La campana.

Ci sono quelli che hanno letto questa notizia prima di te.
Iscriviti per ricevere articoli freschi.
E-mail
Nome
Cognome
Come vuoi leggere la campana
Senza spam.

Il tipo di microchitechitecture del processore riproduce uno dei ruoli chiave nella prestazione di un laptop o PC, poiché la velocità di campionamento e decodifica dei dati che immette il processore e le istruzioni dipende dalla microarchitettura, e quindi la loro esecuzione e registrare in RAM.

Confronto di microarchitetture del processore Haswell, Broadwell e Skylake da Intel

Sul questo momento I microarchitet di tre generazioni di Intel sono pertinenti e in competizione tra loro. Questa è la 4a generazione della quarta generazione di Haswell, la quinta generazione di Broadwell e la nuova microarchitettura della sesta generazione di Skylake. Come è noto, la base della creazione di dati dei microarchitets è una strategia ampia chiamata "Tik-Allora". "Tik" significa creare una nuova generazione di processori basati su un processo tecnologico ridotto. "Quindi" implica anche il rilascio di nuovi microprocessori, ma senza modificare la tecnologia della creazione. L'articolo sarà condotto dalla loro analisi comparativa e sulla sua base si concluderà sul nucleo più produttivo.

Haswell.

- Microarchitettura, sviluppata nel 2012 sulla tecnologia 22 NM. Supporta prese: LGA 1150, BGA 1364, LGA 2011-3. Funziona con DDR4 RAM bar. Pneumatico: DMI2.

Plus di un processore con questa microarchitettura:

1) Efficienza energetica

2) Supporta DDR4

3) basso costo. Ad esempio, il prezzo di Intel Core I3 4160 con il core Haswell è di 7.800 rubli.

1) Realizzato da una tecnologia obsoleta di 22 NM, come risultato del quale perde in molti parametri della sua versione migliorata di Broadwell.

Broadwell.

- La versione di aggiornamento di Haswell è progettata per i processori Xeon Intel, nonché per la settima generazione Intel Core I7. Made in 14 NM Technology. Appartiene al ramo della "Tik" Marketing Mission "Tik-Like". Rispetto ad Haswell, c'è un'efficienza del 3-5% rispetto a Haswell, mentre consuma energia del 30%, c'è anche molto meno dissipazione del calore nel PC, 4,5 W contro 15 Haswell. Tutto ciò è spiegato, prima di tutto, il ridotto processo tecnologico, su cui è stato fabbricato il kernel, la possibilità di overcloccare il processore con questa microarchitettura, nonché la presenza di 4 cache di crystalwell, che dà un tasso di cambio più alto con la RAM di solo 3 cache.

Pluse del kernel:

1) Consumo energetico efficiente

2) la possibilità di overclocking

3) Supporto DirectX 12

4) È in questa microarchitettura che è stata distribuita la cache L4, che è stata utilizzata solo nel raro numero di microprocessori has

5) La durata della batteria più elevata rispetto a Haswell

1) Costo (il prezzo varia entro il 13-150000, a seconda del modello del processore, per questa microarchitettura è destinato alle pietre serie Xeon e Core I7 da Intel mentre il microprocessore Haswell funziona su pietre di budget)

2) rapporto prezzo / qualità. Nelle prove, la microarchitettura ha mostrato risultati bassi, davanti a Haswell circa il 3%, incluso il marchio 3D (Core I7-6850K su Broadwell-E: 19065 punti, core I7-5820 su Haswell-E- 16598 punti). Se consideriamo questo rispetto al confronto del ponte di edera e hashell, allora il risultato non è impressionante.

Analisi comparativa delle prestazioni di Broadwell e Haswell

Skylake.

- La microarchitettura della sesta generazione, progettata, come Haswell, è principalmente per i processori ULV ad efficienza energetica a bilancio. È stato sviluppato secondo la strategia "tik-quindi" e colpisce il ramo "così". Cioè, il kernel è stato fatto senza modificare il processo tecnologico, ma con un cambiamento fondamentale nella microarchitettura relativa a Broadwell.

Il microprocessore funziona su una nuova presa ad alte prestazioni LGA 1151, supporta DDR4, nonché, a differenza del LGA 1150, funziona con USB 3.0, ha un bus DMI3 nuovo, molto più produttivo e maggiore efficienza energetica rispetto al suo predecessore.

1) Supporto per il nuovo connettore LGA 1151, più produttivo di LGA 1150 - Presa Broadwell

2) Supporto USB 3.0

3) La possibilità di sovraccaricare la GPU su una nuova presa

4) Supporta DDR4 e ottimizzazione del lavoro con questa Plank RAM

5) Migliore efficienza energetica relativa a Broadwell

6) Uno dei principali vantaggi è il supporto del nuovo pneumatico DMI 3, che dà 2 volte più di DMI 2, su cui funziona Broadwell e Haswell. Questo vantaggio è particolarmente evidente sull'esempio di un tale programma come Sony Vegas, dove la performance di Skylake è superiore a quasi 1,5 volte.

7) Costo (per modelli di bilancio Intel Core I3 Prezzo medio è 3000-7000 rubli)

Per quanto riguarda Broadwell e Skylake solo Pluses, rispetto al lago Kaby della 7a generazione - la nuova micrarchitettura, che è dotata di un piccolo numero di processori, fornisce prestazioni a pochi percento di seguito.

Riassumendo:

Se prendi tutti gli indicatori, incluso il costo dei microarchiti, quindi la valutazione compilata dall'autore sarà così:

1 ° posto: Skylake

2 ° posto: Haswell (questa microarchitettura, come test ha mostrato, sebbene sia più antico e meno efficiente dal punto di vista energetico, ma in termini di prestazioni ritardati dietro Broadwell del 2-3%, mentre ha un costo inferiore)

3 POSTO: Broadwell

Produzione:

Nonostante i vari trucchi di marketing a cui aderisce, mostra ancora un certo risultato e almeno un po ', ma migliora le prestazioni e la velocità dei suoi processori con ogni generazione. Quindi, chissà, forse, del 2030, inizierà a produrre i primi processori quantici, che saranno in un milione di volte migliori della corrente, ma questa è un'altra storia.

Introduzione È stata fatta che ogni anno Intel aggiorna la microarchitettura dei suoi processori destinati all'utilizzo di personal computer comuni. Questo programma è già diventato così abitante, che è percepito come qualcosa di concesso. Sandy Bridge è stato rilasciato all'inizio del 2011, l'Ivu Bridge è apparso nell'aprile 2012 e il Haswell attualmente rilevante è stato rappresentato il 4 giugno l'anno scorso. Considerando la routine attuale, il mercato sta già aspettando i processori di nuova generazione - Broadwell. Tuttavia, tutto non era molto buono con loro. L'introduzione di un nuovo processo tecnico di 14 nm, che Intel deve essere utilizzato per la produzione di Broadwell, è arrivata attraverso la complessità di una natura di produzione. Pertanto, il piano originale, che ha assunto l'emergere di una nuova generazione di design del processore nel mezzo di quest'anno, doveva essere rivisto. Secondo i dati attuali, l'annuncio delle varianti di energia elettrica mobile di Broadwell si verificherà alla vigilia del nuovo anno e dei processori basati su questo design per il desktop di massa e computer mobili Diventerà disponibile solo il prossimo anno.

Nella situazione attuale, Intel ha deciso di rallegrare in qualche modo l'illuminazione dell'aspettativa prolungata non pianificata dei nuovi prodotti e ha trovato un'azione che ha ricevuto il nome del codice Haswell Aggiorna. La sua essenza è che invece del rilascio di nuovi processori Broadwell, la società offre modelli avanzati di vecchi, le cui prestazioni non sono migliorate da una nuova microarchitettura, ma aumentate frequenze di clock. L'annuncio ufficiale della CPU, che fa parte dei numerosi aggiornamenti Haswell, è stato programmato per l'11 maggio, e ha già avuto luogo. 42 nuove posizioni sono apparse nel listino prezzi Intel, 24 dei quali mirati ai sistemi desktop di varie classi. In questa recensione, faremo conoscere quelli dall'Haswell aggiornato, che sono destinati ai desktop ordinari e appartengono alle famiglie Core I7, Core I5 \u200b\u200be Core I3.

Maggiori informazioni su Haswell Aggiorna per i desktop

Quindi, parlando di Haswell Refresh, Intel significa effettivamente un semplice aumento delle frequenze dei suoi processori familiari LGA 1150 Haswell. Nell'uscita di prodotti tali aggiornati non c'è nulla di insolito: la società ha gradualmente aumentato la frequenza dei suoi processori tra gli annunci di nuove microarchitetture prima, semplicemente prima che tali eventi fossero sparsi, e non hanno pagato tanta attenzione. La caratteristica distintiva di Haswell Refresh è che la crescita della frequenza non si verifica da singoli modelli e l'intera linea dell'intera linea, dal basso.

Inoltre, tanta attenzione l'aggiornamento ha refresh non è a causa della loro novità o aumento notevole della produttività. Tutto il hype - artificiale, genera specificamente Intel stesso, cercando di creare un'impressione di innovazione incessante, anche nonostante il trasferimento dell'annuncio Broadwell in un secondo momento. In altre parole, il rilascio di Haswell Refresh è un aggiornamento completamente ordinario e i processori freschi differiscono dai vecchi presenti sul mercato per quasi un anno di Haswell, aumentato solo da una ridicola frequenza di 100 MHz. Cioè, stiamo parlando di un piccolo aumento della produttività, il che costituisce circa il 2-3 percento, e niente di più.

Fortunatamente, per questo piccolo aumento della velocità, gli acquirenti non dovrebbero pagare nulla. I nuovi processori di aggiornamento haswell occupavano vecchie posizioni nel listino prezzi, superando il campione dell'anno scorso da lì. Se parliamo in modo specifico delle proposte per computer desktop, allora cosa succede la sostituzione è la seguente:

Va sottolineato che la crescita della frequenza dell'orologio si verifica all'interno del quadro dei pacchetti termici precedentemente installati: 84 W per Core I7 e Core I5 \u200b\u200be 54 W - per Core I3. Tuttavia, allo stesso tempo, Haswell Refresh è basato su esattamente gli stessi cristalli a semiconduttore, come precedentemente utilizzato. Il miglioramento del potenziale di frequenza è garantito esclusivamente dal miglioramento del 22 Nm Intelsky del processo tecnologico, l'audit del nucleo nelle novità non cambia e conserva il numero C0. E questo significa che i miglioramenti fondamentali nelle caratteristiche termiche ed elettriche, come in alcune altre sfumature dei nuovi processori, non dovrebbe essere previsto.



Haswell Aggiorna processori per sistemi desktop


Assolutamente in quanto i predecessori guardano i processori di aggiornamento e esternamente.



Sinistra - Haswell normale, giusto - Haswell Aggiorna


L'unico associato al rilascio di Haswell Refresh è un cambiamento interessante e fondamentalmente importante influisce sui processori Overclocker della serie K, informazioni complete su cui non è ancora dovuta al fatto che saranno presentate leggermente in seguito, presumibilmente il 2 giugno. Mentre Intel continuerà a offrire vecchi Core I7-4770K e Core I5-4670K per overclockers, ma quei processori che li sostituiranno meritano una storia separata.

Il fatto è che nelle varietà di Haswell Refresh con fattori liberi che hanno il proprio nome del codice collettivo del canyon del Diavolo, vedremo non solo aumentate le frequenze del passaporto. Intel renderanno questi processori più attraenti per l'overclocking, per il quale prevede di apportare gravi cambiamenti nel loro imballaggio. Il materiale conduttore di calore situato tra il cristallo del processore e il distributore di copertura del coperchio verranno sostituiti da un più efficiente e il coperchio stesso verrà fatto da un'altra lega con una migliore conduttività termica. Secondo i dati preliminari, la famiglia del canyon del diavolo consisterà in due processori LGA 1150 sbloccati: Core I7-4790K e Core I5-4690K. Inoltre, diventerranno più alti del solito aggiornamento di Haswell, il pacchetto termico e sono notevolmente aumentate le frequenze di clock anche in modalità nominale.

Sfortunatamente, questo è ancora tutto ciò che è noto del canyon del diavolo, ma quando campioni di queste CPU compaiono nel nostro laboratorio, condivideremo certamente informazioni complete su di loro nelle nostre recensioni. Oggi parleremo solo del solito Desktop Haswell Refresh con un livello di rilascio del calore standard, che può già essere acquistato nei negozi.

Nella serie Core I7, la novità è solo una:


Core I7-4790 aumenta la frequenza dell'orologio della vecchia linea di processori per la piattaforma LGA 1150 di 100 MHz, quindi sorpasso, quindi overclocking Core I7-4770K e il solito nucleo I7-4771. In caso contrario, questa è una tipica generazione del Core I7 hashell: ha quattro core, supporta iper-threading, ha una spaziosa cache di terzo livello con un volume di 8 MB. Il nucleo grafico, come i predecessori, appartiene alla classe GT2, cioè, ci sono 20 dispositivi di azionamento. Va notato che grazie alla tecnologia Turbo Boost 2.0, la tipica frequenza del lavoro per il Core I7-4790 è di 3,8 GHz.



Core I7-4790.


Un set completo di tecnologie di sicurezza, tra cui VPRO, TXT e VT-D, questo processore è supportato anche per intero. In altre parole, Core I7-4790 è una nuova ammiraglia per la piattaforma LGA 1150, ma senza overclocking.

La serie Core I5 \u200b\u200bè apparsa tre nuovi processori di aggiornamento Haswell:



In questi processori, la frequenza rispetto ai predecessori è aumentata di soli 100 MHz. Ma questo è stato sufficiente per garantire che il nucleo anziano I5-4690 diventa più rapido Core I5-4670K e leadership intercettata in questa formazione. I restanti processori sono sistemati in modo organico in slot gratuiti di frequenza. Altre loro caratteristiche non sono cambiate. Iper-threading nella serie Core I5 \u200b\u200bnon è supportato, la cache L3 è ridotta a 6 mb Core grafico usato - GT2.



Core I5-4690.



Core I5-4590.



Core I5-4460.


Il processore minerario Core I5-4460 prende un posto speciale nella serie: disabilitato le tecnologie di sicurezza VPRO e TXT e le istruzioni per lavorare con la memoria transazionale non sono supportate. La tecnologia Turbo Boost 2.0 fa una tipica frequenza di lavoro per il Core I5-4690 - 3,7 GHz, per il nucleo I5-4590 - 3,5 GHz e per il nucleo I5-4460 - 3,2 GHz.

La serie Core I3 con Haswell Refresh è aumentata di altre tre modifiche:



Si è verificato anche 100 megahertz Aumento delle frequenze dell'orologio mantenendo tutte le altre caratteristiche. Processori Core I3, a differenza dei modelli anziani, dei dual-core, ma supportano la tecnologia virtuale di hyper-threading multithreading. A causa di ciò, hanno una generazione di calore meno calcolata a 54 e non 84 W. Va notato che nella linea Core I3 al momento dell'annuncio di aggiornamento di Haswell non aveva più slot gratuiti di frequenza, quindi è uscito che il modello Core I3-4350 è completamente coinciso in base alle caratteristiche con Core I3-4340. L'unica differenza della nuova modifica è di più prezzo basso.



Core I3-4360.



Core I3-4350.



Core I3-4150.


Nei processori Core I3-4360 e Core I3-4350, la dimensione della cache di terzo livello è di 4 MB e la cache del Core I3-4150 riduce a 3 MB. Peggio nel modello minore del modello e della grafica. Sebbene formalmente, tutto il core i3 è dotato di grafica GT2, in base I3-4150 il numero di dispositivi esecutivi GPU è ridotto da 20 a 16.

Qualsiasi LGA 1150 Haswell Aggiorna processori no condizioni supplementari Non imporre sulle schede madri. Nonostante il fatto che il loro aspetto sia cronometrato e aggiornando la piattaforma con la sua traduzione in nuove serie di logiche della Nona Series (Z97 e H97), tutte le nuove cpus funzionano senza problemi nei vecchi genitori LGA 1150 con i chipset dell'ottava serie. Per la loro corretta definizione dei pagamenti rilasciati lo scorso anno, è richiesto solo l'aggiornamento del BIOS.

Per quanto riguarda le funzionalità di accelerazione, Haswell Refresh, che è arrivato fino ad oggi, non è affatto in alcun volume. Aumentare le frequenze sopra il cambiamento nominale del moltiplicatore è impossibile, l'overclocking è estremamente limitato tramite il pneumatico. Infatti, il limite a cui può essere disperso il generatore di clock di base è di circa 105-110 MHz. Cioè, l'acquisizione di Haswell Aggiornamento per gestirle in modalità anormali di qualsiasi punto è privata. Tuttavia, l'accelerazione della memoria ai processori di non-errore di livello DDR3-2400 per la piattaforma LGA 1150 consente ancora.

Come abbiamo testato

Nuovi processori relativi a un set di Haswell Refresh, abbiamo confrontato con i loro predecessori, Haswell ordinaria, che sono disponibili per quasi un anno. Di conseguenza, l'elenco dei componenti hardware coinvolti nei test è il seguente:

Processori:

Intel Core I7-4790 (Haswell, 4 Cores + HT, 3,6-4,0 GHz, 4x256 KB L2, 8 MB L3);
Intel Core I7-4770K (Haswell, 4 Cores + HT, 3,5-3,9 GHz, 4x256 KB L2, 8 MB L3);
Intel Core I5-4690 (Haswell, 4 Kernels, 3,5-3,9 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4670K (Haswell, 4 core, 3,4-3,8 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4590 (Haswell, 4 core, 3,3-3,7 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4570 (Haswell, 4 kernel, 3,2-3.6 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4460 (Haswell, 4 core, 3,2-3,4 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4440 (Haswell, 4 kernels, 3,1-3.3 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I3-4360 (Haswell, 2 Kernels + HT, 3,7 GHz, 2x256 KB L2, 4 MB L3);
Intel Core I3-4350 (Haswell, 2 Cores + HT, 3,6 GHz, 2x256 KB L2, 4 MB L3);
Intel Core I3-4340 (Haswell, 2 Kernels + HT, 3,6 GHz, 2x256 KB L2, 4 MB L3);
Intel Core I3-4150 (Haswell, 2 Cores + HT, 3,5 GHz, 2x256 KB L2, 3 MB L3);
Intel Core I3-4130 (Haswell, 2 Kernels + HT, 3,4 GHz, 2x256 KB L2, 3 MB L3).

Cooler processore: NOCTUA NH-U14S.
Scheda madre: Gigabyte Z87X-UD3H (LGA1150, Intel Z87 Express).
Memoria: 2x8 GB DDR3-2133 SDRAM, 9-11-11-31 (G.SKILL F3-2133C9D-16GTX).
Scheda video: NVIDIA GEFORCE GTX 780 TI (3 GB / 384 bit GDDR5, 876-928 / 7000 MHz).
Sottosistema del disco: Intel SSD 520 240 GB (SSDSC2CW240A3K5).
Alimentazione: Corsair AX760I (80 Plus Platinum, 760 W).

Il test è stato eseguito nel sistema operativo Microsoft Windows 8 Enterprise X64 utilizzando il prossimo set di driver:

Driver di chipset Intel 10.0.13;
Driver del motore di gestione Intel 10.0.0.1204;
Intel Rapid Storage Storage Technology 13.0.3.1001;
NVIDIA GeForce Driver 335.23.

Prestazione

Performance totale

Per stimare la performance dei processori in compiti comuni, utilizziamo tradizionalmente il pacchetto di test BAPCO Sysmark che simula il lavoro dell'utente in programmi e applicazioni di ufficio moderni comuni per la creazione e l'elaborazione di contenuti digitali. L'idea di test è molto semplice: fornisce l'unica metrica che caratterizza la velocità media ponderata del computer durante l'uso quotidiano. Di recente, questo benchmark è ancora una volta aggiornato, e ora usiamo di più ultima versione - Sysmark 2014.



I risultati visualizzati nel diagramma sono abbastanza previsti. Dato che nei processori di aggiornamento haswell non ci sono miglioramenti e ottimizzazioni a livello di microarchitettura, tutto risolve la frequenza dell'orologio. E poiché nella nuova CPU è aumentata solo a 100 MHz, le differenze nella performance delle prestazioni e dei rappresentanti del vecchio Haswell del set di aggiornamento di Haswell, che vengono a spostarsi, in media del 2,5%. Più specificamente: Core I7-4790 Swepakes Core I7-4771 (è fondamentale I7-4777K) dell'1,8%; Core I5-4690 supera il core I5-4670 del 2,3 percento; Il nucleo I5-4590 è in vantaggio del nucleo I5-4570 del 2,3 percento, il nucleo I5-4460 più rapido Core I5-4440 del 2,7 percento, il nucleo I3-4360 supera il nucleo I3-4340 del 3,1 percento e il Core I3-4150 Obsoles Core I3- 4130 del 2,3 percento.

La più profonda comprensione dei risultati di Sysmark 2014 è in grado di fornire conoscenze con stime di produttività ottenute in vari scenari di utilizzo del sistema. Modelli di scenari di produttività per ufficio Tipici lavoro d'ufficio: Preparazione dei testi, elaborare fogli di calcolo, lavorare con e-mail e visitare siti Internet. Lo script utilizzerà il seguente set di applicazioni: Adobe Acrobat Xi Pro, Google Chrome. 32, Microsoft Excel. 2013, Microsoft OneNote 2013, Microsoft Outlook 2013, Microsoft Powerpoint. 2013, Microsoft Word 2013, WinZip Pro 17.5 Pro.



Nello scenario di creazione dei media, la creazione di una commerciale utilizzando immagini e video digitali pre-filtrati. A tale scopo, vengono applicati i pacchetti estesi Popular Adobe Photoshop CS6, Adobe Premiere Pro CS6 e Trimble SketchUp Pro 2013.



Lo scenario di analisi dei dati / finanziari è dedicato all'analisi statistica e alle previsioni di investimento basata su un determinato modello finanziario. Lo script utilizza grandi volumi di dati numerici e due applicazioni Microsoft Excel 2013 e WinZip Pro 17.5 Pro.




Performance del gioco

Come sapete, la performance delle piattaforme dotate di processori ad alte prestazioni nella stragrande maggioranza dei giochi moderni è determinata dalla capacità del sottosistema grafico. Ecco perché durante il test dei processori, scegliamo il gioco più dipendente dal processore e eseguiamo la misurazione del numero di fotogrammi due volte. I primi test di passaggio vengono eseguiti senza inclusione di levigatura e con l'installazione lontana dal massimo autorizzazioni elevate. Tali impostazioni ci consentono di valutare il modo in cui i processori con carico di gioco vengono visualizzati in linea di principio, il che significa che consente di costruire ipotesi su come le piattaforme di elaborazione testate si comportano in futuro, quando le opzioni più veloci per gli acceleratori grafici appaiono sul mercato. Il secondo passaggio viene eseguito con installazioni realistiche - quando si seleziona il permesso FullHD e il livello massimo di levigatura a schermo intero. A nostro avviso, tali risultati non sono meno interessanti, poiché rispondono a una domanda frequente di quale livello di performance del gioco può fornire processori in questo momento - in condizioni moderne.





















Non abbiamo caricato una panoramica con un gran numero di test di gioco, poiché i guadagni delle prestazioni, che forniscono i processori familiari di aggiornamento Haswell, non è troppo evidente. Tuttavia, nei grafici forniti, è possibile contrassegnare diverse opzioni diverse per il modo in cui la performance del gioco è.

Quindi, Batman: Arkham Origin - Un gioco in cui la performance di qualsiasi processore Intel risulta essere sufficiente per caricare completamente il grafico del flagship mappa di Nvidia GeForce GTX 780 TI. Di conseguenza, in esso vediamo l'influenza estremamente minori della scelta della CPU sul risultato, e il nuovo aggiornamento haswell non distinguere contro lo sfondo dei predecessori.

Civilization V: Brave New World - Un gioco strategico in cui i calcoli attivi vengono eseguiti sulla CPU, tuttavia, e qui i processori troppo potenti non sono per niente. Iniziare con il nucleo I5-4570 e l'aumento delle prestazioni più elevate quasi impercettibile. Tuttavia, al di sotto di questa peculiare confine, il vantaggio di Haswell Aggiorna sui predecessori equivalenti è nella regione del 3%.

Metro: l'ultima luce è uno sparatutto molto del processore, ma alle impostazioni massime di qualità (prima di tutto, a causa della tesszione), il frame rate riposa ancora nella potenza della scheda video. Ma con una diminuzione della risoluzione, è possibile vedere un piccolo effetto dall'aumentare la frequenza nel rinfrescamento di Haswell rinnovato. La sua scala è standard - circa il 2%.

Nel ladro, tutto sembra ancora più interessante. Questo è uno dei pochi giochi che sono negativamente correlati alla tecnologia iper-filettatura in processori a quattro core. È ottimizzato sotto quattro flussi e altri kernel virtuali in Core I7 riducono solo le prestazioni. Se parliamo dell'effetto che dà haswell a Haswell Aggiorna, è ancora insignificante: non più del 3% con risoluzione ridotta e non più dell'1% delle impostazioni massime grafiche.

Test nelle applicazioni

In Autodesk 3DS Max 2014, misuriamo la velocità del rendering in raggio mentale. Scena complessa appositamente preparata.



Le prestazioni nella nuova Adobe Premiere Pro CC vengono testate misurando il tempo di rendering nel formato del progetto Blu-ray H.264 contenente sequenza video HDV 1080P25 con l'imposizione di vari effetti.



Performance di misurazione nel nuovo Adobe Photoshop CC, svolgiamo il proprio test, che è un test di ritocco riciclato creativo Photoshop Photoshop Test, che include un'elaborazione tipica di quattro immagini da 24 megapixel realizzate da una fotocamera digitale.



Per misurare la velocità dei processori, quando si comprimono le informazioni, utilizziamo l'archiviatore WinRAR 5.0, con il quale con il massimo grado di compressione, archivia la cartella con vari file con un volume totale di 1,7 GB.



Per stimare la velocità di ricodifica del video al formato H.264, il test utilizzato X264 FHD Benchmark 1.0.1 (64 bit), in base al misurazione del tempo di codifica di misura X264 Video sorgente in formato MPEG-4 / AVC con il permesso [Email protetto] e impostazioni predefinite. Va notato che i risultati di questo punto di riferimento sono di grande importanza pratico, poiché il Codice X264 è alla base delle numerose utenze di ricodifica popolare, come freno a mano, Megui, VirtualDub, e così via. Aggiorniamo periodicamente l'encoder utilizzato per misurare le prestazioni, e in questo test hanno partecipato la versione R2431, che implementa il supporto per tutti i set moderni di istruzioni, incluso AVX2.



Nessuna applicazione ti consente di identificare i vantaggi evidenti dei processori Haswell Rafresh sui loro predecessori. È abbastanza naturale. L'unico cambiamento nella nuova CPU è una frequenza aumentata. Quindi una velocità notevole della velocità non è semplicemente da nessuna parte. I risultati del nuovo Core I7-4790, Core I5-4690, Core I5-4590, Core I5-4460, Core I3-4360, Core I3-4350 e Core I3-4150 sono migliori di quanto sono stati a lungo presenti sul mercato di proposte della stessa classe e che il costo di un massimo del 3%.

Consumo di energia

I cambiamenti nelle prestazioni, presentati Haswell Refresh, sono completamente non impressionanti. Nessun altro miglioramento in nuove modifiche di processori, in base al fatto che si basano sul cristallo del semiconduttore di una vecchia revisione, non dovrebbe essere. Ciononostante, rimane una piccola speranza per alcuni miglioramenti nelle caratteristiche termiche ed energetiche che potrebbero verificarsi a scapito del processo tecnologico di produzione. Dai un'occhiata.

I seguenti grafici, se non specificamente stabiliti separatamente, il consumo di sistema (senza monitor) è stato fornito, misurato all'uscita dalla presa in cui è collegata l'unità di alimentazione e rappresenta la quantità di consumo energetico di tutti i componenti coinvolti nel sistema . In totale, l'efficienza dell'alimentazione elettrica stessa viene automaticamente inclusa nell'indicatore totale, ma considerando che il modello BP utilizzato da noi, Corsair AX760I, ha un certificato Platinum 80 più, la sua influenza deve essere minimale. Per correggere la valutazione del consumo di energia, abbiamo attivato la modalità Turbo e tutte le tecnologie di risparmio energetico esistenti: C1E, C6 e migliorato Intel SpeedStep.

Prima di tutto, è stato misurato il consumo in stato di inattività.



Qui tutti i processori hanno mostrato un unanimità raro. È chiaro: in semplice Haswell, entrano in stati di risparmio energetico e riducono il loro consumo energetico a valori quasi zero. Pertanto, quei numeri che vengono mostrati nel diagramma sono più caratterizzati dal consumo del resto della piattaforma di prova.

Quindi abbiamo misurato il consumo massimo con il carico creato dalla versione a 64 bit dell'utilità Linx 0.6.5 con il supporto per il set di istruzioni AVX2 in base al pacchetto Linpack.



Il diagramma presentato dimostra molto chiaramente l'assenza di miglioramenti del consumo energetico dai processori di aggiornamento di Haswell. I nuovi e veloci modelli richiedono elettricità più dei loro predecessori. Allo stesso tempo, l'accelerazione da 100 meghertz condotta in nuove modifiche della CPU è in circa il 5% di aumento del consumo energetico. Si noti che, nonostante ciò, Intel non ha trovato necessario aumentare il bordo del pacco termico per Haswell. In altre parole, la dissipazione del calore di qualsiasi base I7 e Core I5 \u200b\u200bdovrebbe adattarsi al framework da 84 watt e Core I3 è in 54-watt.

Considerando che il consumo energetico avviato dal pacchetto LinPack basato su Linx, supera notevolmente il livello realistico medio, abbiamo misurato il consumo e con un carico più "atterrato" - ricodifica un video utilizzando una versione a 64 bit della versione X264 R2431.



In generale, l'immagine qui è esattamente la stessa del carico creato da Linx. Quasi i valori di consumo di energia assoluti. Tuttavia, i processori di aggiornamento haswell consumano più dei loro predecessori della stessa classe sullo stesso 5 percento. Tutto ciò significa solo una cosa: nessun miglioramento del consumo di nuovi modelli di Haswell non è stato fatto.

Non ci sono cambiamenti espliciti nella modalità di temperatura dei nuovi prodotti. Ovviamente, nell'ordinario Haswell rinfrescare il materiale di conduzione termico sotto il coperchio rimase lo stesso infruttuoso di prima. La temperatura del kernel nel verificarsi del carico in nuovi processori aumenta quasi immediatamente e continua ad un livello elevato anche se è installato un dispositivo di raffreddamento efficace nel sistema. Ad esempio, nel nostro caso, quando si utilizza il dispositivo di raffreddamento NOCTUA NH-U14S, il maggiore di Haswell Aggiorna, Core I7-4790 durante il funzionamento dell'utilità LINX molto rapidamente riscaldata a 84 gradi. E questo è senza alcuna accelerazione, nella modalità nominale!



Richiamare, la temperatura limite in cui i processori familiari haswell includono la trottizzazione, - 100 gradi.

CONCLUSIONI.

Riassumendo, siamo costretti a dichiarare che il nome forte che Haswell aggiorna ha ricevuto processori completamente ordinari, che la loro uscita non porta quasi nulla di nuovo. Per il loro rilascio Intel. Non ho fatto alcun lavoro di ingegneria. Pertanto, le qualità dei consumatori di CPU fresche per la piattaforma LGA 1150 non sono praticamente alcuna differenza da ciò che è stato chiesto prima. Il numero di nuclei, la quantità di cache, il tipo di anima grafica integrata, un insieme di tecnologie supportate - tutto rimane invariato. Nessuna ottimizzazione è stata effettuata a livello di cristallo del semiconduttore, pertanto la dissipazione del calore e il consumo energetico del refrigeramento di Haswell rimane tipico del livello Haswell.

L'unico, dove puoi vedere almeno alcuni movimenti in avanti sono le frequenze di clock. Tuttavia, considerando che la crescita della frequenza non è supportata da alcun miglioramento tecnologico o ingegneristico, ma è solo un semplice overclocking di vecchi modelli, il loro aumento era estremamente debole. Infatti, nel quadro di Haswell rinfrescano Intel, ha aumentato la velocità dei suoi processori al minimo possibile delta - per 100 MHz. Di conseguenza, esattamente lo stesso, minimo, l'aumento delle prestazioni che abbiamo visto nel processo di test. Nuovi processori di aggiornamento Haswell si sono rivelati più veloci del vecchio haswell per il 2-3% e non più.

Tutto ciò significa che il rilascio di Haswell Refresh può essere interessante solo se non si è migrato alla piattaforma LGA 1150. Dato che il costo dei nuovi modelli non è superiore a quello superiore, quando si acquista un nuovo computer, ora è abbastanza naturale chiedere nei negozi nuove modifiche dei processori. E se il tuo fornitore preferito ha refreshing nel listino prezzi non è ancora disponibile, è meglio pagare un po 'con l'acquisto, ma in seguito ottenere un po' di più alte prestazioni Per gli stessi soldi.

E, inoltre, non dimenticare che dopo circa tre settimane, ci sono ancora un paio di processori, formalmente correlati al numero di haswell aggiornato, core I7-4790K e core I5-4690K. Queste CPU hanno il nome del proprio codice del Codice Devil's Canyon, a differenza dei modelli discussi oggi, promettono di diventare un regalo eccellente per gli appassionati. Appariranno in loro e notevolmente migliorate frequenze di clock e ridotte temperature di lavoro e il miglior overclocking. Ma non andremo avanti: una panoramica completa di Core I7-4790K e Core I5-4690K è possibile leggere nel nostro sito in qualche modo più tardi.

Pro Posty Bridge si è fermato prima che il ponte sabbioso si fermi e la traduzione del nuovo processo tecnico dell'anno scorso, Intel è arrivato al prossimo passo a Tock, prescritto diversi anni prima.

"Tick-così" Intel non è sempre una bomba, ma, sicuramente, un simbolo di progresso tecnologico

Ai gradini "Tock", come applicato dall'illustrazione, devi inserire una nuova architettura. Quello che è stato fatto - il mondo ha visto una microarchitettura sotto il nome del codice Haswell e i 14 modelli di processori Core I5 \u200b\u200be I7 sotto il connettore LGA 1150 (noto anche come socket H3), di cui otto "ordinari" e sei a bassa potenza. In generale, il tema del consumo di energia (o, se uno per essere accurato, "il consumo di energia adeguato per il potere di elaborazione corrente") passa con un filo rosso attraverso la microarchitettura di Haswell, poiché Intel vede un grande futuro per la sua creazione in un segmento mobile , e senza un processore o soc con appetiti moderati da fare non c'è nulla. Il concorrente principale, a giudicare da confronti in fonti aperte, Intel considera artigianato sui processori del braccio, poiché hanno già preso radici nel segmento mobile e ha mostrato la loro vitalità lì.

La rete Intel ha già fatto molto potere. Ruiting Il controllo del TDP iniziale Utilizzando la tensione di alimentazione del processore fornita ad esso dal convertitore della scheda madre e il convertitore di frequenza del core, Intel spostò parte dei convertitori nella CPU, scoprendo così la possibilità più accuratamente (e quindi in modo efficiente) tensione di dosaggio a ciascuno di Altri blocchi situati sul cristallo. A quel punto, il processore aveva già cessato di essere solo un processore nella comprensione iniziale di questa parola e includeva il controller di memoria e altre parti del ponte settentrionale (NB), che in una volta avevano significativamente semplificato il cablaggio delle schede madri e riducenti Il consumo energetico del pacchetto CPU + NB.

Lavorare con la nutrizione è stata anche condotta nella direzione di uso razionale, quando un particolare blocco ha funzionato (elettricità consumata con lettura) solo ai momenti di destra, e durante i periodi di tempo inattivo, l'energia non è stata spesa. Uno dei frutti del lavoro in questa direzione è stata l'apparizione nei sistemi Intel insieme allo stato S0 Stati S0ix, che ha ridotto significativamente il consumo energetico del processore nei momenti di inattivo allo stato del "Sistema di sonno" (STORE S3, Il laptop va in esso dopo aver indebolito lo schermo in condizioni di lavoro). Infatti, il sistema potrebbe dormire assolutamente in modo assoluto per l'utente, poiché la transizione a S0IH è 450 microsecondi e il risveglio è di 3,2 millisecondi (0,00045 S e 0,0032 con rispettivamente). Per salvare lo schermo nello stato attivo, la tecnologia PSR Technology (Panel Auto-Arrese) è sviluppata, il che implica la presenza di un buffer che conserva diversi ultimi frame. Ciò consente di ridurre il carico sul processore grafico, specialmente in un aggiornamento infrequente delle informazioni sullo schermo (ad esempio, quando la lettura del testo), che, a sua volta, consente di ridurre il consumo di energia del processore grafico.

Un nuovo processore Intel può risparmiare energia significativamente migliore dei predecessori.

È vero, ciò richiede supporto hardware dal monitor, in modo che questo metodo di risparmio energetico possa essere trovato nel segmento mobile, dove il "monitor" e "parte di calcolo" sono un dispositivo. Ma per la dimostrazione degli sviluppi Intel, l'esempio è molto adatto, soprattutto perché hanno trovato l'implementazione dei processori sull'architettura Haswell. Pertanto, l'unità PCU (Power Control Unit) in Haswell può utilizzare in modo molto efficace l'energia a causa di una pluralità di "modalità operative", in ciascuna delle quali solo i blocchi necessari sono attivi. Questo, secondo Intel, ha permesso di ridurre il consumo di energia in un semplice periodo di quasi cinque volte rispetto alla generazione passata (terzo) di processori, il passaggio da "modalità" è accelerato da un trimestre, che consente di gestire più attivamente Il consumo energetico dei nuclei e "si addormentano" anche nei casi che l'ultima generazione era inappropriata a causa della lunga procedura di inclusione. Qui il kernel di un paio di millisecondi "citato", salva le azioni del millivatt, lì "jeep up" ... e gli watt salvati sono reclutati.

Anche l'architettura interna del processore è stata seriamente migliorata, anche se a livello mondiale non è cambiato. Intel continua a macinare e modificare l'architettura utilizzata a Conroe. Vero, le differenze tra Ivy Bridge e Haswell sono molto più che tra il ponte sabbioso e il ponte di edera. Quest'ultimo, nella mia umile opinione, in genere è stato restyling per sabbioso; Delle modifiche significative, è possibile notare solo la transizione da 32 Nm in 22 Nm processo tecnico.

Intel Haswell Architecture come schema

Nell'unità del processore Haswell, un trasportatore graduale 14-19 è stato conservato e la cache è passata su una sola e mezzo mila microins, ma l'unità di decodifica delle istruzioni è ora unita e non divisa tra due fili. La dimensione della finestra della finestra fuori ordine (OOO) è aumentata dai 168 ai record di record, e nella stazione di prenotazione sono stati aggiunti due porte, aumentando il numero totale a otto. Sandy Bridge aveva sei porti per parallelo eseguendo sei microoperazioni. Tre di loro sono utilizzati per le operazioni di memoria (lettura / scrittura), tre - operazioni matematiche. Una porta aggiunta è utilizzata per eseguire operazioni e ramificazioni matematiche interere e il secondo è quello di calcolare l'indirizzo.

I blocchi FMA (Fused Multiply-Add) (Fused Multiply-Add) sono stati riciclati nelle porte 0-1, nonché il supporto per il set di istruzioni AVX2 (estensioni di vettore avanzato 2). Ciò consente di aumentare significativamente la produttività sia con lo stesso tipo che con il carico misto, ma la maggior parte di tutti è cresciuta la velocità di eseguire operazioni a punto flottante - Intel dichiara un aumento di prestazioni di due volte.

Nuovi gruppi di istruzioni - una garanzia di efficienza futura

In pratica, puoi aspettarti un aumento quando si lavora con contenuti multimediali e 3D.

Il nuovo blocco FMA è in grado di dare una seria vittoria flop per tatto

La cache non è andata senza attenzione. La velocità dell'operazione L1 e pneumatici tra L1 e L2 sono stati raddoppiati, da 32 a 64 byte per ciclo in entrambi i casi; La latenza è rimasta invariata. Il TLB universale (tampone per la lookaside di traduzione) è finalizzato: da 4K a 4K + 2 m esteso, la larghezza del pneumatico è raddoppiata. L'accesso alla cache L3 è ora più ampio grazie alla capacità di elaborare dati e richieste non dati contemporaneamente.

Il blocco TSX contribuirà a distribuire il carico tra i nuclei del processore

Haswell è stata aggiunta di un'istruzione TSX (Transactional Synchronization Extensions) (estensioni transazionali di sincronizzazione), che consente di aumentare la velocità di lavoro a spese del funzionamento "intelligente" di tali dati a cui sono indirizzati diversi core contemporaneamente. Ciò dovrebbe aumentare l'efficienza del processore con tali compiti difficili da parallelare e fornisce anche ai programmatori la possibilità di spostare una parte del lavoro sulla distribuzione del carico tra i nuclei al processore. TSX, come AVX2 - Uno strumento conveniente per gli sviluppatori che, abilmente gestendoli, può ottenere un aumento significativo della velocità per le loro applicazioni. Per la stessa ragione, il risultato istantaneo "qui e ora" da questi nuovi gruppi di istruzioni non dovrebbe essere previsto.

Uno degli eventi più significativi di quest'anno nel segmento del desktop può essere certamente considerato il rilascio di una nuova famiglia di processori Intel Core Fourth-generation, noto come Haswell in codice. In questo articolo, consideriamo brevemente la microarchitettura di Haswell e confrontiamo le prestazioni del processore Intel Core I7-4770 sulla base di questa microarchitettura con le prestazioni del processore Intel Core I7-3770 basato sulla microarchitettura del Bridg sabbioso di generazione precedente.

Ricordiamo che per molti anni, il rilascio di nuove generazioni di processori Intel è subordinato alla regola empirica Tick-Tock ("Tikak"), l'essenza del quale è che la traduzione della produzione a un nuovo processo tecnologico (tick) e l'introduzione Di una nuova microarchitettura del processore (TOCK) si verifica alternativamente, con una frequenza di circa due anni. Cioè, se nel primo anno c'è una transizione a una nuova produzione di processo, quindi nel secondo anno c'è una nuova microarchitettura del processore nello stesso processore tecnico. L'anno successivo, la microchitechitetia viene trasferita a un nuovo processo tecnico di produzione, ecc.

In particolare, nel 2012, Intel ha rilasciato una versione da 22 nm di processori basata sulla microarchitettura del ponte sabbioso, che è noto sotto il nome del codice Ivy Bridge (ciclo di tick), e ora è arrivato un turno di processori da 22 nm basati sulla nuova microarchitettura del processore Haswell.

In dettaglio delle caratteristiche della nuova microarchitettura di Haswell, abbiamo già scritto al computerprpress No. 10'2012. Tuttavia, molte volte sono passate da allora, e soprattutto, i nuovi dettagli di questa microarchitettura sono diventati noti. Pertanto, lasciati ripetutamente ripetutamente ripetutamente e effettuare una breve panoramica della microarchitettura di Haswell, concentrandosi su tali dettagli che sono stati omessi nella nostra recensione precedente.

Core computazionale Haswell.

Haswell è il nome del codice della nuova microarchitettura del processore, ma secondo la tradizione con lo stesso nome sono tutti i processori basati su di esso. Inoltre, Haswell è il nome del codice del core del processore Haswell, che è abbastanza logico, poiché la microarchitettura e il nucleo del processore sono due lati della stessa medaglia.

Quindi, considerare brevemente la microarchitettura haswell (o il kernel di computing haswell, che è in linea di principio la stessa cosa).

Il Core Computing Haswell non ha modificato le modifiche cardinali rispetto al nucleo di elaborazione del Ponte Ivy / Bridge Sandy Bridge - solo i singoli blocchi del kernel del processore sono stati migliorati. Pertanto, sarà opportuno ricordare a condizioni generali della microarchitettura del ponte sabbioso e dimorare sulle modifiche apportate ad esso.

Blocco pre-processor

Tradizionalmente, la microarchitettura del kernel del processore inizia con un blocco pre-processor (front-end), che è responsabile della selezione delle istruzioni X86 dalla cache delle istruzioni e della decodifica (Fig. 1). Nella microchiteccitettura haswell, l'unità pre-flusso ha subito modifiche minime.

Fico. 1. precrossor in microarchitets haswell e ponte sabbioso

Le istruzioni x86 sono selezionate dalla cache delle istruzioni L1i (cache di istruzioni), che non è cambiata in microarchitettura haswell. Ha una dimensione di 32 KB, è un 8 canali e diviso dinamicamente tra due flussi di istruzioni (supporto per la tecnologia iper-filettatura).

Dalla cache L1i, i comandi vengono scaricati da blocchi a 16 byte nel buffer buffer a 16 byte (tampone di recupero).

Poiché le istruzioni X86 hanno una lunghezza variabile (da 1 a 16 byte) e le lunghezze del blocco sono state caricate dalla cache, fissate, i limiti tra i singoli comandi sono decodificati durante la decodifica dei comandi (informazioni sulle dimensioni dei comandi è memorizzato nella cache dell'istruzione L1i in campi speciali). La procedura per la selezione dei comandi dal blocco selezionato è chiamato decodifica preliminare (predecode).

Dopo il campionamento del comando, la coda di istruzioni è organizzata. Nel ponte sabbioso e nella microchiteccitettura di Haswell, il buffer della coda di comando è progettato per 20 comandi in ciascuno dei due flussi, e dal buffer pre-ordine per ciascun orologio al buffer dei comandi, è possibile caricare fino a sei comandi selezionati.

Successivamente, i comandi selezionati (istruzioni x86) vengono trasmessi al decodificatore, dove vengono trasformati in micro operatori della macchina (designati come micro-ops o uops).

Il decodificatore principale del processore Haswell rimane invariato. È ancora a quattro canali e può decodificare in ogni tatto fino a quattro istruzioni x86. Come già notato, la lunghezza di un comando può raggiungere 16 byte, tuttavia, la lunghezza media dei comandi è di 4 byte. In media, quattro comandi vengono scaricati in ciascun blocco a 16 byte, che quando si utilizza un decodificatore a quattro canali sono contemporaneamente decodificati in un orologio.

Il decodificatore a quattro canali è composto da tre semplici decodificatori decorativi semplici istruzioni In una microperte e un complesso, che è in grado di decodificare un'istruzione non più di quattro micro-operativi (decodificatore di tipo 4-1-1-1). Per istruzioni ancora più complesse, decodificati in più di quattro micro-operativi, il decodificatore complesso è collegato all'unità di sequesser Ucode, che viene utilizzata per decodificare tali istruzioni.

Quando vengono utilizzate istruzioni per la decodifica, le tecnologie macro-fusione e micro-fusione.

Macro-fusion è una fusione di due istruzioni x86 in un complesso micro-ops micro-ops, che continuerà a essere eseguito come una micro-operazione. Naturalmente, non tutte le istruzioni possono essere soggette a questa fusione, ma solo alcune istruzioni coppie (ad esempio, istruzioni di confronto e transizione condizionale). Senza l'uso della tecnologia macro-fusione, solo quattro istruzioni (in un decodificatore a quattro canali) possono essere decodificate e con tecnologia macro-fusione, cinque istruzioni possono essere lette in ciascun tatto, che vengono trasformate in quattro e sono decodificate a causa di fusione.

Va notato che i blocchi prolungati ALU estesi (unità logica aritmetica) vengono utilizzati per mantenere in modo efficiente la tecnologia macro-fusione (unità logica aritmetica).

La micro-fusione è una fusione di due micro-operative (istruzioni non X86, ovvero micro-operazioni) in uno contenente due azioni elementari. In futuro, due tali microerazioni fuse vengono elaborate come una, che riduce il numero di microoperazioni elaborate e, di conseguenza, per aumentare il numero totale di istruzioni eseguite dal processore per un tatto.

Inoltre, la microarchitettura di Haswell e Sandy Bridge utilizza la cache dei microroratori decodificati (uop cache), che include tutti i micro-operativi decodificati. Questa cache è progettata per circa 1500 microoperazioni di media lunghezza. La cache delle microoperazioni decodificate è otto banche (cioè questa cache è a 8 canali), ognuna delle quali è costituita da 32 cachestro, e ogni cachestalco contiene fino a sei micro-operatori decodificati (UOP). Da qui si scopre che la cache può contenere circa 1500 microoperazioni.

Il concetto di cache di microoperazioni decodificati è di mantenere le sequenze di micro-operazione già decodificate. Di conseguenza, se è necessario eseguire nuovamente una determinata istruzione X86, e la sequenza corrispondente di micro-op di decodificata è ancora nella cache dei micro-op di decodificati, non è necessario selezionare immediatamente questa istruzione dalla cache L1 e decodificata IT - già decodificate Micro Performance provengono dalla cache per un'ulteriore elaborazione.

Dopo il processo di decodifica delle istruzioni x86, essi, quattro pezzi per il tatto, inserire il buffer della coda della coda decodifica. Nella microarchitettura del ponte sabbioso, questo buffer delle istruzioni decodificati è stato progettato per due flux di 28 microoperazioni per ogni filo. Nei microarchitet, evy bridge e haswell, non è suddiviso in due flussi di comandi ed è progettato per 56 microoperazioni. Questo approccio risulta essere più preferibile quando si esegue un'applicazione single-thread (con un flusso di comando). In questo caso, un flusso di comandi è disponibile per un buffer con una capacità di 56 micro-op e nella microarchitettura del ponte sabbioso solo su 28 microoperazioni.

Sembrerebbe che se si confronti i kernel del processore Haswell e Ivy Bridge, quindi non ci sono differenze nei loro pre-processori, e le pre-opposizioni di Haswell Nuclei e Bridge Sandy differiscono solo alla struttura del buffer di istruzione foded.

Tuttavia, come dice Intel, alcuni miglioramenti nel pre-processore sono stati ancora fatti e preoccupati del miglioramento del blocco di previsione del ramo (predittori dei rami). Tuttavia, quali miglioramenti sono stati implementati, Intel non rivela.

Finire una descrizione del pre-processore nella microarchitettura di Haswell, è inoltre necessario menzionare il buffer TLB.

Il buffer TLB (tamponi da parte di look-o-opt) è uno speciale cache del processore, che memorizza gli indirizzi di istruzioni e dati decodificati, che possono ridurre significativamente l'accesso a loro. Questa cache è progettata per ridurre il tempo per convertire un indirizzo di indirizzo virtuale o istruzioni per fisico. Il fatto è che il processore utilizza una indirizzamento virtuale e sono necessari indirizzi fisici reali per accedere ai dati nella cache o nella RAM. La trasformazione dell'indirizzo virtuale nel fisico occupa circa tre orologio del processore. TLB Cache memorizza i risultati delle trasformazioni precedenti, rendendo la trasformazione degli indirizzi da eseguire in un orologio.

Nei processori con microarchitettura Haswell e Sandy Bridge (come nei processori Intel basati su altre microarchitetture), viene utilizzata una cache TLB a due livelli, e se la cache TLB L2 è unificata, la cache TLB L1 è divisa in un buffer di dati (DTLB ) e buffer di istruzioni (ITLB).

L1 TLB-Caches di istruzioni e dati nella microarchitettura di Haswell non sono cambiati - sono esattamente come nella microarchitettura del ponte sabbioso. Le istruzioni ITLB-Cache L1 sono progettate per 128 voci, se ogni voce indirizza la pagina di memoria con una capacità di 4 KB. Pertanto, quando si utilizzano 4 KB, le pagine di memoria L1 ITLB-Cache possono indirizzare 512 KB di memoria. Nel caso di pagine con una capacità di 4 KB, la cache ITLB è un 4 canali e diviso staticamente tra due flussi di comando. Inoltre, la cache L1 ITLB può aggiungere 2 MB di pagine di memoria. In questo caso, la cache contiene otto voci per ogni flusso ed è completamente associativa.

Unità di esecuzione del comando straordinaria

Dopo il processo di decodifica delle istruzioni x86, inizia la fase della loro straordinaria esecuzione (out-of-order).

Al primo stadio, la ridenominazione e la distribuzione di registri di processore aggiuntivi, che non sono definiti dall'architettura del set di comando. La tecnica dei registri di ridenominazione non sarà priva di significato senza il riordino dei comandi. Pertanto, dal buffer delle istruzioni decodificate (coda decodificata) di microoperazioni per quattro pezzi, il buffer riordinato è incluso nel buffer del riordino, dove i reordini micro-operatori non sono nell'ordine della loro ricevuta (fuori- ORDINE).

Nella microarchitettura del ponte sabbioso, la dimensione del buffer del riordino è progettato per 168 microoperazioni e nella microarchitettura di Haswell - per 192 microoperazioni.

Si noti che il buffer del riordino (tampone di riordino) e l'unità di pensionamento (unità di pensionamento) sono combinati in un'unica unità di processore, ma le istruzioni vengono inizialmente eseguite e l'unità di pensionamento è attivata per funzionare in seguito, quando è necessario emettere eseguibili eseguibili istruzioni nel manuale specificato.

Successivamente, si verifica la distribuzione di microoperazioni sui blocchi esecutivi. Nell'unità del processore di pianificazione unificata, le code di micro-operanti sono formate, come risultato della quale le microoperazioni cadono su una delle porte dispositivi funzionali (Porti di spedizione). Questo processo è chiamato dispacciamento (spedizione) e le porte sietette la funzione del gateway per funzionare i dispositivi.

Nei microartiti di Sandy Bridge e Haswell, i cluster della straordinaria esecuzione dei comandi (cluster fuori ordine) utilizzano i cosiddetti file di registro fisici (file di registro fisico, PRF), in cui sono memorizzati i micro operanti.

Richiamare che quando i file di registro fisici non sono stati applicati nei kernel del processore (ad esempio, in microarchitettura nehalem), ogni microperica ha avuto una copia dell'operando (o degli operandi). In effetti, ciò significava che i blocchi di cluster della straordinaria esecuzione dei comandi dovessero avere una dimensione sufficientemente ampia per poter soddisfare le microoperazioni insieme agli operandi richiesti.

L'utilizzo di PRF consente a microoperazioni stesse di salvare solo puntatori agli operandi, ma non gli operandi stessi. Da un lato, questo approccio fornisce una riduzione del consumo energetico del processore, poiché il movimento del trasportatore di micro-funzionamento insieme ai loro operandi richiede significativi costi di consumo di energia. D'altra parte, l'uso di un file di registro fisico consente di salvare la dimensione del cristallo e lo spazio rilasciato viene utilizzato per aumentare la dimensione dei buffer del cluster dell'esecuzione straordinaria dei comandi.

Fico. 2. Blocchi di esecuzione dei comandi straordinari

nei microarchizetti haswell e ponte sabbioso

Nel Microarchitecture Sandy Bridge, un file di registro fisico per Integer Operands (Integer Register) è progettato per 160 record e per flottando Comma Operands (registri AVX) - su 144 record.

Nella microarchitettura di Haswell, i registri Integer e i registri AVX registra i file di registro sono progettati per 168 voci.

Lettura dei buffer (carico) e dei record (negozio), che sono utilizzati per accedere alla memoria, sono aumentati. Ad esempio, se la microarchitettura del ponte sabbioso, i buffer di carico e archivio sono stati calcolati rispettivamente su 64 e 36 record, quindi nella microarchitettura haswell, sono calcolati secondo 72 e 42 record.

La dimensione del buffer di pianificazione unificata, che forma code micro-funzionamento alle porte dei dispositivi funzionali, è stata cambiata anche nella microarchitettura haswell. Se in Sandy Bridge è stato progettato per 54 micro-funzionamento, quindi in Haswell - per 60.

Quindi, se si confronta l'architettura Haswell e Sandy Bridge, quindi nella straordinaria unità di esecuzione, la microchiticoltura Haswell non ha strutturale, ma solo cambiamenti qualitativi per quanto riguarda l'aumento delle dimensioni dei tamponi. Ma non ci sono cambiamenti fondamentali nella straordinaria unità di esecuzione nella microarchitettura di Haswell.

Blocchi esecutivi del kernel della CPU

Per quanto riguarda i blocchi esecutivi del nucleo del processore, quindi nella microarchitettura haswell, hanno subito modifiche significative rispetto alla microarchitettura del ponte sabbioso. Così, in Bridge Sandy ci sono sei porti di dispositivi funzionali (porte di dispacciamento): tre computing e tre per lavorare con la memoria (in Fig. 3 mostra solo porte di calcolo).

Fico. 3. Blocchi esecutivi in \u200b\u200bmicroarchitets Sandy Bridge

e haswell (i porti per lavorare con la memoria non sono mostrati)

Nella microarchitettura haswell, il numero di porte di dispositivi portatili è aumentato a otto. A cosa c'era nella microarchitettura del ponte di sabbia, un'altra porta per la registrazione dell'indirizzo (indirizzo del negozio) e viene aggiunta una porta di calcolo per operazioni con interi e operazioni di spostamento. Pertanto, i processori Haswell possono eseguire fino a otto microoperazioni in un orologio, mentre nella microarchitettura del ponte sabbioso, il numero massimo di tatto micro-operatorio è sei.

Inoltre, i dispositivi di esecuzione stessi sono leggermente modificati nella microarchitettura haswell. Ciò è dovuto al fatto che la microarchitettura haswell è apparso ulteriori set di istruzioni: AVX2, FMA3 e BMI.

Set di istruzioni AVX2 (Istruzioni vettoriali avanzate) è un'estensione del set di istruzioni AVX, che è presente nella microarchitettura del ponte sabbioso. In generale, il kit di istruzioni AVX è una continuazione logica dei set di istruzioni SSE, SSE2, SSE3 e SSE4. Per l'elaborazione dei dati nelle istruzioni AVX, vengono utilizzati 16 circuiti vettoriali di vettore di 256 bit, a causa del quale molte volte possono accelerare molte volte. Ad esempio, la moltiplicazione di quattro numeri a 64 bit che utilizza il team AVX è possibile in un solo orologio, mentre senza l'istruzione AVX richiederà quattro orologi.

La differenza principale tra la nuova istruzione AVX2 impostata dalla versione precedente di AVX è che se le precedenti operazioni a 256 bit con i registri AVX erano disponibili solo per il punto di galleggiamento dell'operand, e solo le operazioni a 128 bit erano disponibili per gli operandi Integer, quindi in AVX2 256 --Bit operazioni sono diventate disponibili per gli operandi interi. Infatti, quando si utilizza AVX per un panno, è possibile implementare 16 operazioni con numeri di precisione singola e otto operazioni con numeri di doppia precisione. E quando si utilizza AVX2 in un unico orologio, è possibile implementare 32 operazioni con numeri di precisione singola e 16 operazioni con numeri di doppia precisione.

Inoltre, AVX2 ha migliorato il supporto per turni e permutazioni nelle operazioni vettoriali. Ci sono nuove istruzioni utilizzate per costruire diversi (quattro o otto) elementi non correlati in un elemento vettoriale, quindi è possibile caricare più completamente i registri AVX a 256 bit.

Un nuovo set di istruzioni FMA3 (ISTRUZIONI MULTIPLY Fused) è destinato a eseguire operazioni di moltiplicazione e addizione combinata su tre operandi.

L'uso delle operazioni FMA3 consente di implementare più efficacemente le operazioni di divisione, l'estrazione della radice quadrata, la moltiplicazione di vettori e matrici, ecc. Il set FMA3 include 36 istruzioni per il punto di galleggiamento per l'esecuzione di calcoli a 256 bit e 60 istruzioni per i vettori a 128 bit.

I comandi BMI (istruzioni di manipolazione bit) includono 15 istruzioni per lo scalare per le operazioni di bit che funzionano con registri generici interi. Queste istruzioni sono suddivise in tre gruppi: manipolazioni su singoli bit, come inserto, spostamento ed estratti di bit, contando i bit, come il conteggio degli zeri principali nella registrazione dei numeri e la moltiplicazione intera della precisione arbitraria. Questo insieme di istruzioni consente di accelerare un numero di operazioni specifiche utilizzate, ad esempio, quando crittografate.

Sottosistema di memoria nella microarchitettura haswell

Uno dei cambiamenti più significativi nella microarchitettura haswell in confronto con Sandy Bridge è stato realizzato nel sottosistema di memoria. E non è solo che la dimensione dei buffer di lettura (carico) è aumentato (Store), che vengono utilizzati per accedere alla memoria (record 72 e 42, rispettivamente). La cosa principale è stata aggiunta un'altra porta per la registrazione dell'indirizzo (indirizzo del negozio), la cache L1 è diventata più produttiva e la larghezza di banda tra la cache L1 e L2 è aumentata. Considerare questi cambiamenti in modo più dettagliato.

L'accesso al sottosistema di memoria inizia con il fatto che le microarazioni corrispondenti arrivano a leggere buffer (caricamento) e record (negozio), che insieme possono accumulare più di cento microarazioni. Nella microarchitettura del ponte sabbioso, i porti dei dispositivi funzionali contrassegnati da schemi come 2, 3 e 4 erano responsabili dell'accesso alla memoria (Fig. 4). Le porte 2 e 3 sono associate ai dispositivi di informazioni sulla generazione degli indirizzi (indirizzo Generation Generation Unità, AGU) per la registrazione o la lettura dei dati, e la porta 4 è associata a un dispositivo funzionale per la registrazione dei dati dal kernel del processore alla cache L1 (DL1). La procedura per la generazione dell'indirizzo prende uno o due orologi del processore.

Fico. 4. Sottosistema di memoria in microarchitets Sandy Bridge e Haswell

Nella microchitettura Haswell alle porte 1, 2 e 3, viene aggiunta la porta 7, che è associata al dispositivo funzionale per la generazione della registrazione degli indirizzi (STORE AGU). Di conseguenza, il kernel haswell può supportare due operazioni di download dei dati e un'unica operazione di registrazione dei dati per tatto.

Un dispositivo funzionale evidenziato per la generazione di una registrazione dei dati è leggermente semplice da eseguire in confronto con dispositivi funzionali per la generazione di un indirizzo generico (per la registrazione e il download dei dati). Il fatto è che la micro-operazione di registrazione dei dati registra semplicemente l'indirizzo (e, in definitiva, i dati stessi) al buffer di registrazione (BUFFER STORE). E la microperica di caricamento dei dati deve essere registrata nel buffer di lettura e traccia anche il contenuto del buffer del contenuto al fine di eliminare possibili conflitti.

Non appena viene generato l'indirizzo virtuale necessario, la cache DTLB L1 inizia per la conformità di questo indirizzo virtuale fisico. La cache dei dati DTLB L1 stessa nella microarchitettura di Haswell non è cambiata. Supporta 64, 32 e 4 record per le pagine di memoria di 4 KB, 2 MB e 1 GB, rispettivamente ed è un 4 canali.

Quando la cache L1 DTLB, le voci corrispondenti nella cache TLB L2 unificata, che ha un numero di miglioramenti nella microarchitettura Haswell inizia. Questa cache supporta la dimensione della pagina 4 KB e 2 MB, è un 8 canali e progettato per 1024 record. E nella microarchitettura Sandy Bridge L2 TLB, la cache è stata progettata per 512 voci (cioè, era a metà meno), supportata solo 4 pagine di memoria KB ed era a 4 canali.

La cache L1 è rimasta la dimensione di 32 Kbyte e 8 canali (come nella microarchitettura del ponte sabbioso). Allo stesso tempo, l'accesso alla cache TLB e il controllo dei tag della cache dei dati L1 possono essere eseguiti in parallelo.

Tuttavia, nella microarchitettura haswell, la cache dei dati L1 ha una larghezza di banda più elevata. Supporta simultaneamente un'operazione di lettura a 256 bit e due operazioni di registrazione a 256 bit, che nell'aggregazione fornisce una larghezza di banda aggregata di 96 byte per il tatto. Nella microarchitettura del ponte sabbioso, la cache L1 supporta simultaneamente un'operazione di lettura a 128 bit e due operazioni di record a 128 bit, cioè ha una larghezza di banda teorica due volte inferiore. In questo caso, la larghezza di banda della cache dei dati L1 effettiva nella microarchitettura del ponte sabbioso è più del doppio della larghezza di banda nella microarchitettura di Haswell a causa del fatto che nel ponte sabbioso solo due blocchi funzionali di AGU.

Inoltre, la microarchitettura Haswell è aumentata e throughput tra la cache L1 e L2. Quindi, se in Bridge Sandy, la larghezza di banda tra la cache L2 e L1 era di 32 byte per ciclo, quindi in Haswell è fino a 64 byte per ciclo. E allo stesso tempo in contanti L2 in Haswell ha la stessa latenza del ponte sabbioso. In conclusione, notiamo che, come nella microarchitettura del ponte sabbioso, in Haswell Cache L2 non è esclusivo e non incluso in relazione alla cache L1.

Nuove modalità di risparmio energetico nel processore Haswell

Una delle innovazioni del processore Haswell è quella di ridurre il consumo di energia totale del processore, i nuovi stati del consumo energetico, che sono chiamati S0IX e sono presi in prestito dai processori Intel Atom (tali modalità di consumo energetico sono stati implementati nei processori Moorestown).

Richiama che tradizionalmente il sistema potrebbe essere nello stato attivo S0 (modalità operativa normale) o in uno dei quattro stati "Sleep" S1-S4.

Nello stato S1, tutte le cache del processore vengono ripristinate e il processore ha smesso di eseguire le istruzioni. Tuttavia, viene mantenuta la potenza del processore e della RAM e i dispositivi non designati come accensione possono essere disabilitati. Lo stato S2 è uno stato "Sleep" ancora più profondo quando il processore è disabilitato.

Stato S3 (altro nome - Sospendere alla RAM (STR) o in modalità standby - Standby) - Questo è uno stato in cui la RAM continua a nutrirsi e rimane quasi l'unico componente che consuma energia.

Lo stato S4 è noto come ibernazione (ibernazione). In questo stato, tutti i contenuti della RAM vengono salvati in memoria non volatile (ad esempio, su disco rigido o SSD).

Gli Stati S0IX (S0I1, S0I2, S0I3, S0I4) sono simili agli stati S1, S2, S3 e S4 nel senso del consumo energetico, ma differiscono da loro dal fatto che per la transizione del sistema allo stato attivo S0 richiede molto meno tempo. Ad esempio, per passare dallo stato S0 allo stato S0I3, sono necessari 450 μS e 3.1 ms per la transizione inversa.

Core grafico in microarchitettura haswell

Una delle principali innovazioni nella microarchitettura Haswell è un nuovo core grafico con supporto DirectX 11.1, OpenCL 1.2 e OpenGL 4.0.

Ma la cosa più importante è che il nucleo grafico nella microarchitettura haswell è scalabile. Ci sono varianti del nucleo grafico con i nomi dei codici GT3, GT2 e GT1 (figura 5).

Fico. 5. Flowchart del kernel grafico haswell

Il nucleo GT1 avrà prestazioni minime e GT3 è il massimo.

La seconda unità di calcolo apparirà nel nucleo grafico GT3, a causa del quale il numero di blocchi di rasterizzazione, i trasportatori di pixel, i nucleari informatici e i campionatori raddoppieranno. Si prevede che GT3 sarà il doppio del GT2.

Il nucleo GT3 contiene 40 blocchi esecutivi, 160 nuclei di calcolo e quattro blocchi di struttura. Per confrontare, ricordiamo che nel codice grafico di Intel HD Graphics 4000, i processori di Ivy Bridge contengono 16 dispositivi esecutivi, 64 kernel informatici e due blocchi di struttura. Pertanto, nonostante le stesse frequenze di clock del loro lavoro, il nucleo grafico di Intel GT3 supera il suo predecessore in termini di prestazioni. Inoltre, il kernel GT3 ha una maggiore prestazione dovuta all'integrazione della memoria EDRAM (nel kernel GT3E) nel packaging del processore.

Il nucleo GT2 contiene 20 blocchi esecutivi, 80 nuclei di calcolo e due moduli di texture e il kernel GT1 è solo 10 blocchi esecutivi, 40 nuclei di elaborazione e un modulo di texture.

Le unità esecutive stesse hanno quattro kernel informatici come quelli usati in aMD Architecture. VLIW4.

Un'altra innovazione è che quando si lavora con la memoria, viene applicata la tecnologia di accesso istantanea, che consente ai kernel di elaborazione del processore e un nucleo grafico per accedere direttamente a RAM. NEL versione precedente La grafica dei core computazionali del processore e il kernel grafico ha anche collaborato con una memoria operativa comune, ma la memoria è stata divisa in due aree con dimensioni dinamicamente variabili. Uno di questi è stato assegnato al nucleo grafico e l'altro per i nuclei informatici del processore. Tuttavia, per ottenere l'accesso simultaneo alla stessa sezione del nucleo della grafica della memoria e il processore i nuclei computazionali non potrebbero. E nel caso processore grafico Gli stessi dati sono stati richiesti che il core computing del processore è stato utilizzato, ha dovuto copiare questa sezione della memoria. Ciò ha portato ad un aumento dei ritardi, e in aggiunta, il problema del tracciamento della coerenza dei dati è nato.

La tecnologia AstantAccess consente al conducente del kernel grafico di mettere il puntatore alla posizione di un'area specifica nell'area dell'area grafica, a cui il kernel del computing del processore deve essere accessibile. In questo caso, il nucleo informatico del processore funzionerà direttamente con questa area di memoria, senza creare una copia e, dopo aver eseguito le azioni necessarie, l'area di memoria verrà restituita al nucleo grafico.

La famiglia di nuovi core grafici GT1, GT2 e GT3 ha migliorato le funzionalità di codifica video. Decodifica hardware supportata da H.264 / MPEG-4 AVC, VC-1, formati MPEG-2, MPEG-2 HD, Motion JPEG, DIVX con risoluzione fino a 4096 × 2304 pixel. Si rivolge che il nucleo della grafica può contemporaneamente decodificare più flussi video 1080p e riprodurre video 2160p senza caricare e saltare i fotogrammi.

È apparso un'unità di miglioramento della qualità video speciale, che si chiama il motore di qualità video ed è responsabile della riduzione del rumore, della correzione del colore, della deinterlacciamento, del cambiamento adattativo in contrasto, ecc. Inoltre, i nuovi core grafici supporteranno le funzioni di stabilizzazione dell'immagine, la conversione della frequenza del fotogramma e la gamma estesa.

Inoltre, il nucleo grafico nel processore Haswell fornisce il collegamento fino a tre monitor allo stesso tempo. Display Port 1.2 Porte con autorizzazioni fino a 3840 × 2160 e 60 Hz Frequenza, HDMI con risoluzione fino a 4096 × 2304 e 24 Hz Frequenza (con risoluzione massima), così come la porta DVI.

Gamma modello haswell.

Mentre è ancora prematuro per parlare della gamma di modelli dei processori Haswell. Naturalmente, su Internet puoi trovare informazioni diverse e talvolta incoerenti relative ai piani Intel per il rilascio dei processori Haswell. Tuttavia, la Società non conferma ufficialmente queste informazioni, quindi non è noto quali metodi dei processori saranno annunciati in primo luogo.

È solo un affidabile che i processori Haswell saranno ufficialmente chiamati la quarta generazione Intel Core e realizza tre serie: Core I7, Core I5 \u200b\u200be Core I3. Come le precedenti generazioni di processori Intel, i modelli del processore HASWELL sono contrassegnati con un numero a quattro cifre che inizia con il numero 4 (la prima figura indica il numero di processori).

Intel inizialmente annuncerà il rilascio di processori per desktop e laptop della serie Core I7 e Core I5, e i processori di serie I3 più deboli ed economici appariranno in seguito.

I processori del desktop saranno terminati con il nucleo grafico GT2 con il nome ufficiale di Intel HD Graphics 4600, ma queste sono solo voci, quindi è abbastanza possibile che sia presente un modello con il core grafico GT3 (nome ufficiale Intel HD graphics 5200) La famiglia di processori per PC desktop.

Le versioni mobili dei processori Haswell saranno dotate di un nucleo grafico o GT3 (modelli principali) o GT2.

Di nuovo, su voci, tutte le versioni processori mobili sarà quad-core con supporto per la tecnologia iper-filettatura ( noi stiamo parlando Sulla famiglia dei processori mobili Core I7). I processori per PC desktop delle famiglie Core I7 e Core I5 \u200b\u200bsaranno principalmente (ad eccezione di un modello nella famiglia Core I5) Quad-core, ma la tecnologia Hyper-Threading supporterà solo il modello superiore della famiglia Core I7 e il modello dual-core della famiglia Core I5.

Tutte le famiglie Core I5 \u200b\u200be Core I7 supporteranno la tecnologia Turbo Boost.

La dimensione della cache L3 nei processori delle famiglie Core I7 e Core I5 \u200b\u200bpuò essere 8, 6 e 4 MB, pozzo, il TDP di questi processori varia da 35 a 84 W.

I processori per PC desktop hanno il connettore LGA 1150 e sono compatibili solo con schede madri basate su nuovi chipset Intel serie a 8 serie.

Processore Intel Core I7-4770

Se non avessimo avuto sull'intera gamma di modelli di processori Haswell e le loro caratteristiche al momento della stesura di questo articolo, non abbiamo avuto, quindi sul processore Intel Core I7-4770, che abbiamo avuto sui test, sapevamo di tutto. Questo processore non è il più in alto nella famiglia Intel Core I7 di quattro generazioni ed è inferiore solo dal modello Intel Core I7-4770K, che differisce da esso in ciò che ha un rapporto di moltiplicazione completamente sbloccato e 100 MHz è una frequenza di clock di base più elevata. In tutto il resto di questi processori sono gli stessi.

Quindi, il processore Intel Core I7-4770 è Quader, supporta la tecnologia Hyper-Threading e la sua frequenza di base è di 3,4 GHz. NEL modalità Turbo. Aumentare la massima frequenza dell'orologio può raggiungere 3,9 GHz. Il processore è dotato di core grafiche L3 da 8 MB e GT2 (il nome ufficiale di Intel HD Graphics 4600), che funziona su una frequenza di clock di 1,2 GHz. Il controller di memoria nel processore, come prima, il doppio canale e la frequenza massima ufficiale della memoria DDR3 supportata è di 1600 MHz (è possibile, ovviamente, utilizzare più velocità).

Di nuovo, come prima, il processore Intel Core I7-4770 ha un controller PCI Express 3.0 integrato da 16 linee. Bene, l'ultima circostanza importante - il TDP di questo processore è 84 W.

Per confronto, ricorderemo che il processore Intel Core I7-3770 (nome del codice Ivy Bridge) della generazione precedente ha una caratteristica molto simile. È anche quad-core, supporta iper-threading e ha una cache L3 di 8 MB. Le frequenze di clock di base di questi processori sono leggermente diverse: per il modello Intel Core I7-4770, è di 3,4 GHz e per Intel Core I7-3770K - 3,5 GHz. Tuttavia, in modalità Turbo Boost, le frequenze dell'orologio di questi processori coincidono: se sono caricati uno o due kernel del processore, la frequenza massima dell'orologio può essere di 3,9 GHz (a condizione che il consumo di energia massima e la corrente massima). Se i tre kernel del processore sono caricati, la frequenza massima dell'orologio può essere di 3,8 GHz e quando si caricano tutti e quattro i core è di 3,7 GHz.

I core grafici sono distinti in questi processori e, naturalmente, la microarchitettura dei nuclei di calcolo stesso. E ora un piccolo dettaglio: il processore Intel Core I7-3770 ha un TDP 77 W, cioè meno di Intel Core I7-4770. Bene, apparentemente un aumento delle dimensioni e dei registri del buffer, i porti aggiuntivi di dispositivi funzionali e un aumento della larghezza di banda della memoria del processore non viene superato. Tutto ciò ha portato ad un aumento del consumo energetico del processore. Con questo, tuttavia, è abbastanza possibile riconciliare se, a causa di un piccolo aumento del consumo di energia, è stato raggiunto un adeguato aumento delle prestazioni del processore. Bene, rimane per verificare se è davvero.

Performance in applicazioni non a camera

Per testare il processore Intel Core I7-4770, abbiamo utilizzato il nostro programma di analisi del benchmark V.12.0 di Benchmark, descrizione dettagliata Che può essere trovato nel numero di marzo della rivista. Richiamare che questa utilità di test si basa sulle seguenti applicazioni reali:

  • Xilisoft. Convertitore video. Ultimate 7.7.2;
  • Wondershare Video Converter Ultimate 6.0.3.2;
  • Movavi Video Converter 10.2.1;
  • Adobe Premier Pro CS 6.0;
  • PhotoDex Proshow Gold 5.0.3276;
  • Adobe Audition CS 6.0;
  • Adobe Photoshop CS 6.0;
  • ABBYY FINERERER 11;
  • WinRAR 4.20;
  • WinZip 17.0.

L'indicatore delle prestazioni utilizza il tempo di esecuzione delle attività di test.

È chiaro che di per sé il momento dell'esecuzione dei compiti di test non consente ancora di stimare le prestazioni del processore. Tali risultati hanno senso solo rispetto ad alcuni risultati adottati per i riferimenti. Tale confronto dei risultati consente di stimare quante volte (o quanto percentuale) il processore di prova è il riferimento più produttivo (e forse meno) durante l'esecuzione di un determinato compito.

Abbiamo confrontato il processore Intel Core I7-4770 con il processore Intel Core I7-3770. Per visibilità, i risultati dei risultati hanno inoltre calcolato le prestazioni integrali generali del processore e le stime integrali per singoli gruppi di test (conversione video, creando contenuti video, elaborazione audio, elaborazione foto digitale, riconoscimento del testo, archiviazione e decompressione dei dati).

Per calcolare la valutazione integrale delle prestazioni, i risultati del test del processore Intel Core I7-4770 sono normalizzati relativi ai risultati del processore Intel Core I7-3770K. I risultati del test normalizzati sono stati suddivisi in sei gruppi logici (conversione video, elaborazione audio, creando un contenuto video, l'elaborazione di foto digitali, il riconoscimento del testo, l'archiviazione e i dati di decompressione), e in ciascun gruppo il risultato integrale è stato calcolato come un mediaometro a media Risultati normalizzati. Per facilità di vista, il valore risultante è stato moltiplicato per 1000. Successivamente, il misuratore medio è stato calcolato dai risultati integrali ottenuti, che è un indicatore di prestazione integrale risultante. Per il processore Intel Core I7-3770K è un risultato integrale delle prestazioni, nonché i risultati integranti per ogni singolo gruppo di test sono 1000 punti.

Per testare il processore Intel Core I7-3770K, è stata utilizzata la seguente configurazione PC:

  • scheda madre - Gigabyte GA-Z77X-UD5H;
  • chipset. sistema di bordo - Intel Z77 Express;
  • memoria - DDR3-1600;
  • scheda video - Processor Graphics Core Intel HD 4000;
  • Il test del processore Intel Core I7-4770 è stato effettuato sul seguente supporto:
  • scheda madre - Intel DH87MC;
  • chipset per scheda di sistema - Intel H87 Express;
  • memoria - DDR3-1600;
  • dimensioni memoria - 16 GB (due moduli GEIL 8 GB);
  • modalità memoria - a due canali;
  • scheda video - Processor Graphics Core Intel HD 4600;
  • drive - Intel SSD 520 (240 GB).

In entrambi i casi usati sistema operativo Microsoft Windows 8 Enterprise (64-bit).

Si noti che il materna scheda Intel. DH87MC, che abbiamo usato per testare il processore Intel Core I7-4770, è un campione di ingegneria. Intel ha rifiutato di produrre schede madri sotto il suo marchio ed è ora impegnata solo dal design di riferimento, cioè, fa tasse come campione per i suoi partner. Pertanto, la scheda Intel DH87MC non andrà mai in vendita.

Entrambi per il processore Intel Core I7-3770K e per il processore Intel Core I7-4770, il test è stato effettuato con impostazioni del BIOS Per impostazione predefinita, cioè, è stata attivata la modalità Intel Turbo Boost, ma non è stata prodotta alcuna accelerazione dei processori.

Per garantire un'elevata precisione dei risultati, tutti i test sono stati guidati cinque volte.

I risultati dei test sono presentati nella tabella. 1 e in fig. 6.

Fico. 6. Risultati integrali dell'utilità dei processori di test

Script di benchmark per computerpress V.12.0

Come potete vedere, le prestazioni integrali del processore Intel Core I7-4770 sono quasi del 10% superiori alla performance del processore I7-3770K Core, e il maggiore aumento delle prestazioni è osservato in applicazioni come Adobe Photoshop CS6 (15%) e Adobe Premier Pro CS 6.0 (18%) e Posadex Proshow Gold 5.0.3276 (13%).

Va notato che i processori Intel Core I7-4770 e Core I7-3770K funzionano sulla stessa frequenza di clock e la differenza osservata nelle prestazioni è spiegata solo dai cambiamenti nella microarchitettura del processore Intel Core I7-4770. Nelle applicazioni non a camera, la nuova micro-architettura del processore Haswell consente di ottenere un guadagno di prestazione in media del 10%.

Performance nei giochi

L'utilità di Benchmark ComputPrepress Script V.12.0 consente di valutare le prestazioni del processore solo quando si lavora con applicazioni non di gioco in cui le possibilità del nucleo grafico integrato non sono praticamente utilizzate.

Pertanto, abbiamo anche apprezzato la performance del core grafico del processore Intel Core I7-4770 nei giochi 3D utilizzando 3DMark Professional e 3DMark 11 Advanced Edition.

Benchmark 3DMark Professional è un nuovo test che supporta sia le piattaforme Windows che Android. Questo banco include tre test: Storm Ice, Cloud Gate and Fire Strike. Il primo è focalizzato su dispositivi mobili come smartphone, tablet o netbook, i laptop portatili / ultrabooks e computer universali di medio livello; E il terzo su PC di gioco produttivo con una grafica potente.

I risultati del test dei processori che utilizzano 3DMark Professional e 3DMark 11 Advanced Edition sono presentati nella tabella. 2 e Tabella 3 e in fig. 7 e 8.

Fico. 7. Risultati del test di elaborazione

Fico. 8. Risultati del test di elaborazione

Come si può vedere dai risultati del test professionale 3DMARK e dal 3DMark 11 Advanced Edition, il nucleo grafico Intel HD 4600 (processore Core I7-4770) ha davvero B diproduttività del peso rispetto al nucleo Intel HD 4000 (processore I7-3770K di base). Tuttavia, la differenza di performance in questi test non è il doppio della società Intel ha dichiarato nei suoi materiali di presentazione e un po 'meno. Tuttavia, i progressi nella performance del sottosistema grafico è ovvio.

Aperto, tuttavia, è rimasto un'altra domanda. Sì, le prestazioni del sottosistema grafico nel processore Core I7-4770 sono aumentate quasi due volte rispetto al processore Core I7-3770K. Ma è sufficiente per questa produttività in modo che il computer possa essere riprodotto senza utilizzare una scheda grafica discreta? Se si guarda un risultato dettagliato nei test di 3DMark Professional e 3DMark 11 Advanced Edition (valore FPS nei test grafici), quindi possiamo concludere che il nucleo grafico Intel HD 4600 non è adatto per i giochi. Tuttavia, tutti gli stessi benchmarks 3DMark Professional e 3DMark 11 Advanced Edition sono programmi specifici. Pertanto, per dare una risposta obiettiva a questa domanda, rivolgersi ai risultati di testare il processore del Core I7-4770 e in altri benchmark di gioco. In questo caso, non è necessario confrontare i risultati dei processi di prova grafica del nucleo I7-4770 e dei processori Core I7-3770K, poiché siamo interessati solo al risultato assoluto del processore Core I7-4770 nel FPS.

  • Per questo test, abbiamo utilizzato i seguenti benchmark:
  • Analisi del paradiso di Unigine Heaven 4.0;
  • Unigine Valley 1.0;
  • Bioshock infinito (benchmark integrato);
  • Metro 2033 (benchmark integrato).

Il test è stato eseguito durante la risoluzione dello schermo 1920 × 1080 (meno risoluzione è semplicemente irrilevante) e in due modalità: massima prestazione e massima qualità. Queste impostazioni estreme determinano un tipo di spina, oltre a quali fps non possono più uscire per qualsiasi impostazione di gioco.

Le impostazioni di ciascun benchmark sulle modalità massime e le modalità di qualità sono presentate nella tabella. 4, tabella. 5, tavolo. 6 e tavolo. 7 e risultati del test - in FIG. nove.

Figura 9. Risultati dei test del processore Intel Core I7-4770 nei giochi

e benchmark di gioco

Dai risultati del test è chiaro che anche quando si installano la qualità minima (massima prestazione) integrata nel processore Intel Core I7-4770, il nucleo grafico non consentirà di riprodurre moderni giochi 3D. Nessuno dei benchmark utilizzati da noi, il valore medio FPS non salirà sopra 30 fps, che, ovviamente, non può essere riconosciuto come risultato soddisfacente. E pertanto, la conclusione è: infatti, il nuovo core grafico Intel HD 4600 è più produttivo rispetto a kernel Intel. HD 4000, ma questa circostanza non significa che la grafica integrata ti consentirà di fare senza una scheda grafica discreta. Per un computer su cui verranno lanciati i giochi, la grafica integrata non è chiaramente adatta.

Conclusione

In conclusione della nostra recensione del processore Intel Core I7-4770, riassumare.

In confronto con il processore Intel Core I7-3770K, le prestazioni del processore Intel Core I7-4770 sono cresciute di circa il 10% nelle applicazioni non player. Tuttavia, parlando della crescita della performance del processore haswell, è necessario tenere a mente una circostanza molto importante.

Uno dei principali vantaggi dei processori Intel Core (Sandy Bridge) e la terza generazione (Ivy Bridge) era che stavano bene accelerando e il concetto di frequenza di clock di base era in una certa misura virtuale. Questi processori sono stati suddivisi in completamente sbloccati (processori serie C) e parzialmente sbloccati (tutti gli altri processori). È possibile accedere ai processori della serie K è possibile modificare il coefficiente di moltiplicazione (il valore massimo per il coefficiente di moltiplicazione, sebbene esista, ma è piuttosto alto).

Per i processori parzialmente accelerati, è stato possibile stabilire un fattore di moltiplicazione in quattro passaggi aboveward rispetto al valore massimo in modalità Turbo Boost. Ad esempio, il processore Intel Core I7-3770 con una frequenza di clock di base di 3,4 GHz può essere dispersa a una frequenza di 4,3 GHz (rapporto di moltiplicazione 43), poiché la frequenza massima dell'orologio di questo processore in modalità Turbo Boost è di 3,9 GHz (moltiplicazione Rapporto 39).

Tuttavia, nei processori Haswell che non sono correlati alla serie K, tale accelerazione parziale è bloccata affatto, e quindi è impossibile disperderli.

Sembrerebbe diverse dalle manipolazioni con il fattore di moltiplicazione, è possibile accedere anche al processore aumentando la frequenza pneumatico di sistema. Formalmente, in effetti, è possibile. Ma, come spettacoli pratiche, i processori Intel Core della seconda, terza e quarta generazione sono quasi impossibili da dispersi a causa di un aumento della frequenza del pneumatico del sistema. In particolare, i nostri esperimenti con il processore Intel Core I7-4770 hanno mostrato che dopo un aumento della frequenza del pneumatico del sistema, solo 3 MHz il sistema non è più caricato.

Perché Intel ha bloccato la possibilità di overclocking parziale - assolutamente incomprensibile. Molto probabilmente, questa fase scortese dell'azienda in relazione agli utenti e ai partner impegnati nella produzione di schede madri può essere considerata come un altro errore di marketing aziendale.

L'impossibilità di elaborare i processori Haswell che non si riferiscono alla serie K porta alla prossima tristi conclusioni. Dal punto di vista del costo e delle prestazioni è più redditizio acquistare un processore Intel Core I7-3770 parzialmente sbloccato rispetto a un processore Intel Core I7-4770 assolutamente bloccato. Riscaldamento a una frequenza di 4,3 GHz (accelera senza problemi a tale frequenza), riceverai prestazioni più elevate rispetto al processore Intel Core I7-4770.

"Pratiche interessanti senza scienza - come un mangime, facendo un passo su una nave senza sterzo o bussola; Non è mai sicuro di dove nuota. La pratica sempre dovrebbe essere eretta su una buona teoria ... "(Leonardo da Vinci)

Articoli dedicati alla microarchitettura fondamentalmente nuovi processori Intel., di solito inizia con riferimento al design "TIK-SO" adottato in azienda dal 2007. La sua essenza risiede nel fatto che lo sviluppo di nuovi progetti di processore e il trasferimento della produzione a norme tecnologiche più avanzate si alternano l'uno con l'altro. L'ultima microarchitettura, Ivy Bridge, in questa classificazione è stata "spunta", il nuovo, has, è "così". Cioè, in faccia Haswell., in teoria, dobbiamo vedere i fondamentalmente aggiornati dall'interno del processore, ma la tecnologia prodotta dalla già familiare tecnologia da 22 nm con transistor tridimensionali.

Ecco perché tali aspettative elevate sono associate al prossimo rilascio di Haswell. Mercato computer personale Situato in una stagnazione. La concorrenza tra i produttori di processori X86 in un segmento ad alte prestazioni ha mostrato no, e computer desktop. Consegnare lentamente la tua posizione sotto l'assalto dei dispositivi mobili. Anche l'aspetto del sistema operativo Windows 8 non è stato corretto, anche l'aspetto del sistema operativo Windows 8 - non è stato solo possibile tornare al precedente interesse per i personal computer, inoltre, molti Adepti di fattori di forma tradizionali hanno causato un antipasto persistente . E ora tutti gli appassionati stanno aspettando la rivoluzione di Intel, sperando in un salto di alta qualità, che avrebbe risvegliato interesse per la dinamica predefinita della piattaforma X86. Qualcuno crede che i desktop classici e i computer portatili possano di nuovo diventare una tendenza della moda, e qualcuno si aspetta che l'emergere di una nuova linea di processori spingesse almeno i proprietari di sistemi già disponibili alla loro modernizzazione. In altre parole, Haswell agli occhi degli appassionati di personal computer produttivi è quasi l'ultima speranza per il revival del segmento del cuore del mondo.

Tuttavia, Intel su questo punteggio sembra essere un'opinione completamente diversa. Il raffreddamento degli interessi nei confronti dei personal operatori produttivi si sentono in azienda, ma tenendo conto della congiuntura stabilita, è previsto di non provare a riscaldare i vecchi mercati, ma per prendere la conquista di nuovi. L'intera linea generale è soggetta ad adeguamento. Intel non intende continuare a combattere attivamente per l'onore del tradizionale e familiare a molti sistemi, ed invece, vuole apportare modifiche all'architettura X86 e ai prodotti esistenti per adattarli per quelle classi di dispositivi mobili che sono ora a il picco della popolarità. In parte questo obiettivo è l'inizio delle trasformazioni fondamentali nell'azienda agricola Atom: la promozione attiva dei processori di questa classe in smartphone e tablet, nonché la preparazione del nuovo microarchitecture silvermont. Ma la metamorfosi parallela avverrà con la linea del processore principale, che, secondo gli sviluppatori, dovrebbe diventare ancora più mobile. E haswell - anche se non il primo, ma probabilmente la pietra miliare più evidente su questo percorso.


Tutte le presentazioni e i materiali per la stampa dedicati ai processori promettenti, nelle prime pagine ci dicono che Haswell è prima di mirare a ultrabook e trasformatori di computer portatili ultraportati, che sono trasformati in un movimento leggero della mano alle tavolette. Ed è così impossibile riflettere l'obiettivo che si trovava prima degli sviluppatori della nuova microarchitettura. Se allo stadio della creazione di microarchitetture ponte sabbioso e ponte di edera, gli ingegneri hanno lavorato sui processori di progettazione con un consumo di energia mirato di 35-45 W, mentre altre opzioni sono state ottenute variando il numero di nuclei, frequenza e tensione, quindi con i requisiti del consumo di Haswell erano ancora più stretti. Ora Intel considera la gamma più interessante dai 15 ai 20 W. Così, Haswell è una microarchitettura ultra-abile pronunciata, in termini di prestazioni nel palcoscenico sopra l'atomo. Per quanto riguarda le modifiche desktop di Haswell, è per Intel - un sottoprodotto. Naturalmente, è molto più facile ottenere da un processore economico che per eseguire questa conversione nella direzione opposta. Ma la rimozione delle restrizioni sul consumo di energia e la dissipazione del calore non significa ridimensionamento non immerso della produttività. Quindi quanto giustifica le aspettative di Haswell nel suo cappello desktop - la domanda non è così ovvia.

E qui sarà rilevante ricordare il ciclo precedente "Allora", processori con la microarchitettura del ponte sabbioso. In confronto con i loro predecessori, la generazione di Westmere è stata in grado di fornire solo una crescita delle prestazioni del 15% nell'ambiente desktop precisamente perché gli sviluppatori hanno iniziato a spostare i loro accenti sul rapporto tra produttività e consumo energetico. Ora la conversazione viene anche eseguita in un'altra lingua: i principali punti di forza di Haswell, secondo il produttore, è un'eccellente efficienza e un livello fondamentalmente nuovo di velocità grafica. Per quanto riguarda le prestazioni di calcolo, Intel per qualche motivo non si concentra su di esso, il che causa cattivi sospetti. Basta aggravato se si guarda i dati preliminari sulla velocità del desktop Haswell, che ora sono stati trapelati alla stampa.

Aspettando l'uscita dei processori costruiti sul corso microchitetico di Haswell, rimane molto lungo. E pochi giorni dopo saremo in grado di dare risposte espanse a qualsiasi domanda. Tuttavia, prima di questo, opportuno familiarizzare con la teoria - dovrebbe essere anche un antidoto sgradevole, ma necessario da troppo arcobaleno, che potrebbe essere formata in un'aspettativa dormiente di qualcosa di nuovo.

Microarchitettura haswell: tick o giù di lì

Onestamente, la parte introduttiva addensa eccessivamente la vernice. Sì, la microarchitettura haswell può veramente essere considerata altamente efficiente dal punto di vista energetico, ed è stato sviluppato principalmente con un occhio sulle applicazioni mobili. Tuttavia, Intel non dimentica ancora che il modello di business adottato nella società implica l'uso di un unico design in una vasta linea di prodotti, che include componenti mobili, desktop e server. Ciò significa che sotto la facciata alla moda del basso consumo energetico, una solida base è nascosta, che ti consente di inviare Haswell a diverse nicchie di mercato. In altre parole, la nuova microarchitettura non ha perso la sua versatilità. Manipolando il numero di nuclei, le versioni del motore grafico, il livello obiettivo del consumo di energia, la dimensione della memoria della cache e l'aggiunta di una o di un'altra serie di interfacce esterne da Haswell può essere ottenuta in modo diverso nella sua essenza.


Tuttavia, se la microarchitettura stessa si riferisce, quindi sì, in primo luogo ci sono innovazioni volte a ottimizzare i regimi termici ed energetici. Modifiche in grado di sollevare le prestazioni, non così tanto, e sul ciclo di sviluppo "quindi" sono anche disegnati, quindi con grande difficoltà. Infatti, quando Intel ha prodotto Nehalem o Bridge Sandy, la ristrutturazione ha colpito non solo i blocchi interni dei nuclei di calcolo, ma anche il concetto di base del design del processore. Ogni "così" sembrava essere davvero fondamentalmente diverso e lo spirito è stato catturato nel grado di innovazione. Ma se guardi lo schema di Haswell generalizzato, è facile confondere con il predecessore - Ivy Bridge.


Tutti i blocchi funzionali e i principi della loro associazione nel processore sono rimasti uguali. Haswell eredita tutte le tecnologie di successo del passato: turbo, hyper-threading, anello bus, ma nulla di nuovo a questo bagaglio aggiunge. Ci sono cambiamenti solo nelle profondità dei singoli nodi. Inoltre, l'interferenza di ingegneria nei livelli profondi della microarchitettura non è troppo. Il trasportatore esecutivo è cambiato non troppo, la sua lunghezza è la stessa durata di 14-19 volte prima. La parte frontale ha ricevuto solo singoli miglioramenti cosmetici e tutte le modifiche significative riguardano solo il meccanismo delle istruzioni di esecuzione e supportano nuovi set di comandi. Parlando se Haswell è più microarchitettura produttiva piuttosto che Ivy Bridge, Intel si riferisce al miglioramento delle prestazioni fino al 20-30 percento, ma si dovrebbe tenere presente che questa valutazione include una vittoria dall'uso dei nuovi comandi AVX2 per cui un lungo e L'implementazione della fase difficile è ancora avanti.

Efficienza: tutto per lei

Ma i passi fatti per migliorare l'efficacia dei costi del design del processore, sono persino debug. La quota del leone degli sforzi degli sviluppatori è stata spesa per ridurre il consumo energetico, e, devo dire, dal punto di vista dei sistemi mobili, questi sforzi erano lontani dall'essere chiesto. È previsto che Haswell funzioni da una batteria di circa il 50 percento più lungo rispetto alle configurazioni simili basate sul ponte Ivy. Nella semplice vittoria haswell rispetto ai processori della generazione precedente, è di circa 2-3 volte! E in uno stato di prontezza per il lavoro durante il risparmio le connessioni di rete (Collegato Standby) Piattaforma di consumo generale rispetto ai sistemi a base di ponte sabbiosi diminuiti di circa 20 volte.

Tale progresso impressionante con le sue radici non è il semplice migliorare il processo tecnologico, che ha effettivamente solo differenze evolutive dal processo tecnico di 22 nm con transistor tridimensionali utilizzati per la produzione di Ivy Bridge. E ancora più la questione non è in un aumento banale del numero di zone del cristallo del processore, che in assenza di attività può essere scollegata dal bus di fornitura indipendentemente l'uno dall'altro. Naturalmente, tutto ciò rende un certo contributo all'economia di Haswell, ma tali modifiche si verificano con ogni nuova generazione di processori Intel e il salto di alta qualità è avvenuto solo ora. Quindi il segreto del successo è in un altro.

In breve: sono state raggiunte nuove frontiere dell'economia grazie a una serie di eventi, condotti non così tanto con il processore stesso, come con la piattaforma e l'infrastruttura nel suo complesso.

In primo luogo, l'integrazione complessiva dei componenti della piattaforma è stata svolta un ruolo importante: una parte significativa del programma di convertitore di potenza era giurato al cristallo del processore e una versione sociale specializzata del processore è stata progettata per applicazioni ultramotiche, che contiene il secondo cristallo Lo stesso substrato: un set di logica di sistema.


In secondo luogo, Intel ha esaurito un lavoro significativo con i principali produttori di controller, indicandoli alla necessità di sostegno di alta qualità per il sonno e il sonno profondo. Lungo la strada, gli sviluppatori sono calcolati, effettivamente ottenuto dai produttori di matrici di visualizzazione Matrici di supporto del pannello Arrestazione del pannello, consentendo di salvare l'immagine sullo schermo senza il suo aggiornamento continuo dal nucleo grafico.

In terzo luogo, il sistema operativo Windows 8, il cui kernel è molto più preferito per il trattamento degli interrupt, per quanto possibile, cercando di evitare transazioni disperse che risvegliano il processore o il dispositivo.

E infine, nel quarto, l'haswell ha un nuovo set di stati del sonno S0IX, simili dal livello del consumo energetico su S3 / S4 (quando tutti i componenti della piattaforma vengono inviati alle passività), ma con il tempo di traduzione di il sistema in uno stato completamente operativo sul livello di diversi millisecondi. Inoltre, sono stati ulteriormente aggiunti nuovi stati del processore del processore C7 e ulteriormente ottenuti presso il funzionamento visibile del sistema, ma in cui la tensione di alimentazione può essere completamente rimossa dalla parte principale della CPU.


Tuttavia, tutto quanto sopra riguarda principalmente piattaforme mobili e la durata del loro lavoro della batteria. Nei sistemi desktop, la maggior parte di queste innovazioni detiene anche, ma per gli utenti finali, sono praticamente indifferenti. Mentre influenzano il più direttamente, questa apparenza nelle nuove zone del processore Haswell operano a frequenze diverse. Nel Ponte Ivy c'erano due zone di questo tipo: i kernel di calcolo (insieme al cassettino e all'agente di sistema) e al nucleo grafico. Ma non si è scoperto una migliore decisione Dal punto di vista dell'efficienza, poiché gli appelli di grafici ai dati in L3-Keshe hanno portato all'uscita dagli stati di risparmio energetico dell'intero processore. Pertanto, nella parte Haswell Uncore, che combina l'agente di sistema e il Caus di terzo livello, ha ricevuto la propria frequenza indipendente.

E questo non è affatto un cambiamento positivo, ma un'illustrazione luminosa di tali priorità che gli ingegneri Intel hanno aderito allo sviluppo del loro nuovo design. Il lavoro asincrono di Nuclei di Uncore e Computing porta al fatto che la cache di terzo livello in Haswell ha una maggiore latenza rispetto ai processori della generazione precedente. In altre parole, per motivi di migliorare l'efficienza di Intel è pronta a rimettere persino i guadagni guadagnati guadagnati in precedenza.

Ma tutte le misure adottate da Intel per ridurre il consumo di energia, consentire all'azienda di espandere significativamente la gamma di processori di efficienza energetica fondamentale. Nel segmento mobile, la comparsa di ampia e include circa due dozzine di elementi della serie U, con una caratteristica generazione di calore calcolata di circa 15 W. Inoltre, è prevista la serie Y con dissipazione del calore a 6-7 W. Queste cifre sembrano particolarmente impressionanti se prendiamo in considerazione che stiamo parlando della dissipazione del calore del gruppo, che include oltre al core del processore e il cristallo del set di logica.

Per coloro che volevano rapidamente

Ma ancora, inserendo le idee dei processori del nucleo riorientato sui computer portatili ultra-auto-trasformatori e piatti produttivi, Intel non ha dimenticato un po 'il cuore dei loro processori. Sebbene i kernel informatici di Haswell siano molto simili al kernel Ivy Bridge, si possono ancora trovare una serie di miglioramenti. È vero, questi miglioramenti non sono effettuati affatto dal desiderio di aumentare la produttività pulita - il numero di istruzioni elaborate dietro il tatto. La ragione del loro aspetto è l'introduzione di nuove istruzioni AVX2 e il desiderio di aumentare l'efficienza della tecnologia iper-filettatura, che dovrà compensare l'impossibilità di utilizzare quattro nuclei a pieno titolo nei processori a basso costo. Ma, per fortuna, ci sono effetti collaterali positivi tra le innovazioni fatte.

La parte anteriore del trasportatore esecutivo ha rimasto quasi intatto. La nuova microarchitettura, così come i suoi predecessori, viene affilata nell'elaborazione di quattro istruzioni per il tatto. L'unità di esempio dell'istruzione e il decodificatore hanno esattamente la larghezza. Rimase le istruzioni invariate e nella cache del primo livello di 32 kbyte, così come la cache introdotta in Ivy Bridge per le istruzioni decodificate per una e mezzo mila microoperazioni. I vantaggi in questa fase a Haswell prima del design del passato ce ne sono solo due. Innanzitutto, a causa del nuovo design del processore che si verifica, con ogni versione, la dimensione di tutti i buffer interni ha aumentato l'accuratezza del blocco di previsione di transizione. In secondo luogo, la coda delle istruzioni già decodificata ha ricevuto un'ottimizzazione esplicita sotto iper-threading: la sua divisione in due flussi ha iniziato a verificarsi dinamicamente.


In realtà, la mancanza di cambiamenti negli algoritmi di base delle istruzioni di campionamento e decodifica ed è una chiara indicazione che non vale particolare la pena aspettare di aumentare il trattamento delle istruzioni in Haswell. Più di quattro (o cinque nel caso di un funzionamento di successo della tecnologia X86 Macro-Ops Fusion) X86, questa architettura non può digerire. E se prima nel ciclo di sviluppo "quindi" Intel ha fatto innovazioni che potrebbero aumentare l'efficienza del lavoro dei decodificatori esistenti, ora non lo è.

I cambiamenti notevoli nella microarchitettura haswell vengono rilevati se si sposta nel trasportatore più a fondo. Quindi, l'aumento di tutti i tamponi principali ha toccato non solo le previsioni delle transizioni. È importante che allo stesso tempo sia aumentata una straordinaria finestra di esecuzione. Ciò raggiunge un miglioramento delle possibilità sull'elaborazione parallela delle istruzioni di un singolo flusso, che alla fine consente di caricare più strettamente i dispositivi esecutivi (Koi in Haswell non ha solo più, ma più evidente).


In realtà, contro lo sfondo di tutti gli altri, miglioramenti abbastanza miserabili nelle stime microarchiteziali, questo è forse il vantaggio principale del nuovo design del microprocessore. Se solo sei porte esecutive fossero fornite nel Ponte Ivy, poi c'erano otto in Haswell.


Pertanto, nella teoria di Haswell può gestire fino a otto microoperazioni per tatto. Tuttavia, va notato che le tre porte sono assegnate alle operazioni di memoria, cioè, sono destinate a mantenere le microoperazioni ausiliarie derivanti dalle istruzioni di disinserita X86.

Pertanto, l'aspetto di una porta separata per le operazioni interi e le filiali di elaborazione è di fondamentale importanza. Ovviamente, si presume che nel tempo, il numero di istruzioni a 256 bit utilizzate nei programmi crescerà, e in modo che non blocchino il lavoro del codice più comune, la sua esecuzione può ora essere assegnata al porto indipendente. Tali porti "scatenatura" dei tipi di operazioni dovrebbero dare un effetto positivo particolarmente forte mentre eseguito simultaneamente da un nucleo di due flussi eterogenei con la partecipazione della tecnologia iper-filettatura. Cioè, siamo di nuovo di fronte alla crescita della sua efficacia in Haswell.

Inoltre, il processore è ora risultato essere un totale di quattro porte in grado di lavorare con istruzioni interere. Ciò significa che il codice intero più normale può passare attraverso la fase di esecuzione con lo stesso ritmo come attraverso il decodificatore.

Tuttavia, a giudicare dall'approccio generale al progetto di una nuova microarchitettura, Intel stava pensando alla crescita del numero di istruzioni elaborate da quest'ultimo. Ciò che probabilmente gli sviluppatori preoccupati sono molto più forti, questo sta lavorando con nuove squadre dal set AVX2. Questa multilvola istruzioni include comandi SIMD a 256 bit per l'elaborazione di numeri interi, operazioni di memoria rarefatta e varie permutazioni e turni di vettori. Ma la percentuale del leone e più importante del nuovo set di comandi è fondamentalmente nuove istruzioni FMA sostanziali (fusibili multipli-aggiunti), che in realtà includono una coppia di operazioni - moltiplicazione e aggiunta. Naturalmente, la loro esecuzione dei vecchi agenti causerebbe un significativo processore di protrusione, quindi sono ora fatte due porte separate per loro ed attuatori evidenziati. Di conseguenza, Haswell può eseguire due doppi istruzioni FMA per il tatto.


Pertanto, teoricamente, Haswell sul codice AVX2 può mostrare il doppio delle prestazioni dei materiali di picco elevate rispetto ai processori delle generazioni passate. Sebbene, infatti, se si confronta la velocità di esecuzione di un'istruzione FMA e le istruzioni separate per la moltiplicazione e l'aggiunta, la vera quantità di accelerazione sarà al 60 percento, che, ovviamente, è anche molto buona.

In una certa misura, l'implementazione dell'esecuzione rapida dei comandi FMA è una risposta Intel sulla crescente popolarità dei calcoli sui processori grafici. Il set AVX2 e l'hardware disponibile per la sua elaborazione rendono l'haswell eccellente numerico, e queste istruzioni si adattano perfettamente in algoritmi di calcolo popolari utilizzati sia nei campi scientifici che durante l'elaborazione di vari contenuti multimediali.

Di conseguenza, i processori Haswell possono ancora essere significativamente più produttivi dei loro predecessori. Ma non a spese di un'esecuzione più rapida del vecchio codice, e a causa della fornitura di strumenti per la migliore attuazione di vecchi algoritmi attraverso nuovo sistema Istruzioni. Questo, ovviamente, richiede determinati sforzi della comunità del programmatore, ma non porta a costi aggiuntivi del processore elettrico, che si adatta perfettamente alla linea generale, che Intel ora aderisce.

Il desiderio di rendere il lavoro di un processore con le istruzioni AVX2 nel modo più semplice possibile, ha costretto gli sviluppatori Haswell a pensare di aumentare la velocità della memoria della cache. Nuove squadre sono suggerite due volte più velocemente rispetto all'elaborazione dei dati. Pertanto, per mantenere il saldo nella nuova microarchitettura, la larghezza di banda del primo e del secondo livello è aumentata simmetricamente. Sottolineiamo, stiamo parlando di espandere la larghezza di banda L1 e L2-Kesha, la latenza della stessa memoria della cache rimane allo stesso livello di prima.


Di conseguenza, la cache di primo livello è stata in grado di elaborare due letture a 32 byte e una registrazione a 32 chiavi per tatto. La cache del secondo livello può ricevere e fornire i dati di 64 dati di dati. E in quello e in un altro caso, vi è un aumento di due volte in throughput rispetto ai microarchitet del processore delle generazioni passate. Inoltre, l'haswell è riuscito finalmente a eliminare tutti i ritardi aggiuntivi associati a ricorsi ai dati non a livello nella L1-Keshe.

Sfortunatamente, i miglioramenti sono andati attorno al Caus di terzo livello, che ora opera alla propria frequenza in modo asincrono con i nuclei di calcolo. E anche se la sua frequenza è vicina alla frequenza della parte principale del processore, Asynchrony causa un aumento della latenza. Nessun risarcimento nella forma della larghezza di banda crescente seguita. Il bus dell'anello intra-processor in Haswell viene trasferito da Ivy Bridge senza alcuna modifica, quindi allunga il L3-Kesha più di 32 byte di dati per il ritmo è impossibile con tutto il desiderio.

Riassumendo, notiamo che, sebbene sia rimasto sulla microarchitettura dei nuclei computazionali ed è simile al ponte Ivy, miglioramenti che possono aumentare la sua velocità sul codice abituale, è ancora lì. Infatti, tra tutte le fasi del trasportatore, è stata effettuata una grave rielaborazione, che ha portato al fatto che, sebbene la velocità del campionamento e la decodifica delle istruzioni e rimase quasi la stessa, l'esecuzione di queste istruzioni potrebbe ora verificarsi più rapidamente e con un maggiore grado di parallelismo. Ma influenzerà la reale esibizione di Haswell, dipende dal fatto che l'esecuzione sia davvero, e non la decodifica era un collo di bottiglia nelle versioni passate della microarchitettura centrale.

Grafica integrata: andiamo al livello di GeForce GT 650m

Tuttavia, al fine di sentire l'aumento della potenza di Haswell con una probabilità del 100%, non è assolutamente necessario riscrivere i programmi disponibili in AVX2. Il fatto è che in questo processore c'è una parte importante che occupa circa il 30 percento dell'area di cristallo, su cui gli ingegneri Intel hanno funzionato molto duramente. Questo è un nucleo grafico integrato. Considerando il contenuto primario delle applicazioni mobili dei suoi processori, Intel ha condotto miglioramenti successivi nella grafica incorporata in essi in embusto in essi e cerca di garantire che il proprio acceleratore non sia peggiore delle soluzioni ad altri sviluppatori, compresi quelli che sono pratici. Nel Ponte Ivy, abbiamo già visto quasi la doppia crescita delle prestazioni grafiche rispetto ai processori della generazione precedente, avvenuta simultaneamente con l'implementazione del supporto per tutte le moderne versioni dell'interfaccia software. La microarchitettura haswell promette di aumentare la velocità del kernel grafico è ancora un po 'due volte.


I piani di sviluppo, come vediamo, erano ambiziosi, ma allo stesso tempo, come nel nucleo informatico, in questo caso Intel è stato in grado di fare a meno dell'introduzione di profondi cambiamenti architettonici. La struttura del nucleo grafico rimane vecchio e la crescita delle prestazioni è assicurata in un metodo di puro modulo ampio. La nuova architettura della schermata video Intel promette solo nel 2014 - nella prossima generazione di processori con il nome del codice Broadwell. Di conseguenza, come il kernel di calcolo, il nucleo grafico haswell porta i pensieri che "così" e dal nuovo processore si sono rivelati troppo credibili. Tuttavia, ciò non sminuisce la crescita raggiunta della velocità, che, naturalmente, merita di conoscere più le sue fonti. Soprattutto da quando nel nuovo generazione Intel. Grafica HD Il luogo ha trovato soluzioni di ingegneria molto divertenti.


Ad eccezione delle singole ottimizzazioni del convogliamento grafico volte a trasferire parte del carico dal conducente ai blocchi hardware e ad aumentare la produttività dei blocchi funzionali più specializzati che si esibiscono nelle operazioni preparatorie del rendering 3D del trasportatore, un nuovo nucleo grafico è molto simile al kernel da I processori della generazione precedente con supporto aggiunto DirectX 11.1. Il vantaggio principale del nuovo design è la presenza di un numero significativamente maggiore di dispositivi esecutivi universali. Se la versione massima del grafico Ivy Bridge ha 16 dispositivi esecutivi (incluso 4 ALU ciascuno), il numero di dispositivi esecutivi nel core grafico HASWELL può raggiungere fino a 40 pezzi.

Tuttavia, Intel ha deciso di condurre una maggiore segmentazione esplicita e sulla base di un unico design per creare diverse opzioni grafiche: GT1, GT2, GT3 e GT3e. La versione base è GT2 con 20 dispositivi esecutivi. È destinato alla maggior parte dei modelli di processore desktop e offerte su 4 dispositivi in \u200b\u200bpiù rispetto alla grafica più vecchia dei processori di generazione del ponte Ivy. Tuttavia, la sua versione tagliata, GT1, ha solo 6 dispositivi esecutivi e differisce poco dal grafico già presente nei processori di Pentium e Celeron esistenti. L'opzione massima, GT3, che ha 40 dispositivi di azionamento, è un GT2 con un doppio cluster esecutivo. Tale versione pompata della schermata video è rivolta alla maggior parte delle varianti di Haswell Mobile, inclusi principali processori per ultrabooks. Due e mezzo aumento multiplo del numero di attuatori e dovrebbe, secondo lo sviluppo degli sviluppatori, fornire una crescita due volte delle prestazioni grafiche. Tuttavia, una versione così produttiva del traffico video, GT3, non cadrà in computer desktop. E questo significa che nella grafica Intel integrata del desktop, l'aumento della produttività non sarà multiplo, ma solo circa il 30 percento.


È curioso che, infatti, il cristallo di Haswell Semiconductor avrà su uno o due dispositivi esecutivi più che forniti dal design. I dispositivi aggiuntivi svolgono il ruolo di ricambio, sono necessari per sostituire blocchi non funzionanti e ridurre il numero di processori difettosi.

L'aumento della potenza del cluster esecutivo del nucleo grafico ha costretto gli sviluppatori di progettazione a pensarci a essere un collo di bottiglia del layout della trama. Pertanto, la velocità del blocco di texture in Haswell è stata simmetricamente aumentata. Intel promette un aumento di quattro volte nella velocità di textura rispetto alla grafica di Ivy Bridge, e questo è abbastanza rafforzante se si considera l'aumento della potenza del resto del motore.

Tuttavia, nonostante tutte le misure adottate, anche le prestazioni di GT3 sembravano insufficienti Intel per attirare i propri nuclei integrati degli utenti più esigenti. Pertanto, per i sistemi mobili di gioco produttivi, Intel ha creato una modifica GT3E a pagamento specializzata. Nei processori con un tale kernel, che formeranno una serie H-Mobile H separata, il nucleo grafico GT3 integrato sarà integrato da una memoria rapida EDRAM con un volume di 128 MB e un pneumatico a 512 bit. L'idea è che le limitazioni significative sulla velocità del videoregistratore incorporato impone una larghezza di banda insufficiente della memoria del sistema, che riproduce anche il ruolo della memoria video in tali casi. Edram verrà installato su un substrato con kernel del processore ed eseguire il ruolo di L4-Kesh, fornendo una larghezza di banda di circa 64 GB / s. Tuttavia, non viene fornita alcuna interfaccia specializzata tra il nucleo grafico e EDRAM, in modo che tale cache L4 sia buffer tutti i contatti in memoria e non solo avviati dal nucleo grafico. Tuttavia, Intel si aspetta che questo integratore sarà in grado di ritirare Haswell sulla prestazione grafica ad un unico livello con NVIDIA GeForce GT 650m.


Ma dovrebbe essere intesa che l'aggiunta di un processore di cristallo addizionale EDRAM è aumentato significativamente il consumo energetico e il costo del processore, quindi la CPU con GT3E dovrebbe essere utilizzata esclusivamente nei laptop dei giocatori ad alte prestazioni, dove stiamo parlando Economia, compattezza e budget. Quindi, la società AMD con la sua Generazione APU Richland non è ancora stata un senso di pressione speciale da parte di un concorrente. E di solito riguarda l'ambiente desktop: offrire una vasta gamma di processori con core grafici produttivi per questo segmento di mercato Intel non considera necessario.

Tuttavia, anche gli utenti dei sistemi desktop saranno in grado di stimare altri vantaggi del nucleo grafico di nuova generazione, come le funzionalità avanzate di connessione del monitor. I supporti Haswell funzionano fino a tre visualizzazioni indipendenti e tutte e tre le connessioni possono essere digitali. Grazie alla stessa implementazione di compatibilità con le ultime versioni delle interfacce HDMI e DisplayPort, le autorizzazioni supportate massime hanno raggiunto valori 4KX2K.

Senza miglioramenti, non c'è uno dei bambini Intel preferiti: il codificatore video hardware Quick Sync si trova nel nucleo grafico. Gli sviluppatori lo considerano come uno dei modi per ridurre il consumo di energia dei processori, poiché la sincronizzazione rapida consente di rilasciare i kernel informatici da compiti ad alta intensità energetica e molto comuni di codifica e decodifica video, trasferirli a un nodo specializzato ed economico. Pertanto, in ogni nuova versione del design del processore, le prestazioni dei rapidi aumenti di sincronizzazione e il numero di formati supportati da questa tecnologia cresce. Pertanto, Haswell oltre ai formati già masterizzati sarà in grado di funzionare sul livello hardware con SVC (codifica video scalabile - derivativo AVC H.264), decodifica MJPEG (Motion JPEG) e codificare il video in formato MPEG2. Garantirà la compatibilità a pieno titolo durante la codifica e la decodifica con il video in risoluzione 4K (4096x2304, 4096x2160 e 3840x2160), che sta attualmente diventando sempre più popolare.

L'encoder di sincronizzazione rapido è aumentato e è aumentato. E ora è inerente a non solo in alto throughput, ma anche bassa latenza, aprendo il percorso nella teleconferenza. La velocità della codifica in Haswell è notevolmente superiore a quella del Ponte Ivy, tuttavia versioni diverse Il kernel grafico è diverso e un po '. Ma la qualità del video ottenuta durante la codifica hardware è migliorata in qualsiasi modifica grafica. La tecnologia aggiornata di sincronizzazione rapida dovrebbe dare la migliore qualità dell'immagine codificata rispetto al bridge di edera, anche con lo stesso bitrate.

Conclusione

Ovviamente, la nuova microarchitettura haswell può esprimere entrambe le speranze per un futuro brillante e delusione dei progressi raggiunti. Tutto dipende da ciò che ti aspetti. Sfortunatamente, lo schema Intel "Tik-Quindi" spinge invisibilmente alle aspettative di oltrepassare, perché Haswell si riferisce al ciclo di sviluppo "Quindi", cioè dovrebbe essere percepito come una nuova generazione di microarchitettura. Ma non ci sono molti miglioramenti fondamentali e rivoluzionari in esso. Non stiamo parlando del trattamento fondamentale del design del processore, ma solo su un insieme di miglioramenti e miglioramenti. Naturalmente, i miglioramenti di questi molti, e puoi persino parlare della transizione della quantità di qualità. Ma, sia così come può, Intel ha effettivamente costretto la microarchitettura disponibile dell'EDY Bridge e non ha suggerito qualcosa di fondamentalmente nuovo. Inoltre, la principale enfasi durante l'elaborazione completata non era in cerca di modi per aumentare le prestazioni computazionali, ma per migliorare l'efficienza energetica e lo sviluppo delle possibilità grafiche.

Dal punto di vista, il Paradigma tradizionale del processore, il Haswell Microchitectura offre solo supporto per il nuovo set di istruzioni AVX2, il miglior parallelismo a livello di esecuzione delle istruzioni e la maggiore larghezza di banda del primo e del secondo livello. Sono tali modifiche abbastanza per soddisfare le aspettative degli aderenti dei personal computer classici? Improbabile. Pertanto, la maggior parte degli appassionati vedendo solo un leggero aumento della velocità di calcolo, che perde presumibilmente entro il 5-15 percento, molto probabilmente, nuovi processori saranno infelici. E questo significa che nessun effetto di interesse per i soliti desktop e laptop non è previsto e con il rilascio di una nuova famiglia di processori.

Ma Intel, nonostante tutto questo, può essere orgoglioso del lavoro eseguito. L'azienda ha istituito davanti a lui deciso. La progettazione di Haswell si è rivelata così efficiente dal punto di vista energetico ed equilibrato che questi processori, oltre ogni dubbio, saranno in grado di prendere un luogo degno nella mancanza di un produttore delle sottospecie di dispositivi mobili - compresse produttive e computer portatili di trasformazione. La pianificazione dell'azienda su questo mercato ora non si preoccupava esattamente: in risposta allo scavo della coorte di aderenti dell'architettura del braccio, così come sul nuovo AMD APU, Intel ora ha un buon bilanciere domestico. Dopotutto, la microarchitettura haswell consente di creare modifiche progettuali che possiedono indicatori di consumo energetico che esprimono in numeri non ambigui e sono il gruppo SOC, incluso non solo il processore, ma anche un set di logica di sistema.

Su questo non abbiamo ancora messo il punto finale. Questo materiale apre solo il ciclo di articoli sui processori con una nuova microarchitettura. Nel prossimo futuro, possiamo facilmente e con processori reali nelle tue mani conoscere sia con il desktop che per le forme di realizzazione mobili della microarchitettura di Haswell. PoiForse le nostre conclusioni fatte solo sulla base della conoscenza della documentazione cambieranno in qualche modo. E voglio davvero crederci ...

La campana.

Ci sono quelli che hanno letto questa notizia prima di te.
Iscriviti per ricevere articoli freschi.
E-mail
Nome
Cognome
Come vuoi leggere la campana
Senza spam.