THE BELL

Є ті, хто прочитали цю новину раніше вас.
Підпишіться, щоб отримувати статті свіжими.
Email
ім'я
Прізвище
Як ви хочете читати The Bell
без спаму

Тип мікроархітектури процесора грає одну з ключових ролей в продуктивності ноутбука або ПК, адже від мікроархітектури залежить швидкість вибірки і декодування надходять в процесор даних і інструкцій, а потім їх виконання і запис в ОЗУ.

Порівняння мікроархітектури процесорів Haswell, Broadwell і Skylake від Intel

на наразі актуальними і конкуруючими між собою вважаються мікроархітектури трьох поколінь від Intel. Це ядро \u200b\u200b4-го покоління Haswell, 5-го покоління Broadwell і новітня мікроархітектура 6-го покоління Skylake. Як відомо, в основі створення даних мікроархітектури лежить екстенсивна стратегія під назвою «Тік-так». «Тік» означає створення нового покоління процесорів на основі зменшеного технологічного процесу. «Так» ж має на увазі випуск нових мікропроцесорів, але без зміни технології створення. У статті буде проведено їх порівняльний аналіз і на його основі буде зроблено висновок про найбільш продуктивному ядрі.

Haswell

- мікроархітектура, розроблена в 2012 році за 22 нм технології. Підтримує сокети: LGA 1150, BGA +1364, LGA 2011-3. Працює з планкою ОЗУ DDR4. Шина: DMI2.

Плюси процесора з даної мікроархітектури:

1) Енергоефективний

2) Підтримує DDR4

3) Низька вартість. Наприклад, ціна на Intel Core I3 4160 з ядром Haswell становить 7800 рублів.

1) Виготовлений за застарілою 22 нм технології, в результаті чого програє по багатьом параметрам його поліпшеної версії Broadwell.

Broadwell

- апгрейднутая версія Haswell, розроблена для процесорів Intel серії Xeon, а також для сьомого покоління Intel Core I7. Виготовлена \u200b\u200bпо 14 нм технології. Належить до гілки «тик» маркетингової місії «тік-так». У порівнянні з Haswell має на 3-5% більшу ефективність, ніж Haswell, при цьому споживає енергії на 30%, також набагато менше тепловиділення в ПК, 4.5 вт проти 15 Haswell. Все це пояснюється, перш за все, зменшеним технологічним процесом, за яким було виготовлено ядро, можливістю розгону процесора з даної мікроархітектури, а також наявністю 4 кеша Crystalwell, що дає більш високу швидкість обміну з ОЗУ, ніж всього 3 кеша.

Плюси ядра:

1) Ефективне енергоспоживання

2) Можливість розгону

3) Підтримка DirectX 12

4) Саме в цій мікроархітектурі набув поширення кеш L4, до цього використовувався лише в рідкісному числі мікропроцесорів Haswell

5) Більш високий час автономної роботи, ніж Haswell

1) Вартість (ціна варіюється в межах 13-150000 в залежності від моделі процесора, бо призначається дана мікроархітектура для каменів серії Xeon і Core I7 від Intel в той час як мікропроцесор Haswell працює і на бюджетних каменях)

2) Співвідношення ціни / якості. У тестах мікроархітектура показало невисокі результати, випередивши Haswell приблизно на 3 відсотки, в тому числі і в 3D Mark (Core I7-6850K на Broadwell-E: 19065 очок, Core I7-5820 на Haswell-E- 16598 очок). Якщо розглядати це щодо порівняння Ivy Bridge і Haswell, то результат не вражаючий.

Порівняльний аналіз продуктивності Broadwell і Haswell

Skylake

- мікроархітектура 6-го покоління, призначена, як і Haswell, в основному, для бюджетних енергоефективних процесорів типу ULV. Розроблено вона згідно зі стратегією «тік-так» і зачіпає гілку «так». Тобто, ядро \u200b\u200bбуло виготовлено без зміни технологічного процесу, але з кардинальною зміною мікроархітектури щодо Broadwell.

Мікропроцесор працює на новому високопродуктивному сокеті LGA 1151, підтримує DDR4, а також, на відміну від LGA 1150 працює з USB 3.0, має нову, набагато більш продуктивну шину DMI3 і велику енергоефективність в порівнянні зі своїм попередником.

1) Підтримка нового роз'єму LGA 1151, більш продуктивного, ніж LGA 1150 - сокет Broadwell

2) Підтримка USB 3.0

3) Можливість розігнати GPU на новому сокеті

4) Підтримка DDR4 і оптимізація роботи з даної планкою ОЗУ

5) Краща енергоефективність щодо Broadwell

6) Одне з головних достоїнств - підтримка нової шини DMI 3, що дає в 2 рази більшу швидкість, ніж DMI 2, на якому працюють Broadwell і Haswell. Дана перевага особливо помітно на прикладі такої програми, як Sony Vegas, де продуктивність Skylake вище майже в 1.5 рази

7) Вартість (для бюджетних моделей Intel Core I3 в середньому ціна становить 3000-7000 рублів)

Щодо Broadwell і Skylake тільки плюси, в порівнянні ж з Kaby Lake 7-го покоління - новітній мікроархітектури, якою оснащено поки невелика кількість процесорів, дає продуктивність на кілька відсотків нижче.

Підведення підсумків:

Якщо взяти всі показники, в тому числі, вартість мікроархітектури, то рейтинг, складений автором, буде такою:

1 місце: Skylake

2 місце: Haswell (дана мікроархітектура, як показали тести, хоч і є більш старшої і менш енергоефективної, але по продуктивності відстає від Broadwell на 2-3 відсотки, при цьому має нижчу вартість)

3 місце: Broadwell

висновок:

Незважаючи на різні маркетингові хитрування, яких дотримується корпорація Intel, вона все ж показує певний результат і хоч потроху, але покращує з кожним поколінням продуктивність і швидкодію своїх процесорів. Так що, хто знає, можливо, до 2030 року, почне випускати перші квантові процесори, які будуть в мільйон разів краще нинішніх, але це вже інша історія.

ВведеніеТак уже повелося, що кожен рік компанія Intel оновлює микроархитектуру своїх процесорів, націлених на використання в загальновживаних персональних комп'ютерах. Цей графік став вже настільки звичний, що сприймається як щось само собою зрозуміле. Sandy Bridge були випущені на початку 2011 року, Ivу Bridge з'явилися в квітні 2012, а актуальні на даний момент Haswell були представлені 4 червня минулого року. З огляду на сформований розпорядок, ринок вже щосили очікує процесори нового покоління - Broadwell. Однак з ними все склалося не дуже вдало. Впровадження нового 14-нм техпроцесу, який Intel повинна використовувати для виробництва Broadwell, наштовхнулося на складності виробничого характеру. Тому початковий план, який передбачав появу нового покоління процесорного дизайну в середині цього року, довелося переглянути. Згідно з наявними актуальних даних, анонс мобільних енергоефективних варіантів Broadwell відбудеться напередодні Нового року, а засновані на цьому дизайні процесори для масових настільних і мобільних комп'ютерів стануть доступні лише в наступному році.

У ситуації, що склалася Intel вирішила якось скрасити незаплановане тривале очікування новинок і придумала акцію, яка дістала кодову назву Haswell Refresh. Її суть полягає в тому, що замість виходу нових процесорів Broadwell компанія пропонує вдосконалені моделі старих, продуктивність яких поліпшена не новою мікроархітектури, а збільшеними тактовими частотами. Офіційний анонс CPU, що входять в безліч Haswell Refresh, був призначений на 11 травня, і він вже відбувся. У интеловский прайс-листі з'явилося 42 нові позиції, 24 з яких націлюються на настільні системи різних класів. У цьому огляді ми познайомимося з тими з оновлених Haswell, які призначаються для ординарних десктопів і відносяться до сімейств Core i7, Core i5 і Core i3.

Детальніше про Haswell Refresh для десктопів

Отже, говорячи про Haswell Refresh, Intel фактично має на увазі просте підвищення частот своїх LGA 1150 процесорів сімейства Haswell. У виході таких оновлених продуктів немає нічого незвичайного - компанія поступово підвищувала частоти своїх процесорів між анонсами нової мікроархітектури і раніше, просто до цього такі події були розрізнені, і їм не приділялося стільки уваги. Відмітна ж особливість Haswell Refresh в тому, що зростання частот відбувається не у окремих моделей, а у всієї лінійки цілком, знизу доверху.

Причому, стільки уваги Haswell Refresh приділяється не через їх якоїсь новизни або помітного збільшення продуктивності. Весь галас - штучна, її спеціально генерує сама Intel, намагаючись створити враження безперервних інновацій навіть незважаючи на перенесення анонса Broadwell на більш пізній термін. Іншими словами, вихід Haswell Refresh - цілком ординарне оновлення, а свіжі процесори відрізняються від старих, присутніх на ринку вже майже рік Haswell, тільки збільшену на смішні 100 МГц частотою. Тобто, мова йде про незначне прирості в продуктивності, що становить близько 2-3 відсотків, і не більше того.

На щастя, за цей невеликий приріст швидкодії покупці не повинні нічого платити. Нові процесори Haswell Refresh зайняли старі позиції в прайс-листі, витіснивши звідти Haswell зразка минулого року. Якщо говорити конкретно про пропозиції для настільних комп'ютерів, то відбувається заміна виглядає наступним чином:

Необхідно підкреслити, що зростання тактової частоти відбувається в рамках встановлених раніше теплових пакетів: 84 Вт для Core i7 і Core i5 і 54 Вт - для Core i3. Однак при цьому в основі Haswell Refresh залишаються точно такі ж напівпровідникові кристали, як і використовувалися раніше. Поліпшення частотного потенціалу забезпечується виключно вдосконаленням интеловского 22-нм технологічного процесу, ревізія ж ядра в новинках не змінюється і зберігає номер C0. А це означає, що принципових поліпшень в теплових та електричних характеристиках, як і в якихось інших нюансах роботи нових процесорів, очікувати не слід.



Процесори Haswell Refresh для настільних систем


Абсолютно так само як попередники виглядають процесори Haswell Refresh і зовні.



Зліва - звичайний Haswell, праворуч - Haswell Refresh


Єдине пов'язане з виходом Haswell Refresh цікаве і принципово важлива зміна торкнеться оверклокерских процесорів K-серії, повної інформації про яких поки немає в силу того, що вони будуть представлені дещо пізніше, імовірно 2 червня. Поки Intel продовжить пропонувати для оверклокерів старі моделі Core i7-4770K і Core i5-4670K, але ті процесори, які прийдуть їм на зміну, заслуговують на окрему розповідь.

Справа в тому, що в різновидах Haswell Refresh з вільними множниками, що мають власне збірне кодове ім'я Devil's Canyon, ми побачимо не тільки збільшені паспортні частоти. Intel збирається зробити ці процесори більш привабливими для розгону, для чого планує внести серйозні зміни в їх упаковку. Теплопровідні матеріал, розташований між процесорним кристалом і кришкою-теплорозподільника буде замінений на більш ефективний, а сама кришка буде виготовлятися з іншого сплаву з кращого теплопровідністю. За попередніми даними, сімейство Devil's Canyon буде складатися з двох розблокованих LGA 1150 процесорів: Core i7-4790K і Core i5-4690K. Причому, вони отримають більш високий, ніж у звичайних Haswell Refresh, тепловий пакет і помітно підвищені тактові частоти навіть у номінальному режимі.

На жаль, це поки все, що відомо про Devil's Canyon, але коли зразки цих CPU з'являться в нашій лабораторії, ми неодмінно поділимося вичерпною інформацією про них в наших оглядах. Сьогодні ж мова буде йти тільки про звичайні десктопних Haswell Refresh зі стандартним рівнем тепловиділення, які вже можна купити в магазинах.

У серії Core i7 новинка поки тільки одна:


Core i7-4790 підвищує тактову частоту старшої лінійки процесорів для платформи LGA 1150 на 100 МГц, обганяючи, таким чином, і оверклокерьский Core i7-4770K, і звичайний Core i7-4771. В іншому, це типовий Core i7 покоління Haswell: він має чотири ядра, підтримує Hyper-Threading, має в своєму розпорядженні містким кешем третього рівня об'ємом 8 Мбайт. Графічне ядро, як і у попередників, відноситься до класу GT2, тобто має у своєму розпорядженні 20 виконавчими пристроями. Слід зазначити, що завдяки технології Turbo Boost 2.0 типовою частотою роботи для Core i7-4790 є 3.8 ГГц.



Core i7-4790


Повний набір технологій забезпечення безпеки, включаючи vPro, TXT і VT-d, цим процесором також підтримується в повному обсязі. Іншими словами, Core i7-4790 - це новий флагман для платформи LGA 1150, але без підтримки розгону.

У серії Core i5 з'явилася три нові процесори Haswell Refresh:



У цих процесорів частоти в порівнянні з попередниками підвищилися теж всього на 100 МГц. Але цього виявилося достатньо для того, щоб старший Core i5-4690 став швидше Core i5-4670K і перехопив лідерство в цій лінійці. Решта ж процесори органічно розмістилися в вільних раніше частотних слотах. Інші їх характеристики залишилися незмінними. Hyper-Threading в серії Core i5 не підтримується, L3-кеш скорочений до 6 Мбайт, що використовується графічне ядро \u200b\u200b- GT2.



Core i5-4690



Core i5-4590



Core i5-4460


Молодший процесор Core i5-4460 займає в серії особливе місце: в ньому відключені технології забезпечення безпеки vPro і TXT, а також не підтримуються інструкції для роботи з транзакционной пам'яттю. Технологія Turbo Boost 2.0 робить типовою робочою частотою для Core i5-4690 - 3,7 ГГц, для Core i5-4590 - 3,5 ГГц і для Core i5-4460 - 3,2 ГГц.

Серія Core i3 з виходом Haswell Refresh приросла ще трьома модифікаціями:



Тут також відбулося 100-мегагерцового збільшення тактових частот при збереженні всіх інших характеристик. Процесори Core i3, на відміну від старших моделей, двоядерні, але вони підтримують технологію віртуальної багатопоточності Hyper-Threading. За рахунок цього вони мають менший розрахунковим тепловиділенням на рівні 54, а не 84 Вт. Слід зазначити, що в лінійці Core i3 на момент анонса Haswell Refresh вже не було вільних частотних слотів, тому вийшло так, що модель Core i3-4350 повністю збіглася за характеристиками з Core i3-4340. Єдина відмінність нової модифікації - більш низька ціна.



Core i3-4360



Core i3-4350



Core i3-4150


У процесорах Core i3-4360 і Core i3-4350 розмір кеш-пам'яті третього рівня становить 4 Мбайт, а у Core i3-4150 кеш зменшений до 3 Мбайт. Гірше в початковій моделі і графічне ядро. Хоча формально всі Core i3 забезпечені графікою GT2, в Core i3-4150 кількість виконавчих пристроїв GPU зменшено з 20 до 16.

Будь-які LGA 1150 процесори Haswell Refresh ніяких додаткових умов на материнські плати не накладають. Незважаючи на те, що до їх появи приурочено і оновлення платформи з її перекладом на нові набори логіки дев'ятої серії (Z97 і H97), все нові CPU без проблем працюють в старих LGA 1150-материнках з чіпсетами восьмий серії. Для їх правильного визначення платами, випущеними в минулому році, потрібно тільки оновлення BIOS.

Що стосується розгінних можливостей, то у Haswell Refresh, що вийшли на цей момент, їх взагалі немає ні в якому обсязі. Збільшення частот вище номінальних зміною множника неможливо, розгін ж по шині вкрай обмежений. Фактично, межа, до якого можна розігнати базовий тактовий генератор, становить близько 105-110 МГц. Тобто, придбання Haswell Refresh з метою експлуатації їх в нештатних режимах якого б то не було сенсу позбавлене. Втім, розгін пам'яті до рівня DDR3-2400 неоверклокерскіе процесори для платформи LGA 1150 все ж дозволяють.

Як ми тестували

Нові процесори, що відносяться до безлічі Haswell Refresh, ми порівняли з їх попередниками, простими Haswell, які вже майже рік доступні у продажу. В результаті, список задіяних в тестуванні апаратних компонентів виглядає наступним чином:

Процесори:

Intel Core i7-4790 (Haswell, 4 ядра + HT, 3,6-4,0 ГГц, 4x256 Кбайт L2, 8 Мбайт L3);
Intel Core i7-4770K (Haswell, 4 ядра + HT, 3,5-3,9 ГГц, 4x256 Кбайт L2, 8 Мбайт L3);
Intel Core i5-4690 (Haswell, 4 ядра, 3,5-3,9 ГГц, 4x256 Кбайт L2, 6 Мбайт L3);
Intel Core i5-4670K (Haswell, 4 ядра, 3,4-3,8 ГГц, 4x256 Кбайт L2, 6 Мбайт L3);
Intel Core i5-4590 (Haswell, 4 ядра, 3,3-3,7 ГГц, 4x256 Кбайт L2, 6 Мбайт L3);
Intel Core i5-4570 (Haswell, 4 ядра, 3,2-3,6 ГГц, 4x256 Кбайт L2, 6 Мбайт L3);
Intel Core i5-4460 (Haswell, 4 ядра, 3,2-3,4 ГГц, 4x256 Кбайт L2, 6 Мбайт L3);
Intel Core i5-4440 (Haswell, 4 ядра, 3,1-3,3 ГГц, 4x256 Кбайт L2, 6 Мбайт L3);
Intel Core i3-4360 (Haswell, 2 ядра + HT, 3,7 ГГц, 2x256 Кбайт L2, 4 Мбайт L3);
Intel Core i3-4350 (Haswell, 2 ядра + HT, 3,6 ГГц, 2x256 Кбайт L2, 4 Мбайт L3);
Intel Core i3-4340 (Haswell, 2 ядра + HT, 3,6 ГГц, 2x256 Кбайт L2, 4 Мбайт L3);
Intel Core i3-4150 (Haswell, 2 ядра + HT, 3,5 ГГц, 2x256 Кбайт L2, 3 Мбайт L3);
Intel Core i3-4130 (Haswell, 2 ядра + HT, 3,4 ГГц, 2x256 Кбайт L2, 3 Мбайт L3).

Процесорний кулер: Noctua NH-U14S.
Материнська плата: Gigabyte Z87X-UD3H (LGA1150, Intel Z87 Express).
Пам'ять: 2x8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill F3-2133C9D-16GTX).
Відеокарта: NVIDIA GeForce GTX 780 Ti (3 Гбайт / 384-біт GDDR5, 876-928 / 7000 МГц).
Дискова підсистема: Intel SSD 520 240 GB (SSDSC2CW240A3K5).
Блок живлення: Corsair AX760i (80 Plus Platinum, 760 Вт).

Тестування виконувалося в операційній системі Microsoft Windows 8 Enterprise x64 з використанням наступного комплекту драйверів:

Intel Chipset Driver 10.0.13;
Intel Management Engine Driver 10.0.0.1204;
Intel Rapid Storage Technology 13.0.3.1001;
NVIDIA GeForce Driver 335.23.

продуктивність

Загальна продуктивність

Для оцінки продуктивності процесорів в загальновживаних завданнях ми традиційно використовуємо тестовий пакет Bapco SYSmark, що моделює роботу користувача в реальних поширених сучасних офісних програмах і додатках для створення і обробки цифрового контенту. Ідея тесту дуже проста: він видає єдину метрику, що характеризує середньозважену швидкість комп'ютера при повсякденному використанні. Нещодавно цей бенчмарк в черговий раз оновився, і тепер ми задіємо саму останню версію - SYSmark 2014.



Результати, відображені на діаграмі, цілком очікувані. З огляду на, що в процесорах Haswell Refresh немає ніяких удосконалень і оптимізацій на рівні мікроархітектури, все вирішує тактова частота. А, оскільки в нових CPU вона зросла всього на 100 МГц, відмінності в показниках продуктивності старих Haswell і представників безлічі Haswell Refresh, що приходять їм на зміну, становить в середньому 2,5 відсотка. Конкретніше: Core i7-4790 обганяє Core i7-4771 (він же Core i7-4770K) на 1,8 відсотка; Core i5-4690 перевершує Core i5-4670 на 2,3 відсотка; Core i5-4590 випереджає Core i5-4570 на 2,3 відсотка, Core i5-4460 швидше Core i5-4440 на 2,7 відсотка, Core i3-4360 перевершує Core i3-4340 на 3,1 відсотка, а Core i3-4150 обганяє Core i3-4130 на 2,3 відсотка.

Більш глибоке розуміння результатів SYSmark 2014 здатне дати знайомство з оцінками продуктивності, що отримується в різних сценаріях використання системи. Сценарій Office Productivity моделює типову офісну роботу: Підготовку текстів, обробку електронних таблиць, роботу з електронною поштою і відвідування Інтернет-сайтів. Сценарій задіє наступний набір додатків: Adobe Acrobat XI Pro, Google Chrome 32, Microsoft Excel 2013, Microsoft OneNote 2013, Microsoft Outlook 2013, Microsoft PowerPoint 2013, Microsoft Word 2013, WinZip Pro 17.5 Pro.



У сценарії Media Creation моделюється створення рекламного ролика з використанням попередньо знятих цифрових зображень і відео. Для цієї мети застосовуються популярні пакети Adobe Photoshop CS6 Extended, Adobe Premiere Pro CS6 і Trimble SketchUp Pro 2013.



Сценарій Data / Financial Analysis присвячений статистичному аналізу і прогнозування інвестицій на основі якоїсь фінансової моделі. У сценарії використовуються великі обсяги чисельних даних і два додатки Microsoft Excel 2013 і WinZip Pro 17.5 Pro.




Ігрова продуктивність

Як відомо, продуктивність платформ, оснащених високопродуктивними процесорами, в переважній більшості сучасних ігор визначається потужністю графічної підсистеми. Саме тому при тестуванні процесорів ми вибираємо найбільш процесорозалежність гри, а результат вимірювання кількості кадрів виконуємо двічі. Першим проходом тести проводяться без включення згладжування і з установкою далеко не самих високих дозволів. Такі настройки дозволяють оцінити, наскільки добре проявляють себе процесори з ігровою навантаженням в принципі, а значить, дозволяють будувати здогади про те, як будуть вести себе тестовані обчислювальні платформи в майбутньому, коли на ринку з'являться більш швидкі варіанти графічних прискорювачів. Другий прохід виконується з реалістичними установками - при виборі FullHD-дозволи та максимального рівня повноекранного згладжування. На наш погляд такі результати не менш цікаві, так як вони відповідають на часте питання про те, який рівень ігрової продуктивності можуть забезпечити процесори прямо зараз - в сучасних умовах.





















Ми не стали завантажувати огляд великою кількістю ігрових тестів, так як приріст продуктивності, який забезпечують процесори сімейства Haswell Refresh, не дуже помітний. Проте, на наведених графіках можна відзначити кілька різноманітних варіантів того, як складається ігрова продуктивність.

Так, Batman: Arkham Origin - гра, в якій продуктивності будь-яких интеловских процесорів виявляється досить для того, щоб повністю завантажити флагманську графічну карту NVIDIA GeForce GTX 780 Ti. В результаті, в ній ми бачимо вкрай незначний вплив вибору CPU на результат, а нові Haswell Refresh взагалі нічим не виділяються на тлі попередників.

Civilization V: Brave New World - стратегічна гра, Де виконуються активні розрахунки на CPU, однак і тут дуже потужні процесори виявляються ні до чого. Починаючи з Core i5-4570 і вище приріст продуктивності майже непомітний. Однак і нижче цієї своєрідної кордону перевага Haswell Refresh над рівноцінними попередниками становить в районі 3 відсотків.

Metro: Last Light - вельми процесорозалежність шутера, але при максимальних налаштуваннях якості (в першу чергу, через тесселяции), частота кадрів все одно впирається в потужність відеокарти. Зате при зменшенні дозволу можна побачити невеликий ефект від збільшення частоти в щойно анонсованих Haswell Refresh. Його масштаб стандартний - близько 2 відсотків.

У Thief все виглядає ще цікавіше. Ця - одна з небагатьох ігор, що негативно ставляться до технології Hyper-Threading в чотириядерних процесорах. Вона оптимізована під чотири потоки, і додаткові віртуальні ядра в Core i7 тільки знижують продуктивність. Якщо ж говорити про ефект, який дає підміна Haswell на Haswell Refresh, то він знову незначний: не більше 3 відсотків при зниженому дозволі і не більше 1 відсотка при максимальних налаштуваннях графіки.

Тести в додатках

У Autodesk 3ds max 2014 ми вимірюємо швидкість рендеринга в mental ray спеціально підготовленої складної сцени.



Продуктивність в новому Adobe Premiere Pro CC тестується виміром часу рендеринга в формат H.264 Blu-Ray проекту, що містить HDV 1080p25 відеоряд з накладенням різних ефектів.



Вимірювання продуктивності в новому Adobe Photoshop CC ми проводимо з використанням власного тесту, що представляє собою творчо перероблений Retouch Artists Photoshop Speed \u200b\u200bTest, що включає типову обробку чотирьох 24-мегапіксельних зображень, зроблених цифровою камерою.



Для вимірювання швидкодії процесорів при компресії інформації ми користуємося архіватором WinRAR 5.0, за допомогою якого з максимальним ступенем стиснення архівуємо папку з різними файлами загальним обсягом 1,7 Гбайт.



Для оцінки швидкості перекодування відео в формат H.264 використовувався тест x264 FHD Benchmark 1.0.1 (64bit), заснований на вимірюванні часу кодування кодером x264 вихідного відео в формат MPEG-4 / AVC з роздільною здатністю [Email protected] і настройками за замовчуванням. Слід зазначити, що результати цього бенчмарка мають величезне практичне значення, Так як кодер x264 лежить в основі численних популярних утиліт для перекодування, наприклад, HandBrake, MeGUI, VirtualDub і ін. Ми періодично оновлюємо кодер, який використовується для вимірювань продуктивності, і в даному тестуванні взяла участь версія r2431, в якій реалізована підтримка всіх сучасних наборів інструкцій, включаючи і AVX2.



Ніякі програми не дозволяють виявити помітні переваги процесорів Haswell Rafresh над їх попередниками. Це цілком природно. Єдина зміна в нових CPU - підвищена частота. Так що помітного приросту швидкодії взятися просто нізвідки. Результати нових Core i7-4790, Core i5-4690, Core i5-4590, Core i5-4460, Core i3-4360, Core i3-4350 та Core i3-4150 краще, ніж у давно присутніх на ринку пропозицій того ж класу і тієї ж вартості максимум на 3 відсотки.

енергоспоживання

Зміни в продуктивності, піднесені Haswell Refresh, абсолютно не вражають. Ніяких же інших поліпшень в нових модифікаціях процесорів, виходячи з того, що вони ґрунтуються на напівпровідниковому кристалі старої ревізії, бути не повинно. Проте, залишається невелика надія на якісь поліпшення в теплових і енергетичних характеристиках, які могли статися за рахунок вдосконалення виробничого технологічного процесу. Перевіримо.

На наступних нижче графіках, якщо інше не обумовлюється окремо, наводиться повне споживання систем (без монітора), виміряний на виході з розетки, в яку підключений блок живлення тестової системи, і представляє собою суму енергоспоживання всіх задіяних в системі компонентів. В сумарний показник автоматично включається і ККД самого блоку живлення, проте з огляду на, що використовувана нами модель БП, Corsair AX760i, має сертифікат 80 Plus Platinum, його вплив повинен бути мінімальний. Для правильної оцінки енергоспоживання ми активували турбо-режим і всі наявні енергозберігаючі технології: C1E, C6 і Enhanced Intel SpeedStep.

В першу чергу виміру піддалося споживання в стані простою.



Тут все процесори проявили рідкісне одностайність. Воно й зрозуміло: в просте Haswell переходять в енергозберігаючі стану і знижують своє енергоспоживання практично до нульових величин. Тому ті числа, які наведені на діаграмі, більше характеризують споживання решти тестової платформи.

Потім ми виміряли максимальне споживання при навантаженні, створюваної 64-бітної версією утиліти LinX 0.6.5 з підтримкою набору інструкцій AVX2, що базується на пакеті Linpack.



Наведена діаграма дуже явно демонструє відсутність будь-яких поліпшень в енергоспоживанні у процесорів Haswell Refresh. Нові та більш швидкі моделі вимагають електроенергії більше, ніж їх попередники. При цьому проведений в нових модифікаціях CPU 100-мегагерцовий розгін виливається приблизно в 5-відсоткове зростання енергоспоживання. Зауважимо, що, незважаючи на це, Intel не вважала за потрібне збільшувати для Haswell кордону теплового пакету. Іншими словами, тепловиділення будь-яких Core i7 і Core i5 має вписуватися в 84-ватні рамки, а Core i3 - в 54-ватні.

З огляду на, що енергоспоживання, що ініціюється базується на пакеті Linpack утилітою LinX, сильно перевищує середній реалістичний рівень, ми виміряли споживання і при більш «приземленою» навантаженні - перекодуванні відеоролика за допомогою 64-бітової версії кодека x264 версії r2431.



В цілому, картина тут точно така ж, як і при навантаженні, створюваної LinX. Менше лише абсолютні значення енергоспоживання. Проте, процесори Haswell Refresh споживають більше своїх попередників одного класу на ті ж 5 відсотків. Все це означає лише одне: ніяких поліпшень в споживанні нових моделей Haswell не зроблено.

Немає ніяких явних змін і в температурному режимі новинок. Очевидно, що в звичайних Haswell Refresh теплопровідні матеріал під кришкою залишився таким же невдалим, що й раніше. Температура ядер при виникненні навантаження у нових процесорів зростає практично моментально і тримається на високому рівні навіть в тому випадку, якщо в системі встановлено ефективний кулер. Наприклад, в нашому випадку, при використанні кулера Noctua NH-U14S, старший з Haswell Refresh, Core i7-4790 при роботі утиліти LinX дуже швидко нагрівався до 84 градусів. І це без будь-якого розгону, в номінальному режимі!



Нагадаємо, гранична температура, при якій процесори сімейства Haswell включають троттлінг, - 100 градусів.

висновки

Підводячи підсумок, ми змушені констатувати, що гучна назва Haswell Refresh отримали абсолютно ординарні процесори, які своїм виходом не привносять практично нічого нового. Для них випуску Intel не стала проробляти ніякої інженерної роботи. Тому, споживчі якості свіжих CPU для платформи LGA 1150 практично не відрізняються від того, що пропонувалося раніше. Кількість ядер, об'єм кеш-пам'яті, тип вбудованого графічного ядра, набір підтримуваних технологій - все залишилося незмінним. Не було зроблено ніяких оптимізацій і на рівні напівпровідникового кристала, тому тепла і споживання Haswell Refresh залишилося на типовому для Haswell рівні.

Єдине, де можна побачити хоч якийсь рух вперед - це тактові частоти. Однак, з огляду на, що зростання частот непідкріплюється ніякими технологічними або інженерними поліпшеннями, а більшою мірою кримінальна лише простого розгону старих моделей, їх збільшення виявилося вкрай слабким. Фактично, в рамках Haswell Refresh Intel збільшила швидкість роботи своїх процесорів на мінімально можливу дельту - на 100 МГц. Відповідно точно такий же, мінімальний, приріст в продуктивності ми побачили і в процесі тестування. Нові процесори Haswell Refresh виявилися швидше старих Haswell на 2-3 відсотки і не більше того.

Все це означає, що вихід Haswell Refresh може бути цікавий тільки в тому випадку, якщо ви ще не мігрували на платформу LGA 1150. З огляду на, що вартість нових моделей не вище, ніж у старих, при покупці нового комп'ютера тепер цілком природно питати в магазинах саме нові модифікації процесорів. А якщо у вашого улюбленого постачальника Haswell Refresh в прайс-листі поки відсутні, краще трохи почекати з покупкою, але згодом отримати трохи більше високу продуктивність за ті ж гроші.

І, крім того, не забувайте, що приблизно через три тижні нас чекає вихід ще пари процесорів, формально відносяться до числа оновлених Haswell, Core i7-4790K та Core i5-4690K. Ці CPU, що мають власне кодове ім'я Devil's Canyon, на відміну від розглянутих сьогодні моделей, обіцяють стати відмінним подарунком для ентузіастів. У них з'являться і помітно поліпшені тактові частоти, і знизився робочі температури, і кращий розгін. Але не будемо забігати вперед: повний огляд Core i7-4790K і Core i5-4690K ви зможете прочитати на нашому сайті дещо пізніше.

Проапгрейдить до упору Sandy Bridge і перевівши його на новий техпроцес в минулому році, Intel впритул підійшла до чергового кроку «tock», запропонованому самій собі кілька років до того.

«Тік-так» Intel - це не завжди бомба, але, безумовно, символ технологічного прогресу

На кроках «tock», як випливає з ілюстрації, необхідно вводити нову архітектуру. Що і було зроблено - світ побачив микроархитектуру під кодовим ім'ям Haswell і базуються на ній 14 моделей процесорів Core i5 і i7 під роз'єм LGA 1150 (також відомого як Socket H3), з них вісім «звичайних» і шість low power. Взагалі, тема енергоспоживання (або, якщо бути точним, «енергоспоживання, адекватного для поточної обчислювальної потужності») проходить червоною ниткою через микроархитектуру Haswell, тому як Intel бачить велике майбутнє для свого творіння в мобільному сегменті, а без процесора або SoC з помірними апетитами робити там нічого. Основним своїм конкурентом, судячи з порівнянням у відкритих джерелах, Intel вважає вироби на ARM-процесорах, так як вони вже добре прижилися в мобільному сегменті і показали там свою життєздатність.

На ниві харчування процесорів Intel вже чимало зробила. Йдучи від початкового регулювання TDP тільки за допомогою напруги живлення процесора, що подається на нього з перетворювача материнської плати і тактової частоти ядер, Intel перенесла частину перетворювачів в CPU, тим самим відкривши для себе можливість більш точно (а значить, ефективно) дозувати напруга на кожному з інших блоків, розташованих на кристалі. На той час процесор вже перестав бути тільки процесором в первісному розумінні цього слова і включав в себе контролер пам'яті і інші частини північного моста (NB), що свого часу дозволило істотно спростити розводку материнських плат і знизити енергоспоживання зв'язки CPU + NB.

Робота з харчуванням також велася і в сторону раціонального використання, коли той чи інший блок функціонував (читай - споживав електрику) тільки в потрібні моменти, а в періоди простою відключався і не гають енергію. Одним із плодів робіт в цьому напрямку стала поява в системах Intel поряд зі станом S0 станів S0ix, який значно скорочував енергоспоживання процесора в моменти простою до стану «сплячою системи» (стан S3, в нього переходить ноутбук після закривання екрану в робочому стані). Фактично, система могла «спати» абсолютно прозоро для користувача, так як перехід в S0iх становить 450 мікросекунд, а пробудження - 3,2 мілісекунди (0,00045 с і 0,0032 с відповідно). Для збереження екрану в активному стані розроблена технологія PSR (Panel Self-Refresh), що має на увазі наявність буфера, що зберігає кілька останніх кадрів. Це дозволяє знижувати навантаження на графічний процесор, особливо при нечастому оновленні інформації на екрані (наприклад, при читанні тексту), що, в свою чергу, дає можливість знизити енергоспоживання графічного процесора.

Новий процесор Intel вміє економити енергію значно краще попередників

Правда, для цього необхідна апаратна підтримка з боку монітора, так що широке застосування цей спосіб енергозбереження може знайти в мобільному сегменті, де «монітор» і «обчислювальна частина» є одним пристроєм. Але для демонстрації напрацювань Intel приклад дуже підходить, тим більше що вони знайшли реалізацію в процесорах на архітектурі Haswell. Так, блок PCU (Power Control Unit) в Haswell вміє дуже ефективно використовувати енергію за рахунок безлічі «режимів роботи», в кожному з яких активні тільки необхідні зараз блоки. Це, по завіреннях Intel, дозволило знизити енергоспоживання в просте майже в п'ять разів у порівнянні з минулим (третім) поколінням процесорів, Перемикання між «режимами» прискорено на чверть, що дозволяє більш активно управляти енергоспоживанням ядер і «засипати їх» навіть в тих випадках , які в минулому поколінні були недоцільні через довгої процедури включення / вимикання. Тут ядро \u200b\u200bпару мілісекунд «поспати», заощадимо частки мілівата, там «задрімав» ... Так і набираються зекономлені вати.

Внутрішня архітектура процесора також була серйозно допрацьована, хоча глобально нічого не змінилося. Intel продовжує шліфувати і допрацьовувати шматками архітектуру, яку використовували ще в Conroe. Правда, відмінностей між Ivy Bridge і Haswell куди більше, ніж між Sandy Bridge і Ivy Bridge. Останній, на мою скромну думку, взагалі був рестайлінгом для «Санді»; з істотних змін можна відзначити лише перехід з 32 нм на 22 нм техпроцес.

Архітектура Intel Haswell у вигляді схеми

В процесорному блоці Haswell зберігся 14-19 ступінчастий конвеєр, без змін перейшов і кеш на півтори тисячі мікроінструкцій, а ось блок декодування інструкцій тепер єдиний і не ділиться між двома потоками. Розмір блоку Out-of-Order Window (OoO) збільшено з 168 до 192 записів, а в Reservation Station додалися два порти, збільшивши загальне число до восьми. У Sandy Bridge було шість портів для паралельного виконання шести мікрооперацій. Три з них використовуються для операцій з пам'яттю (читання / запис), три - математичними операціями. Один доданий порт використовується для виконання цілочисельних математичних операцій і розгалуження, а другий - для обчислення адреси.

Були перероблені блоки FMA (Fused Multiply-Add) в портах 0-1, а також додана підтримка набору інструкцій AVX2 (Advanced Vector Extensions 2). Це дозволяє значно підвищити продуктивність як при однотипної, так і при змішаному навантаженні, але все-таки найбільше зросла швидкість виконання операцій з плаваючою точкою - Intel заявляє про двократне підвищення продуктивності.

Нові набори інструкцій - запорука майбутньої ефективності

На практиці можна очікувати приріст при роботі з мультимедійним контентом і в 3D.

Новий блок FMA здатний дати серйозний виграш FLOPS за такт

Не залишився без уваги і КЕШ. Швидкість роботи L1 і шини між L1 і L2 були збільшені вдвічі, з 32 до 64 байт за цикл в обох випадках; латентність залишилася без змін. Доопрацьовано універсальний TLB (Translation Lookaside Buffer): з 4К до розширеного 4К + 2M, ширина шини збільшена вдвічі. Доступ до кешу L3 тепер ширше завдяки можливості обробляти запити data і non data одночасно.

Блок TSX допоможе розподілити навантаження між ядрами процесора

У Haswell був доданий набір інструкцій TSX (Transactional Synchronization eXtensions), що дозволяє підвищити швидкість роботи за рахунок «розумного» оперування тими даними, до яких одночасно звертаються кілька ядер. Це повинно підвищити ефективність роботи процесора з тими завданнями, які важко распараллелить, а також дає програмістам можливість перекласти частину роботи по розподілу навантаження між ядрами на процесор. TSX, як і AVX2 - зручний інструмент для розробників, які, вміло оперуючи їм, можуть домогтися значного збільшення швидкодії для своїх додатків. З цієї ж причини миттєвого результату «тут і зараз» від цих нових наборів інструкцій чекати не варто.

Одним з найбільш значущих подій цього року в сегменті настільних ПК безумовно можна вважати випуск нового сімейства процесорів Intel Core четвертого покоління, відомих під кодовою назвою Haswell. У цій статті ми коротко розглянемо микроархитектуру Haswell і порівняємо продуктивність процесора Intel Core i7-4770 на базі цієї мікроархітектури з продуктивністю процесора Intel Core i7-3770 на базі мікроархітектури попереднього покоління Sandy Bridgе.

Нагадаємо, що вже протягом багатьох років вихід нових поколінь процесорів Intel підпорядковується емпіричному правилу TICK-TOCK ( «тіктак»), суть якого полягає в тому, що переведення виробництва на новий технологічний процес (TICK) і впровадження нової процесорної мікроархітектури (TOCK) відбувається по черзі, з періодичністю приблизно в два роки. Тобто якщо в перший рік відбувається перехід на новий техпроцес виробництва, то на другий рік на цьому ж техпроцессе впроваджується нова процесорна мікроархітектура. На наступний рік відбувається перенос мікроархітектури на новий техпроцес виробництва і т.д.

Зокрема, в 2012 році компанія Intel випустила 22-нм версію процесорів на базі мікроархітектури Sandy Bridge, які відомі під кодовою назвою Ivy Bridge (цикл TICK), а тепер настала черга випуску 22-нм процесорів на базі нової процесорної мікроархітектури Haswell.

Детально про особливості нової мікроархітектури Haswell ми вже писали в КомпьютерПресс № 10'2012. Однак з тих пір пройшло багато часу, а найголовніше - стали відомі нові подробиці цієї мікроархітектури. А тому дозволимо собі в чомусь повторитися і зробити короткий огляд мікроархітектури Haswell, акцентуючись на тих деталях, які в нашому попередньому огляді були опущені.

Обчислювальний ядро \u200b\u200bHaswell

Haswell - це кодова назва нової процесорної мікроархітектури, але за традицією цим же ім'ям називаються всі базуються на ній процесори. Крім того, Haswell - це кодова назва ядра процесора Haswell, що цілком логічно, оскільки мікроархітектура і ядро \u200b\u200bпроцесора - це дві сторони однієї медалі.

Отже, розглянемо коротко микроархитектуру Haswell (або обчислювальний ядро \u200b\u200bHaswell, що в принципі одне й те саме).

Обчислювальний ядро \u200b\u200bHaswell не зазнало кардинальних змін в порівнянні з обчислювальним ядром Ivy Bridge / Sandy Bridge - були покращені лише окремі блоки ядра процесора. А тому доречним буде нагадати в загальних рисах микроархитектуру Sandy Bridge і зупинитися на внесених в неї зміни.

блок предпроцессора

Традиційно опис мікроархітектури ядра процесора починається з блоку предпроцессора (front-end), який відповідає за вибірку інструкцій x86 з кешу інструкцій і їх декодування (рис. 1). У мікроархітектурі Haswell блок предпроцессора зазнав мінімальних змін.

Мал. 1. Предпроцессор в мікроархітектури Haswell і Sandy Bridge

Інструкції x86 вибираються з кешу інструкцій L1I (Instruction Сache), який не змінився в мікроархітектурі Haswell. Він має розмір 32 Кбайт, є 8-канальним і динамічно поділяємо між двома потоками інструкцій (підтримка технології Hyper-Threading).

З кешу L1I команди завантажуються 16-байтними блоками в 16-байтний буфер предкодірованія (Fetch Buffer).

Оскільки інструкції x86 мають змінну довжину (від 1 до 16 байт), а довжина блоків, якими команди завантажуються з кешу, фіксована, при декодуванні команд визначаються межі між окремими командами (інформація про розміри команд зберігається в кеші інструкцій L1I в спеціальних полях). Процедура виділення команд з обраного блоку називається попередніми декодуванням (PreDecode).

Після операції вибірки команди організовуються в чергу (Instruction Queue). У мікроархітектурі Sandy Bridge і Haswell буфер черги команд розрахований на 20 команд в кожному з двох потоків, причому з буфера предкодірованія за кожен такт в буфер черги команд можуть завантажуватися до шести виділених команд.

Після цього виділені команди (x86-інструкції) передаються в декодер, де вони перетворюються в машинні микрооперации (позначаються як micro-ops або uOps).

Декодер ядра процесора Haswell залишився без змін. Він як і раніше є чотирьохканальним і може декодувати в кожному такті до чотирьох інструкцій x86. Як уже зазначалося, довжина однієї команди може досягати 16 байт, проте середня довжина команд становить 4 байта. В середньому в кожному 16-байтним блоці завантажуються чотири команди, які при використанні чотирьохканального декодера одночасно декодируются за один такт.

Чотириканальний декодер складається з трьох простих декодерів, декодер прості інструкції в одну микрооперацию, і одного складного, який здатний декодувати одну інструкцію не більше ніж в чотири микрооперации (декодер типу 4-1-1-1). Для ще більш складних інструкцій, декодує більш ніж в чотири микрооперации, складний декодер з'єднаний з блоком uCode Sequenser, який і застосовується для декодування подібних інструкцій.

При декодуванні інструкцій використовуються технології Macro-Fusion і Micro-Fusion.

Macro-Fusion - це злиття двох x86-інструкцій в одну складну микрооперацию micro-ops, яка в подальшому буде виконуватися як одна мікрооперація. Природно, такого злиття можуть піддаватися не будь-які інструкції, а тільки деякі пари інструкцій (наприклад, інструкція порівняння і умовного переходу). Без застосування технології Macro-Fusion за кожен такт процесора можна розкодувати тільки чотири інструкції (в чотирьохканальна декодере), а при використанні технології Macro-Fusion в кожному такті можуть зчитуватися п'ять інструкцій, які за рахунок злиття перетворюються в чотири і піддаються декодуванню.

Відзначимо, що для ефективного підтримки технології Macro-Fusion застосовуються розширені блоки ALU (Arithmetical Logic Unit), здатні підтримати виконання злитих микроопераций.

Micro-Fusion - це злиття двох микроопераций (НЕ x86-інструкцій, а саме микроопераций) в одну, яка містить два елементарних дії. Надалі дві такі злиті микрооперации обробляються як одна, що дозволяє знизити кількість оброблюваних микроопераций, а отже, збільшити загальну кількість виконуваних процесором інструкцій за один такт.

Крім того, в мікроархітектурі Haswell і Sandy Bridge застосовується кеш декодованих микроопераций (Uop Cache), в який надходять всі декодувати микрооперации. Цей кеш розрахований приблизно на 1500 микроопераций середньої довжини. Кеш декодованих микроопераций є вісім банків (тобто даний кеш є 8-канальним), кожен з яких складається з 32 кешстрок, а кожна кешстрока вміщує до шести декодованих микроопераций (uop). Звідси і виходить, що кеш може містити приблизно 1500 микроопераций.

Концепція кеша декодованих микроопераций полягає в тому, щоб зберігати в ньому вже декодувати послідовності мікрооперацій. В результаті, якщо потрібно виконати якусь x86-інструкцію повторно, а відповідна їй послідовність декодованих микроопераций все ще знаходиться в кеші декодованих микроопераций, не потрібно повторно вибирати цю інструкцію з кешу L1 і декодувати її - з кешу на подальшу обробку надходять вже декодувати микрооперации.

Після процесу декодування x86-інструкцій вони, по чотири штуки за такт, надходять в буфер черги декодованих інструкцій (Decode Queue). У мікроархітектурі Sandy Bridge цей буфер черги декодованих інструкцій був розрахований на два потоки команд по 28 микроопераций на кожен потік. У мікроархітектури Ivy Bridge і Haswell він не ділиться на два потоки команд і розрахований на 56 микроопераций. Такий підхід виявляється більш кращим при виконанні однопотокового додатки (з одним потоком команд). В цьому випадку одному потоку команд доступний буфер ємністю на 56 микроопераций, а в мікроархітектурі Sandy Bridge - тільки на 28 микроопераций.

Здавалося б, якщо порівнювати ядра процесорів Haswell і Ivy Bridge, то різниці в їх предпроцессорах немає взагалі, а предпроцессори ядер Haswell і Sandy Bridge розрізняються лише структурою буфера черги декодованих інструкцій.

Проте, як заявляє компанія Intel, деякі поліпшення в предпроцессор Haswell все ж були внесені і стосувалися удосконалення блоку пророкування розгалужень (Branch Predictors). Однак, які саме поліпшення були реалізовані, компанія Intel не розкриває.

Закінчуючи опис предпроцессора в мікроархітектурі Haswell, потрібно також згадати і про TLB-буфері.

Буфер TLB (Translation Look-aside Buffers) - це спеціальний кеш процесора, в якому зберігаються адреси декодованих інструкцій і даних, що дозволяє значно скоротити час доступу до них. Цей кеш призначений для скорочення часу перетворення віртуального адреси даних або інструкцій в фізичний. Справа в тому, що процесор використовує віртуальну адресацію, а для доступу до даних в кеші або оперативної пам'яті потрібні реальні фізичні адреси. Перетворення ВА у фізичний займає приблизно три такту процесора. TLB-кеш зберігає результати попередніх перетворень, завдяки чому перетворення адреси можливо здійснювати за один такт.

У процесорах c мікроархітектури Haswell і Sandy Bridge (як і в процесорах Intel на базі інших мікроархітектури) використовується дворівневий кеш TLB, причому якщо кеш L2 TLB є уніфікованим, то L1 TLB-кеш розділений на буфер даних (DTLB) і буфер інструкцій (ITLB) .

L1 TLB-кеші інструкцій і даних в мікроархітектурі Haswell не зазнали змін - вони точно такі ж, як і в мікроархітектурі Sandy Bridge. L1 ITLB-кеш інструкцій розрахований на 128 записів, в разі якщо кожна запис адресує сторінку пам'яті ємністю 4 Кбайт. Таким чином, при застосуванні 4 Кбайт сторінок пам'яті L1 ITLB-кеш може адресувати 512 Кбайт пам'яті. У разі сторінок ємністю 4 Кбайт ITLB-кеш є 4-канальним і статично розділений між двома потоками команд. Крім того, L1 ITLB-кеш може адресувати 2 Мбайт сторінок пам'яті. В цьому випадку кеш містить вісім записів на кожен потік і є повністю асоціативним.

Блок позачергового виконання команд

Після процесу декодування x86-інструкцій починається етап їх позачергового виконання (Out-of-Order).

На першому етапі відбувається перейменування і розподіл додаткових регістрів процесора, які не визначені архітектурою набору команд. Техніка перейменування регістрів буде безглуздою без переупорядковування команд. Тому з буфера черги декодованих інструкцій (Decode Queue) микрооперации по чотири штуки за такт надходять в буфер переупорядковування (ReOrder Buffer), де відбувається переупорядочение микроопераций не в порядку їх надходження (Out-of-Order).

У мікроархітектурі Sandy Bridge розмір буфера переупорядковування розрахований на 168 микроопераций, а в мікроархітектурі Haswell - на 192 микрооперации.

Відзначимо, що буфер переупорядковування (ReOrder Buffer) і блок відставки (Retirement Unit) суміщені в єдиному блоці процесора, але спочатку проводиться переупорядочение інструкцій, а блок Retirement Unit включається в роботу пізніше, коли треба видати виконані інструкції в заданому програмою порядку.

Далі відбувається розподіл микроопераций за виконавчими блокам. У блоці процесора Unified Scheduler формуються черги микроопераций, в результаті чого микрооперации потрапляють на один з портів функціональних пристроїв (Dispatch ports). Цей процес називається диспетчеризацією (Dispatch), а самі порти виконують функцію шлюзу до функціональних пристроїв.

У мікроархітектури Sandy Bridge і Haswell кластери позачергового виконання команд (Out-of-Order Cluster) використовують так звані фізичні реєстрові файли (Physical Register File, PRF), в яких зберігаються операнди микроопераций.

Нагадаємо, що, коли в ядрах процесорів не застосовувалися фізичні реєстрові файли (наприклад, в мікроархітектурі Nehalem), кожна мікрооперація мала копію необхідного їй операнда (чи операндів). Фактично це означало, що блоки кластера позачергового виконання команд повинні були мати досить великим розміром, Щоб мати можливість вміщати микрооперации разом з необхідними їм операндами.

Використання PRF дозволяє самим Мікрооперацій зберігати лише покажчики на операнди, але не самі операнди. З одного боку, такий підхід забезпечує зниження енергоспоживання процесора, оскільки переміщення по конвеєру микроопераций разом з їх операндами вимагає істотних витрат по енергоспоживанню. З іншого - застосування фізичного реєстрового файлу дозволяє заощадити розмір кристала, а вивільнені простір використовувати для збільшення розмірів буферів кластера позачергового виконання команд.

Мал. 2. Блоки позачергового виконання команд

в мікроархітектури Haswell і Sandy Bridge

У мікроархітектурі Sandy Bridge фізичний регістровий файл для цілочисельних операндів (Integer Registers) розрахований на 160 записів, а для операндів з плаваючою комою (AVX Registers) - на 144 записи.

У мікроархітектурі Haswell фізичні реєстрові файли Integer Registers і AVX Registers розраховані на 168 записів.

Буфери читання (Load) і записи (Store), які використовуються для доступу до пам'яті, також збільшилися. Наприклад, якщо в мікроархітектурі Sandy Bridge буфери Load і Store були розраховані на 64 і 36 записів відповідно, то в мікроархітектурі Haswell вони розраховані відповідно на 72 і 42 записи.

Розмір буфера Unified Scheduler, в якому формуються черги микроопераций до портів функціональних пристроїв, також змінився в мікроархітектурі Haswell. Якщо в Sandy Bridge він був розрахований на 54 микрооперации, то в Haswell - на 60.

Отже, якщо порівнювати архітектури Haswell і Sandy Bridge, то в блоці позачергового виконання команд мікроархітектура Haswell має не структурні, а лише якісні зміни, що стосуються збільшення розмірів буферів. Але ніяких принципових змін в блоці позачергового виконання команд в мікроархітектурі Haswell немає.

Виконавчі блоки ядра процесора

Що стосується виконавчих блоків ядра процесора, то в мікроархітектурі Haswell вони зазнали істотних змін у порівнянні з мікроархітектури Sandy Bridge. Так, в Sandy Bridge налічується шість портів функціональних пристроїв (портів диспетчеризації): три обчислювальних і три для роботи з пам'яттю (на рис. 3 показані тільки обчислювальні порти).

Мал. 3. Виконавчі блоки в мікроархітектури Sandy Bridge

і Haswell (порти для роботи з пам'яттю не показані)

У мікроархітектурі Haswell кількість портів функціональних пристроїв збільшено до восьми. До того, що було в мікроархітектурі Sandy Bridge, додали ще один порт для запису адреси (Store address) і обчислювальний порт для операцій з цілими числами і операцій зсуву (Integer ALU & Shift). Таким чином, процесори Haswell можуть за один такт виконувати до восьми микроопераций, в той час як в мікроархітектурі Sandy Bridge максимальна кількість виконуваних за такт микроопераций одно шести.

Крім того, в мікроархітектурі Haswell трохи змінені і самі виконавчі пристрої. Пов'язано це з тим, що в мікроархітектурі Haswell з'явилися додаткові набори інструкцій: AVX2, FMA3 і BMI.

Набір інструкцій AVX2 (Advanced Vector Instructions) є розширенням набору інструкцій AVX, який присутній в мікроархітектурі Sandy Bridge. Взагалі, набір інструкцій AVX є логічним продовженням наборів інструкцій SSE, SSE2, SSE3 і SSE4. Для обробки даних в інструкціях AVX використовується 16 векторних регістрів розрядністю по 256 біт, завдяки чому можна у багато разів прискорити багато операцій. Наприклад, множення чотирьох 64-розрядних чисел з використанням AVX-команди можливо всього за один такт, в той час як без AVX-інструкції для цього буде потрібно чотири такту.

Головна відмінність нового набору інструкцій AVX2 від попередньої версії AVX полягає в тому, що якщо раніше 256-бітові операції з AVX-регістрами були доступні тільки для операнда з плаваючою комою, а для цілочисельних операндів були доступні лише 128-бітові операції, то в AVX2 256 -бітний операції стали доступні і для цілочисельних операндів. Фактично, при використанні AVX за один такт можна реалізувати 16 операцій з числами одинарної точності і вісім операцій з числами подвійної точності. А при використанні AVX2 за один такт можна реалізувати 32 операції з числами одинарної точності і 16 операцій з числами подвійної точності.

Крім того, в AVX2 з'явилася поліпшена підтримка зрушень і перестановок в векторних операціях. Є й нові інструкції, які використовуються для складання декількох (чотирьох або восьми) незв'язаних елементів в один векторний елемент, завдяки чому є можливість більш повно завантажувати 256-бітові AVX-регістри.

Новий набір інструкцій FMA3 (Fused Multiply Add) призначений для проведення операцій суміщеного множення і складання над трьома операндами.

Використання операцій FMA3 дозволяє більш ефективно реалізувати операції ділення, добування квадратного кореня, множення векторів і матриць і т.д. Набір FMA3 включає 36 інструкцій з плаваючою точкою для виконання 256-бітних обчислень і 60 інструкцій для 128-бітних векторів.

У набір команд BMI (Bit Manipulation Instructions) входять 15 скалярних інструкцій для бітових операцій, які працюють з цілочисельними регістрами загального призначення. Ці інструкції розбиті на три групи: маніпуляції над окремими бітами, такі як вставка, зрушення і витяг біт, підрахунок бітів, наприклад підрахунок провідних нулів у запису чисел, і целочисленное множення довільної точності. Даний набір інструкцій дозволяє прискорювати ряд специфічних операцій, які використовуються, наприклад, при шифруванні.

Підсистема пам'яті в мікроархітектурі Haswell

Одне з найбільш значущих змін в мікроархітектурі Haswell в порівнянні з Sandy Bridge було зроблено в підсистемі пам'яті. І справа не тільки в тому, що збільшений розмір буферів читання (Load) і записи (Store), які використовуються для доступу до пам'яті (72 і 42 записи відповідно). Головне, був доданий ще один порт для запису адреси (Store address), кеш даних L1 став більш продуктивним, а пропускна здатність між кешами L1 і L2 збільшена. Розглянемо ці зміни більш докладно.

Доступ до підсистеми пам'яті починається з того, що відповідні микрооперации надходять в буфери читання (Load) і записи (Store), які в сукупності можуть накопичувати більше ста микроопераций. У мікроархітектурі Sandy Bridge порти функціональних пристроїв, які маркуються на схемах як 2, 3 і 4, відповідали саме за доступ до пам'яті (рис. 4). Порти 2 і 3 пов'язані з функціональними пристроями генерації адреси (Address Generation Unit, AGU) для запису або читання даних, а порт 4 пов'язаний з функціональним пристроєм для запису даних з ядра процесора в кеш даних L1 (DL1). Процедура генерації адреси займає один або два такту процесора.

Мал. 4. Підсистема пам'яті в мікроархітектури Sandy Bridge і Haswell

У мікроархітектурі Haswell до портів 1, 2 і 3 доданий ще порт 7, який пов'язаний з функціональним пристроєм генерації адреси для запису даних (Store AGU). В результаті ядро \u200b\u200bHaswell може підтримувати дві операції завантаження даних і одну операцію запису даних за такт.

Виділене функціональний пристрій генерації адреси для запису даних трохи простіше у виконанні в порівнянні з функціональними пристроями генерації адреси загального призначення (для запису і завантаження даних). Справа в тому, що мікрооперація записи даних просто записує адресу (і, в кінцевому рахунку, самі дані) в буфер записи (store buffer). А мікрооперація завантаження даних повинна записувати в буфер читання і також відстежувати вміст буфера запису, для того щоб виключити можливі конфлікти.

Як тільки згенерований потрібний віртуальний адреса, починається перегляд кеша L1 DTLB на предмет відповідності цього віртуального адреси фізичній. Сам кеш даних L1 DTLB в мікроархітектурі Haswell не зазнав змін. Він підтримує 64, 32 і 4 записи для сторінок пам'яті розміром 4 Кбайт, 2 Мбайт і 1 Гбайт відповідно і є 4-канальним.

При промаху в кеші L1 DTLB починається перегляд відповідних записів в уніфікованому кеші L2 TLB, який має ряд поліпшень в мікроархітектурі Haswell. Цей кеш підтримує сторінку розміром 4 Кбайт і 2 Мбайт, є 8-канальним і розрахований на 1024 записи. А в мікроархітектурі Sandy Bridge L2 TLB кеш був розрахований на 512 записів (тобто був удвічі менше), підтримував тільки сторінки пам'яті розміром 4 Кбайт і був 4-канальним.

Сам кеш даних L1 залишився розміром 32 Кбайт і 8-канальним (як і в мікроархітектурі Sandy Bridge). При цьому доступ в TLB-кеш і перевірка тегів кеша даних L1 може проводитися паралельно.

Однак в мікроархітектурі Haswell кеш даних L1 має більш високу пропускну здатність. Він підтримує одночасно одну 256-бітну операцію читання і дві 256-бітові операції записи, що в сукупності дає сукупну смугу пропускання в 96 байт за такт. У мікроархітектурі Sandy Bridge кеш даних L1 підтримує одночасно одну 128-бітну операцію читання і дві 128-бітові операції записи, тобто має теоретичну смугу пропускання в два рази нижче. При цьому реальна смуга пропускання кеша даних L1 в мікроархітектурі Sandy Bridge більш ніж удвічі нижче смуги пропускання в мікроархітектурі Haswell через те, що в Sandy Bridge тільки два функціональних блоку AGU.

Крім того, в мікроархітектурі Haswell збільшена і пропускна здатність між кешами L1 і L2. Так, якщо в Sandy Bridge пропускна здатність між кешем L2 і L1 становила 32 байта за цикл, то в Haswell вона підвищена до 64 байтів за цикл. І при цьому кеш L2 в Haswell має ту ж латентність, що і в Sandy Bridge. На закінчення відзначимо, що, як і в мікроархітектурі Sandy Bridge, в Haswell кеш L2 НЕ ексклюзиву і не інклюзіва по відношенню до кешу L1.

Нові режими енергозбереження в процесорі Haswell

Одне з нововведень в процесорі Haswell - це дозволяють знизити сукупну енергоспоживання процесора нові стану енергоспоживання, які називаються S0ix і запозичені у процесорів Intel Atom (такі режими енергоспоживання були реалізовані ще в процесорах Moorestown).

Нагадаємо, що традиційно система може перебувати або в активному стані S0 (звичайний робочий режим), або в одному з чотирьох станів «сну» S1-S4.

У стані S1 все процесорні кеші скинуті і процесор припинив виконання інструкцій. Однак підтримується харчування процесора і оперативної пам'яті, а пристрої, які не позначені як включені, можуть бути відключені. Стан S2 - це ще більш глибоке стан «сну», коли процесор відключений.

Стан S3 (інша назва - Suspend to RAM (STR) або режим очікування - Standby) - це стан, в якому на оперативну пам'ять (ОЗУ) ще перебуватиме під харчування і вона залишається практично єдиним компонентом, який споживає енергію.

Стан S4 відомо як гібернація (Hibernation). У цьому стані весь вміст оперативної пам'яті зберігається в незалежній пам'яті (наприклад, на жорсткому диску або SSD).

Стану S0ix (S0i1, S0i2, S0i3, S0i4) аналогічні станам S1, S2, S3 і S4 в сенсі енергоспоживання, але відрізняються від них тим, що для переходу системи в активний стан S0 потрібно набагато менше часу. Наприклад, для переходу зі стану S0 в стан S0i3 потрібно 450 мкс, а для зворотного переходу - 3,1 мс.

Графічне ядро \u200b\u200bв мікроархітектурі Haswell

Одне з основних нововведень в мікроархітектурі Haswell - це нове графічне ядро \u200b\u200bc підтримкою DirectX 11.1, OpenCL 1.2 і OpenGL 4.0.

Але найголовніше, що графічне ядро \u200b\u200bв мікроархітектурі Haswell масштабується. Існують варіанти графічного ядра з кодовими назвами GT3, GT2 і GT1 (рис. 5).

Мал. 5. Блок-схема графічного ядра Haswell

Ядро GT1 буде мати мінімальну продуктивність, а GT3 - максимальну.

У графічному ядрі GT3 з'явиться другий обчислювальний блок, за рахунок чого подвоїться кількість блоків растеризації, піксельних конвеєрів, обчислювальних ядер і семплером. Очікується, що GT3 буде вдвічі продуктивніше GT2.

Ядро GT3 містить 40 виконавчих блоків, 160 обчислювальних ядер і чотири текстурних блоки. Для порівняння нагадаємо, що в графічному ядрі Intel HD Graphics 4000 процесорів Ivy Bridge міститься 16 виконавчих пристроїв, 64 обчислювальних ядра і два текстурних блоки. Тому, незважаючи на приблизно однакові тактові частоти їх роботи, графічне ядро \u200b\u200bIntel GT3 перевершує свого попередника за рівнем продуктивності. Крім того, ядро \u200b\u200bGT3 має більш високу продуктивність завдяки інтеграції пам'яті EDRAM (в ядрі GT3e) в упаковку процесора.

Ядро GT2 містить 20 виконавчих блоків, 80 обчислювальних ядер і два текстурних модуля, а ядро \u200b\u200bGT1 - тільки 10 виконавчих блоків, 40 обчислювальних ядер і один текстурний модуль.

Самі виконавчі блоки мають по чотири обчислювальних ядра на зразок тих, що використовуються в архітектурі AMD VLIW4.

Ще одне нововведення полягає в тому, що при роботі з пам'яттю застосуються технологія Instant Access, яка дозволяє обчислювальним ядрам процесора і графічного ядра безпосередньо звертатися до оперативної пам'яті. В попередніх версіях графічного ядра обчислювальні ядра процесора і графічне ядро \u200b\u200bтеж працювали із загальною оперативною пам'яттю, Але при цьому пам'ять ділилася на дві області з динамічно змінюваними розмірами. Одна з них відводилася для графічного ядра, а інша - для обчислювальних ядер процесора. Однак отримати одночасний доступ до одного і того ж ділянки пам'яті графічне ядро \u200b\u200bі обчислювальні ядра процесора не могли. І в разі, якщо графічного процесора були потрібні ті ж дані, що використовувалися обчислювальним ядром процесора, йому доводилося копіювати цю ділянку пам'яті. Це призводило до зростання затримок, а крім того, виникала проблема відстеження когерентності даних.

Технологія InstantAccess дозволяє драйверу графічного ядра ставити покажчик на положення певної ділянки в області пам'яті графічного ядра, до якої обчислювальному ядру процесора необхідно безпосередньо отримати доступ. При цьому обчислювальний ядро \u200b\u200bпроцесора буде працювати з цією областю пам'яті безпосередньо, без створення копії, а після виконання необхідних дій область пам'яті буде повернута в розпорядження графічного ядра.

Сімейство нових графічних ядер GT1, GT2 і GT3 має поліпшені можливостями з кодування-декодування відео даних. Підтримується апаратне декодування форматів H.264 / MPEG-4 AVC, VC-1, MPEG-2, MPEG-2 HD, Motion JPEG, DivX з роздільною здатністю аж до 4096 × 2304 пікселів. Заявляється, що графічне ядро \u200b\u200bздатне одночасно декодувати кілька відеопотоків 1080p і відтворювати відео 2160p без пригальмовування і пропуску кадрів.

З'явився і спеціальний блок поліпшення якості відео, який називається Video Quality Engine і відповідає за шумозаглушення, корекцію, деінтерлейсінг, адаптивне зміна контрасту і т.д. Також нові графічні ядра будуть підтримувати функції стабілізації зображення, перетворення частоти кадрів і розширеної гами.

Крім того, графічне ядро \u200b\u200bв процесорі Haswell забезпечує підключення до трьох моніторів одночасно. Підтримуються порти Display Port 1.2 з дозволами до 3840 × 2160 і частотою 60 Гц, HDMI c дозволом до 4096 × 2304 і частотою 24 Гц (при максимальному дозволі), а також порт DVI.

Модельний ряд процесорів Haswell

Поки що передчасно говорити про модельний ряд процесорів Haswell. Природно, в Інтернеті можна знайти різноманітну і часом суперечливу інформацію щодо планів компанії Intel по випуску процесорів Haswell. Однак офіційно цю інформацію компанія не підтверджує, тому невідомо, які саме моделі процесорів будуть оголошені в першу чергу.

Достовірно відомо лише, що процесори Haswell будуть офіційно називатися Intel Core четвертого покоління і складуть три серії: Core i7, Core i5 і Core i3. Як і попередні покоління процесорів Intel, моделі процесорів Haswell маркуються чотиризначним числом, яке починається з цифри 4 (перша цифра позначає номер покоління процесорів).

Спочатку компанія Intel оголосить про випуск процесорів для настільних ПК і ноутбуків серій Core i7 і Core i5, а більш слабкі і дешеві процесори серії Core i3 з'являться пізніше.

Процесори для настільних ПК будуть наділятися графічним ядром GT2 з офіційною назвою Intel HD Graphics 4600 проте це лише чутки, тому цілком можливо, що в сімействі процесорів для настільних ПК виявиться модель з графічним ядром GT3 (офіційна назва Intel HD Graphics 5200).

Мобільні версії процесорів Haswell будуть оснащуватися графічним ядром або GT3 (топові моделі), або GT2.

Знову ж таки з чуток, всі версії мобільних процесорів будуть чотирьохядерними з підтримкою технології Hyper-Threading ( мова йде про сімейство мобільних процесорів Core i7). Процесори для настільних ПК сімейств Core i7 і Core i5 також будуть переважно (за винятком однієї моделі в сімействі Core i5) чотирьохядерними, однак технологію Hyper-Threading будуть підтримувати тільки топові моделі сімейства Core i7 і двоядерний модель процесора сімейства Core i5.

Всі процесори сімейств Core i5 і Core i7 будуть підтримувати технологію Turbo Boost.

Розмір кешу L3 у процесорів сімейств Core i7 і Core i5 може становити 8, 6 і 4 Мбайт, ну а TDP цих процесорів варіюється від 35 до 84 Вт.

Процесори для настільних ПК мають роз'єм LGA 1150 і сумісні тільки з материнськими платами на базі нових чіпсетів Intel 8-ї серії.

Процесор Intel Core i7-4770

Якщо про все модельному ряді процесорів Haswell і їх характеристиках на момент написання цієї статті офіційної інформації ми не мали, то про процесор Intel Core i7-4770, який був у нас на тестуванні, ми знали всі. Цей процесор не самий топовий в сімействі Intel Core i7 четвертого покоління і поступається лише моделі Intel Core i7-4770K, яка відрізняється від нього тим, що має повністю розблокований коефіцієнт множення і на 100 МГц вищу базову тактову частоту. У всьому іншому ці процесори однакові.

Отже, процесор Intel Core i7-4770 є чотирьохядерним, підтримує технологію Hyper-Threading, а його базова частота становить 3,4 ГГц. В режимі Turbo Boost максимальна тактова частота може досягати 3,9 ГГц. Процесор наділений кешем L3 розміром 8 Мбайт і графічним ядром GT2 (офіційна назва Intel HD Graphics 4600), яке працює на тактовій частоті 1,2 ГГц. Контролер пам'яті в процесорі, як і раніше, двоканальний, а офіційна максимальна частота підтримуваної пам'яті DDR3 становить 1600 МГц (можна, звичайно, використовувати і більш швидкісну пам'ять).

Знову ж таки, як і раніше, процесор Intel Core i7-4770 має вбудований контроллер PCI Express 3.0 на 16 ліній. Ну і останнє важлива обставина - TDP цього процесора становить 84 Вт.

Для порівняння нагадаємо, що процесор Intel Core i7-3770 (кодове найменування Ivy Bridge) попереднього покоління має дуже схожі характеристики. Він також є чотирьохядерним, підтримує Hyper-Threading і має кеш L3 розміром 8 Мбайт. Трохи відрізняються базові тактові частоти цих процесорів: для моделі Intel Core i7-4770 вона становить 3,4 ГГц, а для Intel Core i7-3770К - 3,5 ГГц. Однак в режимі Turbo Boost тактові частоти цих процесорів збігаються: якщо завантажено одне або два ядра процесора, то максимальна тактова частота може становити 3,9 ГГц (за умови, що ні перевищено максимальне енергоспоживання і максимальний струм). У разі якщо завантажені три ядра процесора, максимальна тактова частота може становити 3,8 ГГц, а при завантаженні всіх чотирьох ядер - 3,7 ГГц.

Відрізняються в цих процесорах графічні ядра і, звичайно ж, сама мікроархітектура обчислювальних ядер. А тепер маленька деталь: процесор Intel Core i7-3770 має TDP 77 Вт, тобто менше, ніж Intel Core i7-4770. Що ж, мабуть збільшення розмірів буферів і кількості регістрів, додаткові порти функціональних пристроїв і збільшення пропускної підсистеми пам'яті процесора дарма не минули. Все це призвело і до збільшення енергоспоживання процесора. З цим, однак, цілком можна змиритися, якщо за рахунок невеликого збільшення енергоспоживання досягнуто адекватний приріст продуктивності процесора. Що ж, залишилося перевірити, чи так це насправді.

Продуктивність в неігрових додатках

Для тестування процесора Intel Core i7-4770 ми використовували нашу утиліту ComputerPress Benchmark Script v.12.0, докладний опис якої можна знайти в березневому номері журналу. Нагадаємо, що дана тестова утиліта заснована на наступних реальних додатках:

  • Xilisoft Video Converter Ultimate 7.7.2;
  • Wondershare Video Converter Ultimate 6.0.3.2;
  • Movavi Video Converter 10.2.1;
  • Adobe Premier Pro CS 6.0;
  • Photodex ProShow Gold 5.0.3276;
  • Adobe Audition CS 6.0;
  • Adobe Photoshop CS 6.0;
  • ABBYY FineReader 11;
  • WinRAR 4.20;
  • WinZip 17.0.

Як показник продуктивності використовується час виконання тестових завдань.

Зрозуміло, що саме по собі час виконання тестових завдань ще не дозволяє оцінити продуктивність процесора. Подібні результати мають сенс тільки в порівнянні з деякими результатами, прийнятими за референсні. Таке зіставлення результатів дозволяє оцінити, у скільки разів (або на скільки відсотків) тестований процесор продуктивніший (а може, і менше) референсного при виконанні певного завдання.

Ми порівнювали процесор Intel Core i7-4770 з процесором Intel Core i7-3770. Для наочності представлення результатів також розраховувалися загальний інтегральний показник продуктивності процесора і інтегральні оцінки по окремих групах тестів (відеоконвертірованіе, створення відеоконтенту, аудіообработка, обробка цифрових фотографій, Розпізнавання тексту, архівування та розархівування даних).

Для розрахунку інтегральної оцінки продуктивності результати тестування процесора Intel Core i7-4770 нормувалися щодо результатів процесора Intel Core i7-3770K. Нормовані результати тестів розбивалися на шість логічних груп (відеоконвертірованіе, аудіообработка, створення відеоконтенту, обробка цифрових фотографій, розпізнавання тексту, архівування та розархівування даних), і в кожній групі розраховувався інтегральний результат як середньогеометричні від нормованих результатів. Для зручності подання результатів отримане значення множилося на 1000. Після цього розраховувалося середньогеометричні від отриманих інтегральних результатів, яке і являє собою результуючий інтегральний показник продуктивності. Для процесора Intel Core i7-3770K інтегральний результат продуктивності, а також інтегральні результати по кожній окремій групі тестів складають 1000 балів.

Для тестування процесора Intel Core i7-3770K використовувалася наступна конфігурація ПК:

  • материнська плата - Gigabyte GA-Z77X-UD5H;
  • чіпсет системної плати - Intel Z77 Express;
  • пам'ять - DDR3-1600;
  • відеокарта - процесорний графічне ядро \u200b\u200bIntel HD 4000;
  • Тестування процесора Intel Core i7-4770 проводилося на наступному стенді:
  • материнська плата - Intel DH87MC;
  • чіпсет системної плати - Intel H87 Express;
  • пам'ять - DDR3-1600;
  • обсяг пам'яті - 16 Гбайт (два модуля GEIL по 8 Гбайт);
  • режим роботи пам'яті - двоканальний;
  • відеокарта - процесорний графічне ядро \u200b\u200bIntel HD 4600;
  • накопичувач - Intel SSD 520 (240 Гбайт).

В обох випадках застосовувалася операційна система Microsoft Windows 8 Enterprise (64-bit).

Відзначимо, що материнська плата Intel DH87MC, яку ми використовували для тестування процесора Intel Core i7-4770, - це інженерний семпл. Компанія Intel відмовилася від виробництва материнських плат під своїм брендом і тепер займається лише референсним дизайном, тобто виробляє плати в якості зразка для своїх партнерів. Тому плата Intel DH87MC ніколи не надійде в продаж.

Як для процесора Intel Core i7-3770K, так і для процесора Intel Core i7-4770 тестування проводилося з настройками BIOS за замовчуванням, тобто режим Intel Turbo Boost був активований, але ніякого розгону процесорів не проводилося.

Для забезпечення високої точності результатів всі тести прогонялись по п'ять разів.

Результати тестування представлені в табл. 1 і на рис. 6.

Мал. 6. Інтегральні результати тестування процесорів утилітою

ComputerPress Benchmark Script v.12.0

Як бачите, інтегральна продуктивність процесора Intel Core i7-4770 майже на 10% перевершує продуктивність процесора Core i7-3770K, причому найбільший приріст в продуктивності спостерігається в таких додатках, як Adobe Photoshop CS6 (15%) і Adobe Premier Pro CS 6.0 (18% ) і Photodex ProShow Gold 5.0.3276 (13%).

При цьому потрібно врахувати, що процесори Intel Core i7-4770 і Core i7-3770K працюють на одній і тій же тактовій частоті і спостерігається різниця в продуктивності пояснюється виключно змінами в мікроархітектурі процесора Intel Core i7-4770. У неігрових додатках нова мікроархітектура процесора Haswell дозволяє отримати виграш в продуктивності в середньому на 10%.

Продуктивність в іграх

Утиліта ComputerPress Benchmark Script v.12.0 дозволяє оцінити продуктивність процесора лише при роботі з неігровими додатками, в яких можливості інтегрованого графічного ядра практично не використовуються.

Тому ми також оцінили продуктивність графічного ядра процесора Intel Core i7-4770 в 3D-іграх з використанням бенчмаков 3DMark Professional і 3DMark 11 Advanced Edition.

Бенчмарк 3DMark Professional - це новий тест, який підтримує як Windows-, так і Android-платформи. До складу цього бенчмарка входять три тести: Ice Storm, Cloud Gate і Fire Strike. Перший з них орієнтований на мобільні пристрої типу смартфонів, планшетів або нетбуків, другий - на ноутбуки / ультрабуки і універсальні комп'ютери середнього рівня; а третій - на продуктивні ігрові ПК з потужною графікою.

Результати тестування процесорів із застосуванням бенчмарков 3DMark Professional і 3DMark 11 Advanced Edition представлені в табл. 2 і табл.3 і на рис. 7 і 8.

Мал. 7. Результати тестування процесорів

Мал. 8. Результати тестування процесорів

Як видно з результатів тестів 3DMark Professional і 3DMark 11 Advanced Edition, графічне ядро \u200b\u200bIntel HD 4600 (процесор Core i7-4770) дійсно має б пробільшу продуктивність, ніж ядро \u200b\u200bIntel HD 4000 (процесор Core i7-3770K). Однак різниця по продуктивності в цих тестах не в два рази, як про це заявляла компанія Intel в своїх презентаційних матеріалах, а трохи менше. Проте прогрес в продуктивності графічної підсистеми в наявності.

Відкритим, проте, залишився ще одне питання. Так, продуктивність графічної підсистеми в процесорі Core i7-4770 збільшилася майже вдвічі в порівнянні з процесором Core i7-3770K. Але чи достатньо цієї продуктивності, щоб на комп'ютері можна було грати без використання дискретної графічну карту? Якщо подивитися на детальний результат в тестах 3DMark Professional і 3DMark 11 Advanced Edition (значення FPS в графічних тестах), то можна зробити висновок, що для ігор графічне ядро \u200b\u200bIntel HD 4600 не годиться. Однак все ж бенчмарки 3DMark Professional і 3DMark 11 Advanced Edition - це специфічні програми. А тому, щоб дати об'єктивну відповідь на це питання, звернемося до результатів тестування процесора Core i7-4770 і в інших ігрових бенчмарках. В даному випадку немає необхідності порівнювати результати тестування графічних ядер процесорів Core i7-4770 і Core i7-3770K, оскільки нас цікавить лише абсолютний результат процесора Core i7-4770 в FPS.

  • Для цього тестування ми використовували такі бенчмарки:
  • Unigine Heaven Benchmark 4.0;
  • Unigine Valley 1.0;
  • Bioshock Infinite (вбудований бенчмарк);
  • Metro 2033 (вбудований бенчмарк).

Тестування проводилося при дозволі екрану 1920 × 1080 (менший дозвіл просто неактуально) і в двох режимах: максимальної продуктивності і максимальної якості. Ці крайні настройки визначають своєрідну вилку, за межі якої FPS вийти вже не може за будь-яких настройках гри.

Налаштування кожного бенчмарка на режими максимальної продуктивності і якості представлені в табл. 4, табл. 5, табл. 6 і табл. 7, а результати тестування - на рис. 9.

Рис 9. Результати тестування процесора Intel Core i7-4770 в іграх

і ігрових бенчмарках

З результатів тестування видно, що навіть при налаштуванні на мінімальну якість (максимальну продуктивність) вбудоване в процесор Intel Core i7-4770 графічне ядро \u200b\u200bне дозволить грати в сучасні 3D-ігри. Ні в одному з використовуваних нами бенчмарков середнє значення FPS не підніметься вище 30 FPS, що, звичайно ж, не можна визнати задовільним результатом. А тому, висновок такий: дійсно, нове графічне ядро \u200b\u200bIntel HD 4600 більш продуктивне в порівнянні з ядром Intel HD 4000, але ця обставина не означає, що вбудована графіка дозволить вам обходитися без дискретної графічної карти. Для комп'ютера, на якому мають виконуватися гри, вбудована графіка явно не годиться.

висновок

На закінчення нашого огляду процесора Intel Core i7-4770 підведемо короткий підсумок.

У порівнянні з процесором Intel Core i7-3770K продуктивність процесора Intel Core i7-4770 зросла приблизно на 10% в неігрових додатках. Однак, говорячи про зростання продуктивності процесорів Haswell, потрібно мати на увазі дуже важливу обставину.

Одне з головних достоїнств процесорів Intel Core другого (Sandy Bridge) і третього (Ivy Bridge) поколінь полягало в тому, що вони були добре разгоняемость і поняття базової тактової частоти було в якійсь мірі віртуальним. Ці процесори ділилися на повністю розблоковані (процесори К-серії) і частково розблоковані (всі інші процесори). Процесори K-серії можна було розганяти шляхом зміни коефіцієнта множення (максимальне значення для коефіцієнта множення хоч і існує, але воно досить висока).

Для частково розганяються процесорів можна було встановити коефіцієнт множення на чотири сходинки вище, ніж максимальне значення в режимі Turbo Boost. Наприклад, процесор Intel Core i7-3770 c базової тактовою частотою 3,4 ГГц можна розігнати до частоти 4,3 ГГц (коефіцієнт множення 43), оскільки максимальна тактова частота цього процесора в режимі Turbo Boost становить 3,9 ГГц (коефіцієнт множення 39 ).

Однак в процесорах Haswell, що не відносяться до K-серії, такий частковий розгін заблокований взагалі, а значить розігнати їх неможливо.

Здавалося б, крім маніпуляцій з коефіцієнтом множення процесор можна також розганяти шляхом збільшення частоти системної шини. Формально, дійсно, можна. Але, як показує практика, процесори Intel Core другого, третього і четвертого поколінь практично неможливо розігнати за рахунок збільшення частоти системної шини. Зокрема, наші експерименти з процесором Intel Core i7-4770 показали, що після збільшення частоти системної шини всього на 3 МГц система вже не завантажується.

Навіщо Intel заблокувала можливість часткового розгону - абсолютно незрозуміло. Швидше за все, цей недружній крок компанії по відношенню до користувачів і партнерам, які займаються виробництвом материнських плат, можна розцінити як чергову маркетингову помилку компанії.

Неможливість розгону процесорів Haswell, що не відносяться до К-серії, призводить до наступного сумного висновку. З точки зору вартості і продуктивності вигідніше купити частково розблокований процесор Intel Core i7-3770, ніж абсолютно заблокований процесор Intel Core i7-4770. Розігнавши його до частоти 4,3 ГГц (до такої частоти він розганяється без проблем), ви отримаєте більш високу продуктивність в порівнянні з процесором Intel Core i7-4770.

«Захоплюються практикою без науки - немов керманич, ступає на корабель без керма або компаса; він ніколи не впевнений, куди пливе. Завжди практика повинна бути споруджена на хорошій теорії ... »(Леонардо да Вінчі)

Статті, присвячені мікроархітектурі принципово нових процесорів Intel, Зазвичай починаються з відсилання до прийнятої в компанії з 2007 року моделі розробки «тік-так». Суть її полягає в тому, що розробка нових процесорних дизайнів і переведення виробництва на більш досконалі технологічні норми чергуються один з одним. Минула мікроархітектура, Ivy Bridge, в цій класифікації була «тиком», нова ж, Haswell, - це «так». Тобто в особі Haswell, По ідеї, ми повинні побачити кардинально оновлений зсередини процесор, але випускається за вже звичною 22-нм технології з тривимірними транзисторами.

Саме тому з майбутнім виходом Haswell пов'язані такі великі очікування. ринок персональних комп'ютерів знаходиться в застої. Конкуренція між виробниками x86-процесорів в високопродуктивному сегменті зійшла нанівець, а самі настільні комп'ютери потихеньку здають свої позиції під натиском мобільних пристроїв. Чи не виправило цієї ситуації навіть поява операційної системи Windows 8 - їй не тільки не вдалося повернути колишній інтерес до персональних комп'ютерів, більше того, у багатьох адептів традиційних форм-факторів вона викликала стійку неприязнь. І тепер все ентузіасти чекають революції від Intel, сподіваючись на якісний стрибок, який би не дивлячись ні на що пробудив інтерес до втратила колишню динаміку платформі x86. Хтось вірить, що класичні десктопи і ноутбуки можуть знову стати модною тенденцією, а хтось чекає, що поява нової лінійки процесорів хоча б підштовхне власників вже наявних систем до їх модернізації. Іншими словами, Haswell в очах ентузіастів продуктивних персональних комп'ютерів - це чи не остання надія на пожвавлення близького серцю сегмента ринку.

Однак у Intel на цей рахунок, схоже, думка зовсім інше. Охолодження інтересу до продуктивних персональних комп'ютерів відчувають і в компанії, але, з урахуванням кон'юнктури, що склалася, планується не намагатися розігрівати старі ринки, а взятися за завоювання нових. Коригуванні піддається вся генеральна лінія. Intel не має наміру продовжувати активно боротися за честь традиційних і звичних багатьом систем, а замість цього вона хоче займатися внесенням змін в архітектуру x86 і наявні продукти з тим, щоб пристосувати їх для тих класів мобільних пристроїв, які знаходяться зараз на піку популярності. Частково цієї мети служать почалися корінні перетворення в господарстві Atom: активне просування процесорів цього класу в смартфони та планшети, а також підготовка нової мікроархітектури Silvermont. Але паралельно метаморфози будуть відбуватися і з процесорної лінійкою Core, яка за задумом розробників повинна стати ще більш мобільною. І Haswell - хоча вже не перша, але, напевно, найпомітніша віха на цьому шляху.


Всі презентації та матеріали для преси, присвячені перспективним процесорам, на перших же сторінках розповідають нам про те, що Haswell в першу чергу націлюється на ультрабуки і ультрапортативні ноутбуки-трансформери, які легким рухом руки перетворюються в планшети. І це як не можна краще відображає ту мету, яка стояла перед розробниками нової мікроархітектури. Якщо на етапі створення мікроархітектури Sandy Bridge і Ivy Bridge інженери працювали над дизайном процесорів з цільовим енергоспоживанням 35-45 Вт, в той час як інші варіанти виходили шляхом варіювання числа ядер, частоти і напруги, то з Haswell вимоги по споживанню були ще більш посилені. Тепер Intel вважає найпривабливішим діапазон від 15 до 20 Вт. Таким чином, Haswell - яскраво виражена ультрамобільними мікроархітектура, що стоїть за рівнем продуктивності на щабель вище Atom. Що ж до десктопних модифікацій Haswell, то це для Intel - побічний продукт. Звичайно, отримати з економічного процесора звичайний набагато простіше, ніж виконати це перетворення в зворотну сторону. Але зняття обмежень по енергоспоживання і тепловиділення аж ніяк не означає безперешкодне масштабування продуктивності. Так що наскільки виправдає очікування Haswell у своїй деськтопной іпостасі - питання не настільки очевидний.

І тут доречним буде згадати попередній цикл «так», процесори з мікроархітектури Sandy Bridge. Вони в порівнянні зі своїми попередниками покоління Westmere змогли забезпечити лише приблизно 15-відсотковий приріст продуктивності в деськтопной середовищі саме тому, що розробники стали зміщувати свої акценти на співвідношення продуктивності і енергоспоживання. Зараз же розмова ведеться і зовсім на іншій мові: головні сильні сторони Haswell, на думку виробника, - це чудова економічність і принципово новий рівень графічного швидкодії. Що ж стосується обчислювальної продуктивності, то Intel чомусь не акцентує на ній увагу, що викликає всякі нехороші підозри. Тільки усугубляющиеся, якщо подивитися на попередні дані про швидкодію десктопних Haswell, які до теперішнього часу вже просочилися в пресу.

Чекати виходу процесорів, побудованих на мікроархітектурі Haswell, залишилося зовсім недовго. І через кілька днів ми зможемо дати розгорнуті відповіді на будь-які питання. Однак перед цим доречно буде ознайомитися з теорією - вона повинна стати хоч і неприємним, але необхідним протиотрутою від занадто райдужних ілюзій, які цілком могли сформуватися в тяжкому очікуванні чогось новенького.

Мікроархітектура Haswell: тик або так

Чесно кажучи, вступна частина надмірно згущує фарби. Так, мікроархітектура Haswell багато в чому дійсно може вважатися високоенергоеффектівной, і розроблялася вона в першу чергу з прицілом на мобільні застосування. Однак Intel все-таки не забуває про те, що прийнята в компанії бізнес-модель передбачає використання єдиного дизайну у великій лінійці продукції, що включає мобільні, десктопні і серверні компоненти. Це означає, що під модним фасадом низького енергоспоживання ховається міцний фундамент, що дозволяє направити Haswell в різні ринкові ніші. Іншими словами, нова мікроархітектура втратила своєї універсальності. Шляхом маніпулювання числом ядер, версіями графічного движка, цільовим рівнем енергоспоживання, розміром кеш-пам'яті і додаванням того чи іншого набору зовнішніх інтерфейсів з Haswell можуть виходити різні за своєю суттю процесори.


Втім, якщо говорити про власне мікроархітектури, то так, в ній на першому місці стоять нововведення, спрямовані на оптимізацію теплових і енергетичних режимів. Змін же, здатних підняти продуктивність, не так багато, і на цикл розробки «так» вони якщо і тягнуть, то з великими труднощами. Дійсно, коли Intel випускала Nehalem або Sandy Bridge, перебудова торкалася не тільки внутрішні блоки обчислювальних ядер, але і базову концепцію процесорного дизайну. Кожен «так» здавався чимось дійсно принципово іншим, а від ступеня новаторства захоплювало дух. Але якщо подивитися на узагальнену схему Haswell, то її легко переплутати з попередником - Ivy Bridge.


Всі функціональні блоки і принципи їх об'єднання в процесорі залишилися тими ж. Haswell успадковує з минулого все вдалі технології: турборежим, Hyper-Threading, кільцеву шину, але нічого нового до цього багажу не додає. Зміни є лише в надрах окремих вузлів. Причому інженерне втручання в глибинні шари мікроархітектури не дуже значно. Виконавчий конвеєр змінився не дуже сильно, його протяжність становить ті ж 14-19 стадій, що і раніше. Фронтальна частина отримала лише окремі косметичні удосконалення, а все більш-менш значущі зміни стосуються лише механізму виконання інструкцій і підтримки нових наборів команд. Говорячи про те, чи є Haswell більш продуктивної мікроархітектури, ніж Ivy Bridge, Intel посилається на поліпшення швидкодії до 20-30 відсотків, але слід мати на увазі, що ця оцінка включає і виграш від використання нових команд AVX2, для яких тривалий і непростий етап впровадження ще попереду.

Економічність: все заради неї

Зате кроків, зроблених для поліпшення економічності процесорного дизайну, - хоч відбавляй. Левова частка зусиль розробників була витрачена на зниження енергоспоживання, і, треба сказати, з точки зору мобільних систем зусилля ці пройшли далеко не даремно. Очікується, що системи на базі Haswell зможуть працювати від батареї приблизно на 50 відсотків довше, ніж аналогічні конфігурації на базі Ivy Bridge. У просте виграш Haswell у порівнянні з процесорами попереднього покоління складає близько 2-3 разів! А в стані готовності до роботи при збереженні мережевих з'єднань (Connected standby) загальне споживання платформи в порівнянні з системами на базі Sandy Bridge знизилося приблизно в 20 разів.

Настільки вражаючий прогрес своїм корінням сягає не в просте вдосконалення технологічного процесу, який насправді має лише еволюційні відмінності від 22-нм техпроцесу з тривимірними транзисторами, використовуваного для виробництва Ivy Bridge. І вже тим більше справа не в банальному збільшенні кількості зон процесорного кристала, які при відсутності активності можуть незалежно один від одного відключатися від живильної шини. Звичайно, все це вносить певний внесок у економічність Haswell, але подібні зміни відбуваються з кожним новим поколінням интеловских процесорів, а якісний стрибок стався тільки зараз. Так що секрет успіху - в іншому.

Коротко: нові рубежі економічності були досягнуті завдяки комплексу заходів, проведених не стільки з самим процесором, скільки з платформою і інфраструктурою в цілому.

По-перше, важливу роль зіграла загальна інтеграція компонентів платформи: в процесорний кристал перекочувала значна частина схеми перетворювача живлення, а для ультра мобільних застосувань був спроектований спеціалізований SoC-варіант процесора, що містить на тій же підкладці другий кристал - набір системної логіки.


По-друге, Intel провела значну роботу з основними виробниками контролерів, вказавши їм на необхідність якісної підтримки станів сну і глибокого сну. Попутно розробники розраховують, нарешті, домогтися від виробників дисплейних матриць підтримки функції Panel Self Refresh, що дозволяє зберігати зображення на екрані без його постійного оновлення з боку графічного ядра.

По-третє, на руку зіграла і операційна система Windows 8, ядро \u200b\u200bякої набагато дбайливіше відноситься до обробки переривань, по можливості намагаючись уникати розрізнених транзакцій, що будять процесор або пристрою.

І нарешті, по-четверте, в Haswell з'явився новий набір ACPI-станів сну S0ix, схожих за рівнем енергоспоживання на S3 / S4 (коли в пасив відправляються всі складові платформи за винятком системної пам'яті), але з часом переведення системи в повністю робочий стан на рівні декількох мілісекунд. Крім того, додалися також і нові стану простою процесора C7 і далі, що досягаються при видимої працездатності системи, але при яких з основної частини CPU може бути повністю знято напругу живлення.


Однак все перераховане в першу чергу стосується мобільних платформ і тривалості їх роботи від батареї. У настільних системах більшість з цих нововведень також має місце, але для кінцевих користувачів вони практично байдужі. Що ж їх зачіпає безпосередньо, так це поява в процесорі Haswell нових зон, які працюють на різних частотах. В Ivy Bridge таких зон було дві: обчислювальні ядра (разом з кешем і системним агентом) і графічне ядро. Але це виявилося не кращим рішенням з точки зору економічності, так як звернення графіки до даних в L3-кеші приводили до виходу з енергозберігаючих станів всього процесора. Тому в Haswell Uncore-частина, яка об'єднує системний агент і кеш третього рівня, отримала свою власну незалежну частоту.

І це - аж ніяк не позитивна зміна, а яскрава ілюстрація тих пріоритетів, яких дотримувалися інженери Intel при розробці їх нового дизайну. Асинхронна робота Uncore і обчислювальних ядер призводить до того, що кеш третього рівня в Haswell має велику латентність, ніж у процесорів попереднього покоління. Іншими словами, заради поліпшення економічності Intel готова навіть відкочувати зроблені раніше для збільшення продуктивності кроки.

Але зате всі заходи, вжиті Intel для зниження енергоспоживання, дозволяють компанії значно розширити спектр пропонованих енергоефективних процесорів Core. У мобільному сегменті очікується поява великої і включає близько двох десятків найменувань U-серії, з характерним розрахунковим тепловиділенням порядку 15 Вт. Крім того, нас очікує і Y-серія з виділенням тепла на рівні 6-7 Вт. Ці цифри здаються особливо вражаючими, якщо взяти до уваги, що мова йде про тепловиділення збірки, що включає крім процесорного ядра і кристал набору логіки.

Для тих, хто хотів швидше

Але все-таки, захопившись ідеями по переорієнтації процесорів Core на ультрамобільні ноутбуки-трансформери і продуктивні планшети, Intel не забула про те, щоб трохи підрихтувати саме серце своїх процесорів. Хоча обчислювальні ядра Haswell дуже схожі на ядра Ivy Bridge, в них все-таки можна виявити деяку кількість поліпшень. Правда, зроблені ці поліпшення зовсім не з прагнення підняти чисту продуктивність - кількість оброблюваних за такт інструкцій. Причина їх появи - впровадження в обіг нових інструкцій AVX2 і бажання збільшити ефективність роботи технології Hyper-Threading, яка повинна буде компенсувати неможливість використання чотирьох повноцінних ядер в нізковаттних процесорах. Але, на щастя, у зроблених нововведень є і позитивні побічні ефекти.

Передня частина виконавчого конвеєра Haswell залишилася практично недоторканою. Нова мікроархітектура, так само як і її попередники, заточена під обробку чотирьох інструкцій за такт. Блок вибірки інструкцій і декодер мають саме таку ширину. Залишився без змін і кеш інструкцій першого рівня об'ємом 32 Кбайт, а також введений ще в Ivy Bridge кеш для декодованих інструкцій на півтори тисячі микроопераций. Переваг на цьому етапі у Haswell перед минулим дизайном є тільки два. По-перше, завдяки тому, що відбувається при кожному релізі нового процесорного дизайну збільшення розміру всіх внутрішніх буферів зросла точність роботи блоку передбачення переходів. По-друге, черга вже декодованих інструкцій отримала явну оптимізацію під Hyper-Threading: її поділ на два потоки стало відбуватися динамічно.


Власне, відсутність змін в базових алгоритмах вибірки і декодування інструкцій і є явною вказівкою на те, що розраховувати на збільшення темпу обробки інструкцій у Haswell особливо не варто. Більше чотирьох (або п'яти в разі успішного спрацьовування технології macro-ops fusion) x86-команд ця архітектура переварити не може. І якщо раніше на циклі розробки «так» Intel робила нововведення, здатні збільшити ефективність роботи наявних декодерів, то тепер цього немає.

Помітні ж зміни в мікроархітектурі Haswell виявляються, якщо рухатися по конвеєру глибше. Так, збільшення всіх основних буферів торкнулося не тільки передбачення переходів. Важливо, що при цьому було збільшено вікно позачергового виконання команд. Цим досягається деяке поліпшення можливостей по паралельній обробці інструкцій одного потоку, що в кінцевому підсумку дозволяє більш щільно завантажувати роботою виконавчі пристрої (яких в Haswell стало не просто більше, а помітно більше).


Власне, на тлі всіх інших досить жалюгідних поліпшень в потрухах мікроархітектури це, мабуть, - головна перевага нового мікропроцесорного дизайну. Якщо в Ivy Bridge було передбачено всього шість виконавчих портів, то в Haswell їх стало вісім.


Таким чином, в теорії Haswell може обробляти до восьми микроопераций за такт. Однак слід зауважити, що три порти відведені на операції роботи з пам'яттю, тобто призначаються для обслуговування допоміжних микроопераций, що виникають при розбиранні x86-інструкцій.

Тому першорядне значення має поява окремого порту для цілочисельних операцій і обробки розгалужень. Очевидно, мається на увазі, що з часом число використовуваних в програмах 256-бітних інструкцій буде рости, і, щоб вони не блокували роботу самого звичайного коду, його виконання тепер може бути виділено на незалежний порт. Таке «розв'язання» портів за типами операцій повинно дати особливо сильний позитивний ефект при одночасному виконанні одним ядром двох різнорідних потоків за участю технології Hyper-Threading. Тобто ми знову стикаємося з ростом її ефективності в Haswell.

Також в розпорядженні процесора тепер виявилося сумарно чотири порти, здатних працювати з цілочисельними інструкціями. А це означає, що самий ординарний цілочисельний код може проходити через етап виконання з тим же темпом, що і через декодер.

Втім, судячи із загального підходу до проектування нової мікроархітектури, Intel замислювалася про зростання кількості оброблюваних за такт інструкцій в останню чергу. Що ж напевно хвилювало розробників набагато сильніше, так це робота з новими командами з набору AVX2. У цей безліч інструкцій входять 256-бітові SIMD-команди для обробки цілих чисел, розріджені операції з пам'яттю і різні перестановки і зрушення компонентів векторів. Але левова і найважливіша частка нового набору команд - принципово нові вещественночісленние FMA-інструкції (Fused Multiply-Add), які фактично одночасно включають в себе пару операцій - множення і додавання. Природно, їх виконання старими засобами викликало б значні простої процесора, тому для них тепер зроблено два окремих порту і виділені виконавчі пристрої. В результаті Haswell може виконувати по дві здвоєні FMA-інструкції за такт.


Таким чином, теоретично Haswell на AVX2-коді може показувати вдвічі вищу пікову вещественночісленную продуктивність, ніж процесори попередніх поколінь. Хоча, насправді, якщо зіставити швидкість виконання однієї FMA-інструкції і роздільних інструкцій множення і складання, то реальна величина прискорення виявиться на рівні 60 відсотків, що, звичайно ж, теж дуже непогано.

В якійсь мірі впровадження швидкого виконання FMA-команд є відповіддю Intel на зростаючу популярність обчислень на графічних процесорах. Набір AVX2 і наявні апаратні засоби для його обробки роблять Haswell відмінною чіслодробілкой, а самі ці інструкції прекрасно вписуються в популярні обчислювальні алгоритми, використовувані як в наукових областях, так і при обробці різного мультимедійного контенту.

Отже, процесори Haswell все-таки можуть бути істотно продуктивніше своїх попередників. Але не за рахунок більш швидкого виконання старого коду, а за рахунок надання інструментів для кращої реалізації старих алгоритмів через нову систему інструкцій. Це, природно, вимагає певних зусиль від співтовариства програміста, але зате не призводить до додаткових витрат процесором електроенергії, що відмінно вписується в ту генеральну лінію, якої тепер дотримується Intel.

Бажання зробити роботу процесора з AVX2-інструкціями максимально гладкою змусило розробників Haswell задуматися про збільшення швидкості роботи кеш-пам'яті. Нові команди припускають вдвічі швидшу, ніж раніше, обробку даних. Тому для підтримки балансу в новій мікроархітектурі симетрично збільшена пропускна здатність кеш-пам'яті першого і другого рівнів. Підкреслимо, мова йде саме про розширення смуги пропускання L1- і L2-кеша, латентність же кеш-пам'яті залишається на тому ж рівні, що і раніше.


В результаті кеш першого рівня став здатний відпрацьовувати два 32-байтних читання і одну 32-байтную запис за такт. Кеш ж другого рівня може приймати і віддавати за такт по 64 байта даних. І в тому і в іншому випадку має місце дворазове збільшення пропускної здатності в порівнянні з процесорними мікроархітектури минулих поколінь. Плюс до цього в Haswell, нарешті, вдалося ліквідувати всі додаткові затримки, пов'язані зі зверненнями до невирівняних даними в L1-кеші.

На жаль, при цьому поліпшення обійшли кеш третього рівня, який тепер працює на власній частоті асинхронно з обчислювальними ядрами. І хоча його частота близька до частоти основної частини процесора, асинхронність викликає збільшення латентності. Ніякої ж компенсації у вигляді збільшення пропускної здатності не було. Внутріпроцессорная кільцева шина в Haswell перенесена з Ivy Bridge без будь-яких змін, так що витягнути з L3-кеша більше 32 байт даних за такт неможливо при всьому бажанні.

Резюмуючи, відзначимо, що хоча Haswell по мікроархітектурі обчислювальних ядер і схожий на Ivy Bridge, поліпшення, здатні збільшити його швидкість роботи на звичайному коді, все-таки є. Фактично між усіма етапами конвеєра проведений серйозний ребаланс, який призвів до того, що, хоча швидкість вибірки і декодування інструкцій і залишилася практично тією ж, виконання цих інструкцій тепер може відбуватися відчутно швидше і з більшим ступенем паралелізму. Але чи позначиться це на реальній продуктивності Haswell, залежить від того, чи дійсно саме виконання, а не декодування було пляшковим горлечком в попередніх версіях мікроархітектури Core.

Інтегрована графіка: виходимо на рівень GeForce GT 650M

Проте, для того, щоб відчути зрослу міць Haswell з 100-відсотковою ймовірністю, зовсім не обов'язково переписувати під AVX2 наявні програми. Справа в тому, що в цьому процесорі є важлива частина, що займає приблизно 30 відсотків площі кристала, над якою інженери Intel попрацювали дуже ретельно. Це - інтегроване графічне ядро. З огляду на першочерговість мобільних застосувань своїх процесорів, Intel в останні кілька років проводить послідовні поліпшення вбудованої в них графіки і прагне до того, щоб її власний прискорювач виглядав не гірше рішень інших розробників, включаючи і тих, які графічними рішеннями займаються цілеспрямовано. В Ivy Bridge ми вже бачили майже двократне зростання графічної продуктивності в порівнянні з процесорами попереднього покоління, що стався одночасно з впровадженням підтримки всіх сучасних версій програмних інтерфейсів. Мікроархітектура Haswell обіцяє підняти швидкість роботи графічного ядра ще приблизно вдвічі.


Плани у розробників, як бачимо, були грандіозні, але при цьому, як і в обчислювальних ядрах, в даному випадку Intel змогла обійтися без внесення глибоких архітектурних змін. Структура графічного ядра залишилося старої, а зростання продуктивності забезпечується в чистому вигляді екстенсивними методами. Нову ж архітектуру відеоприскорювача Intel обіцяє лише в 2014 році - в наступному поколінні процесорів з кодовим ім'ям Broadwell. В результаті, як і обчислювальні ядра, графічне ядро \u200b\u200bHaswell навіває думки про те, що «так» і з нового процесора вийшов не надто правдоподібний. Втім, це не применшує досягнутого зростання швидкодії, який, безумовно, заслуговує на те, щоб познайомитися з його джерелами трохи докладніше. Тим більше що в новому поколінні Intel HD Graphics місце знайшли вельми цікаві інженерні рішення.


Якщо не брати до уваги окремих оптимізацій графічного конвеєра, спрямованих на перенесення частини навантаження з драйвера на апаратні блоки і на збільшення продуктивності більшості спеціалізованих функціональних блоків, що виконують в конвеєрі 3D-рендеринга підготовчі операції, нове графічне ядро \u200b\u200bсильно схоже на ядро \u200b\u200bз процесорів попереднього покоління з доданою підтримкою DirectX 11.1. Головна ж перевага нового дизайну - наявність істотно більшої кількості універсальних виконавчих пристроїв. Якщо максимальна версія графіки Ivy Bridge в своєму розпорядженні 16 виконавчими пристроями (що включають по 4 ALU кожне), то кількість виконавчих пристроїв в графічному ядрі Haswell може доходити до 40 штук.

Однак при цьому Intel вирішила провести більш явну сегментацію і на основі єдиного дизайну зробити кілька варіантів графіки: GT1, GT2, GT3 та GT3e. Базова версія - це GT2 з 20 виконавчими пристроями. Вона призначається для більшості десктопних моделей процесорів і пропонує на 4 пристрої більше, ніж старша графіка процесорів покоління Ivy Bridge. Однак її урізана версія, GT1, має лише 6 виконавчих пристроїв і мало відрізняється від графіки, вже присутньої в існуючих процесорах Pentium і Celeron. Максимальний же варіант, GT3, який має в своєму розпорядженні 40 виконавчими пристроями, являє собою GT2 з подвоєним виконавчим кластером. Така прокачаних версія відеоприскорювача націлюється на більшість мобільних варіантів Haswell, включаючи в першу чергу процесори для ультрабуків. Двох з половиною кратне збільшення кількості виконавчих пристроїв і має, за задумом розробників, забезпечити двократне зростання продуктивності графіки. Однак така продуктивна версія відеодвіжка, GT3, в настільні комп'ютери не потрапить. А це означає, що у деськтопной інтегрованої графіки Intel приріст продуктивності буде не разовий, а лише приблизно 30-відсотковий.


Цікаво, що насправді напівпровідниковий кристал Haswell буде мати на одне або два виконавчих пристрої більше, ніж передбачено дизайном. Додаткові пристрої грають роль запасних, вони потрібні для заміни неробочих блоків і для зниження кількості бракованих процесорів.

Збільшення потужності виконавчого кластера графічного ядра змусило розробників дизайну задуматися і про те, щоб вузьким місцем не став етап накладення текстур. Тому швидкість роботи текстурного блоку в Haswell була симетрично збільшена. Intel обіцяє чотириразовий зростання швидкості текстурирования в порівнянні з графікою Ivy Bridge, і це - цілком достатня посилення, якщо врахувати зростання потужності решти движка.

Втім, незважаючи на всі вжиті заходи, навіть продуктивність GT3 здалася Intel недостатньою, щоб залучити на бік власних інтегрованих ядер найвимогливіших користувачів. Тому для продуктивних ігрових мобільних систем Intel створила спеціалізовану заряджену модифікацію GT3e. У процесорах з таким ядром, які будуть утворювати окрему мобільну H-серію, вбудоване графічне ядро \u200b\u200bGT3 буде доповнюватися швидкої eDRAM-пам'яттю об'ємом 128 Мбайт і 512-бітної шиною. Ідея полягає в тому, що суттєві обмеження на швидкість вбудованих відеоядер накладає недостатня пропускна здатність системної пам'яті, яка в таких випадках грає також і роль відеопам'яті. eDRAM ж буде встановлюватися на одну підкладку з процесорним ядром і виконувати роль L4-кеша, забезпечуючи пропускну здатність близько 64 Гбайт / с. Однак ніякого спеціалізованого інтерфейсу між графічним ядром і eDRAM не передбачено, так що такий L4-кеш буде буферізіровать всі звернення в пам'ять, а не тільки ініційовані графічним ядром. Проте Intel очікує, що саме ця добавка зможе вивести Haswell по графічної продуктивності на один рівень з NVIDIA GeForce GT 650M.


Але слід розуміти, що додавання до процесорного кристалу додаткового кристала eDRAM помітно збільшує енергоспоживання і вартість процесора, тому CPU з GT3e передбачається використовувати виключно в високопродуктивних геймерських ноутбуках, де мова про економічність, компактність і бюджетности не йде. А значить, компанія AMD зі своїми APU покоління Richland поки що не відчувати особливого тиску з боку конкурента. І особливо це стосується деськтопной середовища: пропонувати широкий асортимент процесорів з продуктивними графічними ядрами для цього ринкового сегмента Intel не вважає за необхідне.

Втім, навіть користувачі настільних систем зможуть оцінити інші переваги графічного ядра нового покоління, наприклад розширені можливості по підключенню моніторів. У Haswell підтримується робота до трьох незалежних дисплеїв, причому всі три підключення можуть бути цифровими. Завдяки ж впровадження сумісності з останніми версіями інтерфейсів HDMI і DisplayPort, максимальні підтримувані дозволу досягли величин 4Kx2K.

Без поліпшень не залишилося і одне з улюблених дітищ Intel - вбудований в графічне ядро \u200b\u200bапаратний відеокодер Quick Sync. Розробники розглядають його як один із шляхів зниження енергоспоживання процесорів, так як Quick Sync дозволяє вивільняти обчислювальні ядра від енергоємних і вельми поширених завдань кодування і декодування відео, переносячи їх виконання на спеціалізований і економічний вузол. Тому в кожній новій версії процесорного дизайну продуктивність Quick Sync піднімається, а число підтримуваних цією технологією форматів росте. Так, Haswell на додаток до вже освоєних форматам буде здатний на апаратному рівні працювати з SVC (Scalable Video Coding - похідна AVC H.264), декодувати MJPEG (motion JPEG) і кодувати відео у форматі MPEG2. При цьому буде забезпечена повноцінна сумісність при кодуванні та декодуванні з відео в дозволі 4K (4096x2304, 4096x2160 і 3840x2160), яке в даний час набуває все більшої популярності.

Зросла і чиста продуктивність кодера Quick Sync. Причому тепер йому властива не тільки висока пропускна здатність, але і низька латентність, що відкриває апаратного кодування шлях в телеконференції. Швидкість же кодування в Haswell помітно вище, ніж у Ivy Bridge, однак в різних версіях графічного ядра вона різниться, причому в рази. Зате якість одержуваного при апаратному кодуванні відео покращився в будь-яких модифікаціях графіки. Оновлена \u200b\u200bтехнологія Quick Sync повинна давати кращу якість кодованого зображення, ніж Ivy Bridge, навіть при однаковому бітрейті.

висновок

Очевидно, нова мікроархітектура Haswell може вселяти як надії на світле майбутнє, так і розчарування рівнем досягнутого прогресу. Все залежить від того, на що ви розраховуєте. На жаль, интеловский схема «тік-так» незримо підштовхує до завищення очікувань, адже Haswell відноситься до циклу розробки «так», то є повинен сприйматися як нове покоління мікроархітектури. Але принципових і революційних поліпшень в ньому зроблено не так багато. Мова йде не про кардинальну переробці процесорного дизайну, а лише про деяке наборі поліпшень і удосконалень. Звичайно, поліпшень цих чимало, і можна навіть говорити про перехід кількості в якість. Але, як би там не було, Intel фактично форсувала наявну микроархитектуру Ivy Bridge, а не запропонувала щось принципово нове. Причому основний акцент при виконаної переробці робився не на пошуки шляхів збільшення обчислювальної продуктивності, а на поліпшення енергоефективності та розвиток графічних можливостей.

З точки ж зору традиційно процессорной парадигми мікроархітектура Haswell пропонує лише підтримку нового набору інструкцій AVX2, кращий паралелізм на рівні виконання інструкцій і зрослу пропускну здатність кеш-пам'яті першого і другого рівнів. Чи достатньо таких змін для того, щоб відповідати очікуванням прихильників класичних персональних комп'ютерів? Навряд чи. Тому більшість ентузіастів, побачивши лише незначний приріст обчислювального швидкодії, що лежить приблизно в рамках 5-15 відсотків, швидше за все, новими процесорами будуть незадоволені. І це означає, що ніякого сплеску інтересу до звичних десктопів і ноутбуків не передбачається і з виходом нового сімейства процесорів.

Але Intel, незважаючи на все це, може пишатися виконаною роботою. Поставлене перед собою завдання компанія вирішила. Дизайн Haswell вийшов настільки енергоефективним і збалансованим, що ці процесори, поза всякими сумнівами, зможуть зайняти гідне місце в ласому для виробника підвиді мобільних пристроїв - продуктивних планшетах і ноутбуках-трансформерів. Намічається на цьому ринку бум компанія тепер точно не прозевает: у відповідь на наміри когорти прихильників архітектури ARM, а також на нові APU компанії AMD у Intel тепер є хороша домашня заготовка. Адже мікроархітектура Haswell дозволяє створювати модифікації дизайну, які мають показниками енергоспоживання, що виражаються в однозначних числах, і представляють при цьому SoC-збірки, що включають не тільки процесор, але і набір системної логіки.

На цьому ми поки що не ставимо фінальну крапку. Даний матеріал лише відкриває цикл статей про процесори з новою мікроархітектури. У самий найближчий час ми зможемо більш детально і з реальними процесорами в руках познайомитися як з десктопними, так і з мобільними втіленнями мікроархітектури Haswell. І тоді, Можливо, наші висновки, зроблені лише на основі знайомства з документацією, дещо зміняться. І в це дійсно хочеться вірити ...

THE BELL

Є ті, хто прочитали цю новину раніше вас.
Підпишіться, щоб отримувати статті свіжими.
Email
ім'я
Прізвище
Як ви хочете читати The Bell
без спаму