Dzwon.

Są ci, którzy przeczytali tę wiadomość przed tobą.
Subskrybuj odbieranie artykułów świeżych.
E-mail
Nazwa
Nazwisko
Jak chcesz przeczytać dzwonek
Bez spamu

Rodzaj mikrochitechitechitektury procesora odtwarza jedną z kluczowych ról w wydajności laptopa lub komputera, ponieważ prędkość pobierania próbek i dekodowania danych wprowadzających procesor i instrukcje zależy od mikroarchitektury, a następnie ich wykonanie i rekord w pamięci RAM.

Porównanie mikroarchitektury procesora Haswell, Broadwell i Skylake z Intel

Na ten moment Microarchitets z trzech pokoleń z Intel są istotne i konkurują między sobą. Jest to czwarta generacji czwartej generacji HASWELL, piątej generacji Broadwell i najnowszej mikroarchitektury 6-pokolistych skylaczów. Jak wiadomo, podstawa tworzenia danych z mikroarchetet jest rozległą strategią o nazwie "Tik-tak". "Tik" oznacza tworzenie nowej generacji procesorów opartych na obniżonym procesie technologicznym. "Więc" oznacza również uwolnienie nowych mikroprocesorów, ale bez zmiany technologii tworzenia. Artykuł zostanie przeprowadzony przez ich analizę porównawczą i na jej podstawie zostanie zawarta o najbardziej produktywnym rdzeniu.

Haswell.

- Microarchitecture, opracowany w 2012 r. Na technologii 22 nm. Obsługuje gniazda: LGA 1150, BGA 1364, LGA 2011-3. Działa z barem DDR4 RAM. Opona: DMI2.

Plusy procesora z tym mikroarchitekturą:

1) energooszczędny

2) Obsługuje DDR4

3) niski koszt. Na przykład cena Intel Core I3 4160 z rdzeniem HASWELL wynosi 7 800 rubli.

1) Wykonane przez przestarzałą technologię 22 NM, w wyniku czego traci w wielu parametrach ulepszonej wersji Broadwell.

Broadwell.

- Wersja aktualizacji Haswell jest przeznaczona dla procesorów Xeon Intel, a także do siódmej generacji Intel Core I7. Wykonane w technologii 14 nm. Należy do oddziału misji marketingowej "Tik" "Tik-podobny". W porównaniu z HASWELL, istnieje 3-5% wydajność niż haswell, podczas gdy zużywa energię o 30%, istnieje również znacznie mniej rozpraszania ciepła w PC, 4,5 W przeciwko 15 Haswell. Wszystko to wyjaśniono, przede wszystkim zmniejszenie procesu technologicznego, na którym wyprodukowano jądro, możliwość podkręcenia procesora z tym mikroarchitektury, a także obecnością 4 pamięci podręcznej Crystalwell, co zapewnia wyższy kurs walutowy z pamięcią RAM niż tylko 3 pamięć podręczna.

Plusy jądra:

1) Wydajne zużycie energii

2) możliwość podkręcenia

3) Obsługa DirectX 12

4) Jest w tym mikroarchitektury, że pamięć podręczna L4 została dystrybuowana, która była używana tylko w rzadkiej liczbie mikroprocesorów haswell

5) Wyższa żywotność baterii niż HASWELL

1) Koszt (cena zmienia się w promieniu 13-150000, w zależności od modelu procesora, dla tej mikroarchitektury jest przeznaczony dla kamieni serii Xeon i Rdzeń I7 z Intel, podczas gdy mikroprocesor Haswell działa na kamieniach budżetowych)

2) Wskaźnik cen / jakości. W badaniach mikroarchitektura wykazała niskie wyniki, wyprzedzając około 3 procent, w tym znak 3D (Core I7-6850K na Broadwell-E: 19065 punktów, Core I7-5820 na Punkty Haswell-E-16598). Jeśli weźmiemy w stosunku do porównania mostu Ivy i Haswell, wówczas wynik nie jest imponujący.

Analiza porównawcza Performance Broadwell i Haswell

Skylake.

- Mikroarchitektura szóstej generacji, zaprojektowanej, podobnie jak Haswell, jest głównie dla energooszczędnych procesorów ULV. Został opracowany zgodnie z strategią "Tik-SO" i wpływa na oddział "tak". Oznacza to, że jądro powstało bez zmiany procesu technologicznego, ale z fundamentalną zmianą mikroarchitektury w stosunku do Broadwell.

Mikroprocesor działa na nowym wysokiej wydajności gniazda LGA 1151, obsługuje DDR4, a także w przeciwieństwie do LGA 1150, działa z USB 3.0, ma nowy, znacznie bardziej produktywny autobus DMI3 i większą efektywność energetyczną w porównaniu z jego poprzednikiem.

1) Obsługa nowego złącza LGA 1151, bardziej produktywna niż LGA 1150 - Gniazdo Broadwell

2) Obsługa USB 3.0

3) Zdolność do przetaktowywania GPU na nowym gnieździe

4) Obsługa DDR4 i optymalizacja pracy z tym deską RAM

5) Najlepsza efektywność energetyczna w stosunku do Broadwell

6) Jedną z głównych zalet jest wsparcie nowej opony DMI 3, która daje 2 razy więcej niż DMI 2, na których praca Broadwell i Haswell. Ta zaleta jest szczególnie zauważalna na przykładzie takiego programu jako Sony Vegas, gdzie wydajność Skylaczka jest powyżej prawie 1,5 razy.

7) Koszt (dla modele budżetowe Intel Core I3 Średnia cena wynosi 3000-7000 rubli)

Jeśli chodzi o Broadwell i Skylake Plusy tylko w porównaniu z Jeziorem Kaby z siódmej generacji - najnowszej mikroarchitektury, która jest wyposażona w niewielką liczbę procesorów, zapewnia wydajność poniżej.

Zreasumowanie:

Jeśli weźmiesz wszystkie wskaźniki, w tym koszty mikroarchetetów, a następnie ocena skompilowana przez autora będzie taka:

1 miejsce: Skylake

2 miejsce: Haswell (ta mikroarchitektura, jak pokazywały testy, chociaż jest starsza i mniej energooszczędna, ale pod względem wydajności opóźnienia za Broadwell o 2-3 procent, a jednocześnie niższy koszt)

3 miejsce: Broadwell

Wynik:

Pomimo różnych sztuczek marketingowych, które Intel przylega, nadal pokazuje pewny wynik i przynajmniej trochę, ale poprawia wydajność i szybkość procesorów z każdym pokoleniem. Więc, kto wie, może, do 2030 r. Zacznie produkować pierwszych procesorów kwantowych, które będą w milionie razy lepiej niż obecny, ale to kolejna historia.

Wprowadzenie Zostało to zrobione, że każdy rok Intel aktualizuje mikroarchitekturę swoich procesorów mających na celu wykorzystanie wspólnych komputerów osobistych. Ten harmonogram już stał się tak zwyczajny, który jest postrzegany jako coś udzielonego. Sandy Bridge został wydany na początku 2011 r., Most IVU pojawił się w kwietniu 2012 r., A obecnie odpowiedni Haswell był reprezentowany 4 czerwca ubiegłego roku. Biorąc pod uwagę aktualną procedurę, rynek już czeka na procesory nowej generacji - Broadwell. Jednak wszystko nie było z nimi bardzo dobre. Wprowadzenie nowego procesu technicznego 14-nm, który Intel musi użyć do produkcji Broadwell, natknął się na złożoność natury produkcyjnej. W związku z tym, pierwotny plan, który zakładał, że pojawienie się nowej generacji projektowania procesora w środku tego roku, musiał zostać zmieniony. Zgodnie z bieżącymi danymi, ogłoszenie o mobilnej energetycznej wariantach Broadwell wystąpi w przeddzień nowego roku i procesorów opartych na tym projekcie dla masowego pulpitu i komputery mobilne Stanie się dostępny tylko w przyszłym roku.

W obecnej sytuacji Intel postanowił jakoś rozjaśnić nieplanowane przewlekłe oczekiwania nowych produktów i wymyślił akcję, która odebrała nazwę kodu HASWELL. Jego istotą jest to, że zamiast wydania nowych procesorów Broadwell firma oferuje zaawansowane modele starszych, których wydajność nie jest ulepszona przez nową mikroarchitekturę, ale zwiększone częstotliwości zegara. Oficjalne ogłoszenie procesora, która jest częścią wielu odświeżania, została zaplanowana na 11 maja, a już miał już miejsce. 42 Nowe pozycje pojawiły się na Cennikowi Intel, z których 24 są skierowane do systemów stacjonarnych różnych klas. W tej recenzji będziemy zapoznać się z tymi z zaktualizowanych Haswell, które są przeznaczone do zwykłych komputerów stacjonarnych i należą do rdzenia I7, rdzeń I5 i Core I3 rodziny.

Przeczytaj więcej o Haswell Odśwież na pulpit

Tak więc, mówiąc o Haswell Odśwież, Intel faktycznie oznacza prosty wzrost częstotliwości procesorów rodziny LGA 1150 Haswell. W wyjściu z takich zaktualizowanych wyrobów nie ma nic niezwykłego - firma stopniowo zwiększa częstotliwość swoich procesorów między komunikatami nowych mikroarchitektur przed, po prostu przed tym, że takie wydarzenia były rozproszone i nie zwracali tak wiele uwagi. Charakterystyczną cechą odświeżania HASWELL jest taki, że wzrost częstotliwości występuje nie z indywidualnych modeli, a całej linii całej linii, od dołu.

Co więcej, tak wiele uwagi odświeżania jest wypłacana nie ze względu na ich nowość lub zauważalny wzrost wydajności. All Hype - Sztuczne, specjalnie generuje sam Intel, próbując stworzyć wrażenie nieustannego innowacji, nawet pomimo przeniesienia ogłoszenia Broadwell w późniejszym terminie. Innymi słowy, wydanie Haswell Odświeża jest całkowicie zwykłą aktualizację, a świeże procesory różnią się od starych obecnych na rynku przez prawie rok HASWELL, tylko wzrosły o śmiesznej częstotliwości 100 MHz. Oznacza to, że mówimy o drobnym wzroście wydajności, co stanowi około 2-3 procent i nic więcej.

Na szczęście na ten mały wzrost prędkości, kupujący nie powinni niczego płacić. Nowy Haswell Odświeżający procesory zajmowały stare pozycje w cenniku, przewyższanie próbki zeszłego roku. Jeśli porozmawiamy konkretnie o propozycjach komputerów stacjonarnych, to co się dzieje, co się dzieje, jest następujący:

Należy podkreślić, że wzrost częstotliwości zegara występuje w ramach wcześniej zainstalowanych pakietów termicznych: 84 W dla Core I7 i Core I5 \u200b\u200bi 54 W - dla Core I3. Jednak w tym samym czasie, Haswell Odśwież opiera się na dokładnie tych samych kryształach półprzewodnikowych, jak poprzednio stosowane. Poprawa potencjału częstotliwości zapewnia wyłącznie dzięki poprawie procesu technologicznego Intelsky 22-NM, audyt jądra w nowościach nie zmienia się i zachowuje numer C0. Oznacza to, że nie należy oczekiwać, że fundamentalne ulepszenia w cechach termicznych i elektrycznych, jak w innych niuansach nowych procesorów nie należy oczekiwać.



Haswell Refreshes Processors do systemów pulpitu


Absolutnie jak poprzedniki wyglądają haswell odświeżania procesorów i zewnętrznie.



W lewo - Normal Haswell, Right - Haswell Odśwież


Jedynym związanym z wydaniem odświeżania Haswell jest interesującą i zasadniczo ważną zmianą wpływa na procesory overclocker serii K, pełne informacje, na których nie jest jeszcze ze względu na fakt, że zostaną przedstawione nieco później, prawdopodobnie w dniu 2 czerwca. Podczas gdy Intel będzie nadal oferować stary rdzeń I7-4770K i Core I5-4670K dla Overclockers, ale te procesory, które zastąpi im zasługują na osobną historię.

Faktem jest, że w odmianach HASWELL odświeżają się z wolnymi czynnikami, które mają własną nazwę zbiorowej kodu Devil's Canyon, zobaczymy nie tylko zwiększone częstotliwości paszportowe. Intel sprawi, że procesory będą bardziej atrakcyjne dla podkręcania, dla których planuje poważne zmiany w ich opakowaniu. Materiał przewodzący ciepło umieszczony pomiędzy kryształu procesora a dystrybutorem osłuba zostanie zastąpiony przez bardziej wydajny, a sama pokrywa zostanie wykonana z innego stopu o lepszej przewodności termicznej. Według wstępnych danych, rodzina kanionu diabła będzie składać się z dwóch odblokowanych procesorów LGA 1150: Core I7-4790K i Core I5-4690K. Ponadto zostaną wyższe niż zwykłe odświeżanie Haswell, pakiet termiczny i zauważalnie zwiększone częstotliwości zegara nawet w trybie nominalnym.

Niestety, jest to wciąż wszystko, co znane jest o diabelskim kanionie, ale kiedy próbki tych procesorów pojawiają się w naszym laboratorium, z pewnością podzielamy kompleksowe informacje o nich w naszych opinie. Dziś porozmawiamy tylko o zwykłym pulpicie Haswell odświeżanie za pomocą standardowego poziomu uwalniania ciepła, które już można kupić w sklepach.

W serii Core I7 nowość jest tylko jedna:


Core I7-4790 zwiększa częstotliwość zegara starszej linii procesorów dla platformy LGA 1150 o 100 MHz, a tym samym przetaktowywanie rdzenia I7-4770K i zwykłego rdzenia I7-4771. W przeciwnym razie jest to typowy rdzeń I7 Generation Haswell: Ma cztery rdzenie, obsługuje hiper-gwintowanie, ma przestronną pamięć podręczną trzeciego poziomu z objętością 8 MB. Rdzeń graficzny, podobnie jak poprzedniki, należy do klasy GT2, to znaczy, istnieje 20 urządzeń uruchamiających. Należy zauważyć, że dzięki technologii Turbo Boost 2.0, typowa częstotliwość pracy dla rdzenia I7-4790 wynosi 3,8 GHz.



Core I7-4790.


Kompletny zestaw technologii bezpieczeństwa, w tym VPRO, TXT i VT-D, ten procesor jest również obsługiwany w całości. Innymi słowy, Core I7-4790 jest nowym sztandarem dla platformy LGA 1150, ale bez podkręcania.

Seria rdzeniowa i5 pojawiła się trzy nowe procesory odświeżające Haswell:



W tych procesorach częstotliwość w porównaniu z poprzednikami wzrosła tylko o 100 MHz. Ale wystarczyło to, aby zapewnić, że starszy rdzeń I5-4690 staje się szybszym rdzeniem i5-4670K i przechwycone przywództwo w tym składzie. Pozostałe przetwórcy są organicznie uwzględniane w wolnych szczelinach częstotliwości. Inne ich cechy się nie zmieniły. Hyper-gwinting w serii rdzenia I5 nie jest obsługiwany, pamięć podręczna L3 jest zmniejszona do 6 MB Rdzeń Graphics - GT2.



Core I5-4690.



Core I5-4590.



Core I5-4460.


Rdzeń procesora górniczego I5-4460 zajmuje specjalne miejsce w serii: wyłączone technologie VPRO i TXT i instrukcje pracy z pamięcią transakcyjną nie są obsługiwane. Turbo Boost 2.0 Technologia tworzy typowej częstotliwości roboczej dla rdzenia I5-4690 - 3,7 GHz, dla rdzenia I5-4590 - 3,5 GHz i dla rdzenia I5-4460 - 3,2 GHz.

Seria rdzenia I3 z odświeżaniem Haswell wzrosła o trzy więcej modyfikacji:



Wystąpił również 100 megahertz zwiększyć częstotliwości zegara przy zachowaniu wszystkich innych cech. Rdzeń I3 procesory, w przeciwieństwie do starszych modeli, podwójnego rdzenia, ale wspierają wirtualną technologię hiper-gwintowania wirtualnej. Z tego powodu mają mniej obliczonej generacji ciepła w 54, a nie 84 W. Należy zauważyć, że w linii podstawowej I3 w momencie ogłoszenia o odświeżeniu HASWELL nie miał już wolnych szczelin częstotliwości, dlatego wychodził, że rdzeń model I3-4350 całkowicie zbiegła się zgodnie z cechami z rdzeniem I3-4340. Jedyną różnicą nowej modyfikacji jest więcej niska cena.



Core I3-4360.



Core I3-4350.



Core I3-4150.


W procesorach rdzenia I3-4360 i Core I3-4350, rozmiar pamięci podręcznej trzeciego poziomu wynosi 4 MB, a rdzeń pamięci podręcznej I3-4150 redukuje do 3 MB. Gorzej w młodszym modelu i rdzeniu graficznym. Chociaż formalnie wszystkie rdzeń I3 jest wyposażone w grafikę GT2, w rdzeniu I3-4150 liczba urządzeń Executive GPU zmniejsza się z 20 do 16.

Wszelkie LGA 1150 Haswell Odświeżaj procesory Nie dodatkowe warunki Nie narzucaj płyt głównych. Pomimo faktu, że ich wygląd jest czasowy i aktualizuje platformę z jej tłumaczeniem na nowe zestawy logiki dziewiątej serii (Z97 i H97), wszystkie nowe prace procesowe bez problemów w starym LGA 1150 rodziców z chipsetami ósmej serii. W przypadku ich prawidłowej definicji płatności zwolniony w ubiegłym roku wymagana jest tylko aktualizacja BIOS.

Jeśli chodzi o możliwości przyspieszenia, odświeżanie, kto ma do tej pory, nie jest w ogóle wolumin. Zwiększenie częstotliwości powyżej nominalnej zmiany mnożnika jest niemożliwe, podkręcanie jest bardzo ograniczone za pomocą opony. W rzeczywistości limit, do którego można rozproszyć generator zegara podstawowego wynosi około 105-110 MHz. Oznacza to, że nabywanie Haswell odświeżania w celu prowadzenia ich w nienormalnych trybach każdego punktu jest pozbawiony. Jednak przyspieszenie pamięci z procesorami bez błędów DDR3-2400 dla platformy LGA 1150 nadal pozwalają.

Jak przetestowaliśmy

Nowe procesory związane z zestawem odświeżania Haswell, w porównaniu z ich poprzednikami, zwykłym haswell, które były dostępne przez prawie rok. W rezultacie lista składników sprzętowych związanych z testami jest następująca:

Procesory:

Intel Core I7-4790 (Haswell, 4 Cores + HT, 3,6-4,0 GHz, 4x256 KB L2, 8 MB L3);
Intel Core I7-4770K (Haswell, 4 Corres + HT, 3,5-3,9 GHz, 4x256 KB L2, 8 MB L3);
Intel Core I5-4690 (Haswell, 4 jądra, 3,5-3,9 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4670K (Haswell, 4 rdzenie, 3,4-3,8 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4590 (Haswell, 4 rdzenie, 3,3-3,7 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4570 (Haswell, 4 jądra, 3,2-3,6 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4460 (Haswell, 4 rdzenie, 3,2-3,4 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I5-4440 (Haswell, 4 jądra, 3,1-3,3 GHz, 4x256 KB L2, 6 MB L3);
Intel Core I3-4360 (Haswell, 2 jądra + HT, 3,7 GHz, 2x256 KB L2, 4 MB L3);
Intel Core I3-4350 (Haswell, 2 Cores + HT, 3,6 GHz, 2x256 KB L2, 4 MB L3);
Intel Core I3-4340 (Haswell, 2 jądra + HT, 3,6 GHz, 2x256 KB L2, 4 MB L3);
Intel Core I3-4150 (Haswell, 2 Cores + HT, 3,5 GHz, 2x256 KB L2, 3 MB L3);
Intel Core I3-4130 (Haswell, 2 jądra + HT, 3,4 GHz, 2x256 KB L2, 3 MB L3).

Chłodnica procesora: NOCTUA NH-U14S.
Płyta główna: GIGABYTE Z87X-UD3H (LGA1150, Intel Z87 Express).
Pamięć: 2x8 GB DDR3-2133 SDRAM, 9-11-11-31 (G.skill F3-2133C9D-16GTX).
Karta wideo: NVIDIA GEFORCE GTX 780 TI (3 GB / 384 bit GDDR5, 876-928 / 7000 MHz).
Podsystem dysku: Intel SSD 520 240 GB (SSDSC2CW240A3K5).
Zasilanie: Corsair AX760i (80 plus Platinum, 760 W).

Testowanie przeprowadzono w systemie operacyjnym Microsoft Windows 8 Enterprise X64 przy użyciu następnego zestawu sterowników:

Intel Chipset Driver 10.0.13;
Intel Management Silver Driver 10.0.0.1204;
Technologia Intel Rapid Storage 13.0.3.1001;
Kierowca NVIDIA GeForce 335.23.

Występ

Całkowita wydajność

Aby oszacować wydajność procesorów we wspólnych zadaniach, tradycyjnie korzystamy z pakietu testowego BAPCO Sysmark, który symuluje pracę użytkownika w prawdziwych wspólnych nowoczesnych programach biurowych i aplikacjach do tworzenia i przetwarzania treści cyfrowych. Pomysł testowy jest bardzo prosty: daje jedyną metrykę charakteryzującą średnią średnią prędkość komputera podczas codziennego użytku. Ostatnio ten benchmark ponownie został zaktualizowany, a teraz używamy najbardziej ostatnia wersja - Sysmark 2014.



Wyniki wyświetlane na diagramie są dość oczekiwane. Biorąc pod uwagę, że w procesorach HASWELL odświeżający nie ma ulepszeń i optymalizacji na poziomie mikroarchitektury, wszystko rozwiązuje częstotliwość zegara. A ponieważ w nowym procesorze, wzrosła tylko w 100 MHz, różnice w wynikach występów starego haswella i przedstawicieli zestawu odświeżania Haswell, które przychodzą do zmiany, średnio 2,5 procent. Dokładniej: Core I7-4790 Overtakes Core I7-4771 (jest to rdzeń I7-4770K) o 1,8 procent; Core I5-4690 przekracza rdzeń I5-4670 o 2,3%; Core I5-4590 wyprzedza rdzeń I5-4570 o 2,3 procent, rdzeń I5-4460 szybciej rdzeń I5-4440 o 2,7%, Core I3-4360 przekracza rdzeń I3-4340 o 3,1 procent, a rdzeń I3-4150 Obsole Core I3- 4130 o 2,3 procent.

Głębsze zrozumienie wyników Sysmark 2014 jest w stanie przedstawić znajomość z produktywności szacunków uzyskanych w różnych scenariuszach używania systemu. Modele scenariusza produktywności biura typowe praca w biurze: Przygotowanie tekstów, przetwarzania arkuszy kalkulacyjnych, pracy e-mail i odwiedzanie stron internetowych. Skrypt użyje następującego zestawu aplikacji: Adobe Acrobat Xi Pro, Google Chrome. 32, Microsoft Excel. 2013, Microsoft OneNote 2013, Microsoft Outlook 2013, Microsoft PowerPoint. 2013, Microsoft Word 2013, WinZip Pro 17.5 Pro.



W scenariuszu tworzenia multimediów stworzenie komercyjnej przy użyciu wstępnie filtrowanych obrazów cyfrowych i wideo. W tym celu stosowane są dodatkowe pakiety Adobe Photoshop CS6, Adobe Premiere Pro CS6 i Trimble Scalecup Pro 2013.



Scenariusz analizy danych / finansowych poświęcony jest do analizy statystycznej i prognozowania inwestycji opartej na pewnym modelu finansowym. Skrypt wykorzystuje duże objętości danych numerycznych i dwóch aplikacji Microsoft Excel 2013 i WinZip Pro 17.5 Pro 17.5 Pro.




Wydajność gry

Jak wiesz, wydajność platform wyposażonych w wydajnych procesorów w przytłaczającej większości nowoczesnych gier jest określana przez pojemność podsystemu graficznego. Dlatego podczas testowania procesorów wybieramy większość gra zależna od procesora, a my wykonujemy pomiar liczby ramek dwa razy. Pierwsze testy przechodzące są przeprowadzane bez włączenia wygładzania i instalacji daleko od najbardziej wysokie uprawnienia. Takie ustawienia pozwalają nam ocenić, jak dobrze przetwarza się procesory z obciążeniem do gier, co oznacza, że \u200b\u200bumożliwia zbudowanie domysłów dotyczących sposobu, w jaki testowane platformy obliczeniowe będą zachowywać w przyszłości, gdy na rynku pojawią się szybsze opcje akceleratorów graficznych. Drugie przejście jest wykonywane z realistycznymi instalacjami - po wybraniu zgody FullHD i maksymalny poziom wygładzania na ekranie. Naszym zdaniem takie wyniki nie są mniej interesujące, ponieważ reagują na często zadawane pytanie, o jakim poziomie wydajności gry mogą zapewnić procesorom teraz - w nowoczesnych warunkach.





















Nie załadowaliśmy przeglądu z dużą liczbą testów gier, ponieważ zyski wykonania, które zapewniają procesory rodzinne Haswell, nie jest zbyt zauważalne. Jednak w podanych wykresach można zaznaczyć kilka różnych opcji, w jaki sposób jest wydajność gry.

Więc, Batman: Arkham Origin - gra, w której wykonanie wszelkich procesorów Intel okazuje się wystarczająco, aby w pełni załadować flagową grafikę mapa NVIDIA. GeForce GTX 780 TI. W rezultacie widzimy niezwykle niewielki wpływ wyboru procesora na wynik, a nowe odświeżanie Haswell nie wyróżnia się na tle poprzedników.

Cywilizacja V: Brave New World - gra strategiczna, w której aktywne obliczenia są wykonywane na procesorze, jednakże, a tutaj zbyt potężne procesory nie są na nic. Począwszy od rdzenia i5-4570 i wyższego wzrostu zwiększa się niemal niezauważalny. Jednak poniżej tej osobliwej granicy zaletą HASWELL odświeżania nad równoważnymi poprzednikami znajduje się w regionie 3 procent.

Metro: Ostatnie światło jest bardzo zależnym od procesora strzelanki, ale przy maksymalnych ustawieniach jakości (przede wszystkim z powodu TESSELLACJI), szybkość klatek nadal spoczywa na mocy karty graficznej. Ale ze spadkiem rezolucji można zobaczyć mały efekt zwiększania częstotliwości w odświeżonym odświeżaniu odświeżania. Jego skala jest standardowa - około 2 procent.

W złodzieja wszystko wygląda jeszcze bardziej interesujące. Jest to jedna z niewielu gier, które negatywnie związane z technologią hiper-gwintowanie w procesorach czterordzeniowych. Jest zoptymalizowany pod czterema strumieniami, a dodatkowe wirtualne jądra w Core I7 zmniejszają tylko wydajność. Jeśli porozmawiamy o efekcie, który daje Haswell, abyś mógł odświeżyć, jest ponownie nieznaczny: nie więcej niż 3 procent przy zmniejszonej rozdzielczości i nie więcej niż 1 procent przy maksymalnych ustawieniach graficznych.

Testy w aplikacjach

W Autodesk 3DS max 2014, mierzymy szybkość renderowania psychiczny Promień. Specjalnie przygotowana kompleksowa scena.



Wydajność w nowym Adobe Premiere Pro CC jest testowana przez pomiar czasu renderowania w formacie projektu Blu-ray H.264 zawierający sekwencję wideo HDV 1080P25 z nałożeniem różnych efektów.



Wydajność pomiaru w nowym Adobe Photoshop CC, przeprowadzamy własny test, który jest kreatywnym recyklingiem retuszu Photoshop Test prędkości Photoshop, który obejmuje typowe przetwarzanie czterech 24 obrazów megapikseli wykonanych przez aparat cyfrowy.



Aby zmierzyć szybkość procesorów, podczas kompresji informacji, używamy archiwizacji WinRAR 5.0, z którym z maksymalnym stopniem kompresji, archiwizuj folder z różnymi plikami o całkowitej objętości 1,7 GB.



Aby oszacować prędkość rewilowania wideo do formatu H.264, używany test X264 FHD Benchmark 1.0.1 (64bit), na podstawie pomiaru czasu kodowania koderów X264 Source wideo w formacie MPEG-4 / AVC za zgodą [Chroniony e-mail] i ustawienia domyślne. Należy zauważyć, że wyniki tego benchmarku mają duże znaczenie praktyczne, ponieważ kod X264 leży u podstaw licznych popularnych mediów recodingowych, takich jak Handbrake, Megui, Virtualdub i tak dalej. Okresowo aktualizujemy enkoder używany do pomiaru wydajności, aw tym testach wzięło udział w wersji R2431, która implementuje wsparcie dla wszystkich nowoczesnych zestawów instrukcji, w tym AVX2.



Brak aplikacji umożliwiają identyfikację zauważalnych zalet procesorów Haswell Rafresh nad ich poprzednikami. Jest dość naturalny. Jedyną zmianą nowego procesora jest zwiększoną częstotliwością. Więc zauważalna prędkość prędkości po prostu nie ma nigdzie. Wyniki nowego rdzenia I7-4790, Core I5-4690, Core I5-4590, Core I5-4460, Core I5-4460, Rdzeń I3-4350, Rdzeń I3-4350 i Core I3-4150 są lepsze niż długie na rynku propozycji tej samej klasy i że koszt maksymalnie 3 procent.

Zużycie energii

Zmiany wydajności, prezentowane odświeżanie haswell, całkowicie nie są imponujące. Brak innych ulepszeń w nowych modyfikacjach procesorów, na podstawie faktu, że są one oparte na krysztale półprzewodnikowym starej rewizji, nie powinno być. Niemniej jednak pozostaje trochę nadziei na pewne ulepszenia w cechach termicznych i energetycznych, które mogą wystąpić kosztem procesu technologicznego produkcji. Czek.

Następujące wykresy, o ile nie określono specjalnie oddzielnie, zużycie systemu (bez monitora) jest dostarczane, mierzone na wyjściu z wylotu, w którym podłączony jest jednostka zasilania, i reprezentuje ilość zużycia energii wszystkich składników zaangażowanych w system . W sumie wydajność samego zasilania jest automatycznie zawarte w całkowitym wskaźniku, ale biorąc pod uwagę, że model BP używany przez nas, Corsair Ax760i, ma certyfikat 80-plus, jego wpływ musi być minimalny. Aby poprawić ocenę zużycia energii, aktywowaliśmy tryb turbo i wszystkie istniejące technologie energooszczędne: C1E, C6 i Enhanced Intel Speedstep.

Przede wszystkim mierzono konsumpcję w stanie bezczynności.



Tutaj wszystkie procesory wykazały rzadkie jednomyślność. Jest jasne: w prostym HASWELL, idą w stanach energooszczędnych i zmniejszają zużycie energii do prawie zerowych wartości. Dlatego te liczby pokazane na diagramie są bardziej scharakteryzowane przez zużycie reszty platformy testowej.

Następnie mierzyliśmy maksymalne zużycie z obciążeniem utworzonym przez 64-bitową wersję narzędzia LINX 0.6.5 z obsługą zestawu instrukcji AVX2 na podstawie pakietu LinPack.



Prezentowany diagram bardzo wyraźnie pokazuje brak wszelkich ulepszeń zużycia energii z procesorów odświeżania Haswell. Nowe i szybsze modele wymagają energii elektrycznej więcej niż ich poprzedników. W tym samym czasie 100 Meghertz przyspieszenia prowadzone w nowych modyfikacjach procesora wynosi około 5 procent wzrostu zużycia energii. Zauważ, że pomimo tego Intel nie znalazł konieczności zwiększenia granicy opakowania termicznego dla HASWELL. Innymi słowy, rozpraszanie ciepła dowolnego rdzenia I7 i Core I5 \u200b\u200bpowinno pasować do struktury 84-Wat, a Core I3 wynosi w 54-Wat.

Biorąc pod uwagę, że zużycie energii zainicjowanej przez pakiet LinPack LINX, znacznie przekracza średni realistyczny poziom, mierzyliśmy zużycie i z bardziej "lądowaną" obciążeniem - recoding wideo za pomocą 64-bitowej wersji wersji X264 R2431.



Ogólnie rzecz biorąc, obraz tutaj jest dokładnie taki sam jak z obciążeniem utworzonym przez LINX. Prawie absolutne wartości zużycia energii. Niemniej jednak procesory Haswell odświeżają konsumować więcej swoich poprzedników tej samej klasy na tym samym 5 procent. Wszystko to oznacza tylko jedną rzecz: brak ulepszeń w konsumpcji nowych modeli Haswell nie jest wykonywane.

Nie ma wyraźnych zmian w trybie temperatury nowych produktów. Oczywiście, w zwykłym odświeżaniu materiału przewodzącego termicznego pod osądzie pozostał taki sam nieudany jak poprzednio. Temperatura jądra w występowaniu obciążenia w nowych procesorach wzrasta prawie natychmiast i utrzymuje na wysokim poziomie, nawet jeśli w systemie jest zainstalowany skuteczny chłodnicy. Na przykład w naszym przypadku, przy użyciu chłodnicy NOCTUA NH-U14S, najstarszy odświeżanie Haswell, Rdzeń I7-4790 podczas operacji narzędzia LINX bardzo szybko ogrzano do 84 stopni. I to jest bez żadnego przyspieszenia w trybie nominalnym!



Przypomnijmy, temperatura graniczna, w której procesory rodziny Haswell obejmują Trottling, - 100 stopni.

wnioski

Podsumowując, jesteśmy zmuszeni stwierdzić, że głośna nazwa Haswell odświeżała odebrana całkowicie zwykli procesory, które ich zjazd nie przynosi prawie nic nowego. Dla ich intel Release. Nie dokonałem żadnej pracy inżynieryjnej. Dlatego cechy konsumentów świeżych procesorów dla platformy LGA 1150 są praktycznie żadnej różnicy od tego, co zostało wcześniej zadane. Liczba rdzeni, ilość pamięci podręcznej, rodzaj zintegrowanego rdzenia graficznego, zestaw obsługiwanych technologii - wszystko pozostaje niezmienione. Na poziomie kryształu półprzewodnikowego nie zostały wykonane na poziomie kryształu półprzewodnikowego, dlatego rozpraszanie ciepła i zużycie energii odświeżenia Haswell pozostaje typowe dla poziomu HASWELL.

Jedynym, w którym widać przynajmniej jakiś ruch do przodu są częstotliwościami zegara. Biorąc jednak pod uwagę, że wzrost częstotliwości nie jest wspierany przez jakiekolwiek ulepszenia technologiczne lub inżynieryjne, ale jest tylko prostym przetaktowaniem starych modeli, ich wzrost był bardzo słaby. W rzeczywistości w ramach Haswell odświeżają Intel, zwiększył szybkość procesorów do minimalnego możliwego delty - na 100 MHz. W związku z tym, dokładnie taki sam, minimalny, wzrost wydajności widzieliśmy w procesie testowania. Nowy procesory Haswell odświeżające okazały się szybsze niż stare haswell przez 2-3 procent i nie więcej.

Wszystko to oznacza, że \u200b\u200bwydanie Haswell Odświeżanie może być interesujące tylko wtedy, gdy nie wyemigrowałeś do platformy LGA 1150. Biorąc pod uwagę, że koszt nowych modeli nie jest wyższy niż starszy, przy zakupie nowego komputera, jest teraz całkiem naturalny Zapytać w sklepach nowe modyfikacje procesorów. A jeśli twój ulubiony dostawca haswell odśwież się na cenniku nie jest jeszcze dostępny, lepiej jest zapłacić trochę przy zakupie, ale później zdobądź trochę więcej wysoka wydajność Za te same pieniądze.

Ponadto nie zapominaj o tym po około trzech tygodniach, nadal istnieje para procesorów, formalnie związana z liczbą zaktualizowanej Haswell, Core I7-4790K i Core I5-4690K. Te procesy posiadające własną nazwę kodu Devil's Canyon, w przeciwieństwie do omawianych obecnie modeli, obiecuję stać się doskonałym prezentem dla entuzjastów. Pojawi się w nich i zauważalnie lepsze częstotliwości zegara i zmniejszone temperatury robocze, a najlepsze podkręcanie. Ale nie będziemy prowadzić do przodu: pełny przegląd rdzenia I7-4790K i Core I5-4690K możesz przeczytać w naszej stronie jeszcze później.

Pro Posty Bridge zatrzymał się przed przystankiem Piaszczystego Bridge i tłumaczenie go na nowy proces techniczny w ubiegłym roku, Intel przyszedł do następnego kroku TCK, przepisany kilka lat wcześniej.

"Zaznacz - więc" Intel nie zawsze jest bombą, ale zdecydowanie symbolem postępu technologicznego

Na krokach "Tock", jak stosuje się z ilustracji, musisz wprowadzić nową architekturę. Co zostało zrobione - świat widział mikroarchitekturę pod nazwą kodu Haswell i 14 modeli procesorów Rdzeń I5 i I7 w złączu LGA 1150 (znany również jako gniazdo H3), z których osiem "zwykłych" i sześć niskiej mocy. Ogólnie rzecz biorąc, motyw zużycia energii (lub, jeśli ktoś jest dokładny, "zużycie energii odpowiednie do bieżącej mocy obliczeniowej") przechodzi z czerwoną nitką przez Mikroarchitekturę Haswell, ponieważ Intel widzi dużą przyszłość dla jego stworzenia w segmencie mobilnym , a bez procesora lub SOC z umiarkowanymi apetytami nie ma nic. Głównym konkurentem, oceniając przez porównania w otwartych źródłach, Intel uważa rzemiosło na procesorach ramienia, ponieważ już podjęto root w segmencie mobilnym i pokazywały tam ich witalność.

Sieć Intela wykonała już dużo mocy. Ruiting początkową kontrolę TDP tylko przy użyciu napięcia zasilania procesora dostarczanego z konwertera płyty głównej i konwertera częstotliwości rdzenia, Intel przesunął część konwerterów w procesorze, odkrywając tym samym możliwość bardziej dokładniej (a zatem efektywnie) napięcie dawkowania na każdym z nich Inne bloki znajdujące się na krysztale. W tym czasie procesor przestał już być tylko procesorem w początkowym zrozumieniu tego słowa i zawierał kontroler pamięci i inne części mostu północnego (NB), które jednocześnie znacznie uprościł okablowanie płyt głównych i zmniejszyć Zużycie energii pakietu CPU + NB.

Pracując z odżywianiem przeprowadzono również w kierunku racjonalnego użytku, gdy funkcjonował określony blok (odczytywany energię elektryczną) tylko w odpowiednich momentach, a w okresach bezczynności czasu energia nie została wydana. Jednym z owoców pracy w tym kierunku była wygląd w systemach Intel wraz z państwami S0 S0IX, co znacznie zmniejszyło zużycie mocy procesora w momentach bezczynności do stanu "SYSTEM" (stan S3, Laptop przechodzi do niej po slamowaniu ekranu w stanie roboczym). W rzeczywistości system może spać absolutnie przejrzysty dla użytkownika, ponieważ przejście do S0iH wynosi 450 mikrosekund, a przebudzenie wynosi odpowiednio 3,2 milisekund (0,00045 s i 0,0032). Aby zapisać ekran w stanie aktywnym, technologii PSR (panel samoreświatowy) jest opracowywana technologia, która oznacza obecność bufora przechowywania kilku ostatnich ramek. Pozwala to zmniejszyć obciążenie procesora graficznego, zwłaszcza w rzadszej aktualizacji informacji na ekranie (na przykład podczas czytania tekstu), co z kolei umożliwia zmniejszenie zużycia mocy procesora graficznego.

Nowy procesor Intel może znacznie zaoszczędzić energię lepszą niż poprzedniki.

To prawda, że \u200b\u200bwymaga to wsparcia sprzętowego z monitora, dzięki czemu ta metoda oszczędzania energii można znaleźć w segmencie mobilnym, gdzie "Monitor" i "Część obliczeniowa" to jedno urządzenie. Ale na demonstrację rozwoju Intel, przykład jest bardzo odpowiedni, zwłaszcza że znaleźli wdrażanie procesorów w architekturze HASWELL. W ten sposób jednostka PCU (jednostka sterująca energią) w HASWELL może bardzo skutecznie wykorzystać energię ze względu na wiele "trybów pracy", w każdym z których aktywnie aktywne są tylko niezbędne bloki. To, zgodnie z Intel, umożliwiło zmniejszenie zużycia energii w prosty okres prawie pięć razy w porównaniu z przeszłością (trzecią) wytwarzaniem procesorów, przełączanie między "trybami" jest przyspieszany przez kwartał, który umożliwia bardziej aktywnie zarządzać Pobór mocy jądra i "zasypiony" nawet w przypadkach, że ostatnie pokolenie były nieodpowiednie ze względu na długą procedurę włączenia. Tutaj jądro kilku milisekund "cytowanych", zapisz akcje Milvatt, "Jeep Up" ... i zapisane waty są rekrutowane.

Wewnętrzna architektura procesora była również poważnie poprawiona, choć na całym świecie nie zmieniła się. Intel nadal miesza i modyfikuje architekturę, która używana w Conroe. To prawda, że \u200b\u200bróżnice między mostem Ivy i Haswell są znacznie więcej niż między mostem piaszczystym a mostem bluszczu. Ten ostatni, w mojej skromnej opinii, był ogólnie restauracyjny dla piaszczystych; Zgodnie z istotnymi zmianami możliwe jest zauważenie tylko przejścia z 32 nm na 22 procesor techniczny NM.

Intel Haswell Architecture jako schemat

W jednostce procesora HASWELL zachowano przenośnik 14-19 stopniowy, a pamięć podręczna przeszła na pół i pół tysiąca mikroiny, ale jednostka dekodowania instrukcji jest teraz zjednoczona i nie podzielona między dwoma niciami. Rozmiar jednostki okna out-rzędu (OOO) jest zwiększona z 168 do 192 płyt, a w stacji rezerwacji dodano dwa porty, zwiększając całkowitą liczbę do ośmiu. Sandy Bridge miał sześć portów dla równoległych wykonywania sześciu mikro-operacji. Trzy z nich są używane do operacji pamięci (odczyt / zapis), trzy - operacje matematyczne. Jeden dodany port służy do wykonywania operacji matematycznych i rozgałęzienia liczb całkowitych, a druga jest obliczenie adresu.

Bloki FMA (skondensowane mnożące) bloki (skondensowane mnożące dodanie) zostały poddane recyklingowi w portach 0-1, a także wsparcie dla zestawu instrukcji AVX2 (zaawansowane rozszerzenia wektorowe 2). Pozwala to na znacząco zwiększenie wydajności zarówno z tym samym typem, jak i obciążeniem mieszanym, ale przede wszystkim osiągnęła prędkość wykonywania operacji pływających - Intel deklaruje dwukrotny wzrost wydajności.

Nowe zestawy instrukcji - gwarancja przyszłej wydajności

W praktyce można oczekiwać wzrostu przy pracy z treścią multimedialną i 3D.

Nowy blok FMA jest w stanie dać poważne klapki wygrane na takt

Pamięć podręczna nie poszła bez uwagi. Prędkość działania L1 i opony między L1 a L2 podwoili się od 32 do 64 bajtów na cykl w obu przypadkach; Opatrzowanie pozostało niezmienione. UNIVERSAL TLB (tłumaczenie buforowy) jest sfinalizowany: od 4K do rozszerzenia 4k + 2m, szerokość opony jest podwojona. Dostęp do pamięci podręcznej L3 jest obecnie szerszy dzięki możliwości przetwarzania danych i żądań danych jednocześnie.

Blok TSX pomoże dystrybuować obciążenie między rdzenie procesorowe

Haswell został dodany instrukcje instrukcji TSX (rozszerzenia synchronizacji transakcyjnej) (transakcyjne rozszerzenia synchronizacji), co pozwala zwiększyć szybkość pracy kosztem "Smart" działających tych danych, z którymi kilka rdzeni jest adresowanych jednocześnie. Powinno to zwiększyć wydajność procesora z tymi zadaniami, które są trudne do równoległego, a także daje programistom możliwość zmiany części pracy w dystrybucji obciążenia między rdzeniami do procesora. TSX, podobnie jak AVX2 - wygodne narzędzie dla deweloperów, którzy zręcznie prowadzą ich, może osiągnąć znaczący wzrost prędkości dla ich zastosowań. Z tego samego powodu należy oczekiwać natychmiastowego wyniku "tutaj i teraz" z tych nowych zestawów instrukcji.

Jednym z najważniejszych wydarzeń w tym roku w segmencie pulpitu może być z pewnością uznany za wydanie nowej rodziny procesorów Intel Core Fourth-Generation, znany jako kodenamowany przez Haswell. W tym artykule krótko rozważamy mikroarchitekturę HASWELL i porównujemy wydajność procesora Intel Core I7-4770 na podstawie tego mikroarchitektury z wydajnością procesora Intel Core I7-3770 na podstawie mikroarchitektury poprzedniej generacji Sandy Bridg.

Przypomnijmy, że przez wiele lat uwalnianie nowych pokoleń procesorów Intel jest podporządkowane Empirycznym zasadzie TKIN-TOCK ("Tikak"), którego istotą jest to, że tłumaczenie produkcji do nowego procesu technologicznego (zaznacz) i wprowadzenie Nowa mikroarchitektura procesora (Toku) występuje na przemian z częstotliwością około dwóch lat. Oznacza to, że jeśli w pierwszym roku istnieje przejście do nowej produkcji procesowej, a następnie w drugim roku znajduje się nowa mikroarchitektura procesora w tym samym procesorze technicznym. W przyszłym roku Microchitechitia przenosi się do nowego procesu technicznego produkcji itp.

W szczególności, w 2012 r. Intel wydał wersję procesorów 22-nm w oparciu o MICRORACHITECTURE MICROARCHITECTURE SANDY Bridge, które są znane pod nazwą kodu Blushy Bridge (Cleck Cycle), a teraz dotarł do obrotu procesorów 22-nm opartych na nowym mikroarchitektroniu procesora Haswell.

Szczegółowo o cechach nowej mikrochitekturze haswell, napisaliśmy już na komputery nr 10'2012. Jednak wiele razy przekazało od tego czasu, a co najważniejsze - znane są nowe szczegóły tego mikroarchitektury. Dlatego też, aby się wielokrotnie powtórzyć i dokonać krótkiego przeglądu mikroarchitektury Haswell, koncentrując się na tych szczegółach pominiętych w naszej poprzedniej recenzji.

Computational Core Haswell.

Haswell to nazwa kodu nowego mikroarchitektury procesora, ale w zależności od tradycji tej samej nazwy są one wszystkim procesorom na nim. Ponadto haswell jest nazwa kodu rdzenia procesora haswell, która jest dość logiczna, ponieważ mikroarchitektura i rdzeń procesora są dwie strony tego samego medalu.

Więc rozważ krótko mikroarchitekturę haswell (lub jądro obliczeniowe haswell, co jest zasadniczo tym samym).

Rdzeń Computing Haswell nie zmienił kardynałowych zmian w porównaniu z bluszczącym mostem / Sandy Bridge Computing Core - poprawiono tylko pojedynczych bloków jądra procesorów. W związku z tym należy przypomnieć o ogólnych warunkach, że Microarchitektura Microarchitecture Bridge Sandy i mieszka na zmianach.

Blokowy procesor

Tradycyjnie mikroarchitektura jądra procesora zaczyna się od bloku wstępnego procesora (front-end), który jest odpowiedzialny za wybór instrukcji X86 z instrukcji pamięci podręcznej i dekodowania je (rys. 1). W MicrochitechitechitechitechiteCicence HAWELL jednostka przed przepływem wstępnym przeszedł minimalne zmiany.

Figa. 1. Pkropysta w Microarchitets Haswell i Most Sandy

Instrukcje X86 są wybierane z pamięci podręcznej L1I Instrukcji (pamięć podręcznej instrukcji), która nie zmieniła się w Microarchitecture Haswell. Ma rozmiar 32 KB, jest 8-kanałowy i dynamicznie podzielony między dwoma strumieniami instrukcji (obsługa technologii hiper-gwintowania).

Z pamięci podręcznej L1I polecenia są pobierane przez bloki 16 bajtów w buforze buforowym 16 bajtów (bufor Fetch).

Ponieważ instrukcje X86 mają długość zmiennej (od 1 do 16 bajtów), a długości bloków, które polecenia są ładowane z pamięci podręcznej, ustalone, granice między poszczególnymi poleceniami są dekodowane podczas dekodowania poleceń (informacje o rozmiarach poleceń jest przechowywany w pamięci podręcznej instrukcji L1I w polach specjalnych). Procedura wyboru poleceń z wybranego bloku nazywana jest wstępnym dekodowaniem (predektatem).

Po pobraniu próbkowania zorganizowane jest kolejka instrukcji. W mostku piaszczystym i haswell mikrochitechitechibufor polecenia jest przeznaczony do 20 poleceń w każdym z dwóch strumieni i z buforu przedporządkowania dla każdego zegara do bufora poleceń, do sześciu wybranych poleceń można załadować.

Następnie wybrane polecenia (instrukcje X86) są przesyłane do dekodera, gdzie są one przekształcane w maszyny Micro Operatory (oznaczone jako mikro-ops lub UOPS).

Dekoder rdzeni procesora Haswell pozostaje niezmieniony. Jest jeszcze czterokanałowy i może dekodować w każdym taktowi do czterech instrukcji X86. Jak już zauważono, długość jednego polecenia może osiągnąć 16 bajtów, jednak średnia długość poleceń wynosi 4 bajty. Średnio cztery polecenia są pobierane do każdego bloku 16 bajtów, które przy użyciu czterokanowanego dekodera są jednocześnie dekodowane w jednym zegara.

Czterokanałowy dekoder składa się z trzech prostych dekoderów dekoderów proste instrukcje W jednym mikrooprzepieniu i jednym kompleksie, który jest zdolny do dekodowania jednej instrukcji nie więcej niż cztery mikro-działające (dekoder typu 4-1-1-1). Jeszcze bardziej złożone instrukcje, dekodowane w więcej niż czterech mikroprzedsiębiorstwach, kompleksowy dekoder jest podłączony do jednostki SEQUESER UCODE, który służy do dekodowania takich instrukcji.

Wykorzystywane są instrukcje dekodowania, technologie makro-fuzji i mikro-fusion.

Makro-fuzja jest połączeniem dwóch instrukcji X86 w jednym kompleksowym mikro-ops Micro-ops, które będą nadal wykonywane jako jedna mikro-operacja. Oczywiście, nie jakiekolwiek instrukcje mogą podlegać tej fuzji, ale tylko niektóre instrukcje par (na przykład instrukcje porównawcze i przejście warunkowe). Bez użycia technologii makro-fuzji można uzyskać tylko cztery instrukcje (w dekoderze czterokanałowych), oraz dzięki technologii makro-fuzji, pięć instrukcji można odczytać w każdym taktowi, które są przekształcane w cztery i są zdekodowane połączenie.

Należy zauważyć, że rozszerzone bloki rozszerzone alu (arytmetyczna jednostka logika) są wykorzystywane do skutecznego utrzymania technologii makro-fuzji (arytmetycznej jednostki logicznej), co może obsługiwać wykonanie mikro-operacji fuzyjnych.

Mikro-fuzja jest połączeniem dwóch instrukcji mikroprojowych (instrukcji innych niż X86, mianowicie mikro-operacji) w jeden zawierający dwie podstawowe działania. W przyszłości dwa takie mikroeracje są przetwarzane jako jeden, co zmniejsza liczbę przetwarzanych mikro operacji, aw konsekwencji, aby zwiększyć całkowitą liczbę instrukcji wykonywanych przez procesor dla jednego taktu.

Ponadto Microarchitectumtecture Bridge Bridge Bridge wykorzystuje pamięć podręczną dekodowanych mikroeratorów (pamięć podręcznej UOP), która obejmuje wszystkie zdekodowane mikro-działające. Ta pamięć podręczna została zaprojektowana na około 1500 średnich funkcji mikroprzedsiębiorstw. Pamięć podręczna dekodowanych mikroprzedsiębiorstw wynosi osiem banków (to znaczy, ta pamięć podręczna jest 8-kanałowa), z których każda składa się z 32 Cachestrożnie, a każdy Cachestalk posiada do sześciu dekodowanych mikro-działających (UOP). Stąd okazuje się, że pamięć podręczna może zawierać około 1500 mikroprzedsiębiorstw.

Koncepcja pamięci podręcznej dekodowanych mikroprzedsiębiorstw jest utrzymanie już dekodowanych sekwencji mikro-operacji. W rezultacie, jeśli musisz ponownie wykonać pewną instrukcję X86, a odpowiednia sekwencja dekodowanych mikro-ops jest nadal w pamięci podręcznej dekodowanych mikro-ops, nie jest konieczne natychmiastowe wybieranie tej instrukcji z pamięci podręcznej L1 i dekodowane To - już dekodowane mikro wydajność pochodzą z pamięci podręcznej do dalszego przetwarzania.

Po procesie dekodowania instrukcji X86, cztery kawałki dla taktu, wprowadź bufor kolejki kolejki dekodowej. W Microarchitecture Bridge Microarchitecture, ten bufor z dekodowanych instrukcji został zaprojektowany dla dwóch strumienia 28 mikroprzedsiębiorstw dla każdego wątku. W mikroarchetetach, bluszczu i Haswell nie jest podzielony na dwa przepływy poleceń i jest przeznaczone do 56 mikroprzedsiębiorstw. Takie podejście okazuje się być bardziej korzystne podczas wykonywania aplikacji pojedynczej gwintowanej (za pomocą jednego strumienia poleceń). W takim przypadku jeden strumień poleceń jest dostępny dla bufora o pojemności 56 mikro-ops, aw microarchitectumtecturze mostu piaszczystego tylko na 28 mikroprzedsiębiorstw.

Wydawałoby się, że jeśli porównujesz jądra procesora Haswell i Bridge Bridge, w ogóle nie ma różnic w ich procesorach wstępnych, a wstępnie opozycje jądra haswell i mostu piaszczystego różnią się tylko do struktury fodowanej buforu instrukcji.

Niemniej jednak, ponieważ Intel mówi, niektóre ulepszenia w procesorze przedoperacyjnym były nadal podejmowane i zainteresowani poprawa bloku przewidywania oddziału (predyktory oddziału). Jednak, które ulepszenia zostały wdrożone, Intel nie ujawnia.

Wykończenie opisu prealizatora w Microarchitectumtecture Haswell, należy również wspomnieć o buforze TLB.

Bufor TLB (tłumaczenie buforów wyszukiwania) to specjalna pamięć podręczna procesora, która przechowuje adresy dekodowanych instrukcji i danych, co może znacznie zmniejszyć dostęp do nich. Ta pamięć podręczna ma na celu zmniejszenie czasu na przekształcenie adresu adresu wirtualnego lub instrukcji fizycznych. Faktem jest, że procesor używa wirtualnego adresowania, a wymagane są prawdziwe adresy fizyczne, aby uzyskać dostęp do danych w pamięci podręcznej lub pamięci RAM. Transformacja wirtualnego adresu w fizycznym zajmuje około trzech zegarek procesora. Pamięć podręczna TLB przechowuje wyniki poprzednich transformacji, dzięki czemu transformacja adresowa została przeprowadzona w jednym zegara.

W procesorach z Microarchitecture Haswell i Most Sandy (jak w procesorach Intel w oparciu o inne mikroarchitektury) stosuje się dwupoziomowy pamięć podręczną TLB, a jeśli pamięć podręczna L2 TLB jest ujednolicona, a pamięć podręczna L1 TLB jest podzielona na bufor danych (DTLB ) i bufor instrukcji (ITLB).

L1 TLB-CH. Instrukcje L1 ITLB-Cache są zaprojektowane dla 128 wpisów, jeśli każdy wpis dotyczy strony pamięci o pojemności 4 KB. Tak więc, przy użyciu 4 KB strony pamięci L1 ITLB-Cache może rozwiązać 512 KB pamięci. W przypadku stron o pojemności 4 KB pamięci podręcznej ITLB jest 4-kanałowy i statycznie podzielony między dwoma strumieniami poleceń. Ponadto pamięć podręczna L1 ITLB może dodać 2 MB stron pamięci. W tym przypadku pamięć podręczna zawiera osiem wpisów dla każdego strumienia i jest w pełni skojarzona.

Nadzwyczajna jednostka wykonania dowodzenia

Po procesie dekodowania instrukcji X86 rozpoczyna się etap ich nadzwyczajnej egzekucji (pozarządu).

Na pierwszym etapie, zmiana naziemu i dystrybucji dodatkowych rejestrów procesora, które nie są zdefiniowane przez architekturę zestawu polecenia. Technika nazwy rejestrów będzie bez znaczenia bez poleceń kolejności. Dlatego, z bufora dekodowanych instrukcji (kolejka dekodowania) mikro-operacji dla czterech elementów, zamorienisty bufor jest zawarty w buforze przywróconym, w którym rejestrowcy mikro-działające nie są w kolejności ich odbioru (poza ZAMÓWIENIE).

W Microarchitecture Bridge Sandy, wielkość buforu przywracającego jest przeznaczony do 168 mikroprzedsiębiorstw, aw Microarchitecture Haswell - dla 192 Micro-Operations.

Należy pamiętać, że buforowy buforowy (bufor użytkownika) i jednostka emerytalna (jednostka emerytalna) łączy się w jednej jednostce procesora, ale instrukcje są początkowo przeprowadzane, a jednostka jednostki emerytalnej jest włączona do pracy później, gdy trzeba wydać wykonywalność instrukcje w określonej instrukcji.

Następnie występuje dystrybucja mikroprangacji na blokach wykonawczych. W Uniifikowanej jednostce procesora harmonogramu powstają kolejki mikro-operacyjne, w wyniku których mikro-operacje spadają na jednym z portów urządzenia funkcjonalne. (Porty wysyłkowe). Ten proces nazywa się wysyłką (wysyłka), a same porty wykonują funkcję bramy do urządzeń funkcyjnych.

W mikroarchitach mostu piaszczystego i Haswell, klastry nadzwyczajnej realizacji poleceń (klastra pozarządowe) wykorzystują tzw. Fizyczne pliki rejestru (plik fizyczny rejestru, prf), w których przechowywane są mikro operants.

Przypomnijmy, że gdy fizyczne pliki rejestru nie zostały zastosowane w jądrach procesorowych (na przykład w Nehalem Microarchitecture), każdy mikrooperacja miała kopię operand (lub operandy). W rzeczywistości oznacza to, że bloki klastra niezwykłej realizacji poleceń miały mieć wystarczająco duży rozmiar, aby móc pomieścić mikro operacje wraz z wymaganymi operanami.

Korzystanie z PRF umożliwia same mikro-operacje, aby zapisywać tylko wskaźniki do operandów, ale nie same operandy. Z jednej strony podejście to zapewnia redukcję zużycia energii procesora, ponieważ ruch przenośnika mikro-eksploatacyjnego wraz z ich operanami wymaga znacznych kosztów zużycia energii. Z drugiej strony, użycie fizycznego pliku rejestru pozwala zaoszczędzić rozmiar kryształu, a zwalniona przestrzeń jest używana do zwiększenia rozmiaru buforów klastrów nadzwyczajnych wykonywania poleceń.

Figa. 2. Nadzwyczajne bloki wykonania poleceń

w Microarchitets Haswell i Most Sandy

W Microarchitecture Sandy Bridge, fizyczny plik rejestru dla operandów integera (liczb całkowitych) jest zaprojektowany dla 160 rekordów, oraz do pływających operandy przecinków (rejestry AVX) - na 144 rekordach.

W Microarchitecture w Haswell, pliki liczb całkowitych i pliki rejestrowe Rejestry AVX są zaprojektowane dla 168 wpisów.

Czytanie buforów (ładunek) i rekordy (sklep), które są używane do uzyskania dostępu do pamięci. Na przykład, jeśli microarchitektura mostka piaszczystego, bufory obciążeń i przechowywania obliczono odpowiednio na 64 i 36 rekordach, następnie w mikroarchituwie HASWELL, są one obliczane według rekordów 72 i 42.

Wielkość ujednoliconego buforu harmonogramu, który tworzy mikro-operacyjne kolejki do portów urządzeń funkcjonalnych, zmieniono również w mikroprzy mikroarchitektroniu. Jeśli na moście Sandy został zaprojektowany do 54 mikropastycznych, a następnie w Haswell - o 60.

Jeśli więc porównujesz architekturę Haswell i Sandy Bridge, a następnie w niezwykłej jednostce wykonawczej, mikrochiticulturze HASWELL nie jest strukturalne, ale tylko zmiany jakościowe dotyczące wzrostu rozmiarów bufora. Ale nie ma podstawowych zmian w niezwykłej jednostce egzekucyjnej w Microarchitecture Haswell.

Bloki wykonawcze jądra CPU

Jeśli chodzi o bloki wykonawcze rdzenia procesora, a następnie w Microarchitectumtecture HASWELL, przeszedł istotne zmiany w porównaniu z microarchitekturą mostu piaszczystego. Tak więc, na moście piaszczystym istnieje sześć portów urządzeń funkcjonalnych (portów wysyłkowych): trzy obliczenia i trzy do pracy z pamięcią (na rys. 3 pokazuje tylko porty obliczeniowe).

Figa. 3. Bloki wykonawcze w Microarchitets Sandy Bridge

i haswell (porty do pracy z pamięcią nie są wyświetlane)

W Microarchitecture w Haswell liczba portów portowych wzrosła do ośmiu. Do tego, co było w Middy Bridge Microarchitecture, inny port na nagrywanie adresu (adres sklepu) i dodano port obliczeniowy do operacji z liczbami całkowitymi i operacjach zmiany biegów. W ten sposób procesory Haswell mogą wykonywać do ośmiu mikroprzedsiębiorstw w jednym zegarze, podczas gdy w Microarchitecture Bridge Sandy, maksymalna liczba mikro-działających taktu jest sześć.

Ponadto same urządzenia wykonujące są nieznacznie zmieniane w mikroprębiotecektiquecture Haswell. Wynika to z faktu, że Haswell Microarchitecture pojawił się dodatkowymi instrukcjami: AVX2, FMA3 i BMI.

AVX2 Instrukcja zestaw (zaawansowane instrukcje wektorowe) to rozszerzenie zestawu instrukcji AVX, który jest obecny w Microarchitecture Bridge Sandy. Ogólnie rzecz biorąc, zestaw instrukcji AVX jest logiczną kontynuacją zestawów instrukcji SSE, SSE2, SSE3 i SSE4. W przypadku przetwarzania danych w instrukcjach AVX stosuje się 16 obwodów wektorowych wektora 256 bitów, dzięki czemu wiele razy może przyspieszyć wiele razy. Na przykład, mnożenie czterech 64-bitowych numerów przy użyciu zespołu AVX jest możliwe w jednym zegara, natomiast bez instrukcji AVX będzie wymagać czterech zegarów.

Główną różnicą między nowym instrukcją AVX2 zestawem z dawnej wersji AVX jest to, że jeśli wcześniejsze 256-bitowe operacje z rejestrami AVX były dostępne tylko do operacji pływających punktów, a tylko 128-bitowe operacje były dostępne dla operandów integerowych, a następnie w AVX2 256 -Bit operacje stały się dostępne dla operandów całkowitych. W rzeczywistości przy użyciu AVX dla jednej ściereczki można wdrożyć 16 operacji za pomocą pojedynczych numerów dokładności i osiem operacji z podwójnymi numerami dokładności. A podczas korzystania z AVX2 w jednym zegara można wdrożyć 32 operacje za pomocą pojedynczych numerów dokładności i 16 operacji z podwójnymi numerami dokładności.

Ponadto AVX2 poprawił wsparcie dla zmian i permutacji w operacjach wektorowych. Istnieją nowe instrukcje, aby zbudować kilka (cztery lub osiem) niepowiązanych elementów do jednego elementu wektorowego, w ten sposób możliwe jest załadowanie 256-bitowego rejestru AVX.

Nowy zestaw instrukcji FMA3 (skondensowany mnożący dodatek) jest przeznaczony do przeprowadzenia połączonych mnożenia i operację dodawania ponad trzech operandów.

Korzystanie z operacji FMA3 umożliwia skuteczniejsze wdrożenie operacji podziału, ekstrakcję korzenia kwadratowego, mnożenie wektory i macierzy itp. Zestaw FMA3 zawiera 36 instrukcji pływających punktów do wykonywania 256-bitowych obliczeń i 60 instrukcji dla 128-bitowych wektorów.

Polecenia BMI (instrukcje manipulacji bitów) obejmują 15 instrukcji skalarnych dla operacji bitowych, które działają z rejestrami ogólnego ogólnego przeznaczenia. Instrukcje te są podzielone na trzy grupy: manipulacje nad poszczególnymi bitami, takimi jak wkładki, przesuwanie i bity ekstraktu, bitów liczących, takich jak liczenie wiodących zer w nagrywaniu liczb oraz wielokrotnego rozmnażania dowolnej dokładności. Ten zestaw instrukcji umożliwia przyspieszenie liczby określonych operacji, na przykład, gdy szyfrowano.

Podsystem pamięci w Microarchitecturecue Haswell

Jedną z najważniejszych zmian w Mikroarchitecówce Haswell w porównaniu z mostem piaszczystym został wykonany w podsystemie pamięci. I nie tylko, że rozmiar bufory odczytu (ładunek) jest zwiększona (przechowuj), które są używane do uzyskania dostępu odpowiednio do pamięci (72 i 42 rekordów). Główną rzeczą dodano inny port do nagrywania adresu (adres sklepu), pamięć podręczna L1 stała się bardziej produktywna, a przepustowość pomiędzy L1 i L2 caches jest zwiększona. Rozważ te zmiany bardziej szczegółowo.

Dostęp do podsystemu pamięci rozpoczyna się od faktu, że odpowiednie mikroeracje przychodzą do odczytu buforów (ładowania) i rekordów (sklep), które razem mogą gromadzić więcej niż sto mikroeracji. W Microarchitecture Bridge Sandy, porty urządzeń funkcjonalnych oznaczonych w schematach jako 2, 3 i 4 były odpowiedzialne za dostęp do pamięci (rys. 4). Porty 2 i 3 są powiązane z urządzeniami informacyjnymi generowania adresów (adres ogólnej generowania, AGU) do nagrywania lub odczytu danych, a port 4 jest powiązany z urządzeniem funkcjonalnym do nagrywania danych z jądra procesora do pamięci podręcznej L1 (DL1). Procedura generowania adresu zajmuje jeden lub dwa zegar procesora.

Figa. 4. Podsystem pamięci w Microarchitets Sandy Bridge i Haswell

W Microchitecetecture Haswell do portów 1, 2 i 3, dodaje się port 7, który jest powiązany z urządzeniem funkcjonalnym do generowania nagrywania adresów (Store AGU). W rezultacie jądro Haswell może obsługiwać dwie operacje pobierania danych i pojedynczą operację nagrywania danych dla taktu.

Podświetlone urządzenie funkcjonalne do generowania nagrywania danych jest nieznacznie proste do wykonania w porównaniu z urządzeniami funkcjonalnymi do generowania adresu ogólnego przeznaczenia (do nagrywania i pobierania danych). Faktem jest, że mikro-operacja nagrywania danych po prostu rejestruje adres (i ostatecznie, same dane) do bufora rekordów (bufor sklepowy). A mikrooprzewacja ładowania danych powinna być rejestrowana w buforze odczytu, a także śledzić zawartość bufora zawartości w celu wyeliminowania możliwych konfliktów.

Gdy tylko niezbędny adres wirtualny zostanie wygenerowany, pamięć podręczna L1 DTLB rozpoczyna się za zgodność tego wirtualnego adresu fizycznego. Sama pamięć podręczna danych L1 DTLB w MicroarchitectureTue w Haswell nie zmieniła się. Obsługuje 64, 32 i 4 rekordy dla stron pamięci o 4 KB, odpowiednio 2 MB i 1 GB i jest 4-kanałowym.

Gdy pamięć podręczna L1 DTLB, odpowiednie wpisy w ujednoliconej pamięci podręcznej L2 TLB, które rozpoczyna się wiele ulepszeń w mikroprzy mikroarchitektroniu. Ta pamięć podręczna obsługuje rozmiar strony 4 KB i 2 MB, jest 8-kanałowy i zaprojektowany dla 1024 rekordów. W mikroarchitecture Sandy Bridge L2 TLB, pamięć podręczna została zaprojektowana dla 512 wpisów (to znaczy, że była w połowie mniejsza), wspierała tylko 4 kb strony pamięci i był 4-kanałowy.

Sama pamięć podręczna L1 pozostała wielkością 32 KB i 8-kanałowa (jak w Microarchitecture Bridge Sandy). W tym samym czasie dostęp do pamięci podręcznej TLB i sprawdzanie znaczników pamięci podręcznej danych L1 można wykonać równolegle.

Jednak w mikroarchituwitku HASWELL pamięć podręczna danych L1 ma wyższą przepustowość. Obsługuje jednocześnie jedną 256-bitową operację odczytu i dwie 256-bitowe operacje rekordu, które w agregacie daje zagregowaną przepustowość 96 bajtów dla taktu. W Microarchitecture Bridge Sandy, pamięć podręczna L1 obsługuje jednocześnie jedną 128-bitową operację odczytu i dwie 128-bitowe rejestrowe operacje, czyli ma szerokość pasma teoretyczna dwa razy niższa. W tym przypadku, rzeczywista przepustowość pamięci podręcznej L1 w Microarchitectumterytwie Mosta Piaszczystego jest ponad dwukrotna przepustowość w Microcheitture Haswell ze względu na fakt, że na piaszczystym moście tylko dwa funkcjonalny blok AGU.

Ponadto mikroarchitektura Haswell wzrosła i przepustowość między L1 a L2 Caches. Tak więc, jeśli w moście piaszczystym, przepustowość pomiędzy pamięcią podręczną L2 i L1 wynosiła 32 bajtów na cykl, a następnie w Haswell jest do 64 bajtów na cykl. A jednocześnie gotówka L2 w Haswell ma taką samą opóźnienie jak na Most Sandy. Podsumowując, zauważamy, że jak w Microarchitecture Bridge Sandy, w Haswell Cache L2 nie jest wyłączny i nie obejmujący w stosunku do pamięci podręcznej L1.

Nowe tryby oszczędzania energii w procesorze Haswell

Jedną z innowacji w procesorze Haswell jest zmniejszenie całkowitego zużycia mocy procesora, nowe stanowienia zużycia energii, które są nazywane S0IX i są pożyczone z procesorów Atom Intel (takie tryby zużycia energii zostały wdrożone w procesorach Moorestown).

Przypomnijmy, że tradycyjnie system może być albo w stanie aktywnym S0 (normalny tryb pracy) lub w jednym z czterech stanów "snu" S1-S4.

W stanie S1 wszystkie bufory procesorów są resetowane, a procesor przestał wykonać instrukcje. Jednak moc procesora i pamięci RAM jest utrzymywana, a urządzenia, które nie są oznaczone jako włączone, mogą być wyłączone. Stan S2 jest jeszcze głębszym stanem "snu", gdy procesor jest wyłączony.

Status S3 (inna nazwa - zawiesić do RAM (STR) lub tryb gotowości - Standby) - jest to stan, w którym RAM nadal karmić i pozostaje prawie jedynym komponentem, który zużywa energię.

Stan S4 jest znany jako hibernacja (hibernacja). W tym stanie wszystkie zawartość pamięci RAM jest zapisywane w pamięci nieulotnej (na przykład na dysku twardym lub SSD).

Stany S0IX (S0I1, S0I2, S0I3, S0I4) są podobne do stanów S1, S2, S3 i S4 w sensie zużycia energii, ale różnią się od nich fakt, że do przejścia systemu do stanu aktywnego S0 wymaga znacznie mniej czasu. Na przykład, do przejścia od stanu S0 do stanu S0I3, wymagane są 450 μs i 3,1 ms do odwrotnego przejścia.

Rdzeń graficzny w Microarchitecture Haswell

Jedną z głównych innowacji w Microarchitectumteitkacie Haswell jest nowym rdzeniem graficznym z obsługą DirectX 11.1, OpenCl 1.2 i OpenGL 4.0.

Ale najważniejszą rzeczą jest to, że rdzeń graficzny w Microarchitectumtecture Haswell jest skalowalny. Istnieją warianty rdzenia graficznego z nazwami kodami GT3, GT2 i GT1 (rys. 5).

Figa. 5. Haswell Graphic Cernel Schemart

Rdzeń GT1 będzie miał minimalną wydajność, a GT3 jest maksymalna.

Druga jednostka obliczeniowa pojawi się w rdzeniu graficznym GT3, dzięki czemu liczba bloków rasteryzacji, przenośnikami pikseli, jąder obliczeniowych i próbników. Oczekuje się, że GT3 będzie dwa razy więcej niż GT2.

Rdzeń GT3 zawiera 40 bloków wykonawczych, 160 jąder obliczeniowych i cztery bloki teksturowe. Aby porównać, przypominamy sobie, że w kodzie graficznym Intel HD Graphics 4000 procesorów Blush Most zawierają 16 urządzeń wykonawczych, 64 jąder obliczeniowy i dwa bloki teksturalne. Dlatego pomimo w przybliżeniu tych samych częstotliwości zegara ich pracy rdzeń graficzny Intel GT3 przekracza swój poprzednik pod względem wydajności. Ponadto jądro GT3 ma wyższą wydajność dzięki integracji pamięci EDRAM (w jądrze GT3E) w opakowaniu procesora.

Rdzeń GT2 zawiera 20 bloków wykonawczych, 80 jąder obliczeniowych i dwóch modułów tekstury, a jądro GT1 to tylko 10 bloków wykonawczych, 40 jąder obliczeniowy i jeden moduł tekstury.

Same jednostki wykonawcze mają cztery jądry komputerowe, takie jak te używane architektura AMD. Vliw4.

Kolejną innowacją jest to, że podczas pracy z pamięcią stosuje się natychmiastowa technologia dostępu, co pozwala na jądro obliczeniowe procesora i graficzny rdzeń do bezpośredniego dostępu RAM. W poprzednie wersje Grafika rdzeni obliczeniowych procesora i jądro graficznego również pracował ze wspólną pamięcią operacyjną, ale pamięć została podzielona na dwa obszary o dynamicznie zmiennych wymiarach. Jeden z nich został przydzielony do rdzenia graficznego, a drugi dla rdzeni komputerowych procesora. Jednak, aby uzyskać jednoczesny dostęp do tej samej części graficznej pamięci rdzeń graficznych i rdzeni obliczeniowych procesorów. I w przypadku procesor graficzny Te same dane były wymagane, aby stosowano rdzeń przetwarzający procesor, musiał skopiować tę sekcję pamięci. Doprowadziło to do wzrostu opóźnień, a ponadto problem śledzenia spójności danych wstał.

Technologia InstantAccess umożliwia kierowcy jądra graficznego, aby umieścić wskaźnik do położenia określonego obszaru w obszarze graficznym, do którego jądro przetwarzania procesora musi być dostępna. W tym przypadku rdzeń komputerowy procesora będzie współpracować z tym obszarem pamięci bezpośrednio, bez tworzenia kopii, a po wykonaniu niezbędnych działań, obszar pamięci zostanie zwrócony do rdzenia graficznego.

Rodzina nowych rdzeni graficznych GT1, GT2 i GT3 ma ulepszone możliwości kodowania wideo. Obsługiwany sprzętowy dekodowanie H.264 / MPEG-4 AVC, VC-1, formaty MPEG-2, MPEG-2 HD, Motion JPEG, DivX z rozdzielczością do 4096 × 2304 pikseli. Stwierdzono, że rdzeń graficzny może jednocześnie dekodować wiele strumieni wideo 1080p i odtwarzać wideo 2160p bez ładowania i pomijania ramek.

Pojawiła się specjalna jednostka poprawy jakości wideo, która nazywa się silnikiem jakości wideo i jest odpowiedzialny za redukcję hałasu, korekty kolorów, odpływu, adaptacyjne zmiany w przeciwieństwie itp. Ponadto nowe rdzenie graficzne obsługują funkcje stabilizacji obrazu, konwersję częstotliwości ramy i rozszerzoną gamma.

Ponadto rdzeń graficzny w procesorze Haswell zapewnia łączenie do trzech monitorów w tym samym czasie. Wyświetl port 1.2 Porty z uprawnieniami do 3840 × 2160 i 60 Hz częstotliwości, HDMI z rozdzielczością do 4096 × 2304 i 24 Hz częstotliwości (z maksymalną rozdzielczością), a także port DVI.

Zakres modelu Haswell.

Chociaż nadal przedwczesny jest rozmawiać o zakresie modelu procesorów Haswell. Oczywiście w Internecie można znaleźć zróżnicowane i czasami niespójne informacje dotyczące planów ITEL do wydania procesorów Haswell. Jednak firma nie potwierdza jednak tych informacji, więc nie wiadomo, które metody procesorów zostaną ogłoszone w pierwszej kolejności.

Jest to jedynie niezawodnie, że procesory Haswell zostaną oficjalnie zwane czwartą generacją Intel Core i wykonać trzy serie: Core I7, Core I5 \u200b\u200bi Core I3. Podobnie jak poprzednie generacje procesorów Intel, modele procesorów Haswell są oznaczone czterocyfrową liczbą, która zaczyna się od numeru 4 (pierwsza figura wskazuje liczbę procesorów).

Intel początkowo ogłosi uwalnianie procesorów do pulpitu i laptopów rdzenia serii I7 i Core I5, a słabsze i tanie procesory serii I3 pojawią się później.

Procesory Desktop zostaną zakończone rdzeniem GT2 Graphics z oficjalną nazwą grafiki Intel HD 4600, ale są to tylko pogłoski, dlatego jest całkiem możliwe, że model z rdzeniem graficznym GT3 (oficjalna nazwa Intel HD Graphics 5200) Rodzina procesorów do komputerów stacjonarnych.

Mobilne wersje procesorów Haswell będą wyposażone w rdzeń graficzny lub GT3 (najlepsze modele) lub GT2.

Ponownie, na plotkach, wszystkie wersje procesory mobilne będzie czterordzeniowy z obsługą technologii hiper-gwintowania ( rozmawiamy Na rodzinie rdzenia procesorów mobilnych I7). Procesory do komputerów stacjonarnych Rdzeń I7 i Rdzeń Rdzeń I5 będą również głównie (z wyjątkiem jednego modelu w rodzinie głównej I5) Quad-Core, ale technologia hiper-gwintowania będzie wspierać tylko najlepszy model rdzenia rodziny I7 i Dwukrowy model rdzenia rodziny I5.

Wszystkie Rodziny Rdzeń I5 i Core I7 będą wspierać technologię Turbo Boost.

Rozmiar pamięci podręcznej L3 w procesorach Rdzeń I7 i Rdzeń I5 może wynosić 8, 6 i 4 MB, cóż, TDP tych procesorów waha się od 35 do 84 W.

Procesory komputera pulpitu mają złącze LGA 1150 i są kompatybilne tylko z płytami głównymi na podstawie nowych chipsetów z serii Intel.

Procesor Intel Core I7-4770

Gdybyśmy nie mieli o całym zakresie modelu procesorów Haswell i ich cech w momencie pisania tego artykułu, nie mieliśmy, wtedy na procesorze Intel Core I7-4770, który mieliśmy na testowaniu, znaliśmy wszystko. Ten procesor nie jest najwyższej jakości rodziny Intel Intel I7 i jest gorszy tylko przez model Intel Core I7-4770K, który różni się od niego w tym, co ma w pełni odblokowany stosunek mnożenia i 100 MHz jest wyższą podstawową częstotliwością zegara. We wszystkich reszcie tych procesorów są takie same.

Tak więc procesor Intel Core I7-4770 jest Quader, obsługuje technologię hiper-gwintowania, a jej częstotliwość podstawy wynosi 3,4 GHz. W tryb turbo Zwiększ maksymalną częstotliwość zegara może osiągnąć 3,9 GHz. Procesor jest wyposażony w rdzeń L3 8 MB i GT2 Graphics (oficjalna nazwa Intel HD Graphics 4600), która działa na częstotliwości zegara 1,2 GHz. Sterownik pamięci w procesorze, jak poprzednio, podwójny kanał i oficjalną maksymalną częstotliwość obsługiwanej pamięci DDR3 wynosi 1600 MHz (można oczywiście użyć więcej prędkości).

Ponownie, jak poprzednio, procesor Intel Core I7-4770 ma wbudowany sterownik PCI Express 3.0 o 16 linii. Cóż, ostatnie ważne okoliczności - TDP tego procesora wynosi 84 W.

Dla porównania przypomnimy, że procesor Intel Core I7-3770 (Nazwa kodu Ivy Bridge) poprzedniej generacji ma bardzo podobne cechy. Jest to również czterordzeniowy, obsługuje hiper-gwintowanie i ma pamięć podręczną L3 8 MB. Podstawowe częstotliwości zegara tych procesorów są nieco inne: dla modelu Intel Core I7-4770, jest to 3,4 GHz, a dla Intel Core I7-3770K - 3,5 GHz. Jednak w trybie Turbo Boost częstotliwości zegara tych procesorów pokrywa się: jeśli załadowano jeden lub dwa jądra procesora, następnie maksymalna częstotliwość zegara może wynosić 3,9 GHz (pod warunkiem, że maksymalne zużycie energii i maksymalny prąd). Jeśli załadowano trzy jądra procesora, maksymalna częstotliwość zegara może wynosić 3,8 GHz, a podczas ładowania wszystkich czterech rdzeni wynosi 3,7 GHz.

Rdzenie graficzne wyróżniają się w tych procesorach i oczywiście mikroarchitektura samego jądra obliczeniowego. A teraz mały szczegół: procesor Intel Core I7-3770 ma TDP 77 W, czyli mniej niż Intel Core I7-4770. Cóż, najwyraźniej zwiększenie rozmiarów bufora i rejestrów, dodatkowe porty urządzeń funkcjonalnych i wzrost przepustowości pamięci procesora nie jest przekazywany. Wszystko to doprowadziło do wzrostu zużycia energii procesora. Z tym jednak dość możliwe jest pogodzenie, jeżeli z powodu niewielkiego wzrostu zużycia energii, osiągnięto odpowiedni wzrost wydajności procesora. Cóż, pozostaje do sprawdzenia, czy tak naprawdę jest.

Wydajność w zastosowaniach nieokresowych

Aby przetestować procesor Intel Core I7-4770, korzystaliśmy z narzędzia V.12.0 ComputerTpress Script V.12.0 szczegółowy opis Które można znaleźć w marcu numer magazynu. Przypomnijmy, że to narzędzie testowe opiera się na następujących realnych zastosowaniach:

  • Xilisoft. Konwerter wideo. Ultimate 7.7.2;
  • Wondershare Video Converter Ultimate 6.0.3.2;
  • Konwerter wideo Movavi 10.2.1;
  • Adobe Premier Pro CS 6.0;
  • Photodex Proshow Gold 5.0.3276;
  • Adobe Audition CS 6.0;
  • Adobe Photoshop CS 6.0;
  • Abbyy finereader 11;
  • Winrar 4.20;
  • WinZip 17.0.

Wskaźnik wydajności wykorzystuje czas wykonania zadań testowych.

Jasne jest, że sam w sobie czas wykonania zadań testowych nie pozwala na oszacowanie wydajności procesora. Takie wyniki mają sens tylko w porównaniu z niektórymi wynikami przyjętymi do odniesień. Takie porównanie wyników pozwala oszacować, ile razy (lub ile procent) procesor testowy jest bardziej produktywny (a może mniej) odniesienia podczas wykonywania określonego zadania.

Porównaliśmy procesor Intel Core I7-4770 z procesorem Intel Core I7-3770. W przypadku widoczności wyników wyników obliczały również ogólne zintegrowane wykonanie procesora i integralnych szacunków dla poszczególnych grup testów (przetwarzanie wideo, tworzenie treści wideo, przetwarzanie audio, przetwarzanie zdjęcia cyfrowe., rozpoznawanie tekstów, archiwizacji i danych rozpoznawczych).

Aby obliczyć zintegrowaną ocenę wydajności, wyniki badania procesora Intel Core I7-4770 są znormalizowane w stosunku do wyników procesora Intel Core I7-3770K. Znormalizowane wyniki badań zostały podzielone na sześć grup logicznych (konwertowanie wideo, przetwarzanie audio, tworzenie treści wideo, przetwarzanie zdjęć cyfrowych, rozpoznawania tekstu, danych archiwizacji i rozpoznawczych), aw każdej grupie zintegrowany wynik obliczono jako średni pomiernik z znormalizowane wyniki. Dla łatwości widzenia wynikowa wartość pomnożono przez 1000. Następnie przeciętny miernik obliczono na podstawie uzyskanych zintegrowanych wyników, co jest wynikiem zintegrowanego wskaźnika wydajności. W przypadku procesora Intel Core I7-3770K jest wynik zintegrowany, a także integralne wyniki dla każdej grupy testów wynosi 1000 punktów.

Aby przetestować procesor Intel Core I7-3770K, zastosowano następującą konfigurację komputera:

  • płyta główna - GIGABYTE GA-Z77X-UD5H;
  • chipset. płyta główna - Intel Z77 Express;
  • pamięć - DDR3-1600;
  • karta wideo - Rdzeń graficzny procesora Intel HD 4000;
  • Testy procesora Intel I7-4770 przeprowadzono na poniższym stojaku:
  • płyta główna - Intel DH87MC;
  • chipsetów płyty systemowej - Intel H87 Express;
  • pamięć - DDR3-1600;
  • rozmiar pamięci - 16 GB (dwa moduły Geil 8 GB);
  • tryb pamięci - dwukanałowy;
  • karta wideo - Rdzeń graficzna procesora Intel HD 4600;
  • drive - Intel SSD 520 (240 GB).

W obu przypadkach używanych system operacyjny Microsoft Windows 8 Enterprise (64-bit).

Zauważ, że matczyny deska Intel. DH87MC, które wykorzystaliśmy do przetestowania procesora Intel Core I7-4770, jest próbką inżynieryjną. Intel odmówił produkcji płyt głównych pod marką i jest teraz zaangażowany tylko przez projekt referencyjny, czyli opłaty za próbkę dla swoich partnerów. Dlatego deska Intel DH87MC nigdy nie pójdzie na sprzedaż.

Zarówno dla procesora Intel Core I7-3770K, jak i dla procesora Intel Core I7-4770, przeprowadzono testowanie ustawienia BIOS. Domyślnie tak, że aktywowany był tryb Intel Turbo Boost, ale nie powstało żadne przyspieszenie procesorów.

Aby zapewnić wysoką dokładność wyników, wszystkie testy były prowadzone pięć razy.

Wyniki testów przedstawiono w tabeli. 1 i na rys. 6.

Figa. 6. Zintegrowane wyniki narzędzia procesorów testowych

Komputerowy skrypt benchmark V.12.0

Jak widać, integralna wydajność procesora Intel Core I7-4770 wynosi prawie 10% lepszy od podstawowego wydajności procesora I7-3770K, a największy wzrost wydajności jest obserwowany w aplikacjach, takich jak Adobe Photoshop CS6 (15%) i Adobe Premier Pro CS 6.0 (18%) i Photodex Proshow Gold 5.0.3276 (13%).

Należy zauważyć, że procesory Intel Core I7-4770 i Core I7-3770K pracują na tej samej częstotliwości zegara, a obserwowana różnica w wydajności jest wyjaśniona tylko przez zmiany mikroarchitektury procesora I7-4770 I7-4770. W zastosowaniach nieokresowych nowa mikro-architektura procesora Haswell umożliwia uzyskanie wzmocnienia wydajności średnio o 10%.

Wydajność w grach

Komputerowy Script Benchmark Script V.12.0 Umożliwia ocena wydajności procesora tylko podczas pracy z aplikacjami niebezpiecznymi, w których możliwości zintegrowanego rdzenia graficznego są praktycznie stosowane.

Dlatego też doceniamy wyniki rdzenia graficznego procesora Intel Core I7-4770 w grach 3D za pomocą Edycji Adversal 3DMark Professional i 3Dmark 11.

Benchmark 3Dmark Professional to nowy test, który obsługuje platformy Windows i Android. Ten benchmarque obejmuje trzy testy: burza lodowa, bramę chmurową i strajk ognia. Pierwszy koncentruje się na urządzeniach mobilnych, takich jak smartfony, tablety lub netbooki, drugi - na laptopach / ultrabooków i uniwersalnych komputerach środkowych; Oraz trzeci - na produktywnych komputerach z potężną grafiką.

Wyniki testowe procesorów przy użyciu edycji Adversal 3DMark Professional i 3Dmark 11 przedstawiono w tabeli. 2 i tabela 3 i na rys. 7 i 8.

Figa. 7. Wyniki testowania przetwarzania

Figa. 8. Wyniki testowania przetwarzania

Jak widać na 3Dmark Professional Wyniki testu i 3DMark 11 Edycja Advanced, Intel HD 4600 Rdzeń Graphics (Rdzeń I7-4770 Procesor) Naprawdę ma B owydajność wagi niż Intel HD 4000 Core (Core I7-3770K Procesor). Jednak różnica w wykonaniu w tych testach nie jest dwukrotnie, jak firma Intel stwierdziła w swoich materiałach prezentacyjnych i trochę mniej. Niemniej jednak postęp w wydajności podsystemu graficznego jest oczywisty.

Otwarty jednak pozostał kolejnym pytaniem. Tak, wydajność podsystemu graficznego w procesorze Rdzeń I7-4770 wzrósł prawie dwa razy w porównaniu z procesorem I7-3770K. Ale czy to wystarczy dla tej wydajności, aby komputer mógł zostać odtworzony bez użycia dyskretnej karty graficznej? Jeśli spojrzysz na szczegółowy wynik testów 3Dmark Professional i 3Dmark 11 Edycja Advanced (wartość FPS w testach graficznych), możemy stwierdzić, że rdzeń graficzny Intel HD 4600 nie jest odpowiedni dla gier. Jednak wszystkie te same benchmarki 3DMark Professional i 3Dmark 11 Edycja zaawansowane są konkretnymi programami. Dlatego, aby dać obiektywną odpowiedź na to pytanie, zwróć się do wyników badania rdzenia procesora I7-4770 i innych benchmarków gier. W takim przypadku nie ma potrzeby porównywania wyników badań rdzeń graficzny rdzeń rdzeń I7-4770 i rdzeń procesorów I7-3770K, ponieważ jesteśmy zainteresowani jedynie bezwzględnym wynikiem rdzenia procesora I7-4770 w FPS.

  • W tym teście użyliśmy następujących benchmarków:
  • Unigine Heaven Benchmark 4.0;
  • Unigine Valley 1.0;
  • BioShock Infinite (wbudowany benchmark);
  • Metro 2033 (wbudowany benchmark).

Testowanie przeprowadzono podczas rozstrzygania ekranu 1920 × 1080 (mniej rozdzielczości jest po prostu nieistotna) iw dwóch trybach: maksymalna wydajność i maksymalna jakość. Te ekstremalne ustawienia określają rodzaj wtyczki, poza którym FPS nie może już wyjść na dowolne ustawienia gry.

Ustawienia każdego benchmarku na maksymalnej wydajności i trybach jakości przedstawiono w tabeli. 4, stół. 5, stół. 6 i stół. 7 i wyniki testu - na FIG. dziewięć.

Rysunek 9. Intel Core I7-4770 Wyniki testu procesora w grach

i benchmarki do gier

Z wyników testowych jasne jest, że nawet przy ustawieniu do minimalnej jakości (maksymalnej wydajności) wbudowanej w procesor Intel Core I7-4770, rdzeń graficzny nie pozwoli na odtwarzanie nowoczesnych gier 3D. Żaden z benchmarków używanych przez nas, średnia wartość FPS nie wzrośnie powyżej 30 fps, co oczywiście nie można uznać za zadowalający wynik. W związku z tym wniosek jest: rzeczywiście, nowy rdzeń graficzny Intel HD 4600 jest bardziej produktywny w porównaniu z intel Kernel. HD 4000, ale ta okoliczność nie oznacza, że \u200b\u200bwbudowana grafika pozwoli Ci wykonać bez dyskretnej karty graficznej. W przypadku komputera, na którym zostaną uruchomione gry, wbudowana grafika jest wyraźnie odpowiednia.

Wniosek

Podsumowując nasz procesor Intel Core I7-4770, podsumuj.

W porównaniu z procesorem Intel Core I7-3770K wydajność procesora Intel Core I7-4770 wzrosła o około 10% w aplikacjach nie-odtwarzaczów. Jednak mówienie o rozwoju wydajności procesora Haswell, konieczne jest pamiętać o bardzo ważnej okoliczności.

Jedną z głównych zalet procesorów Intel Core (Sandy Bridge) i trzecim (mostem Ivy) było to, że były dobrze przyspieszające, a koncepcja podstawowej częstotliwości zegara była w pewnym stopniu wirtualna. Procesory te zostały podzielone na całkowicie odblokowane (procesory serii C) i częściowo odblokowane (wszystkie inne przetwórcy). Dostęp do procesorów serii K można uzyskać, zmieniając współczynnik mnożenia (maksymalna wartość współczynnika mnożenia, choć istnieje, ale jest dość wysoka).

W przypadku częściowo przyspieszonych procesorów możliwe było ustalenie współczynnika mnożenia na cztery kroki Aboveward niż maksymalna wartość w trybie Turbo Boost. Na przykład procesor Intel Core I7-3770 z częstotliwością zegara podstawowego 3,4 GHz można rozproszyć do częstotliwości 4,3 GHz (stosunek mnożenia 43), ponieważ maksymalna częstotliwość zegara tego procesora w trybie Turbo Boost wynosi 3,9 GHz (mnożenie Stosunek 39).

Jednak w procesorach HASWELL, które nie są związane z serią K, takie częściowe przyspieszenie jest w ogóle zablokowane, a zatem niemożliwe jest ich rozproszenie.

Wydawałoby się inaczej niż manipulacje z czynnikiem mnożenia, procesor można również uzyskać, zwiększenie częstotliwości opona systemowa. Formalnie rzeczywiście, jest to możliwe. Ale jako programy praktyczne, procesory Intel Core of Drugi, trzeci i czwarty pokoleń są prawie niemożliwe do rozproszenia ze względu na wzrost częstotliwości opony systemu. W szczególności nasze eksperymenty z procesorem Intel Core I7-4770 wykazały, że po zwiększeniu częstotliwości opon systemu, tylko 3 MHz system nie jest już ładowany.

Dlaczego Intel zablokował możliwość częściowego podkręcenia - absolutnie niezrozumiałe. Najprawdopodobniej ten nieprzyjazny krok firmy w odniesieniu do użytkowników i partnerów zaangażowanych w produkcję płyt głównych można uznać za błąd marketingowy innej firmy.

Niemożliwość przetaktowania procesorów Haswell, które nie odnoszą się do serii K, prowadzi do następnego smutnego wniosku. Z punktu widzenia kosztów i wydajności jest bardziej opłacalny, aby kupić częściowo odblokowany procesor Intel Rdzeń I7-3770 niż absolutnie zablokowany procesor Intel Core I7-4770. Podgrzewanie go do częstotliwości 4,3 GHz (przyspiesza bez problemów z taką częstotliwością), otrzymasz wyższą wydajność w porównaniu z procesorem Intel Core I7-4770.

"Ciekawe praktyki bez nauki - jak pasza, wchodząc na statek bez kierownicy lub kompasu; Nigdy nie jest pewien, gdzie pływa. Zawsze praktyka powinna być wzniesiona na dobrej teorii ... "(Leonardo da Vinci)

Artykuły dedykowane do mikroarchitektury zasadniczo nowych procesorów Intel, zazwyczaj zaczynają odnieść się do projektu "Tik-SO" przyjęte w Spółce od 2007 roku. Jego istota polega na tym, że rozwój nowych projektów procesorów i przeniesienie produkcji do bardziej zaawansowanych norm technologicznych alternatywny ze sobą. Ostatnia mikroarchitektura, bluszcz most, w tej klasyfikacji był "Tick", nowa, Haswell jest "tak". To jest w twarz Haswell.Teoretycznie musimy zobaczyć fundamentalnie zaktualizowany od wewnątrz procesora, ale technologia wytwarzana przez już znaną technologię 22-NM z trójwymiarowymi tranzystorami.

Dlatego takie wysokie oczekiwania są związane z nadchodzącym zwolnieniem HASWELL. Rynek komputery osobiste Znajduje się w stagnacji. Konkurencja między producentami procesorów X86 w segmencie o wysokiej wydajności pokazano nie, a komputery osobiste Powoli przekazuj swoją pozycję pod atakiem urządzeń mobilnych. Nawet pojawienie się systemu operacyjnego Windows 8 nie został skorygowany, nawet pojawienie się systemu operacyjnego Windows 8 - nie tylko możliwe jest powrót do dawnego zainteresowania komputerami osobistymi, ponadto, wielu adeptów tradycyjnych czynników form spowodował trwałą niechęć . A teraz wszyscy entuzjastom czekają na rewolucję z Intel, mając nadzieję na wysokiej jakości skok, który obudziłby zainteresowanie domyślną dynamiką platformy X86. Ktoś uważa, że \u200b\u200bklasyczne komputery stacjonarne i laptopy mogą ponownie stać się trendem mody, a ktoś oczekuje, że pojawienie się nowej linii procesorów przynajmniej popycha właścicieli już dostępnych systemów do ich modernizacji. Innymi słowy, w oczach entuzjastów produktywnych komputerów osobistych jest prawie ostatnią nadzieją na ożywienie segmentu serca świata.

Jednakże Intel na tym wyniku wydaje się być zupełnie inną opinią. Chłodzenie zainteresowania produktywnymi komputerami osobistymi poczuć w firmie, ale biorąc pod uwagę ustaloną koniunkturę, planuje się nie starać się rozgrzać starych rynków, ale wziąć podboju nowych. Cała ogólna linia podlega korektom. Intel nie zamierza nadal aktywnie walczyć o honor tradycyjnego i znanego wielu systemów, a zamiast tego chce wprowadzić zmiany w architekturze X86 i istniejących produktach, aby dostosować je do tych klas urządzeń mobilnych, które są teraz szczyt popularności. Częściowo ten cel jest początkiem fundamentalnych transformacji w gospodarstwie atomowym: aktywna promocja procesorów tej klasy w smartfonach i tabletach, a także przygotowanie nowej mikroplantu silvermont. Ale równoległa metamorfoza wystąpi z główną linią procesora, która, zgodnie z deweloperami, powinna stać się jeszcze bardziej mobilna. I haswell - choć nie pierwszy, ale prawdopodobnie najbardziej zauważalny kamień milowy na tej ścieżce.


Wszystkie prezentacje i materiały do \u200b\u200bprasy dedykowanej do obiecujących procesorów, na pierwszych stronach mówią nam, że Haswell jest pierwszym dążeniem do Ultrabooks i ultraportacyjnych laptopów, które są przekształcone w przemieszczanie światła ręki do tabletek. I tak jest niemożliwe, aby odzwierciedlić cel, który stanął przed deweloperami nowej mikrochitektury. Jeśli na etapie tworzenia mikroarchitectures mostu piaszczystego i mostu bluszczu, inżynierowie pracowali nad procesorami projektowymi z ukierunkowanym zużyciem mocy 35-45 W, podczas gdy inne opcje uzyskano przez zmianę liczby rdzeni, częstotliwości i napięcia, a następnie z wymaganiami zużycia konsumpcji HASWEL były jeszcze bardziej dokręcone. Teraz Intel uważa, że \u200b\u200bnajbardziej atrakcyjny zakres od 15 do 20 W. Tak więc Haswell jest wyraźną ultra-Aobile Microarchitecture, stojąc pod względem wydajności na etapie powyżej atomu. Jeśli chodzi o modyfikacje pulpitu Haswella, jest to dla Intel - produkt uboczny. Oczywiście jest znacznie łatwiejsze do uzyskania ekonomicznego procesora niż wykonać tę konwersję w przeciwnym kierunku. Ale usunięcie ograniczeń dotyczących zużycia energii i rozpraszania ciepła nie oznacza niezakłóconego skalowania wydajności. Więc ile uzasadnia oczekiwania HASWELL w kapeluszu na pulpicie - pytanie nie jest tak oczywiste.

I tutaj będzie istotne do zapamiętania poprzedniego cyklu "SO", procesory z mikroplantu mostu piaszczystego. W porównaniu z ich poprzednikami, pokolenie Westmere była w stanie dostarczyć tylko około 15-procentowego wzrostu wydajności w środowisku pulpitu, dlatego, że deweloperzy zaczęli przenosić swoje akcenty w stosunku wydajności i zużycia energii. Teraz rozmowa prowadzi również w ogóle w innym języku: Głównymi atutami HASWELL, zgodnie z producentem, jest doskonałą wydajnością i zasadniczo nowym poziomem prędkości graficznej. Jeśli chodzi o wydajność obliczeniową, Intel z jakiegoś powodu nie skupi się na nim, co powoduje wszelkie złe podejrzenia. Po prostu pogorszyłeś się, jeśli spojrzysz na wstępne dane o prędkości pulpitu Haswell, które zostały teraz wyciekane do prasy.

Czekam na wyjście procesorów zbudowanych na przebiegu mikrochitetycznym Haswell, pozostaje bardzo długo. I kilka dni później będziemy mogli dać rozszerzone odpowiedzi na wszelkie pytania. Jednak przed tym, że będzie to właściwe zapoznanie się z teorią - powinno być nawet nieprzyjemne, ale niezbędne antidotum z zbyt tęczy iluzji, które mogłyby być utworzone w uśpionych oczekiwaniu czegoś nowego.

Haswell Microarchitecture: Zaznacz lub tak

Szczerze mówiąc, część wprowadzająca z nadmiernie pogrubia farbę. Tak, Haswell Microarchitecture naprawdę można naprawdę uznać za wysoce energooszczędne i został opracowany przede wszystkim z okiem aplikacji mobilnych. Jednakże Intel nadal nie zapominają, że model biznesowy przyjęty w Spółce wiąże się z wykorzystaniem pojedynczej konstrukcji w szerokiej linii produktów, która obejmuje komponenty mobilne, pulpitu i serwerów. Oznacza to, że pod modną fasadą niskiego zużycia mocy, solidna fundacja jest ukryta, co pozwala wysłać haswell do różnych niszach rynkowych. Innymi słowy, nowy mikroarchitektura nie straciła wszechstronności. Manipulowanie liczbą rdzeni, wersje silnika graficznego, docelowego poziomu zużycia energii, rozmiar pamięci pamięci podręcznej i dodanie jednego lub innego zestawu interfejsów zewnętrznych z Haswell można uzyskać inaczej w jego istotę.


Jednakże, jeśli sama mikroarchitektura się dotyczy, tak, w pierwszej kolejności istnieją innowacje mające na celu optymalizację systemów termicznych i energetycznych. Zmiany zdolne do podnoszenia wydajności, nie tak bardzo, a na cyklu rozwoju ", więc" są również narysowane, a następnie z wielką trudnością. Rzeczywiście, gdy Intel produkował Nehalem lub Most Sandy, restrukturyzacja wpływa nie tylko wewnętrzne bloki jąderów obliczeniowych, ale także podstawową koncepcją projektowania procesora. Każde "więc" wydawało się, że jest naprawdę zasadniczo inny, a Duch został schwytany na stopniu innowacji. Ale jeśli spojrzysz na uogólniony schemat Haswell, łatwo jest mylić z poprzednikiem - bluszczy mostem.


Wszystkie bloki funkcjonalne i zasady ich stowarzyszenia w procesorze pozostały takie same. Haswell dziedziczy wszystkie udane technologie z przeszłości: turbo, hiper-gwintowanie, pierścień, ale nic nowego do tego bagażu dodaje. Są zmiany tylko w głębi poszczególnych węzłów. Ponadto zakłócenia inżynieryjne w głębokich warstwach mikroarchitektury nie są zbyt duże. Przenośnik wykonawczy nie zmienił się zbyt wiele, jego długość jest taka sama 14-19 etapów jak poprzednio. Część czołowa otrzymała tylko indywidualne ulepszenia kosmetyczne, a wszystkie istotne zmiany odnoszą się tylko do mechanizmu wykonywania instrukcji i wspierać nowe zestawy poleceń. Mówiąc o tym, czy haswell jest bardziej produktywnym mikroarchitektury, a nie mostem bluszczu, Intel odnosi się do poprawy wydajności do 20-30 procent, ale należy go pamiętać, że ocena ta obejmuje wygraną z wykorzystania nowych poleceń AVX2, dla których długi czas i Trudna implementacja sceny jest nadal przed nami.

Wydajność: dla niej

Ale kroki podjęte w celu poprawy opłacalności projektu procesora, debugują nawet debugowanie. Udział Lwią o wysiłkach deweloperskich wydano na zmniejszenie zużycia energii, a muszę powiedzieć, z punktu widzenia systemów mobilnych, wysiłki te były dalekie od zastanawiania się. Oczekuje się, że ma pracować z baterii o około 50 procent dłużej niż podobne konfiguracje oparte na moście Ivy. W prostym wygranej w porównaniu z procesorami poprzedniej generacji wynosi około 2-3 razy! Oraz w stanie gotowości do pracy podczas oszczędzania połączenia sieciowe (Połączony tryb gotowości) ogólna platforma zużycia w porównaniu z systemami opartymi na moście piaszczystym zmniejszyła się o około 20 razy.

Takim imponującym postępem z korzeniami nie jest proste w celu poprawy procesu technologicznego, który w rzeczywistości ma tylko różnice ewolucyjne z procesu technicznego 22-nm z trójwymiarowymi tranzystorami stosowanymi do produkcji mostu Ivy. I jeszcze bardziej, więc sprawa nie jest w banalnym wzroście liczby stref kryształu procesora, który w przypadku braku aktywności można odłączyć od magistrali dostaw niezależnie od siebie. Oczywiście, wszystko to sprawia, że \u200b\u200bwkład w gospodarkę HASWELL, ale takie zmiany występują przy każdej nowej generacji procesorów Intel, a skok wysokiej jakości stało się tylko teraz. Więc tajemnica sukcesu jest w innym.

Krótko mówiąc: Nowe granice gospodarki zostały osiągnięte dzięki zestawowi wydarzeń, prowadził nie tak bardzo z samym procesorem, jak w przypadku platformy i infrastruktury jako całości.

Po pierwsze, ogólna integracja składników platform odegrała ważną rolę: znacząca część schematu konwertera zasilania była przysiągł do kryształu procesora, a specjalistyczna wersja procesora została zaprojektowana dla zastosowań ultramotycznych, która zawiera drugi kryształ To samo substrat - zestaw logiki systemowej.


Po drugie, Intel spędził znaczącą pracę z głównymi producentami kontrolerów, wskazując na potrzebę wysokiej jakości wsparcia snu i głębokiego snu. Po drodze obliczane są deweloperzy, wreszcie osiągnąć od producentów monitorów monitorów monitorujących panel pomocy technicznej, umożliwiając zapisywanie obrazu na ekranie bez ciągłej aktualizacji z rdzenia graficznego.

Po trzecie, system operacyjny Windows 8, którego jądro jest znacznie bardziej preferowane do przetwarzania przerwania, w miarę możliwości, próbując uniknąć rozproszonych transakcji, które przebudzają procesor lub urządzenie.

I wreszcie, w czwartym, Haswell ma nowy zestaw stanów snu S0IX, podobny do poziomu zużycia energii na S3 / S4 (gdy wszystkie elementy platformy są wysyłane do zobowiązań), ale z czasem tłumaczenia system w stanie w pełni operacyjnym na poziomie kilku milisekund. Ponadto dodano również nowe stany bezczynności procesora C7 i dodatkowo osiągnięte przy widocznej pracy systemu, ale przy czym napięcie zasilania można całkowicie usunąć z głównej części CPU.


Jednak wszystkie powyższe dotyczą przede wszystkim platform mobilnych i czas trwania ich pracy baterii. W systemach desktopowych większość z tych innowacji ma również, ale dla użytkowników końcowych są one praktycznie obojętni. Jak wpływa na najbardziej bezpośrednio, ten wygląd w nowych strefach HASWELL działających na różnych częstotliwościach. W moście bluszczu było dwie takie strefy: jądro obliczeniowe (wraz z kasem i agentem systemowym) oraz rdzeń graficzny. Ale nie okazało się lepsza decyzja Z punktu widzenia wydajności, ponieważ odwołania wykresów do danych w L3-Keshe doprowadziły do \u200b\u200bwyjścia z energooszczędnych stanów całego procesora. Dlatego w części HASWELL Uncore, który łączy agent systemowy i podatek trzeci poziom, otrzymał własną częstotliwość niezależną.

I to nie ma pozytywnej zmiany, ale jasnej ilustracji tych priorytetów, które inżynierowie Intel są przestrzegane rozwój nowego projektu. Asynchroniczne prace Uncore i Computing Jądra prowadzi do faktu, że pamięć podręczna trzeciego poziomu w Haswell ma większe opóźnienia niż procesory poprzedniej generacji. Innymi słowy, ze względu na poprawę efektywności Intel jest gotowy do nawilżania zarobków zarobkowych zarobionych wcześniej.

Ale wszystkie środki podjęte przez Intel w celu zmniejszenia zużycia energii, pozwalają Spółce znacząco rozszerzyć zakres rdzeniowych energooszczędnych procesorów. W segmencie mobilnym pojawienie się obszernej i obejmuje około dwóch tuzina elementów serii U, z charakterystyczną obliczoną generacją ciepła około 15 W. Ponadto oczekuje się, że seria Y z rozpraszaniem ciepła przy 6-7 W. Dane te wydają się szczególnie imponujące, jeśli weźmiemy pod uwagę, że rozmawiamy o rozproszeniu ciepła montażu, który obejmuje oprócz rdzenia procesora i kryształu zestawu logiki.

Dla tych, którzy chcieli szybko

Ale nadal, wkładanie pomysłów reorientingowych procesorów rdzeniowych na laptopach ultra-samochód i płyt produkcyjnych, Intel nie zapomniał trochę o samym sercu swoich procesorów. Chociaż jądro obliczeniowe Haswell są bardzo podobne do jądra mostu Ivy, nadal można znaleźć wiele ulepszeń. To prawda, że \u200b\u200bte ulepszenia są w ogóle nie od pragnienia, aby podnieść czystą wydajność - liczba instrukcji przetwarzanych za taktum. Powodem ich wyglądu jest wprowadzenie nowych instrukcji AVX2 i pragnienie zwiększenia wydajności technologii hiper-gwintowania, który będzie musiał zrekompensować niemożność stosowania czterech pełnoprawnych jąder w procesorach tanich. Ale na szczęście istnieją pozytywne skutki uboczne wśród innowacji.

Przednia część przenośnika wykonawczego Haswell pozostała prawie nietknięta. Nowa mikroarchitektura, a także jego poprzedniki, zostaje zaostrzone w przetwarzaniu czterech instrukcji dla taktu. Jednostka próbki instrukcji i dekoder mają dokładnie szerokość. Pozostała niezmieniona i pamięć podręczna instrukcje pierwszego poziomu 32 KBYTES, a także pamięć podręczna wprowadzona w mostku Ivy dla dekodowanych instrukcji na pół i pół tysiąca mikro operacji. Zalety na tym etapie w HASWELL przed przeszłym projektem są tylko dwa. Po pierwsze, z powodu nowego projektu procesora, z każdym zwolnieniem, wielkość wszystkich buforów wewnętrznych zwiększyła dokładność bloku przewidywania przejścia. Po drugie, kolejka już zdekodowanych instrukcji otrzymała wyraźną optymalizację pod hyper-gwinting: jego podział na dwa strumienie zaczęły występować dynamicznie.


W rzeczywistości brak zmian w podstawowych algorytmach instrukcji pobierania próbek i dekodowania oraz jest wyraźnym wskazaniem, że nie jest szczególnie warta oczekiwania na zwiększenie przetwarzania instrukcji w HASWELL. Więcej niż cztery (lub pięć w przypadku udanej pracy technologii Fusion Macro-Ops) X86 Polecenia ta architektura nie może strawić. A jeśli wcześniej w cyklu rozwoju "Więc" Intel dokonał innowacji, które mogłyby zwiększyć wydajność pracy istniejących dekoderów, teraz nie jest to.

Znane zmiany w mikroarchituwicucie HASWELL są wykrywane, jeśli przejdziesz do głębiej przenośnika. Tak więc wzrost wszystkich głównych buforów dotknął nie tylko przewidywania przejść. Ważne jest, aby w tym samym czasie zwiększono niezwykłe okno wykonania. Osiąga to pewne doskonalenie możliwości w zakresie równoległego przetwarzania instrukcji pojedynczego przepływu, który ostatecznie umożliwia szybsze obciążenie urządzeń wykonawczych (Koi w Haswell, nie tylko więcej, ale bardziej zauważalny).


Właściwie, na tle wszystkich innych, dość nieszczęśliwych ulepszeń w szacunkach mikroarchitowych, może to być główną zaletą nowej konstrukcji mikroprocesorowej. Jeśli udzielono tylko sześciu portów wykonawczych w moście Ivy, było osiem w HASWELL.


Tak więc w teorii Haswell może obsługiwać do ośmiu mikro-operacji na takt. Należy jednak zauważyć, że trzy porty są przypisane do operacji pamięci, czyli one przeznaczone do utrzymania pomocniczych mikroprzedsiębiorstw wynikających z demontażu instrukcji X86.

Dlatego pojawienie się oddzielnego portu dla operacji całkowitej i oddziałów przetwarzania ma ogromne znaczenie. Oczywiście, zakłada się, że w czasie, liczba 256-bitowych instrukcji stosowanych w programach wzrośnie, a więc nie blokują pracy najczęstszego kodu, jego wykonanie może być teraz przeznaczone na niezależny port. Takie porty "Uwolnienie" według rodzajów operacji powinny dać szczególnie silny pozytywny wpływ, jednocześnie wykonany przez jeden rdzeń dwóch heterogenicznych strumieni z udziałem technologii hiper-gwintowania. Oznacza to, że znów jesteśmy w obliczu wzrostu jego skuteczności w HASWELL.

Również procesor okazał się teraz łącznie cztery porty zdolne do pracy z instrukcjami całkowitymi. Oznacza to, że najbardziej zwykły kod liczby całkowitej może przejść przez etap wykonania z tym samym tempem, co przez dekoder.

Jednak oceniając przez ogólne podejście do projektowania nowej mikroarchitektury, Intel myślał o rozwoju liczby instrukcji przetwarzanych przez ten ostatni. Co prawdopodobnie martwi się deweloperzy jest znacznie silniejszy, działa z nowymi zespołami z zestawu AVX2. Te wiele instrukcji obejmuje 256-bitowe polecenia SIMD do obróbki liczb całkowitych, rozrachowanych operacji pamięci i różnych permutacji i zmianach wektorów. Ale lwa i najważniejsza część nowego zestawu poleceń jest zasadniczo nowa instrukcje zasadnicze (skondensowane mnożące dodanie), które faktycznie obejmują parę operacji - mnożenie i dodawanie. Oczywiście ich wykonanie przez stare agenci spowodowałyby znaczny procesor występy, więc dwa odrębne porty są teraz wykonane dla nich i podkreślonych siłowników. W rezultacie Haswell może wykonywać dwie dual instrukcje FMA dla taktu.


W ten sposób teoretycznie haswell na kodzie AVX2 może pokazać dwukrotnie wyższą wydajność materiału szczytowego niż procesory dawnych pokoleń. Chociaż, w rzeczywistości, jeśli porównujesz szybkość wykonania jednej instrukcji FMA i oddzielne instrukcje dotyczące mnożenia i dodawania, wówczas rzeczywistą kwotę przyspieszenia będzie w 60 procent, co oczywiście jest również bardzo dobre.

W pewnym stopniu wdrażanie szybkiej realizacji poleceń FMA jest odpowiedzią Intel na rosnącej popularności obliczeń na procesorach graficznych. Zestaw AVX2 i dostępny sprzęt do przetwarzania sprawiają, że haswell doskonała numeryczna, a same instrukcje pasują idealnie w popularnych algorytmach obliczeniowych stosowanych zarówno w polach naukowych, jak i podczas przetwarzania różnych treści multimedialnych.

W związku z tym procesory Haswell nadal mogą być znacznie bardziej produktywne niż ich poprzedniki. Ale nie kosztem szybszego wykonania starego kodu, a dzięki zapewnieniu narzędzi do najlepszej realizacji starych algorytmów nowy system instrukcje. Jest to oczywiście wymaga pewnych wysiłków ze społeczności programisty, ale nie prowadzi do dodatkowych kosztów procesora energii elektrycznej, który doskonale pasuje do linii ogólnej, którą Intel przestrzegają teraz.

Pragnienie uczynienia pracy procesora z instrukcjami AVX2 tak płynnie, jak to możliwe, wymusił programistów Haswell, aby pomyśleć o zwiększeniu szybkości pamięci podręcznej. Nowe zespoły są sugerowane dwa razy szybciej niż wcześniej, przetwarzanie danych. Dlatego, aby utrzymać saldo w nowej mikroarchitektroniu, przepustowość pierwszego i drugiego poziomu jest symetrycznie zwiększona. Podkreślamy, rozmawiamy o rozszerzeniu przepustowości L1 i L2-Keshy, opóźnienie tej samej pamięci podręcznej pozostaje na tym samym poziomie, co wcześniej.


W rezultacie pamięć podręczna pierwszego poziomu była w stanie wypracować dwa odczyty 32-bajtów i jeden 32-kluczowy nagranie na takt. Pamięć podręczna drugiego poziomu może odbierać i podać dane przez 64 bajtów danych. W tym iw innym przypadku istnieje dwukrotny wzrost przepustowości w porównaniu z mikroprzy mikroarchetetami procesorowymi. Plus, Haswell w końcu udało się wyeliminować wszystkie dodatkowe opóźnienia związane z odwołaniami do danych pozaopoziomowych w L1-Keshe.

Niestety, ulepszenia poszło wokół wyczyn trzeciego, który obecnie działa na własnej częstotliwości asynchronicznie z jąderami obliczeniowymi. I chociaż jego częstotliwość jest bliska częstotliwości głównej części procesora, asynchronia powoduje wzrost opóźnienia. Nie stosowała się odszkodowania w formie rosnącej przepustowości. Pierścień wewnątrzrynkujący w Haswell jest przenoszony z mostu Ivy bez zmian, więc wyciągnij się z L3-Kesha ponad 32 bajtów danych dla rytmu jest niemożliwe z całym pragnieniem.

Podsumowując, zauważamy, że chociaż haswell na mikroarchitektroniu jąder obliczeniowych i jest podobny do mostu bluszczu, ulepszenia, które mogą zwiększyć jego prędkość na zwykłym kodzie, jest nadal. W rzeczywistości, pomiędzy wszystkimi etapami przenośnika przeprowadzono poważne brewancję, która doprowadziła do tego, że chociaż prędkość pobierania próbek i dekodowania instrukcji i pozostała prawie taka sama, wykonanie tych instrukcji może teraz wystąpić szybciej i z większym stopniem równoległości. Ale wpłynie to na prawdziwe wykonanie HASWELL, zależy od tego, czy realizacja jest naprawdę, a nie dekodowanie było wąskim wąskim w przeszłości wersjach rdzenia mikroarchitektury.

Zintegrowana grafika: Idziemy na poziom GeForce GT 650m

Jednak w celu odczuwania zwiększonej mocy haswell o 100-procentowej prawdopodobieństwie, absolutnie nie jest konieczne przepisanie dostępnych programów w ramach AVX2. Faktem jest, że w tym procesorze jest ważną rolę, która zajmuje około 30 procent obszaru krystalicznego, nad którym inżynierowie Intel pracowali bardzo ciężko. Jest to zintegrowany rdzeń graficzny. Biorąc pod uwagę główną zawartość aplikacji mobilnych swoich procesorów, Intel prowadzi kolejne ulepszenia w zakresie grafiki w nich i ma na celu zapewnienie, że własny akcelerator nie wygląda gorzej niż rozwiązania innych deweloperów, w tym tych, którzy są praktycznymi. W moście bluszczu widzieliśmy już prawie podwójny wzrost wydajności graficznej w porównaniu z procesorami poprzedniej generacji, która miała miejsce jednocześnie przy wdrażaniu wsparcia dla wszystkich nowoczesnych wersji interfejsu oprogramowania. Mikroarchitektura Haswell obiecuje podnieść prędkość jądra graficznego, jest nadal nieco dwukrotnie.


Plany rozwoju, jak widzimy, były ambitne, ale jednocześnie, jak w jądrach obliczeniowych, w tym przypadku Intel był w stanie wykonać bez wprowadzenia głębokich zmian architektonicznych. Struktura rdzenia graficznego pozostaje stara, a wzrost wydajności zapewnia się w czystej formie obszernych metodach. Nowa architektura ekranu Intel Video Promisuje się tylko w 2014 r. - w następnej generacji procesorów z nazwą kodu Broadwell. W rezultacie, jak jądro obliczeniowe, rdzeń graficzny Haswell przynosi myśli, że "więc" i z nowego procesora okazały się nie zbyt wiarygodne. Jednak nie umniejsza to osiągniętego wzrostu prędkości, co oczywiście zasługuje na zapoznanie się z jego źródłami jeszcze więcej. Zwłaszcza, że \u200b\u200bw nowym generacja Intel. Grafika HD Miejsce znalazło bardzo zabawne rozwiązania inżynieryjne.


Z wyjątkiem indywidualnych optymalizacji przenośnika graficznego, którego celem jest przenoszenie części obciążenia ze sterownika do bloków sprzętowych i zwiększenie wydajności najbardziej wyspecjalizowanych bloków funkcjonalnych wykonujących w przenośniku renderowania 3D renderowania operacji przygotowawczych, nowy rdzeń graficzny jest znacznie podobny do jądra Procesory poprzedniej generacji z dodatkowym wspornikiem DirectX 11.1. Główną zaletą nowego projektu jest obecność znacznie większej liczby urządzeń wykonawczych uniwersalnych. Jeśli maksymalna wersja wykresu mostka bluszcza ma 16 urządzeń wykonawczych (w tym 4 alu), a następnie liczba urządzeń wykonawczych w rdzeniu graficznym Haswell może osiągnąć do 40 sztuk.

Jednakże Intel postanowił przeprowadzić bardziej wyraźną segmentację i na podstawie jednego projektu, aby wykonać kilka opcji graficznej: GT1, GT2, GT3 i GT3E. Wersja podstawowa to GT2 z 20 urządzeniami wykonawczymi. Jest przeznaczony dla większości modeli procesorów i oferuje 4 urządzenia więcej niż starszą grafikę procesorów wytwarzania mostu Ivy. Jednak jego przycięta wersja, GT1, ma tylko 6 urządzeń wykonawczych i różni się niewiele od grafiki już obecnej w istniejącym procesorach Pentium i Celeron. Maksymalna opcja, GT3, która ma 40 urządzeń uruchamiających, jest GT2 z podwójnym klastrem wykonawczym. Taka pompowana wersja ekranu wideo jest skierowana do większości wariantów mobilnych Haswell, w tym głównie przetwórców dla Ultrabooks. Dwa i pół wielokrotnego wzrostu liczby siłowników i powinien, zgodnie z rozwojem deweloperów, zapewnić dwukrotny wzrost wydajności grafiki. Jednak taka produktywna wersja ruchu wideo, GT3, nie spadnie na komputery stacjonarne. Oznacza to, że na desktopie zintegrowanej grafikę Intel, wzrost wydajności nie będzie wielokrotny, ale tylko około 30 procent.


Jest ciekawa, że \u200b\u200bw rzeczywistości kryształ półprzewodnikowy Haswell będzie miał jeden lub dwa urządzenia wykonawcze bardziej niż dostarczane przez projekt. Dodatkowe urządzenia odgrywają rolę zapasową, są one potrzebne do wymiany bloków nieorkalnych i zmniejszenie liczby uszkodzonych procesorów.

Wzrost władzy klastra wykonawczego rdzenia graficznego wymusił programistów projektowych, aby pomyśleć o tym, że jest wąskim wąskim układem tekstury. Dlatego prędkość bloku tekstury w Haswell została symetrycznie wzrosła. Intel obiecuje czterokrotny wzrost prędkości teksturowania w porównaniu z grafiką mostu bluszczu, a to jest wystarczające wzmocnienie, jeśli weźmiesz pod uwagę wzrost mocy reszty silnika.

Jednak pomimo wszystkich podjętych środków nawet wykonanie GT3 wydawały się niewystarczające Intel, aby przyciągnąć własne zintegrowane rdzenie najbardziej wymagających użytkowników. Dlatego dla systemów mobilnych do gier produkcyjnych Intel stworzył wyspecjalizowaną modyfikację naładowania GT3E. W procesorach z takim jądrem, który utworzy oddzielną mobilną serię H, wbudowany rdzeń GFAL GT3 zostanie uzupełniony przez szybką pamięć EDRAM o objętości 128 MB i opony 512-bitową. Chodzi o to, że znaczące ograniczenia dotyczące prędkości wbudowanego nagrywarki wideo nakładają niewystarczającą przepustowość pamięci systemowej, która również odgrywa rolę pamięci wideo w takich przypadkach. Edram zostanie zainstalowany na jednym podłożu kernel procesora I wykonaj rolę L4-Kesha, zapewniając przepustowość około 64 GB / s. Jednakże, nie ma wyspecjalizowanego interfejsu między rdzeniem graficznym a EDRAM, dzięki czemu taka pamięć podręczna L4 buforuje wszystkie kontakty w pamięci i nie tylko inicjowane przez rdzeń graficzny. Niemniej jednak Intel oczekuje, że ten dodatek będzie mógł wycofać haswell na wydajności graficznej o jeden poziom z NVIDIA GEFORCE GT 650M.


Należy jednak rozumieć, że dodanie dodatkowego kryształu procesora Crystal Crystal Crystal znacznie zwiększa zużycie energii i koszt procesora, więc procesor z GT3E ma być stosowany wyłącznie w laptopach o wysokiej wydajności, gdzie mówimy o Gospodarka, zwartość i budżet. Tak więc firma AMD z jego APU Generacji Richland nie mieli jeszcze poczucia szczególnej presji od konkurenta. I zwykle dotyczy środowiska pulpitu: oferowanie szerokiej gamy procesorów z produktywnymi rdzeniem graficznymi dla tego segmentu rynku Intel nie uważa go za konieczne.

Jednak nawet użytkownicy Systemów Desktopowych będą mogli oszacować inne zalety rdzenia graficznego nowej generacji, takich jak zaawansowane możliwości połączenia monitora. Haswell obsługuje pracę do trzech niezależnych wyświetlaczy, a wszystkie trzy połączenia mogą być cyfrowe. Dzięki tej samej implementacji kompatybilności z najnowszymi wersjami interfejsów HDMI i DisplayPort, maksymalne obsługiwane uprawnienia osiągnęły wartości 4kx2K.

Bez poprawy nie ma żadnego z ulubionych niemowląt Intel - The Hardware Video Encoder Szybka synchronizacja znajduje się w rdzeniu graficznym. Deweloperzy uważają go za jeden ze sposobów zmniejszenia zużycia energii procesorów, ponieważ szybka synchronizacja pozwala uwolnić jądra obliczeniowe z energochłonnych i bardzo typowych zadań wideo kodującego i dekodującego, przenosząc je do specjalistycznego i ekonomicznego węzła. Dlatego w każdej nowej wersji projektu procesora, wydajność szybkiej synchronizacji wznosi się, a liczba formatów obsługiwanych przez tę technologię rośnie. Tak więc, oprócz już opanowanych formatów będzie w stanie pracować na poziomie sprzętu z SVC (skalowalny kodowanie wideo - pochodną AVC H.264), dekodowanie MJPEG (Motion JPEG) i koduje wideo w formacie MPEG2. Zapewni pełnoprawną zgodność podczas kodowania i dekodowania z wideo w rozdzielczości 4K (4096x2304, 4096x2160 i 3840x2160), która obecnie staje się coraz bardziej popularna.

Szybki koder synchronizacji wzrosła i wzrosła. A teraz jest nieodłączny w nie tylko wysokiej przepustowości, ale także niskiej opóźnienia, otwierając ścieżkę w telekonferencji. Szybkość kodowania w Haswell jest zauważalnie wyższa niż most Ivy różne wersje. Kernel graficzny jest inny i nieco. Ale jakość wideo uzyskanego podczas kodowania sprzętu poprawiła się w dowolnych modyfikacjach graficznych. Zaktualizowana technologia szybkiej synchronizacji powinna zapewnić najlepszą jakość zakodowanego obrazu niż most Ivy, nawet z tym samym bitrate.

Wniosek

Oczywiście nowy mikroarchitektura Haswell może wydalać zarówno nadzieje na jasną przyszłość, jak i rozczarowanie osiągniętej postępy. Wszystko zależy od tego, czego oczekujesz. Niestety, system Intel "Tik-tak" niewidocznie popycha oczekiwania, ponieważ Haswell odnosi się do cyklu rozwoju "tak", to znaczy powinno być postrzegane jako nowa generacja mikroarchitektury. Ale nie ma w nim wiele podstawowych i rewolucyjnych ulepszeń. Nie mówimy o fundamentalnym przetwarzaniu projektowania procesora, ale tylko o pewnym zestawie ulepszeń i ulepszeń. Oczywiście ulepszenia tych wielu, a nawet rozmawiasz o przejściu ilości w jakości. Ale tak może być, Intel faktycznie zmusił dostępny mikroarchitekturę Mostu Ivy'a i nie sugerował czegoś fundamentalnego nowego. Co więcej, głównym naciskiem podczas zakończonego przetwarzania nie był w poszukiwaniu sposobów zwiększenia wydajności obliczeniowej, ale poprawić efektywność energetyczną i rozwój możliwości graficznego.

Z punktu widzenia, tradycyjnie procesor Paradigm, Haswell Microchitectura oferuje tylko wsparcie dla nowego zestawu instrukcji AVX2, najlepszy równoległość na poziomie wykonywania instrukcji i zwiększonej przepustowości pierwszego i drugiego poziomu. Czy takie zmiany są wystarczające, aby sprostać oczekiwaniom adherents klasycznych komputerów osobistych? Mało prawdopodobny. Dlatego większość entuzjastów widzących tylko niewielki wzrost prędkości obliczeniowej, który traci prawdopodobnie w ciągu 5-15 procent, najprawdopodobniej nowe procesory będą nieszczęśliwe. Oznacza to, że żaden wybuch interesujący w zwykłych komputerach stacjonarnych i laptopach nie jest przewidywany iz wydawnictwem nowej rodziny procesora.

Ale Intel, pomimo tego wszystkiego, może być dumny z wykonanej pracy. Firma ustanowiła przed nim zdecydowana. Konstrukcja Haswell okazała się tak energooszczędna i zrównoważona, że \u200b\u200bte procesory, poza wszelką wątpliwością, będą mogły podjąć godne miejsce w braku producenta podgatunkowych urządzeń mobilnych - produktywnych tabletek i laptopów transformatorowych. Planowanie Spółki na tym rynku nie obchodzi nie przejmuje się: w odpowiedzi na wykopaliska kohorty adherents of Architecture Architecture, a także na nowym AMD APU, Intel ma teraz dobry rachunek billet. W końcu mikroarchitektura haswell umożliwia tworzenie modyfikacji projektowych, które posiadają wskaźniki zużycia energii wyrażające w jednoznacznych liczbach, a także montaż SOC, w tym nie tylko procesor, ale także zestaw logiki systemowej.

Na tym nie umieścimy jeszcze ostatniego punktu. Ten materiał otwiera tylko cykl artykułów na procesorach z nową mikroarchitekturą. W najbliższej przyszłości możemy łatwo iz prawdziwymi procesorami w twoich rękach Zapoznaj się zarówno z przykładami wykonania Mikroarchitektury Mikroarchitektury w Mikroarchitektury. I wtedyByć może nasze wnioski dokonane tylko na podstawie znajomości z dokumentacją będzie nieco zmienić. I naprawdę chcę w to wierzyć ...

Dzwon.

Są ci, którzy przeczytali tę wiadomość przed tobą.
Subskrybuj odbieranie artykułów świeżych.
E-mail
Nazwa
Nazwisko
Jak chcesz przeczytać dzwonek
Bez spamu