زنگ

کسانی هستند که این اخبار را قبل از شما می خوانند.
برای دریافت جدیدترین مقالات مشترک شوید.
پست الکترونیک
نام
نام خانوادگی
چگونه می خواهید زنگ را بخوانید
بدون هرزنامه

ریز پردازنده Elbrus-4S (1891VM8Ya) - ریزپردازنده جهانی چند هسته ای با کارایی بالا و مطابق با معماری پیشرفته Elbrus ساخته شده است.

Elbrus-8SV و Elbrus-16S

هر هسته پردازنده رمزگشایی شده و در هر چرخه ساعت حداکثر 23 عملیات برای اجرا ارسال می کند.

Elbrus-4C یک سیستم بر روی تراشه است که شامل 4 هسته محاسباتی ، حافظه پنهان سطح 2 با حجم کلی 8 مگابایت ، 3 کنترل کننده حافظه ، 3 کانال ارتباطی پردازنده و یک کانال ورودی-خروجی است.

فرکانس ساعت کار میکرو مدار 800 مگاهرتز است. کریستال مطابق استاندارد 65 نانومتر ساخته شده است ، متوسط \u200b\u200bاتلاف توان 45 وات است. ابزارهایی برای کاهش چشمگیر اتلاف نیرو در دسترس هستند.

زمینه اصلی کاربرد ریزپردازنده های Elbrus-4S سرورها هستند ، کامپیوترهای رومیزی، رایانه های جاسازی شده قدرتمند طراحی شده برای کار در مناطقی که نیازهای بیشتری برای جنبه های زیر دارند:

  • امنیت اطلاعات
  • محدوده دمای عملیاتی
  • مدت زمان چرخه زندگی محصولات

ویژگی های معماری Elbrus امکان استفاده موثر از پردازنده Elbrus-4C را در سیستم های پردازش سیگنال هوشمند دیجیتال ، در مدل سازی ریاضی ، محاسبات علمی و سایر زمینه های با نیازهای بیشتر برای توان محاسباتی فراهم می کند.

اطلاعات بیشتر را می توان در اخبار مربوط به اتمام آزمایشات پردازنده یافت.

توجه: در حین کار روی پروژه ، از نام کاربری "Elbrus-2S" برای پردازنده استفاده شد.

مشخصات فنی

مشخصه مقدار
ویژگی های عملکردی ریز پردازنده
تعیین تراشه 1891VM8YA
معماری Elbrus (VLIW)
فرکانس ساعت تا 800 مگاهرتز
تعداد هسته ها 4
عملیات در هر ساعت (در هر هسته) تا 23
حافظه پنهان سطح 1 سطح ، در هر هسته 64 کیلوبایت
سطح آموزش سطح 1 ، در هر هسته 128 کیلوبایت
حافظه پنهان L2 (هدف عمومی) 8 مگابایت
سازمان حافظه RAM حداکثر 3 کانال DDR3-1600 ECC
پهنای باند کانالهای RAM 38.4 گیگابایت در ثانیه
امکان ترکیب در یک سیستم چند پردازنده با حافظه مشترک منسجم حداکثر 4 پردازنده
کانالهای ارتباطی بین پردازنده 3 ، دوبلکس
پهنای باند هر کانال ارتباط بین پردازنده 12 گیگابایت در ثانیه
کانالهای ورودی / خروجی / RemoteDMA 1 ، دوبلکس
پهنای باند I / O / RemoteDMA 4 گیگابایت در ثانیه
سازگار با پل جنوبی VLSI KPI
مشخصات فنی میکرو مدار
فرآیند فنی 65 نانومتر
تعداد ترانزیستور 986 میلیون
ولتاژ تغذیه 1.5 ولت ، 2.5 ولت ، 3.3 ولت
محدوده کاری دمای متوسط -60 ... + 85 درجه از جانب
مصرف برق 45 وات
سال شروع تولید 2014
فن آوری های اضافه شده
فناوری صرفه جویی در انرژی وجود دارد

گالری

در وبلاگ ویدئویی ماکسیم گورشنین ، بررسی رایانه داخلی آماده "Elbrus-801 PC" بر اساس پردازنده 8 هسته ای روسی "Elbrus-8C" منتشر شده است. گزارش شده است که تولید سریالی اقلام جدید در سه ماهه دوم سال 2017 آغاز می شود.

طبق اطلاعاتی که قبلاً در رسانه های روسی منتشر شده ، Elbrus-8C یک پیشرفت کاملا روسی است: معماری ، مدار و توپولوژی ریزپردازنده توسط متخصصان موسسه ماشین آلات کنترل الکترونیکی (INEUM) و MCST طراحی شده است.

پردازنده جدید روسی Elbrus-8C منتشر شد. این بار خیلی خنده دار نیست

این تراشه دارای 8 هسته با معماری بهبود یافته 64 بیتی Elbrus نسل سوم است. حجم حافظه نهان سطح دوم و سوم به ترتیب 4 و 16 مگابایت است. فرکانس ساعت هر هسته Elbrus-8S 1.3 گیگاهرتز است. عملکرد ادعا شده به 250 گیگافلوپ (میلیاردها عملیات نقطه شناور در ثانیه) می رسد. یک فناوری ساخت 28 نانومتری ارائه شده است.

ویدئو از کانال ماکسیم گورشنین شامل بسیاری از موارد جالب در مورد PC جدید Elbrus-801 بر اساس این پردازنده 8 هسته ای است:

یک داستان جالب از همان منبع در مورد تابلوهای "Elbrus-8S":

مقاله را با دوستان خود در شبکه های اجتماعی به اشتراک بگذارید!

اولین رایانه های شخصی و سرورهای مبتنی بر پردازنده های Elbrus 8C منتشر شدند

اطلاعات

ریز پردازنده " Elbrus-8S"(1891ВМ10Я) پردازنده ای با کارایی بالا با معماری بهبودیافته البروس است که اجازه می دهد تا 25 عملیات در هر چرخه در هر هسته - 250 میلیارد عملیات شناور در ثانیه. با توجه به استانداردهای فن آوری 28 نانومتر طراحی و تولید شده است که امکان کاهش مصرف برق را فراهم می کند.

ویژگی های "Elbrus-8S":

  • معماری اصلی البرس ، ارائه می دهد بهره وری بالا در محاسبات ریاضی ، رمزنگاری ، پردازش سیگنال دیجیتال.
  • پشتیبانی سخت افزاری برای محاسبات ایمن. یک پشته تماس جداگانه که مزایایی را از نظر فراهم می کند امنیت اطلاعات.
  • اجرای کدهای باینری در مجموعه دستورات Intel x86 و x86-64 با استفاده از ترجمه پویا بدون ترکیب مجدد برنامه ها.
  • دامنه تمدید شده از -60 تا +85 درجه.

وجود 4 کانال دسترسی به حافظه و 3 کانال ارتباطی بین پردازنده امکان ساخت مقیاس پذیر را فراهم می کند مجتمع های محاسباتیارائه سرعت بالا در پردازش و انتقال اطلاعات.

مشخصات فنی

نامگذاری
سری تراشه 1891ВМ10Я
ترکیب 1891VM10AYA - با فرکانس ساعت تا 1300 مگاهرتز
1891VM10BYa - با فرکانس ساعت تا 1000 مگاهرتز
مشخصات فنی
معماری Elbrus ، نسخه 4
مقیاس پذیری 8 هسته در پردازنده
4 پردازنده در ماژول (16 گیگابایت بر ثانیه ارتباط جفتی)
2 ماژول در ماشین
فرکانس ساعت 1300 مگاهرتز (1891VM10AYA)
1000 مگاهرتز (1891VM10BY)
اوج عملکرد 25 عملیات در هر ساعت در هر هسته (8 واحد ، 12 ماده)
250 GFLOPS تک دقت ، 125 GFLOPS دو دقت
حافظه نهان L1: داده های 64KB + دستورات 128KB در هر هسته
L2: 512 کیلوبایت در هر هسته ، 4 مگابایت در کل
L3: پردازنده 16 مگابایتی
رم 4 کانال DDR3-1600 ECC ثبت شده ، تا 51.2 گیگابایت در ثانیه
64 گیگابایت برای هر پردازنده
فضای آدرس دستگاه 1 ترابایت
پیرامون 1 کانال ورودی / خروجی ، حداکثر 16 گیگابایت در ثانیه
کنترل کننده سازگار - KPI-2
پارامترهای فنی
توپولوژی 2.73 میلیارد

ترانزیستور
28 فرآیند نانومتری ، فرایند 321 میلی متر مربع

مسکن 59.5 x 43.0 x 4.6 میلی متر ، 32.0 گرم
2028 پایه FCBGA
منبع تغذیه 0.9 ولت ، 1.0 ولت ، 1.15 ولت ، 1.5 ولت ، 1.8 ولت
80 وات (1891VM10AYA)
60 وات (1891WM10BY)
شرایط استفاده −60 ... + 85 درجه سانتیگراد
−40 ... + 90 درجه سانتیگراد
دسترسی تولید سریال از سال 2016
مستندات TVGI.431281.016

AWP Elbrus 401 اولین رایانه روسی با پردازنده ساخت روسیه است. مشخصات ، بررسی ، شرح Elbrus 401

بسیاری منتظر آزادی بودند اولین رایانه روسی و سرانجام ، یک آغاز وجود دارد ، یک کامپیوتر AWP وجود دارد Elbrus-401 با پردازنده ساخت روسیه.

پردازنده Elbrus-8S! 28 نانومتر برو روسیه!

اگرچه خیر ، 1 نسخه قبلی رایانه روسی Elbrus 4.4 قبلاً قبل از آن منتشر شده بود.

بیایید ببینیم که از چه چیزی ساخته شده و ویژگی های Elbrus-401 چیست. این کامپیوتر در کیس MiniTower مونتاژ می شود و به هیچ وجه ارزان نیست ، اگرچه قیمت Elbrus-401 در آینده باید کاهش یابد. رایانه شخصی بر روی سیستم عامل Elbrus بر اساس هسته لینوکس با قابلیت نصب سایر سیستم عامل هایی که از سیستم عامل Intel x86، x86-64 پشتیبانی می کنند ، قابل اجرا است.

در اینجا برخی از مشخصات کامپیوتر ARM Elbrus-401: با آن فرکانس 800 مگاهرتز کار کنید ، hDD 1 ترابایت و 128 گیگابایت mSATA ، 24 گیگابایت RAM قابل ارتقا تا 96 گیگابایت ، گرافیک سری AMD Radeon 6000 ،

Elbrus-401 فقط یکی از اولین آنهاست رایانه های روسیمتاسفانه کامپیوتر هنوز ارزان نیست. بعداً در فرآیند تولید انبوه قیمت رایانه Elbrus باید پایین برود همچنین ، در آینده نه تنها رایانه ها در روسیه تولید می شوند ، بلکه لپ تاپ ها ، تبلت ها و تلفن های هوشمند قدرتمند نیز تولید می شوند.

من می خواهم نظر شما را بدانم که آیا تکنسین های روسی قادر به رقابت با تولیدکنندگان خارجی هستند و از نظر شما چه زمانی این اتفاق می افتد؟ ترک خود را مرور درباره آینده فناوری رایانه در روسیه.

  • ما خوشحال خواهیم شد اگر شما یک نظر بگذارید ، نظر دهید ، نکات مفید یا علاوه بر مقاله.
  • آیا در مورد این موضوع نظری دارید؟ حتما اضافه کنید!
  • با تشکر از پاسخگویی و نظرات شما!

در این مقاله ، ما نشان خواهیم داد که چگونه فن آوری های شناسایی تصویر در Elbrus-4C و در Elbrus-8C جدید کار می کنند: ما چندین مشکل بینایی ماشین را در نظر خواهیم گرفت ، کمی در مورد الگوریتم های حل آنها صحبت خواهیم کرد ، نتایج معیار ارائه می دهیم و در نهایت یک فیلم نشان می دهیم.



Elbrus-8S پردازنده جدید 8 هسته ای MCST با معماری VLIW است. ما نمونه مهندسی را در 1.3 گیگاهرتز آزمایش کردیم. شاید در تولید سریال افزایش یابد.



در اینجا مقایسه مشخصات Elbrus-4S و Elbrus-8S ارائه شده است.


Elbrus-4C Elbrus-8S
فرکانس ساعت ، مگاهرتز 800 1300
تعداد هسته ها 4 8
تعداد عملیات در هر چرخه ساعت (در هر هسته) تا 23 تا 25
حافظه پنهان L1 ، در هر هسته 64 کیلوبایت 64 کیلوبایت
حافظه پنهان L2 ، در هر هسته 2 مگابایت 512 کیلوبایت
حافظه پنهان L3 ، به اشتراک گذاشته شده است - 16 مگابایت
سازمان حافظه RAM حداکثر 3 کانال DDR3-1600 ECC حداکثر 4 کانال DDR3-1600 ECC
فرآیند فنی 65 نانومتر 28 نانومتر
تعداد ترانزیستور 986 میلیون 2730 میلیون
عرض دستورالعمل SIMD 64 بیت 64 بیت
پشتیبانی از سیستم های چند پردازنده حداکثر 4 پردازنده حداکثر 4 پردازنده
سال شروع تولید 2014 2016
سیستم عامل سیستم عامل "Elbrus" 3.0-rc27 سیستم عامل "Elbrus" 3.0-rc26
نسخه کامپایلر Lcc 1.21.18 1.21.14

در Elbrus-8C فرکانس ساعت بیش از یک و نیم برابر افزایش یافت ، تعداد هسته ها دو برابر شد و خود معماری نیز بهبود یافت.


بنابراین ، به عنوان مثال ، Elbrus-8S می تواند حداکثر 25 دستورالعمل را در هر چرخه ساعت به استثنای SIMD (در مقابل 23 برای Elbrus-4C) اجرا کند.


مهم: ما هیچ گونه بهینه سازی خاصی برای Elbrus-8C انجام ندادیم. کتابخانه EML درگیر بود ، اما دامنه بهینه سازی های البروس در پروژه های ما اکنون به وضوح کمتر از سایر معماری ها است: در آنجا چندین سال به تدریج افزایش یافت و ما نه چندان دور و نه چندان فعال روی پلتفرم البروس کار می کردیم. البته عملکردهای اصلی وقت گیر بهینه شده اند ، اما هنوز دست ها به بقیه نرسیده اند.

تشخیص گذرنامه RF

البته ، ما تصمیم گرفتیم که با راه اندازی محصول Smart IDReader 1.6 محصول خود ، تسلط بر یک بستر جدید را برای ما شروع کنیم که توانایی تشخیص گذرنامه ، گواهینامه رانندگی ، کارت های بانکی و سایر اسناد را فراهم می کند. لازم به ذکر است که نسخه استاندارد این برنامه در هنگام شناسایی یک سند به طور م noثر نمی تواند از بیش از 4 رشته استفاده کند. برای دستگاه های موبایل این بیش از حد کافی است ، اما هنگام محک زدن پردازنده های دسک تاپ ، این می تواند منجر به دست کم گرفتن عملکرد سیستم های چند هسته ای شود.


نسخه سیستم عامل Elbrus و کامپایلر lcc که در اختیار ما قرار گرفت ، به هیچ تغییر خاصی در نیاز نداشت کد منبع و ما پروژه خود را بدون هیچ مشکلی کنار هم قرار دادیم. توجه داشته باشید که در نسخه جدید پشتیبانی کامل از C ++ 11 ظاهر شد (همچنین در آخرین نسخه های lcc برای Elbrus-4C نیز وجود داشت) ، که خبر خوبی است.


برای شروع ، تصمیم گرفتیم نحوه شناسایی گذرنامه روسی را که قبلاً در مورد آن نوشتیم بررسی کنیم در Elbrus-8C. ما آن را در دو حالت آزمایش کردیم: جستجو و شناسایی گذرنامه در یک قاب جداگانه (هر مکان) و در یک فیلم گرفته شده از وب کم (حالت وب کم). در حالت هرجایی ، تشخیص گسترش گذرنامه بر روی یک قاب انجام می شود و گذرنامه می تواند در هر قسمت از قاب قرار گیرد و به صورت خودسرانه جهت گیری شود. در حالت وب کم ، فقط صفحه گذرنامه با عکس شناسایی می شود و یک سری فریم پردازش می شود. فرض بر این است که خطوط گذرنامه افقی هستند و گذرنامه کمی بین قاب ها جابجا می شود. اطلاعات دریافت شده از فریم های مختلف برای بهبود کیفیت تشخیص یکپارچه شده است.


برای آزمایش ، ما برای هر یک از حالت ها 1000 تصویر گرفتیم و میانگین زمان تشخیص (یعنی زمان بدون در نظر گرفتن بارگذاری تصویر) را هنگام راه اندازی در 1 رشته و با موازی سازی اندازه گیری کردیم. زمان عملکرد حاصل در جدول زیر نشان داده شده است.



نتایج مربوط به حالت تک نخ کاملاً مطابق با انتظارات است: علاوه بر شتاب ناشی از افزایش فرکانس (و ضریب فرکانس 4C و 8C 1300/800 \u003d 1.625 است) ، به دلیل پیشرفت معماری ، یک شتاب جزئی محسوس وجود دارد.


در حالت شروع با حداکثر تعداد نخ ها ، شتاب برای هر دو حالت 1.7 بود. به نظر می رسد تعداد هسته های Elbrus-8C دو برابر 4C باشد. پس افزایش 4 هسته اضافی کجاست؟ واقعیت این است که الگوریتم تشخیص ما فعالانه فقط از 4 رشته استفاده می کند و مقیاس ضعیف تری دارد ، بنابراین افزایش عملکرد بسیار ناچیز است.


در مرحله بعدی ، ما تصمیم گرفتیم که به بارگذاری کامل هسته های هر دو پردازنده دست پیدا کنیم و چندین فرآیند شناسایی گذرنامه را راه اندازی کردیم. هر تماس شناسایی به همان روش آزمایش قبلی موازی می شد ، اما در اینجا زمان پردازش گذرنامه بارگیری تصویر از یک فایل را شامل می شود. اندازه گیری زمان بر روی همان هزار گذرنامه انجام شد. نتایج هنگام بارگیری کامل Elbrus در زیر نشان داده شده است:



برای هر حالت ، شتاب حاصله 3.6 ~ به شتاب مورد انتظار نزدیک شد ، زیرا به دلیل اینکه زمان بارگیری عکس از پرونده را در نظر گرفتیم ، به آن نرسید. در مورد حالت وب کم ، اثر زمان بارگیری حتی بیشتر است و بنابراین سرعت ملایم تر است - 2.5 برابر.

ردیابی خودرو

تشخیص اشیا of از یک نوع معین یکی از کارهای کلاسیک دید فنی است. این می تواند تشخیص چهره ، افراد ، اشیا aband رها شده یا هر نوع اشیا دیگر با ویژگی های متمایز باشد.


به عنوان مثال ، ما تصمیم گرفتیم مشکل شناسایی اتومبیل هایی را که در همان جهت حرکت می کنند ، بگیریم. از آشکارساز مشابه می توان در سیستم های کنترل خودکار خودرو ، سیستم های تشخیص پلاک و غیره استفاده کرد. بدون تردید ، ما یک فیلم برای آموزش و آزمایش با استفاده از ضبط ماشین که خیلی دور از دفتر ما نیست ، فیلمبرداری کردیم. ما از طبقه بندی آبشار Viola-Jones به عنوان ردیاب استفاده کردیم. علاوه بر این ، ما از صافی نمایی موقعیت های اتومبیل های یافت شده برای آنهایی که چندین قاب پشت سر هم مشاهده می کنیم ، استفاده کردیم. لازم به ذکر است که تشخیص فقط در مستطیل ROI (منطقه مورد نظر) انجام می شود که کل قاب را اشغال نمی کند ، زیرا تلاش برای تشخیص قسمت داخلی ماشین ما و همچنین اتومبیل هایی که کاملاً درون قاب نمی افتند منطقی نیست.


بنابراین ، الگوریتم ما شامل مراحل زیر است:

  1. برش مستطیل ROI در مرکز قاب.
  2. تصویر ROI رنگی را به خاکستری تبدیل کنید.
  3. پیش محاسبه علائم Viola-Jones.
    در این مرحله ، تصویر مقیاس بندی می شود ، نقشه های ویژگی های کمکی (به عنوان مثال ، مرزهای جهت دار) ساخته می شوند و مبالغ تجمعی برای همه ویژگی ها برای محاسبه سریع موجک های Haar محاسبه می شود.
  4. طبقه بندی Viola-Jones را روی چندین پنجره اجرا کنید.
    در اینجا ، با چند مرحله پنجره های مستطیلی مرتب می شوند که طبقه بندی کننده بر روی آنها راه اندازی می شود. اگر طبقه بندی پاسخ مثبت بدهد ، آنگاه شی شناسایی شد ، یعنی تصویر داخل پنجره مربوط به ماشین است. در این حالت ، ناحیه تصویری که جسم در آن قرار دارد تصفیه می شود: در مجاورت تشخیص اولیه ، پنجره هایی با همان اندازه ، اما با یک مرحله کوچکتر ، انتخاب می شوند و همچنین به ورودی طبقه بندی می شوند. همه اشیا found پیدا شده برای پردازش بیشتر ذخیره می شوند. این روش برای چندین مقیاس از تصویر ورودی تکرار شده است.
    در واقع ، این مرحله پیچیدگی محاسباتی اصلی مسئله را تشکیل می دهد و موازی سازی به طور خاص برای آن انجام شده است. ما از کتابخانه tbb برای انتخاب خودکار تعداد م ofثر رشته ها استفاده کردیم.
  5. پردازش آرایه کشف شده پس از استفاده از ردیاب. از آنجا که تعدادی از کشف های به دست آمده می توانند بسیار نزدیک و مربوط به همان شی باشند ، ما کشف ها را با یک سطح تقاطع به اندازه کافی بزرگ ترکیب می کنیم. در نتیجه ، ما یک آرایه مستطیل به دست می آوریم که موقعیت وسایل نقلیه شناسایی شده را نشان می دهد.
  6. مقایسه ردیابی در فریم های قبلی و فعلی. ما در نظر می گیریم که اگر مساحت تقاطع مستطیل ها بیش از نیمی از مساحت مستطیل فعلی باشد ، همان جسم شناسایی شده است. ما موقعیت جسم را مطابق فرمول ها صاف می کنیم:
    x من = x من + (1-α) ایکس من-1
    تو من = تو من + (1-α) بله من-1
    من من = من من + (1-α) w من-1
    سلام = سلام + (1-α) ساعت من-1
    جایی که ( ایکس, بله) --- مختصات گوشه بالا سمت چپ مستطیل ، w و ساعت به ترتیب عرض و ارتفاع آن است و α ضریب ثابتی است که به صورت تجربی انتخاب شده است.

داده های ورودی: توالی فریم های رنگی به اندازه 800x600 پیکسل.
از این پس ، برای تخمین فریم در ثانیه (فریم در ثانیه) ، ما از میانگین زمان اجرای بیش از 10 اجرای برنامه استفاده کردیم. در این حالت ، فقط زمان پردازش تصاویر در نظر گرفته شد ، زیرا اکنون در حال کار با یک فیلم ضبط شده هستیم و تصاویر به سادگی از یک فایل بارگیری می شوند ، اما در یک سیستم واقعی ، می توانند از طریق یک دوربین تهیه شوند. مشخص شد که این ردیابی با سرعت بسیار مناسبی کار می کند و در Elbrus-4C 15.5 فریم بر ثانیه و در Elbrus-8C 35.6 فریم بر ثانیه تولید می کند. در Elbrus-8C ، بار پردازنده کاملاً کامل نیست ، اگرچه همه هسته ها در اوج قرار دارند. بدیهی است که این امر به این واقعیت مربوط می شود که تمام محاسبات موجود در این وظیفه موازی نشده اند. به عنوان مثال ، قبل از استفاده از ردیاب Viola-Jones ، ما تغییرات کمکی نسبتاً سنگین هر فریم را انجام می دهیم ، و این قسمت از سیستم به ترتیب کار می کند.


اکنون زمان نمایش است. رابط برنامه و رندر با انجام می شود ابزار استاندارد Qt5 هیچ بهینه سازی اضافی انجام نشد.


Elbrus-4C



Elbrus-8S


محلی سازی بصری

در این برنامه ، ما تصمیم گرفتیم محلی سازی بصری را بر اساس نکات خاص نشان دهیم. با استفاده از پانورامای Google Street View که به GPS ارجاع شده است ، به سیستم خود یاد گرفتیم که بدون استفاده از مختصات GPS یا سایر اطلاعات خارجی آن ، از مکان دوربین مطلع شود. از چنین سیستمی می توان برای هواپیماهای بدون سرنشین و روبات ها به عنوان یک سیستم ناوبری پشتیبان ، برای روشن شدن مکان فعلی یا کار در سیستم های فاقد GPS استفاده کرد.


ابتدا پایگاه پانوراما را با مختصات GPS پردازش کردیم. ما 660 تصویر گرفته ایم که تقریباً 0.4 کیلومتر ^ 2 خیابان مسکو را پوشش می دهد:




سپس با استفاده از نقاط ویژه توصیف تصاویر را ایجاد کردیم. برای هر تصویر ، ما:

  1. ما با استفاده از الگوریتم YAPE (Yet Another Point Detector) و توصیف کننده های RFD برای آنها نقاط ویژه ای را برای 3 مقیاس قاب (قاب خود ، قاب 4/3 برابر کاهش و قاب به نصف کاهش یافتیم) پیدا کردیم.
  2. مختصات آن ، مجموعه ای از نکات ویژه ، توصیف کننده های آنها را ذخیره کردیم. از آنجایی که ما توصیف کننده های نقاط منفرد کادر فعلی را با مقادیر توصیف کننده از پایه خود مقایسه خواهیم کرد ، بنابراین می توان توصیف کننده ها را با استفاده از فاصله Hamming به عنوان یک متریک در یک درخت ذخیره کرد. حجم کل اطلاعات ذخیره شده کمی بیشتر از 15 مگابایت بود.

با این کار مقدمات کامل می شود ، حال بیایید به سراغ آنچه مستقیماً در طول برنامه رخ می دهد برویم:

  1. یک تصویر رنگی را به خاکستری تبدیل می کند.
  2. انجام کنتراست خودکار.
  3. با استفاده از الگوریتم YAPE و شمارش توصیف کننده های RFD برای آنها ، نقاط واحد را برای سه مقیاس فریم (همچنین با ضرایب 1 ، 0.75 و 0.5) جستجو کنید. این الگوریتم ها تا حدی موازی می شوند ، اما بیشتر محاسبات متوالی باقی مانده اند. علاوه بر این ، آنها هنوز برای سیستم عامل Elbrus بهینه نشده اند.
  4. برای مجموعه توصیفات به دست آمده ، جستجو برای توصیف کنندگان مشابه در میان ذخیره شده در درخت انجام می شود و چندین مشابه ترین قاب تعیین می شود. برای توصیف کنندگان مختلف ، جستجوی درخت با استفاده از tbb موازی می شود. در این حالت ، برای 5 فریم اول فیلم ، 10 نزدیک ترین فریم را انتخاب می کنیم و سپس فقط 5 فریم می گیریم.
  5. فریم های انتخاب شده برای حذف "پرت ها" تحت فیلتر اضافی قرار می گیرند ، زیرا مسیر حرکت خودرو معمولاً مداوم است.

داده های ورودی: توالی فریم های رنگی به اندازه 800x600 پیکسل.

1.71 گذرنامه ، حالت هرجایی ، s / frame ، بارگذاری کامل پردازنده 1.38 0.43 3.2 گذرنامه ، حالت وب کم ، c / frame ، بارگذاری کامل پردازنده 0.47 0.19 2.5

نتایج برای شناسایی گذرنامه نسبتاً ناچیز بود ، زیرا برنامه ما به شکل فعلی نمی تواند به طور م effectivelyثر از بیش از 4 رشته استفاده کند. وضعیت مشابهی در رابطه با تشخیص وسایل نقلیه و موقعیت بصری وجود دارد: الگوریتم ها دارای مقاطع غیر موازی نیستند ، بنابراین نباید انتظار افزایش مقیاس خطی با افزایش تعداد هسته ها را داشت. با این حال ، در مواردی که هیچ محدودیتی در بارگیری همه هسته های پردازنده توسط برنامه ها وجود نداشته باشد ، ما شاهد افزایش 3.2 برابر هستیم که نزدیک به حد نظری 3.6 برابر است. به طور متوسط \u200b\u200b، تفاوت عملکرد بین نسل پردازنده های MCST در مجموعه کارهای ما حدود 2-3 برابر است و این بسیار خوشایند است. فقط با افزایش فرکانس و بهبود معماری ، بیش از 1.7 برابر سود می کنیم. MCST با استراتژی اضافه کردن 5٪ در سال به سرعت در حال جلب نظر اینتل است.


در طول آزمایش های تحت بار کامل ، هیچگونه یخ زدگی یا خرابی را تجربه نکردیم ، که نشان دهنده بلوغ معماری پردازنده است. رویکرد VLIW که در Elbrus-8C توسعه یافته امکان کار در زمان واقعی الگوریتم های مختلف را فراهم می کند دید رایانه ای، و كتابخانه EML شامل یك مجموعه بسیار خوب از توابع ریاضی است كه باعث كاهش وقت برای كسانی می شود كه خود كد را بهینه نمی كنند. در پایان ، ما یک آزمایش دیگر را با اجرای 3 نمایش همزمان (محلی سازی ، جستجوی اتومبیل و جستجوی چهره) بر روی یک پردازنده Elbrus-8C و دریافت بار متوسط \u200b\u200bپردازنده حدود 80٪ انجام دادیم. اینجا هیچ نظری وجود ندارد.



ما می خواهیم از این شرکت و کارمندان MCST و INEUM بروک برای فرصتی که Elbrus-8S را امتحان کرده و به آنها تبریک می گوییم تشکر می کنیم - این هشت پردازنده ای فراتر از این است و برای آنها آرزوی موفقیت می کنیم!

منابع مورد استفاده

P. Viola ، M. Jones ، "تشخیص سریع اشیا using با استفاده از آبشار تقویت شده از ویژگی های ساده" ، مجموعه مقالات CVPR 2001.
B. Fan ، Q. Kong ، T. Trzcinski ، Z. H. Wang ، C. Pan و P. Fua ، "انتخاب زمینه های پذیرش برای توصیف ویژگی های باینری" ، IEEE Trans. فرآیند تصویر. ، ص. 2583–2595 ، 2014.

پردازنده روسی Elbrus-8S

عصر بخیر ، خوانندگان گرامی. موضوع امروز بسیار مورد توجه وطن پرستان خواهد بود. برو روسیه !!! بیایید امروز در مورد پردازنده های روسی صحبت کنیم " البرس"و" بایکال" حیف است که نمی توان مقاله را " پردازنده ها تولید روسی "، زیرا در واقع آنها در آسیای شرقی تولید می شوند (مانند اکثر وسایل الکترونیکی رهبران جهان) و نه در روسیه. اما کاملاً افتخار می شود که روسیه یکی از معدود کشورهای جهان است که قادر به توسعه ریزپردازنده های خود است ، زیرا آینده در پشت آنها است.

و در میان شما کسانی هستند که برای جستجوی مقاله ، عبارت Yandex را چکش زدند پردازنده های روسی"؟ اگر ما در مورد مردم صحبت کنیم ، پس " همه روس ها روس نیستند" و اگر در مورد پردازنده ها صحبت کنیم ، آنگاه آنها روسی... Infa 100٪ ، بررسی کردم!

بنابراین ما امروز چه چیزی داریم؟ و امروز نیمه اول سال 2017 داریم و پردازنده های روسی دائما در حال توسعه هستند.

پردازنده های روسی "Processor-9" با پشتیبانی از حافظه DDR4

در عنوان فرعی چه می بینیم؟ با پشتیبانی! این معنی دیگری ندارد پردازنده -9به طور مستقیم با غول های موجود Intel و AMD رقابت خواهد کرد. در اینجا شما واقعاً می توانید به روسیه افتخار کنید.

پردازنده -9 چیست؟ این نام رمز پردازنده برتر روسی است Elbrus-16S از شرکت MCST. قرار است تولید آن در سال 2018 آغاز شود. دو گزینه پردازنده با 8 و 16 هسته وجود دارد. به طور کلی ، مشخصات پردازنده به شرح زیر است:

مشخصات اصلی اصلی پردازنده Elbrus-16S (پردازنده -9)

پیش از این رایانه های مبتنی بر پردازنده های روسی البروس قبلاً در معرض فروش قرار داشتند. 4 C ، اما هزینه آنها بسیار زیاد است. این امر به این دلیل بود که تولید انبوه پردازنده وجود نداشت. این رایانه ها بیشتر شبیه مدل های آزمایشی بودند و بنابراین تا 400000 روبل هزینه دارند. در مورد Elbrus-16S ، با تولید انبوه پردازنده ها در تایوان ، اوضاع اصلاح می شود. علاوه بر این ، تولید کننده باید درک کند که با چنین قیمتی ، هیچ بحثی در مورد رقابت وجود ندارد.

چرا ما اطلاعات کل پردازنده های Elbrus را مقایسه نمی کنیم؟ بالاخره جالب.

Elbrus-2C + Elbrus-4C Elbrus-8S Elbrus-16S
سال انتشار 2011 2014 2015-2018 (بازنگری) 2018 (طرح)
فرکانس ساعت 500 مگاهرتز 800 مگاهرتز 1300 مگاهرتز 1500 مگاهرتز
عمق بیت xs 32/64 بیتی 64 بیتی 64/128 بیتی
تعداد هسته ها 2 4 8 8/16
حافظه نهان سطح اول 64 کیلوبایت 128 کیلوبایت
حافظه نهان سطح دوم 1 مگابایت 8 مگابایت 4 مگابایت 4 مگابایت
کش سطح 3 16 مگابایت 16 مگابایت
پشتیبانی از RAM DDR2-800 3 x DDR3-1600 4 x DDR3-1600 4 x DDR4-2400
روند فنی 90 نانومتر 65 نانومتر 28 نانومتر 28 نانومتر (یا 16)
مصرف برق 25 وات 45 وات 75-100 وات 60-90 وات

همچنین پیشرفت های پردازنده ای وجود داشت که از گواهینامه دولتی عبور نکردند. اما این مدتها پیش بود و درست نبود.

نظر شما در مورد پردازنده های روسی چیست؟ آیا فقط به دلیل روسی بودن کامپیوتر می خواهید 400000 خریداری کنید؟ بنویسید ، ما در مورد این موضوع صحبت خواهیم کرد

پردازنده های روسی Elbrus در مقایسه با Intel

من می دانم که بسیاری از افراد علاقه مند به مقایسه پردازنده های روسی با پردازنده های اینتل هستند. هیچ چیز تعجب آور نیست ، روس ها مردمی مغرور هستند و بنابراین ما می خواهیم دستاوردهای خود را با بهترین ها مقایسه کنیم. و اینتل در دنیای پردازنده های رایانه ای دقیقاً همین است.

به طور کلی ، صفحه خاصی با مقایسه پردازنده های Elbrus با اینتل در شبکه پرسه می زند ، اما چقدر تصمیم گیری برای خود مطمئن است. همانطور که متوجه شدم ، این جدول جدید نیست ، زیرا مقایسه با جدیدترین پردازنده های اینتل انجام نشده است ، اما هنوز نمی توان برخی از آنها را قدیمی خواند. علاوه بر این ، برخی از آنها سرور قدرتمندی هستند پردازنده های اینتل زئون در جدول می توانید مشخصات فنی اصلی و همچنین عملکرد پردازنده ها را در Gigaflops مقایسه کنید.

به طور کلی ، در اینجا خود جدول مقایسه پردازنده قرار دارد. من در حال وارد کردن آن به شکلی هستم که پیدا کردم ، دقیق قضاوت نکنید. حیف است که فقط مقایسه ای بین Elbrus و Intel وجود دارد ، اما هیچ پردازنده بایکال وجود ندارد ، اما من فکر می کنم هنوز هم علاقه مندان می توانند این نقص را برطرف کنند.

پردازنده های روسی Elbrus: مقایسه با Intel

پردازنده های روسی Baikal-T1 و Baikal-M

اگر پردازنده های Elbrus صرفاً برای رایانه ها طراحی شده و آماده رقابت با تولیدکنندگان دیگر باشند ، پردازنده های بایکال بیشتر برای بخش صنعتی طراحی شده اند و با چنین رقابت سختی روبرو نخواهند شد. با این حال ، پردازنده های Baikal-M در حال حاضر در حال توسعه هستند ، که می توانند برای رایانه های رومیزی استفاده شوند.

پردازنده Baikal-T1

طبق بایکال الکترونیک ، پردازنده ها بایکال-T1 می تواند برای روترها ، روترها و سایر تجهیزات مخابراتی استفاده شود ، برای مشتری های لاغر و تجهیزات اداری ، برای مراکز چندرسانه ای ، سیستم های CNC. اما پردازنده ها بایکال-م می تواند قلب رایانه های شخصی کار ، اتوماسیون صنعتی و مدیریت ساختمان شود. در حال حاضر جالب تر! اما اطلاعات دقیق در مورد مشخصات فنی نه هنوز. فقط می دانیم که روی 8 هسته ARMv8-A کار خواهد کرد و حداکثر هشت هسته دارد هسته های گرافیکی تولید کنندگان ARM Mali-T628 و همچنین مهم بودن ، تولیدکنندگان قول می دهند که از نظر انرژی بسیار کارآمد باشد. بذار ببینیم چه اتفاقی میافتد.

در حین نوشتن مقاله ، من درخواستی را از JSC "بایكال الكترونیكس" ارائه دادم و جواب دیری نپایید كه منتظر بمانید. Andrey Petrovich Malafeev عزیز (مدیر روابط عمومی و رویدادهای شرکتی) با مهربانی با ما در میان گذاشت آخرین اطلاعات در مورد پردازنده Baikal-M.

این شرکت قصد دارد اولین نمونه های مهندسی پردازنده Baikal-M را در پاییز سال جاری منتشر کند. و سپس من نقل قول می کنم ، تا اصل اطلاعات را به هیچ وجه تحریف نکنم:

- نقل قول شروع -

پردازنده Baikal-M یک سیستم بر روی تراشه است که شامل کم مصرف است هسته های پردازنده با معماری ARMv 8 ، یک زیر سیستم گرافیکی و مجموعه ای از رابط های پرسرعت. از Baikal-M می توان به عنوان یک پردازنده مطمئن با قابلیت محافظت از داده های گسترده در تعدادی از دستگاه های B 2C و B2B استفاده کرد.

برنامه های کاربردی Baikal-M

  • تک بلوک ، خودکار محل کار، ایستگاه کاری گرافیکی ؛
  • مرکز رسانه ای خانه (دفتر)؛
  • سرور و پایانه کنفرانس ویدیویی
  • میکروسرور
  • شرکت کوچک NAS؛
  • روتر / فایروال

درجه بالای یکپارچه سازی پردازنده Baikal-M امکان تولید محصولات فشرده ای را دارد که عمده ارزش افزوده آنها از پردازنده داخلی است. اطلاعات کامل در مورد نمودار منطقی و توپولوژی فیزیکی میکرو مدار در ترکیب با نرم افزار قابل اعتماد و راه حل های سخت افزاری مناسب باعث می شود که پردازنده به عنوان بخشی از سیستم های طراحی شده برای پردازش اطلاعات محرمانه مورد استفاده قرار گیرد.

نرم افزار کاربردی

استفاده گسترده از معماری ARMv8 (AArch64) اجازه می دهد تا مقدار زیادی از نرم افزار آماده و نرم افزار سیستم مورد استفاده قرار گیرد. تئاترهای عملیاتی پشتیبانی می شوند سیستم های لینوکس و Android ، از جمله در سطح توزیع و بسته های باینری. دستگاه های PCIe و USB زیادی در دسترس است. بسته نرم افزاری ارائه شده توسط Baikal Electronics شامل هسته لینوکس در منبع و فرم کامپایل شده و همچنین درایورهای کنترلرهای تعبیه شده در Baikal-M است.

ویژگی های اصلی پردازنده Baikal-M

  • 8 هسته ARM Cortex-A57 (64 بیتی).
  • فرکانس کار تا 2 گیگاهرتز.
  • پشتیبانی سخت افزاری از مجازی سازی و فناوری Trust Zone در سطح کل SoC.
  • رابط با رم - دو کانال 64 بیتی DDR3 / DDR4-2133 با پشتیبانی ECC
  • حافظه پنهان - 4 مگابایت (L2) + 8 مگابایت (L3).
  • پردازنده گرافیکی هشت هسته ای Mali-T628.
  • مسیر ویدیویی پشتیبانی از HDMI ، LVDS
  • رمزگشایی ویدئو سخت افزار
  • کنترلر PCI Express از 16 مسیر PCIe G پشتیبانی می کند. 3
  • دو کنترل کننده 10 گیگابیتی شبکه های اترنت، دو گیگابیت کنترل کننده اترنت. کنترل کننده ها پشتیبانی می کنند شبکه های مجازی VLAN و اولویت بندی ترافیک.
  • دو کنترل کننده SATA 6G ، نرخ داده را تا 6Gbps فراهم می کند.
  • 2 کانال USB v.3.0 و 4 کانال USB v.2.0.
  • پشتیبانی از حالت بوت مطمئن.
  • شتاب دهنده های سخت افزاری پشتیبانی از GOST 28147-89، GOST R 34.11-2012.
  • مصرف برق - بیش از 30 وات

- نقل قول پایان -

دوستان چی میگی؟ آیا پردازنده های روسی شما را تحت تأثیر قرار دادند یا شما را بی تفاوت گذاشتند؟ من شخصاً به آینده بزرگ فناوری های دیجیتال روسیه اعتقاد دارم!

آیا تا آخر مطالعه کرده اید؟

این مفید بود؟

خب نه

دقیقاً چه چیزی را دوست نداشتید؟ مقاله ناقص بود یا خلاف واقع؟
در نظر بنویسید و ما قول می دهیم که پیشرفت کنیم!

کمراد krom63سند "عملکرد پردازنده Elbrus-8C در برنامه های ابر رایانه ای دینامیک گاز محاسباتی" را در اینترنت پیدا کرده و پیوند آن را در انجمن موضوعی وب سایت ixbt.com به اشتراک گذاشته است.

در این مقاله نتایج آزمایش پردازنده Elbrus-8C به عنوان بخشی از رایانه Elbrus-801 در مقایسه با ریز پردازنده های Intel و AMD ارائه شده است.

آزمایش در انجام شد بسته های نرم افزاریх برای مدلسازی سه بعدی پویایی گاز و مشکلات آئرواکستیک در حلال گرداب طراحی شده است در شبکه های ترکیبی بدون ساختار - سایپرز ، باشگاه دانش

(مقاله بصورت خلاصه ، نسخه کامل مقاله در لینک زیر است)

بسته نرم افزاری NOISEtte

حوزه اصلی کاربرد NOISEtte مدل سازی ابر رایانه از مشکلات آیرودینامیکی و آئرواکوست است که معمولاً برای صنعت هوافضا مشخص است.

بسته نرم افزاری تاپیر

برای محاسبه جریانهای گاز قابل فشردگی چسبناک زیر صوتی و مافوق صوت طراحی شده است. گسسته سازی معادلات Navier-Stokes بر اساس روش حجم محدود با تعیین مقادیر توابع شبکه در مراکز جرم عناصر شبکه بدون ساختار ترکیبی انجام می شود.

ویژگی های معماری پردازنده Elbrus-8S

پردازنده هشت هسته ای Elbrus-8C به خانواده معماری VLIW تعلق دارد. هر هسته می تواند حداکثر 25 عملیات مختلف ابتدایی را در یک چرخه ساعت انجام دهد. ساختار تیم گسترده (قبل از میلاد) به شما امکان می دهد:

1 فرمان انتقال کنترل: انتقال ، تماس ، بازگشت ؛

3 دستور منطق محمول ؛

حداکثر 6 عمل منطقی - منطقی: عدد صحیح ، بیت ، تغییر و محاسبات واقعی (از جمله ترکیبی) ، دسترسی به حافظه ، مقایسه ، انتقال و عملگرهای سه گانه.

4 دستور برای دسترسی به داده های منظم خطی ، از جمله افزایش نشانگر مربوطه ؛

1 دستور برای کنترل شمارنده چرخه ؛

16 بایت داده ثابت ؛

دستورات کنترل پنجره را ثبت کنید.

برای حساب واقعی ، 6 واحد منطقی حساب با واحد ضرب FP32 و FP64 و واحدهای جمع آوری کاملاً خط لوله وجود دارد که امکان شروع و خاتمه اجرای fmul * ، fadd * / fsub * ، ترکیبی (شامل دو عملیات) fmul_add * / sub * / rsub * را می دهد هر ضرب

همچنین یک دستگاه تقسیم خطی و ریشه مربع وجود دارد که به شما امکان می دهد هر 2 چرخه ساعت یکبار عملیات fdiv * ، fsqrt * را اجرا کنید. شرح دقیق تر معماری در

زیر سیستم حافظه با استفاده از 4 کانال DDR3 1600 حداکثر سرعت عملیاتی 51.2 گیگابایت بر ثانیه را فراهم می کند. سلسله مراتب حافظه نهان با استفاده از

سطح داده 1 سطح حافظه پنهان ، 64 کیلوبایت ، 4 طرفه ؛

حافظه پنهان دستورالعمل L1 در هر هسته ، 128 کیلوبایت ، 4 طرفه ؛

حافظه پنهان L2 در هر هسته ، 512 کیلوبایت ، 4 طرفه ؛

حافظه پنهان مشترک L3 برای 8 هسته ، 16 مگابایت ، 16 طرفه مشترک.

پردازنده ها را می توان در یک سیستم NUMA تا 4 پردازنده ترکیب کرد ، برای ارتباط بین آنها از لینک هایی با پهنای باند حداکثر 8 گیگابایت بر ثانیه در هر جهت استفاده می شود.

چندین آنالوگ غربی پردازنده Elbrus-8C برای آزمایش مقایسه ای انتخاب شدند. در میان آنها دو پردازنده با ویژگی های مشابه وجود دارد که با حافظه DDR3 کار می کنند و با توجه به فناوری پردازش 22 نانومتر یا بیشتر ساخته شده اند: AMD Opteron 6276 ، هسته Interlagos. Intel Xeon E5- 2650v2، Ivy Bridge core. همچنین پردازنده های اینتل از میان مدرن ترین ها وجود دارند این لحظهبا حافظه DDR4 کار می کند و روی فناوری پردازش 14 نانومتری ساخته شده است: Intel Xeon E5-2683v4، هسته Broadwell و Intel Xeon Platinum 8160، Skylake core. جدول 3 تعداد هسته ها ، سرعت ساعت (گیگاهرتز) ، حداکثر عملکرد (GFLOPS) ، پهنای باند حافظه (GB / s) ، مصرف برق (W) ، فناوری فرآیند (nm) را نشان می دهد.

شتاب موازی

این اندازه گیری نشان می دهد که چند بار محاسبه پردازنده چند هسته ای در حالت چند رشته ای با موازی سازی OpenMP نسبت به اجرای متوالی روی همان پردازنده تسریع می شود. نتایج شتاب در 8 هسته در جدول 4 ارائه شده است. شتاب در پردازنده Elbrus-8S ، 5-6 بار ، به طور کلی ، به خوبی با همتایان غربی مطابقت دارد. اکثر پردازنده ها دارای شتاب ضعیف در عملیات با شدت محاسبات کم و محدود به پهنای باند حافظه هستند (SpMV ، Grad). در همین زمان ، Skylake به لطف یک زیر سیستم حافظه قدرتمندتر با 6 کانال DDR4 ، شتاب بالا را در همه عملیات نشان می دهد.


مقایسه یک هسته واحد.

این معیار عملکرد محاسبه را در حالت ترتیبی مقایسه می کند. نتایج ارائه شده در جدول 5 نسبت عملکرد را با پردازنده Elbrus-8C نشان می دهد که سرعت آن به عنوان واحد در نظر گرفته می شود. در کد NOISEtte ، اختلاف با پردازنده های اینتل حدود 3 برابر بود. از نظر عملکرد در هر ساعت ، این مربوط به اختلاف حدود یک و نیم برابر است (از زمان پردازنده ها) فرکانس اینتل حدود دو برابر بیشتر) در مقایسه با AMD ، ضرر حدود 1.4 برابر بود. توجه به این نکته مهم است که NOISEtte منطق پیاده سازی و عملکرد بسیار پیچیده تری دارد (قسمت محاسباتی حدود ده هزار خط است) نسبت به Tapir (حدود هزار خط). برای اکثر عملیات های منابع فشرده NOISEtte ، هیچ سازگاری خاصی با معماری Elbrus انجام نشده است. برای Tapir ، یک انطباق نسبتاً ساده از محاسبات برای معماری Elbrus انجام شد ، که در بخش 3 بالا شرح داده شد. در کد Tapir ، تفاوت با اینتل فقط حدود یک و نیم برابر بود. بنابراین ، در این ضمیمه Elbrus-8C عملکرد بالاتری را در هر چرخه ساعت نسبت به نمونه های Intel دارد. هسته AMD حدود 1.5 برابر کندتر از Elbrus است.


مقایسه عملکرد در 8 هسته.

این آزمون عملکرد محاسبات را در حالت چند رشته ای در تعداد هسته های مشابه Elbrus-8C مقایسه می کند. در حالت موازی ، عملکرد زیر سیستم حافظه در حال حاضر تأثیر قابل توجهی در نتیجه دارد ، زیرا 8 رشته می تواند کاملاً خسته شود توان عملیاتی حافظه نتایج مربوط به نسبت با Elbrus در جدول 6 نشان داده شده است. در مقایسه با جدول 5 ، می توان گفت که در کد NOISEtte نسبت به نفع Elbrus تغییر کرده است. Elbrus در این آزمون عملکرد بهتری نسبت به AMD در هر دو کد دارد. برای کد Tapir ، اختلاف با اینتل حدود 2 برابر بود.


مقایسه کل پردازنده.

این معیار عملکرد محاسباتی را در حالت چند رشته ای در تمام هسته های پردازنده مقایسه می کند. نتایج در جدول 7 نشان داده شده است.

پردازنده AMD به مراتب ضعیف تر از Intel است. 8 هسته ای Elbrus-8S نسبت به پردازنده 16 هسته ای کد Tapir عملکرد بهتری دارد. پردازنده های 16 و 24 هسته ای اینتل ، به دلیل شتاب بالای OpenMP ، به طور قابل توجهی نسبت به 8 هسته افزایش یافته است ، اختلاف با Elbrus در حال حاضر حدود 3-7 برابر بود.


عملکرد محاسبات.

برای اندازه گیری عملکرد واقعی ، تعداد عملیات حساب در کد Tapir محاسبه شد. همچنین ، به عنوان مثالی از عملیاتی که به شدت پهنای باند حافظه محدود می کند ، ما عملکرد NOISEtte SpMV را انتخاب کردیم که کمترین شدت محاسباتی مورد بررسی را دارد - حدود 0.2 FLOP در بایت ، که تقریباً 10 برابر کمتر از کد Tapir است. نتایج در جدول 8 نشان داده شده است ، که همچنین درصد دستگاههای اوج نظری را لیست می کند.


از نتایج می توان دریافت که درصد قابل توجهی از اوج در SpMV بدست می آید ، زیرا اوج تعداد عملیات حساب در پردازنده ها چندین برابر بیشتر از پهنای باند حافظه است. رابطه بین عملکرد و توان را می توان از جدول 3 برآورد کرد.

همچنین می توانیم به درصد کم قله در اسکای لایک اشاره کنیم که در هر سیکل نسبت به سلف قبلی خود Broadwell چهار برابر عملیات دارد. می توان نتیجه گرفت که در نوع الگوریتم های مورد بررسی ، عمدتا به دلیل محدودیت های پهنای باند حافظه ، افزایش دو برابری دستگاه های محاسباتی بردار و دو برابر شدن ثبات های بردار ، عملکردی ندارد.

نتیجه

عملکرد محاسبات در پردازنده های چند هسته ای Elbrus8S در کاربردهای واقعی پویایی گاز محاسباتی مورد بررسی قرار گرفت. از دو بسته نرم افزاری برای مدل سازی جریان های فشرده کننده در شبکه های بدون ساختار ، NOISEtte و Tapir ، استفاده شد.

چندین مدل از پردازنده های Intel Xeon از مدل های 5 ساله تا مدرن ترین ها در نظر گرفته شده است. معجزات ، البته ، اتفاق نمی افتد ، Elbrus ، همانطور که انتظار می رفت ، کندتر از پردازنده های Intel بود. از دست دادن عملکرد هسته برای کد NOISEtte به طور متوسط \u200b\u200b2.6 برابر و برای کد Tapir 1.5 برابر است. با توجه به اینکه فرکانس ساعت Elbrus-8C تقریباً نیمی از آن است ، به نظر می رسد این نتیجه نسبتاً خوبی باشد ، از نظر چرخه ساعت ، Elbrus از Intel کمتر نیست. علاوه بر این ، از دست دادن حدود دو برابر در این کلاس از برنامه ها حتی برای پردازنده های AMD ، رقیب اصلی اینتل نیز معمول است. از نظر عملکرد کل پردازنده ، تلفات نسبت به اینتل در کد NOISEtte از 2.5 برابر Ivy Bridge 8 هسته ای تا 6.8 برابر Skylake 24 هسته ای و برای کد Tapir به ترتیب از 2 تا 5 برابر بوده است.

برای مقایسه ، یک پردازنده 16 هسته ای AMD Opteron 6276 مربوط به حدود 5 سال پیش در نظر گرفته شد. این پردازنده حدود 2 برابر به Ivy Bridge 8 هسته ای مربوطه باخت. در کد NOISEtte ، 8 هسته ای Elbrus-8C با فرکانس 1.3 گیگاهرتز 1.4 برابر کندتر از پردازنده 16 هسته ای AMD با فرکانس 2.3 گیگاهرتز بود و در کد Tapir ، البروس 12 درصد از AMD پیشی گرفت.

همچنین لازم به ذکر است که پردازنده های اینتل نیز دارند این نوع برنامه های کاربردی ، هیچ افزایش در عملکرد هسته وجود دارد. علاوه بر این ، هسته مدرن Skylake اینتل 20 درصد کندتر از هسته Intel Ivy Bridge 5 سال پیش است. گسترش رجیسترهای برداری و دو برابر شدن تعداد واحدهای محاسباتی ، به دلیل محدود بودن پهنای باند حافظه ، عملکردی (تنها با استفاده از ابزار بردار سازی خودکار کامپایلر) ندارد. رشد عملکرد پردازنده های مدرن بیشتر به دلیل افزایش تعداد هسته ها است.

در عین حال ، برای پردازنده Elbrus-8C ، عملکرد اصلی نسبت به نسل قبلی Elbrus-4C حدود یک و نیم برابر افزایش یافته است. این به ما امکان می دهد امیدوار باشیم که با عرضه نسل بعدی پردازنده های Elbrus-16C ، شکاف بیشتر کاهش یابد. پیش بینی می شود مدل بعدی با 16 هسته با فرکانس 2 گیگاهرتز عرضه شود. فرض بر این است که از 4 تا 8 کانال حافظه DDR4-2666 استفاده می شود که می تواند پهنای باند حافظه را بیش از 3 برابر افزایش دهد. بهبود بیشتر کامپایلر بهینه سازی نیز می تواند سهم قابل توجهی در افزایش عملکرد داشته باشد.

خوب ، این اتفاق افتاده است. جهان رایانه های جدید پردازنده روسی ELBRUS را مشاهده کرد. Elbrus-8S یک پردازنده هشت هسته ای است که با استفاده از فناوری پردازش 28 نانومتری تولید شده است. برای مقایسه ، پردازنده های نسل فعلی اینتل Kaby Lake از فرایند 14 نانومتری استفاده می کنند. اینتل در خطر است؟ کمی بیشتر و عقب؟

من به نوعی فراموش کردم ، اما یک پردازنده نسل قبلی نیز وجود داشت. Ruselectronics می گوید تراشه جدید پنج برابر سریعتر از Elbrus-4S قبلی است.

پردازنده قبلی در سال 2015 منتشر شد و به دلیل عملکرد ضعیف نسبت به راه حل های سال 1999 مورد تمسخر قرار گرفت.

خوب ، با توجه به چنین شروع بد دو سال پیش ، راه حل جدید کاملاً مناسب به نظر می رسد. اصطلاحاً ساخته شده

سازنده "سطح بالایی از امنیت اطلاعات" را به کاربر تضمین می کند. دقیقاً درباره چه چیزی صحبت می کنیم معلوم نیست. پشتیبانی از اتصال به اینترنت وجود ندارد؟ تاکنون ، این امن ترین سناریو برای استفاده از رایانه ای است که من از آن مطلع هستم.

با هم بستر جدید مونتاژ اختصاصی رایانه شخصی Elbrus 801 را نشان داد. همه چیز در نسخه خاصی از سیستم عامل Elbrus Linux اجرا می شود.

آرسنی بریکین ، معاون مدیر Ruselectronics ، گفت که ما می توانیم انتظار داشته باشیم که اولین گروه از رایانه های شخصی با Elbrus-8S در سه ماهه دوم سال 2017 ظاهر شود.

من می خواهم اکنون در جهانی موازی قرار داشته باشم که در آن روسیه رقیبی برای اینتل ایجاد می کند و با موفقیت شروع به مبارزه با آن در بازار رایانه های در حال مرگ می کند ، اما نه ، افسوس ، این اتفاق نخواهد افتاد.

تلاش برای ایجاد محصول جایگزین واردات به طور کلی خوب است ، فقط مصرف کننده نهایی به آن نیازی ندارد ، نهادهای دولتی این رایانه ها را با این رایانه ها تهیه می کنند و تمام می شود.

زنگ

کسانی هستند که این اخبار را قبل از شما می خوانند.
برای دریافت جدیدترین مقالات مشترک شوید.
پست الکترونیک
نام
نام خانوادگی
چگونه می خواهید زنگ را بخوانید
بدون هرزنامه