Самый мощный российский процессор будет 32-ядерным и сделанным по технорме 7 нм

Во сколько может обойтись разработка

В
открытых источниках можно найти следы формальной закупки НИИ «Масштаб» от 31
января 2020 г. на выполнение составной части опытно-конструкторских работ (ОКР)
по созданию «мобильной аппаратно-программной платформы смартфона на базе
отечественной схемотехники» (шифр «Трастфон-СЭС-Т1»). Формальность процедуры
обусловлена ее способом: закупка у единственного возможного поставщика. Им и
стала «Смартэкосистема».

На
официальном сайте госзакупок следы процедуры не обнаруживаются. На различного
рода коммерческих ресурсах, касающихся закупок, документация по ней либо уже
переправлена в архив, либо представлена пустыми файлами.

Все
указывает на то, что в тот момент «Масштаб» уже пользовался правом
стратегически важных для России предприятий не выкладывать подробности о своих
закупках в публичный доступ, чтобы не навлечь на себя известные западные санкции.
В базе «Контур.фокуса» последние публичные закупочные процедуры этого НИИ
датированы 2019 г.

Так или
иначе, цена составной части ОКР на создание трастфона была выставлена в закупке
на уровне 45 млн руб. То есть логично предположить, что общий бюджет разработки
доверенного телефона на «Скифе» составит несколько большую сумму.

Возрождение: современные российские процессоры

Начиная с 2005 года, МЦСТ ведёт разработку процессоров “Эльбрус”, которые являются идеологическими наследниками одноимённых МВК, но построены по современным технологическим нормам. Новая архитектура “Эльбрус” полностью отечественной разработки по принципам похожа на суперскалярную архитектуру VLIW.

VLIW

(от англ.very large instruction word – “очень длинная машинная команда”) – архитектура процессоров, при которой используются наборы сложных инструкций большой длины, выполняющихся за один такт. При этом задача их разделения на более простые команды для параллельного выполнения вычислительными модулями процессора ложится на компилятор.

Ключевые особенности архитектуры “Эльбрус”:

  • длинные наборы команд – выполнение за один такт одновременно до 23 инструкций;
  • эмуляция архитектуры х86 – возможность запуска программного обеспечения, написанного под распространённую архитектуру х86, с помощью динамической трансляции двоичных кодов в коды процессора “Эльбрус” при минимальных потерях производительности;
  • защищённый режим исполнения программ – аппаратная проверка работы программы с памятью и межмодульная защита;
  • непересекающиеся стеки адресов – отделение стека пользовательской информации, что защищает от вирусных атак подменой адреса возврата в библиотеку;
  • отсутствие аппаратного транслятора команд – в отличие от процессоров архитектуры х86, где с помощью вшитого блока декодирования инструкций длинные команды разбиваются на короткие RISC-инструкции для каждого вычислительного модуля, эта работа производится компилятором при создании программ.

В 2008 году начались поставки компьютеров “Эльбрус-3М”

на базе процессора на обновлённой архитектуре, который обладал следующими характеристиками:

Технологический процесс 130 нм
Тактовая частота 300 МГц
Количество ядер 1
Пиковая производительность 2,4 GFLOPS в режиме 64 бит
Кэш-память 1-го уровня 64 КБ данные + 64 КБ команды
Кэш-память 2-го уровня 256 КБ
Размеры кристалла 189 мм2
Количество транзисторов 75,8 млн
Мощность 6 Вт

В эпоху процессоров семейства Intel Core с частотой в 3 ГГц характеристики на первый взгляд не поражают воображение, но следует помнить, что “Эльбрус” построен на совсем другой архитектуре. Благодаря своим преимуществам и использованию нестандартных наборов регистров и команд, процессоры не подвержены вирусным атакам и гарантированно не содержат бэкдоров, а при компиляции программ непосредственно под свою архитектуру показывают приличную производительность. В то же время, благодаря динамической трансляции, могут запускать ОС Windows и ПО Microsoft Office!

Компьютеры “Эльбрус-3М” поставлялись для военной отрасли, и в качестве операционной системы использовали российскую МСВС-Э (Мобильную система Вооруженных Сил), созданную на основе Linux.

С тех пор МЦСТ активно работал над разработкой новых процессоров по всё более современным техпроцессам и с возрастающей производительностью. По состоянию на 2020 год характеристики флагманов архитектуры “Эльбрус” выглядят следующим образом:

Процессор «Эльбрус-4С» «Эльбрус-8С» «Эльбрус-8СВ»
Техпроцесс 65 нм 28 нм 28 нм
Тактовая частота 800 МГц 1300 МГц 1500 МГц
Количество ядер 4 8 8
Количество операций за такт, на ядро 23 25 50
Пиковая производительность в режиме 64 бит 25 GFLOPS 125 GFLOPS 288 GFLOPS
Кэш-память 1-го уровня, на ядро 64 КБ данные + 128 КБ команды 64 КБ данные + 128 КБ команды 64 КБ данные + 128 КБ команды
Кэш-память 2-го уровня 8 МБ 4 МБ 4 МБ
Кэш-память 3-го уровня 16 МБ 16 МБ
Контроллер памяти DDR3-1600 ECC DDR3-1600 ECC DDR4-2400 ECC
Площадь кристалла 380 мм2 321 мм2 350 мм2
Количество транзисторов 986 млн 2,73 млрд 3,5 млрд
Мощность 45 Вт 80 Вт 90 Вт

При этом компания производит как материнские платы на базе своих процессоров, так и готовые компьютеры и специальные вычислительные комплексы “под ключ”.

Материнская плата с процессором “Эльбрус-8С” и южным мостом МЦСТ КПИ-2

С ростом производительности ЦП расширились и возможности для их применения:

  • государственные учреждения и бизнес-структуры с повышенными требованиями к информационной безопасности;
  • организация многоместных рабочих мест в сфере образования, офисах и т.д.;
  • задачи шифрования с использованием ГОСТ, для которых особенно оптимизирована архитектура;
  • различные прикладные задачи, например, распознавание паспортов.

Планы «Ростеха» и Yadro нереальны?

Архитектуры процессоров, которые сегодня есть на рынке, существуют 30–40 лет, над ними работали поколения разработчиков, в них вложено много ресурсов и денег, отметил в разговоре с «Ведомостями» директор Консорциума отечественных разработчиков систем хранения данных Олег Изумрудов.

«Они давно применяются для серьезных вычислений и ответственных задач.
На этом фоне странно делать ставку на молодую, недоработанную
архитектуру, – полагает он. – Заявленные в проекте характеристики недостижимы в
перспективе десятилетий. Например, обещанная тактовая частота процессора
значительно выше достижимой сейчас в RISC-V. Существующие сегодня
процессоры этой архитектуры работают на частоте 450 МГц. Сейчас
заявленные отечественными разработчиками показатели на практике не
реализуемы».

История

Эльбрус – это линейка российских микропроцессоров. Исторически так сложилось, что первым прообразом современных процессоров Эльбрус послужил суперкомпьютер Эльбрус-3. К сожалению, он не был полностью собран, а только в виде несколько шкафов. Наладка не была доведена до конца, и эти шкафы разобрали.

Но идеи, что закладывались в Эльбрус-3, не канули в лету и возродились в первом российском микропроцессоре Эльбрус. Его выпуск припал на 2007 год.

На протяжении следующего десятилетия ЦП совершенствовались, увеличивалась их мощность в гигафлопсах, уменьшались нанометры в техпроцессе. Значимыми достижениями стали разработки процессоров Эльбрус-2С+, Эльбрус-4С, Эльбрус-8С.

Азы «эльбрус-программирования»

Отвечая в рамках своего видеобращения на вопрос о приоритетных способах портирования программ на платформу «Эльбрус», Константин Трушкин указал на необходимость программирования на языках C и C++ без завязки на конкретную платформу. «Если пишете кроссплатформенно на этих языках, то скорее всего легко свой код перенесете на платформу “Эльбрус”, — указал он. — Конечно при условии, что вы уже перенесли ваш софт на Linux, и ваш софт на нем хорошо работает, без привязки к каким-то закрытым библиотекам».

«Важно, чтобы в вашем коде не было так называемых ассемблерных вставок и других сильно зависимых от архитектуры фрагментов кода, — добавил он. — Тогда все переносится обычной перекомпиляцией»

«Говорун» мощностью в 1 петафлопс

Не только ПК в России делают — суперкомпьютеры тоже! Так, в Объединенном институте ядерных исследований (ОИЯИ) построили и ввели в эксплуатацию новый суперкомпьютер.

Назвали систему в честь учёного Н. Н. Говоруна — просто Govorun. Правда, здесь обошлось без «Байкалов» и «Эльбрусов». Чтобы создать систему мощностью в 1 петафлопс, взяли чипы Intel Xeon и видеокарты Nvidia Volta.

Гибридный компьютер включает три различные подсистем.

  • В первой — 21 узел с парой 72-ядерных процессоров Intel Xeon Phi 7290 в каждом, которые эффективны для параллельных вычислений.
  • Во второй — 14 узлов с 18-ядерными процессорами Intel Xeon Gold 6154 для ресурсоёмких вычислений.
  • В третьей — пять узлов NVIDIA DGX-1 Volta, каждый включает по восемь видеокарт Tesla V100. Мощность этой подсистемы самая высокая, 600 терафлопс.

Установлен «Говорун» в Лаборатории информационных технологи ОИЯИ. Суперкомпьютер позволяет проводить теоретические расчёты, на основе которых затем ставятся эксперименты в коллайдерах и на других установках.

«Говорун» будет моделировать поведение детектора NICA, который должны достроить в Дубне к 2020 году, и создавать программы для распознавания треков элементарных частиц. Кроме того, он будет обрабатывать статистику столкновений частиц в коллайдерах.

Но если говорить объективно, 1 петафлопс — это 181-е место в рейтинге «Топ-500», списке мощнейших суперкомпьютеров мира, который публикуется раз в полгода. На вершине рейтинга — система с 10 млн процессорных ядер и пиковой мощностью в 125 петафлопс.

Немного об архитектурах процессоров Байкал-М и Эльбрус

Байкал-М

Байкал-М — процессор на основе 64 разрядной RISC архитектуре ARM (armv8, aarch64), имеет 8 ядер, которые реализуют микроархитектуру ядер Cortex-A57.

Схема микроархитектуры Cortex-A57:

Устройство конвейера Cortex-A57:

Особенности ядер Cortex-A57:

  • 64 битная архитектура armv8.0a
  • FP/SIMD расширения VFPv4 и NEON
  • Внеочередное исполнение
  • Предсказание ветвлений
  • Поддержка виртуализации
  • 8 портов на исполнение микроопераций:
    • 2 Загрузки/Сохранения
    • 2 простых АЛУ (сложение, сдвиг)
    • 1 блок ветвлений
    • 1 АЛУ для умножения, деления
    • 2 блока SIMD/FPU
  • 3 уровневый декодер команд
  • Кеши
    • 48 КБ L1 кэш команд (3 канальный, ассоциативный, размер линии 64 байта)
    • 32 КБ L1 кэш данных (2 канальный, ассоциативный, размер линии 64 байта)
    • 32 КБ L1 кэш данных (2 канальный, ассоциативный, размер линии 64 байта)
    • В Байкал-М 1 МБ L2 на 1 кластер (2 ядра в кластере), в сумме 4 МБ
    • Кэш L3: 8 МБ

Моё видео о сравнении Байкала и Эльбруса:

Эльбрус-8СВ

Эльбрус-8СВ — процессор на основе 64 разрядной VLIW архитектуры E2K 5го поколения (e2k, elbrus-v5), имеет 8 ядер.

Схема микроархитектуры E2K:

Подробные детали микроархитектуры E2K:

Особенности ядер elbrus-v5:

  • 64 битная VLIW архитектура elbrus-v5
  • 128 (+ 8 бит на тег) разрядные регистры (были 80 бит + 4 бита на тег) и SIMD расширения
  • 256 регистров (поддержка регистровых окон), 32 регистра из 256 — глобальные
  • Предикатный файл на 64 бита (32 2 битовых флажков)
  • 6 АЛУ блоков (с разными возможностями):
    • 4 могут в Load
    • 2 могут в Store
    • 6 целых/сдвиговых АЛУ
    • 6 вещественных АЛУ
    • 4 сравнивающих блоков
    • 4 целочисленных умножений
    • 6 вещественных умножений
    • 4 целочисленных векторных блоков
    • 2 вещественных векторных блоков
    • 1 деление и квадратный корень
  • Блок предпоткачки массивов
  • Блок аппаратной поддержки циклов (можно зациклить одну Широкую Команду без прыжков)
  • Явный спекулятивный режим
  • Кеши
    • 128 КБ L1 кэш команд (4 канальный, ассоциативный, размер линии 256 байт)
    • 64 КБ L1 кэш данных (4 канальный, ассоциативный, размер линии 32 байта)
    • L2: 512 Кбайт в каждом ядре, 4 Мбайт суммарно (Размер линии: 64 байт, Ассоциативность: 4)
    • L3: 16 Мбайт в процессоре (Размер линии: 64 байт, Ассоциативность: 16)
  • Нет предсказателя ветвлений (будет в поколении 7)
  • Нет переупорядочивания инструкций (Ложится на плечи компилятора)

Характеристики

Характеристика Значение
Функциональные характеристики микропроцессора
Обозначение микросхемы 1891ВМ8Я
Архитектура Эльбрус (VLIW)
Тактовая частота до 800 МГц
Число ядер 4
Операций в такт (на ядро) до 23
Кэш-память данных 1-го уровня, на ядро 64 КБ
Кэш-память команд 1-го уровня, на ядро 128 КБ
Кэш-память 2-го уровня (универсальная) 8 МБ
Организация оперативной памяти До 3 каналов DDR3-1600 ECC
Пропускная способность каналов оперативной памяти 38,4 ГБ/сек
Возможность объединения в многопроцессорную систему с когерентной общей памятью До 4 процессоров
Каналы межпроцессорного обмена 3, дуплексные
Пропускная способность каждого канала межпроцессорного обмена 12 ГБ/сек
Каналы ввода-вывода/RemoteDMA 1, дуплексный
Пропускная способность канала ввода-вывода/RemoteDMA 4 ГБ/сек
Совместимые СБИС южного моста КПИ
Технологические характеристики микросхемы
Технологический процесс 65 нм
Количество транзисторов 986 млн.
Напряжение питания 1,5 В, 2,5 В, 3,3 В
Рабочий диапазон температуры среды -60…+85 град. С
Потребляемая мощность 45 Вт
Год начала производства 2014
Добавленные технологии
Технология энергосбережения имеется

Кому все это нужно

Итак, российские процессоры имеют более чем скромные параметры по сравнению с топовыми моделями от Intel, AMD и Qualcomm, при этом дороже зарубежных аналогов в разы, а использовать их в домашнем компьютере не получится еще долгие годы. Так зачем они нужны?

Ответ на этот вопрос складывается из нескольких частей:

  • собственное производство микросхем – это вопрос престижа страны, а также гарантии поставок даже при самых жестких санкциях (правда, в нынешнем виде – пока санкции не дойдут до Китая);
  • требования к производительности, экономичности и тепловыделению не так важны, как требования к защищенности. Российские производители готовы выпускать процессоры с защитой от радиации, а российское производство гарантирует защиту информации;
  • в некоторых задачах российские процессоры сопоставимы по производительности с зарубежными или даже превосходят их.

Последний пункт можно рассмотреть на примере процессора «Эльбрус-4С». На первый взгляд, 4 ядра и тактовая частота в 800 MHz при техпроцессе 65 нм – это далеко не уровень настоящего времени. Но архитектура этого процессора (разработанная в России), позволяет распараллеливать задачи не на уровне самого процессора, а на уровне компилятора – специальной программы, которая передает конкретные команды на процессор. Другими словами, благодаря более оптимальному распределению задач производительность процессора выше, чем у аналогичного по тактовой частоте.

С другой стороны, российская разработка не способна без адаптации работать с обычными операционными системами и приложениями х86. Конечно, их можно запустить и на «Эльбрусе», но по производительности такая система будет уступать конкурентам.

Говоря проще, российские процессоры окажутся быстрее в тех задачах, под которые их создавали. Например, «Эльбрус-4С» справился с шифрованием данных по российскому алгоритму (по ГОСТ) быстрее, чем Intel Core i7-2600. Но американская разработка оказалась быстрее в «стандартной» процедуре архивации и распаковки данных.

Поэтому российские разработки точно найдут своего потребителя – пока это государственные структуры, которые нуждаются в сертифицированных по российским стандартам компьютерах. А вскоре клиентами могут стать и телеком-операторы, поскольку наступит время исполнения так называемого «Пакета Яровой».

Информация

Микропроцессор «Эльбрус-2СМ» (1891ВМ9Я) – двухъядерный процессор с архитектурой «Эльбрус», построенный на принципах широкого командного слова (VLIW). Представляет собой систему на кристалле с интегрированным контроллером памяти, контроллером межпроцессорных связей и двумя контроллерами канала ввода-вывода. Работает на тактовой частоте 300 МГц.  Производится по технологическим нормам 90 нм. Каждое ядро декодирует и отправляет на исполнение до 23 операций за такт.

Особенности процессора «Эльбрус-2СМ»:

  • Поддерживаемый тип памяти — DDR2-533.
  • Процессор выполнен по технологии LP, которая обеспечивает низкие токи утечки.

Основная сфера применения микропроцессора «Эльбрус-2СМ» – доверенные вычислительные системы с высокими требованиями к обеспечению информационной безопасности.

Примечание: в ходе работы над проектом, для процессора использовалось рабочее название «Эльбрус-1C».

Сроки релиза

По состоянию на 8 октября 2020 г. специалисты МЦСТ проводили исследования полученного инженерного образца «Эльбрус-16С». Одно из достижений – обеспечена загрузка операционной системы «Эльбрус Линукс».

По прогнозам МЦСТ, новый процессор будет полностью готов к серийному производству к концу 2021 г. Представители МЦСТ сообщили CNews, что само производство начнется в первой половине 2022 г.

Представители МЦСТ заявили лишь, что процессор будет соответствовать требованиям к российским интегральным схемам второго уровня в рамках постановления правительства России от 17 июля 2015 г. № 719. Это значит, что их непосредственный выпуск будет развернут за пределами нашей страны. В России пока нет заводов, способных выпускать 16-нанометровую продукцию. Также собеседники CNews рассказали , что к целевой аудитории нового чипа относятся производители серверов среднего и высшего классов производительности, СХД, мощных встраиваемых вычислительных узлов, рабочих станций и суперЭВМ. На вопрос CNews о том, где именно будет производиться новый «Эльбрус», они ответить не смогли.

Сроки релиза и стоимость

На момент публикации материала «Ростех» и «Автоматика», как сообщили CNews представители госкорпорации, занимались подготовкой к серийному выпуску «Эльбрус 801-К». Точные сроки начала работы конвейера пока не установлены, но известно, что первая партия выйдет, по плану, в 2021 г. Производством займется Институт электронных управляющих машин (ИНЭУМ) им. И. С. Брука, входящий в состав концерна «Автоматика». Рекомендуемая стоимость компьютера будет объявлена перед выпуском первой партии.

В госкорпорации рассказали также, что ее новый вычислительный комплекс получил сертификаты соответствия требованиям информационной безопасности и энергетической отрасли. Кроме того, «Эльбрус 801-К» создан в соответствии с ГОСТ Р МЭК 62623-2015 и техническим регламентом Таможенного союза, имеет маркировку Евразийского соответствия (Eurasian Conformity, EAC). Кроме того, лежащий в его основе процессор «Эльбрус -8С» соответствует требованиям Постановления Правительства России от 17 июля 2015 г. N 719 «О подтверждении производства промышленной продукции на территории Российской Федерации» и занесен в Единый реестр радиоэлектронной продукции.

Тест № 3. PostgreSQL

Тестируем pgbench из дистрибутива PostgreSQL. Оно создаёт тестовую базу данных и выполняет набор запросов, типичных для OLTP систем. Результатом выполнения тестов является число транзакций в секунду (tps). Тесты отличаются количеством одновременно работающих клиентов (50 и 150) и количеством потоков СУБД (2 и 32). Каждый тест измерял общее количество транзакций, выполненное за десять минут.

Тестирование базы данных оказалось провальным для процессоров «Эльбрус» — они показали результат в 2,6 раз хуже конкурентов

Однако следует принимать во внимание, что между конкурентными платформами Intel тест дал также заметно разные результаты. Это связано с тем, что тест данной СУБД затрагивает множество подсистем сервера и в большой степени зависит от производительности дисковой подсистемы

Производителям серверных платформ на базе «Эльбрус», возможно, следует уделить больше внимания интеграции различных компонентов.

Для корректного сравнения процессоров между собой в левой части таблицы приведены полученные в результате тестов значения tps (including connections establishing) — Transactions-per-second в перерасчёте на 1 ядро частотой 1 ГГц:

В правой части таблицы приведены соотношения производительности Intel/«Эльбрус» для соответствующих процессоров Intel. 

Для унификации посчитано среднее значение для разных процессоров:

На чём тестировали «Эльбрусы»

Чтобы условия были максимально приближены к рабочим, взяли приложения из «Эльбрус Линукс», из них выбрали базовые и наиболее показательные среды с разными профилями нагрузки. В итоге в тестовый стек вошли:   

  • Базы данных реляционные (PostgreSQL).

  • Балансировщики (Nginx).

  • Резидентная система управления базами данных класса NoSQL Redis.

  • Шины данных (RabbitMQ).

Плюс — сделали классический 7-Zip. Обычно по нему понятно, корректно ли сработали остальные тесты и можно ли доверять их результатам.   

Внутри тестов задали наборы команд с разными параметрами. Мы подобрали параметры так, чтобы нагрузить по максимуму именно процессоры, а не сравнивать диски, оперативную память и другие компоненты.  

Стартовали со сравнения баз данных: Интеловый сервер vs один «Эльбрус». Производительность Intel оказалась в семь раз выше, чем на «Эльбрусе». Как позже выяснилось, даёт о себе знать влияние дисковых подсистем. Да, на «Эльбрусе» они слабее (минус RAID). Зато дистрибутив Linux, что стоит на «Эльбрусах», в самом деле хорошо оптимизирован и, на первый взгляд, стабильнее, чем на Интелах. 

Интересно, что если на одном из серверов Интела некоторые тесты до конца не дошли, выдавая ошибки, то на «Эльбрусах» такой проблемы не было. Это так, к слову. 

Чем ещё интересен «Эльбрус»

Внутри процессор «Эльбрус» устроен следующим образом. Имеется 6 каналов исполнения операций, работающих параллельно, при этом до четырёх каналов могут быть использованы для чтения из памяти и до двух – для записи в память. Во всех шести каналах можно исполнять целочисленные арифметико-логические операции, в четырёх – операции с плавающей запятой. Каждый такт процессор может запустить по одной операции в каждый канал. У Эльбруса универсальный регистровый файл из 256 84-разрядных регистров; при этом есть отдельный регистровый файл для предикатов (однобитных значений) на 32 регистра. Имеется аппаратная поддержка циклов, в том числе с конвейеризацией, что повышает эффективность использования ресурсов процессора. Интересной особенностью Эльбруса является программируемое асинхронное устройство предварительной подкачки данных. У него есть встроенный буфер объемом 4 кБ для сокрытия задержек от доступа к памяти, и оно не задействует каналы исполнения операций, что позволяет освободить их для вычислний.  Поддержка спекулятивных и условных (предикатированных) вычислений позволяет уменьшить число переходов и параллельно исполнять несколько ветвей программы. Широкая команда может при максимальном заполнении задавать в одном такте до 23-х операций (и более 33-х операций при упаковке операндов в векторные команды).

Чтобы более эффективно использовать возможности аппаратуры процессора, в компилятор введена поддержка Intrinsic-функций (это специальные аппаратно-зависимые функции, заменяющие отдельные ассемблерные инструкции и позволяющие избавиться от inline-ассемблера, т.к. его использование часто нежелательно или невозможно).

Также «Эльбрус» имеет несколько уникальных особенностей, выгодно отличающих его от зарубежных аналогов. Одна из них — специальное оборудование для работы в составе многопроцессорных систем. Это контроллер межъядерных взаимодействий и контроллер запросов MAU, передающий запросы от каждого из ядер в системный коммутатор, и контроллер когерентных сообщений, анализирующий запросы от коммутатора и передающий их нужным ядрам. В свою очередь, системный коммутатор осуществляет обслуживание абонентов согласно политике приоритетов, обеспечивая максимально возможную загрузку межпроцессорных линков, и независимость пакетных потоков между различными парами абонентов и независимость потоков командных пакетов различного типа друг от друга. Каждый кристалл имеет три канала межпроцессорного обмена, а также возможность работать в многопроцессорной системе с общей памятью – до четырёх процессоров «Эльбрус-4С» в одной системе без дополнительных схем, и до шестнадцати – с помощью выделенного чипа-коммутатора.

Обслуживание внешних интерфейсов организовано «классическим» способом – с помощью Контроллера Периферийных Интерфейсов (КПИ), играющего роль «южного моста». Он соединяется с процессором по выделенной шине с пропускной способностью 2 Гбит/с в каждую сторону и предоставляет как привычные всем PC-интерфейсы, так и специализированные интерфейсы для промышленного применения.

Технические характеристики КПИ 

Год начала производства 2010
Техпроцесс, нм 130
Тактовая частота, МГц 250
Пропускная способность шины связи с процессором, Гбайт/с 2
Подсистема управления прерываниями 2 PIC + 1 IO_PIC
Таймеры системный, сторожевой
Число транзисторов, млн 30
Площадь кристалла, мм² 112
Корпус HFCBGA-1156
Потребляемая мощность, Вт 6
Диапазон рабочих температур, °С –60…+85
Наработка на отказ, ч > 100000
Интерфейсы
PCI-Express (версии 1.0a) 8 линий
PCI (версии 2.3) 32/64 бита, частота 33/66 МГц
Ethernet (1 Гбит/с) 1 порт
SATA 2.0 4 порта
IDE (PATA-100) 2 порта по 2 устройства
USB 2.0 2 порта
AC-97 2-канальное стерео
RS-232/485 2 порта
IEEE-1284 (с поддержкой DMA) 1 порт
Программируемые универсальные входы-выходы GPIO 16 сигналов
I²C 4 канала
SPI 4 устройства

Выводы и ближайшее будущее

Сравнительные тесты процессоров среднего уровня Эльбрус и Intel для задач хранения данных показали примерно равные и одинаково достойные результаты, при этом каждый процессор показал свои интересные особенности.

Intel сильно превзошел Эльбрус в случайном чтении небольшими блоками, а также в последовательном чтении и записи небольшими блоками.

При случайной записи небольшими блоками оба процессора показывают равные результаты.

По показателям задержки Эльбрус выглядит значительно лучше Intel-а в потоковой нагрузке, т.е. в последовательном чтении и записи большими блоками.

Кроме того, Эльбрус в отличии от Intel, одинаково хорошо справляется как с нагрузками чтения, так и с нагрузками записи, в то время как у Intel чтение всегда значительно лучше записи.
Исходя из полученных результатов можно сделать вывод о применимости систем хранения данных Аэродиск Восток на процессоре Эльбрус 8С в следующих задачах:

  • информационные системы с преобладанием операций записи;
  • файловый доступ;
  • онлайн-трансляции;
  • видеонаблюдение;
  • резервное копирование;
  • медиа-контент.

Коллективу МЦСТ есть ещё над чем работать, но результат их работы виден уже сейчас, что, конечно, не может не радовать.

Данные тесты проводились на ядре Linux для e2k версии 4.19, на текущий момент в бета-тестах (в МЦСТ, в Базальт СПО, а также у нас, в Аэродиске) находится ядро Linux 5.4-e2k, в котором, кроме всего прочего, серьезно переработан планировщик и много оптимизаций под скоростные твердотельные накопители. Также специально для ядер ветки 5.х.х АО «МЦСТ» выпускает новый компилятор LCC версии 1.25. По предварительным результатам, на том же процессоре Эльбрус 8С, собранное новым компилятором новое же ядро, окружение ядра, системные утилиты и библиотеки и, собственно, ПО Аэродиск ВОСТОК позволит получить ещё более значительный прирост производительности. И это без замены оборудования — на том же процессоре и с теми же частотами.

Мы ожидаем выхода версии Аэродиск ВОСТОК на базе ядра 5.4 ближе к концу года, и как только работа над новой версией будет завершена, мы обновим результаты тестирования и также опубликуем их здесь.

Если теперь вернуться к началу статьи и ответить на вопрос, кто же прав: пессимисты, которые говорят, что Эльбрус «никакой» и никогда не догонит ведущих производителей процессоров, или все-таки оптимисты, которые говорят, что «уже почти догнали и скоро перегоним»? Если исходить не из стереотипов и религиозных предубеждений, а из реальных тестов, то, однозначно, правы оптимисты.

Эльбрус уже сейчас показывает хорошие результаты, если сравнивать его с процессорами x86-64 среднего уровня. До верхних в линейке моделей серверных процессоров Intel или AMD 8-ке Эльбруса, конечно, далеко, но она туда и не целилась, для этого будут выпущены процессоры 16С и 32С. Вот тогда и поговорим.

Мы понимаем, что после этой статьи вопросов про Эльбрус станет ещё больше, поэтому мы решили организовать ещё один онлайн-вебинар «ОколоИТ», чтобы в прямом эфире на эти вопросы дать ответы.

→ Регистрация на вебинар

Выводы

Во сколько раз Core i7 2600 быстрее Эльбрусов:

Во сколько раз Core i7 2600 быстрее Эльбрусов, если бы он работал на частоте Эльбрусов:

Как мы знаем, Эльбрус имеет VLIW архитектуру, у которой повышение производительности достигается путём оптимизации компилируемого кода (Эльбрус имеет явный параллелизм). Также у Эльбруса нет предсказателя переходов и переупорядочивания инструкций (снова всё явно задаётся компилятором).

Следует:

  • Компилируемые программы на C/C++ (возможно, другие) будут иметь хорошую производительность. Это достигается патчами участков кода, где нужно оптимизировать производительность и умным компилятором LCC (eLbrus C Compiler).
  • Языки с JIT-трансляцией (Java, JavaScript, C# Mono) будут иметь среднюю производительность. Здесь оптимизируют саму среду исполнения. Возможно, также потребуется оптимизировать сами программы.
  • Интерпретируемые языки (PHP, Python, Lua) будут иметь низкую производительность. Но оптимизация среды выполнения позволит поднять до среднего уровня.

Другие способы:

  • Доработка компилятора LCC.
  • Архитектурно-специфические доработки в самой ОС.
  • Улучшать архитектуру Эльбрус:
    • Поднимать частоту
    • Добавить предсказатель и т. д.

Какие языки ещё хотелось бы протестировать:

  • Golang (Ждём выпуска)
  • Ruby
  • Perl

P.S. Поздравляем команду МЦСТ с Новым Годом. Желаем удачи в разработке следующих поколений процессоров. Ждём массового появления устройств на процессорах с архитектурой E2K!

Заключение

Подробное изучение архитектуры процессора «Эльбрус-4С» оставило после себя двоякое впечатление. С одной стороны, не будем лукавить, по многим параметрам она является устаревшей и значительно отстает от продукции AMD и Intel. С другой стороны, отечественная электроника уже давно находится в периоде застоя, поэтому было бы глупо ожидать, что в такой ситуации процессоры МЦСТ смогут составить хоть какую-то конкуренцию западным разработкам. И здесь главное понимать, что предпринимаются реальные попытки возродить отечественную индустрию электроники. В такой ситуации выпуск «Эльбрус-4С» — очень большой шаг вперед. Тем более, что в архитектуре реализовано несколько очень интересных технологий, а со своими задачами в оборонной отрасли он справляется более чем уверенно.

У компании МЦСТ большие планы на будущее. Это и выпуск процессоров «Эльбрус-8С», и «Эльбрус-1С+». Так что следующий год во многом покажет, насколько конкурентоспособной окажется российская отрасль микроэлектроники.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector