О новой российской 50-ядерной микросхеме 1892ВМ248 для роботов и серверов

Российский разработчик микросхем НПЦ ЭЛВИС (Научно-производственный центр «Электронные вычислительно-информационные системы») сообщил о создании новой 50-ядерной гетерогенной системы на кристалле RoboDeus («Процессор 1892ВМ248»). Эта микросхема предназначена для встраиваемых систем и робототехники, высших роботов, серверов с элементами искусственного интеллекта, систем хранения данных и центров обработки данных.
По данным разработчика, российская RoboDeus от НПЦ ЭЛВИС представляет собой систему на кристалле многоядерного микропроцессора для нового поколения оборудования с поддержкой видеоаналитики. Микросхема может использоваться в когнитивных серверах, в задачах обучения нейронных сетей, автономных робототехнических комплексах и мультимедийных приложениях.
RoboDeus изготавливается по технологии 16 нм с поддержкой DDR4 и включает 8-ядерный когерентный кластер CPU MIPS64, кластер на базе 16 DSP-ядер ELcore-50, 4 графических ядра PowerVR Series8XT, кодеки HEVC/H.264, навигационное ядро с поддержкой ГЛОНАСС/GPS/BeiDou/GALILEO и встроенные порты ввода/вывода.
Полные технические характеристики 1892ВМ248 с сайта разработчика:
-
Технология изготовления – КМОП, 16 нм процесс TSMC;
-
Максимальная рабочая частота, МГц – 1500 (CPU)/ 600-1000 (DSP)/ 600 (GPU);
-
Общее потребление микропроцессора – до 100 Вт, гибко варьируется до минимальных параметров;
-
Встроенный L3 кэш -16 Мбайт;
-
Специальный аппаратный блок для обеспечения управления режимами энергосбережения (Low Power Management);
-
Напряжение электропитания:
- напряжение питания ядра 1– 1,2 В;
- настраиваемое напряжение питания периферии 1.8/2.5/3.3 В;
-
Тип корпуса: 2022 HFCBGA;
-
Многоядерная гетерогенная MIMD-архитектура на базе стандартных процессорных и специализированных ядер:
- управляющий когерентный кластер из 8 CPU ядер MIPS64 I6500 и рабочей частотой процессорных ядер до 1500 МГц;
- арифметический сопроцессор, соответствующий стандарту IEEE 754, generation 3 для каждого из ядер MIPS64, 128-битный SIMD сопроцессор (MSA), кэш второго уровня, общим объемом 4 Мбайт и кэш третьего уровня общим объемом 16 Мбайт;
- ядро CPU MIPS64 I6400 сервисного процессора для управления системой;
- высокопроизводительный кластер на базе 16 DSP-ядер ELcore-50 (IP-ядро ЭЛВИС) с возможностью управления ресурсами микросхемы и внешней памяти, совместимых с линейкой «DELcore» с плавающей и фиксированной точкой;
-
пиковая производительность DSP кластера:
- 1 TFLOPs DP (FP64);
- 4 TFLOPs SP (FP32);
- 16 TFLOPs HP (FP 16);
-
общий объём памяти программ и данных кластера – 16 Мбайт;
-
пиковая производительность одного DSP-ядра (операций за такт):
- 64 MAC для формата FP64;
- 256 MAC в формате FP32;
- 1024 MAC в формате FP16;
- 8 MAC в формате INT64;
- 64 MAC в формате INT32;
- 256 MAC в формате INT16;
- 1024 MAC в формате INT8;
-
поддержка и обеспечение резервного реконфигурируемого контура управления внутри микросхемы на базе отечественного CPU- ядра;
-
встроенный графический акселератор (PowerVR Series8XT GT8540): 4 когерентных ядра с рабочей частотой не менее 600 МГц на базе графического ядра PowerVR 8XT GT8540;
-
пиковая производительность GPU:
- в формате FP32 – 230 GFLOPs;
- в формате FP16 – 460 GFLOPs;
-
поддерживаемые стандарты: OpenGL, OpenCL, OpenVG;
-
поддержка режима программируемого вычислителя (pGPU) с API OpenCL;
-
встроенный многофункциональный препроцессор обработки изображений (ISP);
-
встроенное ядро кодирования декодирования видео:
- в режиме кодирования:
- 2 многостандартных кодера форматов H.265 (HEVC) и H.264 с поддержкой всех основных профилей, скорости кодирования:
- 1x 4K UHD (3840х1080) 60 кадров/с;
- 2x 4K UHD (3840х1080) 30 кадров/с;
- 8x Full HD (1920х1080) 30 кадров/с;
- поддержка кодирования одновременно до 8 потоков (по 4 потока на каждый кодер);
- отдельный блок кодирования в стандартах JPEG и M-JPEG: скорость – до 1 Гпикселя в секунду, разрешение UHD 60 кадров/с;
- 2 многостандартных кодера форматов H.265 (HEVC) и H.264 с поддержкой всех основных профилей, скорости кодирования:
- в режиме декодирования:
- 2 многостандартных декодера форматов H.265 (HEVC) и H.264 с поддержкой всех основных профилей;
- поддержка декодирования одновременно до 8 потоков (по 4 потока на каждый декодер);
- для режимов кодера/декодера:
- поддержка разрешения до 8К;
- глубина цвета – до 10 бит на канал;
- поддержка цветовой субдискретизации 4:0:0, 4:2:0, 4:2:2;
- встроенные микроконтроллеры для управления параметрами кодирования и декодирования;
- в режиме кодирования:
-
4-х стандартное навигационное ядро, ГЛОНАСС/GPS/BeiDou/GALILEO;
-
Периферия:
- 4 порта DDR4 с 72-разрядными шинами данных (с системной поддержкой ECC и CRC), пропускная способность 819 Гбит/с;
- 4 контроллера по 4 линии PCI Express 4.0, пропускная способность 16 ГТ/с на линию;
- 2 контроллера Ethernet MAC 1 Гбит;
- контроллер MAC Ethernet 10 Гбит + PHY;
- NAND Flash контроллер с ECC (ONFI 2.2, 8/16 бит, 200 MT/с);
- 2 контроллера SATA 3.0 по 6 ГТ/с;
- 2 порта USB 3.1 + PHY по 10 ГТ/с;
- 64 линии ввода-вывода GPIO;
- 3 SD/MMC порта (SDHC/SDXC, UHS-I, 104 Mбит/с) с поддержкой eMMC 4.5;
- 4 универсальных асинхронных порта (UART) типа 16550А с поддержкой IrDA;
- 5 портов I2C интерфейса (1 Мбит/с);
- 2 выделенных порта интерфейса SPI;
- выделенный порт интерфейса I2S;
- многофункциональный контроллер LCD – дисплеев с частотой следования пикселей 594 МГц, поддержка видеовывода HDMI с разрешением 3840x2160p60;
- 2 многофункциональных порта MFBSP (LPORT, SPI, I2S, GPIO) со встроенным контроллером DMA;
- 2 порта MIPI CSI2 с возможностью подключения 2 камер, поддержка интерфейсов CMOS, HiSPI, LVDS;
- 8 универсальных 32-разрядных таймеров;
- система коммутации, построенная по принципу NOC (сеть на кристалле) с встроенной подсистемой обеспечения безопасности и виртуализации;
- широкие возможности по отладке и трассированию программ: архитектура отладки и трассирования MIPS EJTAG, отладка по стандарту IEEE1149.1 (JTAG), порт отладки c доступом к внутренней памяти микросхемы, подсистема сбора программной трассы от CPU и DSP в реальном времени, вывод трассы через внешний порт; контроллер управления электропитанием;
-
Инструментальное программное обеспечение:
- компилятор языка С/C++ для процессорного блока CPU;
- компилятор С/С++/C11 для блока сигнальной обработки DSP;
- средства компиляции OpenCL для графического ускорителя (GPU);
- пакет бинарных утилит на основе binutils: ассемблер, дизассемблер, линкер, библиотекарь;
- поддержка на аппаратном уровне примитивов, используемых в нейросетях DNN;
-
Интегрированная среда разработки и отладки программ:
- средства разработки программ, симулятор микросхемы, средства отладки включают:
- средства профилирования исполнения программ на CPU;
- средства профилирования исполнения программ на GPU;
- средства профилирования исполнения программ на DSP;
- создание проекта, компиляцию файлов проекта и сборку проекта с получением исполняемого кода и отладку на программном симуляторе и отладочной плате для СнК;
- ввод и редактирование текстов программы;
- компиляцию файлов и компоновку программы;
- диагностику и визуальную локализацию синтаксических ошибок;
- подготовку образа памяти для загрузки в целевое устройство;
- отладку программ;
- симулятор микросхемы обеспечивает программную имитацию команд процессорных ядер микросхемы, работу с памятью, графическим процессором (поддержка OpenGL и другие API для GPU) и периферийными устройствами микросхемы;
- средства отладки программ обеспечивают отладку программ на симуляторе микросхемы и непосредственно на микросхеме через порт JTAG микросхемы и порт USB инструментальной машины, а также:
- загрузку программ в модель памяти;
- задание точек останова программы по адресу в программе или на строке программы;
- запуск программы;
- исполнение программы до точки останова или по шагам, с заходом в вызываемую функцию или с пропуском вызываемых функций;
- получение сообщений об остановах и завершении программы;
- чтение данных из памяти симулятора по адресу или символическому имени переменной при остановах программы;
- чтение данных из памяти и с регистров симулятора (или микросхемы) и запись данных в память и регистры симулятора микросхемы (или микросхемы);
- программу начальной загрузки для обеспечения резервного реконфигурируемого контура управления внутри микросхемы на базе отечественного CPU- ядра.
- средства разработки программ, симулятор микросхемы, средства отладки включают: