Чипы Intel Myriad X И Их Масштабируемость В Нейронных Сетях



Невротика Intel NCS2, чипы Myriad X, решения сторонних производителей — Intel продвигает решения на базе Myriad X в самых разных вариантах.

Почему эти ускорители так хороши? Во-первых, стоимость одного FPS. Во-вторых, полная совместимость с OpenVINO, где вы можете перенести существующие решения с CPU/GPU на флешку или MyriadX без модификации или дополнительной адаптации.

Конечно, адаптация — это не особенность VPU, а скорее особенность OpenVINO, где каждая обученная сеть может работать на любой выбранной аппаратной платформе, будь то CPU, GPU, FPGA, VPU, и выбор можно сделать не до разработки, но после.

Рассмотрим основные показатели установленных в них планок и чипов при выводе нейросетей на базе топологий UNET 576x384 и Darknet19 MMR (распознавание размеров и моделей транспортных средств):

Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Основные показатели Intel NCS2 в выводе нейронных сетей UNET, Darknet19 Соответственно, при низкой стоимости мы имеем высокую эффективность использования этих устройств.

А что, если мы говорим о выводе входящих видеопотоков, например, RTSP Ful HD 15 FPS H.264/H.265 внутри серверной инфраструктуры? Вы не можете вставлять флешки в сервер; все-таки это решения для домашнего использования или для экспериментов:

Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Intel нейронный вычислительный модуль В серверном выводе сейчас часто используются графические процессоры nVidia Tesla 4 и Tesla V100. Но есть и вариант от Intel с Myriad X на борту — это Intel Vision Accelerator, специализированное узкопрофильное решение для PCIe или M.2, в зависимости от модификации и количества чипов на плате.

Ниже представлена PCIe-модификация платы:

Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Intel Vision Ускоритель Основных модификаций здесь три — платы с 1, 2, 8 Myriad X на борту в форматах M.2, M-PCIe или полноразмерном PCIe. Вот основные характеристики и требования:

Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Модификации Intel Vision Accelerator с 1, 2, 8 Myriad X на борту Рассмотрим модификации плат от UP Board, например, UP Core AI. Такие устройства часто используются при выводе в непосредственной близости от камеры или других автономных малогабаритных устройств, что позволяет существенно экономить драгоценные ресурсы существующих устройств и не требует их полной замены при дополнении существующего функционала навыками искусственного интеллекта.



Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Вверх по ядру



Но что, если требуется более высокая плотность?

Интересное решение предложила компания ComBox Technology — полноразмерная несущая плата PCIe x4 с 8 блейдами, в каждой из которых установлено по 8 чипов Myriad X MA2485. По сути, это блейд-система на шине PCIe, где внутри несущей платы может быть установлено от 1 до 8 планок с 8 ускорителями вывода на каждой.

Результатом является промышленное масштабируемое решение с высокой плотностью VPU для корпоративного сегмента.

Все блейды в системе отображаются как несколько карт HDDL с 8 ускорителями в каждой.

Это позволяет использовать набор как для вывода одной задачи со множеством входящих потоков, так и для множества разных задач.



Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Блейд-плата ComBox Myriad X В решении используется PLX с 12 линиями PCIe, 8 из которых идут на 8 блейдов, по одной линии на каждый и 4 на материнскую плату.

Далее каждая линия идет на коммутатор PCIe-USB, где для подключения используется 1 порт, а на каждый подключенный Myriad X пробрасывается 8. Общая потребляемая мощность платы с 64 чипами не превышает 100 Вт, но возможно также последовательное соединение необходимого количества блейдов, что пропорционально влияет на энергопотребление.

Итого в пределах одной полноразмерной карты PCIe имеем 64 Myriad X, а в рамках серверного решения на платформе, например, от Supermicro 1029GQ-TRT, 4 карты в форм-факторе 1U, т.е.

256 микросхем вывода Myriad X на 1U. .



Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Супермикро 1029GQ-TRT Если сравнивать решение на базе Myriad X с nVidia Tesla T4, то разумно рассматривать топологию ResNet50, в которой VPU выдает 35 FPS. Итого имеем 35 FPS/Myriad X * 64 штуки = 2240 FPS/плата и 8960 FPS/1U сервер, что сопоставимо с производительностью батчи=1 nVidia Tesla V100, при этом стоимость ускорителя на Myriad X существенно меньше.

Не только стоимость показывает целесообразность использования Myriad X в выводе, но и возможность параллельного вывода различных нейронных сетей, а также эффективность с точки зрения выделения тепла и энергопотребления.

Теги: #Машинное обучение #Процессоры #Высокая производительность #искусственный интеллект #нейронные сети #аппаратное обеспечение #вывод

Вместе с данным постом часто просматривают: