Чипы Intel Myriad X И Их Масштабируемость В Нейронных Сетях

Невротика Intel NCS2, чипы Myriad X, решения сторонних производителей — Intel продвигает решения на базе Myriad X в самых разных вариантах.
Почему эти ускорители так хороши? Во-первых, стоимость одного FPS. Во-вторых, полная совместимость с OpenVINO, где вы можете перенести существующие решения с CPU/GPU на флешку или MyriadX без модификации или дополнительной адаптации.
Конечно, адаптация — это не особенность VPU, а скорее особенность OpenVINO, где каждая обученная сеть может работать на любой выбранной аппаратной платформе, будь то CPU, GPU, FPGA, VPU, и выбор можно сделать не до разработки, но после.
Рассмотрим основные показатели установленных в них планок и чипов при выводе нейросетей на базе топологий UNET 576x384 и Darknet19 MMR (распознавание размеров и моделей транспортных средств):

Основные показатели Intel NCS2 в выводе нейронных сетей UNET, Darknet19 Соответственно, при низкой стоимости мы имеем высокую эффективность использования этих устройств.
А что, если мы говорим о выводе входящих видеопотоков, например, RTSP Ful HD 15 FPS H.264/H.265 внутри серверной инфраструктуры? Вы не можете вставлять флешки в сервер; все-таки это решения для домашнего использования или для экспериментов:

Intel нейронный вычислительный модуль В серверном выводе сейчас часто используются графические процессоры nVidia Tesla 4 и Tesla V100. Но есть и вариант от Intel с Myriad X на борту — это Intel Vision Accelerator, специализированное узкопрофильное решение для PCIe или M.2, в зависимости от модификации и количества чипов на плате.
Ниже представлена PCIe-модификация платы:

Intel Vision Ускоритель Основных модификаций здесь три — платы с 1, 2, 8 Myriad X на борту в форматах M.2, M-PCIe или полноразмерном PCIe. Вот основные характеристики и требования:

Модификации Intel Vision Accelerator с 1, 2, 8 Myriad X на борту Рассмотрим модификации плат от UP Board, например, UP Core AI. Такие устройства часто используются при выводе в непосредственной близости от камеры или других автономных малогабаритных устройств, что позволяет существенно экономить драгоценные ресурсы существующих устройств и не требует их полной замены при дополнении существующего функционала навыками искусственного интеллекта.

Вверх по ядру

Но что, если требуется более высокая плотность?

Интересное решение предложила компания ComBox Technology — полноразмерная несущая плата PCIe x4 с 8 блейдами, в каждой из которых установлено по 8 чипов Myriad X MA2485. По сути, это блейд-система на шине PCIe, где внутри несущей платы может быть установлено от 1 до 8 планок с 8 ускорителями вывода на каждой.

Результатом является промышленное масштабируемое решение с высокой плотностью VPU для корпоративного сегмента.

Все блейды в системе отображаются как несколько карт HDDL с 8 ускорителями в каждой.

Это позволяет использовать набор как для вывода одной задачи со множеством входящих потоков, так и для множества разных задач.

Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Блейд-плата ComBox Myriad X В решении используется PLX с 12 линиями PCIe, 8 из которых идут на 8 блейдов, по одной линии на каждый и 4 на материнскую плату.

Далее каждая линия идет на коммутатор PCIe-USB, где для подключения используется 1 порт, а на каждый подключенный Myriad X пробрасывается 8. Общая потребляемая мощность платы с 64 чипами не превышает 100 Вт, но возможно также последовательное соединение необходимого количества блейдов, что пропорционально влияет на энергопотребление.

Итого в пределах одной полноразмерной карты PCIe имеем 64 Myriad X, а в рамках серверного решения на платформе, например, от Supermicro 1029GQ-TRT, 4 карты в форм-факторе 1U, т.е.

256 микросхем вывода Myriad X на 1U. .

Чипы Intel Myriad X и их масштабируемость в нейронных сетях

Супермикро 1029GQ-TRT Если сравнивать решение на базе Myriad X с nVidia Tesla T4, то разумно рассматривать топологию ResNet50, в которой VPU выдает 35 FPS. Итого имеем 35 FPS/Myriad X * 64 штуки = 2240 FPS/плата и 8960 FPS/1U сервер, что сопоставимо с производительностью батчи=1 nVidia Tesla V100, при этом стоимость ускорителя на Myriad X существенно меньше.

Не только стоимость показывает целесообразность использования Myriad X в выводе, но и возможность параллельного вывода различных нейронных сетей, а также эффективность с точки зрения выделения тепла и энергопотребления.

Теги: #Машинное обучение #Процессоры #Высокая производительность #искусственный интеллект #нейронные сети #аппаратное обеспечение #вывод

Чипы Intel Myriad X И Их Масштабируемость В Нейронных Сетях

Последнее изменение: 2024-10-19 21:10:22

Вместе с данным постом часто просматривают:

Чипы Intel Myriad X И Их Масштабируемость В Нейронных Сетях

Но что, если требуется более высокая плотность?

Глобальный Фонд Юрия Мильнера Dst Инвестировал В Гонконгский Стартап P2P-Кредитования Welab

Вычислительный Сюжет Или Настольная Ролевая Зараза

Опенстэк. Детективная История Или Где Связь? Часть Вторая. Ipv6 И Многое Другое

Hd-Видео В Интернете — Flash Или Silverlight?

Что Должна Вернуть Функция?

Биткойн Покоряет Телеэкраны

Как Я Играл В Банке

Интернет-Провайдер 2.0. Футуристическая Идея.

Отключение Ctrl-Alt-Delete, Alt-Tab, Start И Других Комбинаций

Страна Не Узнала Своих Героев

Автор Статьи

Роман Иванов

Интересно

Sigbop Signature Solutions — Программное Обеспечение Для Электронного Маркетинга...

Лазарь: Кто Стоит За Атаками На Систему Банковских Переводов Swift...

Polymer (Полимер) - Программное Обеспечение Для Предотвращения Потери Данных...

Как Работают Pr-Компании...

Ипотечные Лидеры, Подход К Увеличению Продаж...

Как Выбрать Лучшую Партнерскую Программу Казино...

Почему Употребление Горячего Шоколада Может Сделать Вас Лучше...

Dima Manisha