Сотрудники Сеульского университета опубликовали изучать о моделировании движения двуногих персонажей на основе работы суставов и мышечных сокращений с помощью нейросети с Deep Reinforcement Learning. Ниже приведен перевод небольшого обзора.
Меня зовут Джи Ли.
Я профессор Сеульского национального университета и исследователь компьютерной графики с более чем 25-летним опытом.
Я исследую новые способы понимания, представления и моделирования движений человека и животных.
Моделирование движений двуногих персонажей на основе физики — известная проблема в робототехнике и компьютерной графике с середины 80-х годов.
В 90-х годах большинство двуногих контроллеров были основаны на упрощенной динамической модели (например, перевернутом маятнике), что позволяло использовать стратегию баланса, которую можно было вывести с помощью уравнения замкнутой формы.
С 2007 года появились контроллеры, которые используют динамику всего тела для достижения быстрого прогресса в этой области.
Примечательно, что теория оптимального управления и методы стохастической оптимизации, такие как CMS-ES, были основными инструментами для поддержания баланса моделируемых двуногих.
Постепенно исследователи построили более подробные модели человеческого тела.
В 1990 году модель перевернутого маятника имела менее пяти степеней свободы.
В 2007 году динамическая модель представляла собой 2D-фигуру, приводимую в движение двигателями в шарнирах с десятками степеней свободы.
В 2009-2010 годах появились полноценные 3D-модели со 100 степенями свободы.
В 2012–2014 годах появились контроллеры биомеханических моделей, приводимых в движение мышцами.
Контроллер каждый раз посылает сигнал каждой отдельной мышце, чтобы стимулировать их.
Сокращение мышц тянет прикрепленные кости и заставляет их двигаться.
В нашей работе мы задействовали 326 мышц для перемещения модели, включая все основные мышцы нашего тела, за исключением некоторых мелких.
Сложность управления движением двуногого персонажа.
Число степеней свободы динамической системы быстро росло с 2007 года.
Предыдущие подходы к проектированию контроллеров страдали от «проклятия размерности», когда требуемые вычислительные ресурсы (время и память) увеличиваются экспоненциально по мере увеличения числа степеней свободы.
.
Мы использовали глубокое обучение с подкреплением для решения проблем, связанных со сложностью скелетно-мышечной модели и масштабируемостью двуногого управления.
Сети могут эффективно представлять и хранить многомерные политики управления (функция, которая сопоставляет состояния с действиями) и исследовать невидимые состояния и действия.
Новый подход
Основное улучшение заключается в том, как мы справляемся с мышечной активацией по всему телу.Мы создали иерархическую сеть, которая в верхних слоях учится имитировать движение суставов при низкой частоте кадров (30 Гц), а в нижних слоях учится стимулировать мышцы на высоких частотах (1500 Гц).
Динамика сокращения мышц требует большей точности, чем моделирование скелета.
Наша иерархическая структура исключает расхождения в требованиях.
Чего мы достигли
Приятно видеть, как наш алгоритм работает с широким спектром движений человека.Мы пока не знаем, насколько он широк на самом деле, и пытаемся понять границы.
Пока мы их не достигли из-за ограничения вычислительных ресурсов.
Новый подход дает лучшие результаты каждый раз, когда мы вкладываем больше ресурсов (в основном ядер ЦП).
Плюсом является то, что глубокое обучение с подкреплением требует вычислительных усилий только на этапе обучения.
После изучения политики многомерного управления моделирование и контроль выполняются быстро.
Моделирование опорно-двигательного аппарата вскоре будет выполняться в интерактивных приложениях в реальном времени.
Например, в играх.
Мы используем мышечную модель Хилла, которая является фактическим стандартом биомеханики.
Наш алгоритм очень гибкий, поэтому можно включить любой динамический паттерн сокращения мышц.
Использование высокоточной модели мышц позволяет генерировать движения человека в различных состояниях, в том числе при патологиях, протезах и так далее.
Прямая мышца бедра.
3D-сетка поверхности (слева).
Приближение с путевыми точками (по центру).
Приблизительные координаты LBS путевых точек при сгибании колена (справа).
Использование глубокого обучения с подкреплением (DRL)
Мы разделяем ту же фундаментальную идею, что и исследование передвижения Deepmind, основанное на модели «палка-мотор».Удивительно, но стандартный алгоритм DRL хорошо работает с моделью «палка-и-мотор», но плохо работает с биомеханическими моделями, активируемыми мышцами.
На прошлой выставке NeurlPS 2018 возникла проблема ИИ для протезирования .
У конкурсной модели всего 20+ мышц, но даже результат победителя выглядит не лучшим образом.
Этот пример показывает сложность тренировки моделей с мышечной силой.
Наша иерархическая модель совершает прорыв и позволяет применять ДХО к биомеханической модели человека с большим количеством мышц.
Проект в PDF .
Проект на тему Гитхаб .
Тему исследовали: Джехи Ли, Сынхван Ли, Кёнмин Ли и Мунсок Пак.
Теги: #Машинное обучение #Разработка игр #нейронные сети #биомеханика #симуляция #глубокое обучение с подкреплением #симуляции
-
Конференции Рунета 2014
19 Oct, 24 -
Началось Голосование За Отчеты Yiiconf
19 Oct, 24 -
«Что Бы Сделал Иисус?»
19 Oct, 24 -
Видео По Ремонту Станка
19 Oct, 24