Как Выиграть Игру С Неизвестными Правилами?

Привет, Хабр! Короче говоря, приглашаем всех принять участие в необычном соревновании по машинному обучению.

Вызов черного ящика , который поддерживается DCA.

Как выиграть игру с неизвестными правилами?

Условия просты: вам нужно написать бота, который сможет играть в игру с неизвестными правилами.

Победители получат ценные призы: от Xbox One до 300 тысяч рублей за первое место и возможность попасть в крутые компании в качестве специалиста по машинному обучению.

Ниже мы поговорим о конкурсе в формате вопрос-ответ.



Что за соревнование?

Итак, вам нужно научить бота играть в игру с неизвестными правилами.

На каждом этапе игры бот может узнать вектор состояния игровой среды, подумать, что он хочет делать в этом состоянии, и предпринять одно из четырех возможных действий.

За совершенные действия бот получает вознаграждение, иногда сразу, иногда только через некоторое время после действия.

То есть не всегда сразу можно понять, хорошее было действие или нет. Кроме того, игра не является детерминированной; в наградах присутствует элемент случайности.

Но случайность уже заморожена в файлах уровней.

Это нужно для того, чтобы результат на уровне не зависел от запуска.

Вы можете представить это так: мы подбросили монету 100 раз и сохранили все результаты.

Затем мы используем эти результаты для расчета вознаграждений.

Подробнее об условиях и интерфейсе игры можно прочитать на сайте сайт конкурса .

Там же можно найти тестовые примеры, характеристики и полезные ссылки для изучения вопроса (хотя времени осталось мало).



Чем он отличается от Kaggle?

Kaggle — самая известная международная платформа для соревнований по машинному обучению.

Все соревнования на Kaggle построены примерно следующим образом:

  • Участник загружает данные
  • Обучает модель (например, классификатор) с использованием этих данных
  • Делает прогнозы для неизвестных данных, используя свою модель, и создает статический файл с ответами.

  • Загружает файл с ответами на сервер Kaggle, где проверяется качество его прогнозов.

    Победителем становится тот, чей файл ответов окажется более точным.

Наш конкурс построен по-другому:
  • Участник скачивает игровой симулятор и обучающие уровни.

  • Учит бота проходить обучающие уровни
  • Он загружает исходный код своего бота на наш сервер, где проверяет, сколько очков он набирает на неизвестном ему уровне.

    Выигрывает тот, чей бот наберет больше очков.

Другими словами, решение проблемы на Kaggle — это статический файл с ответами.

Решение в нашем конкурсе — обученный агент, взаимодействующий с неизвестной игровой средой.



Тогда в чем отличие от Russian AI Cup?

Короче говоря, то, что правила неизвестны.

Ежегодно наш партнер Mail.ru проводит открытые соревнования по искусственному программированию — Russian AI Cup. Например, в прошлом году нужно было создать программу для управления одним или группой кодмобилей.

Если внимательно посмотреть на прошлогодних победителей российского AI Cup, то окажется, что во всех их решениях использовались априорные человеческие знания о структуре игры и вообще не использовалось машинное обучение.

Мы подумали, что будет интереснее, когда система не будет использовать человеческий опыт, а научится понимать саму среду, в частности играть в игры.

Чтобы облегчить это, мы создали игру с неизвестными правилами.



Кто-нибудь уже знает, как научить машины играть в игры?

Да, эта область машинного обучения называется Обучение с подкреплением .

Не так давно компания Google Глубокий разум (тот самый, который создал АльфаГо ) выпустил отличную статью» Игра в Atari с глубоким обучением с подкреплением », в котором он научил программу играть в десятки игр Atari 2600 на человеческом уровне.

Некоторые участники пытаются использовать свои идеи для нашей игры, но судя по чат в Telegram, пока не очень удачно :)

Как сейчас обстоят дела у участников?

На сайте мы разместили пример простого бот , кто немного умеет играть в нашу игру.

Как мы это придумали, пока будет нашей тайной — мы не хотим ограничивать вашу фантазию нашей идеей.

Результат работы этого бота (2090 баллов на проверочном наборе) мы считаем базовым уровнем для участников.

На данный момент из более чем 850 зарегистрированных участников преодолеть этот уровень смогли 42, это оказалось не так просто, как мы думали.

Многие из участников, преодолевших базовый уровень, добились этого, просто немного улучшив коэффициенты нашего простого бота.

Мы надеемся, что вы сможете превзойти их с помощью новых подходов.

:)

Что нужно, чтобы начать участвовать?

Достаточно иметь Python с установленным модулем numpy и уметь на нем программировать.

Если по каким-то причинам у вас нет Python, рекомендуем установить Анаконда Последняя версия.

Anaconda — это Python со множеством полезных библиотек для машинного обучения и анализа данных.



На каких языках вы можете писать?

Мы поддерживаем только Python. До недавнего времени можно было использовать только Python 2.7, но мы решили, что нет смысла сопротивляться будущему и сделали поддержку Python 3.5. Если что-то вас не устраивает, не стесняйтесь сразу писать нам.

Мы стараемся помочь каждому.



Каковы призы?

Призовой фонд составляет более 600 000 рублей.

Эти средства будут распределены следующим образом: 1 место: 300 000 рублей 2 место: 170 000 рублей 3-е место: 125 000 рублей Кроме того, следующие пять лучших участников получат Microsoft Xbox One.

Что там было с вакансиями?

Партнеры конкурса — Data-Centric Alliance, Mail.ru, Skyeng постоянно ищут продвинутых специалистов в области машинного обучения и анализа данных.

Участники, хорошо выступившие в нашем конкурсе и предложившие нетривиальные подходы, будут приглашены на собеседования.

Это означает, что впереди маячит карьера с еще более интересными задачами в области машинного обучения.



Каковы сроки?

30 мая 2016, 23:59 по московскому времени: Крайний срок загрузки решений.

10 июня 2016 г.

: определение победителей.



Как следить за новостями?

У нас есть Форум , где мы публикуем новости о конкурсе, отвечаем на вопросы и где участники делятся идеями.

Также у нас есть два Telegram-канала для обсуждений: англоговорящий И русскоязычный .

Задавайте свои вопросы в комментариях, мы будем рады ответить! Теги: #черный ящик #вызов #kaggle #машинное обучение #искусственный интеллект #Машинное обучение #искусственный интеллект #спортивное программирование #Большие данные #Машинное обучение

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.