Alphago Выиграла Третью, Решающую Партию У Ли Седоля

Третья победа искусственного интеллекта в исторической серии из пяти игр го

Го — восточноазиатская логическая игра с древней историей и богатыми культурными традициями.
Существует несколько правил и вариаций, но основная цель одна: каждому из двух игроков необходимо отгородить как можно большую территорию камнями своего цвета.
Исследователей ИИ привлекает Го из-за его сложности.
Покорять шахматы уже поздно — компьютеры уже несколько лет играют лучше людей.
Но в Го количество возможных позиций гораздо больше (10¹⁰⁰ ), чем в шахматах.
Современные программы играют хорошо, но на уровне любителей го.
Создание системы, способной превзойти лучших людей, возможно, займет в лучшем случае десятилетие.
Так говорили эксперты до появления AlphaGo. Разработка от DeepMind (компанию купила Google в 2014 году) использует метод Монте-Карло.
Лучшие современные компьютерные системы Go используют эту технологию.
Но в AlphaGo ходы также помогают нейронной сети выбирать политику и ценности.
Их можно назвать близкими родственниками нейронных сетей, распознающих изображения и речь.
Сначала система была обучена играть на 160 тысячах игр с сервера KGS. Затем AlphaGo попрактиковалась в играх против себя.
Этот пример ИИ впервые привлек внимание в январе.
Тогда Google опубликовано исследовательский документ об AlphaGo, в котором упоминается матч в октябре 2015 года.
Трехкратный чемпион Европы Фань Хуэй проиграл новой разработке в пяти играх из пяти.
Считается, что европейский уровень владения го ниже, чем на родине игры, в Азии.
Некоторые действия и ошибки Хуэя вызвали вопросы.
Именно поэтому игроки в Го и энтузиасты искусственного интеллекта с нетерпением ждали сеульского матча AlphaGo против одного из лучших представителей человеческой команды — обладателя девятого профессионального дана.
Ли Седоля .
До марта вопрос был следующий: Есть ли у AlphaGo шанс против Ли Седоля? ? Но Седоль проиграл первый , так второй стороны.
Если после первой партии мастер девятого дана проявил оптимизм, то после второй он ушел в замешательстве.
Седоль заявил, что не видел моментов, когда он вел игру.
Сегодня состоялась третья партия.
В игре были представлены бывший глава Google Рик Шмидт, один из важных инженеров компании Джефф Дин и Сергей Брин, недавно прилетевшие в Сеул.
Очевидно, что победа над Go символизирует важность технологий машинного обучения, которые являются сердцем Google.

Слева направо: основатель DeepMind Демис Хассабис, обладатель девятого профессионального дана Ли Седоль, сооснователь Google Сергей Брин.
Как и в первой партии, Седоль играл черными, то есть первым.
Также одним из хороших моментов будет знакомство с системой — у инженеров DeepMind вряд ли есть ресурсы, чтобы что-то менять в дни матчей.
По крайней мере, это слухи утверждает Этот Седоль и команда экспертов по Го провели ночь в поисках слабых мест AlphaGo. Первые ходы черных были агрессивными.
Похоже, Седоль пытался повести игру в другом направлении, пытаясь оказать давление на слабые места системы.
Видеозапись трансляции третьей партии матча AlphaGo - Ли Седоль.
В ходе игры ИИ продемонстрировал умение работать со сложными моментами в виде ко-позиций.
Считается, что компьютерные системы Го плохо справляются с Ко.
К концу третьей партии у черных кончилось время, поэтому мужчине пришлось на минуту задуматься над своими ходами.
После 176 ходов игра закончился победа системы AlphaGo. На часах ИИ оставалось 8 минут и 31 секунда.

Это третья подряд победа AlphaGo в серии.
Определен общий исход исторической серии из пяти игр.
Судьба денежного вознаграждения определена — очевидно, что теперь оно пойдет на благотворительность и развитие Го, как и было задумано в случае поражения человека.
Глубину демонстрации преимущества AlphaGo определят две последние игры в воскресенье и вторник – несмотря на четкое завершение серии, она все равно будет доыграна.

#АльфаГо выиграл третью игру и матч! Исторический момент. В полном восторге от невероятного гения Ли Седоля и горжусь потрясающей командой AlphaGo! — Демис Хассабис (@demishassabis) 12 марта 2016 г.

В марте прошлого года система победила профессионального игрока второго дана, сегодня она побеждает профессионального игрока девятого дана.

Возможно, этому способствовал тот факт, что система AlphaGo последние пять месяцев тренировалась сама с собой.

Как утверждает Генеральный директор DeepMind Демис Хассабис, текущая конфигурация использует примерно тот же объем аппаратных ресурсов, что и вариант, победивший Фань Хуэя.

Хассабис говорит что алгоритмы важнее, а не аппаратное обеспечение.

Последняя, пятая игра состоится во вторник.

Тогда и будут подведены итоги битвы между тысячами лет игры человека в Го и двумя годами разработки, работающей на кластере из нескольких десятков коммерчески доступных серверных процессоров и графических ускорителей.

Полезные материалы по теме: