Эта книга представляет собой общее руководство по глубокому подходу к обучению с подкреплением на Python. Она содержит введение в эту область машинного обучения, которая совмещает в себе две связанные идеи: глубокие нейронные сети и технику обучения с подкреплением в процессе создания виртуальных агентов, способных к решению задач игрового жанра.
Книга начинается со знакомства с основами теории глубокого обучения и подкрепления, а также реализаций существующих алгоритмов на базе SLM lab. Затем авторы приводят примеры реальных приложений, в которых глубокое подкрепление, реализованных на языках программирования, удалось достичь уникальных результатов.
Издание должно быть полезно не только студентам, которые изучают компьютерные науки и Интернет, но и разработчикам программного обеспечения, знакомым с общими принципами машинного и глубокого обучения. Это руководство сочетает в одном издании важные моменты из этих областей знаний, что сделает процесс изучения более интересным и понятным.
Электронная Книга «Глубокое обучение с подкреплением. Теория и практика на языке Python» написана автором Лаура Грессер в 2020 году.
Минимальный возраст читателя: 16
Язык: Русский
Серии: Библиотека программиста (Питер)
ISBN: 978-5-4461-1699-7
Описание книги от Лаура Грессер
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области – от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники. Эта книга – введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL. Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.