Книга «Обучение с подкреплением: Инженерный подход» от автора Фила Уиндера предоставляет детальное ознакомление с промышленным использованием обучения с подкреплением, а также объясняет, как эффективно решать любые по шаговые задачи благодаря методу проб и ошибке.
Автор описывает различные марковские процессы для принятия решений и их применение в практических задачах. Глубокие Q-нейронные сети, методы вычисления градиентов политик и устранение энтропии также рассматриваются в этой книге. Все теоретические основы RL и алгоритмов даются с применением к специфическим отраслям и наукам.
Это первая книга, которая объясняет RL как инженерный метод для решения сложных промышленных задач. Эта книга предлагает всеобъемлющее руководство по обучению с подкреплением и поможет инженерам и научным работникам, заинтересованным в применении этих методов в реальном мире.
Электронная Книга «Обучение с подкреплением для реальных задач. Инженерный подход» написана автором Фил Уиндер в 2021 году.
Минимальный возраст читателя: 0
Язык: Русский
ISBN: 978-5-9775-6885-2
Описание книги от Фил Уиндер
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга – первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе.