Эта книга рассказывает об использовании OpenAI Gymи тензорного потока для обучения с высоким уровнем подкрепления
*Глубокое RL (RL)* – это прогрессивное направление ИИ, которое прочно завоевывает популярность в последнее время и имеет большой потенциал для приложений в различных областях.
Вы держите в руках подробное практическое руководство по применению глубокого обучения с подкреплением для профи на языке Python с использованием Open AI Gym и библиотеки машинного обучения TensorFlow. В книге изложены список основных понятий глубокого обучения и прокладывание путей в Open AI GYM и Tensroflow, описаны марковские цепи, метод Монте-Карло, динамическое программирование, теория вероятностей. От новых смыслов в направлениях DQL, DRQL, A P P, T R P O, изученных от и до тактики применяются современные школы. Как понятно из названия, книга предоставляет знакомство с инструментами создания агентов, умеющих откликаться на мнения пользователей, разбирать QFD, определение хода обучения, донастройки, калибровке и прочим новшествам RL. Справиться с книгой сможет только профессионал. Ее покупка позволит вам овладеть знаниями и навыками, необходимыми для проведения глубокого обучения в проектах и стать настоящим экспертом в области разумного управления без границ преград человеческой воли. Приобретая книгу вы сможете также получить epub файл для клиентов.
Электронная Книга «Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи (pdf + epub)» написана автором Судхарсан Равичандиран в 2018 году.
Минимальный возраст читателя: 16
Язык: Русский
Серии: Библиотека программиста (Питер)
ISBN: 978-5-4461-1251-7
Описание книги от Судхарсан Равичандиран
Глубокое обучение с подкреплением (Reinforcement Learning) – самое популярное и перспективное направление искусственного интеллекта. Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением. Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомитесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что «страшные» аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать. Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL. Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта. После покупки предоставляется дополнительная возможность скачать книгу в формате epub.