Глубокое обучение с подкреплением: теория и практика на языке Python

Лаура Грессер, Ван Лун Кенг

Эта книга представляет собой комплексное введение в область глубокого обучения с подкреплением (Deep Reinforcement Learning, Deep RL), уникально сочетающее теоретические основы с практической реализацией. Авторы начинают с фундаментальных понятий обучения с подкреплением, постепенно погружая читателя в мир последовательных задач принятия решений, где виртуальные агенты учатся на взаимодействии со средой.

В первой части подробно рассматриваются классические и современные алгоритмы, основанные на стратегиях и полезностях, такие как REINFORCE, SARSA и глубокие Q-сети (DQN), включая их улучшенные версии. Вторая часть посвящена комбинированным методам, включая метод актора-критика с преимуществом (A2C), оптимизацию ближайшей стратегии (PPO) и методы параллелизации, а также содержит сравнительный анализ алгоритмов.

Третья, практическая часть книги, фокусируется на применении знаний. Она охватывает начало работы с глубоким RL, знакомит с программной библиотекой SLM Lab, рассматривает архитектуры нейронных сетей и вопросы аппаратного обеспечения, необходимые для эффективных экспериментов. Книга богато иллюстрирована и содержит примеры реализации на Python.

Издание идеально подходит для студентов, изучающих компьютерные науки, и разработчиков программного обеспечения, уже знакомых с основами машинного обучения и языком Python. Оно служит мостом между теорией алгоритмов глубокого RL и их практическим применением для решения реальных задач, от игр до робототехники.

Похожие книги

Обучение с подкреплением для реальных задач. Инженерный подход

Фил Уиндер

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

Судхарсан Равичандиран

Глубокое обучение: легкая разработка проектов на Python

Сет Вейдман

Алгоритмы обучения с подкреплением на Python. Описание и разработка алгоритмов искусственного интеллекта

Андреа Лонца

Обучение с подкреплением на PyTorch: сборник рецептов

Юси (Хэйден) Лю

Глубокое обучение в биологии и медицине

Бхарат Рамсундар, Питер Истман, Патрик Уолтерс, Виджай Панде

Глубокое обучение с fastai и PyTorch: минимум формул, минимум кода, максимум эффективности

Джереми Ховард и Сильвейн Гуггер

Глубокое обучение с точки зрения практика

Джош Паттерсон, Адам Гибсон

Алгоритмы машинного обучения

Вадим Смоляков

Глубокое обучение систем компьютерного зрения

М. В. Ронкин, А. Ю. Долганов