Глубокое обучение с подкреплением: теория и практика на языке Python
Эта книга представляет собой комплексное введение в область глубокого обучения с подкреплением (Deep Reinforcement Learning, Deep RL), уникально сочетающее теоретические основы с практической реализацией. Авторы начинают с фундаментальных понятий обучения с подкреплением, постепенно погружая читателя в мир последовательных задач принятия решений, где виртуальные агенты учатся на взаимодействии со средой.
В первой части подробно рассматриваются классические и современные алгоритмы, основанные на стратегиях и полезностях, такие как REINFORCE, SARSA и глубокие Q-сети (DQN), включая их улучшенные версии. Вторая часть посвящена комбинированным методам, включая метод актора-критика с преимуществом (A2C), оптимизацию ближайшей стратегии (PPO) и методы параллелизации, а также содержит сравнительный анализ алгоритмов.
Третья, практическая часть книги, фокусируется на применении знаний. Она охватывает начало работы с глубоким RL, знакомит с программной библиотекой SLM Lab, рассматривает архитектуры нейронных сетей и вопросы аппаратного обеспечения, необходимые для эффективных экспериментов. Книга богато иллюстрирована и содержит примеры реализации на Python.
Издание идеально подходит для студентов, изучающих компьютерные науки, и разработчиков программного обеспечения, уже знакомых с основами машинного обучения и языком Python. Оно служит мостом между теорией алгоритмов глубокого RL и их практическим применением для решения реальных задач, от игр до робототехники.









