Алгоритмы обучения с подкреплением на Python. Описание и разработка алгоритмов искусственного интеллекта
Эта книга представляет собой практическое руководство по освоению и реализации алгоритмов обучения с подкреплением (Reinforcement Learning, RL) с использованием языка Python. Автор подробно рассматривает ключевые элементы RL, включая стратегии, функции ценности, модели и системы вознаграждений, а также демонстрирует их применение для создания самообучающихся агентов искусственного интеллекта.
Вторая и третья части книги посвящены детальному разбору современных алгоритмов. Читатель научится сочетать Q-обучение с нейронными сетями для решения сложных задач, освоит методы градиента стратегии, а также такие продвинутые алгоритмы, как TRPO, PPO, DDPG и TD3. Особое внимание уделяется повышению производительности и устойчивости моделей.
Книга также охватывает смежные темы: технику подражательного обучения, алгоритмы исследования на основе верхней доверительной границы (UCB, UCB1) и метаалгоритм ESBAS. Издание содержит практические примеры работы со средой OpenAI Gym, что позволяет сразу применять полученные знания на практике. Книга предназначена для разработчиков, исследователей в области ИИ и всех, кто хочет с нуля освоить обучение с подкреплением, имея базовые навыки программирования на Python.









