Алгоритмы обучения с подкреплением на Python. Описание и разработка алгоритмов искусственного интеллекта

Андреа Лонца

Эта книга представляет собой практическое руководство по освоению и реализации алгоритмов обучения с подкреплением (Reinforcement Learning, RL) с использованием языка Python. Автор подробно рассматривает ключевые элементы RL, включая стратегии, функции ценности, модели и системы вознаграждений, а также демонстрирует их применение для создания самообучающихся агентов искусственного интеллекта.

Вторая и третья части книги посвящены детальному разбору современных алгоритмов. Читатель научится сочетать Q-обучение с нейронными сетями для решения сложных задач, освоит методы градиента стратегии, а также такие продвинутые алгоритмы, как TRPO, PPO, DDPG и TD3. Особое внимание уделяется повышению производительности и устойчивости моделей.

Книга также охватывает смежные темы: технику подражательного обучения, алгоритмы исследования на основе верхней доверительной границы (UCB, UCB1) и метаалгоритм ESBAS. Издание содержит практические примеры работы со средой OpenAI Gym, что позволяет сразу применять полученные знания на практике. Книга предназначена для разработчиков, исследователей в области ИИ и всех, кто хочет с нуля освоить обучение с подкреплением, имея базовые навыки программирования на Python.

Похожие книги

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

Судхарсан Равичандиран

Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка

Бенджамин Бенгфорт, Ребекка Билбро, Тони Охеда

Глубокое обучение с подкреплением: теория и практика на языке Python

Лаура Грессер, Ван Лун Кенг

Знакомство с PyTorch: глубокое обучение при обработке естественного языка

Делип Рао, Брайан Макмахан

Глубокое обучение в картинках. Визуальный гид по искусственному интеллекту

Джон Крон, Грант Бейлевельд, Аглаэ Бассенс

Глубокое обучение: легкая разработка проектов на Python

Сет Вейдман

Машинное обучение и TensorFlow

Нишант Шакла, Кеннет Фриклс

Алгоритмы неформально. Инструкция для начинающих питонистов

Брэдфорд Такфилд

Python. Чистый код для продолжающих

Эл Свейгарт

Обучение с подкреплением для реальных задач. Инженерный подход

Фил Уиндер