Transformers: полное руководство по применению за пределами NLP

Эта книга представляет собой всеобъемлющее руководство по архитектуре трансформеров, выходящее далеко за рамки их классического применения в обработке естественного языка (NLP). Автор подробно исследует фундаментальные принципы работы трансформеров — от токенизации и механизма внимания до позиционных энкодингов и структуры энкодера-декодера — обеспечивая прочную теоретическую основу.

Основное внимание уделяется практическому применению трансформеров в нетрадиционных областях. Читатель узнает, как адаптировать эту архитектуру для работы с временными рядами, включая моделирование финансовых данных и обнаружение аномалий с использованием таких моделей, как Chronos, PatchTST и TimesFM. Книга также охватывает передовые методы в компьютерном зрении, такие как классификация изображений и семантическая сегментация с помощью Swin Transformer V2 и Segment Anything Model (SAM).

Отдельные разделы посвящены генеративным моделям для создания изображений и видео на основе диффузионных трансформеров (DiT, PIXART-α/Σ, Latte, Tora). Автор объясняет, как сочетание диффузионных процессов с архитектурой трансформеров позволяет создавать высококачественный визуальный контент. Книга также затрагивает применение трансформеров в аудиодомене, демонстрируя универсальность этой архитектуры.

Издание ориентировано на практиков — инженеров по машинному обучению и исследователей данных, — желающих расширить свой инструментарий за пределы NLP. Каждая тема подкреплена объяснением ключевых концепций, обзором state-of-the-art моделей и рекомендациями по тонкой настройке для конкретных задач. Книга служит мостом между теоретическими основами трансформеров и их революционными приложениями в современных AI-системах.

Transformers: The Definitive Guide. Applications Beyond NLP

Похожие книги

Transformers in Action

Hands-On Generative AI with Transformers and Diffusion Models

Generative AI on Kubernetes: Operationalizing Large Language Models

AI and ML for Coders in PyTorch: A Coder’s Guide to Generative AI and Machine Learning

Building Generative AI Services with FastAPI: A Practical Approach to Developing Context-Rich Generative AI Applications

TensorFlow for Deep Learning: From Linear Regression to Reinforcement Learning

Building and Training Generative AI Models: A Practical Guide to Generative AI Development and Scaling

Prompt Engineering for Generative AI: Future-Proof Inputs for Reliable AI Outputs at Scale

Generative Artificial Intelligence: Exploring the Power and Potential of Generative AI

Learn Generative AI with PyTorch