Build a Text-to-Image Generator (from Scratch) With transformers and diffusions

Mark Liu

Эта книга представляет собой практическое руководство по созданию генератора текст-в-изображение с нуля, используя современные архитектуры трансформеров и диффузионных моделей. Автор подробно объясняет, как работают модели, подобные Stable Diffusion и DALL-E, и проводит читателя через процесс их реализации.

Книга разделена на пять частей. В первой части рассматриваются основы внимания и трансформеров, включая построение собственного трансформера и применение Vision Transformer для классификации изображений. Вторая часть посвящена диффузионным моделям, их обучению и контролю над генерацией изображений. Третья часть фокусируется на генерации текст-в-изображение с использованием латентной диффузии и глубокому анализу Stable Diffusion.

Четвертая часть исследует альтернативные подходы на основе трансформеров, такие как VQGAN и минимальная реализация DALL-E. В заключительной части обсуждаются новые разработки и вызовы в области генерации изображений по текстовым описаниям. Книга содержит множество практических примеров и кода, что делает её ценным ресурсом для разработчиков и исследователей в области искусственного интеллекта.

Похожие книги

Learn Generative AI with PyTorch

Mark Liu

Hands-On Generative AI with Transformers and Diffusion Models

Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker

Transformers: The Definitive Guide. Applications Beyond NLP

Nicole Koenigstein

Generative Artificial Intelligence: Exploring the Power and Potential of Generative AI

Shivam R Solanki, Drupad K Khublani

Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems

Aurélien Géron

AI and ML for Coders in PyTorch: A Coder’s Guide to Generative AI and Machine Learning

Laurence Moroney

Building and Training Generative AI Models: A Practical Guide to Generative AI Development and Scaling

Irena Cronin

TypeScript Basics: Learn TypeScript from Scratch and Solidify Your Skills with Projects

Nabendu Biswas

Hugging Face in Action

Wei-Meng Lee

Building Generative AI Applications with Opensource Libraries: Practical guide to implementing large language models

Srikannan Balakrishnan