Строим LLM с нуля

Себастьян Рашка

Эта книга предлагает уникальный практический подход к пониманию больших языковых моделей (LLM). Вместо использования готовых библиотек, автор шаг за шагом проводит читателя через процесс создания LLM в стиле GPT с нуля, которую можно запустить на обычном ноутбуке. Основываясь на принципе Ричарда Фейнмана «Я не понимаю того, чего не могу создать», книга делает сложные концепции генеративного ИИ доступными и понятными.

Вы начнете с основ работы с текстовыми данными и механизмами внимания, затем перейдете к созданию GPT-подобной модели для генерации текста. Книга охватывает полный цикл разработки: от планирования и кодирования до обучения и тонкой настройки модели. Каждая глава построена как практическое руководство с четкими объяснениями и примерами кода.

Особую ценность представляют разделы о предварительном обучении на неразмеченных данных, тонкой настройке для классификации текста и создании чат-бота, способного следовать инструкциям в диалоге. Приложения книги включают введение в PyTorch, решения упражнений и дополнительные материалы по эффективной настройке параметров с помощью LoRA.

Идеально подходит для разработчиков, исследователей и энтузиастов ИИ, которые хотят не просто использовать LLM, а глубоко понять их внутреннее устройство. Книга превращает абстрактные концепции машинного обучения в конкретные реализации, давая читателям уверенность в работе с современными технологиями генеративного ИИ.

Похожие книги

Знакомство с PyTorch: глубокое обучение при обработке естественного языка

Делип Рао, Брайан Макмахан

Обработка естественного языка в действии. Понимание, анализ и генерация текста с помощью Python

Лейн Хобсон, Коул Ховард, Ханнес Макс Хапке

Обработка естественного языка в действии. 2-е издание

Хобсон Лейн, Мария Дышель

Машинное обучение с PyTorch и Scikit-Learn

Себастьян Рашка, Юси (Хэйден) Лю, Вахид Мирджалили

Алгоритмы и структуры данных на Python

Cuantum Technologies

Сверхбыстрый Python. Эффективные техники для работы с большими наборами данных

Тиаго Антао

Глубокое обучение: легкая разработка проектов на Python

Сет Вейдман

Разработка с ИИ: как эффективно использовать ChatGPT и Copilot

Нэйтан Б. Крокер

GPT-3: программирование на Python в примерах

Aймен Эль Амри

Машинное обучение с использованием Python. Сборник рецептов: Практические решения от предобработки до глубокого обучения

Кайл Галлатин, Крис Элбон