Строим LLM с нуля
Эта книга предлагает уникальный практический подход к пониманию больших языковых моделей (LLM). Вместо использования готовых библиотек, автор шаг за шагом проводит читателя через процесс создания LLM в стиле GPT с нуля, которую можно запустить на обычном ноутбуке. Основываясь на принципе Ричарда Фейнмана «Я не понимаю того, чего не могу создать», книга делает сложные концепции генеративного ИИ доступными и понятными.
Вы начнете с основ работы с текстовыми данными и механизмами внимания, затем перейдете к созданию GPT-подобной модели для генерации текста. Книга охватывает полный цикл разработки: от планирования и кодирования до обучения и тонкой настройки модели. Каждая глава построена как практическое руководство с четкими объяснениями и примерами кода.
Особую ценность представляют разделы о предварительном обучении на неразмеченных данных, тонкой настройке для классификации текста и создании чат-бота, способного следовать инструкциям в диалоге. Приложения книги включают введение в PyTorch, решения упражнений и дополнительные материалы по эффективной настройке параметров с помощью LoRA.
Идеально подходит для разработчиков, исследователей и энтузиастов ИИ, которые хотят не просто использовать LLM, а глубоко понять их внутреннее устройство. Книга превращает абстрактные концепции машинного обучения в конкретные реализации, давая читателям уверенность в работе с современными технологиями генеративного ИИ.









