Building Generative AI Services with FastAPI: A Practical Approach to Developing Context-Rich Generative AI Applications

Практическое руководство по созданию промышленных генеративных AI-сервисов с использованием фреймворка FastAPI. Книга охватывает полный цикл разработки — от проектирования до развертывания в облаке.

Вы научитесь интегрировать модели, обрабатывающие текст, изображения, аудио и видео, а также настраивать взаимодействие с базами данных, файловыми системами, веб-сайтами и API. Особое внимание уделяется построению контекстно-обогащенных приложений с использованием RAG (Retrieval-Augmented Generation) и векторных баз данных.

Автор подробно рассматривает ключевые аспекты production-разработки: аутентификацию, управление параллелизмом, кэширование, потоковую передачу данных через WebSockets и Server-Sent Events. Также приводятся лучшие практики тестирования AI-выводов, оптимизации производительности и обеспечения безопасности микросервисов.

Заключительные главы посвящены контейнеризации приложений с помощью Docker и их развертыванию в облачной среде. Книга подойдет веб-разработчикам, дата-сайентистам и DevOps-инженерам, желающим создавать масштабируемые AI-приложения реального времени.

Building Generative AI Services with FastAPI: A Practical Approach to Developing Context-Rich Generative AI Applications
A
Автор
Alireza Parandeh
Издательство
O’Reilly Media, Inc.
Год
2025
Язык
Английский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент