Kafka Streams и ksqlDB: данные в реальном времени
Эта книга представляет собой практическое руководство по созданию масштабируемых приложений потоковой обработки данных с использованием двух ключевых технологий экосистемы Apache Kafka: библиотеки Kafka Streams и сервера потоковой обработки ksqlDB. Автор, инженер службы обработки данных в Mailchimp, подробно объясняет концепции потоковой обработки на реальных бизнес-задачах.
В первой части книги дается краткое введение в Apache Kafka, необходимое для понимания основ работы с потоками данных. Вторая часть посвящена библиотеке Kafka Streams, где рассматриваются обработка без сохранения состояния и с сохранением состояния, работа с окнами и временем, расширенное управление состоянием, а также низкоуровневый Processor API.
Третья часть книги полностью посвящена ksqlDB — SQL-движку для потоковой обработки данных поверх Kafka. Здесь рассматриваются интеграция данных, основы и продвинутые техники потоковой обработки с использованием SQL-подобного синтаксиса, что особенно ценно для разработчиков, не пишущих на Java.
Заключительная часть книги охватывает вопросы промышленной эксплуатации: тестирование, мониторинг и развертывание приложений потоковой обработки. Книга содержит практические примеры и рекомендации по выбору между Kafka Streams и ksqlDB для различных проектов.









