Потоковая обработка данных с Apache Flink. Основы разработки потоковых приложений
Эта книга представляет собой фундаментальное руководство по Apache Flink — мощному фреймворку с открытым исходным кодом для распределённой потоковой обработки данных. Авторы, являющиеся ключевыми контрибьюторами проекта с первых дней его существования, предлагают глубокое погружение в архитектуру и принципы работы системы.
Вы изучите основные концепции параллельной потоковой обработки, поймёте её отличия от традиционной пакетной обработки и освоите идеологию API DataStream. Книга подробно рассматривает такие важные аспекты, как обработка с учётом состояния, механизмы отказоустойчивости, временные семантики (режим обработки по времени событий) и гарантии согласованности «ровно один раз» при взаимодействии с внешними системами.
Практическая часть охватывает полный цикл разработки: от создания масштабируемых потоковых приложений до их развёртывания, настройки кластеров и операционного обслуживания в production-средах. Особое внимание уделяется решению реальных задач, таких как аналитика в реальном времени, обнаружение мошенничества, обработка данных IoT и построение дашбордов с малой задержкой.









