Обработка больших данных

Джейд Картер

Эта книга представляет собой всеобъемлющее руководство по технологиям больших данных (Big Data), написанное для специалистов, стремящихся эффективно применять эти технологии в реальных проектах. Автор начинает с фундаментальных основ, объясняя ключевые концепции, такие как «5 V» (Volume, Velocity, Variety, Veracity, Value), и значение больших данных для трансформации бизнеса, ускорения принятия решений и глубокого анализа поведения клиентов.

Центральное место в книге занимает детальный разбор архитектуры и экосистемы Apache Hadoop — одной из ключевых платформ для распределённой обработки больших данных. Читатель узнает, как развернуть и настроить кластер Hadoop, и научится решать с его помощью практические задачи. Особое внимание уделяется Apache Spark, который значительно ускоряет обработку данных и предлагает инструменты для работы с потоками данных, машинным обучением и графовыми вычислениями.

Книга также погружает в мир Apache Kafka — платформы для потоковой передачи данных в реальном времени, революционизирующей подходы к интеграции и обработке информации. Практические примеры и реальные кейсы помогают закрепить теорию, делая книгу ценным ресурсом как для новичков, так и для опытных специалистов, стремящихся освоить современный стек технологий для анализа и обработки больших данных.

Похожие книги

Анализ больших данных. Технологии и методы

Не указан

Просто Big Data

Жукова М. В., Деменок С. Л.

Большие данные. Зачем, что и как?

Алена Запорожан

120 практических задач

Джейд Картер

Библиотеки Python Часть 2. Практическое применение

Джейд Картер

Основы проектирования баз данных

О.Л. Голицына, Т.Л. Партыка, И.И. Попов

Java. Библиотека профессионала. Том 1. Основы

Кей С. Хорстманн

Java Programming Guide

Не указан

Как стать программистом

Борис Рузанов

Core Java. Том II. Расширенные возможности

Кей С. Хорстманн