Алгоритмы и структуры для массивных наборов данных
Эта книга посвящена алгоритмам и структурам данных, специально разработанным для обработки массивных (больших) распределённых наборов данных. Стандартные алгоритмы часто неэффективны или неприменимы в таких условиях, и авторы предлагают практические решения для реальных задач.
Вы изучите продвинутые структуры данных и алгоритмы, такие как фильтры Блума, набросок count-min, HyperLogLog и LSM-деревья. Каждая концепция объясняется на примерах из индустрии, что помогает понять их применение в распределённых системах хранения и обработки данных.
Книга также рассматривает аппаратные аспекты, влияющие на производительность: иерархию памяти, разрыв между процессором и памятью, задержки и пропускную способность. Это позволяет конструировать алгоритмы с учётом современных вычислительных сред, включая распределённые системы.
Издание подходит для разработчиков, инженеров данных и архитекторов, которые работают с большими объёмами информации и хотят оптимизировать обработку, снизить затраты и повысить точность анализа.









