Data Clustering with Python: From Theory to Implementation

Книга «Data Clustering with Python: From Theory to Implementation» представляет собой практическое руководство по реализации алгоритмов кластеризации данных с использованием языка Python. Автор, Гоцзюнь Ган, доцент кафедры математики Университета Коннектикута, переработал свою предыдущую работу на C++, адаптировав её для современного Python — самого популярного языка программирования для научных вычислений и анализа данных.

Издание разделено на две основные части. Первая часть знакомит читателей с основами Python и ключевыми библиотеками для работы с данными: NumPy, Pandas и Matplotlib. Это позволяет новичкам быстро освоить необходимый инструментарий. Вторая часть посвящена непосредственно алгоритмам кластеризации, включая иерархические и разделительные методы. Каждая глава содержит теоретическое объяснение, пошаговую реализацию алгоритма на Python и практические примеры применения к реальным наборам данных.

Особенностью книги является её процедурный стиль программирования, который позволяет компактно и наглядно реализовывать сложные алгоритмы. Автор также проводит сравнения с реализациями в библиотеке scikit-learn, что помогает читателям понять преимущества и ограничения разных подходов. Книга не требует предварительного опыта работы с Python, что делает её доступной для широкого круга специалистов: от студентов до практикующих аналитиков и исследователей.

Все примеры кода доступны на GitHub, что позволяет сразу применять полученные знания на практике. Издание входит в серию «Chapman & Hall/CRC The Python Series» и ориентировано на применение в областях Data Science, машинного обучения и искусственного интеллекта.

Data Clustering with Python: From Theory to Implementation
A
Автор
Guojun Gan
Издательство
CRC Press (Chapman & Hall/CRC The Python Series)
Год
2026
Язык
Английский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент