Scaling Python with Dask: From Data Science to Machine Learning

Книга «Scaling Python with Dask» представляет собой практическое руководство по использованию библиотеки Dask для параллельных вычислений в Python. Dask — это мощный инструмент с открытым исходным кодом, который позволяет эффективно распараллеливать задачи, используя возможности современных многоядерных процессоров и GPU, и масштабироваться до облачных сред для обработки больших объёмов данных.

Авторы, опытные инженеры данных Holden Karau и Mika Kimmins, подробно объясняют, как Dask интегрируется с популярными библиотеками экосистемы PyData, такими как NumPy, pandas и scikit-learn, предоставляя знакомые API для параллельной обработки. Книга охватывает ключевые концепции распределённых систем, необходимые для работы с Dask, и демонстрирует методы пакетной параллельной обработки данных.

Читатели узнают, как использовать Dask для решения задач Data Science и машинного обучения, работать с высокоуровневыми API и базовыми строительными блоками библиотеки, а также как задействовать GPU для ускорения вычислений. Издание основано на реальном опыте использования Dask в таких организациях, как Walmart, Capital One и NASA.

Книга предназначена для data scientists, инженеров данных и Python-разработчиков, которые сталкиваются с необходимостью обработки больших данных и хотят эффективно использовать вычислительные ресурсы без переписывания кода под другие фреймворки.

Scaling Python with Dask: From Data Science to Machine Learning
A
Автор
Holden Karau, Mika Kimmins
Издательство
O’Reilly Media, Inc.
Год
2023
Язык
Английский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент