Нечеткое сопоставление данных в SQL. Качество данных и эффективность запросов

Эта книга посвящена практическим методам работы с данными с использованием SQL. Автор, Джим Лемер, предлагает комплексный подход к импорту, очистке, сопоставлению, оценке и анализу разнородных данных исключительно средствами SQL. Основное внимание уделяется повышению качества данных и оптимизации производительности запросов.

В книге подробно рассматриваются техники нечеткого сопоставления данных, которые позволяют находить сходства и различия между различными выражениями одних и тех же данных. Это критически важно для выявления и удаления дубликатов, разбора строк, извлечения данных из структур XML и JSON, а также подготовки наборов данных для анализа.

Издание содержит множество реальных примеров и рабочий код, что делает его ценным ресурсом для администраторов баз данных, программистов, бизнес-аналитиков и специалистов по исследованию данных. Книга также затрагивает подходы к качеству данных и процессам ETL (Extract, Transform, Load), помогая читателям осмысленно работать с разнообразными источниками информации.

Нечеткое сопоставление данных в SQL. Качество данных и эффективность запросов
B
Автор
Джим Лемер
Издательство
Спринт Бук
Год
2024
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент