Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка
Эта книга представляет собой практическое руководство по применению методов машинного обучения для анализа текстовых данных с использованием Python. Авторы фокусируются на создании реальных приложений обработки естественного языка (NLP), которые могут быть интегрированы в программные продукты.
Книга начинается с основ работы с естественными языками в вычислительной среде, создания собственных корпусов текстов и их предварительной обработки. Далее рассматриваются конвейеры векторизации и преобразования текстовых данных, методы классификации и кластеризации для выявления сходств в тексте.
Особое внимание уделяется контекстно-зависимому анализу текста, визуализации результатов и графовым методам анализа. Практические главы посвящены созданию чат-ботов, масштабированию анализа текста для больших объемов данных и применению глубокого обучения в NLP-задачах.
Издание подходит для разработчиков, аналитиков данных и исследователей, которые хотят научиться создавать языково-осознанные продукты с использованием современных методов машинного обучения.









