Active Machine Learning with Python: Refine and elevate data quality over quantity with active learning
Эта книга представляет собой практическое руководство по применению активного машинного обучения (Active Machine Learning) на языке Python. Активное обучение — это подход, при котором модель сама выбирает наиболее информативные данные для разметки, что позволяет значительно повысить качество моделей при меньшем объёме размеченных данных.
В первой части книги рассматриваются фундаментальные концепции активного обучения: сравниваются активный и пассивный подходы, описываются ключевые компоненты систем активного обучения и исследуются различные стратегии запросов (query strategies). Подробно разбираются методы выборки по неопределённости (uncertainty sampling), подходы «запрос по комитету» (query-by-committee) и методы, учитывающие плотность данных (density-weighted sampling).
Особое внимание уделяется роли человека в процессе обучения (Human-in-the-Loop). Автор рассматривает проектирование интерактивных систем, инструменты для разметки данных, управление конфликтами между моделью и разметчиками, а также методы обеспечения качества аннотаций и балансировки наборов данных.
Вторая часть книги посвящена практическому применению активного обучения в различных областях, начиная с компьютерного зрения. На примере классификации изображений с использованием набора данных CIFAR и свёрточных нейронных сетей (CNN) демонстрируется, как реализовать стратегии активного обучения для улучшения качества моделей.









