Концепция машинного обучения 53: XGBoosting и Adaboosting.

Повышение:

Повышение — это метод алгоритма машинного обучения, который включает объединение слабых моделей в сильную модель. Он работает путем последовательного обучения ряда моделей, при этом каждая модель пытается исправить ошибки предыдущих моделей. Таким образом, бустинг может улучшить общую точность модели, сделав ее более точной, чем любая отдельная модель в серии.

=> Повышение — это итеративный процесс, в котором каждая последующая модель обучается на модифицированной версии обучающего набора, где примерам, которые были неправильно классифицированы предыдущими моделями, присваивается более высокий вес. Идея состоит в том, чтобы сосредоточиться на примерах, которые было трудно классифицировать в предыдущих моделях, и заставить последующие модели уделять больше внимания этим примерам. Таким образом, последующие модели могут учиться на ошибках предыдущих моделей и улучшать общую производительность модели.

=› Одним из самых популярных алгоритмов повышения является AdaBoost (Adaptive Boosting), впервые представленный Йоавом Фройндом и Робертом Шапире в 1996 году. К другим популярным алгоритмам повышения относятся Gradient Boosting и XGBoost, которые являются более сложными, но и более мощными, чем AdaBoost. Эти алгоритмы работают, используя серию деревьев решений для прогнозирования, при этом каждое последующее дерево пытается исправить ошибки предыдущих деревьев.

=› Повышение — это мощный метод повышения производительности моделей машинного обучения, особенно в ситуациях, когда данные сложны и их трудно классифицировать. Однако важно отметить, что бустинг также может привести к переоснащению, если модели слишком сложны или если набор данных слишком мал.

XGBoosting и Adaboosting:

XGBoost и Adaboost — два популярных алгоритма повышения, которые используются в машинном обучении для задач классификации и регрессии. Оба алгоритма включают в себя обучение последовательности слабых учеников для итеративного улучшения производительности всей модели.

XGBBoosting:

XGBoost означает «Экстремальное повышение градиента». Это алгоритм повышения градиента, который использует деревья решений в качестве слабых учеников. Алгоритм работает путем итеративного обучения деревьев решений для исправления ошибок предыдущих деревьев с целью минимизации функции потерь.

=› Алгоритм XGBoost состоит из двух основных компонентов: компонента повышения дерева и регуляризованной целевой функции. Компонент повышения дерева отвечает за добавление новых деревьев в модель и корректировку весов существующих деревьев. Регуляризованная целевая функция используется для измерения ошибки текущей модели и штрафа за сложные модели.

Чтобы понять, как работает XGBoost, рассмотрим следующий пример:

=> Предположим, мы хотим предсказать цену дома на основе его характеристик, таких как количество спален, площадь и местоположение. Мы можем использовать XGBoost для обучения модели, которая предсказывает цену дома с учетом его характеристик.

=› Алгоритм XGBoost начинается с инициализации модели с одним деревом решений. Это дерево делает прогнозы на основе входных признаков, но может делать ошибки. Затем алгоритм вычисляет ошибку прогнозов дерева, используя функцию потерь, такую как среднеквадратическая ошибка или логарифмическая потеря.

=> Далее алгоритм обучает новое дерево решений для исправления ошибок предыдущего дерева. Новое дерево добавляется в модель, и его прогнозы объединяются с прогнозами предыдущего дерева. Алгоритм снова вычисляет ошибку комбинированной модели и повторяет процесс добавления новых деревьев и корректировки их весов, пока ошибка не будет минимизирована.

=› Ключом к успеху XGBoost является использование градиентного спуска для оптимизации функции потерь. Алгоритм использует градиент функции потерь по отношению к прогнозам модели для корректировки весов деревьев решений. Это позволяет XGBoost быстро сходиться к точной модели, избегая переобучения.

Алгоритм XGBoost математически можно представить следующим образом:

=› минимизировать i=1∑nl(yi,y ^i)+k=1∑KΩ(fk)

где «n» — количество отсчетов, «y_i» — истинная метка «i-го» отсчета, «\hat{y}_i» — предсказанная метка от «i-го» отсчета, «l» — функция потерь, «K» — количество деревьев в модели, «f_k» — «k-е» дерево решений, а «\ Omega» — член регуляризации, который наказывает сложные модели.

XGBoost имеет множество практических приложений, в том числе:

Обнаружение мошенничества
Классификация изображений
Обработка естественного языка
Системы рекомендаций

AdBoosting:

Adaboost означает «Адаптивное повышение». Это алгоритм повышения, который использует взвешенную комбинацию слабых учеников для создания сильного ученика. Алгоритм работает, присваивая более высокие веса неправильно классифицированным образцам и более низкие веса правильно классифицированным образцам.

=› Алгоритм Adaboost состоит из двух основных компонентов: компонента слабого ученика и компонента взвешивания. Компонент слабого ученика отвечает за создание последовательности слабых учеников, каждому из которых присваивается вес в зависимости от его точности. Компонент взвешивания используется для корректировки весов обучающих выборок в зависимости от точности слабых учеников.

Чтобы понять, как работает Adaboost, рассмотрим следующий пример:

=› Предположим, у нас есть набор данных о пациентах с определенными заболеваниями, и мы хотим предсказать, будет ли у пациента определенное заболевание, основываясь на его симптомах. Набор данных содержит различные характеристики, такие как возраст, пол и симптомы. Мы можем использовать Adaboost для обучения модели, которая предсказывает, будет ли у пациента болезнь или нет.

=› Алгоритм Adaboost начинается с инициализации равных весов каждой обучающей выборки. Затем он обучает слабого ученика на наборе данных и оценивает его производительность. Слабым учеником может быть любой алгоритм, выдающий бинарный вывод, такой как дерево решений, логистическая регрессия или персептрон.

=> Если слабый ученик правильно классифицирует образец, его вес уменьшается, а если он неправильно классифицирует образец, его вес увеличивается. Затем алгоритм повторно взвешивает образцы на основе их весов, при этом неправильно классифицированные образцы получают более высокий вес. Этот процесс повторяется в течение определенного количества итераций, при этом каждая итерация создает нового слабого ученика, который взвешивается в зависимости от его точности.

=> После того, как все слабые ученики были обучены и взвешены, окончательный прогноз делается путем объединения прогнозов всех слабых учеников, при этом прогноз каждого слабого ученика взвешивается по его точности.

Алгоритм Adaboost можно представить математически следующим образом:

=› минимизировать i=1∑nwiexp(−yif(xi))

где «n» — количество отсчетов, «w_i» — вес «i-го» отсчета, «y_i» — истинная метка «i-го» отсчета, «f(x_i)» — прогноз модели на «i-й» выборке, а «\ exp (-y_i f (x_i))» — это экспоненциальная функция потерь, которая наказывает неправильно классифицированные выборки.

Adaboost имеет множество практических приложений, в том числе:

Распознавание лица
Классификация текстов
Обнаружение мошенничества
Профилактическое обслуживание

Сравнение XGBoost и Adaboost:

=› И XGBoost, и Adaboost являются повышающими алгоритмами, которые могут улучшить успеваемость слабых учащихся. Однако XGBoost использует деревья решений в качестве слабых обучаемых, в то время как Adaboost может использовать любой алгоритм, выдающий двоичный вывод. XGBoost использует градиентный спуск для оптимизации функции потерь, а Adaboost использует повторное взвешивание выборок. Было показано, что XGBoost превосходит Adaboost во многих приложениях, но Adaboost проще и проще в реализации.

Таким образом, XGBoost и Adaboost — это мощные алгоритмы повышения, которые могут улучшить производительность слабых учащихся в задачах классификации и регрессии. У каждого алгоритма есть свои сильные и слабые стороны, и выбор алгоритма зависит от конкретной задачи и набора данных.