Почему онлайн-обучение?

Прежде чем я углублюсь в онлайн-обучение, я хочу поговорить о данных.

D-A-T-A - это четырехбуквенное слово за последние годы стало движущей силой во многих отраслях и, по сути, во всем мире. Производство данных выросло в геометрической прогрессии.

Согласно IDC (Международная корпорация данных в опубликованном ими техническом документе), ожидается, что к 2025 году глобальная сфера данных составит 175ZB.

ЭТО HUUUUUUGGGEEEEEE !!!!!

В документе также упоминается, что 30% глобальной сферы данных будет работать в режиме реального времени. Учитывая ограниченные возможности хранения, нам будет сложно анализировать все данные на лету.

С доступными традиционными методами пакетного обучения, в которых хранятся четко определенные обучающие данные и моделируемого обучения на их основе будет недостаточно. Переобучение модели требует больших объемов памяти и вычислительной мощности. Более того, функции и метки статичны, так как мы не можем изменять их в этом процессе.

Итак, представляем вам парадигму онлайн-обучения, которая может принимать поток данных и изучать одно наблюдение за раз. Это также гибко для любой функции, изменения ярлыка в будущем. Любое изменение вероятностного распределения данных может быть устранено. Онлайн-алгоритмы также очень подходят для обучения, выходящего за рамки стадии производства, что позволяет устройствам адаптироваться к индивидуальным привычкам и среде клиентов [1].

Чем отличается онлайн-обучение?

Первоначально предполагаемая модель (любая базовая модель) требует наблюдения и обеспечивает его прогноз. Затем становится известна фактическая метка и вычисляются потери. Эта потеря помогает обновлять модель и извлекать уроки из нее. Это просто, чем кажется правильным ...

Что ж, для первоначального прогноза можно использовать несколько подходов. Упомянутые ниже подходы очень похожи на методы повышения, при которых слабые ученики последовательно обучаются для улучшения прогнозов.

Подходы:

(а) Обучение на основе рекомендаций экспертов с использованием алгоритма рандомизированного взвешенного большинства - это можно очень хорошо объяснить на простом примере из реальной жизни. Допустим, я хочу инвестировать в акции и, очевидно, хочу получить максимальную прибыль. Поскольку я новичок в этом, я бы предпочел прислушаться к мнению некоторых экспертов при выборе правильного портфолио.

Шаг 1: Инициализировать веса w1,. . . , wn всех экспертов к 1.

Шаг 2: Учитывая набор прогнозов {x1,. . . , xn}, вывести xi с вероятностью wi / W, где W = P i wi.

Шаг 3: Когда получен правильный ответ, оштрафуйте каждого ошибочного эксперта, умножив его вес на β. Переходите к шагу 2.

(б) Обучение на примерах с использованием алгоритма Винноу - вместо того, чтобы искать определенное количество экспертов, мы можем учиться на различных примерах.

Шаг 1: Инициализировать веса w1,. . . , wn переменных равными 1.

Шаг 2: Рассмотрим пример x = {x1,. . . , xn}, выведите 1, если w1x1 + w2x2 +. . . + wnxn ≥ n и вывести 0 в противном случае.

Шаг 3: Если алгоритм ошибается:

  1. Если алгоритм предсказывает отрицательный результат на положительном примере, то для каждого xi, равного 1, удвойте значение wi.
  2. Если алгоритм предсказывает положительный результат на отрицательном примере, то для каждого xi, равного 1, сократите значение wi вдвое. Переходите к шагу 2.

Другие методы оптимизации, такие как самый известный стохастический градиентный спуск, также могут быть использованы для обучения со временем.

Преимущества:

(i) Модель не нужно обучать с нуля.

(ii) Нет увеличения требований к памяти

(iii) Модель адаптируется к Concept Drift и масштабируется.

(iv) Как уже говорилось, он гибок для модификаций функций и меток.

(v) Мультимодальное и многозадачное обучение

Обладая всеми этими преимуществами, этот метод онлайн-обучения / инкрементального обучения можно использовать во многих сценариях.

Примеры использования:

(i) Прогнозирование временных рядов: при высокочастотной торговле акциями обычно используется онлайн-обучение, поскольку трейдинг не может ждать традиционно запланированного переобучения.

(ii) Фильтрация спама. По мере того, как спамеры переходят от простой «лотереи WIN» к серьезному мошенничеству с работой и фармацевтическими препаратами, нам нужна модель, которая со временем будет развиваться и ограничивать этот спам.

(iii) Рекомендательные системы: это одно из самых эффективных приложений для онлайн-обучения. Поскольку предпочтения пользователя меняются со временем, модель всегда готова предоставить индивидуальные рекомендации.

(iv) Размещение рекламы: для любого запроса нам нужны самые актуальные и свежие объявления. В этом случае модели учатся на основе CTR (Click Through Rate), чтобы обеспечить наилучший результат. Приятно знать, что Google использует похожую технологию.

(v) Интернет вещей: мы не хотим, чтобы все данные датчиков сохранялись и затем обрабатывались для получения выходных данных, вместо этого нам нужны мгновенные ответы на основе данных датчиков, и именно здесь мы используем онлайн-обучение.

Ограничения

Как мы все знаем, у каждой медали есть две стороны, у онлайн-обучения также есть некоторые ограничения.

- ›Дилемма стабильности-пластичности:

Стабильность - это способность запоминать предыдущие знания, а пластичность - это гибкость для изучения новых концепций. Трудно найти правильный баланс между стабильностью и пластичностью. Мы можем отслеживать изменение модели с помощью PSI (Индекс стабильности популяции) и CSI (Индекс стабильности характеристик), чтобы определить правильный баланс.

- ›Катастрофическое забвение:

Это явление похоже на нашу модель онлайн-обучения при болезни Альцгеймера. Модель имеет тенденцию забывать ранее изученную информацию при изучении новой информации. Это можно преодолеть, сохранив некоторые старые данные и произвольно обучив модель с предыдущими данными. Исправление происходит за счет памяти.

- ›Недоступность помеченных данных:

Модель онлайн-обучения изначально делает прогноз после прохождения наблюдения, но она может учиться только после того, как станет доступна истинная метка. Модель ожидает истинного ярлыка в этом временном интервале, что делает ее «обучение в псевдореальном времени».

- ›Несколько библиотек:

В связи с ростом исследований в области онлайн / инкрементального обучения в настоящее время доступно лишь несколько библиотек.

Одна из таких библиотек, которая упрощает инкрементное обучение, - Creme. Я должен поблагодарить Макса Хэлфорда и команду за их вклад.

Наконец, я хочу завершить это, используя заявление, сделанное IDC в ​​их публикации.

Мир, управляемый данными, всегда будет включен, всегда будет отслеживание, всегда мониторинг, всегда прослушивание и всегда наблюдающий - потому что он всегда будет учиться.

Я хотел бы поблагодарить всех участников и авторов за многочисленные статьи и блоги, на которые я ссылался, чтобы понять эти концепции. Пожалуйста, оставьте отзыв и помогите мне улучшить контент.

Ссылки:

Https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf



Https://cs.gmu.edu/~lifei/teaching/cs695_fall10/zhi_learning.pdf