Правила и лучшие практики машинного обучения

Что нужно, чтобы изучить горячую область технологий: правила и передовой опыт машинного обучения.

Прежде чем перейти к обсуждению того, насколько эффективно мы можем изучать машинное обучение и реализовывать его различные и более широкие приложения для решения задач в реальном времени, нам следует ознакомиться с лучшими практиками машинного обучения. Машинное обучение - новая горячая тема в наши дни, которая пытается имитировать человеческий интеллект в машинах и преобразовать его в более эффективный и точный, чем человеческий. Методы искусственного интеллекта и машинного обучения можно применять практически во всех сферах жизни, чтобы результаты были более эффективными, точными и точными.

Терминология

Ниже приведены некоторые термины, которые будут неоднократно встречаться в этом обсуждении:

Экземпляр: объект, вокруг которого вы хотите сделать прогноз.

Ярлык: своего рода ответ, который мы помещаем в наши обучающие данные с помощью машины или человека-тренера.

Модель: статистическое представление данных.

Конвейер: инфраструктура для разработки программы машинного обучения, включая наборы данных, обученные модели и, наконец, производство.

Итак, прежде чем вы начнете погружаться в машинное обучение, вы должны помнить о следующих правилах.

Правило 1. Не бойтесь!

Вы не должны бояться пробовать и внедрять новые методы для запуска вашего конечного продукта. Машинное обучение - это круто, но для наилучшего обучения ваших моделей требуется количество точных данных. Но если вы не можете позволить себе роскошь получить такой объем данных для наилучшего обучения вашей модели, вам не следует применять машинное обучение к своему продукту. Потому что неполные и неправильные данные тоже могут стать причиной разрушения, но не стоит этого бояться.

Правило 2. Разработайте и реализуйте

Прежде чем внедрять алгоритмы машинного обучения в свою систему, вам следует проанализировать существующую систему, как она работает и насколько эффективно будет использовать и реализовывать модели машинного обучения. Потому что у каждой системы есть свои сценарии, и вам нужно посмотреть, насколько машинное обучение будет эффективным, и оптимизировать систему.

Правило 3. Выбирайте машинное обучение!

Сложную технику машинного обучения сложно поддерживать, поэтому для получения потрясающих результатов лучше всего использовать простейшую технику. Итак, если у вас есть простое представление о конкретной проблеме, вам следует внедрить машинное обучение.

Машинное обучение: этап альфа (1)

Глубоко проанализируйте и сконцентрируйте свои системные сценарии, вокруг которых вы собираетесь разрабатывать машинное обучение, и доверяйте своей первой модели то, что вы строите.

Правило 1 Этапа 1: (Правило 4 :) Простота:

Сделайте вашу первую модель максимально простой и легкой. Если простой подход может решить задачу лучше, чем откладывать сложные модели, пока у вас не будет достаточно точного количества данных.

Правило 2 этапа 1: (правило 5 :) Тестирование независимо от машинного обучения:

Протестируйте каждую часть, чтобы увидеть, как ваша программа выполняет свою работу хорошо или нет?

Правило 3 Этапа 1: (Правило 6 :) Будьте осторожны:

Будьте осторожны с эвристикой, когда вы копируете существующий конвейер для нового проекта, будьте осторожны, чтобы не выбросить полезные и потенциальные данные для ваших моделей!

Правило 4 этапа 1: (правило 7 :) Превращение эвристики в функции:

Не забрасывайте эвристики полностью, пытаясь превратить их в полезные функции для вашей модели машинного обучения, потому что они могут генерировать некоторые функции для вашей модели.

Мониторинг

Правило 5 Этапа 1: (Правило 8 :) Свежесть:

Убедитесь, что ваша модель не устаревает со временем, время от времени проверяйте данные и поддерживайте их в актуальном состоянии для получения наилучших результатов.

Правило 6 Этапа 1: (Правило 9 :) Обнаружение проблем:

Прежде чем доработать и экспортировать модели, тщательно проверьте, нет ли проблем.

Правило 7 Этапа 1: (Правило 10 :) Заключительное тестирование:

Заключительное тестирование, чтобы убедиться, что все функции собраны, и ваши обученные данные в порядке.

Правило 8 Этапа 1: (Правило 11 :) Документация:

Документирование функций, их плюсов и минусов полезно для хорошего понимания модели.

Машинное обучение: стадия бета (2): разработка функций

Правило 1 этапа 2: (правило 12 :) Запланируйте запуск и повторите:

Обученные данные и ваша модель со временем будут развиваться. Поэтому обязательно обновите его новыми функциями и данными.

Правило 2 этапа 2: (правило 13 :) Начните с непосредственно наблюдаемых характеристик:

Уже изучены функции для будущих обновлений.

Правило 3 этапа 2: (правило 14 :) Исследуйте с функциями:

Изучите с помощью функций, то есть количество полученных лайков может быть полезно в будущих рекомендациях, рейтинге качества или в других связанных моделях.

Правило 4 этапа 2: (правило 15 :) Используйте очень специфические функции:

Используйте функции, даже если они кажутся бесполезными, но могут помочь в решении более мелких проблем.

Правило 5 этапа 2: (правило 16 :) Объединение и изменение существующих функций:

Добавьте функции из существующего и постарайтесь не усложнять его понимание.

Правило 6 этапа 2: (правило 17 :) Количество весов характеристик, которые вы можете изучить в линейной модели, примерно пропорционально количеству имеющихся у вас данных:

Правило 7 этапа 2: (Правило 18 :) Удалите ненужные функции:

Если некоторые функции никоим образом не улучшают вашу модель, избавьтесь от них.

Правило 8 этапа 2: (правило 19 :) конечный пользователь.

Получите обратную связь от конечного пользователя через массовый источник или напрямую сообщите об этом пользователям.

Правило 9 этапа 2: (правило 20 :) Измерьте разницу между моделями

Отслеживайте свои модели, прежде чем добавлять новую, проверьте, насколько выходные данные отличаются от предыдущей.

Правило 10 этапа 2: (правило 21 :) При выборе моделей утилитарная производительность важнее предсказательной силы.

Полезность модели важнее ее точности.

Правило 11 этапа 2: (правило 22 :) Ищите закономерности в измеренных ошибках и создавайте новые функции.

Найдите закономерности в выявленных ошибках и добавьте соответствующие функции.

Правило 12 этапа 2: (правило 23 :) Попытайтесь количественно оценить наблюдаемое нежелательное поведение.

Правило 13 этапа 2: (правило 24 :) Имейте в виду, что идентичное краткосрочное поведение не подразумевает идентичного долгосрочного поведения.

Обучение

Правило 14 этапа 2: (правило 25 :) Лучший способ убедиться, что вы тренируетесь так, как вы обслуживаете, - это сохранить набор функций, используемых во время обслуживания, а затем передать эти функции в журнал, чтобы использовать их в время тренировки.

Соберите свежие данные и используйте их для тестирования во время тестирования, и таким образом вы также узнаете, будет ли это работать или нет.

Правило 15 этапа 2: (правило 26 :) Выборочные данные с учетом важности, не отбрасывайте их произвольно!

Правило 16 этапа 2: (правило 27 :) Сами данные могут измениться между обучением и показом.

Не забывайте, что данные могут изменяться сами по себе, однако вы можете справиться с этим, сделав снимки данных, но, похоже, это не решает проблему.

Правило 17 этапа 2: (правило 28 :) Повторно используйте код между конвейером обучения и конвейером обслуживания

Как можно чаще делитесь кодом между учебной и производственной моделями.

Правило 18 этапа 2: (правило 29 :) Используйте более ранние данные для обучения, а более поздние - для тестирования.

Это поможет вам определить, как ваша модель будет работать в будущем.

Правило 19 этапа 2: (правило 30 :) Бинарная классификация

Удерживайте небольшой процент данных в двоичных задачах, чтобы получить четкие обученные данные, и показывайте пользователю только наименьший процент для получения новых свежих данных.

Правило 20 этапа 2: (правило 31 :) Упорядочьте общие черты

Правило 21 этапа 2: (правило 32 :) Избегайте петель обратной связи

Избегайте петель обратной связи, разделяйте их во время обучения и избегайте их во время развертывания.

Правило 22 этапа 2: (правило 33 :) Оцените эффективность своей модели

Измерьте, как ваша модель работает на всех этапах, и отметьте, как они отличаются своими результатами.

Машинное обучение: ступенчатая гамма (3): рост, оптимизация и сложные модели

Правило 1 этапа 3: (правило 34 :) Не тратьте время на новые функции, если не согласованные цели стали проблемой.

Убедитесь, что ваши модели машинного обучения соответствуют основным целям вашего продукта.

Правило 2 этапа 3: (правило 35 :) Решения о запуске являются прокси для долгосрочных целей продукта.

Не спешите с решениями, потому что это может повлиять на несколько матриц.

Правило 3 этапа 3: (правило 36 :) Сохраняйте ансамбли простыми.

Чтобы не усложнять задачу, каждая модель должна быть либо ансамблем, принимающим только входные данные от других моделей, либо базовой моделью, имеющей множество функций, но не то и другое вместе.

Правило 4 этапа 3: (правило 37 :) Когда производительность выходит на плато, ищите качественно новые источники информации для добавления

Если производительность вашей модели не соответствует ожидаемой, ждите добавления новых функций.

Правило 5 этапа 3: (правило 38 :) Не ожидайте, что разнообразие, персонализация или актуальность будут так же коррелированы с популярностью, как вы думаете.

Правило 6 этапа 3: (правило 39 :) Ваши друзья, как правило, одинаковы в разных продуктах. Ваши интересы, как правило, не совпадают.

Мы придерживаемся одного и того же подхода при построении моделей, но наши цели должны быть разными.

Конец примечания!

Эти рекомендации исследователей Google могут быть полезны при выполнении задач машинного обучения, поэтому рекомендуется добавить эту статью в закладки, чтобы ее можно было пересматривать при необходимости, чтобы лучше понять свои модели машинного обучения.

Если вам понравился этот пост, поставьте ему ❤️ ниже, чтобы его могли увидеть другие. Спасибо!

Хотите копать еще?

Вы можете посмотреть курс для начинающих по машинному обучению, который предоставит вам базовые и вводные знания в этой области, что такое машинное обучение и многое другое!

Машинное обучение: стратегия обучения и понимания

Часть 1. Введение (Почему машинное обучение так важно.)

Часть 2: контролируемое обучение

Часть 3. Обучение без учителя

Часть 4: нейронные сети и глубокое обучение.

Часть 5: Обучение с подкреплением

Приложение: Лучшие ресурсы по машинному обучению