Машинное обучение — это область исследования, которая дает компьютеру возможность учиться без явного программирования (Артур Самуэль, 1959). В нашей повседневной жизни мы очень часто сталкиваемся с машинным обучением. Алгоритмы машинного обучения существуют уже давно, но недавний рост быстрых компьютерных вычислений и доступных хранилищ превратил их в реальность. Несколько примеров, как показано ниже
- Онлайн-рекомендация от Netflix и Amazon на основе нашей истории с этими веб-сайтами.
- Система обнаружения мошенничества в банке и т.д.
Чем машинное обучение отличается от классического программирования
В классическом программировании вы вводите правила (программу) и данные, которые будут обрабатываться на основе введенного правила. Вы получаете ответы на выходе. В машинном обучении вы вводите данные, а также ответы и получаете правила в качестве результата. Затем эти правила можно применять к новым данным для прогнозирования или классификации. Вместо явного программирования вы обучаете систему машинному обучению.
Типы машинного обучения
Контролируемое обучение
В контролируемом обучении вы обучаете машину, используя хорошо "маркированные данные.
Машинное обучение с учителем включает в себя два основных процесса: классификацию и регрессию.
- Классификация — это процесс, при котором входящие данные маркируются на основе прошлых выборок данных и вручную обучают алгоритм распознаванию определенных типов объектов и их соответствующей классификации. Система должна уметь различать типы информации, выполнять оптическое распознавание символов, изображений или двоичных кодов.
- Регрессия — это процесс выявления закономерностей и расчета прогнозов непрерывных результатов.
- Примерами являются линейная регрессия, логистическая регрессия, случайный лес, деревья решений, наивный байесовский метод, ближайший сосед.
Обучение без учителя
В отличие от обучения с учителем, оно работает с неразмеченными данными, которые алгоритм пытается понять, самостоятельно извлекая признаки и закономерности.
Алгоритмы обучения без учителя используют следующие методы для описания данных:
- Кластеризация: это исследование данных, используемое для сегментации их на кластеры на основе их внутренних шаблонов без предварительного знания учетных данных группы. Учетные данные определяются сходством отдельных объектов данных, а также аспектами их отличия от остальных (что также можно использовать для обнаружения аномалий).
- Снижение размерности: в поступающих данных много шума. Алгоритмы машинного обучения используют уменьшение размерности, чтобы удалить этот шум при извлечении соответствующей информации.
- Примерами неконтролируемых алгоритмов являются кластеризация k-средних, t-SNE (встраивание t-распределенных стохастических соседей), PCA (анализ основных компонентов).
Обучение с подкреплением
В усиленном машинном обучении используется метод, называемый исследованием/эксплуатацией. Механика проста — действие происходит, последствия наблюдаются, а следующее действие учитывает результаты первого действия.
Два основных типа сигналов вознаграждения:
- Положительный сигнал вознаграждения побуждает продолжать выполнение определенной последовательности действий.
- Сигнал отрицательного вознаграждения наказывает за определенные действия и призывает исправить алгоритм, чтобы прекратить получение штрафов.
Наиболее распространенные алгоритмы обучения с подкреплением включают в себя: Q-Learning, Temporal Difference (TD), поиск по дереву Монте-Карло (MCTS).
Применения машинного обучения
Финансовая служба
Машинное обучение — быстрорастущая тенденция в финансовой индустрии. Он использовался для двух основных целей: обнаружения мошенничества и получения значимого понимания данных для выявления инвестиционных возможностей.
Рекомендации по продуктам
Машинное обучение широко используется различными компаниями электронной коммерции и развлечений, такими как Amazon, Netflix и т. д., для рекомендации продукта пользователю. Всякий раз, когда мы ищем продукт на Amazon, мы начинаем получать рекламу одного и того же продукта во время интернет-серфинга в том же браузере, и это связано с машинным обучением.
Google понимает интерес пользователя с помощью различных алгоритмов машинного обучения и предлагает продукт в соответствии с интересами заказчика.
Автономные автомобили
Одно из самых захватывающих применений машинного обучения — беспилотные автомобили. Машинное обучение играет важную роль в беспилотных автомобилях. Tesla, самая популярная компания по производству автомобилей, работает над беспилотным автомобилем. Он использует метод неконтролируемого обучения для обучения моделей автомобилей обнаружению людей и объектов во время вождения.
Фильтрация спама и вредоносных программ в электронной почте
Всякий раз, когда мы получаем новое электронное письмо, оно автоматически фильтруется как важное, обычное и спам. Мы всегда получаем важное письмо в наш почтовый ящик с важным символом и спамом в нашем ящике для спама, и технология, стоящая за этим, — машинное обучение. Ниже приведены некоторые спам-фильтры, используемые Gmail:
- Фильтр контента
- Фильтр заголовков
- Общий фильтр черных списков
- Фильтры на основе правил
- Фильтры разрешений
Здравоохранение
В медицине машинное обучение используется для диагностики заболеваний. При этом медицинские технологии развиваются очень быстро и способны создавать 3D-модели, которые могут предсказать точное положение поражений в мозге.
Ссылки