Введение в машинное обучение для начинающих

Машинное обучение (ML) - это подмножество искусственного интеллекта (AI), которое позволяет компьютерам учиться на данных и улучшать себя без явного программирования. Хотя Машины безжалостны, они также могут учиться. Вот как ваш телефон распознает ваш отпечаток пальца, так Google Voice переводит вашу речь в текст и так Siri общается с вами.

Как мы видели, машины становятся все более и более интеллектуальными, ИИ применяется в бизнесе, здравоохранении, финансах, сельском хозяйстве и ряде других секторов. В этом посте я очень быстро расскажу вам о ML, алгоритмах ML и о типах проблем, к которым эти алгоритмы ML могут быть применены.

Том Митчелл (1998) - Хорошо поставленная задача обучения: компьютерная программа, как говорят, учится на опыте E в отношении некоторой задачи T и некоторого показателя эффективности P, если ее производительность на T, измеренная с помощью P, улучшается с опытом E.

Применим приведенное выше определение к этой проблеме:

Предположим, ваша почтовая программа отслеживает, какие электронные письма вы помечаете или не помечаете как спам, и на основе этого учится лучше фильтровать спам.

Что такое опыт E, задача T и показатель эффективности P в приведенной выше настройке?

E = Опыт наблюдения за тем, как вы помечаете электронные письма как спам или не как спам.

T = задача классификации писем как спама или не спама.

P = показатель производительности, который дает вероятность того, что программа правильно пометит электронные письма как спам или не как спам.

Как правило, проблемы машинного обучения могут быть решены с помощью следующих алгоритмов машинного обучения:
- контролируемое обучение
- неконтролируемое обучение

Другие типы алгоритмов машинного обучения:
- Обучение с подкреплением
- Рекомендательные системы
- Нейронные сети
- Поддерживающие векторные машины

Обучение с учителем
Алгоритм обучения с учителем похож на то, как ребенок учится арифметике у учителя. Это связано с тем, что специалист по данным действует как руководство, чтобы научить алгоритм, к каким выводам он должен прийти.

Это требует, чтобы возможные результаты алгоритма были уже известны и чтобы данные, используемые для обучения алгоритма, были помечены правильными ответами.

Алгоритм контролируемого обучения обычно применяется к задачам регрессии и классификации.

Проблемы регрессии - это проблемы, которые сопоставляют входные переменные для прогнозирования непрерывного ценного результата, например, прогнозирования цен на акции, прогнозирования количества пользователей, которым понравится статья на носителе и т. Д.

Проблемы классификации - это задачи, которые отображают входные переменные в дискретные категории, например, прогнозирование рака груди, прогнозирование, содержит ли изображение кошку или нет.

Давайте проанализируем сценарий ниже:

Вы управляете компанией и хотите разработать алгоритмы обучения для решения каждой из двух проблем.

Проблема 1. У вас большой запас идентичных предметов. Вы хотите предсказать, сколько из этих товаров будет продано в течение следующих 3 месяцев.

Проблема 2: вы хотите, чтобы программа проверяла учетные записи отдельных клиентов и решала для каждой учетной записи, была ли она взломана / взломана.

Это проблема классификации или регрессии?

Проблема 1 - проблема регрессии. Это потому, что вы пытаетесь спрогнозировать большое количество элементов в течение определенного периода времени. Нет конкретного ограничения на количество товаров, которые вы можете продать в течение трех месяцев. Следовательно, эта проблема имеет непрерывный результат.

Проблема 2 - проблема классификации. Это потому, что вы только пытаетесь предсказать, были ли аккаунты взломаны или нет… ни больше, ни меньше. Следовательно, эта проблема имеет дискретный выход.

Неконтролируемое обучение
Алгоритм неконтролируемого обучения позволяет подходить к решению проблем, практически не имея представления о том, как будет выглядеть результат. Структуры могут быть получены из данных, где влияние переменных неизвестно. Эти структуры могут быть получены путем кластеризации данных на основе отношений между переменными в данных.

Алгоритм неконтролируемого обучения обычно применяется к задачам кластеризации и некластеризации.
Примерами проблем кластеризации являются сегментация рынка, анализ социальных сетей, организация вычислительных кластеров и т. д.
Примером проблем, связанных с некластеризацией, является идентификация разных говорящих в определенной голосовой заметке.

Невозможно предсказать результат работы алгоритма неконтролируемого обучения.

Алгоритм неконтролируемого обучения можно применить к примерам ниже:

- Учитывая набор новостных статей, найденных в Интернете, сгруппируйте их в набор статей об одной и той же истории.
- Получив базу данных данных о клиентах, автоматически обнаруживайте сегменты рынка и группируйте клиентов в разные сегменты рынка.

И наконец…
Я надеюсь, что эта статья помогла вам разобраться в теме машинного обучения.
Мне нравятся отзывы (положительные и отрицательные), поэтому, пожалуйста, дайте мне знать, что вы думаете - напишите ответ или просто нажмите кнопку хлопка и поделитесь этим сообщением с друзьями и коллегами.
Спасибо за чтение!

Введение в машинное обучение для начинающих

Вопросы по теме