Машинное обучение

Идея этого блога - избавиться от жаргона, насколько это возможно. Чтобы дать обзор машинного обучения и причин, по которым мы выбрали его.

Я читал книгу под названием Практическое машинное обучение с помощью Sklearn и TensorFlow, я хочу изложить то, что я читал здесь, как практику (эгоистичную) или научить кого-то там, чему я научился.

Давай прыгнем

Что такое машинное обучение?

Область обучения, которая дает компьютерам возможность учиться, не будучи явно запрограммированной на это.

Довольно определения, вы слышите это почти везде.

Давайте разберемся, чем оно отличается от традиционного программирования раз и навсегда,

Например, спам-фильтр в нашей почте работает по принципу машинного обучения. Учитывая примеры спам-писем (от пользователей) и примеров писем, не связанных со спамом (обычная почта), спам-фильтр, запрограммированный с помощью машинного обучения, может помечать исходящие спам-письма.

Хорошо, вы можете спросить меня: «Эш, я тоже могу делать это с помощью традиционного программирования».

Конечно, можете, но придумайте что-нибудь, что облегчит вашу работу? Вы все еще идете по трудному пути?

Как работает традиционное программирование (спам-фильтр)

Прежде всего, мы должны найти способ уведомить программу о том, как выглядит спам-почта. В наших электронных письмах мы можем использовать слова или фразы (например, 4U, кредитная карта, бесплатно, замечательно, и т. д.), которые часто появляются в разделе «Тема» сообщения. Возможно, даже какие-то другие странные термины в имени отправителя, теле письма и т. Д.

Затем мы напишем алгоритм (с if-else) для каждого обнаруженного нами шаблона, например,

if ('4U' in mail_txt):
	return 'SPAM MAIL' 
else:
	return 'Easy! Good one'

Хорошо, не судите о моих навыках программирования, я постарался упростить понимание. Аналогичным образом, для количества шаблонов, уведомляющих о спаме, будет применяться процедура, аналогичная этой.

Добавляя слишком много странных терминов или шаблонов в наш список рассылки, программа, скорее всего, превратится в длинный список сложных правил.

Хорошо, а что, если спамеры заметили, что все их электронные письма, содержащие 4U, заблокированы? Они узнали, какой ты умный. Вместо этого они могут немного изменить соглашение с 4U на For U, что обходит программу, которую вы сделали.

Код, который мы написали ранее, не будет иметь даже 0,0001% шанса обнаружить это изменение слов. Если спамеры продолжат обходить ваш спам-фильтр, вам придется постоянно писать новые правила.

Как машинное обучение может упростить работу спам-фильтра?

Машинное обучение умнее этих спамеров, честно говоря, оно автоматически узнает, какие слова и фразы считаются спамом или нет, но изучает необычно частые шаблоны слов в спам-сообщения и электронные письма без спама.

Например, машинное обучение достаточно умен, чтобы понять, что спам-письмо содержит такие слова, как (4U, кредитная карта, бесплатно, потрясающе и т. Д.), Помеченные вами как спам, поэтому, если письмо, содержащее такие слова, будет считаться спамом .

Вот почему иногда обычные письма попадали в раздел спама. Это дает нам понять, что машинное обучение не может быть на 100% точным, они делают некоторые ошибки.

Но они упрощают процесс, а это все, что нам нужно, небольшие потери можно контролировать, они лучше учатся, используя более базовые шаблоны, которые вы им предоставляете, что означает больше данных.

Затем, когда спамер стал умнее менять условные обозначения, машинное обучение весьма умен, чтобы заметить, например, 4U, которое становится необычно частым в спаме, помеченном пользователями, и начинает отмечать их без вмешательства человека.

Где машинное обучение может быть полезно?

Чтобы упростить существующие проблемы, решение, которое требует множества длинных списков правил, например, спам-фильтр, который мы видели тогда. Алгоритм машинного обучения может упростить код и работать лучше, чем традиционный подход.
Сценарий, в котором программа использует для адаптации к новым данным, система машинного обучения может сделать это без каких-либо усилий.
Получение информации о сложных проблемах и больших объемах данных.

Примеры применения ML

Обнаружение опухолей при сканировании мозга, которое является семантическим сегментацией (тип проблемы мл). Здесь каждый пиксель изображения классифицируется.
Рекомендуя продукт, который может быть интересен клиенту, рекомендательная система. Все были на Amazon, глядя на некоторые продукты, и они следят за нами, как Призрак везде, на каких бы веб-сайтах или в любом приложении мы не появлялись, бросая рекламу. При этом ваши прошлые последовательности покупок рассматриваются как данные.
Создание интеллектуального бота для игры, обучение с подкреплением. Он работает на основе системы вознаграждений, например, в шахматах. Если вы сделали неправильный ход, ваш обучающий агент (бот) достаточно умен, чтобы понять, что это неправильный ход. Проще говоря, он учится методом проб и ошибок.
Например, как мы дрессируем щенка или кошку, давая им пищу, чтобы они научили их привычке или каким-то действиям.

По мере того как я буду читать книгу, я буду ее писать. Надеюсь, вам понравится этот, если вы оставите свой отзыв, который поможет мне понять, в чем я ошибаюсь.

Хорошего дня! Продолжайте изучать машинное обучение 🤖

Машинное обучение - 101 (Часть I)

Что такое машинное обучение?

Как работает традиционное программирование (спам-фильтр)

Как машинное обучение может упростить работу спам-фильтра?

Где машинное обучение может быть полезно?

Примеры применения ML

Вопросы по теме