Машинное обучение — это изучение компьютерных алгоритмов, которые автоматически совершенствуются благодаря опыту. Это рассматривается как часть искусственного интеллекта.

Три компонента машинного обучения:

Чем больше у вас разнообразия в выборках, тем легче найти соответствующие закономерности и предсказать результат. Поэтому для обучения машины нам нужны три компонента:

1. Данные

Данные Хотите обнаружить спам? Получите образцы спам-сообщений. Чем разнообразнее данные, тем лучше результат. Десятки тысяч строк — это минимум для отчаянных.

Существует два основных способа получения данных — ручной и автоматический.

* Данные, собранные вручную, содержат гораздо меньше ошибок, но на их сбор уходит больше времени, что в целом делает их более дорогими.

* Автоматический подход дешевле — вы собираете все, что можете найти, и надеетесь на лучшее.

2. Особенности

Когда данные хранятся в таблицах, все просто — функции — это имена столбцов. Но какие они, если у вас есть 100 Гб фотографий котов? Мы не можем рассматривать каждый пиксель как функцию. Вот почему выбор правильных функций обычно занимает больше времени, чем все остальные части машинного обучения. Это также основной источник ошибок. Мясные мешки всегда субъективны. Они выбирают только функции, которые им нравятся или которые они считают «более важными». Пожалуйста, не будь человеком.

3. Алгоритмы

Алгоритмы Наиболее очевидная часть. Любую проблему можно решить по-разному. Выбранный метод влияет на точность, производительность и размер конечной модели. Но есть один важный нюанс: если данные дерьмовые, то даже самый лучший алгоритм не поможет. Иногда это называют «мусор на входе — мусор на выходе». Так что не обращайте слишком много внимания на процент точности, попробуйте сначала получить больше данных.

Карта мира машинного обучения

Если вы слишком ленивы для длинных чтений, взгляните на картинку ниже, чтобы получить некоторое представление.

Всегда важно помнить — в мире машинного обучения не существует единственного способа решить проблему. Всегда есть несколько подходящих алгоритмов, и вам нужно выбрать, какой из них подходит лучше. Все, конечно, можно решить с помощью нейросети, но кто будет платить за все эти GeForce?

Начнем с общего обзора. На сегодняшний день существует четыре основных направления в машинном обучении.