Практическое машинное обучение.
Часть 0.
Базовые знания об этом полезны
Часть 1. Предварительная обработка данных
Предварительная обработка данных - важный шаг в процессе интеллектуального анализа данных.
- Импортировать библиотеку
- Получите данные
- Проверьте наличие отсутствующих или нулевых данных.
- Преобразование категориальных данных в числа
- Разделить данные на данные для обучения и тестирования
Для предварительной обработки данных посмотрите этот Блокнот Jupyter.
Часть 2: обучение с учителем
Обучение с учителем - это обучение модели с входной переменной и выходной переменной, а алгоритм сопоставляет входные данные с выходными.
Контролируемое обучение подразделяется на две категории алгоритмов:
- Классификация: проблема классификации возникает, когда выходной переменной является категория, например «болезнь» или «Нет болезни».
- Регрессия. Проблема регрессии возникает, когда выходной переменной является действительное значение, например «Цена».
2.1 Классификация
Существует множество приложений для классификации от здравоохранения до маркетинга.
Узнайте, как реализовать следующие модели классификации:
- "Логистическая регрессия"
- K-Ближайшие соседи (K-NN)
- Опорный вектор Mchine (SVM)
- Ядро SVM
- Наивный Байес
- Классификация дерева решений
- Классификация случайных лесов
2.2 Регрессия
Техника регрессии варьируется от линейной регрессии до случайного леса.
- Простая линейная регрессия
- Множественная линейная регрессия
- Полиномиальная регрессия
- Опорный вектор для регрессии
- "Древо решений"
- Случайный лес
Часть 3: обучение без учителя
Неконтролируемое обучение - это когда присутствуют только входные данные и нет соответствующей выходной переменной.
В обучении без учителя есть две категории алгоритмов:
- Кластеризация. Проблема кластеризации заключается в том, что вы хотите обнаружить неотъемлемые группировки в данных, например группировку клиентов по покупательскому поведению.
- Ассоциация: проблема изучения правил ассоциации - это когда вы хотите найти правила, которые описывают большую часть ваших данных, например, люди, которые покупают X, также склонны покупать Y
3.1 Кластеризация
Кластеризация похожа на классификацию, но основа другая. При кластеризации вы не знаете, что ищете, и пытаетесь идентифицировать некоторые сегменты или кластеры в своих данных.
Узнайте, как реализовать следующие модели кластеризации машинного обучения:
- К-среднее Кластеризация
- Иерархическая кластеризация
Основная проблема заключается в том, как использовать правильный оценщик для наших задач?
Вы можете использовать Scikit-learn map для решения своей задачи.
Чтобы сделать мир лучше, используйте данные с умом.
-Vivek2509
Первоначально опубликовано на https://vivek2509.blogspot.com 21 октября 2020 г.