Публикации по теме 'classifcation-models'


Понимание и реализация алгоритма K-ближайших соседей с нуля в Python
Алгоритм K ближайших соседей — это простой алгоритм классификации, который является одним из наиболее часто используемых алгоритмов классификации. Алгоритм KNN можно использовать как для задач классификации, так и для регрессии, и его результат зависит от нашей цели использования алгоритма. Как работает КНН? Алгоритм KNN работает по очень простому принципу. Он сохраняет весь набор данных во время обучения, а при прогнозировании сравнивает ввод с существующими данными и проверяет..

Прогнозирование Sub-Reddit с помощью классификационного моделирования
Здравствуйте, коллеги, рассказчики данных, в этом посте я хочу поделиться своими выводами о моделировании классификации с помощью веб-парсинга сообщений из двух разных подразделов Reddit и определения их происхождения. Подразделение Reddit, представляющее интерес, - это r / fakehistoryporn и r / NatureIsFuckingLit. Подписка на Reddit выбрана не случайно. Я энтузиаст истории и любитель природы. Итак, переход прямо в рабочий процесс выглядит следующим образом: API веб-парсинга..

Оптимизация гиперпараметров в классификации случайных лесов
Что такое гиперпараметры, как выбирать значения гиперпараметров и стоят ли они вашего времени В этом посте я подробно рассмотрю настройку гиперпараметров для моделей случайной классификации лесов с использованием нескольких пакетов scikit-learn для классификации и выбора моделей. Я буду анализировать наборы данных о качестве вина из Репозитория машинного обучения UCI . Для этого поста я объединил отдельные наборы данных для красного и белого вина и назначил им дополнительный столбец,..

Классификаторы машинного обучения
Что такое классификация? Классификация - это процесс прогнозирования класса заданных точек данных. Классы иногда называют целями / метками или категориями. Классификационное прогнозное моделирование - это задача аппроксимации функции отображения (f) входных переменных (X) в дискретные выходные переменные (y). Например, обнаружение спама у поставщиков услуг электронной почты можно определить как проблему классификации. Это бинарная классификация, так как существует только 2 класса..

Классификация с использованием случайного леса
Классификация с использованием случайного леса импортировать numpy как np из sklearn.feature_extraction.text импортировать CountVectorizer из sklearn.ensemble импортировать RandomForestClassifier Шаг 1: сначала я включил все пакеты. набор данных представляет собой корпус данных. набор данных = ['Пациент с глаукомой','Высокая температура Денгу','Проблемы с глазами, глаукома','пациент с Денгу'] Шаг 2: Метка 1 = глюкома, метка 2 = денгу Метка = np.массив ([1,2,1,2]) Шаг 3:..