Публикации по теме 'classifcation-models'
Понимание и реализация алгоритма K-ближайших соседей с нуля в Python
Алгоритм K ближайших соседей — это простой алгоритм классификации, который является одним из наиболее часто используемых алгоритмов классификации. Алгоритм KNN можно использовать как для задач классификации, так и для регрессии, и его результат зависит от нашей цели использования алгоритма.
Как работает КНН?
Алгоритм KNN работает по очень простому принципу. Он сохраняет весь набор данных во время обучения, а при прогнозировании сравнивает ввод с существующими данными и проверяет..
Прогнозирование Sub-Reddit с помощью классификационного моделирования
Здравствуйте, коллеги, рассказчики данных, в этом посте я хочу поделиться своими выводами о моделировании классификации с помощью веб-парсинга сообщений из двух разных подразделов Reddit и определения их происхождения. Подразделение Reddit, представляющее интерес, - это r / fakehistoryporn и r / NatureIsFuckingLit.
Подписка на Reddit выбрана не случайно. Я энтузиаст истории и любитель природы.
Итак, переход прямо в рабочий процесс выглядит следующим образом:
API веб-парсинга..
Оптимизация гиперпараметров в классификации случайных лесов
Что такое гиперпараметры, как выбирать значения гиперпараметров и стоят ли они вашего времени
В этом посте я подробно рассмотрю настройку гиперпараметров для моделей случайной классификации лесов с использованием нескольких пакетов scikit-learn для классификации и выбора моделей. Я буду анализировать наборы данных о качестве вина из Репозитория машинного обучения UCI . Для этого поста я объединил отдельные наборы данных для красного и белого вина и назначил им дополнительный столбец,..
Классификаторы машинного обучения
Что такое классификация?
Классификация - это процесс прогнозирования класса заданных точек данных. Классы иногда называют целями / метками или категориями. Классификационное прогнозное моделирование - это задача аппроксимации функции отображения (f) входных переменных (X) в дискретные выходные переменные (y).
Например, обнаружение спама у поставщиков услуг электронной почты можно определить как проблему классификации. Это бинарная классификация, так как существует только 2 класса..
Классификация с использованием случайного леса
Классификация с использованием случайного леса
импортировать numpy как np из sklearn.feature_extraction.text импортировать CountVectorizer из sklearn.ensemble импортировать RandomForestClassifier
Шаг 1:
сначала я включил все пакеты. набор данных представляет собой корпус данных.
набор данных = ['Пациент с глаукомой','Высокая температура Денгу','Проблемы с глазами, глаукома','пациент с Денгу']
Шаг 2: Метка 1 = глюкома, метка 2 = денгу
Метка = np.массив ([1,2,1,2])
Шаг 3:..