Публикации по теме 'sklearn'


Пайплайны Scikit-learn для начинающих
Полезный инструмент для оптимизации процесса моделирования. В его простейшем определении конвейеры в Scikit learn могут использоваться для объединения нескольких оценщиков вместе, говорится в документации . Это может быть очень полезно при выборе функций, нормализации и классификации по трем основным причинам: специалистам по обработке данных нужно подогнать и спрогнозировать регрессию только один раз, настройщик гиперпараметров Scikit-learn GridSearch может быть применен к..

Логистические регрессии и редкие события
Взвешенное максимальное правдоподобие по сравнению с передискретизацией Вступление Раньше я работал над созданием некоторых наборов задач для аспирантуры. Одно из заданий было связано с простой задачей классификации с использованием данных, которые я взял из проблемы с тупицей , пытаясь предсказать мошеннические транзакции по кредитным картам. Цель проблемы - предсказать вероятность того, что конкретная транзакция по кредитной карте является мошеннической. Одна непредвиденная проблема..

Обнаружение текста в естественной сцене с использованием OpenCV и машинного обучения (SVM)
Обнаружение текста естественной сцены - одна из сложных задач компьютерного зрения. Это связано с тем, что текст в естественной сцене имеет слишком много вариаций шрифта, условий освещения, меньше текста и больше нетекстовых областей. В отличие от набора данных mnsit, где у нас есть рукописные цифры на переднем и заднем плане, с такими изображениями становится очень легко работать. Основная цель этого поста - обучить классификатор текста естественной сцены. Примечание: это сообщение в..

Реализация моделей машинного обучения в наборе данных Iris.
Мы обсуждали EDA в наборе данных Iris в последнем сообщении блога. Если вы еще не читали, посмотрите мой последний пост В этом посте я попытаюсь реализовать различные модели машинного обучения и увидеть различия между ними и показатели точности. Без дальнейших промедлений приступим к делу. Как обсуждалось в предыдущем посте, набор данных Iris содержит подробную информацию о характеристиках цветков ириса, таких как длина и ширина лепестков, длина и ширина чашелистиков, и они..

Как разместить модель машинного обучения в качестве конечной точки REST API на Python Flask
В этом руководстве мы используем лучшую модель для прогнозирования цен перепродажи HDB и предоставляем ее в качестве конечной точки на Flask. У нас будет конечная точка обучения и конечная точка прогнозирования отдельно. Чтобы проверить точность предсказания на себе, вы можете зайти на hdbpricer.com Это вторая часть руководства из четырех частей 1. Создание хорошей модели прогнозирования 2. Размещение прогнозирования модели в качестве конечной точки API на Flask 3. Создание..

Как создать набор данных линейной регрессии с помощью sklearn и делать на нем прогнозы
В последних нескольких публикациях я сосредоточился на том, как создавать наборы данных классификации, такие как полумесяцы, капли, круги и другие типы наборов данных классификации. Мой последний пост о создании наборов данных, в частности наборов классификационных данных, можно найти здесь: - https://medium.com/mlearning-ai/how-to-make-a-classification-dataset-and-predict-on- it-in-python-feaea3844052 Однако в этом посте я собираюсь обсудить, как создать простой набор данных..

Сетка в поисках хорошего вина
Тонкая настройка модели - жизненно важный шаг в большинстве проектов машинного обучения. Даже при тщательной очистке данных и проектировании функций плохо выбранные гиперпараметры не позволят получить максимальную производительность от ее моделей. В прошлых проектах мне приходилось перебирать параметры и распечатывать ошибки обучения, чтобы выбрать лучшие, но недавно я прочитал Введение в машинное обучение с Python Андреаса К. Мюллера и Сары Гвидо. В этой книге авторы объясняют и..