Публикации по теме 'sklearn'


Сравнение анализа настроений в Твиттере между spacy и sklearn
В своем последнем посте я использовал библиотеку с открытым исходным кодом spacy, чтобы делать прогнозы на основе анализа настроений. В этом посте я намерен делать прогнозы для того же набора данных, используя средства обработки естественного языка sklearn, NLP. Причина, по которой я делаю прогнозы на одном и том же наборе данных, заключается в том, что я хотел бы провести сравнительную проверку, чтобы увидеть, какой алгоритм работает лучше всего. Мой последний пост об анализе..

Как разделить фрейм данных на набор для обучения и тестирования с помощью Python
Краткое руководство по использованию sklearn train_test_split на фреймворке pandas В этой короткой статье я описываю, как разделить набор данных на обучающие и тестовые данные для машинного обучения, применив функцию train_test_split в sklearn. Я использую фрейм данных, который был создан программой из моей последней статьи. Данные основаны на необработанном наборе данных BBC News Article, опубликованном Д. Грином и П. Каннингемом [1]. Не стесняйтесь проверить исходный код здесь ,..

Регрессивный анализ
Прогнозирование цен на бывшие в употреблении телефоны на основе различных характеристик подержанных/восстановленных мобильных телефонов Введение Методы контролируемого машинного обучения включают в себя обучение модели работе с набором функций и прогнозирование метки с использованием набора данных, который включает в себя некоторые уже известные значения метки. Существует множество алгоритмов машинного обучения для контролируемого обучения, и их можно условно разделить на два типа:..

🚀Ускорение алгоритмов машинного обучения
Привет, ребята, я суровый Джайн, и в этой статье я собираюсь объяснить модели повышения в машинном обучении. Мы рассмотрим простое объяснение и работу каждой модели с последующей ее практической реализацией. Итак, что такое повышение? Как работают алгоритмы повышения? какие модели бустеров? На все эти вопросы я постараюсь ответить в этой статье. Что такое бустинг? Повышение — это подход к обучению с учителем (то есть включает несколько деревьев), который начинается с более..

Обычное руководство по обучению с учителем с помощью scikit-learn - Обобщение обыкновенных наименьших квадратов…
Обычное руководство по обучению с учителем с помощью scikit-learn - Обобщенные линейные модели обыкновенных наименьших квадратов (2) Это вторая часть из 92 частей традиционного руководства по контролируемому обучению с помощью scikit-learn, написанного с целью научиться реализовывать алгоритмы для продуктивного использования и быть в состоянии объяснить алгоритмическую логику, лежащую в основе этого. Ссылки на все разделы вы найдете в первой статье . Обычные наименьшие квадраты..

Пример классификации с несколькими метками с MultiOutputClassifier и XGBoost в Python
Scikit-learn API предоставляет класс MulitOutputClassifier, который помогает классифицировать данные с несколькими выходами. В этом руководстве мы узнаем, как классифицировать данные с несколькими выходами (с несколькими метками) с помощью этого метода в Python. Данные с несколькими выходами содержат более одной метки y для заданных входных данных X. Учебник охватывает: Подготовка данных Определение модели Прогнозирование и проверка точности Листинг исходного кода Начнем с..

Введение в линейную регрессию - набор данных sklearn Diabetes Dataset
Все мы знаем уравнение линии, которое мы выучили в старшей школе, y = mx + c Если вы это знаете, это буквально означает, что вы знаете уравнение простой линейной регрессии. Часто нам кажется, что такие громкие слова, как «регресс», могут иметь большое значение, хотя они могут быть такими же простыми, как приведенное выше уравнение. В линейной регрессии y: переменная, которую нужно предсказать (также известная как Зависимая переменная). Это числовой непрерывный тип данных...