Публикации по теме 'grid-search'


Прогнозирование оттока с помощью машинного обучения / LazyPredict
Создайте простую модель оттока с нуля с помощью LazyPredict Отток - широко используемый ключевой показатель эффективности, направленный на определение скорости, с которой клиенты прекращают вести дела с организацией. Он представляет собой процент подписчиков службы, которые прекращают подписку в течение заданного периода времени. Для каждой отрасли компании могут иметь разные ставки, которые необходимо отслеживать, поскольку это может повлиять на годовой периодический доход (ARR),..

Вопросы по теме 'grid-search'

Поиск по сетке с функцией подсчета очков f1, несколько страниц сообщения об ошибке
Хотите использовать Gridsearch для поиска лучших параметров и использовать f1 в качестве показателя оценки. Если я удалю функцию подсчета очков, все будет работать нормально, и я не получу ошибок. Вот мой код: from sklearn import grid_search...
7334 просмотров
schedule 02.12.2021

выбор модели для GaussianMixture с помощью GridSearch
Я хотел бы использовать функцию GaussianMixture с помощью scikit-learn, и мне нужно выполнить выбор модели. Я хочу сделать это с помощью GridSearchCV, и я хотел бы использовать для выбора BIC и AIC. Оба эти значения реализованы в GaussianMixture (),...
2268 просмотров
schedule 28.10.2021

Что означает "mean_test_score" в cv_result?
Здравствуйте, я делаю GridSearchCV и печатаю результат с помощью функции .cv_results_ из scikit learn . Моя проблема в том, что когда я вручную оцениваю среднее значение по всем разделам результатов теста, я получаю другое число по сравнению с...
16185 просмотров
schedule 03.10.2021

Поиск по сетке в задачах классификации нескольких классов с использованием нейронных сетей
Я пытаюсь выполнить поиск по сетке для задачи с несколькими классами в нейронных сетях. Я не могу получить оптимальные параметры, ядро ​​продолжает компилироваться. Есть ли проблемы с моим кодом? Пожалуйста, помогите import keras from...
544 просмотров
schedule 25.10.2021

Как читать выбранные встроенные параметры оценщиков поиска по сетке sklearn?
Я использую sklearn 'gridsearchcv', чтобы найти лучшие гиперпараметры моего метода выбора функций, здесь 'selectkbest'. Я использую конвейер «выбора функций» и мою регрессию гребня поверх него. Пример такого конвейера находится здесь . Однако...
410 просмотров
schedule 07.09.2021

Как передавать веса при использовании Sklearn GridSearchCV с конвейером
Я работаю над моделью классификации текста и использую Pipeline в сочетании с GridSearch Cross Validation . Фрагменты кода ниже: count_vec=CountVectorizer(ngram_range=(1,2),stop_words=Stopwords_X,min_df=0.01)...
1517 просмотров

Как выбрать бета-версию в рейтинге F-beta
Я использую поиск по сетке, чтобы оптимизировать гиперпараметры случайного леса, подходящего для сбалансированного набора данных, и мне сложно выбрать метрику оценки модели. Учитывая реальный контекст этой проблемы, ложноотрицательные результаты...
1249 просмотров

Использование GridSearchCV дает ошибку с CalibratedClassifierCV в scikit-learn. Объект GridSearchCV не имеет атрибута best_params_
Я использую CalibratedClassifierCV с RandomForest и использую GridSearch для определения лучших параметров. Однако, когда я использую GridSearchCV для считывания лучших параметров, он говорит, что объект GridSearchCV не имеет атрибута 'best_params_'...
1726 просмотров
schedule 07.11.2021

Ошибка LightGBM: ValueError: для ранней остановки требуется по крайней мере один набор данных и метрика eval для оценки
Я пытаюсь обучить LightGBM с помощью gridsearch, я получаю следующую ошибку, когда пытаюсь обучить модель. ValueError: For early stopping, at least one dataset and eval metric is required for evaluation Я предоставил набор данных для проверки...
3654 просмотров
schedule 26.10.2021

Вопрос о параллелизме в функции h2o.grid ()
Я пытаюсь использовать функцию h2o.grid() из пакета h2o, чтобы выполнить некоторую настройку с помощью R, когда я устанавливаю параметр parallelism больше 1, он всегда показывает предупреждение Некоторые модели не были построены из-за сбоя,...
147 просмотров

GridSearchCV - какие данные следует использовать?
В настоящее время я работаю над проблемой бинарной классификации с примерно 2000 точками данных в обучающем наборе, и мне интересно, следует ли мне использовать весь обучающий набор для gridsearch или я должен сначала сделать разделение для генерации...
44 просмотров

Как улучшить результат F1 для классификации
Я работаю над прогнозированием, нарушает ли какая-либо задача установленный срок (проблема двоичной классификации) Я использовал логистическую регрессию, случайный лес и XGBoost. Все они дают оценку F1 около 56% для метки класса 1 (то есть оценка...
4264 просмотров

R: Эффективный подход к настройке гиперпараметров случайного леса
У меня есть следующая модель случайного леса (регрессии) с параметрами по умолчанию set.seed(42) # Define train control trControl <- trainControl(method = "cv", number = 10, search = "grid") # Random Forest...
40 просмотров

Поиск по сетке по параметрам внутри параметров BaggingClassifier
Это продолжение вопроса, на который здесь дан ответ , но я считаю, что он заслуживает отдельной темы. В предыдущем вопросе мы имели дело с «ансамблем ансамблевых классификаторов, каждый из которых имеет свои собственные параметры». Начнем с...
1302 просмотров

Техника поиска по сетке в sklearn, python
Я работаю над контролируемым алгоритмом машинного обучения, и у него, кажется, любопытное поведение. Итак, позвольте мне начать: У меня есть функция, в которой я передаю разные классификаторы, их параметры, данные обучения и их метки: def...
712 просмотров

Как настроить параметр «гамма» предварительно вычисленного ядра RBF в Python, используя «gridsearchCV» и «конвейер»?
Я пытаюсь настроить параметр gamma предварительно вычисленного ядра RBF , используя gridsearchCV() и Pipeline в scikit-learn . Я следил за объяснением в следующих двух ссылках StackOverflow : Можно ли настроить параметры с помощью...
1120 просмотров

scikit-learn GridSearchCV с несколькими повторениями
Я пытаюсь получить лучший набор параметров для модели SVR. Я хотел бы использовать GridSearchCV над разными значениями C . Однако из предыдущего теста я заметил, что разделение на набор для обучения / тестирования сильно влияет на общую...
13997 просмотров

Использование Scikit-Learn GridSearchCV для перекрестной проверки с PredefinedSplit - подозрительно хорошие результаты перекрестной проверки
Я хотел бы использовать GridSearchCV scikit-learn для выполнения поиска по сетке и вычисления ошибки перекрестной проверки с использованием предопределенного разделения разработки и проверки (1-кратная перекрестная проверка). Боюсь, что я сделал...
2728 просмотров

Как реализовать SMOTE при перекрестной проверке и GridSearchCV
Я относительно новичок в Python. Можете ли вы помочь мне улучшить мою реализацию SMOTE до надлежащего конвейера? Я хочу применить избыточную и недостаточную выборку к обучающему набору каждой k-кратной итерации, чтобы модель обучалась на...
8871 просмотров

Sklearn GridSearch с предварительной подготовкой
Я делаю Sklearn Pipeline с оптимизацией параметров, сделанной GridSearchCV . Конвейер должен получить лучшую модель для нескольких различных объектов, реализующих подход предварительной подготовки , а затем точной настройки : предварительное...
113 просмотров