Публикации по теме 'grid-search'
Прогнозирование оттока с помощью машинного обучения / LazyPredict
Создайте простую модель оттока с нуля с помощью LazyPredict
Отток - широко используемый ключевой показатель эффективности, направленный на определение скорости, с которой клиенты прекращают вести дела с организацией. Он представляет собой процент подписчиков службы, которые прекращают подписку в течение заданного периода времени. Для каждой отрасли компании могут иметь разные ставки, которые необходимо отслеживать, поскольку это может повлиять на годовой периодический доход (ARR),..
Вопросы по теме 'grid-search'
Поиск по сетке с функцией подсчета очков f1, несколько страниц сообщения об ошибке
Хотите использовать Gridsearch для поиска лучших параметров и использовать f1 в качестве показателя оценки.
Если я удалю функцию подсчета очков, все будет работать нормально, и я не получу ошибок.
Вот мой код:
from sklearn import grid_search...
7334 просмотров
schedule
02.12.2021
выбор модели для GaussianMixture с помощью GridSearch
Я хотел бы использовать функцию GaussianMixture с помощью scikit-learn, и мне нужно выполнить выбор модели. Я хочу сделать это с помощью GridSearchCV, и я хотел бы использовать для выбора BIC и AIC. Оба эти значения реализованы в GaussianMixture (),...
2268 просмотров
schedule
28.10.2021
Что означает "mean_test_score" в cv_result?
Здравствуйте, я делаю GridSearchCV и печатаю результат с помощью функции .cv_results_ из scikit learn .
Моя проблема в том, что когда я вручную оцениваю среднее значение по всем разделам результатов теста, я получаю другое число по сравнению с...
16185 просмотров
schedule
03.10.2021
Поиск по сетке в задачах классификации нескольких классов с использованием нейронных сетей
Я пытаюсь выполнить поиск по сетке для задачи с несколькими классами в нейронных сетях. Я не могу получить оптимальные параметры, ядро продолжает компилироваться. Есть ли проблемы с моим кодом? Пожалуйста, помогите
import keras
from...
544 просмотров
schedule
25.10.2021
Как читать выбранные встроенные параметры оценщиков поиска по сетке sklearn?
Я использую sklearn 'gridsearchcv', чтобы найти лучшие гиперпараметры моего метода выбора функций, здесь 'selectkbest'. Я использую конвейер «выбора функций» и мою регрессию гребня поверх него.
Пример такого конвейера находится здесь .
Однако...
410 просмотров
schedule
07.09.2021
Как передавать веса при использовании Sklearn GridSearchCV с конвейером
Я работаю над моделью классификации текста и использую Pipeline в сочетании с GridSearch Cross Validation . Фрагменты кода ниже:
count_vec=CountVectorizer(ngram_range=(1,2),stop_words=Stopwords_X,min_df=0.01)...
1517 просмотров
schedule
12.09.2021
Как выбрать бета-версию в рейтинге F-beta
Я использую поиск по сетке, чтобы оптимизировать гиперпараметры случайного леса, подходящего для сбалансированного набора данных, и мне сложно выбрать метрику оценки модели. Учитывая реальный контекст этой проблемы, ложноотрицательные результаты...
1249 просмотров
schedule
01.10.2021
Использование GridSearchCV дает ошибку с CalibratedClassifierCV в scikit-learn. Объект GridSearchCV не имеет атрибута best_params_
Я использую CalibratedClassifierCV с RandomForest и использую GridSearch для определения лучших параметров. Однако, когда я использую GridSearchCV для считывания лучших параметров, он говорит, что объект GridSearchCV не имеет атрибута 'best_params_'...
1726 просмотров
schedule
07.11.2021
Ошибка LightGBM: ValueError: для ранней остановки требуется по крайней мере один набор данных и метрика eval для оценки
Я пытаюсь обучить LightGBM с помощью gridsearch, я получаю следующую ошибку, когда пытаюсь обучить модель.
ValueError: For early stopping, at least one dataset and eval metric is required for evaluation
Я предоставил набор данных для проверки...
3654 просмотров
schedule
26.10.2021
Вопрос о параллелизме в функции h2o.grid ()
Я пытаюсь использовать функцию h2o.grid() из пакета h2o, чтобы выполнить некоторую настройку с помощью R, когда я устанавливаю параметр parallelism больше 1, он всегда показывает предупреждение
Некоторые модели не были построены из-за сбоя,...
147 просмотров
schedule
03.11.2021
GridSearchCV - какие данные следует использовать?
В настоящее время я работаю над проблемой бинарной классификации с примерно 2000 точками данных в обучающем наборе, и мне интересно, следует ли мне использовать весь обучающий набор для gridsearch или я должен сначала сделать разделение для генерации...
44 просмотров
schedule
03.03.2022
Как улучшить результат F1 для классификации
Я работаю над прогнозированием, нарушает ли какая-либо задача установленный срок (проблема двоичной классификации)
Я использовал логистическую регрессию, случайный лес и XGBoost. Все они дают оценку F1 около 56% для метки класса 1 (то есть оценка...
4264 просмотров
schedule
10.03.2022
R: Эффективный подход к настройке гиперпараметров случайного леса
У меня есть следующая модель случайного леса (регрессии) с параметрами по умолчанию
set.seed(42)
# Define train control
trControl <- trainControl(method = "cv",
number = 10,
search = "grid")
# Random Forest...
40 просмотров
schedule
12.03.2022
Поиск по сетке по параметрам внутри параметров BaggingClassifier
Это продолжение вопроса, на который здесь дан ответ , но я считаю, что он заслуживает отдельной темы.
В предыдущем вопросе мы имели дело с «ансамблем ансамблевых классификаторов, каждый из которых имеет свои собственные параметры». Начнем с...
1302 просмотров
schedule
24.03.2022
Техника поиска по сетке в sklearn, python
Я работаю над контролируемым алгоритмом машинного обучения, и у него, кажется, любопытное поведение. Итак, позвольте мне начать:
У меня есть функция, в которой я передаю разные классификаторы, их параметры, данные обучения и их метки:
def...
712 просмотров
schedule
14.04.2022
Как настроить параметр «гамма» предварительно вычисленного ядра RBF в Python, используя «gridsearchCV» и «конвейер»?
Я пытаюсь настроить параметр gamma предварительно вычисленного ядра RBF , используя gridsearchCV() и Pipeline в scikit-learn . Я следил за объяснением в следующих двух ссылках StackOverflow :
Можно ли настроить параметры с помощью...
1120 просмотров
schedule
23.04.2022
scikit-learn GridSearchCV с несколькими повторениями
Я пытаюсь получить лучший набор параметров для модели SVR. Я хотел бы использовать GridSearchCV над разными значениями C . Однако из предыдущего теста я заметил, что разделение на набор для обучения / тестирования сильно влияет на общую...
13997 просмотров
schedule
07.05.2022
Использование Scikit-Learn GridSearchCV для перекрестной проверки с PredefinedSplit - подозрительно хорошие результаты перекрестной проверки
Я хотел бы использовать GridSearchCV scikit-learn для выполнения поиска по сетке и вычисления ошибки перекрестной проверки с использованием предопределенного разделения разработки и проверки (1-кратная перекрестная проверка).
Боюсь, что я сделал...
2728 просмотров
schedule
11.05.2022
Как реализовать SMOTE при перекрестной проверке и GridSearchCV
Я относительно новичок в Python. Можете ли вы помочь мне улучшить мою реализацию SMOTE до надлежащего конвейера? Я хочу применить избыточную и недостаточную выборку к обучающему набору каждой k-кратной итерации, чтобы модель обучалась на...
8871 просмотров
schedule
21.05.2022
Sklearn GridSearch с предварительной подготовкой
Я делаю Sklearn Pipeline с оптимизацией параметров, сделанной GridSearchCV . Конвейер должен получить лучшую модель для нескольких различных объектов, реализующих подход предварительной подготовки , а затем точной настройки : предварительное...
113 просмотров
schedule
25.05.2022