Публикации по теме 'train-test-split'


«Освоение оценки модели: глубокое погружение в методы перекрестной проверки»
ПЕРЕКРЕСТНАЯ ПРОВЕРКА Темы, которые будут освещены в этом блоге: 1. Необходимость перекрестной проверки 2. Удерживай подход / Тестовый сплит 3. ПЕРЕКРЕСТНАЯ ПРОВЕРКА 4. Исключить одну перекрестную проверку (LOOCV) 5. Перекрестная проверка K-fold 6. Многослойное резюме в K-сгибе Необходимость перекрестной проверки - В машинном обучении нам приходится в основном работать с табличными наборами данных (в случае контролируемого машинного..

Вопросы по теме 'train-test-split'

sklearn train_test_split умирает и выключает ядро ​​Python
Я борюсь с использованием функции train_test_split из scikit-learn с 3D-массивами Numpy. У меня есть массив функций с формой (1860000, 144, 12) и массив меток с формой (1860000,). В другом случае train_test_split работает хорошо. Но когда я...
400 просмотров

Как разделить немаркированные данные на набор для обучения и тестирования с помощью train_test_split?
Я новичок в анализе данных и пытаюсь построить свою первую модель. Я не понимаю, как правильно использовать функцию разделения. В большинстве документов рекомендуется следующий подход (где X = данные и Y = метка): X_train, X_test, y_train, y_test...
286 просмотров
schedule 19.09.2021

Как установить sensplit на Google Colab?
Как установить sensplit на Google Colab? Я уже клонировал репозиторий git в google colab , но я не мог использовать пакет sensplit, когда я запускаю! pip install sensplit, он возвращает ошибки. Пожалуйста, мне нужна подсказка. заранее спасибо
23 просмотров

GridSearchCV - какие данные следует использовать?
В настоящее время я работаю над проблемой бинарной классификации с примерно 2000 точками данных в обучающем наборе, и мне интересно, следует ли мне использовать весь обучающий набор для gridsearch или я должен сначала сделать разделение для генерации...
44 просмотров

Разделить набор данных, содержащий несколько меток
У меня есть набор данных с несколькими метками, то есть для каждого X у меня есть 2 y, и мне нужно разделить на набор для обучения и тестирования. Я пробовал использовать функцию sklearn train_test_split (): import numpy as np from...
41 просмотров

разделить тестовые данные с помощью стратификации на два столбца в scikit-learn
У меня есть набор данных, который я хочу разделить на обучение и тестирование, чтобы у меня были данные в тестовом наборе из каждого источника данных (указанного в столбце «источник») и из каждого класса (указанного в столбце «класс»). Я читал об...
922 просмотров
schedule 29.03.2022

Как обеспечить, чтобы все образцы из определенной группы были все вместе в обучении / тестировании в sklearn cross_val_predict?
У меня есть фреймворк, где каждый образец принадлежит группе. Например: df = a b c group 1 1 2 G1 1 6 1 G1 8 2 8 G3 2 8 7 G2 1 9 2 G2 1 7 2 G3 4 0 2 G4 1 5 1 G4 6 7 8 G5 3 3 7 G6 1...
157 просмотров

Как выполнить k-кратную перекрестную проверку с тензорным потоком?
Я следую примеру тензорного потока в IRIS . В моем случае все данные находятся в одном CSV-файле, а не разделены, и я хочу применить k-кратную перекрестную проверку этих данных. у меня есть data_set =...
35954 просмотров

Разделить набор данных изображения на наборы данных для тестирования поездов
Итак, у меня есть основная папка, которая содержит подпапки, которые, в свою очередь, содержат изображения для набора данных следующим образом. -main_db --- КЛАСС_1 ----- img_1 ----- img_2 ----- img_3 ----- img_4 --- КЛАСС_2...
17160 просмотров

Промежуток времени поезда / Val / Test LSTM
У меня есть набор данных за несколько месяцев (с 15 января по 17 сентября), в котором я сообщаю о финансовом положении клиентов за каждый месяц. Моя задача - спрогнозировать совокупные продажи для каждого покупателя на ближайшие 12 месяцев. Мой...
475 просмотров

Преобразование значения с плавающей запятой в целые числа в кадре данных Pandas, игнорируя нулевые значения
У меня есть два отдельных файла csv, которые я читаю в кадре данных pandas. Я уже сделал небольшую очистку и объединил таблицы по столбцу даты. У меня есть еще один столбец под названием «ExerciseTime», и я преобразовал импортированный формат...
1475 просмотров
schedule 01.04.2023

Как разделить данные с помощью train_test_split в Python Numpy на набор данных для обучения, тестирования и проверки? Раскол не должен быть случайным
Я хочу разделить категории данных на набор для обучения, тестирования и проверки. Например: если у нас есть 3 категории положительных, отрицательных и нейтральных в наборе данных. Положительная категория разделена на обучающую, тестовую и...
352 просмотров
schedule 11.11.2022

Обучайте и тестируйте разделенный набор с помощью ImageDataGenerator и потока
Пытаюсь сделать сеть с помощью аугментации. Сначала я использую ImageDataGenerator с validation_split = 0.2. train_generator = ImageDataGenerator( rotation_range=90, zoom_range=0.15, width_shift_range=0.2, height_shift_range=0.2,...
650 просмотров

Как проверить точность изображений, которых не было в наборе данных
Я использую train_test_split для обучения и тестирования своих данных. Это интересная концепция для разделения данных на обучение и тестирование, но что, если я хочу загрузить некоторые данные, которых не было в тестовых данных? Моя проблема в том,...
137 просмотров

Разделение тестовых наборов поездов для прогнозирования ссылок Node2vec в Stellargraph
Я пытаюсь понять, как использовать класс EdgeSplitter Stellargraph. В частности, примеры на документация по обучению модели предсказания ссылок на основе Node2Vec разбивает граф на следующие части: Распределение сэмплов по наборам train, val...
377 просмотров

Как мне лучше всего сделать %80 обучения, %10 проверки и %10-процентного разделения теста, используя train_test_split в Python?
Как мне лучше всего сделать %80 обучения, %10 проверки и %10-процентного разделения теста, используя train_test_split в Python? Существует ли общий способ визуализации этого разделения после его создания? from sklearn.model_selection import...
43 просмотров
schedule 31.05.2023

Как использовать GridSearchCV для настройки параметров со стратегией train_test_split?
Я пытаюсь настроить свои модели sklearn, используя стратегию train_test_split. Мне известно о способности GridSearchCV выполнять настройка параметров, однако это было завязано на использование стратегии Cross Validation, я бы хотел использовать...
704 просмотров

Как я могу использовать данные test_proportion в модели машинного обучения?
У меня есть данные с 4000 функциями CNN, и это проблема бинарной классификации. Все, что я знаю о тестовых данных, — это пропорции 1 и 0. Как я могу сказать своей модели, чтобы предсказывать тестовые метки, используя данные о пропорциях? (Например,...
53 просмотров