Публикации по теме 'train-test-split'
«Освоение оценки модели: глубокое погружение в методы перекрестной проверки»
ПЕРЕКРЕСТНАЯ ПРОВЕРКА
Темы, которые будут освещены в этом блоге:
1. Необходимость перекрестной проверки
2. Удерживай подход / Тестовый сплит
3. ПЕРЕКРЕСТНАЯ ПРОВЕРКА
4. Исключить одну перекрестную проверку (LOOCV)
5. Перекрестная проверка K-fold
6. Многослойное резюме в K-сгибе
Необходимость перекрестной проверки -
В машинном обучении нам приходится в основном работать с табличными наборами данных (в случае контролируемого машинного..
Вопросы по теме 'train-test-split'
sklearn train_test_split умирает и выключает ядро Python
Я борюсь с использованием функции train_test_split из scikit-learn с 3D-массивами Numpy.
У меня есть массив функций с формой (1860000, 144, 12) и массив меток с формой (1860000,). В другом случае train_test_split работает хорошо. Но когда я...
400 просмотров
schedule
02.11.2021
Как разделить немаркированные данные на набор для обучения и тестирования с помощью train_test_split?
Я новичок в анализе данных и пытаюсь построить свою первую модель. Я не понимаю, как правильно использовать функцию разделения. В большинстве документов рекомендуется следующий подход (где X = данные и Y = метка):
X_train, X_test, y_train, y_test...
286 просмотров
schedule
19.09.2021
Как установить sensplit на Google Colab?
Как установить sensplit на Google Colab? Я уже клонировал репозиторий git в google colab , но я не мог использовать пакет sensplit, когда я запускаю! pip install sensplit, он возвращает ошибки. Пожалуйста, мне нужна подсказка. заранее спасибо
23 просмотров
schedule
12.09.2021
GridSearchCV - какие данные следует использовать?
В настоящее время я работаю над проблемой бинарной классификации с примерно 2000 точками данных в обучающем наборе, и мне интересно, следует ли мне использовать весь обучающий набор для gridsearch или я должен сначала сделать разделение для генерации...
44 просмотров
schedule
03.03.2022
Разделить набор данных, содержащий несколько меток
У меня есть набор данных с несколькими метками, то есть для каждого X у меня есть 2 y, и мне нужно разделить на набор для обучения и тестирования.
Я пробовал использовать функцию sklearn train_test_split ():
import numpy as np
from...
41 просмотров
schedule
25.02.2022
разделить тестовые данные с помощью стратификации на два столбца в scikit-learn
У меня есть набор данных, который я хочу разделить на обучение и тестирование, чтобы у меня были данные в тестовом наборе из каждого источника данных (указанного в столбце «источник») и из каждого класса (указанного в столбце «класс»). Я читал об...
922 просмотров
schedule
29.03.2022
Как обеспечить, чтобы все образцы из определенной группы были все вместе в обучении / тестировании в sklearn cross_val_predict?
У меня есть фреймворк, где каждый образец принадлежит группе. Например:
df = a b c group
1 1 2 G1
1 6 1 G1
8 2 8 G3
2 8 7 G2
1 9 2 G2
1 7 2 G3
4 0 2 G4
1 5 1 G4
6 7 8 G5
3 3 7 G6
1...
157 просмотров
schedule
16.04.2022
Как выполнить k-кратную перекрестную проверку с тензорным потоком?
Я следую примеру тензорного потока в IRIS .
В моем случае все данные находятся в одном CSV-файле, а не разделены, и я хочу применить k-кратную перекрестную проверку этих данных.
у меня есть
data_set =...
35954 просмотров
schedule
16.05.2022
Разделить набор данных изображения на наборы данных для тестирования поездов
Итак, у меня есть основная папка, которая содержит подпапки, которые, в свою очередь, содержат изображения для набора данных следующим образом.
-main_db
--- КЛАСС_1
----- img_1
----- img_2
----- img_3
----- img_4
--- КЛАСС_2...
17160 просмотров
schedule
21.05.2022
Промежуток времени поезда / Val / Test LSTM
У меня есть набор данных за несколько месяцев (с 15 января по 17 сентября), в котором я сообщаю о финансовом положении клиентов за каждый месяц. Моя задача - спрогнозировать совокупные продажи для каждого покупателя на ближайшие 12 месяцев.
Мой...
475 просмотров
schedule
20.07.2022
Преобразование значения с плавающей запятой в целые числа в кадре данных Pandas, игнорируя нулевые значения
У меня есть два отдельных файла csv, которые я читаю в кадре данных pandas. Я уже сделал небольшую очистку и объединил таблицы по столбцу даты. У меня есть еще один столбец под названием «ExerciseTime», и я преобразовал импортированный формат...
1475 просмотров
schedule
01.04.2023
Как разделить данные с помощью train_test_split в Python Numpy на набор данных для обучения, тестирования и проверки? Раскол не должен быть случайным
Я хочу разделить категории данных на набор для обучения, тестирования и проверки. Например: если у нас есть 3 категории положительных, отрицательных и нейтральных в наборе данных. Положительная категория разделена на обучающую, тестовую и...
352 просмотров
schedule
11.11.2022
Обучайте и тестируйте разделенный набор с помощью ImageDataGenerator и потока
Пытаюсь сделать сеть с помощью аугментации.
Сначала я использую ImageDataGenerator с validation_split = 0.2.
train_generator = ImageDataGenerator(
rotation_range=90,
zoom_range=0.15,
width_shift_range=0.2,
height_shift_range=0.2,...
650 просмотров
schedule
04.05.2023
Как проверить точность изображений, которых не было в наборе данных
Я использую train_test_split для обучения и тестирования своих данных. Это интересная концепция для разделения данных на обучение и тестирование, но что, если я хочу загрузить некоторые данные, которых не было в тестовых данных?
Моя проблема в том,...
137 просмотров
schedule
09.07.2023
Разделение тестовых наборов поездов для прогнозирования ссылок Node2vec в Stellargraph
Я пытаюсь понять, как использовать класс EdgeSplitter Stellargraph. В частности, примеры на документация по обучению модели предсказания ссылок на основе Node2Vec разбивает граф на следующие части:
Распределение сэмплов по наборам train, val...
377 просмотров
schedule
08.11.2022
Как мне лучше всего сделать %80 обучения, %10 проверки и %10-процентного разделения теста, используя train_test_split в Python?
Как мне лучше всего сделать %80 обучения, %10 проверки и %10-процентного разделения теста, используя train_test_split в Python? Существует ли общий способ визуализации этого разделения после его создания?
from sklearn.model_selection import...
43 просмотров
schedule
31.05.2023
Как использовать GridSearchCV для настройки параметров со стратегией train_test_split?
Я пытаюсь настроить свои модели sklearn, используя стратегию train_test_split. Мне известно о способности GridSearchCV выполнять настройка параметров, однако это было завязано на использование стратегии Cross Validation, я бы хотел использовать...
704 просмотров
schedule
09.11.2023
Как я могу использовать данные test_proportion в модели машинного обучения?
У меня есть данные с 4000 функциями CNN, и это проблема бинарной классификации. Все, что я знаю о тестовых данных, — это пропорции 1 и 0. Как я могу сказать своей модели, чтобы предсказывать тестовые метки, используя данные о пропорциях? (Например,...
53 просмотров
schedule
02.04.2024