Как мне лучше всего сделать %80 обучения, %10 проверки и %10-процентного разделения теста, используя train_test_split в Python?

Как мне лучше всего сделать %80 обучения, %10 проверки и %10-процентного разделения теста, используя train_test_split в Python? Существует ли общий способ визуализации этого разделения после его создания?

from sklearn.model_selection import train_test_split

# Splitting the data by a percentage
train_data, test_data = train_test_split(mid_prices, train_size=0.8, test_size=0.2, shuffle=False)

person iceAtNight7    schedule 20.06.2021    source источник
comment
Отвечает ли это на ваш вопрос? Как разделить данные на 3 набора (поезд, проверка и тестирование)?   -  person enzo    schedule 21.06.2021
comment
Спасибо, @enzo, это как бы отвечает на мой вопрос, но я пытался это сделать, да, вроде как, но я все еще не уверен. Используя это решение, которое я произвел, является следующим! У вас есть какие-нибудь мысли? train_data, test_data = train_test_split(mid_prices, test_size=0,1, shuffle=False, random_state=42) train_data, validation_data = train_test_split(X_train, y_train, test_size=0,111, shuffle=False, random_state=42) # 0,111 x 0,9 = 0,0999 или 9,99 %   -  person iceAtNight7    schedule 21.06.2021


Ответы (1)


Первоначально разделите данные на 80% и 20%. 80 % на обучение и оставшиеся 20 % на тестирование и проверку.

train_data, rest_data = train_test_split(mid_prices, train_size=0.8, shuffle=False)

Теперь вы можете разделить оставшиеся данные на 50%, чтобы иметь 10% проверки и 10% проверки.

validation_data, test_data = train_test_split(rest_data, test_size=0.5, shuffle=False)

person Yogesh Bhandari    schedule 20.06.2021
comment
Это замечательно! Это намного элегантнее, чем то, что я использовал раньше. Я ценю помощь! - person iceAtNight7; 21.06.2021