Я новичок в анализе данных и пытаюсь построить свою первую модель. Я не понимаю, как правильно использовать функцию разделения. В большинстве документов рекомендуется следующий подход (где X = данные и Y = метка):
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)
У меня есть набор данных без метки (X = data), и я хочу построить на его основе модель для прогнозирования аномалий. Это означает, что я могу разделить свой набор данных только на 2 (части: X_train и X_test). Но я не уверен, правильно ли это для моего набора данных, и хотел бы знать, как мне продолжить, чтобы получить y. Заранее спасибо за вашу поддержку