У меня есть фреймворк, где каждый образец принадлежит группе. Например:
df = a b c group
1 1 2 G1
1 6 1 G1
8 2 8 G3
2 8 7 G2
1 9 2 G2
1 7 2 G3
4 0 2 G4
1 5 1 G4
6 7 8 G5
3 3 7 G6
1 2 2 G6
1 0 5 G7
Я хочу запустить cross_val_predict
, убедившись, что все образцы из одной группы находятся в тесте или все находятся в поезде. Я хочу разделить данные на 4 части, но убедитесь, что все строки из одной группы находятся вместе в тесте или в поезде.
Так, например, строки 0,1 и 4,5 будут в поезде, но строки 3, 6 (G3) будут в тесте.
Это возможно? Я видел group
аргумент в документации, но он не очень понятен, и я не нашел никаких примеров.