Я использую sklearn для многоклассической задачи. Мне нужно разделить alldata на train_set и test_set. Я хочу случайным образом выбирать один и тот же номер образца из каждого класса. На самом деле, я занимаюсь этой функцией
X_train, X_test, y_train, y_test = cross_validation.train_test_split(Data, Target, test_size=0.3, random_state=0)
но он дает несбалансированный набор данных! Любое предложение.