Я пытаюсь прочитать довольно большой файл CSV с помощью Pandas и разбить его на два случайных фрагмента, один из которых составляет 10% данных, а другой - 90%.
Вот моя текущая попытка:
rows = data.index
row_count = len(rows)
random.shuffle(list(rows))
data.reindex(rows)
training_data = data[row_count // 10:]
testing_data = data[:row_count // 10]
По какой-то причине sklearn
выдает эту ошибку, когда я пытаюсь использовать один из этих результирующих объектов DataFrame внутри классификатора SVM:
IndexError: each subindex must be either a slice, an integer, Ellipsis, or newaxis
Я думаю, что я делаю это неправильно. Есть ли лучший способ сделать это?