Я загружаю некоторые данные машинного обучения из файла CSV. Первые 2 столбца являются наблюдениями, а остальные столбцы - объектами.
В настоящее время я делаю следующее:
data = pandas.read_csv('mydata.csv')
который дает что-то вроде:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
Я хотел бы разделить этот фрейм данных на два фрейма: один, содержащий столбцы a
и b
и другой, содержащий столбцы c
, d
и e
.
Не возможно написать что-то вроде
observations = data[:'c']
features = data['c':]
Я не уверен, что лучший метод. Нужна ли мне pd.Panel
?
Между прочим, я нахожу, что индексирование по фрейму данных довольно противоречиво: data['a']
разрешены, а data[0]
- нет. С другой стороны, data['a':]
не разрешены, но data[0:]
разрешены. Есть ли практическая причина для этого? Это действительно сбивает с толку, если столбцы индексируются Int, учитывая, что data[0] != data[0:1]