У меня есть простой файл csv, называемый "test.csv" со следующим содержимым:
colA,colB,colC
1,"x",12
2,"y",34
3,"z",56
Скажем, я хочу пропустить чтение в colA и просто прочитать в colB и colC. Мне нужен общий способ сделать это, потому что у меня много файлов для чтения, а иногда colA называется вообще чем-то другим, но colB и colC всегда одинаковы.
Согласно документации read_csv, один из способов добиться этого - передать именованный список для col_types и только назвать столбцы, которые вы хотите сохранить:
read_csv('test.csv', col_types = list(colB = col_character(), colC = col_numeric()))
Не упоминая colA, он должен быть сброшен с выхода. Однако результирующий кадр данных:
Source: local data frame [3 x 3]
colA colB colC
1 1 x 12
2 2 y 34
3 3 z 56
Я делаю что-то неправильно или документация read_csv не верна? Согласно файлу справки:
Если список, он должен содержать один "коллекционер" для каждого столбца. если ты только хотите прочитать подмножество столбцов, вы можете использовать именованный список (где имена дают имена столбцов). Если колонка не указана по имени он не будет включен в выход.