Извлечение определенных столбцов из кадра данных

У меня есть R-кадр данных с 6 столбцами, и я хочу создать новую фреймворк данных, в которой есть только три столбца.

Предполагая, что мой кадр данных df, и я хочу извлечь столбцы A, B и E, это единственная команда, которую я могу выяснить:

 data.frame(df$A,df$B,df$E)

Есть ли более компактный способ сделать это?

Ответ 1

Используя dplyr, если ваш data.frame называется df1:

library(dplyr)

df1 %>%
  select(A, B, E)

Это также можно записать без трубы %>% как:

select(df1, A, B, E)

Ответ 2

Вы можете подмножество, используя вектор имен столбцов. Я настоятельно предпочитаю этот подход по сравнению с теми, которые обрабатывают имена столбцов, как если бы они были именами объектов (например, subset()), особенно при программировании в функциях, пакетах или приложениях.

# data for reproducible example
# (and to avoid confusion from trying to subset 'stats::df')
df <- setNames(data.frame(as.list(1:5)), LETTERS[1:5])
# subset
df[,c("A","B","E")]

Ответ 3

Это роль функции subset():

> dat <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> subset(dat, select=c("A", "B"))
  A B
1 1 3
2 2 4

Ответ 4

Есть два очевидных варианта: Джошуа Ульрих df[,c("A","B","E")] или

df[,c(1,2,5)]

как в

> df <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> df
  A B C D E F
1 1 3 5 7 8 9
2 2 4 6 7 8 9
> df[,c(1,2,5)]
  A B E
1 1 3 8
2 2 4 8
> df[,c("A","B","E")]
  A B E
1 1 3 8
2 2 4 8

Ответ 5

Вы также можете использовать пакет sqldf, который выполняет выборку для фреймов данных R:

df1 <- sqldf("select A, B, E from df")

Это дает в качестве вывода фрейм данных df1 со столбцами: A, B, E.

Ответ 6

Где df1 - ваш исходный фрейм данных:

df2 <- subset(df1, select = c(1, 2, 5))

Ответ 7

По какой-то причине только

df[, (names(df) %in% c("A","B","E"))]

работал у меня. Все приведенные выше синтаксисы дали "undefined выбранные столбцы".

Ответ 8

Вы можете использовать with:

with(df, data.frame(A, B, E))

Ответ 9

[ и подмножество не подменяются:

[ возвращает вектор, если выбран только один столбец.

df = data.frame(a="a",b="b")    

identical(
  df[,c("a")], 
  subset(df,select="a")
) 

identical(
  df[,c("a","b")],  
  subset(df,select=c("a","b"))
)

Ответ 10

df<- dplyr::select ( df,A,B,C)

Кроме того, вы можете назначить другое имя вновь создаваемым данным

data<- dplyr::select ( df,A,B,C)