Возможно ли изменить структуру данных на месте (разрушительно)?

Кажется, что можно добавить/удалить столбец в data.table на месте, т.е. без копирования всех остальных столбцов в новую таблицу.

Можно ли сделать это с ванилью data.frame?

PS. Я знаю, как добавлять/удалять столбцы "функционально", т.е. Создавать новый кадр без изменения исходного.

Ответ 1

Вы можете удалить или изменить существующий столбец из data.frame по ссылке data.table::set. Я сомневаюсь, что вы можете добавить столбец без копии. Причина, по которой вы можете добавить столбец в data.table без копирования, заключается в том, что data.table over выделяет память. Подробнее см. ?alloc.col.

R> library(data.table)
R> data(mtcars)
R> tracemem(mtcars)
[1] "<0x59fef68>"
R> set(mtcars, j="mpg", value=NULL)        # remove a column
R> set(mtcars, j="cyl", value=rep(42, 32)) # modify a column
R> untracemem(mtcars)
R> str(mtcars)
'data.frame':   32 obs. of  10 variables:
 $ cyl : num  42 42 42 42 42 42 42 42 42 42 ...
 $ disp: num  160 160 108 258 360 ...
 $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
 $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
 $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
 $ qsec: num  16.5 17 18.6 19.4 17 ...
 $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
 $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
 $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
 $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

Сравните это с обычными операциями data.frame

R> data(mtcars)
R> tracemem(mtcars)
[1] "<0x6b3ec30>"
R> mtcars[, "mpg"] <- NULL
tracemem[0x6b3ec30 -> 0x84de0c8]: 
tracemem[0x84de0c8 -> 0x84de410]: [<-.data.frame [<- 
tracemem[0x84de410 -> 0x84de6b0]: [<-.data.frame [<- 
R> tracemem(mtcars)
[1] "<0x84dca30>"
R> mtcars[, "cyl"] <- rep(42, 32)
tracemem[0x84dca30 -> 0x84dcc28]: 
tracemem[0x84dcc28 -> 0x84dd018]: [<-.data.frame [<- 
tracemem[0x84dd018 -> 0x84dff70]: [<-.data.frame [<- 
R> untracemem(mtcars)
R> data(mtcars)