Как вы относитесь к подмножеству data.table с помощью числового диапазона с намерением использовать бинарный поиск?
Например:
require(data.table)
set.seed(1)
x<-runif(10000000,min=0,max=10)
y<-runif(10000000,min=0,max=10)
DF<-data.frame(x,y)
DT<-data.table(x,y)
system.time(DFsub<-DF[DF$x>5 & DF$y<7,])
# user system elapsed
# 1.529 0.250 1.821
#subset DT
system.time(DTsub<-DT[x>5 & y<7])
# user system elapsed
#0.716 0.119 0.841
Вышеупомянутый не использует ключ (векторное сканирование), и ускорение не так драматично. Каков синтаксис для подмножества числового диапазона таблицы данных. Используя бинарный поиск? Я не могу найти хороший пример в документации; было бы полезно, если бы кто-то мог привести пример, используя таблицу игрушек. Таблица выше.
EDIT: этот вопрос аналогичен, но пока не показывает, как подмножество диапазона: data.table: векторное сканирование v бинарный поиск с числовыми столбцами - супер-медленная настройка