Баннинг Даты в R

Я борюсь с датами и временем в R, но я надеюсь, что это довольно простая задача.

Вот мой набор данных:

> str(temp.df)
'data.frame':   74602 obs. of  2 variables:
 $ time : POSIXct, format: "2011-04-09 03:53:20" "2011-04-09 03:53:15" "2011-04-09 03:53:07" "2011-04-09 03:52:39" ...
 $ value: num  1 1 1 1 1 1 1 1 1 1 ...

> head(temp.df$time, n=10)
 [1] "2011-04-09 03:53:20 EDT" "2011-04-09 03:53:15 EDT" "2011-04-09 03:53:07 EDT" "2011-04-09 03:52:39 EDT"
 [5] "2011-04-09 03:52:29 EDT" "2011-04-09 03:51:56 EDT" "2011-04-09 03:51:54 EDT" "2011-04-09 03:51:46 EDT"
 [9] "2011-04-09 03:51:44 EDT" "2011-04-09 03:51:26 EDT"

и для удобства...

> dput(head(temp.df$time, n=10))
structure(c(1302335600, 1302335595, 1302335587, 1302335559, 1302335549, 
1302335516, 1302335514, 1302335506, 1302335504, 1302335486), class = c("POSIXct", 
"POSIXt"), tzone = "")

Что я ищу:

  • Как узнать, сколько часов находится между минимальной и максимальной датой/временем?
  • Каков наилучший способ создания резюме моих данных с использованием часовых поясов времени?

Любая помощь, которую вы можете предоставить, будет с благодарностью

Ответ 1

Используйте соответствующие пакеты временных рядов zoo и/или xts. Этот пример прямо со страниц справки aggregate.zoo(), который объединяет данные POSIXct секунд каждые 10 минут

 tt <- seq(10, 2000, 10)
 x <- zoo(tt, structure(tt, class = c("POSIXt", "POSIXct")))
 aggregate(x, time(x) - as.numeric(time(x)) %% 600, mean)

Функция to.period() в xts также является верным победителем. Здесь есть бесчисленные примеры на SO и в списке r-sig-finance.