Как выбрать первую строку кадра данных R, которая соответствует определенным критериям?
Вот контекст:
У меня есть кадр данных с пятью столбцами:
"pixel", "year","propvar", "component", "cumsum."
Есть 1,225 комбинаций pixel
и year
, потому что данные были вычислены из ежегодного временного ряда из 49 географических пикселей для каждого из 25 учебных лет. В течение каждого пиксельного года я вычислил propvar
, долю от общей дисперсии, объясненную данным компонентом быстрого преобразования Фурье для временных рядов данного пиксельного года. Затем я вычислил cumsum
, который является суммарной суммой propvar
для каждой частотной составляющей в пиксельном году. Столбец component
просто дает вам индекс для компонента ряда Фурье (плюс 1), из которого был рассчитан propvar
.
Я хочу определить количество компонентов, необходимых для объяснения более 99% дисперсии. Я считаю, что один из способов сделать это - найти первую строку в каждом пиксельном году, где cumsum
> 0.99, и создать из нее кадр данных с тремя столбцами, pixel
, year
и numbercomps
, где numbercomps
- количество компонентов, требуемых в течение данного пиксельного года, чтобы объяснить более 99% дисперсии. Я не знаю, как это сделать в R. Кто-нибудь имеет решение?