Привет, у меня есть много файлов CSV для обработки. Каждый файл генерируется путем запуска алгоритма. Мои данные всегда имеют один ключ и значение, подобное этому:
csv1:
index value
1 1 1
2 2 1
3 3 1
4 4 1
5 5 1
csv2:
index value
1 4 3
2 5 3
3 6 3
4 7 3
5 8 3
Теперь я хочу объединить данные CSV, например:
Если оба файла содержат одинаковый ключ, например. 5, результирующая строка должна содержать ключ как общий ресурс файлов (5), так и среднее значение обоих значений ((1 + 3)/2 = 2). Если только один файл содержит ключ (например, 2), эта строка просто добавляется в таблицу результатов (key = 2, value = 1).
Что-то вроде этого:
index value
1 1 1
2 2 1
3 3 1
4 4 2 (as (1+4)/2 = 2)
5 5 2 (as (1+4)/2 = 2)
6 6 3
7 7 3
8 8 3
Сначала я думал, что rbind()
выполняет задание, но не агрегирует значения, а только конкатенации данных. Как я могу достичь этого с помощью R?