У меня есть следующая таблица:
FN LN LN1 LN2 LN3 LN4 LN5
a b b x x x x
a c b d e NA NA
a d c a b x x
a e b c d x e
Я фильтрую записи, для которых LN присутствует в LN1-LN5.
Код, который я использовал:
testFilter = filter(test, LN %in% c(LN1, LN2, LN3, LN4, LN5))
Результат - не то, что я ожидаю:
ï..FN LN LN1 LN2 LN3 LN4 LN5
1 a b b x x x x
2 a c b d e <NA> <NA>
3 a d c a b x x
4 a e b c d x e
Я понимаю, что c(LN1, LN2, LN3, LN4, LN5)
дает: "b" "b" "c" "b" "x" "d" "a" "c" "x" "e" "b" "d" "x" NA "x" "x" "x" NA "x" "e"
и знать, что это ошибка.
В идеале я хочу вернуть только 1-й и 4-й записи.
FN LN LN1 LN2 LN3 LN4 LN5
a b b x x x x
a e b c d x e
Я хочу отфильтровать их только с использованием имен столбцов. Это всего лишь подмножество записей 5.4M.