У меня есть вектор x, который я хотел бы сортировать на основе порядка значений в векторе y. Два вектора не имеют одинаковой длины.
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
Ожидаемый результат:
[1] 4 4 4 2 2 1 3 3 3
У меня есть вектор x, который я хотел бы сортировать на основе порядка значений в векторе y. Два вектора не имеют одинаковой длины.
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
Ожидаемый результат:
[1] 4 4 4 2 2 1 3 3 3
Вот один лайнер...
y[sort(order(y)[x])]
[edit:] Это прерывается следующим образом:
order(y) #We want to sort by y, so order() gives us the sorting order
order(y)[x] #looks up the sorting order for each x
sort(order(y)[x]) #sorts by that order
y[sort(order(y)[x])] #converts orders back to numbers from orders
как насчет этого
x[order(match(x,y))]
Вы можете преобразовать x
в упорядоченный множитель:
x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)
Очевидно, что изменение ваших чисел на факторы может радикально изменить способ, с помощью которого код downstream реагирует на x
. Но поскольку вы не дали нам никакого контекста о том, что произойдет дальше, я подумал, что предлагаю это как вариант.
Как??
rep(y,table(x)[as.character(y)])
(Иан, вероятно, еще лучше)
[ Изменить: Ясно, что у меня правильный подход, но я оставлю это для потомков.]
Вы можете сделать это без циклов, индексируя свой вектор y. Добавьте инкрементное числовое значение в y и объедините их:
y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3
В случае, если вам нужно получить ордер на "y" независимо от того, являются ли это номерами или символами:
x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3
По шагам:
a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3
b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9
x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }
Результат в z: 4 4 4 2 2 1 3 3 3
Важные шаги:
для (i в y) - петли над интересующими элементами.
z < - c (z,...) - сворачивает каждое подвыражение в свою очередь
rep (i, sum (x == i)) - повторяет я (текущий элемент интереса) sum (x == i) раз (количество раз, когда мы нашли я в x).
Также вы можете использовать sqldf
и сделать это с помощью функции join
в sql
:
library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))
result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]
цикл по y и переместить все согласованное значение в X, чтобы скорректировать местоположение.