Я часто сталкиваюсь с этим настолько, что считаю, что для него должна быть хорошая идиома. Предположим, у меня есть data.frame с кучей атрибутов, включая "продукт". У меня также есть ключ, который переводит продукты на бренд + размер. Код продукта 1-3 - Tylenol, 4-6 - Advil, 7-9 - Bayer, 10-12 - общие.
Какой самый быстрый (с точки зрения человеческого времени) способ кодирования этого?
Я имею тенденцию использовать вложенные ifelse
, если есть 3 или меньше категорий, и введите таблицу данных и объедините их, если их больше 3. Любые лучшие идеи? У Stata есть recode
команда, которая является довольно изящной для такого рода вещей, хотя я считаю, что это продвигает чередование кода данных.
dat <- structure(list(product = c(11L, 11L, 9L, 9L, 6L, 1L, 11L, 5L,
7L, 11L, 5L, 11L, 4L, 3L, 10L, 7L, 10L, 5L, 9L, 8L)), .Names = "product", row.names = c(NA,
-20L), class = "data.frame")