Мне нужно создать новый фрейм данных nDF, который будет бинарировать все категориальные переменные и в то же время сохраняет все остальные переменные в кадре данных DF. Например, у меня есть следующие переменные функции: RACE (4 типа) и AGE, а выходная переменная называется CLASS.
DF =
RACE AGE (BELOW 21) CLASS Case 1 HISPANIC 0 A Case 2 ASIAN 1 A Case 3 HISPANIC 1 D Case 4 CAUCASIAN 1 B
Я хочу преобразовать это в nDF с пятью (5) переменными или четырьмя (4) четными:
RACE.1 RACE.2 RACE.3 AGE (BELOW 21) CLASS Case 1 0 0 0 0 A Case 2 0 0 1 1 A Case 3 0 0 0 1 D Case 4 0 1 0 1 B
Я знаком с контрастом обработки с переменной DF $RACE. Однако, если я реализую
contrasts(DF$RACE) = contr.treatment(4)
то, что я получаю, по-прежнему является DF трех переменных, но с переменной DF $RACE, имеющей атрибут "контрасты".
В конечном итоге я хочу, чтобы это был новый кадр данных nDF, как показано выше, но который может быть очень утомительным для оценки того, имеет ли около 50 функциональных переменных, из которых более пяти (5) из них являясь категориальными переменными.