У меня есть следующие данные со всеми категориальными переменными:
class education income social_standing
1 basic low good
0 low high V_good
1 high low not_good
0 v_high high good
Здесь образование имеет четыре уровня (базовый, низкий, высокий и v_high). доход имеет два уровня низкого и высокого уровня; и social_standing имеет три уровня (хороший, v_good и not_good).
В том, что касается моего понимания преобразования указанных данных в формат VW, это будет примерно так:
1 |person education_basic income_low social_standing_good
0 |person education_low income_high social_standing_v_good
1 |person education_high income_low social_standing_not_good
0 |person education_v_high income_high social_standing_good
Здесь "человек" - это пространство имен, а все остальные - значения признаков, префиксные соответствующими именами функций. Я прав? Каким-то образом это представление значений признаков довольно озадачивает меня. Есть ли другой способ представления функций? Будем благодарны за помощь.