Я ищу способ репликации поведения encode в Stata, который преобразует категориальный столбец строки в числовой столбец.
x = pd.DataFrame({'cat':['A','A','B'], 'val':[10,20,30]})
x = x.set_index('cat')
Результат:
val
cat
A 10
A 20
B 30
Я хотел бы преобразовать столбец cat из строк в целые числа, сопоставляя каждую уникальную строку с (произвольным) целым числом от 1 до 1. Это приведет к:
val
cat
1 10
1 20
2 30
Или, как хорошо:
cat val
0 1 10
1 1 20
2 2 30
Любые предложения?
Большое спасибо, как всегда, Rob