Предположим, что у меня есть блок данных со странами, которые идут как:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Я знаю, что есть функция pd.get_dummies, чтобы преобразовать страны в "горячие кодировки". Однако я хочу вместо этого преобразовать их в индексы, чтобы вместо этого получить cc_index = [1,2,1,3]
.
Я предполагаю, что существует более быстрый способ, чем использование get_dummies вместе с предложением numpy where, как показано ниже:
[np.where(x) for x in df.cc.get_dummies().values]
Это немного проще сделать в R, используя "факторы", поэтому я надеюсь, что pandas имеет что-то подобное.