Я использую кодировщик меток для преобразования категориальных данных в числовые значения.
Как LabelEncoder обрабатывает отсутствующие значения?
from sklearn.preprocessing import LabelEncoder
import pandas as pd
import numpy as np
a = pd.DataFrame(['A','B','C',np.nan,'D','A'])
le = LabelEncoder()
le.fit_transform(a)
Вывод:
array([1, 2, 3, 0, 4, 1])
В приведенном выше примере кодер меток изменил значения NaN на категорию. Как я узнаю, какая категория представляет недостающие значения?