Я хочу скопировать данные с отсутствующими столбцами. Сделав это вручную, я бы вычислил расстояние в случае отсутствия столбца просто без этого столбца.
С помощью scikit-learn недостающие данные невозможны. Также нет возможности указать пользовательскую функцию расстояния.
Есть ли вероятность сгруппировать с отсутствующими данными?
Пример данных:
n_samples = 1500
noise = 0.05
X, _ = make_swiss_roll(n_samples, noise)
rnd = np.random.rand(X.shape[0],X.shape[1])
X[rnd<0.1] = np.nan