Я пытаюсь обнаружить выбросы в моем наборе данных и нахожу лес изоляции Склеарн. Я не могу понять, как с этим работать. Я вписываю в него свои тренировочные данные, и он возвращает мне вектор с -1 и значениями 1.
Может кто-нибудь объяснить мне, как это работает и привести пример?
Как я могу знать, что выбросы являются "реальными" выбросами?
Параметры настройки?
Вот мой код:
clf = IsolationForest(max_samples=10000, random_state=10)
clf.fit(x_train)
y_pred_train = clf.predict(x_train)
y_pred_test = clf.predict(x_test)
[1 1 1 ..., -1 1 1]