Я работаю над проблемой классификации с несбалансированными классами (5% 1). Я хочу предсказать класс, а не вероятность.
В двоичной задаче классификации по умолчанию используется scikit classifier.predict() с помощью 0.5?
Если это не так, то какой метод по умолчанию? Если это так, как мне его изменить?
В scikit некоторые классификаторы имеют параметр class_weight='auto', но не все делают. Если class_weight='auto', будет ли .predict() использовать фактическую долю населения в качестве порога?
Какой способ сделать это в классификаторе типа MultinomialNB, который не поддерживает class_weight? Кроме использования predict_proba(), а затем самостоятельно вычисляйте классы.