Я прочитал из эту документацию, которая:
"Балансировка классов может быть выполнена путем выборки равного количества выборок из каждого класса или, предпочтительно, путем нормализации суммы весов выборки (sample_weight) для каждого класса с тем же значением".
Но мне все еще не ясно, как это работает. Если я установил sample_weight
с массивом из двух возможных значений, 1
и 2
', означает ли это, что образцы с 2
будут отбираться в два раза чаще, чем образцы с 1
при выполнении мешок? Я не могу придумать практический пример этого.