Я действительно новичок в этом процессе машинного обучения, и я беру онлайн-курс по этому предмету. В этом курсе инструкторы показали следующий фрагмент кода:
imputer = Inputer(missing_values = 'Nan', strategy = 'mean', axis=0)
imputer = Imputer.fit(X[:, 1:3])
X[:, 1:3] = imputer.transform(X[:, 1:3])
Я действительно не понимаю, почему этот объект imputer должен fit
. Я имею в виду, я просто пытаюсь избавиться от недостающих значений в своих столбцах, заменив их на значение столбца. Из того, что я знаю о программировании, это довольно простая итеративная процедура, и нам не понадобится модель, которая должна тренировать данные, которые должны быть выполнены.
Может ли кто-нибудь объяснить, как работает эта машина, и почему она требует обучения для замены некоторых недостающих значений по столбцу? Я прочитал документацию по sci-kit, но он просто показывает, как использовать методы, а не почему они требуются.
Спасибо.