Я совершенно не знаком с машинным обучением, и я работаю с неконтролируемой методикой обучения.
Изображение показывает мой образец данных (после очистки) Скриншот: пример данных
У меня есть два построенных канала для очистки данных:
num_attribs = list(housing_num)
cat_attribs = ["ocean_proximity"]
print(type(num_attribs))
num_pipeline = Pipeline([
('selector', DataFrameSelector(num_attribs)),
('imputer', Imputer(strategy="median")),
('attribs_adder', CombinedAttributesAdder()),
('std_scaler', StandardScaler()),
])
cat_pipeline = Pipeline([
('selector', DataFrameSelector(cat_attribs)),
('label_binarizer', LabelBinarizer())
])
Затем я сделал объединение этих двух конвейеров, и код для этого показан ниже:
from sklearn.pipeline import FeatureUnion
full_pipeline = FeatureUnion(transformer_list=[
("num_pipeline", num_pipeline),
("cat_pipeline", cat_pipeline),
])
Теперь я пытаюсь сделать fit_transform на Data But It, показывая мне ошибку.
Код для трансформации:
housing_prepared = full_pipeline.fit_transform(housing)
housing_prepared
Сообщение об ошибке: fit_transform() принимает 2 позиционных аргумента, но 3 даны