У меня есть кадр данных pandas
, и я хотел бы предсказать значения столбца A из значений в столбцах B и C. Вот пример игрушки:
import pandas as pd
df = pd.DataFrame({"A": [10,20,30,40,50],
"B": [20, 30, 10, 40, 50],
"C": [32, 234, 23, 23, 42523]})
В идеале, у меня было бы что-то вроде ols(A ~ B + C, data = df)
, но когда я смотрю examples из библиотек алгоритмов, таких как scikit-learn
, он появляется для подачи данных в модель со списком строк вместо столбцов. Это потребовало бы, чтобы я переформатировал данные в списки внутри списков, что, по-видимому, преследует цель использования pandas в первую очередь. Какой самый pythonic способ запустить регрессию OLS (или любой алгоритм машинного обучения в целом) по данным в фрейме данных pandas?