Я пытаюсь запустить множественную регрессию OLS, используя statsmodels и pandas dataframe. В разных столбцах для разных строк отсутствуют значения, и я получаю сообщение об ошибке: ValueError: array не должен содержать infs или NaNs Я видел этот SO-вопрос, похожий, но точно не отвечающий на мой вопрос: statsmodel.api.Logit: valueerror array не должен содержать infs или nans
То, что я хотел бы сделать, это запустить регрессию и игнорировать все строки, где отсутствуют переменные для переменных, которые я использую в этой регрессии. Прямо сейчас у меня есть:
import pandas as pd
import numpy as np
import statsmodels.formula.api as sm
df = pd.read_csv('cl_030314.csv')
results = sm.ols(formula = "da ~ cfo + rm_proxy + cpi + year", data=df).fit()
Мне нужно что-то вроде missing = "drop". Любые предложения будут ценны. Большое спасибо.