Каков наилучший способ, с учетом pandas dataframe, df, получить корреляцию между его столбцами df.1
и df.2
?
Я не хочу, чтобы результат подсчитывал строки с NaN
, что делает pandas
встроенная корреляция. Но я также хочу, чтобы он выводил pvalue
или стандартную ошибку, которая не поддерживается встроенным.
SciPy
, похоже, догнал NaNs, хотя я считаю, что он сообщает о значимости.
Пример данных:
1 2
0 2 NaN
1 NaN 1
2 1 2
3 -4 3
4 1.3 1
5 NaN NaN