Одна из вещей, которые я рассматриваю в большинстве случаев очистки данных, - это отсутствие значений. R имеет дело с этой скважиной, используя метку "Нет данных". В python кажется, что мне придется иметь дело с масками массивов, которые, похоже, являются главной болью для настройки и, похоже, не документированы хорошо. Любые предложения по упрощению этого процесса в Python? Это становится нарушителем транзакций при переходе на Python для анализа данных. Благодаря
Обновить. Очевидно, прошло некоторое время, так как я просмотрел методы в модуле numpy.ma. Похоже, что по крайней мере основные функции анализа доступны для маскированных массивов, а приведенные примеры помогли мне понять, как создавать маскированные маски (спасибо авторам). Я хотел бы узнать, включает ли один из новых статистических методов в Python (разрабатываемый в этом году GSoC) этот аспект и, по крайней мере, делает полный анализ случаев.