В чем разница между Pandas и NumPy + SciPy в Python?

Оба они кажутся чрезвычайно похожими, и мне любопытно, какой пакет будет более полезен для анализа финансовых данных.

Ответ 1

Действительно, pandas предоставляет инструменты обработки данных высокого уровня, созданные на основе NumPy. NumPy сам по себе является довольно низкоуровневым инструментом и будет очень похож на использование MATLAB. pandas, с другой стороны, обеспечивает богатую функциональность временных рядов, выравнивание данных, удобную для пользователя статистику, методы группировки, объединения и объединения и множество других удобств. В последние годы он стал очень популярным в финансовых приложениях. У меня будет глава, посвященный анализу финансовых данных, используя pandas в моей будущей книге.

Ответ 2

Нумеру требуется pandas (и практически всеми численными инструментами для Python). Scipy строго не требуется для pandas, но указан как "необязательная зависимость". Я бы не сказал, что pandas является альтернативой Numpy и/или Scipy. Скорее, это дополнительный инструмент, который обеспечивает более оптимизированный способ работы с числовыми и табличными данными в Python. Вы можете использовать структуры данных pandas, но свободно использовать функции Numpy и Scipy для их управления.

Ответ 3

Pandas предлагают отличный способ манипулирования таблицами, так как вы можете легко сделать binning (binning dataframe в pandas в Python) и рассчитать статистику. Другое замечание в pandas - это класс Panel, в котором вы можете присоединиться к серии слоев с различными свойствами и объединить их с помощью функции groupby.