Новое для Python.
В R вы можете получить размерность матрицы, используя dim (...). Какова соответствующая функция в Python Pandas для их кадра данных?
Новое для Python.
В R вы можете получить размерность матрицы, используя dim (...). Какова соответствующая функция в Python Pandas для их кадра данных?
 df.shape, где df - ваш DataFrame.
Существует несколько способов получить информацию об атрибутах вашего DataFrame или Series.
Создать образец DataFrame и Series
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
     a  b
0  5.0  9
1  2.0  2
2  NaN  4
s = df['a']
s
0    5.0
1    2.0
2    NaN
Name: a, dtype: float64
shape АтрибутАтрибут shape возвращает двоичный набор из числа строк и количество столбцов в DataFrame. Для серии он возвращает кортеж из одного элемента.
df.shape
(3, 2)
s.shape
(3,)
len функцияЧтобы получить количество строк DataFrame или получить длину серии, используйте функцию len. Будет возвращено целое число.
len(df)
3
len(s)
3
size атрибутЧтобы получить общее количество элементов в DataFrame или Series, используйте атрибут size. Для DataFrames это произведение количества строк и количества столбцов. Для серии это будет эквивалентно функции len:
df.size
6
s.size
3
ndim атрибутАтрибут ndim возвращает количество измерений вашего DataFrame или Series. Он всегда будет 2 для DataFrames и 1 для серии:
df.ndim
2
s.ndim
1
countМетод count может использоваться для возврата количества не пропущенных значений для каждого столбца/строки DataFrame. Это может быть очень запутанным, потому что большинство людей обычно думают о подсчете как о длине каждой строки, а это не так. Когда вызывается в DataFrame, возвращается строка с именами столбцов в индексе и количеством не пропущенных значений в качестве значений.
df.count() # by default, get the count of each column
a    2
b    3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0    2
1    2
2    1
dtype: int64
Для серии существует только одна ось для вычисления, и поэтому она просто возвращает скаляр:
s.count()
2
info для извлечения метаданныхМетод info возвращает количество непустых значений и типов данных для каждого столбца
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
		Форма dataframe находится в виде столбцов строк *, поэтому функция поиска формы
dataframe_name.shape()