Как выбрать ячейки больше, чем значение в мультииндексе Pandas данных?
Попробуйте 1:
df[ df > 1.0 ]: это вернуло все ячейки в NAN.
Try2:
df.loc[ df > 1.0 ]: это возвращает KeyError: 0
df[df['A']> 1.0]: это работает. Но я хочу применить условие фильтра ко всем столбцам.
Ответ 1
Если то, что вы пытаетесь сделать, это выбрать только строки, в которых любой столбец соответствует этому условию, вы можете использовать DataFrame.any() вместе с axis=1 (для группировки строк). Пример -
In [3]: df
Out[3]:
A B C
0 1 2 3
1 3 4 5
2 3 1 4
In [6]: df[(df <= 2).any(axis=1)]
Out[6]:
A B C
0 1 2 3
2 3 1 4
В качестве альтернативы, если вы пытаетесь фильтровать строки, где все столбцы удовлетворяют условию, используйте .all() на месте .any(). Пример all -
In [8]: df = pd.DataFrame([[1,2,3],[3,4,5],[3,1,4],[1,2,1]],columns=['A','B','C'])
In [9]: df
Out[9]:
A B C
0 1 2 3
1 3 4 5
2 3 1 4
3 1 2 1
In [11]: df[(df <= 2).all(axis=1)]
Out[11]:
A B C
3 1 2 1