В pandas, учитывая DataFrame D:
+-----+--------+--------+--------+
| | 1 | 2 | 3 |
+-----+--------+--------+--------+
| 0 | apple | banana | banana |
| 1 | orange | orange | orange |
| 2 | banana | apple | orange |
| 3 | NaN | NaN | NaN |
| 4 | apple | apple | apple |
+-----+--------+--------+--------+
Как вернуть строки, которые имеют одинаковое содержимое во всех своих столбцах, когда есть три столбца или больше, что возвращает это:
+-----+--------+--------+--------+
| | 1 | 2 | 3 |
+-----+--------+--------+--------+
| 1 | orange | orange | orange |
| 4 | apple | apple | apple |
+-----+--------+--------+--------+
Обратите внимание, что он пропускает строки, когда все значения являются NaN.
Если это были только два столбца, я обычно делаю D[D[1]==D[2]]
, но я не знаю, как это обобщать для более чем двух столбцов DataFrames.