Я запускаю Python 2.7
с установленной библиотекой Pandas 0.11.0
.
Я искал вокруг, не нашел ответа на этот вопрос, поэтому я надеюсь, что кто-то более опытен, чем у меня есть решение.
Допустим, что мои данные в df1 выглядят следующим образом:
df1=
zip x y access
123 1 1 4
123 1 1 6
133 1 2 3
145 2 2 3
167 3 1 1
167 3 1 2
Используя, например, df2 = df1[df1['zip'] == 123]
, а затем df2 = df2.join(df1[df1['zip'] == 133])
я получаю следующий поднабор данных:
df2=
zip x y access
123 1 1 4
123 1 1 6
133 1 2 3
Я хочу сделать следующее:
1) Удалите строки из df1
, поскольку они определены/объединены с df2
ИЛИ
2) После того, как df2
был создан, удалите строки (разность?) из df1
, которые df2
состоят из
Надеюсь, что все это имеет смысл. Пожалуйста, дайте мне знать, если вам нужна дополнительная информация.
EDIT:
В идеале будет создан третий фреймворк, который выглядит так:
df2=
zip x y access
145 2 2 3
167 3 1 1
167 3 1 2
То есть все от df1
не в df2
. Спасибо!