Я запускаю Python 2.7 с установленной библиотекой Pandas 0.11.0.
Я искал вокруг, не нашел ответа на этот вопрос, поэтому я надеюсь, что кто-то более опытен, чем у меня есть решение.
Допустим, что мои данные в df1 выглядят следующим образом:
df1=
zip x y access
123 1 1 4
123 1 1 6
133 1 2 3
145 2 2 3
167 3 1 1
167 3 1 2
Используя, например, df2 = df1[df1['zip'] == 123], а затем df2 = df2.join(df1[df1['zip'] == 133]) я получаю следующий поднабор данных:
df2=
zip x y access
123 1 1 4
123 1 1 6
133 1 2 3
Я хочу сделать следующее:
1) Удалите строки из df1, поскольку они определены/объединены с df2
ИЛИ
2) После того, как df2 был создан, удалите строки (разность?) из df1, которые df2 состоят из
Надеюсь, что все это имеет смысл. Пожалуйста, дайте мне знать, если вам нужна дополнительная информация.
EDIT:
В идеале будет создан третий фреймворк, который выглядит так:
df2=
zip x y access
145 2 2 3
167 3 1 1
167 3 1 2
То есть все от df1 не в df2. Спасибо!