Удаление элементов из STL, установленных во время итерации

Мне нужно пройти через набор и удалить элементы, которые соответствуют предопределенным критериям.

Это тестовый код, который я написал:

#include <set>
#include <algorithm>

void printElement(int value) {
    std::cout << value << " ";
}

int main() {
    int initNum[] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };
    std::set<int> numbers(initNum, initNum + 10);
    // print '0 1 2 3 4 5 6 7 8 9'
    std::for_each(numbers.begin(), numbers.end(), printElement);

    std::set<int>::iterator it = numbers.begin();

    // iterate through the set and erase all even numbers
    for (; it != numbers.end(); ++it) {
        int n = *it;
        if (n % 2 == 0) {
            // wouldn't invalidate the iterator?
            numbers.erase(it);
        }
    }

    // print '1 3 5 7 9'
    std::for_each(numbers.begin(), numbers.end(), printElement);

    return 0;
}

Сначала я думал, что стирание элемента из набора во время итерации через него приведет к недействительности итератора, а приращение в цикле for будет иметь поведение undefined. Несмотря на это, я выполнил этот тестовый код, и все прошло хорошо, и я не могу объяснить, почему.

Мой вопрос: Является ли это определенным поведением для std-наборов или эта реализация специфична? Кстати, я использую gcc 4.3.3 на ubuntu 10.04 (32-разрядная версия).

Спасибо!

Предлагаемое решение:

Является ли это правильным способом для итерации и стирания элементов из набора?

while(it != numbers.end()) {
    int n = *it;
    if (n % 2 == 0) {
        // post-increment operator returns a copy, then increment
        numbers.erase(it++);
    } else {
        // pre-increment operator increments, then return
        ++it;
    }
}

Изменить: ПРЕДПОЧТИТЕЛЬНОЕ РЕШЕНИЕ

Я придумал решение, которое кажется мне более изящным, хотя он делает то же самое.

while(it != numbers.end()) {
    // copy the current iterator then increment it
    std::set<int>::iterator current = it++;
    int n = *current;
    if (n % 2 == 0) {
        // don't invalidate iterator it, because it is already
        // pointing to the next element
        numbers.erase(current);
    }
}

Если в то время есть несколько условий тестирования, каждый из них должен увеличивать итератор. Мне нравится этот код лучше, потому что итератор увеличивается только в одном месте, делая код менее подверженным ошибкам и более удобочитаемым.

Ответ 1

Это зависит от реализации:

Стандарт 23.1.2.8:

Элементы вставки не должны влиять на действительность итераторов и ссылки на контейнер, а элементы стирания должны делать недействительными только итераторы и ссылки на стертые элементы.

Может быть, вы могли бы попробовать это - это стандартное соответствие:

for (auto it = numbers.begin(); it != numbers.end(); ) {
    if (*it % 2 == 0) {
        numbers.erase(it++);
    }
    else {
        ++it;
    }
}

Обратите внимание, что it++ является постфиксом, поэтому он передает старую позицию для удаления, но сначала переходит к новой позиции из-за оператора.

2015.10.27 обновление: С++ 11 устранил дефект. iterator erase (const_iterator position); вернуть итератор для элемента, который следует за последним удаленным элементом (или set::end, если последний элемент был удален). Итак, стиль С++ 11:

for (auto it = numbers.begin(); it != numbers.end(); ) {
    if (*it % 2 == 0) {
        it = numbers.erase(it);
    }
    else {
        ++it;
    }
}

Ответ 2

Если вы запустите свою программу через valgrind, вы увидите кучу ошибок чтения. Другими словами, да, итераторы недействительны, но вам повезло в вашем примере (или действительно не повезло, так как вы не видите негативных последствий поведения undefined). Одним из решений этого является создание временного итератора, увеличение темпа, удаление целевого итератора, а затем установка цели на временную. Например, перепишите свой цикл следующим образом:

std::set<int>::iterator it = numbers.begin();                               
std::set<int>::iterator tmp;                                                

// iterate through the set and erase all even numbers                       
for ( ; it != numbers.end(); )                                              
{                                                                           
    int n = *it;                                                            
    if (n % 2 == 0)                                                         
    {                                                                       
        tmp = it;                                                           
        ++tmp;                                                              
        numbers.erase(it);                                                  
        it = tmp;                                                           
    }                                                                       
    else                                                                    
    {                                                                       
        ++it;                                                               
    }                                                                       
} 

Ответ 3

Вы неправильно понимаете, что означает "undefined поведение". Поведение Undefined не означает "если вы это сделаете, ваша программа выйдет из строя или приведет к неожиданным результатам". Это означает, что "если вы это сделаете, ваша программа может сработать или произвести неожиданные результаты" или сделать что-нибудь еще, в зависимости от вашего компилятора, вашей операционной системы, фазы луны и т.д.

Если что-то выполняется без сбоев и ведет себя так, как вы ожидаете, это не значит, что это не поведение Undefined. Все это доказывает, что его поведение было таким же, как и для этого конкретного запуска, после компиляции с этим конкретным компилятором в этой конкретной операционной системе.

Удаление элемента из набора делает недействительным итератор для стираемого элемента. Использование недействительного итератора - это поведение Undefined. Так получилось, что наблюдаемое поведение было тем, что вы намеревались в этом конкретном случае; это не значит, что код правильный.

Ответ 4

Просто, чтобы предупредить, что в случае контейнера deque все решения, которые проверяют равенство итератора deque на number.end(), скорее всего, не сработают на gcc 4.8.4. А именно, стирание элемента deque обычно приводит к недействительности указателя на numbers.end():

#include <iostream>
#include <deque>

using namespace std;
int main() 
{

  deque<int> numbers;

  numbers.push_back(0);
  numbers.push_back(1);
  numbers.push_back(2);
  numbers.push_back(3);
  //numbers.push_back(4);

  deque<int>::iterator  it_end = numbers.end();

  for (deque<int>::iterator it = numbers.begin(); it != numbers.end(); ) {
    if (*it % 2 == 0) {
      cout << "Erasing element: " << *it << "\n";
      numbers.erase(it++);
      if (it_end == numbers.end()) {
    cout << "it_end is still pointing to numbers.end()\n";
      } else {
    cout << "it_end is not anymore pointing to numbers.end()\n";
      }
    }
    else {
      cout << "Skipping element: " << *it << "\n";
      ++it;
    }
  }
}

Вывод:

Erasing element: 0
it_end is still pointing to numbers.end()
Skipping element: 1
Erasing element: 2
it_end is not anymore pointing to numbers.end()

Обратите внимание, что хотя преобразование deque верно в этом конкретном случае, конечный указатель был недействительным на этом пути. С deque другого размера ошибка более очевидна:

int main() 
{

  deque<int> numbers;

  numbers.push_back(0);
  numbers.push_back(1);
  numbers.push_back(2);
  numbers.push_back(3);
  numbers.push_back(4);

  deque<int>::iterator  it_end = numbers.end();

  for (deque<int>::iterator it = numbers.begin(); it != numbers.end(); ) {
    if (*it % 2 == 0) {
      cout << "Erasing element: " << *it << "\n";
      numbers.erase(it++);
      if (it_end == numbers.end()) {
    cout << "it_end is still pointing to numbers.end()\n";
      } else {
    cout << "it_end is not anymore pointing to numbers.end()\n";
      }
    }
    else {
      cout << "Skipping element: " << *it << "\n";
      ++it;
    }
  }
}

Вывод:

Erasing element: 0
it_end is still pointing to numbers.end()
Skipping element: 1
Erasing element: 2
it_end is still pointing to numbers.end()
Skipping element: 3
Erasing element: 4
it_end is not anymore pointing to numbers.end()
Erasing element: 0
it_end is not anymore pointing to numbers.end()
Erasing element: 0
it_end is not anymore pointing to numbers.end()
...
Segmentation fault (core dumped)

Вот один из способов исправить это:

#include <iostream>
#include <deque>

using namespace std;
int main() 
{

  deque<int> numbers;
  bool done_iterating = false;

  numbers.push_back(0);
  numbers.push_back(1);
  numbers.push_back(2);
  numbers.push_back(3);
  numbers.push_back(4);

  if (!numbers.empty()) {
    deque<int>::iterator it = numbers.begin();
    while (!done_iterating) {
      if (it + 1 == numbers.end()) {
    done_iterating = true;
      } 
      if (*it % 2 == 0) {
    cout << "Erasing element: " << *it << "\n";
      numbers.erase(it++);
      }
      else {
    cout << "Skipping element: " << *it << "\n";
    ++it;
      }
    }
  }
}

Ответ 5

Это поведение специфично для реализации. Чтобы гарантировать правильность итератора, вы должны использовать "it = numbers.erase(it)"; если вам нужно удалить элемент и просто выполнить итератор в другом случае.

Ответ 6

Я думаю, что использование метода STL ' remove_if ' из может помочь предотвратить некоторые странные проблемы при попытке удалить объект, обернутый итератором.

Это решение может быть менее эффективным.

Допустим, у нас есть какой-то контейнер, например, vector или список с именем m_bullets:

Bullet::Ptr is a shared_pr<Bullet>

' it ' - это итератор, который возвращает ' remove_if ', третий аргумент - это лямбда-функция, которая выполняется для каждого элемента контейнера. Поскольку контейнер содержит Bullet::Ptr, лямбда-функция должна получить этот тип (или ссылку на этот тип) в качестве аргумента.

 auto it = std::remove_if(m_bullets.begin(), m_bullets.end(), [](Bullet::Ptr bullet){
    // dead bullets need to be removed from the container
    if (!bullet->isAlive()) {
        // lambda function returns true, thus this element is 'removed'
        return true;
    }
    else{
        // in the other case, that the bullet is still alive and we can do
        // stuff with it, like rendering and what not.
        bullet->render(); // while checking, we do render work at the same time
        // then we could either do another check or directly say that we don't
        // want the bullet to be removed.
        return false;
    }
});
// The interesting part is, that all of those objects were not really
// completely removed, as the space of the deleted objects does still 
// exist and needs to be removed if you do not want to manually fill it later 
// on with any other objects.
// erase dead bullets
m_bullets.erase(it, m_bullets.end());

" remove_if " удаляет контейнер, в котором лямбда-функция вернула истину, и перемещает это содержимое в начало контейнера. " it " указывает на неопределенный объект, который можно считать мусором. Объекты от 'it' до m_bullets.end() могут быть удалены, так как они занимают память, но содержат мусор, поэтому в этом диапазоне вызывается метод 'erase'.

Ответ 7

С++ 20 будет иметь "равномерное стирание контейнера", и вы сможете написать:

std::erase_if(numbers, [](int n){ return n % 2 == 0 });

И это будет работать для vector, set, deque и т.д. См. CppReference для получения дополнительной информации.

Ответ 8

Я столкнулся с той же самой старой проблемой и нашел ниже код более понятным, который в некотором смысле соответствует вышеуказанным решениям.

std::set<int*>::iterator beginIt = listOfInts.begin();
while(beginIt != listOfInts.end())
{
    // Use your member
    std::cout<<(*beginIt)<<std::endl;

    // delete the object
    delete (*beginIt);

    // erase item from vector
    listOfInts.erase(beginIt );

    // re-calculate the begin
    beginIt = listOfInts.begin();
}