У меня есть программа на С++, которая может быть распараллелена. Я использую компиляцию Visual Studio 2010, 32bit.
Короче, структура программы следующая
#define num_iterations 64 //some number
struct result
{
//some stuff
}
result best_result=initial_bad_result;
for(i=0; i<many_times; i++)
{
result *results[num_iterations];
for(j=0; j<num_iterations; j++)
{
some_computations(results+j);
}
// update best_result;
}
Поскольку каждый some_computations()
является независимым (некоторые глобальные переменные считаются, но не изменяются глобальные переменные), я распараллеливал внутренний for
-loop.
Моя первая попытка заключалась в boost:: thread,
thread_group group;
for(j=0; j<num_iterations; j++)
{
group.create_thread(boost::bind(&some_computation, this, result+j));
}
group.join_all();
Результаты были хорошими, но я решил попробовать больше.
Я попробовал библиотеку OpenMP
#pragma omp parallel for
for(j=0; j<num_iterations; j++)
{
some_computations(results+j);
}
Результаты были хуже, чем boost::thread
.
Затем я попробовал библиотеку ppl и использовал parallel_for()
:
Concurrency::parallel_for(0,num_iterations, [=](int j) {
some_computations(results+j);
})
Результаты были самыми плохими.
Я нашел это поведение совершенно неожиданным. Поскольку OpenMP и ppl предназначены для распараллеливания, я ожидал бы лучших результатов, чем boost::thread
. Я не прав?
Почему boost::thread
дает мне лучшие результаты?