Несколько недель назад я задал вопрос о производительности матричного умножения.
Мне сказали, что для повышения производительности моей программы я должен использовать некоторые специализированные классы матриц, а не свой собственный класс.
Рекомендуемые пользователи StackOverflow:
- uBLAS
- Эйген
- BLAS
Сначала мне захотелось использовать uBLAS, но, читая документацию, оказалось, что эта библиотека не поддерживает умножение матричной матрицы.
В конце концов я решил использовать библиотеку EIGEN. Поэтому я обменял свой класс матрицы на Eigen::MatrixXd
- однако оказалось, что теперь мое приложение работает еще медленнее, чем раньше.
Время до использования EIGEN составляло 68 секунд, и после замены моего матричного класса на EIGEN матричная программа запускалась в течение 87 секунд.
Части программы, которые занимают больше всего времени, выглядят так:
TemplateClusterBase* TemplateClusterBase::TransformTemplateOne( vector<Eigen::MatrixXd*>& pointVector, Eigen::MatrixXd& rotation ,Eigen::MatrixXd& scale,Eigen::MatrixXd& translation )
{
for (int i=0;i<pointVector.size();i++ )
{
//Eigen::MatrixXd outcome =
Eigen::MatrixXd outcome = (rotation*scale)* (*pointVector[i]) + translation;
//delete prototypePointVector[i]; // ((rotation*scale)* (*prototypePointVector[i]) + translation).ConvertToPoint();
MatrixHelper::SetX(*prototypePointVector[i],MatrixHelper::GetX(outcome));
MatrixHelper::SetY(*prototypePointVector[i],MatrixHelper::GetY(outcome));
//assosiatedPointIndexVector[i] = prototypePointVector[i]->associatedTemplateIndex = i;
}
return this;
}
и
Eigen::MatrixXd AlgorithmPointBased::UpdateTranslationMatrix( int clusterIndex )
{
double membershipSum = 0,outcome = 0;
double currentPower = 0;
Eigen::MatrixXd outcomePoint = Eigen::MatrixXd(2,1);
outcomePoint << 0,0;
Eigen::MatrixXd templatePoint;
for (int i=0;i< imageDataVector.size();i++)
{
currentPower =0;
membershipSum += currentPower = pow(membershipMatrix[clusterIndex][i],m);
outcomePoint.noalias() += (*imageDataVector[i] - (prototypeVector[clusterIndex]->rotationMatrix*prototypeVector[clusterIndex]->scalingMatrix* ( *templateCluster->templatePointVector[prototypeVector[clusterIndex]->assosiatedPointIndexVector[i]]) ))*currentPower ;
}
outcomePoint.noalias() = outcomePoint/=membershipSum;
return outcomePoint; //.ConvertToMatrix();
}
Как видите, эти функции выполняют множество операций с матрицей. Вот почему я подумал, что использование Eigen ускорит мое приложение. К сожалению (как я уже упоминал выше), программа работает медленнее.
Есть ли способ ускорить эти функции?
Может быть, если бы я использовал операции с матрицей DirectX, я бы получил лучшую производительность? (однако у меня есть ноутбук со встроенной графической картой).