Я разрабатываю программу, которая должна выполнять тяжелые вычисления линейной алгебры.
Теперь я использую подпрограммы LAPACK/BLAS, но мне нужно использовать мою машину (24-ядерный Xeon X5690).
Я нашел проекты типа pblas и scalapack, но все они, похоже, сосредоточены на распределенных вычислениях и использовании MPI.
У меня нет кластера, все вычисления будут выполняться на одном сервере, а использование MPI выглядит как излишний.
Есть ли у кого-нибудь какие-либо предложения по этому поводу?