Пока я придумал три решения:
Функции крайне неэффективной стандартной библиотеки pow
и log2
int_fast16_t powlog(uint_fast16_t n)
return static_cast<uint_fast16_t>(pow(2, floor(log2(n))));
Более эффективный подсчет последующих степеней 2 до тех пор, пока я не достиг большего числа, чем я должен был достичь:
uint_fast16_t multiply(uint_fast16_t n)
uint_fast16_t maxpow = 1;
while(2*maxpow <= n)
maxpow *= 2;
return maxpow;
Самый эффективный до сих пор поисковый вызов предварительно вычисленной таблицы степеней 2:
uint_fast16_t binsearch(uint_fast16_t n)
static array<uint_fast16_t, 20> pows {1,2,4,8,16,32,64,128,256,512,
return *(upper_bound(pows.begin(), pows.end(), n)-1);
Может ли это быть оптимизировано еще больше? Какие трюки можно использовать здесь?
Полный бенчмарк, который я использовал:
#include <iostream>
#include <chrono>
#include <cmath>
#include <cstdint>
#include <array>
#include <algorithm>
using namespace std;
using namespace chrono;
uint_fast16_t powlog(uint_fast16_t n)
return static_cast<uint_fast16_t>(pow(2, floor(log2(n))));
uint_fast16_t multiply(uint_fast16_t n)
uint_fast16_t maxpow = 1;
while(2*maxpow <= n)
maxpow *= 2;
return maxpow;
uint_fast16_t binsearch(uint_fast16_t n)
static array<uint_fast16_t, 20> pows {1,2,4,8,16,32,64,128,256,512,
return *(upper_bound(pows.begin(), pows.end(), n)-1);
high_resolution_clock::duration test(uint_fast16_t(powfunct)(uint_fast16_t))
auto tbegin = high_resolution_clock::now();
volatile uint_fast16_t sink;
for(uint_fast8_t i = 0; i < UINT8_MAX; ++i)
for(uint_fast16_t n = 1; n <= 999999; ++n)
sink = powfunct(n);
auto tend = high_resolution_clock::now();
return tend - tbegin;
int main()
cout << "Pow and log took " << duration_cast<milliseconds>(test(powlog)).count() << " milliseconds." << endl;
cout << "Multiplying by 2 took " << duration_cast<milliseconds>(test(multiply)).count() << " milliseconds." << endl;
cout << "Binsearching precomputed table of powers took " << duration_cast<milliseconds>(test(binsearch)).count() << " milliseconds." << endl;
Скомпилированный с помощью -O2
, это дало следующие результаты на моем ноутбуке:
Pow and log took 19294 milliseconds.
Multiplying by 2 took 2756 milliseconds.
Binsearching precomputed table of powers took 2278 milliseconds.