Я сравнивал некоторый код, и я не мог заставить его работать так же быстро, как с java.math.BigInteger, даже если вы используете то же самое алгоритм.
Поэтому я скопировал java.math.BigInteger источник в свой собственный пакет и пробовал это:
//import java.math.BigInteger;
public class MultiplyTest {
    public static void main(String[] args) {
        Random r = new Random(1);
        long tm = 0, count = 0,result=0;
        for (int i = 0; i < 400000; i++) {
            int s1 = 400, s2 = 400;
            BigInteger a = new BigInteger(s1 * 8, r), b = new BigInteger(s2 * 8, r);
            long tm1 = System.nanoTime();
            BigInteger c = a.multiply(b);
            if (i > 100000) {
                tm += System.nanoTime() - tm1;
                count++;
            }
            result+=c.bitLength();
        }
        System.out.println((tm / count) + "nsec/mul");
        System.out.println(result); 
    }
}
Когда я запускаю это (jdk 1.8.0_144-b01 на MacOS), он выдает:
12089nsec/mul
2559044166
Когда я запускаю его с недопустимой линией импорта:
4098nsec/mul
2559044166
Это почти в три раза быстрее при использовании JDK-версии BigInteger по сравнению с моей версией, даже если она использует тот же самый код.
Я изучил байт-код с помощью javap и сравнивал вывод компилятора при работе с параметрами:
-Xbatch -XX:-TieredCompilation -XX:+PrintCompilation -XX:+UnlockDiagnosticVMOptions 
-XX:+PrintInlining -XX:CICompilerCount=1
и обе версии генерируют один и тот же код. То есть точка доступа использует некоторые предварительные вычисления, которые я не могу использовать в своем коде? Я всегда понимал, что они этого не делают. Чем объясняется эта разница?
