Почему Groovy Карта масштабируется лучше, чем Array?

Сегодня я пришел в эту проблему, и я не мог понять, почему массив groovy не масштабируется лучше, чем Map, когда он становится больше.

В моем примере я создаю Map (LinkedHashMap) и массив String (String []). Затем я повторяю от 0 до 10 ^ 7, вставляя я в Map или Array. Я делаю это 10 раз, чтобы убедиться, что выбросы не испортили результаты.

int max = 10**7
int numTests = 10

long totalTimeMap = 0
long totalTimeArray = 0

numTests.times{
    long start = System.currentTimeMillis()

    Map m = [:]
    max.times {
        m[it] = "${it}"
    }

    long end = System.currentTimeMillis()
    totalTimeMap += (end-start)
}

numTests.times {
    long start = System.currentTimeMillis()

    String[] s = new String[max]
    max.times{
        s[it] = "${it}"
    }

    long end = System.currentTimeMillis()
    totalTimeArray += (end-start)
}

println "Map: ${totalTimeMap}"
println "Array: ${totalTimeArray}"

Результат был неожиданным, так как карта имела более высокую производительность, чем массив:

Map: 49361
Array: 101123

Я сделал тот же эксперимент в java:

public static void main(String[] args) {

        int max = 10000000;
        int numTests = 10;

        long totalTimeMap = 0;
        long totalTimeArray = 0;

        for(int i=0; i<numTests; i++){
            long start = System.currentTimeMillis();

            Map m = new LinkedHashMap();
            for(int j=0; j<max; j++){
                m.put(j, "" + j);
            }

            long end = System.currentTimeMillis();
            totalTimeMap += (end-start);
        }

        for(int i=0; i<numTests; i++){
            long start = System.currentTimeMillis();

            String[] s = new String[max];
            for(int j=0; j<max; j++){
                s[j] = "" + j;
            }

            long end = System.currentTimeMillis();
            totalTimeArray += (end-start);
        }

        System.out.println("Map: " + totalTimeMap);
        System.out.println("Array: " + totalTimeArray);
    }

и ожидалось (Массив быстрее Map):

Map: 34564
Array: 12822

Мой вопрос: почему Карта работает быстрее, чем Массив при использовании Groovy?

Ответ 1

Когда вы добавляете String в массив в Groovy, вы создаете шаблонную строку String, которая затем преобразуется обратно в строку java (после выполнения шаблона), поскольку она должна вписываться в String[]

Для версии Map вы просто храните шаблонную строку, поэтому никакая оценка не требуется...

Следующий код бенчмаркинга:

@Grab('org.gperfutils:gbench:0.4.3-groovy-2.4')

int max = 10000

new groovyx.gbench.BenchmarkBuilder().run {
    'Array' {
        String[] s = new String[max]
        max.times { int idx ->
            s[idx] = Integer.toString(idx)
        }  
    }
    'List' {
        def s = []
        max.times{
            s << "${it}"
        }  
    }
    'Map' {
        Map m = [:]
        max.times {
            m[it] = "${it}"
        }
    }
}.prettyPrint()

Где мы не используем GroovyStrings в методе Array, дает мне результат:

* Groovy: 2.4.3
* JVM: Java HotSpot(TM) 64-Bit Server VM (25.45-b02, Oracle Corporation)
    * JRE: 1.8.0_45
    * Total Memory: 800.5 MB
    * Maximum Memory: 1820.5 MB
* OS: Mac OS X (10.10.3, x86_64)

Options
=======
* Warm Up: Auto (- 60 sec)
* CPU Time Measurement: On

          user  system      cpu     real

Array  1819502    6491  1825993  1833209
List   1697948    6533  1704481  1724448
Map    2040521    8932  2049453  2116760