С# Список <double> size vs double [] size

Итак, я просто тестировал CLR Profiler от microsoft, и я сделал небольшую программу, которая создала Список с 1 000 000 удвоений в нем. Я проверил кучу и выяснил, что размер List < > составляет около 124 КБ (я точно не помню, но это было вокруг). Это действительно потрясло мой мир, как это могло быть 124 КБ, если бы в нем было 1 миллион удвоений? Во всяком случае, после этого я решил проверить двойную [1000000]. И к моему удивлению (ну, на самом деле, это не то, чего я ожидал от List < >= P), размер массива - 7,6 МБ. ОГРОМНАЯ разница!

Почему они разные? Как List < > управляет своими элементами, что он (невероятно) эффективен для памяти? Я имею в виду, что это не похоже на то, что остальные 7,5 мб были где-то в другом месте, потому что размер приложения был примерно на 3 или 4 КБ больше после того, как я создал 1 миллион удвоений.

Ответ 1

List<T> использует массив для хранения значений/ссылок, поэтому я сомневаюсь, что там будет какая-то разница в размере, кроме того, что добавляет небольшие накладные расходы List<T>.

С учетом кода ниже

var size = 1000000;
var numbers = new List<double>(size);
for (int i = 0; i < size; i++) {
   numbers.Add(0d);
}

куча выглядит так для соответствующего объекта

0:000> !dumpheap -type Generic.List  
 Address       MT     Size
01eb29a4 662ed948       24     
total 1 objects
Statistics:
      MT    Count    TotalSize Class Name
662ed948        1           24 System.Collections.Generic.List`1[[System.Double,  mscorlib]]
Total 1 objects

0:000> !objsize 01eb29a4    <=== Get the size of List<Double>
sizeof(01eb29a4) =      8000036 (    0x7a1224) bytes     (System.Collections.Generic.List`1[[System.Double, mscorlib]])

0:000> !do 01eb29a4 
Name: System.Collections.Generic.List`1[[System.Double, mscorlib]]
MethodTable: 662ed948
EEClass: 65ad84f8
Size: 24(0x18) bytes
 (C:\Windows\assembly\GAC_32\mscorlib\2.0.0.0__b77a5c561934e089\mscorlib.dll)
Fields:
      MT    Field   Offset                 Type VT     Attr    Value Name
65cd1d28  40009d8        4      System.Double[]  0 instance 02eb3250 _items    <=== The array holding the data
65ccaaf0  40009d9        c         System.Int32  1 instance  1000000 _size
65ccaaf0  40009da       10         System.Int32  1 instance  1000000 _version
65cc84c0  40009db        8        System.Object  0 instance 00000000 _syncRoot
65cd1d28  40009dc        0      System.Double[]  0   shared   static _emptyArray
    >> Domain:Value dynamic statics NYI
 00505438:NotInit  <<

0:000> !objsize 02eb3250 <=== Get the size of the array holding the data
sizeof(02eb3250) =      8000012 (    0x7a120c) bytes (System.Double[])

Итак, List<double> - 8 000 036 байт, а базовый массив - 8 000,012 байта. Это хорошо подходит для обычных 12-разрядных служебных служебных данных для ссылочного типа (Array) и 1 000 000 раз 8 байтов для удвоений. Кроме того, List<T> добавляет еще 24 байта служебных данных для полей, показанных выше.

Заключение. Я не вижу никаких доказательств того, что List<double> займет меньше места, чем double[] для того же количества элементов.

Ответ 2

Обратите внимание, что список динамически растет, обычно удваивая размер каждый раз, когда вы нажимаете размер внутреннего буфера. Следовательно, новый список сначала будет иметь что-то вроде 4-элементного массива, и после добавления первых 4 элементов 5-й элемент вызовет внутреннее перераспределение, удваивающее буфер до (4 * 2).