Windows C Runtime toupper медленнее, когда набор локалей

Я диагностирую кросс-кейс в кросс-платформенном (Windows и Linux) приложении, где toupper существенно медленнее в Windows. Я предполагаю, что это то же самое для tolower.

Изначально я тестировал это с помощью простой программы на каждом из них без информации о локали, или даже включая заголовочный файл, и было очень мало разницы в производительности. Тест был миллион циклов итерации, вызывающий каждый символ для строки функции toupper().

После включения файла заголовка и включения строки ниже он намного медленнее и вызывает множество функций локали библиотеки времени выполнения MS C. Это прекрасно, но удар производительности очень плох. В Linux это никак не влияет на производительность.

setlocale(LC_ALL, ""); // system default locale

Если я устанавливаю следующее, он выполняется так же быстро, как linux, но, похоже, пропускает все языковые функции.

setlocale(LC_ALL, NULL); // should be interpreted as the same as below?
OR
setlocale(LC_ALL, "C");

Примечание: Visual Studio 2015 для Windows 10 g++ для Linux работает Cent OS

Попробовали настройки параметров голландского языка и тот же результат, медленный на Windows, не разница в скорости на Linux.

Я делаю что-то неправильно или есть ошибка с настройками языкового стандарта в Windows или это другой способ, которым Linux не делает то, что должен? Я не отлаживал приложение linux, поскольку я не так хорошо знаком с Linux, поэтому не знаю точно, что он делает внутри. Что я должен проверить после сортировки?

Код ниже для тестирования (Linux):

// C++ is only used for timing.  The original program is in C.
#include <stdio.h>
#include <stdlib.h>
#include <ctype.h>
#include <chrono>
#include <locale.h>

using namespace std::chrono;

void strToUpper(char *strVal);

int main()
{

    typedef high_resolution_clock Clock;
    high_resolution_clock::time_point t1 = Clock::now();

    // set locale
    //setlocale(LC_ALL,"nl_NL");
    setlocale(LC_ALL,"en_US");

    // testing string
    char str[] = "the quick brown fox jumps over the lazy dog";

    for (int i = 0; i < 1000000; i++)
    {
        strToUpper(str);
    }

    high_resolution_clock::time_point t2 = Clock::now();
    duration<double> time_span = duration_cast<duration<double>>(t2 - t1);
    printf("chrono time %2.6f:\n",time_span.count());
}

void strToUpper(char *strVal)
{
    unsigned char *t;
    t = (unsigned char *)strVal;

    while (*t)
    {
        *t = toupper(*t);
        *t++;
    }
}

Для окон изменить локальную информацию на:

// set locale
//setlocale(LC_ALL,"nld_nld");
setlocale(LC_ALL, "english_us");

Вы можете увидеть изменение локали из разделителя в завершенное время, полная остановка против запятой.

EDIT - данные профилирования Как вы можете видеть, большую часть времени, проведенного в дочерних системных вызовах от _toupper_l. Без информации о языковой настройке вызов toupper НЕ вызывает дочернего _toupper_l, что делает его очень быстрым.

## disassembly from objconv -fyasm -v2 /lib/x86_64-linux-gnu/libc.so.6 /dev/stdout 2>&1 toupper: lea edx, [rdi+80H] ; 0002E300 _ 8D. 97, 00000080 movsxd rax, edi ; 0002E306 _ 48: 63. C7 cmp edx, 383 ; 0002E309 _ 81. FA, 0000017F ja ?_01766 ; 0002E30F _ 77, 19 mov rdx, qword [rel ?_37923] ; 0002E311 _ 48: 8B. 15, 00395AA8(rel) sub rax, -128 ; 0002E318 _ 48: 83. E8, 80 mov rdx, qword [fs:rdx] ; 0002E31C _ 64 48: 8B. 12 mov rdx, qword [rdx] ; 0002E320 _ 48: 8B. 12 mov rdx, qword [rdx+48H] ; 0002E323 _ 48: 8B. 52, 48 mov eax, dword [rdx+rax*4] ; 0002E327 _ 8B. 04 82 ## the final table lookup, indexing an array of 4B ints ?_01766: rep ret ; actual objconv output shows the prefix on a separate line

Ответ 1