Cout << setw не правильно выравнивается с åäö

Следующий код воспроизводит мою проблему:

#include <iostream>
#include <iomanip>
#include <string>

void p(std::string s, int w)
{
   std::cout << std::left << std::setw(w) << s;
}

int main(int argc, char const *argv[])
{
   p("COL_A", 7);
   p("COL_B", 7);
   p("COL_C", 5);
   std::cout << std::endl;
   p("ABC", 7);
   p("ÅÄÖ", 7);
   p("ABC", 5);
   std::cout << std::endl;
   return 0;
}

Это приводит к следующему выводу:

COL_A  COL_B  COL_C
ABC    ÅÄÖ ABC

Если я изменяю "ÅÄÖ" в коде, например, "ABC", затем он работает:

COL_A  COL_B  COL_C
ABC    ABC    ABC  

Почему это происходит?

Ответ 1

Наряду с наложением std::cout на правильный язык, вам, вероятно, придется переключиться на широкие строки. Например:

void p(std::wstring s, int w)
{
   std::wcout << std::left << std::setw(w) << s;
}

int main(int argc, char const *argv[])
{
   std::locale loc("en_US.UTF-8");
   std::wcout.imbue(loc);

   p(L"COL_A", 7);
   p(L"COL_B", 7);
   p(L"COL_C", 5);
   std::wcout << std::endl;
   p(L"ABC", 7);
   p(L"ÅÄÖ", 7);
   p(L"ABC", 5);
   std::wcout << std::endl;
   return 0;
}

Демо

Ответ 2

Это происходит потому, что эти символы (Ä,...,...) являются символами Юникода, которые, вероятно, кодируются в UTF-8. Это означает, что каждый символ занимает несколько байтов (два в вашем случае, до четырех в общем случае). setw OTOH не знает о UTF-8 - он просто подсчитывает и, таким образом, выравнивает байты.

Ответ 3

Проблема заключается в том, что ваш исходный код, безусловно, хранится в UTF8, что означает 2 байта для каждой буквы ÅÄÖ, а языковой стандарт для cout не установлен соответствующим образом.

Следовательно, ваш cout считает, что он выводит 3x2 = 6 символов и добавляет только одно пространство для достижения ожидаемого 7. Измените язык с помощью функции imbue(), чтобы установить его в UTF8.