Преобразование из строки в wstring приводит к тому, что ú теряет кодировку

Переменная filepath, которая является string, содержит значение Música. У меня есть следующий код:

wstring fp(filepath.length(), L' ');
copy(filepath.begin(), filepath.end(), fp.begin());

fp затем содержит значение M?sica. Как преобразовать filepath в fp без потери кодировки для символа ú?

Ответ 1

Используйте функцию MultiByteToWideChar.

Пример кода:

std::string toStdString(const std::wstring& s, UINT32 codePage)
{
    unsigned int bufferSize = (unsigned int)s.length()+1;
    char* pBuffer = new char[bufferSize];
    memset(pBuffer, 0, bufferSize);
    WideCharToMultiByte(codePage, 0, s.c_str(), (int)s.length(), pBuffer, bufferSize, NULL, NULL);
    std::string retVal = pBuffer;
    delete[] pBuffer;
    return retVal;
}

std::wstring toStdWString(const std::string& s, UINT32 codePage)
{
    unsigned int bufferSize = (unsigned int)s.length()+1;
    WCHAR* pBuffer = new WCHAR[bufferSize];
    memset(pBuffer, 0, bufferSize*sizeof(WCHAR));
    MultiByteToWideChar(codePage, 0, s.c_str(), (int)s.length(), pBuffer, bufferSize);
    std::wstring retVal = pBuffer;
    delete[] pBuffer;
    return retVal;
}

Ответ 2

Поскольку вы используете MFC, у вас есть доступ к ATL String Conversion Macros.

Это значительно упрощает преобразование и использует MultiByteToWideChar. Предполагая, что filepath закодирован на вашей системной странице кода по умолчанию, это должно сделать трюк:

CA2W wideFilepath(filepath.c_str());
wstring fp(static_cast<const wchar_t*>(wideFilepath));

Если filepath не находится на вашей системной странице кода по умолчанию (скажем, в UTF-8), вы можете указать кодировку для преобразования из:

CA2W wideFilepath(filepath.c_str(), CP_UTF8);
wstring fp(static_cast<const wchar_t*>(wideFilepath));

Чтобы преобразовать другой путь: от std::wstring до std::string, вы сделаете следующее:

// Convert from wide (UTF-16) to UTF-8
CW2A utf8Filepath(fp.c_str(), CP_UTF8);
string utf8Fp(static_cast<const char*>(utf8Filepath));

// Or, convert from wide (UTF-16) to your system default code page.
CW2A narrowFilepath(fp.c_str(), CP_UTF8);
string narrowFp(static_cast<const char*>(narrowFilepath));