Кодировка символов Eclipse

Я использую Scanner для сканирования документа .txt в Java. Однако, когда я открываю документ .txt в Eclipse, я замечаю, что некоторые символы не распознаются, и они заменяются тем, что выглядит следующим образом:

Эти символы даже не позволяют мне сканировать файл как

    while(scan.hasNext)

автоматически возвращает false (если эти символы не присутствуют, то я могу полностью проверить документ).

Итак, как мне заставить Eclipse распознавать эти символы, чтобы я мог сканировать? Я не могу удалить их вручную, потому что документ довольно большой. Спасибо.

Ответ 1

Файл, который вы читаете, должен содержать UTF-8 или некоторые другие символы кодировки, и когда вы пытаетесь распечатать их на консоли, вы получите некоторые символы как '. Это связано с тем, что стандартная консольная кодировка не является UTF-8 в eclipse. Вам необходимо установить его, выбрав "Выполнить конфигурацию" → "Общие" → "Кодировка" → "Выбрать UTF-8" из раскрывающегося списка. Проверьте снимок экрана:

enter image description here

Ответ 2

Если вам нужно изменить кодировку символов для всей рабочей области Eclipse, перейдите в Window → Preferences. Затем в разделе General → Workspace измените "кодировку текстового файла" на соответствующую кодировку символов (в данном случае UTF-8).

Eclipse Preferences - Changing Character Encoding