GNU sed версии 4.1.5, похоже, терпит неудачу с международными символами. Вот мой входной файл:
Грас Ох Стенар Трад - от Мои до Миннеаполиса DVD [G2007DVD] 7812 | Икс
Gras Och Stenar Trad - от Möja до Minneapolis DVD [G2007DVD] 7812 | У
(Обратите внимание на умляут во второй строке.)
И когда я делаю
sed '/.* |//'< в
Я ожидал бы увидеть только X и Y, так как я попросил удалить ВСЕ символы до '|' и пространство за его пределами. Вместо этого я получаю:
X
Gras Och Stenar Trad - от M? У
Я знаю, что могу использовать tr для удаления международных символов. во-первых, но есть ли способ использовать sed?