Как заменить новую строку (\n) с помощью sed?

Как заменить новую строку ("\n") пробелом ("") с помощью команды sed?

Я безуспешно пытался:

sed 's#\n# #g' file
sed 's#^$# #g' file

Как мне это исправить?

Ответ 1

Используйте это решение с GNU sed:

sed ':a;N;$!ba;s/\n/ /g' file

Это прочитает весь файл в цикле, а затем заменит символы новой строки пробелом.

Объяснение:

Создать ярлык через :a.
Добавьте текущую и следующую строку в пространство шаблона через N
Если мы находимся перед последней строкой, переходите к созданной метке $!ba ($! Означает не делать это в последней строке, так как должен быть один последний символ новой строки).
Наконец, подстановка заменяет каждую новую строку пробелом в пространстве образца (который является целым файлом).

Вот кросс-платформенный совместимый синтаксис, который работает с BSD и OS X sed (согласно комментарию @Benjie):

sed -e ':a' -e 'N' -e '$!ba' -e 's/\n/ /g' file

Как видите, использование sed для решения этой простой проблемы проблематично. Для более простого и адекватного решения см. Этот ответ.

Ответ 2

sed предназначен для использования на линейном вводе. Хотя он может делать то, что вам нужно.

Лучшим вариантом здесь является использование команды tr следующим образом:

tr '\n' ' ' < input_filename

или полностью удалите символы новой строки:

tr -d '\n' < input.txt > output.txt

или если у вас есть версия GNU (с ее длинными опциями)

tr --delete '\n' < input.txt > output.txt

Ответ 3

Быстрый ответ:

sed ':a;N;$!ba;s/\n/ /g' file

: a создать ярлык 'a'
N добавьте следующую строку в пространство шаблонов
$!, если не последняя строка, ba ветвь (перейдите на) label 'a'
s, /\n/ регулярное выражение для новой строки, // пробелом, /g глобальное соответствие (столько раз, сколько может)

sed будет проходить через шаг 1 до 3, пока не достигнет последней строки, получив все строки в пространстве шаблонов, где sed заменит все \n символы

Альтернативы

Все альтернативы, в отличие от sed, не нуждаются в достижении последней строки, чтобы начать процесс

с bash, медленным

while read line; do printf "%s" "$line "; done < file

с perl, sed-like speed

perl -p -e 's/\n/ /' file

с tr, быстрее, чем sed, может заменить только один символ

tr '\n' ' ' < file

с вставкой, tr-like speed, может заменяться только на один символ

paste -s -d ' ' file

с awk, tr-like speed

awk 1 ORS=' ' file

Другая альтернатива, например "echo $(< file)", работает медленно, работает только с небольшими файлами и требует обработки всего файла, чтобы начать процесс.

Длинный ответ из sed FAQ 5.10:

5,10. Почему я не могу сопоставить или удалить новую строку с помощью \n escape последовательность? Почему я не могу сопоставить 2 или более строк с помощью \n?

\n никогда не будет соответствовать новой строке в конце строки, потому что newline всегда удаляется до того, как линия будет помещена в пространство рисунка. Чтобы получить 2 или более строк в пространстве шаблонов, используйте команда "N" или что-то подобное (например, "H;...; g;" ).

Sed работает так: sed читает по одной строке за раз, отбивает завершение новой строки, помещает то, что осталось в пространстве шаблонов, где sed script может адресовать или изменить его, а когда пространство рисунка
, добавляет новую строку в stdout (или в файл). Если пространство шаблонов полностью или частично удаляется с помощью "d" или "D", Новая строка не добавляется в таких случаях. Таким образом, скрипты типа

  sed 's/\n//' file       # to delete newlines from each line             
  sed 's/\n/foo\n/' file  # to add a word to the end of each line

НИКОГДА не будет работать, потому что конечная новая строка будет удалена до того, как строка помещается в пространство рисунка. Выполнение вышеуказанных задач,
вместо этого используйте один из этих сценариев:

  tr -d '\n' < file              # use tr to delete newlines              
  sed ':a;N;$!ba;s/\n//g' file   # GNU sed to delete newlines             
  sed 's/$/ foo/' file           # add "foo" to end of each line

Так как версии sed, отличные от GNU sed, имеют ограничения по размеру буфер шаблонов, утилита Unix 'tr' здесь предпочтительнее.
Если последняя строка файла содержит новую строку, GNU sed добавит что новая строка выводится, но удаляет все остальные, тогда как tr будет удалить все новые строки.

Чтобы соответствовать блоку из двух или более строк, существует 3 основных варианта:
(1) используйте команду "N" , чтобы добавить следующую строку в пространство шаблона,
(2) используйте команду "H", по крайней мере, дважды, чтобы добавить текущую строку
в пространство удержания, а затем извлеките линии из удержания пространства
с x, g или G; или (3) использовать диапазоны адресов (см. раздел 3.3 выше)
для соответствия строк между двумя указанными адресами.

Варианты (1) и (2) помещают \n в пространство шаблонов, где он могут быть адресованы по желанию ('s/ABC\nXYZ/alphabet/g'). Один пример
использования "N" для удаления блока строк в разделе 4.13
( "Как удалить блок определенных строк подряд?" ). Это
пример можно изменить, изменив команду delete на что-то else, например 'p' (print), 'i' (insert), 'c' (change), 'a' (добавить),
или 's' (заменить).

Выбор (3) не помещает \n в пространство шаблонов, но он делает сопоставьте блок последовательных строк, так что может быть, что вы не используете даже нужно \n найти то, что вы ищете. Поскольку GNU sed версия 3.02.80 теперь поддерживает этот синтаксис:

  sed '/start/,+4d'  # to delete "start" plus the next 4 lines,

в дополнение к традиционному '/отсюда/,/до там /{...}' range адресов, можно избежать использования \n полностью.

Ответ 4

Более короткая альтернатива awk:

awk 1 ORS=' '

объяснение

Программа awk состоит из правил, которые состоят из условных кодовых блоков, а именно:

condition { code-block }

Если кодовый блок опущен, используется значение по умолчанию: { print $0 }. Таким образом, 1 интерпретируется как истинное условие, и print $0 выполняется для каждой строки.

Когда awk читает ввод, он разбивает его на записи, основываясь на значении RS (Record Separator), которое по умолчанию является новой строкой, поэтому awk по умолчанию будет анализировать ввод по строке. Разделение также включает удаление RS из входной записи.

Теперь при печати записи к ней добавляется ORS (разделитель выходных записей), по умолчанию снова вводится новая строка. Таким образом, изменяя ORS на пробел, все новые строки заменяются пробелами.

Ответ 5

gnu sed имеет опцию -z для нулевых разделенных записей (строк). Вы можете просто позвонить:

sed -z 's/\n/ /g'

Ответ 6

Версия Perl работает так, как вы ожидали.

perl -i -p -e 's/\n//' file

Как указано в комментариях, стоит отметить, что это редактирование на месте. -i.bak предоставит вам резервную копию исходного файла перед заменой в случае, если ваше регулярное выражение не так умно, как вы думали.

Ответ 7

Кому нужно sed? Вот путь bash:

cat test.txt |  while read line; do echo -n "$line "; done

Ответ 8

Чтобы заменить все символы новой строки пробелами с помощью awk, не читая весь файл в памяти:

awk '{printf "%s ", $0}' inputfile

Если вы хотите окончательную новую строку:

awk '{printf "%s ", $0} END {printf "\n"}' inputfile

Вы можете использовать символ, отличный от пробела:

awk '{printf "%s|", $0} END {printf "\n"}' inputfile

Ответ 9

Три вещи.

tr (или cat и т.д.) абсолютно не требуется. (GNU) sed и (GNU) awk, при объединении, может сделать 99,9% любой текстовой обработки, в которой вы нуждаетесь.
поток!= строка. ed - это линейный редактор. sed нет. Подробнее о различии см. sed lecture. Большинство людей путают sed как линейную, потому что по умолчанию она не очень жадна в сопоставлении шаблонов для совпадений SIMPLE - например, при выполнении поиска шаблона и замены на один или два символа он по умолчанию заменяет только первое совпадение, которое он находит (если не указано иначе глобальной командой). Не было бы глобальной команды, если бы она была построена на основе строки, а не на основе STREAM, потому что она оценивала бы только строки за раз. Попробуйте запустить ed; вы заметите разницу. ed очень полезен, если вы хотите перебирать определенные строки (например, для цикла), но в большинстве случаев вам просто нужно sed.
При этом
```
sed -e '{:q;N;s/\n/ /g;t q}' file
```
отлично работает в GNU sed версии 4.2.1. Вышеупомянутая команда заменит все новые строки пробелами. Это уродливое и немного громоздкое, но оно работает отлично. {} можно оставить без внимания, поскольку они включены только по соображениям здравомыслия.

Ответ 10

tr '\n' ' '

- это команда.