У меня очень большие файлы генотипов, которые в принципе невозможно открыть в R, поэтому я пытаюсь извлечь интересующие строки и столбцы с помощью командной строки linux. Строки достаточно просты, используя head/tail, но мне трудно понять, как обрабатывать столбцы.
Если я попытаюсь извлечь (скажем) 100-105-й вкладку или разделитель с пробелом, используя
cut -c100-105 myfile >outfile
это, очевидно, не будет работать, если в каждом столбце есть строки из нескольких символов. Есть ли способ изменить вырезание с соответствующими аргументами, чтобы он извлекал всю строку в столбце, где столбцы обозначаются как пробел или табуляция (или любой другой символ)?