Есть ли функция Python, которая будет обрезать пробелы (пробелы и вкладки) из строки?
Пример: \t example string\t
→ example string
Есть ли функция Python, которая будет обрезать пробелы (пробелы и вкладки) из строки?
Пример: \t example string\t
→ example string
Пробел с обеих сторон:
s = " \t a string example\t "
s = s.strip()
Пробел с правой стороны:
s = s.rstrip()
Пробел с левой стороны:
s = s.lstrip()
Как указывает thedz, вы можете предоставить аргумент для разделения произвольных символов на любую из следующих функций:
s = s.strip(' \t\n\r')
Это разделит любые пробелы, \t
, \n
или \r
символы с левой стороны, правой стороны или с обеих сторон строки.
В приведенных выше примерах удаляются только строки из левой и правой сторон строк. Если вы хотите также удалить символы из середины строки, попробуйте re.sub
:
import re
print re.sub('[\s+]', '', s)
Это должно распечатываться:
astringexample
Метод Python trim
называется strip
:
str.strip() #trim
str.lstrip() #ltrim
str.rstrip() #rtrim
Для начального и конечного пробелов:
s = ' foo \t '
print s.strip() # prints "foo"
В противном случае работает регулярное выражение:
import re
pat = re.compile(r'\s+')
s = ' \t foo \t bar \t '
print pat.sub('', s) # prints "foobar"
Вы также можете использовать очень простую и базовую функцию: str.replace(), работает с пробелами и вкладками:
>>> whitespaces = " abcd ef gh ijkl "
>>> tabs = " abcde fgh ijkl"
>>> print whitespaces.replace(" ", "")
abcdefghijkl
>>> print tabs.replace(" ", "")
abcdefghijkl
Простой и легкий.
#how to trim a multi line string or a file
s=""" line one
\tline two\t
line three """
#line1 starts with a space, #2 starts and ends with a tab, #3 ends with a space.
s1=s.splitlines()
print s1
[' line one', '\tline two\t', 'line three ']
print [i.strip() for i in s1]
['line one', 'line two', 'line three']
#more details:
#we could also have used a forloop from the begining:
for line in s.splitlines():
line=line.strip()
process(line)
#we could also be reading a file line by line.. e.g. my_file=open(filename), or with open(filename) as myfile:
for line in my_file:
line=line.strip()
process(line)
#moot point: note splitlines() removed the newline characters, we can keep them by passing True:
#although split() will then remove them anyway..
s2=s.splitlines(True)
print s2
[' line one\n', '\tline two\t\n', 'line three ']
Никто еще не опубликовал эти решения regex.
Matching:
>>> import re
>>> p=re.compile('\\s*(.*\\S)?\\s*')
>>> m=p.match(' \t blah ')
>>> m.group(1)
'blah'
>>> m=p.match(' \tbl ah \t ')
>>> m.group(1)
'bl ah'
>>> m=p.match(' \t ')
>>> print m.group(1)
None
Поиск (вы должны обрабатывать случай ввода "только пробелы" по-разному):
>>> p1=re.compile('\\S.*\\S')
>>> m=p1.search(' \tblah \t ')
>>> m.group()
'blah'
>>> m=p1.search(' \tbl ah \t ')
>>> m.group()
'bl ah'
>>> m=p1.search(' \t ')
>>> m.group()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'NoneType' object has no attribute 'group'
Если вы используете re.sub
, вы можете удалить внутренние пробелы, что может быть нежелательным.
Пробелы содержат пробел, вкладки и CRLF. Таким образом, элегантная и строчная строковая функция, которую мы можем использовать, - перевести.
' hello apple'.translate(None, ' \n\t\r')
ИЛИ, если вы хотите быть тщательным
import string
' hello apple'.translate(None, string.whitespace)
(re.sub('+', '', (my_str.replace('\n', '')))). strip()
Это удалит все ненужные пробелы и символы новой строки. Надеюсь это поможет
import re
my_str = ' a b \n c '
formatted_str = (re.sub(' +', ' ',(my_str.replace('\n',' ')))).strip()
Это приведет к:
"ab\nc" будет изменен на "ab c"
something = "\t please_ \t remove_ all_ \n\n\n\nwhitespaces\n\t "
something = "".join(something.split())
Выход: please_remove_all_whitespaces
var= "\t hi_ \t drop_ all_ \n\n\n\nwhitespaces\n\t "
var= "".join(something.split())
результат: hi_drop_all_witespaces
При использовании Python 3: в вашем операторе печати завершите с sep = "". Это выделит все пространства.
ПРИМЕР:
txt="potatoes"
print("I love ",txt,"",sep="")
Это напечатает: я люблю картошку.
Вместо: я люблю картошку.
В вашем случае, так как вы пытаетесь добраться до \t, выполните sep = "\ t"
попробуйте перевести
>>> import string
>>> print '\t\r\n hello \r\n world \t\r\n'
hello
world
>>> tr = string.maketrans(string.whitespace, ' '*len(string.whitespace))
>>> '\t\r\n hello \r\n world \t\r\n'.translate(tr)
' hello world '
>>> '\t\r\n hello \r\n world \t\r\n'.translate(tr).replace(' ', '')
'helloworld'
Если вы хотите обрезать пропуски только в начале и в конце строки, вы можете сделать что-то вроде этого:
some_string = " Hello, world!\n "
new_string = some_string.strip()
# new_string is now "Hello, world!"
Это работает во многом подобно методу Qt QString :: trimmed(), так как удаляет начальные и конечные пробелы, оставляя внутренние пробелы в покое.
Но если вы хотите что-то вроде метода Qt QString :: упрощенный(), который не только удаляет начальные и конечные пробелы, но также "сдавливает" все последовательные внутренние пробелы на один пробел, вы можете использовать комбинацию .split()
и " ".join
, вот так:
some_string = "\t Hello, \n\t world!\n "
new_string = " ".join(some_string.split())
# new_string is now "Hello, world!"
В этом последнем примере каждая последовательность внутренних пробелов заменяется одним пробелом, в то же время обрезая пробелы в начале и конце строки.
Как правило, я использую следующий метод:
>>> myStr = "Hi\n Stack Over \r flow!"
>>> charList = [u"\u005Cn",u"\u005Cr",u"\u005Ct"]
>>> import re
>>> for i in charList:
myStr = re.sub(i, r"", myStr)
>>> myStr
'Hi Stack Over flow'
Примечание. Это делается только для удаления "\n", "\ r" и "\ t". Он не удаляет лишние пробелы.
content = "this is \nText\r\r\t\n. This is new text"
Чтобы удалить \n
, \r
, \t
, лучший способ:
data = ""
for i in content:
data += i.strip("\n").strip("\t").strip("\r").replace("\n","").replace("\t","").replace("\r","")
Вывод:
>>> data
'this is Text. This is new text'
Это самый простой способ удалить указанные выше символы. Если какой-либо пакет или библиотека python доступны, то, пожалуйста, дайте мне знать, а также предложите, как удалить символ /??, происходит из-за нажатия Enter.
для удаления пробелов из середины строки
$p = "ATGCGAC ACGATCGACC";
$p =~ s/\s//g;
print $p;
выход:
ATGCGACACGATCGACC
Это приведет к удалению всех пробелов и строк новой строки из начала и конца строки:
>>> s = " \n\t \n some \n text \n "
>>> re.sub("^\s+|\s+$", "", s)
>>> "some \n text"