Разделить строку на основе регулярного выражения

У меня есть вывод команды в табличной форме. Я разбираю этот результат из файла результата и сохраняю его в строке. Каждый элемент в одной строке разделяется одним или несколькими пробельными символами, поэтому я использую регулярные выражения, чтобы соответствовать 1 или более пробелам и разбивать их. Однако между каждым элементом вставлено пространство:

>>> str1="a    b     c      d" # spaces are irregular
>>> str1
'a    b     c      d'
>>> str2=re.split("( )+", str1)
>>> str2
['a', ' ', 'b', ' ', 'c', ' ', 'd'] # 1 space element between!!!

Есть ли лучший способ сделать это?

После каждого добавления str2 в список.

Ответ 1

Используя (, ), вы захватываете группу, если вы просто удалите их, у вас не будет этой проблемы.

>>> str1 = "a    b     c      d"
>>> re.split(" +", str1)
['a', 'b', 'c', 'd']

Однако нет необходимости в регулярном выражении, str.split без указания указанного разделителя разделит это на пробел для вас. Это было бы лучшим способом в этом случае.

>>> str1.split()
['a', 'b', 'c', 'd']

Если вам действительно нужно регулярное выражение, вы можете использовать его ('\s' представляет пробелы и оно более четкое):

>>> re.split("\s+", str1)
['a', 'b', 'c', 'd']

или вы можете найти все символы без пробелов

>>> re.findall(r'\S+',str1)
['a', 'b', 'c', 'd']

Ответ 2

Метод str.split автоматически удалит все пробелы между элементами:

>>> str1 = "a    b     c      d"
>>> str1.split()
['a', 'b', 'c', 'd']

Документы находятся здесь: http://docs.python.org/library/stdtypes.html#str.split

Ответ 3

Когда вы используете re.split, а шаблон разделения содержит группы захвата, группы сохраняются на выходе. Если вы этого не хотите, используйте вместо него группу, не участвующую в записи.

Ответ 4

Это очень просто. Попробуйте следующее:

str1="a    b     c      d"
splitStr1 = str1.split()
print splitStr1