Время Python до возраста, часть 2: часовые пояса

Следуя моему предыдущему вопросу Python time to age, я столкнулся с проблемой относительно часового пояса, и получается, что он не всегда будет "+0200". Поэтому, когда strptime пытается разобрать его как таковой, он генерирует исключение.

Я думал о том, чтобы просто отрубить +0200 с помощью [: -6] или что-то еще, но существует ли реальный способ сделать это с помощью strptime?

Я использую Python 2.5.2, если это имеет значение.

>>> from datetime import datetime
>>> fmt = "%a, %d %b %Y %H:%M:%S +0200"
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200", fmt)
datetime.datetime(2008, 7, 22, 8, 17, 41)
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0300", fmt)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.5/_strptime.py", line 330, in strptime
    (data_string, format))
ValueError: time data did not match format:  data=Tue, 22 Jul 2008 08:17:41 +0300  fmt=%a, %d %b %Y %H:%M:%S +0200

Ответ 1

Новое в версии 2.6.

Для наивного объекта% z и% Z коды формата заменяются пустым строки.

Похоже, что это реализовано только в >= 2.6, и я думаю, вам нужно его вручную разобрать.

Я не вижу другого решения, кроме как удалить данные часового пояса:

from datetime import timedelta,datetime
try:
    offset = int("Tue, 22 Jul 2008 08:17:41 +0300"[-5:])
except:
    print "Error"

delta = timedelta(hours = offset / 100)

fmt = "%a, %d %b %Y %H:%M:%S"
time = datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200"[:-6], fmt)
time -= delta

Ответ 2

существует ли реальный способ сделать это с помощью strptime?

Нет, но поскольку ваш формат является датой семейства RFC822, вы можете легко прочитать его с помощью библиотеки email вместо:

>>> import email.utils
>>> email.utils.parsedate_tz('Tue, 22 Jul 2008 08:17:41 +0200')
(2008, 7, 22, 8, 17, 41, 0, 1, 0, 7200)

(7200 = смещение временной зоны от UTC в секундах)

Ответ 3

Вы можете использовать библиотеку dateutil, которая очень полезна:

from datetime import datetime
from dateutil.parser import parse

dt = parse("Tue, 22 Jul 2008 08:17:41 +0200")
## datetime.datetime(2008, 7, 22, 8, 17, 41, tzinfo=tzoffset(None, 7200)) <- dt

print dt
2008-07-22 08:17:41+02:00

Ответ 4

Насколько я знаю, strptime() не распознает числовые коды часовых поясов. Если вы знаете, что строка всегда будет заканчиваться спецификацией часового пояса этой формы (+ или - за ней следует 4 цифры), просто отрубить ее и разбор вручную - это вполне разумная вещь.

Ответ 5

Кажется, что% Z соответствует названиям часовых поясов, а не смещениям.

Например, данный:

>>> format = '%a, %d %b %Y %H:%M:%S %Z'

Я могу разобрать:

>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 GMT', format)
datetime.datetime(2008, 7, 22, 8, 17, 41)

Хотя кажется, что он ничего не делает с часовым поясом, просто замечая, что он существует и действителен:

>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 NZDT', format)
datetime.datetime(2008, 7, 22, 8, 17, 41)

Я полагаю, что если бы вы пожелали, вы могли бы найти сопоставление смещений именам, конвертировать ваш вход и затем проанализировать его. Возможно, проще просто усечь ваш вход.