关于python:使用strptime将带有offset的时间戳转换为datetime obj

Convert timestamps with offset to datetime obj using strptime

我正在转换"2012-07-24t23:14:29-07:00"格式的时间戳。到使用strptime方法的python中的datetime对象。问题在于结束时的时间偏移(-07:00)。如果没有偏移,我可以成功地完成

1
2
3
time_str ="2012-07-24T23:14:29"

time_obj=datetime.datetime.strptime(time_str,'%Y-%m-%dT%H:%M:%S')

但是我试着用偏移量

1
2
3
time_str ="2012-07-24T23:14:29-07:00"

time_obj=datetime.datetime.strptime(time_str,'%Y-%m-%dT%H:%M:%S-%z').

但它给出了一个值错误,说明"z"是一个错误的指令。

有什么解决办法吗?


python 2 strptime()函数确实不支持时区的%z格式(因为底层的time.strptime()函数不支持它)。您有两种选择:

  • 使用strptime解析时忽略时区:

    1
    time_obj = datetime.datetime.strptime(time_str[:19], '%Y-%m-%dT%H:%M:%S')
  • 使用dateutil模块,它的parse函数处理时区:

    1
    2
    from dateutil.parser import parse
    time_obj = parse(time_str)

命令提示下的快速演示:

1
2
3
>>> from dateutil.parser import parse
>>> parse("2012-07-24T23:14:29-07:00")
datetime.datetime(2012, 7, 24, 23, 14, 29, tzinfo=tzoffset(None, -25200))

您还可以升级到python 3.2或更高版本,其中时区支持已经改进到%z可以工作的程度,前提是从输入中删除最后一个:,从%z之前删除-

1
2
3
4
5
6
7
8
9
10
11
12
13
14
>>> import datetime
>>> time_str ="2012-07-24T23:14:29-07:00"
>>> datetime.datetime.strptime(time_str, '%Y-%m-%dT%H:%M:%S%z')
Traceback (most recent call last):
  File"<stdin>", line 1, in <module>
  File"/Users/mj/Development/Library/buildout.python/parts/opt/lib/python3.4/_strptime.py", line 500, in _strptime_datetime
    tt, fraction = _strptime(data_string, format)
  File"/Users/mj/Development/Library/buildout.python/parts/opt/lib/python3.4/_strptime.py", line 337, in _strptime
    (data_string, format))
ValueError: time data '2012-07-24T23:14:29-07:00' does not match format '%Y-%m-%dT%H:%M:%S%z'
>>> ''.join(time_str.rsplit(':', 1))
'2012-07-24T23:14:29-0700'
>>> datetime.datetime.strptime(''.join(time_str.rsplit(':', 1)), '%Y-%m-%dT%H:%M:%S%z')
datetime.datetime(2012, 7, 24, 23, 14, 29, tzinfo=datetime.timezone(datetime.timedelta(-1, 61200)))


在python 3.7+中:

1
2
3
4
5
6
from datetime import datetime

time_str ="2012-07-24T23:14:29-07:00"
dt_aware = datetime.fromisoformat(time_str)
print(dt_aware.isoformat('T'))
# -> 2012-07-24T23:14:29-07:00

在python 3.2+中:

1
2
3
4
5
6
from datetime import datetime

time_str ="2012-07-24T23:14:29-0700"
dt_aware = datetime.strptime(time_str, '%Y-%m-%dT%H:%M:%S%z')
print(dt_aware.isoformat('T'))
# -> 2012-07-24T23:14:29-07:00

注意:在python 3.7之前,这个变体不支持-0700部分中的:(这两种格式都被RFC3339所允许)。请参阅日期时间:添加解析RFC3339日期和时间的功能。

在旧的python版本(如python 2.7)上,可以手动解析UTC偏移量:

1
2
3
4
5
6
7
8
9
10
11
12
13
from datetime import datetime

time_str ="2012-07-24T23:14:29-0700"
# split the utc offset part
naive_time_str, offset_str = time_str[:-5], time_str[-5:]
# parse the naive date/time part
naive_dt = datetime.strptime(naive_time_str, '%Y-%m-%dT%H:%M:%S')
# parse the utc offset
offset = int(offset_str[-4:-2])*60 + int(offset_str[-2:])
if offset_str[0] =="-":
   offset = -offset
dt = naive_dt.replace(tzinfo=FixedOffset(offset))
print(dt.isoformat('T'))

其中,这里定义了FixedOffset类。


埃多克斯1〔12〕

(注意:在我的例子中,我必须坚持使用python 2.7)

我在分析来自git log --date=iso8601输出的提交日期时遇到了类似的问题,实际上它不是iso8601格式(因此在更高版本中添加了--date=iso8601-strict)。

因为我使用的是django,所以我可以利用那里的实用程序。

https://github.com/django/django/blob/master/django/utils/dateparse.py

1
2
3
>>> from django.utils.dateparse import parse_datetime
>>> parse_datetime('2013-07-23T15:10:59.342107+01:00')
datetime.datetime(2013, 7, 23, 15, 10, 59, 342107, tzinfo=+0100)

你可以使用自己的正则表达式来代替strptime


使用python 3.5.2转换26 Sep 2000 05:11:00 -0700

1
2
from datetime import datetime    
dt_obj = datetime.strptime("26 Sep 2000 05:11:00 -0700", '%d %b %Y %H:%M:%S %z')

转换2012-07-24T23:14:29 -0700

1
dt_obj = datetime.strptime('2012-07-24T23:14:29 -0700', '%Y-%m-%dT%H:%M:%S %z')

python 3.5.2不支持-07:00时间偏移":"应删除