Parsing time string in Python
我有一个日期时间字符串,我不知道如何在Python中解析它。
字符串是这样的:
1 | Tue May 08 15:14:45 +0800 2012 |
我试过了
1 | datetime.strptime("Tue May 08 15:14:45 +0800 2012","%a %b %d %H:%M:%S %z %Y") |
但是Python提升了
1 | 'z' is a bad directive in format '%a %b %d %H:%M:%S %z %Y' |
根据Python doc:
%z UTC offset in the form +HHMM or -HHMM (empty string if the the object is naive).
解析此时间字符串的正确格式是什么?
1 2 3 | >>> from dateutil import parser >>> parser.parse("Tue May 08 15:14:45 +0800 2012") datetime.datetime(2012, 5, 8, 15, 14, 45, tzinfo=tzoffset(None, 28800)) |
你最好的选择是看看
有点像
1 2 3 4 5 | >>> from datetime import datetime >>> date_str = 'Tue May 08 15:14:45 +0800 2012' >>> date = datetime.strptime(date_str, '%a %B %d %H:%M:%S +0800 %Y') >>> date datetime.datetime(2012, 5, 8, 15, 14, 45) |
不幸的是,我不确定如何做+0800时区,也许别人可以帮忙解决这个问题。
格式化字符串可以在http://docs.python.org/library/time.html#time.strftime找到,并且格式化打印字符串是相同的。
希望有所帮助
标记
PS,你最好的选择是从pypi安装pytz时区。 (http://pytz.sourceforge.net/)
事实上,如果我没记错的话,我认为pytz有一个很棒的日期时间解析方法。标准的lib在地面上有点薄,带有时区功能。
这是一个stdlib解决方案,它支持输入时间字符串中的变量utc offset:
1 2 3 4 5 6 | >>> from email.utils import parsedate_tz, mktime_tz >>> from datetime import datetime, timedelta >>> timestamp = mktime_tz(parsedate_tz('Tue May 08 15:14:45 +0800 2012')) >>> utc_time = datetime(1970, 1, 1) + timedelta(seconds=timestamp) >>> utc_time datetime.datetime(2012, 5, 8, 7, 14, 45) |
它在SO中多次讨论过。简而言之,不支持"%z",因为平台不支持它。
我的解决方案是新的,只是跳过时区:
1 | datetime.datetime.strptime(re.sub(r"[+-]([0-9])+","","Tue May 08 15:14:45 +0800 2012"),"%a %b %d %H:%M:%S %Y") |
1 2 3 4 5 6 7 | In [117]: datetime.datetime.strptime? Type: builtin_function_or_method Base Class: <type 'builtin_function_or_method'> String Form: <built-in method strptime of type object at 0x9a2520> Namespace: Interactive Docstring: string, format -> new datetime parsed from a string (like time.strptime()). |