关于python:UnicodeDecodeError:’ascii’编解码器无法解码位置0中的字节0xe0:序号不在范围内(128)

UnicodeDecodeError : 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128)

在我的一台机器上,当我使用google-apps引擎或django时出错。

例如:

  • App.YAML

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    application: demas1252c
    version: 1
    runtime: python
    api_version: 1


    handlers:
       - url: /images
    static_dir: images
       - url: /css
    static_dir: css
       - url: /js
    static_dir: js
       - url: /.*
    script: demas1252c.py
  • DMAS1252C.Py

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    import cgi
    import wsgiref.handlers


    from google.appengine.ext.webapp import template
    from google.appengine.ext import webapp


    class MainPage(webapp.RequestHandler):
    def get(self):
    values = {'id' : 10}


    self.response.out.write(template.render('foto.html', values))


    application = webapp.WSGIApplication([('/', MainPage)], debug = True)
    wsgiref.handlers.CGIHandler().run(application)
  • HTML

    1
    2
    3
    4
    5
    <!DOCTYPE html>
    <html lang="en">
        <head></head>
    <body>some</body>
    </html>

错误信息:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
C:\artefacts\dev\project>"c:\Program Files\Google\google_appengine\dev_appserver.py" foto-hosting
Traceback (most recent call last):
  File"c:\Program Files\Google\google_appengine\dev_appserver.py", line 69, in <module>
    run_file(__file__, globals())
  File"c:\Program Files\Google\google_appengine\dev_appserver.py", line 65, in run_file
    execfile(script_path, globals_)
  File"c:\Program Files\Google\google_appengine\google\appengine\tools\dev_appserver_main.py", line 92, in <module>
    from google.appengine.tools import dev_appserver
  File"c:\Program Files\Google\google_appengine\google\appengine\tools\dev_appserver.py", line 140, in <module>
    mimetypes.add_type(mime_type, '.' + ext)
  File"C:\Python27\lib\mimetypes.py", line 344, in add_type
    init()
  File"C:\Python27\lib\mimetypes.py", line 355, in init
    db.read_windows_registry()
  File"C:\Python27\lib\mimetypes.py", line 260, in read_windows_registry
    for ctype in enum_types(mimedb):
  File"C:\Python27\lib\mimetypes.py", line 250, in enum_types
    ctype = ctype.encode(default_encoding) # omit in 3.x!
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128)

当我使用Django中的静态文件(不使用GAE)时,我有非常相似的错误(使用不同的堆栈)。

我试图找出错误的原因,并在mimetypes.py中添加了代码:

1
2
3
print '====='
print ctype
ctype = ctype.encode(default_encoding) # omit in 3.x!

然后我在控制台中收到下一条消息:

1
2
3
4
5
6
7
=====
video/x-ms-wvx
=====
video/x-msvideo
=====
р?фшю/AMR
Traceback (most recent call last):

在注册表中,hkcr/mime/database/contenttype/i有五个带有俄语(西里尔文)字母的键。但是我如何修复这个错误呢?


这是由注册表中的错误数据触发的mimetypes中的错误。(р?фшю/AMR根本不是有效的mime媒体类型。)

ctype_winreg.EnumKey返回的注册表项名称,mimetypes希望它是Unicode字符串,但它不是。与_winreg.QueryValueEx不同,EnumKey返回字节字符串(直接来自Windows API的ANSI版本;python 2中的_winreg即使返回Unicode字符串也不使用Unicode接口,因此"永远不会正确读取非ANSI字符。"

那么,用unicode来尝试.encode失败了吗?解码?尝试在将Unicode字符串编码回ASCII之前获取该字符串时出错!

1
2
3
4
try:
    ctype = ctype.encode(default_encoding) # omit in 3.x!
except UnicodeEncodeError:
    pass

mimetypes中的这些线应该简单地删除。

eta:添加到bug追踪器。


顺便说一句,问题的主要原因是QuickTime向Windows注册表中添加了非ASCII MIME类型。最简单的解决方法是从аудио/видео/开始手动查找并从注册表中删除HKCR/Mime/Database/ContentType/的子部分。


有一个补丁:

http://bugs.python.org/file18143/9291.patch

对我来说很好。

只需将unicodeencodeerror替换为unicodeerror


来自python issue9291的另一个解决方案,作者Alexandr Zarubkin(ME21):

在libsite packages文件夹中添加名为sitecustomize.py的文件。

1
2
import sys
sys.setdefaultencoding("cp1251")

它是一个注册中带有拉丁mime tipes的python bug启动regedit并检查非拉丁名的"hkey_classes_rootmimedatabasecontent type"。