关于python：UnicodeEncodeError：’ascii’编解码器无法对位置0中的字符进行编码：序号不在范围内（128）

UnicodeEncodeError: 'ascii' codec can't encode character in position 0: ordinal not in range(128)

我正在编写一个使用剪刀字符(9986-？)的python脚本。我正试图把我的代码移植到Mac，但我遇到了这个错误。

当从空闲(python 3.2.5-os x 10.4.11 ibook g4 ppc)运行时，剪刀字符显示得很好，代码在Ubuntu 13.10上完全正常工作，但当我尝试在终端中运行时，我会得到这个错误/回溯：

1
2
3
4
5
6
7
8

Traceback (most recent call last):
File"snippets-convert.py", line 352, in <module>
main()
File"snippets-convert.py", line 41, in main
menu()
File"snippets-convert.py", line 47, in menu
print ("|\t",snipper.decode(),"PySnipt'd",snipper.decode(),"\t|")
UnicodeEncodeError: 'ascii' codec can't encode character '\u2702' in position 0: ordinal not in range(128)

给我问题的代码是：

print ("|\t",chr(9986),"PySnipt'd",chr(9986),"\t|")

这不是表示终端没有能力显示该字符吗？我知道这是一个旧系统，但它是我目前唯一必须使用的系统。操作系统的年龄会影响程序吗？

我读过这些问题：

unicodeencodeerror:"ascii"编解码器无法对位置0中的字符u'xef'进行编码：序号不在范围(128)内-不同的字符
"unicodeencodeerror:'ascii'编解码器无法对字符进行编码"-使用2.6，因此不知道它是否适用
unicodeencodeerror:"ascii"编解码器无法编码字符？-似乎是解决我的问题的一个合理的方法，.encode('UTF-8')，我不明白这个错误。但是，它显示的是字符代码，而不是我想要的字符，而.decode()只是给出了相同的错误。不确定我是否做得对。
unicodeencodeerror:"ascii"编解码器无法对位置0-6中的字符进行编码：序号不在范围(128)内-不确定这是否适用，他使用的是一个GUI，正在获取输入，全部是希腊语。

是什么导致了这个错误？这是系统/OS的时代、Python的版本还是一些编程错误？

编辑：这个错误稍后会出现在这个重复的问题上(只是认为我会添加它，因为它在同一个程序中，并且是相同的错误)：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Traceback (most recent call last):
File"snippets-convert.py", line 353, in <module>
main()
File"snippets-convert.py", line 41, in main
menu()
File"snippets-convert.py", line 75, in menu
main()
File"snippets-convert.py", line 41, in main
menu()
File"snippets-convert.py", line 62, in menu
search()
File"snippets-convert.py", line 229, in search
print_results(search_returned) # Print the results for the user
File"snippets-convert.py", line 287, in print_results
getPath(toRead) # Get the path for the snippet
File"snippets-convert.py", line 324, in getPath
snipXMLParse(path)
File"snippets-convert.py", line 344, in snipXMLParse
print (chr(164),child.text)
UnicodeEncodeError: 'ascii' codec can't encode character '\xa4' in position 0: ordinal not in range(128)

编辑：

我进入终端字符设置，它实际上支持该字符(如您在屏幕截图中看到的那样：

enter image description here

当我把它插入终端时，它打印出这个：\342\234\202，当我按下enter时，我得到这个：-bash: ?: command not found。

按@J.F.Sebastian的要求编辑运行的命令：

python3 test-io-encoding.py：

1
2
3
4
5
6
7
8
9
10

PYTHONIOENCODING: None
locale(False): US-ASCII
device(stdout): US-ASCII
stdout.encoding: US-ASCII
device(stderr): US-ASCII
stderr.encoding: US-ASCII
device(stdin): US-ASCII
stdin.encoding: US-ASCII
locale(False): US-ASCII
locale(True): US-ASCII

python3 -S test-io-encoding.py：

1
2
3
4
5
6
7
8
9
10

edit尝试了@paulobu提供的"黑客"解决方案：

如你所见，这导致了一个(耶！)剪刀，但我现在有一个新的错误。回溯/错误：

1
2
3
4
5
6
7
8
9

+-=============================-+
?Traceback (most recent call last):
File"snippets-convert.py", line 357, in <module>
main()
File"snippets-convert.py", line 44, in main
menu()
File"snippets-convert.py", line 52, in menu
print("|\t"+sys.stdout.buffer.write(chr(9986).encode('UTF-8'))+" PySnipt'd"+ sys.stdout.buffer.write(chr(9986).encode('UTF-8'))+" \t|")
TypeError: Can't convert 'int' object to str implicitly

编辑@paulobu修复的添加结果：

1
2
3
4
5

+-=============================-+
|
? PySnipt'd
? |
+-=============================-+

编辑：

他的解决方法是：

1
2
3

+-=============================-+
??| PySnipt'd |
+-=============================-+

相关讨论

当python打印并输出时，它会自动将其编码到目标介质。如果它是一个文件，utf-8将被用作默认值，每个人都会很高兴，但是如果它是一个终端，python将找出终端使用的编码，并尝试使用该编码对输出进行编码。

这意味着，如果终端使用ascii作为编码，那么python将尝试将scissor字符编码为ascii。当然，ASCII不支持它，所以会出现Unicode解码错误。

这就是为什么您总是必须显式地对输出进行编码。显性优于隐性记得吗？要修复代码，可以执行以下操作：

1 2	import sys sys.stdout.buffer.write(chr(9986).encode('utf8'))

这似乎有点黑客。在执行脚本之前，还可以设置pythoniencoding=utf-8。我对这两种解决方案都不满意。可能你的控制台不支持UTF-8，你会看到胡言乱语。但是你的程序会正常运行。

如果您确实需要在控制台上显示正确的输出，我强烈建议您将控制台设置为使用另一种编码，即支持scissor字符的编码。(可能是UTF-8)。在Linux上，可以通过这样做来实现：export lang=UTF_8。在Windows上，您可以使用chcp更改控制台的代码页。只需找出如何在您的和imho中设置utf8，这将是最好的解决方案。

你不能混合使用print和sys.stdout.write，因为它们基本上是相同的。关于您的代码，黑客的方式如下：

1	sys.stdout.buffer.write(("\|\t"+ chr(9986) +" PySnipt'd" + chr(9986)+" \t\|").encode('utf8'))

我建议你读一下文档，看看在print函数和sys.stdout函数下发生了什么：http://docs.python.org/3/library/sys.html sys.stdin

希望这有帮助！

相关讨论

这是有道理的。我该怎么修？甜美！我会试试的！
@个人化又增加了一些解释。如果你明白的话告诉我。
在python 3中，这只是输出字节，因此类似这样的代码将输出str"b'\\xe2\\x9c\\x82'"。
@德尔南：Python总是输出字节。控制台读取字节，并将其转换为字符(如果它能识别)。做这个测试：s=chr(97);s.encode('utf-8');你会看到一个a打印在控制台上：字节97:。
是的，终端只是显示这个：| b'\xe2\x9c\x82' PySnipt'd b'\xe2\x9c\x82' |。
@paulobu python最终会将字节写入控制台，但由于sys.stdout是一种文本输入，print会将其参数转换为unicode字符串以写入该文件对象，而该对象会将unicode字符串编码为底层字节流的编码，并将这些字节写入流。另外，您的示例不起作用，encode总是会导致bytes，而这些结果从未被隐式解码，因此将它们交给任何文本I/O会导致要打印的字节的repr(b'...')。请记住，我们说的是python 3。
@德尔南，你说得对。虽然它在我的控制台上测试过：python3 -c"s=chr(97);print(s.encode('437'))"它打印了b'a'。这不是我所期望的。我不是python3用户，虽然我知道基本知识，但在我看来这一个失败了。抱歉，那么我该如何明确要求python3中的输出编码？
"你总是必须显式编码你的输出"是不正确的。您不希望使用完全重复的脚本，除非输出字符编码能够在不同的环境中运行它们。
不，您可以显式地编写脚本输出并在任何地方使用它。它们不是互相排斥的选择。
它起作用了！有点。我要买一个(耶！)剪刀，但我也有一个新的错误，我已经编辑了我的问题。
我有点不知所措。错误是什么？上次编辑的？
@我明白了。你不能把写和印混在一起。看看我的答案，我会编辑你的代码。
用这个结果编辑了问题，它有两把剪刀(耶！！)但现在格式已关闭。
@rpiawesiomeness修复。在前两个print函数中添加了end参数。这应该可以做到。
@保罗布，又有点管用。它将这些行恢复到原来的位置，但现在剪刀相互重叠…编辑了我的问题w.输出。
@好的，再试一次。更改了一行代码。
@保罗布呜呼！它起作用了！非常感谢！
@paulobu您不应该"总是要显式地对输出进行编码"——这会使您的代码变得脆弱，并且是特定于平台的。它不会在任何地方都工作——它不会在我的Windows终端或我的旧Solaris设备上呈现具有C区域设置的内容。解决方法是固定终端。export LANG=UTF_8也不是一个解决方案，因为它对大多数人来说不是一个合适的地方，它将导致preferedencoding成为'US-ASCII，并导致UnicodeEncodeError。
"如果是一个文件，utf-8将作为默认文件，所有人都会很高兴，"。错误-py3k使用您的区域设置来确定默认的编码编解码器。只有当您的区域设置是基于UTF-8时，它才会是"UTF-8"。
@alastairmcormack编码与平台无关。如果不显式地对输出进行编码，则不管默认值是什么，都会对输出进行编码(您可能不知道哪一个是错误的来源)。解决方案是固定终端"…所以，你的程序中断了，现在是终端的错误：)
所以你宁愿把utf-8打印到我的控制台上，即使我的控制台不支持也永远不支持utf-8？
我明白你的意思。但这也是一个鸡蛋问题。如果程序只想写UTF-8字符…更改编码也不能做到这一点，而且您的终端将永远不支持它，那么程序将永远无法在那里正确运行。一种解决方案可以是询问媒体在该区域使用的是什么区域设置并进行编码，但是如果使用的是ASCII，并且它有一些拉丁-1字符呢？我只是写了答案(2年前)来帮助操作，而不是作为一个通用的解决方案。
：)我认为通用的解决方案是尝试使用printunicode并捕获任何UnicodeEncodeError异常。然后可以打印字符串的repr()。只是一个想法：)
这个答案对手术没有帮助，但是…成为我的客人；
@paulobu：打印字节是错误的，建议必须使用字节，您应该使用Unicode，并适当配置您的环境。例如，在Windows上，可以使用Unicode API，因此字节永远不会在Python中具体化(Win Unicode控制台，PEP 528)。print(unicode_string)跨平台和不同环境工作。

test_io_encoding.py输出建议您更改locale设置，如设置LANG=en_US.UTF-8。

第一个错误可能是由于您试图解码已经是Unicode的字符串。python 2尝试使用默认字符编码('ascii')对其进行编码，然后使用(可能)不同的字符编码对其进行解码。错误发生在encode步骤：

1
2
3
4

>>> u"\u2702".decode() # Python 2
Traceback (most recent call last):
File"<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2702' in position 0: ordinal not in range(128)

看起来您正在使用python 2而不是python 3运行脚本。你会得到：

1
2
3
4

>>>"\u2702".decode() # Python 3
Traceback (most recent call last):
File"<stdin>", line 1, in <module>
AttributeError: 'str' object has no attribute 'decode'

不同的错误。

放下.decode()电话：

1	print("\|\t {0} PySnipt'd {0} \t\|".format(snipper))

第二个问题是将Unicode字符串打印到管道中：

1
2
3
4
5
6

$ python3 -c'print("\u2702")'
?
$ python3 -c'print("\u2702")' | cat
Traceback (most recent call last):
File"<string>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character '\u2702' in position 0: ordinal not in range(128)

设置适合您的目的的PYTHONIOENCODING环境变量：

1 2	$ PYTHONIOENCODING=utf-8 python3 -c'print("\u2702")' \| cat ?

the terminal is just displaying this: | b'\xe2\x9c\x82' PySnipt'd b'\xe2\x9c\x82' |

如果snipper是bytes对象，则保留snipper.decode()调用。

1
2
3
4
5
6

$ python3 -c"print(b'\xe2\x9c\x82'.decode())"
?
$ python3 -c"print(b'\xe2\x9c\x82'.decode())" | cat
Traceback (most recent call last):
File"<string>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character '\u2702' in position 0: ordinal not in range(128)

修复方法相同：

1 2	$ PYTHONIOENCODING=utf-8 python3 -c"print(b'\xe2\x9c\x82'.decode())" \| cat ?

相关讨论

回答得好，但它给了我和这里一样的东西：stackoverflow.com/questions/20923663/&hellip；
设置和环境变量有点过分了。在python2.7中，它与指定和输出编码一样简单。我刚刚意识到，在python3中，这不会起到完全相同的作用。必须有另一种更简单的方法。
@rpiawesomeness:我更新了"snipper是bytes对象"的答案。
@每次在具有不同字符编码的终端上运行程序时，是否要更改其源代码？
snipper.decode()给了我和我最初开始时一样的错误。我用一些新信息编辑了我的问题。
@J.F.塞巴斯蒂安，我只是想让他们通用。我通常坚持使用utf-8作为输出，如果控制台不支持它，我只是处理一些胡言乱语。我通常做的是使控制台编码适应程序的输出编码。
@rpiawesomeness：您能更新您的问题并包括从我的答案运行代码片段的结果吗？例如，如果运行python3 -c"print(b'\xe2\x9c\x82'.decode())"，您会得到什么？
@顺便问一下，J.F.塞巴斯蒂安。如果他需要在终端中正确地显示输出(不仅仅是因为他在测试程序)，那么他实际上需要更改他的代码，因为如果他不这样做，他就永远不会得到正确的程序，不是吗？
@J.F.塞巴斯蒂安，当然。我明白了：UnicodeEncodeError: 'ascii' codec can't encode character '\u2702' in position 0: ordinal not in range(128)。
@rpiawesomeness:你如何运行它？你确定你复制粘贴了吗？我不相信您的终端使用ascii作为字符编码。您是否更改了site.py或sitecustomize.py或usercustomize.py模块？如果你跑步，你会得到什么：PYTHONIOENCODING=ascii:backslashreplace python3 -c"print(b'\xe2\x9c\x82'.decode())"？
@J.F.Sebastian我直接复制粘贴，没有，我没有使用过这些模块。如果我执行最后一个命令，我会得到\u2702。
@rpiawesiomeness:python3 -S test_io_encoding.py的输出是什么？test_io_encoding.py的输出是什么？它与单纯的python3 test_io_encoding.py不同吗？
@J.F.Sebastian刚刚用输出编辑了我的问题。
@rpiawesome:locale命令的输出是什么？尝试设置LANG环境变量，如LANG=en_US.UTF-8。
让我们在聊天中继续讨论

我的区域设置为de_at.utf-8，但这些行在/etc/profile中失踪：

1
2
3

export LANG=de_AT.UTF-8
export LANGUAGE=de_AT.UTF-8
export LC_ALL=de_AT.UTF-8

注销/登录，您的问题应该得到解决

要验证所有区域设置是否正确，请在终端中键入locale。

输出应与此类似：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

LANG=de_AT.UTF-8
LANGUAGE=de_AT.UTF-8
LC_CTYPE="de_AT.UTF-8"
LC_NUMERIC="de_AT.UTF-8"
LC_TIME="de_AT.UTF-8"
LC_COLLATE="de_AT.UTF-8"
LC_MONETARY="de_AT.UTF-8"
LC_MESSAGES="de_AT.UTF-8"
LC_PAPER="de_AT.UTF-8"
LC_NAME="de_AT.UTF-8"
LC_ADDRESS="de_AT.UTF-8"
LC_TELEPHONE="de_AT.UTF-8"
LC_MEASUREMENT="de_AT.UTF-8"
LC_IDENTIFICATION="de_AT.UTF-8"
LC_ALL=de_AT.UTF-8

在文件的第一行.py中，需要添加以下字符串：

#--编码：UTF-8--

你也可以试试这个：

打印(" "，unichr(9986)，"pysnipt'd"，unichr(9986)，" "

相关讨论