如何在python中替换非ascii char

how to replace non ascii char in python

我需要在python中替换非ascii字符，比如?，但是我得到

1	SyntaxError: Non-ASCII character '\xc2' in file test.py but no encoding declared; see http://www.python.org/peps/pep-0263.html for details`

在遵循网页上的指示后，我得到

1	UnicodeDecodeError: 'ascii' codec can't decode byte 0xef in position 449: ordinal not in range(128)

以下是我的代码：

1 2	data = data.replace(u"?", u"1/2") data = re.sub(u"?", u"3/4", data, flags=re.DOTALL)

我需要在代码中更改什么？

我的文件是：

1
2
3
4
5
6

#!/usr/bin/python

with codecs.open("file.txt","r","utf8") as myfile:
data = myfile.read()

data = data.replace(u"?", u"1/2")

文件是：

1	hello world ?

相关讨论

看起来您希望将其作为Unicode读取，但pyhton将其作为字符串读取。试试这个，这个问题看起来和你的UnicodeDecodeError相似。

https://stackoverflow.com/a/18649608/5504999

< /块引用>
尝试在文件顶部添加#coding: utf-8。这将允许使用非ASCII字符。

相关讨论

我得到了：：unicodeencodeerror ASCII编码字符编码不能"U"中的位置。uf057 383：序不在范围内(128)

你在阅读你的第一个参数与u.decode replace()(的UTF - 8的)？

仍然没有工作，让我尝试别的东西

动态的看"的回答。

我想：与codecs.open(HTML _路径+文件名_、"R"、"utf8"的myfile)日期：日期myfile.read)=(=(U"和# data.replace 189；"U"，1 / 2"I GET查询)和非ASCII字符："：- XC2)文件

试试我的答案，即，添加你的文件#coding: utf-8在线上。它允许程序读非ASCII字符。

是的，在