Print HTML From Url
本问题已经有最佳答案,请猛点这里访问。
所以我想打印出一个网站的
1 2 3 4 | from urllib.request import urlopen http = urlopen('http://www.google.de/').read() print(http) |
但是在输出中,所有的换行符都被打印成
因此,我的问题是,如何将HTML代码作为普通字符串打印,并像文本编辑器中显示的那样使用换行符?
请看一下urlopen文档。在HTML报头中,它被写入
1 | print(http.decode('utf-8')) |
如果HTML输出中有特殊字符(由于区域设置),请使用:
1 | print(http.decode('utf-8'), errors='ignore') |