python中文乱码解决方案

python中文乱码解决方案

python中文乱码解决方案

最近希望用python抓取一些网页保存在本地,但发现中文乱码现象时有出现。

乱码出现的时机是这样的(python 版本为2.7.10,系统为win8 64位,用IDLE调试程序)

import requests
res=requests.get(….)#某个网址
fp.open(‘xxx.html’,’w’)
fp.write(res.text)
fp.close()

本地文件打开xxx.html后发现中文都是乱码。
网上查了许多资料,都没有解决,最终还是解决了,貌似requests也不是很靠谱,中文编码问题严重。

最终,能够实现用print函数打印的编码是正常的,同时保存为文件的也正常,需要弃用requests而用urllib2

源代码如下

欢迎评论交流

2015-10-27更新

最近在某网站看到了另一种处理中文字符的方法:
补充如下

打赏作者
如果你觉得这篇文章对你有帮助,半年内收入涨幅大于20%,可以考虑请博主喝一杯咖啡^_^

您的支持将鼓励我们继续创作!

[微信] 扫描二维码打赏

[支付宝] 扫描二维码打赏

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据