python中文乱码解决方案

2015-10-26 08:00  阅读 644 views 次

python中文乱码解决方案

python中文乱码解决方案

最近希望用python抓取一些网页保存在本地,但发现中文乱码现象时有出现。

乱码出现的时机是这样的(python 版本为2.7.10,系统为win8 64位,用IDLE调试程序)

import requests
res=requests.get(….)#某个网址
fp.open(‘xxx.html’,’w’)
fp.write(res.text)
fp.close()

本地文件打开xxx.html后发现中文都是乱码。
网上查了许多资料,都没有解决,最终还是解决了,貌似requests也不是很靠谱,中文编码问题严重。

最终,能够实现用print函数打印的编码是正常的,同时保存为文件的也正常,需要弃用requests而用urllib2

源代码如下

欢迎评论交流

2015-10-27更新

最近在某网站看到了另一种处理中文字符的方法:
补充如下

打赏作者
如果你觉得这篇文章对你有帮助,半年内收入涨幅大于20%,可以考虑请博主喝一杯咖啡^_^

您的支持将鼓励我们继续创作!

[微信] 扫描二维码打赏

[支付宝] 扫描二维码打赏

本文地址:https://www.simongong.net/python-e4-b8-ad-e6-96-87-e4-b9-b1-e7-a0-81-e8-a7-a3-e5-86-b3-e6-96-b9-e6-a1-88/
版权声明:本文为原创文章,版权归 西蒙宫 所有,欢迎分享本文,转载请保留出处!

发表评论


表情