python编码为什么出现中文乱码-创新互联

创新互联www.cdcxhl.cn八线动态BGP香港云服务器提供商，新人活动买多久送多久，划算不套路！

创新互联建站服务项目包括尼木网站建设、尼木网站制作、尼木网页制作以及尼木网络营销策划等。多年来，我们专注于互联网行业，利用自身积累的技术优势、行业经验、深度合作伙伴关系等，向广大中小型企业、政府机构等提供互联网行业的解决方案，尼木网站推广取得了明显的社会效益与经济效益。目前，我们服务的客户以成都为中心已经辐射到尼木省份的部分城市，未来相信会继续扩大服务区域并继续获得客户的支持与信任！

本篇文章为大家展示了python编码为什么出现中文乱码，代码简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。

首先明确几个概念：

字节流：以utf8/gbk等编码编码的字节流。

unicode对象：python代码中，a=u'中国', 或者a='中国'.decode()的结果。

terminal用于显示字符的编码：将一个用utf8/gbk编码的字节流通过terminal指定的编码，去查找对应的字符显示出来。

locale：linux下，Locale 是软件在运行时的语言环境, 它包括语言(Language), 地域 (Territory) 和字符集(Codeset)。一个locale的书写格式为: 语言[_地域[.字符集]]. 所以说呢，locale总是和一定的字符集相联系的。比如：zh_CN.GB2312

编码转换原则：unicode是"中介"，任何编码之间转换都需要先decode()到unicode。

针对python，先把结论放在前面，三点：

#coding:utf-8 #.py文件是什么编码就需要告诉python用什么编码去读取这个.py文件。

sys.stdout.encoding，默认就是locale的编码，print会用sys.stdout.encoding去encode()成字节流，交给terminal显示。所以locale需要与terminal一致，才能正确print打印出中文。

sys.setdefaultencoding(‘utf8’)，用于指定str.encode() str.decode()的默认编码，默认是ascii。

对编码字符串a，代码中可以直接写a.encode(“gbk”)，但事实上内部自动先通过defaultencoding 去decode成unicode之后再encode()的。

str(xxx)应该也是用这个去编码的。

'ascii' codec can't encode characters in position 7-8: ordinal not in range(128)print的时候出现这个错误一般可以使用这个方案去处理。

为了避免代码中到处都要去encode(“xxx”)，还有可能不同的地方写得不一样带来不一致的情况，推荐使用这个：

import sys   
reload(sys)   
sys.setdefaultencoding('utf8')

上述内容就是python编码为什么出现中文乱码，你们学到知识或技能了吗？如果还想学到更多技能或者丰富自己的知识储备，欢迎关注创新互联-成都网站建设公司行业资讯频道。

网站栏目：python编码为什么出现中文乱码-创新互联
当前路径：http://scyanting.com/article/cesdod.html

python编码为什么出现中文乱码-创新互联

其他资讯