python2.x编码问题实例

栏目: Python · 发布时间: 8年前

内容简介:python2.x编码问题实例

python字符串包括str 和 unicode,可以通过type(s)确定是str还是unicode

str可以继续细分为各种编码例如utf-8/GBK等

python内部则都通过unicode处理,如下图:

python2.x编码问题实例

如果是str,可以继续通过chardet.detect(s)确定编码类型

结合type(s),和chardet.detect(s),实验str字符串结果如下:

#coding:utf-8

1)s1 = '人生'     # s1是str,类型是utf-8

2)s1 = '人生'.encode('gbk')     # 报错,原因是 python 实际执行了s = '中文'.decode('asc-ii').encode('gbk'),而ascii不支持中文

3)s1 = '人生'.decode('utf-8').encode('utf-8')     # s1是str,类型是utf-8,转换过程是utf-8、unicode、utf-8

4)s1 = '人生'.decode('utf-8').encode('gbk')     # s1是str,类型是gbk, 转换过程是 utf-8、unicode、gbk

5)s1 = u'人生'      # s1是unicode

6)s1 = '人生'.decode('utf-8')     # s1是unicode

7)s1 = unicode('人生' ,  'utf-8')     # s1是unicode,内部先转成str('utf-8'),再转成unicode,后面的'utf-8'改成'gbk'也行,如果不写则是通过defaultencoding转换

另外,1和3在pycharm正常打印中文,但是在windows环境下乱码,原因是windows是gbk编码,同理4正好相反,pycharm乱码但是windows正常。5、6、7在两个环境下都能正常打印中文,原因是python unicode会自动转换成环境的编码


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数据结构与算法

数据结构与算法

卓滋德克 / 陈曙晖 / 清华大学出版社 / 2003-4-1 / 69.00

本书是一本介绍数据结构与算法的优秀书籍。 本书系统介绍了C++面向对象程序设计、算法复杂度、链表、栈、队列、递归、树、图、排序和查找算法、散列技术、数据压缩算法、内存管理等内容;尤其对递归算法进行了深入剖析。在附录中详细介绍了大O符号与标准模板库:在大多数章中提供了相应的实例分析和程序设计作业。 本书适合作为计算机软件专业或其他相关专业的教科书。对于需要参加计算机考试,......一起来看看 《数据结构与算法》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试