关于python2中的unicode和str以及python3中的str和bytes
python3有两种表示字符序列的类型:bytes和str。前者的实例包含原始的8位值;后者的实例包含Unicode字符。
python2中也有两种表示字符序列的类型,分别叫做str和unicode。与python3不同的是,str的实例包含原始的8位值,而unicode的实例,则包含Unicode字符。
上面两句话我特别不懂,所以文章后面就下是希望为了把上面两句话弄懂。
看几个例子:
#在python2中
>>> type('x'.decode('utf-8'))
<type 'unicode'> #为啥不是二进制了,字符串还能解码?再怎么解 #在python3中
>>> type('x'.decode('utf-8')) #这才是正常的吗!
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'str' object has no attribute 'decode' #字符串怎么解,本来就没有吗
首先这个就是Python语言本身的问题,因为在Python2的语法中,默认的str并不是真正意义上我们理解的字符串,而是一个byte数组,或者可以理解成一个纯ascii码字符组成的字符串,与python3中的bytes类型的变量对应,而真正意义上通用的字符串则是unicode类型的变量,它与Python3中的str变量对应本来应该用作byte数组的类型却用来做字符串,你说乱不乱,之所以这样做是为了与之前的程序保持兼容。
在Python2中,作为两种类型的字符序列,str与unicode需要转换,它们是这样转换的.
str——decode方法——》unicode——encode方法——》str
在python3中可以这样对应这转换,配合上面的图,也许会好理解一点。
byte——decode(解码)方法——》str——>encode(编码)方法——》byte
#在python2中
>>> type('x')
<type 'str'> >>> type('x'.decode('utf-8'))
<type 'unicode'> >>> type(u'x'.encode('utf-8'))
<type 'str'> #在python3中
>>> type(x)
<class 'str'> >>> type(b'x')
<class 'bytes'>>>> type(b'x'.decode('utf-8'))
<class 'str'>
>>> type('x'.encode('utf-8'))
<class 'bytes'>
还有就是隐式的转换,当一个unicode字符串和一个str字符串进行连接的时候,会自动将str字符串转换成unicode类型然后再连接,而这个时候使用的编码方式则是系统所默认的编码方式。python2默认的是ASCII,python3默认的是utf-8。
#在python2中
>>> x = u'喵'
>>> x
u'\u55b5'
>>> type(x)
<type 'unicode'> #在python3中
>>> x = u'喵'
>>> x
'喵'
>>> type(x)
<class 'str'> #为啥结果不一样
最新文章
- XML Schema and XMLspy notes
- Breakpoint is not hit
- Kotlin语法(函数和lambda表达式)
- hdu 1203
- iOS-集成阿里百川IMSDK的服务端及客户端
- Robotium---环境搭建及入门示例
- JavaScript 【跨浏览器XPath,做个兼容】
- HDU 4998 Rotate (计算几何)
- ArrayList遍历的同时删除--- 删除还是用迭代器的比较好,其它的都会有问题.
- 201521123121 《Java程序设计》第1周学习总结
- 浅谈js中null和undefined的区别
- $.each()、$.map()区别浅谈
- spring源码1:基本概念
- JWT 从入门到精通
- 带精英策略的快速非支配排序遗传算法 NSGA-II 算法
- mysql的内存使用
- linux shell中curl 发送post请求json格式问题
- OpenGL入门程序一:绘制简单的矩形
- parser_url
- 4.1 shell文本过滤、find、awk、grep
热门文章
- textarea限制字符输入方法
- Websphere: Stop Server and Uninstall Application
- 并发编程概述 委托(delegate) 事件(event) .net core 2.0 event bus 一个简单的基于内存事件总线实现 .net core 基于NPOI 的excel导出类,支持自定义导出哪些字段 基于Ace Admin 的菜单栏实现 第五节:SignalR大杂烩(与MVC融合、全局的几个配置、跨域的应用、C/S程序充当Client和Server)
- Windows App开发之编辑文本与绘制图形
- HDU 1014 Uniform Generator 题解
- 在CentOS 5下安装中文五笔
- iOS scrollView中嵌套多个tableView处理方案
- dwr文件上传
- 【ubantu】Ubuntu的一些常用命令
- bzoj3992【SDOI2015】序列统计