python3有两种表示字符序列的类型:bytes和str。前者的实例包含原始的8位值;后者的实例包含Unicode字符。

python2中也有两种表示字符序列的类型,分别叫做str和unicode。与python3不同的是,str的实例包含原始的8位值而unicode的实例,则包含Unicode字符

上面两句话我特别不懂,所以文章后面就下是希望为了把上面两句话弄懂。

看几个例子:

#在python2中
>>> type('x'.decode('utf-8'))
<type 'unicode'> #为啥不是二进制了,字符串还能解码?再怎么解 #在python3中
>>> type('x'.decode('utf-8')) #这才是正常的吗!
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'str' object has no attribute 'decode' #字符串怎么解,本来就没有吗

首先这个就是Python语言本身的问题,因为在Python2的语法中,默认的str并不是真正意义上我们理解的字符串,而是一个byte数组,或者可以理解成一个纯ascii码字符组成的字符串,与python3中的bytes类型的变量对应,而真正意义上通用的字符串则是unicode类型的变量,它与Python3中的str变量对应本来应该用作byte数组的类型却用来做字符串,你说乱不乱,之所以这样做是为了与之前的程序保持兼容。

在Python2中,作为两种类型的字符序列,str与unicode需要转换,它们是这样转换的.

str——decode方法——》unicode——encode方法——》str

在python3中可以这样对应这转换,配合上面的图,也许会好理解一点。

byte——decode(解码)方法——》str——>encode(编码)方法——》byte

#在python2中
>>> type('x')
<type 'str'> >>> type('x'.decode('utf-8'))
<type 'unicode'> >>> type(u'x'.encode('utf-8'))
<type 'str'> #在python3中
>>> type(x)
<class 'str'> >>> type(b'x')
<class 'bytes'>>>> type(b'x'.decode('utf-8'))
<class 'str'>

>>> type('x'.encode('utf-8'))
  <class 'bytes'>

还有就是隐式的转换,当一个unicode字符串和一个str字符串进行连接的时候,会自动将str字符串转换成unicode类型然后再连接,而这个时候使用的编码方式则是系统所默认的编码方式。python2默认的是ASCII,python3默认的是utf-8。

#在python2中
>>> x = u'喵'
>>> x
u'\u55b5'
>>> type(x)
<type 'unicode'> #在python3中
>>> x = u'喵'
>>> x
'喵'
>>> type(x)
<class 'str'> #为啥结果不一样

最新文章

  1. XML Schema and XMLspy notes
  2. Breakpoint is not hit
  3. Kotlin语法(函数和lambda表达式)
  4. hdu 1203
  5. iOS-集成阿里百川IMSDK的服务端及客户端
  6. Robotium---环境搭建及入门示例
  7. JavaScript 【跨浏览器XPath,做个兼容】
  8. HDU 4998 Rotate (计算几何)
  9. ArrayList遍历的同时删除--- 删除还是用迭代器的比较好,其它的都会有问题.
  10. 201521123121 《Java程序设计》第1周学习总结
  11. 浅谈js中null和undefined的区别
  12. $.each()、$.map()区别浅谈
  13. spring源码1:基本概念
  14. JWT 从入门到精通
  15. 带精英策略的快速非支配排序遗传算法 NSGA-II 算法
  16. mysql的内存使用
  17. linux shell中curl 发送post请求json格式问题
  18. OpenGL入门程序一:绘制简单的矩形
  19. parser_url
  20. 4.1 shell文本过滤、find、awk、grep

热门文章

  1. textarea限制字符输入方法
  2. Websphere: Stop Server and Uninstall Application
  3. 并发编程概述 委托(delegate) 事件(event) .net core 2.0 event bus 一个简单的基于内存事件总线实现 .net core 基于NPOI 的excel导出类,支持自定义导出哪些字段 基于Ace Admin 的菜单栏实现 第五节:SignalR大杂烩(与MVC融合、全局的几个配置、跨域的应用、C/S程序充当Client和Server)
  4. Windows App开发之编辑文本与绘制图形
  5. HDU 1014 Uniform Generator 题解
  6. 在CentOS 5下安装中文五笔
  7. iOS scrollView中嵌套多个tableView处理方案
  8. dwr文件上传
  9. 【ubantu】Ubuntu的一些常用命令
  10. bzoj3992【SDOI2015】序列统计