is和==的区别

1. id()

id是python的一个内置函数,通过id()可以查看变量表的值在内存中的地址。

s1 = 2
print(id(s1)) # 1514368064
s2 = 2
print(id(s2)) # 1514368064 s3 = 'alex'
print(id(s3)) # 43156680
s4 = "alex"
print(id(s4)) # 43156680 lst = [1, 2, 4]
print(id(lst)) # 43164168
lst1 = [1, 2, 4]
print(id(lst1)) # 41362568 tup = (1, 2)
tup1 = (1, 2)
print(id(tup)) #39978312
print(id(tup1)) #39978376 # 我们发现,数字和字符串的数据地址是一样的. 列表和元组的数据地址是不一样的.

小数据池(常量池):把我们使用过的值存储在小数据池中,供其他数据使用。

小数据池给数字和字符串使用,其他数据类型不存在。

对于数字:-5~256是会被加到小数据池中的,每次使用都是同一个对象。

对于字符串:

1,如果是带特殊字符的,那么不会被添加到小数据池,每次都是新的;

2,如果是单一字母*n的情况,如"a"*20,在20个单位内(包含20个)是可以的,超过20个单位就不会添加到小数据池;

注意(一般情况下):在py文件中,如果你只是单纯的定义一个字符串,那么一般情况下都会被添到小数据池中,我们可以这样认为:在使用字符串的时候,python会帮我们把字符串进行缓存,在下次使用的时候直接指向这个字符串即可,可以节省很多内存。

  这个问题千万不要纠结,因为官方没有给出一个完美的结论和定论,所以只能是自己摸索。

说了这么多,这个id( )和is有什么关系呢?注意,is比较的就是id( )计算出来的结果,由于id( )是帮我们查看某数据(对象)的内存地址,那么is比较的就是数据(对象)的内存地址,即我们通过is可以查看两边使用的是否是同一个对象。

双等(==)表示的是判断是否相等,注意,这个双等比较的是具体的值。

总结:==比较的是两边的值是否一样;is比较的是内存地址是否一样,即是不是同一个对象。

编码问题

1. 关于python2的编码问题:

python2中使用的是ASCII码,所以不支持中文,如果需要在python2中更改编码,需要在中文的开始编写:

    #-*- encoding:utf-8 -*-

2. 编码回顾

    1,ASCII:最早的编码,里面有英文大写字母,小写字母,数字,一些特殊字符,没有中文。8个bit(位),1个byte(字节)。

2,GBK:中文国标码,里面包含了ASCII编码,16个bit,2个byte。

3,unicode:万国码,里面包含了全世界所有国家的文字编码,32个bit,4个byte,包含了ASCII。

4,UTF-8:可变长度的万国码,是unicode的一种实现,最小字符占8位

 英文:8bit  1byte

    欧洲文字:16bit  2byte

    中文:24bit  3byte

  综上,除了ASCII码以外,其他信息不能直接转换。

  在python3的内存中,在程序运行阶段使用的是unicode编码,因为unicode是万国码,什么内容都可以进行显示,那么在数据传输和存储的时候由于unicode比较浪费空间和资源,需要把unicode转存成UTF-8或者GBK进行存储,怎么转换呢,在python中可以把文字信息进行编码,编码之后的内容就可以进行传输了,编码之后的数据是bytes类型的数据,其实啊,还是原来的数据只是经过编码之后表现形式发生了改变而已。

总结:

	ASCII码英文占8位  1个字节
Unicod英文占32位 4个字节
Unicode中文占32位 4个字节
utf8英文占8位 1个字节
utf8中占16位 2个字节
gbk英文占8位 1个字节
gbk中文占16位 2个字节

bytes的表现形式

1,英文 b'alex',英文的表现形式和字符串没什么两样;

2,中文b'\xe4\xb8\xad',这是一个汉字的UTF-8的bytes表现形式;

# 编码:
s0 = "alex"
print(s0.encode("utf-8")) # 将字符串编码成UTF-8,结果为:b'alex'
print(s0.encode("GBK")) # 将字符串编码成GBK,结果为:b'alex' s = "中"
s1 = s.encode("UTF-8") # 中文编码成UTF-8,结果为:b'\xe4\xb8\xad'
s2 = s.encode("GBK") # 中文编码成GBK,结果为:b'\xd6\xd0' # 解码:
print(s1.decode("UTF-8")) # 结果为:中
print(s2.decode("GBK")) # 结果为:中

最新文章

  1. HDU 1074 Doing Homework (状压dp)
  2. 【转】 void与void*详解
  3. iOS 视图控制器转场详解
  4. 第23章 SEH结构化异常处理(2)_编译器对系统SEH机制的封装
  5. 给setTimeout和setIntreval函数添加回调参数
  6. 两年的坚持,最后还是决定将ISoft开源
  7. const,readonly,static
  8. session 重写进入redis测试
  9. MySQL库目录下db.opt文件的作用
  10. Hibernate的Criteria用法
  11. iOS判断机型
  12. Makefile中export分析
  13. UE4成批处理透明材质
  14. Windows Server 2016-DHCP增删功能介绍
  15. (办公)mybatis工作中常见的问题(不定时更新)
  16. ELK日志分析平台搭建
  17. android recovery升级过程中掉电处理
  18. 蓝桥杯 算法提高 9-3摩尔斯电码 _c++ Map容器用法
  19. Oracle EBS AR 客户取数SQL
  20. “全栈2019”Java第九十章:内部类可以向上或向下转型吗?

热门文章

  1. Spring 缓存注解 SpEL 表达式解析
  2. Vue知识整理12:事件绑定
  3. WPF DevExpress Chart控件 界面绑定数据源,不通过C#代码进行绑定
  4. 阶段3 1.Mybatis_05.使用Mybatis完成CRUD_8 Mybatis中的返回值深入-调整实体类属性解决增和改方法的报错
  5. Struts2基本流程
  6. 旅游局nginx配置
  7. 【Qt开发】设置Qt应用程序图标
  8. docker 安装mysql 并将文件挂载到本地
  9. Linux-SSH远程管理服务实战
  10. 十、Zabbix-自动关联模板