Python数据结构常用模块:collections、heapq、operator、itertools

collections

  collections是日常工作中的重点、高频模块,常用类型有:

  计数器(Counter)

  双向队列(deque)

  默认字典(defaultdict)

  有序字典(OrderedDict)

  可命名元组(namedtuple) 

1. Counter

  Counter作为字典dicit()的一个子类用来进行hashtable计数,将元素进行数量统计,计数后返回一个字典,键值为元素,值为元素个数

  常用方法:

most_common(int) 按照元素出现的次数进行从高到低的排序,返回前int个元素的字典
elements 返回经过计算器Counter后的元素,返回的是一个迭代器
update 和set集合的update一样,对集合进行并集更新
substract 和update类似,只是update是做加法,substract做减法,从另一个集合中减去本集合的元素
iteritems 返回由Counter生成的字典的所有item
iterkeys 返回由Counter生成的字典的所有key
itervalues 返回由Counter生成的字典的所有value

  示例:

#coding=utf-8

from collections import Counter

str = "abcbcaccbbad"
li = ["a","b","c","a","b","b"]
d = {"":3, "":2, "":2} #Counter获取各元素的个数,返回字典
print ("Counter(s):", Counter(str))
print ("Counter(li):", Counter(li))
print ("Counter(d):", Counter(d)) #most_common(int)按照元素出现的次数进行从高到低的排序,返回前int个元素的字典
d1 = Counter(str)
print ("d1.most_common(2):",d1.most_common(2)) #elements返回经过计算器Counter后的元素,返回的是一个迭代器
print ("sorted(d1.elements()):", sorted(d1.elements()))
print ('''("".join(d1.elements())):''',"".join(d1.elements()))
#若是字典的话返回value个key
d2 = Counter(d)
print("若是字典的话返回value个key:", sorted(d2.elements())) #update和set集合的update一样,对集合进行并集更新
print ("d1.update("sas1"):",d1.update("sas1"))

>>>> Counter(s): Counter({'b': 4, 'c': 4, 'a': 3, 'd': 1})
>>>> Counter(li): Counter({'b': 3, 'a': 2, 'c': 1})
>>>> Counter(d): Counter({'1': 3, '3': 2, '17': 2})
>>>> d1.most_common(2): [('b', 4), ('c', 4)]
>>>> sorted(d1.elements()): ['a', 'a', 'a', 'b', 'b', 'b', 'b', 'c', 'c', 'c', 'c', 'd']
>>>> ("".join(d1.elements())): aaabbbbccccd
>>>> ['1', '1', '1', '17', '17', '3', '3']

2. deque

  deque属于高性能的数据结构之一,常用方法如下:

append 队列右边添加元素
appendleft 队列左边添加元素
clear 清空队列中的所有元素
count 返回队列中包含value的个数
extend 队列右边扩展,可以是列表、元组或字典,如果是字典则将字典的key加入到deque
extendleft 同extend,在左边扩展
pop 移除并返回队列右边的元素
popleft 移除并返回队列左边的元素
remove(value) 移除队列第一个出现的元素
reverse 队列的所有元素进行反转
rotate(n) 对队列数进行移动

3. defaultdict

  默认字典,字典的一个子类,继承所有字典的方法,默认字典在进行定义初始化的时候得指定字典值有默认类型

dic = defaultdict(dict)

  dic["k1"].update({"asdsa":""}) 

  print (dic)

>>> defaultdict(<class 'dict'>, {'k1': {'asdsa': ''}})

  注:字典dic在定义的时候就定义好了值为字典类型,虽然现在字典中还没有键值 k1,但仍然可以执行字典的update方法. 这种操作方式在传统的字典类型中是无法实现的,必须赋值以后才能进行值得更新操作,否则会报错。

4. OrderedDict

  有序字典也是字典的一个子类

  传统方法进行字典排序

#定义传统字典
dic1 = dict()
# 按顺序添加字典内容
dic1['a'] = ''
dic1['b'] = 'jjj'
dic1['c'] = ''
dic1['d'] = ''
print(dic1) # 结果: {'a': '123', 'c': '394', 'b': 'jjj', 'd': '999'}
# 排序
dic1_key_list = []
for k in dic1.keys():
dic1_key_list.append(k)
dic1_key_list.sort()
for key in dic1_key_list:
print('dic1字典排序结果 %s:%s' %(key,dic1[key]))

  使用OrderedDict对字典进行排序

#定义有序字典
dic2 = OrderedDict()
dic2['a'] = ''
dic2['b'] = 'jjj'
dic2['c'] = 'abc'
dic2['d'] = ''
for k, v in dic2.iteritems():
print('有序字典:%s:%s' %(k,v))

5. namedtuple

  namedtuple由自己的类工厂namedtuple()进行创建,而不是由表中的元组进行初始化,通过namedtuple创建类的参数包括类名称和一个包含元素名称的字符串

  常用方法示例:

#coding=utf-8

from collections import namedtuple

p = namedtuple("person", "name,age,sex")
print (type(p)) zhanglin = p("zhanglin",30,"male")
print(zhanglin)
print(zhanglin.name,zhanglin.age)

 >>> <class 'type'>
 >>> person(name='zhanglin', age=30, sex='male')
 >>> zhanglin 30

  rename参数使用

  使用namedtuple()来创建类的时候,传递的成员属性参数名称不能非法(不能重复,不能为系统标识符),否则会报错

try:
pp = namedtuple("person","name,age,class,sex")
print(pp._fields)
lili = pp("lili",20,"aa","male")
except Exception as e:
print("error",e)

 >>> error Type names and field names cannot be a keyword: 'class'

  输入错误非我们可以控制,namedtuple提供rename=True参数会使系统自动的将错误的参数通过“下划线+参数索引”的方式将参数名称替换

try:
pp = namedtuple("person","name,age,class,sex",rename=True)
print(pp._fields)
lili = pp("lili",20,"aa","male")
except Exception as e:
print("error",e)

 >>> ('name', 'age', '_2', 'sex')

最新文章

  1. 了解vmware tools
  2. EF循环迭代导致如此严重的性能丢失,你知道?
  3. SharePoint中使用C#跳转页面的研究
  4. 更新日志 - fir.im Jenkins &amp; Gradle 插件上线
  5. Properties类使用
  6. 使用uiautomator做UI测试
  7. HDU 2577 How to Type(dp题)
  8. RTC系统
  9. [POJ1753]Flip Game(异或方程组,高斯消元,枚举自由变量)
  10. Android Studio git ignore
  11. Java RMI 简介及其优劣势总结
  12. curl 要么 file_get_contents 获得授权页面的方法的必要性
  13. sql server 行转列 Pivot UnPivot
  14. Spring Boot快速入门
  15. 2017web前端面试总结
  16. Codeforces475D - CGCDSSQ
  17. mybatis_16逆向工程
  18. JAVA基础知识点转载
  19. 32个Chrome 针对网页设计师和开发人员扩展
  20. [BZOJ3507]通配符匹配

热门文章

  1. js中this详解
  2. Android开发之漫漫长途 XIII——Fragment最佳实践
  3. 转-Windows路由表配置:双网卡路由分流
  4. maven依赖问题
  5. 邪恶的PLS
  6. Android ButterKnife注解式开发
  7. ftp服务配置
  8. java SimpleDateFormat日期与时间戳的相互转换
  9. Oracle-Linux安装配置python3.6环境
  10. spring实例化bean三种方式