Python基础-列表生成式和生成器表达式
一、列表生成式(List Comprehension)
列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。
举个例子,要生成list
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
可以用list(range(1, 11))
:
>>> list(range(1, 11))
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
但如果要生成[1x1, 2x2, 3x3, ..., 10x10]
怎么做?方法一是循环:
>>> L = []
>>> for x in range(1, 11):
... L.append(x * x)
...
>>> L
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
但是循环太繁琐,而列表生成式则可以用一行语句代替循环生成上面的list:
>>> [x * x for x in range(1, 11)]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
写列表生成式时,把要生成的元素x * x
放到前面,后面跟for
循环,就可以把list创建出来,十分有用,多写几次,很快就可以熟悉这种语法。
for循环后面还可以加上if判断,这样我们就可以筛选出仅偶数的平方:
>>> [x * x for x in range(1, 11) if x % 2 == 0]
[4, 16, 36, 64, 100]
还可以使用两层循环,可以生成全排列:
>>> [m + n for m in 'ABC' for n in 'XYZ']
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
三层和三层以上的循环就很少用到了。
运用列表生成式,可以写出非常简洁的代码。例如,列出当前目录下的所有文件和目录名,可以通过一行代码实现:
>>> import os # 导入os模块,模块的概念后面讲到
>>> [d for d in os.listdir('.')] # os.listdir可以列出文件和目录
['.emacs.d', '.ssh', '.Trash', 'Adlm', 'Applications', 'Desktop', 'Documents', 'Downloads', 'Library', 'Movies', 'Music', 'Pictures', 'Public', 'VirtualBox VMs', 'Workspace', 'XCode']
for循环其实可以同时使用两个甚至多个变量,比如dict
的items()
可以同时迭代key和value:
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
>>> for k, v in d.items():
... print(k, '=', v)
...
y = B
x = A
z = C
因此,列表生成式也可以使用两个变量来生成list:
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
>>> [k + '=' + v for k, v in d.items()]
['y=B', 'x=A', 'z=C']
最后把一个list中所有的字符串变成小写:
>>> L = ['Hello', 'World', 'IBM', 'Apple']
>>> [s.lower() for s in L]
['hello', 'world', 'ibm', 'apple']
练习:
如果list中既包含字符串,又包含整数,由于非字符串类型没有lower()
方法,所以列表生成式会报错:
l = ['Hello', 'World', 'IBM', 'APPLE', 18, None]
[s.lower() for s in l]
Traceback (most recent call last):
File "<input>", line 1, in <module>
File "<input>", line 1, in <listcomp>
AttributeError: 'int' object has no attribute 'lower'
使用内建的isinstance
函数可以判断一个变量是不是字符串:
[s.lower() for s in l if isinstance(s,str)]
['hello', 'world', 'ibm', 'apple']
二、生成器表达式
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。
只要把一个列表生成式的[]
改成()
,就创建了一个generator:
l = [x * x for x in range(10)]
l
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
g = (x *x for x in range(10))
g
<generator object <genexpr> at 0x00000247C4BFA518>
创建l
和g
的区别仅在于最外层的[]
和()
,L
是一个list,而g
是一个generator。
使用generator的元素可以使用next()函数和for循环
next(g)
0
next(g)
1
next(g)
4
next(g)
9
next(g)
16
next(g)
25
next(g)
36
next(g)
49
next(g)
64
next(g)
81
next(g)
Traceback (most recent call last):
File "<input>", line 1, in <module>
StopIteration
g = (x * x for x in range(10))
for n in g:
print(n) 0
1
4
9
16
25
36
49
64
81
for循环会自动处理StopIteration报错信息
以上内容完全来自廖雪峰的教程,非常感谢!
最新文章
- mysql-data-dumper
- mysql数据表拷贝
- centos7 dokcer fastdfs
- php : DOM 操作 XML
- js 节点属性
- tomcat重启session不过期的处理
- linux 的useradd 命令的p选项
- angularJS平行控制器间共享数据
- IIS、Asp.net 编译时的临时文件路径(转载)
- SQL Server查询性能优化——堆表、碎片与索引(二)
- css样式继承 第7节
- Linux - CentOS6.5服务器搭建与初始化配置详解(上)
- php开发环境安装配置(2)-eclipsephp
- IDEA 快捷键整理
- Dell M102ZD-128 —— 拿XP拯救你
- 史上最全的njRAT通信协议分析
- Tomcat访问路径去掉发布项目的项目名称
- 主机连接虚拟机redis 服务器
- 实践:搭建基于Load Balancer的MySql Cluster
- nginx:location指令中的正则表达式