pyquery 这个模块基本是仿JQuery的形式,也支持CSS选择器语法,因此对于爬虫来说,避免了正则表达式的滥用. 创建对象 from pyquery import PyQuery as pq d = pq("<html></html>") d = pq(url='http://google.com/') d = pq(filename=path_to_html_file) 既可以通过HTML文档字串创建对象,也可以直接使用url(内部调用了urllib等模
python安装 windows 下载安装包 https://www.python.org/downloads 改环境变量 [右键计算机]-->[属性]-->[高级系统设置]-->[高级]-->[环境变量]--> 如:原来的值;C:\python3,切记前面有分号 linux wget https://www.python.org/ftp/python/3.5.2/Python-3.5.2.tgz tar xf Python-3.5.0.tgz cd Python-3.5
#!/usr/bin/python # Filename: cat.py import sys def readfile(filename): '''Print a file to the standard output.''' f = file(filename) while True: line = f.readline() if len(line) == 0: break print line, # notice comma f.close() # Script starts from h