1.打开网址https://www.v2ex.com/,查看其源码。

2.打开PyCharm编译器,新建工程c3-11,新建python file,命名为v2ex.py,同时,新建file,命名为v2ex.html。将https://www.v2ex.com/源码复制到v2ex.html中。

v2ex.py代码如下:

from pyquery import PyQuery

if __name__ == '__main__':
q = PyQuery(open('v2ex.html').read())
print q('title').html() 运行结果如下:

Css选择器:

演示代码:

# -*- encoding=UTF-8 -*-
from pyquery import PyQuery if __name__ == '__main__':
#<title>
q = PyQuery(open('v2ex.html').read())
print q('title').html() #div class="a"
for each in q('div.inner>a').items():
if each.attr.href.find('tab')>0:
print 1,each.attr.href #id=Tabs
for each in q('#Tabs>a').items():
print 2,each.attr.href # 连级
for each in q('.cell>a[href^="/go/"]').items():
print 3,each.attr.href
    for each in q('.cell a[href^="/go/"]').items():
print 4,each.attr.href for each in q('span.item_title>a').items():
print 5,each.html()
												

最新文章

  1. 代码的坏味道(13)——过多的注释(Comments)
  2. JS/CSS收藏
  3. SQL---一次插入多条数据【使用Union】
  4. Linux(10.18-10.25)学习笔记
  5. Hibernate3的DetachedCriteria支持
  6. Oracle RAC 11.2.0.4 – RHRL 6.4: DiskGroup resource are not running on nodes. Database instance may not come up on these nodes
  7. hadoop2.x通过Zookeeper来实现namenode的HA方案以及ResourceManager单点故障的解决方案
  8. PS基础
  9. Javascript:阻止浏览器默认右键事件,并显示定制内容
  10. Google map v3 using simple tool file google.map.util.js v 1.1
  11. Play Modules Morphia 1.2.9a 之 Aggregation and Group aggregation
  12. touchmover 手机端拖动方法
  13. Django之环境搭建以及初始配置
  14. mysql查询当天所有数据sql语句
  15. BZOJ_1196_[HNOI2006]公路修建问题_kruskal+二分答案
  16. Linux 中改变主机名的 4 种方法
  17. jquery:input操作
  18. C#实现在应用程序间发送消息的方法示例
  19. Ubuntu下安装Apache
  20. eclipse中切换jdk版本

热门文章

  1. EasyPlayer RTSP播放器对RTSP播放地址url的通用兼容修改意见
  2. OpenFileDialog对话框Filter属性(转)
  3. Qt中的通用模板算法QtAlgorithms(qDeleteAll,qBinaryFind,qCountLeadingZeroBits,qPopulationCount,qFill,qSwap,qSort)
  4. 【题解】T54037 最开始
  5. 2.2链表 链表中倒数第k个结点
  6. SDUT OJ 螺旋矩阵
  7. 在IIS中某一个网站启用net.tcp
  8. matlab的一个疑问?
  9. 【Java】CookieStore 类使用示例
  10. html5--2.6新的布局元素(5)-nav