爬虫之xpath解析库

xpath语法:

1.常用规则:

   1.  nodename:  节点名定位

   2.  //:  从当前节点选取子孙节点

   3.  /:  从当前节点选取直接子节点

   4.  nodename[@attribute="..."]  根据属性定位标签  '//div[@class="ui-main"]'

   5.  @attributename:   获取属性

   6.  text():   获取文本

2.属性匹配两种情况: 多属性匹配 &  单属性多值匹配

  2.2 多属性匹配

  示例: tree.xpath('//div[@class="item" and @name="test"]/text()')

  2.1 单属性多值匹配

  示例: tree.xpath('//div[contains(@class, "dc")]/text()')

3.按序选择:

  3.1 索引定位: 从1开始(牢记， 牢记， 牢记)

  3.2 last()函数

  3.3 position()函数
巴特西

爬虫之xpath解析库

最新文章

热门文章