爬虫之xpath解析库
2024-08-30 14:44:52
xpath语法:
1.常用规则:
1. nodename: 节点名定位
2. //: 从当前节点选取子孙节点
3. /: 从当前节点选取直接子节点
4. nodename[@attribute="..."] 根据属性定位标签 '//div[@class="ui-main"]'
5. @attributename: 获取属性
6. text(): 获取文本
2.属性匹配两种情况: 多属性匹配 & 单属性多值匹配
2.2 多属性匹配
示例: tree.xpath('//div[@class="item" and @name="test"]/text()')
2.1 单属性多值匹配
示例: tree.xpath('//div[contains(@class, "dc")]/text()')
3.按序选择:
3.1 索引定位: 从1开始(牢记, 牢记, 牢记)
3.2 last()函数
3.3 position()函数
最新文章
- mongodb提示api-ms-win-crt-runtimel1-1-0.dll缺失的解决方案
- 为自己的爬虫更换代理和HTML头部
- 2015-2016-2 《Java程序设计》 游戏化
- maven创建web工程,并导入到eclipse中
- Python-类的继承
- struts2理解
- How to use JDBC-Authentication of Spring Boot/Spring Security with Flyway
- OC单例模式的实现
- in an effort to
- android生成验证码bitmap
- maven新建的项目,不自动引入依赖包
- nginx/php的redis模块扩展
- Python_lambda
- [小程序]_ELVE_小程序开发(1)
- JavaScript常见的继承方式
- springcloud 入门 7 (zuul路由网关)
- Android 百度sdk5.0定位
- SpringMVC异常处理注解@ExceptionHandler@ControllerAdvice@ResponseStatus
- 新建虚拟机_WIN8 64位系统_启动报错Directory ";EZBOOT"; not found
- word图文混排复制到UEditor图片不显示