Python__Xpath模块
2024-10-19 10:15:30
import requests
from lxml import etree # 导入xpath headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36'
} tree = etree.parse('./相关/test.html')
#定位标签
# print(tree.xpath('//div')) #定位指定的所有标签
#属性定位
# print(tree.xpath('//div[@class="tang"]'))
#索引定位:索引是从1开始的
# print(tree.xpath('//div[1]'))
#层级定位:/表示一个层级,//表示多个层级
# print(tree.xpath('//div[@class="tang"]/ul/li[4]/a'))
# print(tree.xpath('//div[@class="tang"]//li[4]/a')) #内容提取:/text(),//text()
# print(tree.xpath('//div[@class="tang"]/ul/li[4]/a/text()')[0])
#取属性值:/@atrrName
# print(tree.xpath('//div[@class="tang"]/ul/li[4]/a/@href')[0])
最新文章
- Android音频介绍
- C++ Primer 第三章 标准库类型vector+迭代器iterator 运算
- tornado解析http body的过程分析
- 【Cardboard】 体验 - Google Cardboard DIY及完成后简单体验
- Two-Phase-Commit for Distributed In-Memory Caches--reference
- Spring中@Transactional(rollbackFor = Exception.class)的作用
- wait/notify实现线程间的通信
- dubbo 实战
- P1231 教辅的组成
- mybatis 初步使用(IDEA的Maven项目, 超详细)
- Android 输入法遮挡问题
- pyculiarity 时间序列(异常流量)异常检测初探——感觉还可以,和Facebook的fbprophet本质上一样
- solrcloud 搭建资料
- ES6的新特性(4)——字符串的扩展
- Integer.MIN_VALUE
- zabbix-agent安装
- checkpoint(sqlserver数据库检查点)
- github 专案介绍 – Python 范例:透过互动式的 Jupyter 和数学解释流行的机器学习演算法
- 键值对集合 dict(字典)
- 转:InnoDB Crash Recovery 流程源码实现分析