Tag names:当仅使用1个tag的时候,xpath匹配具有该标签名称的所有直接子元素. Paths:通过/符号连接tag名称,例如second/child将匹配父元素second下所有的child子元素. 请注意,如果有多个父元素都有子元素,则xpath将匹配所有这些子元素. Wildcards(通配符):通配符*匹配所有元素 Current element:当前元素用一个点(.)表示,通常,当前元素是隐式的,不需要包含在xpath中. Parent element:其他元素的父元素用两个
什么是xpath? 来自百度百科的解释:XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言.XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力.XPath 是 XML 路径语言,用来查询 XML 文档里中的节点.主流的浏览器都支持 Xpath,因为 HTML 页面在 DOM 中表示为 XHTML 文档.Xpath 语言是基于 XML 文档的树结构,并且提供了浏览树的能力,通过多样的标准来选择结点.Selenium WebDriver
使用chrome调试xpath 相信玩过爬虫的都知道一些库,如lxml(python),可以使用xpath方便地对HTML进行提取,但当真正用的时候,问题就来了,想找到一个元素往往要调试好几遍,而且得先code,下面提供了几个工具及如何用chrome进行xpath test 1.XPath Helper https://chrome.google.com/webstore/detail/xpath-helper/hgimnogjllphhhkhlmebbmlgjoejdpjl 1. Open a