lxml获取结点属性整并转换为字典参数
2024-09-05 09:34:59
#-*- coding: UTF- -*- from lxml import etree source = u'''
<div><p class="p1" data-a="">测试数据1</p>
<p class="p1" data-a="">测试数据2</p>
<p class="p1" data-a="" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="" width=""><img src="1.jpg" class="img"/><br/>
图片</p>
''' # 从字符串解析
page = etree.HTML(source) # 元素列表
ps = page.xpath("//p")
for p in ps:
print u"属性:%s" % p.attrib
print u"文本:%s" % p.text # 文本列表
ts = page.xpath("//p/text()")
for t in ts:
print t # xpath定位
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
print l.attrib
最新文章
- jquery.nicescroll.js可全屏可改滚动条颜色的滚动条插件-推荐
- html5 炫酷的字幕雨
- storyboard传值方式
- zoj 1789 The Suspects
- mvc-servlet---servletContext与servletConfig2
- Jenkins进阶系列之——16一个完整的JENKINS下的ANT BUILD.XML文件
- SQL 语句集合
- 利用LibreOffice转换ppt、doc转化pdf
- Github在windows7环境下使用入门
- HTML CSS编码规范(黄金定律)
- Lua快捷键
- TCP传输中序号与确认序号的交互
- 以太坊智能合约虚拟机(EVM)原理与实现
- Easy methods to select MB Star, Extremely MB Star, MB SD C4, Mercedes BENZ C5 SD
- Angular 2/4/5+ 重复点击菜单刷新界面
- 自定义控件详解(六):Paint 画笔MaskFilter过滤
- poj2739(尺取法+质数筛)
- mysql恢复ibd文件
- play framework - 初识
- linux 《vmware下克隆的centos无法配置固定ip》