#-*- coding: UTF- -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="">测试数据1</p>
<p class="p1" data-a="">测试数据2</p>
<p class="p1" data-a="" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="" width=""><img src="1.jpg" class="img"/><br/>
图片</p>
''' # 从字符串解析
page = etree.HTML(source) # 元素列表
ps = page.xpath("//p")
for p in ps:
print u"属性:%s" % p.attrib
print u"文本:%s" % p.text # 文本列表
ts = page.xpath("//p/text()")
for t in ts:
print t # xpath定位
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
print l.attrib

最新文章

  1. jquery.nicescroll.js可全屏可改滚动条颜色的滚动条插件-推荐
  2. html5 炫酷的字幕雨
  3. storyboard传值方式
  4. zoj 1789 The Suspects
  5. mvc-servlet---servletContext与servletConfig2
  6. Jenkins进阶系列之——16一个完整的JENKINS下的ANT BUILD.XML文件
  7. SQL 语句集合
  8. 利用LibreOffice转换ppt、doc转化pdf
  9. Github在windows7环境下使用入门
  10. HTML CSS编码规范(黄金定律)
  11. Lua快捷键
  12. TCP传输中序号与确认序号的交互
  13. 以太坊智能合约虚拟机(EVM)原理与实现
  14. Easy methods to select MB Star, Extremely MB Star, MB SD C4, Mercedes BENZ C5 SD
  15. Angular 2/4/5+ 重复点击菜单刷新界面
  16. 自定义控件详解(六):Paint 画笔MaskFilter过滤
  17. poj2739(尺取法+质数筛)
  18. mysql恢复ibd文件
  19. play framework - 初识
  20. linux 《vmware下克隆的centos无法配置固定ip》

热门文章

  1. Scopus数据库简介
  2. Alpha冲刺(8/10)——2019.4.30
  3. thinkphp5的钩子怎么用
  4. linux中用一个.sh文件执行多个.sh文件
  5. AntDesign vue学习笔记(二)axios使用
  6. SpringBoot:4.SpringBoot整合Mybatis实现数据库访问
  7. .NET Core如何使用NLog
  8. Prometheus 重新标签
  9. SET QUOTED_IDENTIFIER选项对索引的影响
  10. vim:spell语法