08.06自我总结

python爬虫网页解析之lxml模块

一.模块的安装

windows系统下的安装:

方法一:pip3 install lxml

方法二:下载对应系统版本的wheel文件:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

pip3 install lxml-4.2.1-cp36-cp36m-win_amd64.whl #文件所在的路径

linux下安装:

方法一:pip3 install lxml

方法二:yum install -y epel-release libxslt-devel libxml2-devel openssl-devel

二.模块的使用

from lxml.html import etree

演示

import requests
from lxml.html import etree rp = requests.get('http://www.baidu.com')
html = etree.HTML(rp.text)
#解析后的对象可以使用xpath进行内容匹配

xpath的路径写法

最新文章

  1. php中array_filter的使用
  2. sqlserver执行sql文件命令(sqlcmd)
  3. Div中高度自适应增长方法
  4. Head First 设计模式 --9 迭代器模式 组合模式
  5. JQuery中ajax跨域问题
  6. LeetCode 204. Count Primes (质数的个数)
  7. 前端测试框架Jest系列教程 -- Matchers(匹配器)
  8. 使用IntelliJ IDEA的小技巧快乐编程(2)
  9. nginx启用status状态页
  10. rt-thread中线程内置定时器的作用 ---
  11. scrapy基础二
  12. redis的安装与简单使用
  13. elk-准备(一)
  14. CSS选择符-----属性选择符
  15. Python Selenium 文件上传之Autoit
  16. Socket.io各个发送消息的含义【发送对象范围】
  17. 判断元素16种方法expected_conditions
  18. MySQL与OLAP:分析型SQL查询最佳实践探索
  19. css3 弹性盒模型 变化
  20. ACM第二站————STL之stack

热门文章

  1. C#线程学习笔记七:Task详细用法
  2. 如何入侵SF服务器/充当GM刷元宝
  3. CSS 盒子模型、RestCSS、浮动、定位
  4. Cesium专栏-terrain地形、3dtiles模型、gltf模型 高度采样
  5. Windows密码获取和破解(初探)
  6. PMBOK 指南 第三章 项目经理的角色
  7. CentOS 7上的主机名设置和基本网络管理
  8. Elasticsearch系列---初识Elasticsearch
  9. ubuntu安装navicat
  10. ES-映射和分析