xpath解析百度页面的百度一下

# 1)获取网页的源码
# 2)解析的服务器响应的文件 etree.HTML , 用来解析字符串格式的HTML文档对象,将传进去的字符串转变成 element 对象
# 3)打印 import urllib.request # 请求地址
url = 'https://www.baidu.com/' # 请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36'
} # 请求对象的定制
request = urllib.request.Request(url = url, headers = headers) # 模拟浏览器访问服务器
response = urllib.request.urlopen(request) # 获取网页源码
content = response.read().decode('utf-8') # 解析网页源码 来获取我们想要的数据
from lxml import etree # 解析服务器响应的文件
tree = etree.HTML(content) # 获取想要的数据 xpath的返回值是一个列表类型的数据
result = tree.xpath('//input[@id="su"]/@value')[0] print(result)

最新文章

  1. C#使用ADO.NET访问数据库(一)
  2. hive 复杂类型
  3. bzoj1091: [SCOI2003]切割多边形
  4. [译] 企业级 OpenStack 的六大需求(第 1 部分):API 高可用、管理和安全
  5. XSS代码触发条件,插入XSS代码的常用方法
  6. HM必修1
  7. twitter storm 源码走读之5 -- worker进程内部消息传递处理和数据结构分析
  8. 静态Web开发 JavaScript
  9. CSS围住浮动元素的三种方法
  10. 如何在CMD下运用管理员权限
  11. JavaScript基础一(js基础函数与运算符)
  12. PHP获取一周的日期
  13. Workflow相关表简单分析
  14. getWidth()和getMeasuredWidth()的区别
  15. 谷歌浏览器安装octotree插件
  16. docker 常用操作
  17. 【JEECG技术文档】JEECG高级查询构造器使用说明
  18. 中断标志位 IRQF_ONESHOT
  19. Mybatis学习(1)
  20. SpringBoot中使用Redis

热门文章

  1. Python 文件路径设置
  2. 使用 grpcurl 通过命令行访问 gRPC 服务
  3. C++手动加载CLR运行托管程序(CLR Hosting)
  4. 初学Python-day1 运算符和数据类型
  5. 关于ORBSLAM的发展脉络
  6. 阿里大神favoorr提供的书单
  7. luogu P4243 [JSOI2009]等差数列 题解
  8. 上午小测1 T1 木板 题解
  9. matlab添加永久路径
  10. 【做题记录】[NOI2008] 假面舞会—有向图上的环与最长链