报错分析:

我们检查代码没有任何问题,但报错显示:开始和结束标记不匹配。

html:因为html是超文本标记语言,代码不规范也能解析。

python:python是编程语言,代码不规范则解析不了。

解决方案:

我们只要给python指定解析器,他是不是能解析出网页呢?

parser = etree.HTMLParser(encoding="utf-8") #parser:解析器。文件名+网页类型+解析器(指定编码)
把parser解析器放到tree = etree.parse("b.html")里面:tree = etree.parse("b.html", parser=parser)

运行:

指定类型解码:etree.tostring(tree, encoding="utf-8").decode("utf-8")
&#13:这是换行符,这个没有影响



最新文章

  1. java第三周学习
  2. php cli配置文件问题
  3. Sprite(精灵)&& 三个特殊的层Layer
  4. 如何配置pom.xml用maven打包java工程
  5. 红帽RHEL7版本RHCE认证学习及考试经历
  6. mongodb下载、安装、配置服务启动、及可视化工具下载、使用
  7. 对CSS进行wxss思路学习,display属性。
  8. SnapKit代码约束
  9. [札记]IL经典指令解析之方法调度
  10. SqlServer 如何以脚本形式导出数据
  11. TortoiseSVN文件夹及文件图标不显示解决方法 [转]
  12. android PreferenceScreen使用笔记
  13. C语言 - pthread
  14. Python序列化和反序列化
  15. Reveal 使用详解
  16. C# 如何获取可执行文件路径的上上级目录
  17. ajax得到后端数据一直提示为[object Object]解决方法
  18. 简单的epub制作
  19. 在做MVC和WebApi写返回数据时,可以这样定义
  20. D. Time to go back(思维)

热门文章

  1. 解决为知笔记docker镜像部署后登录连接mysql报错
  2. Qt6.2 在Ubuntu20下提示 C++ 和 CMake 错误
  3. ROS多机通信
  4. csv文件导入数据库中文乱码
  5. version libcrypto.so.10 not defined in file libcrypto.so.10 with link time reference
  6. 手写g++编译命令行工具笔记
  7. React-Navigation 5.x 的 demo案例
  8. IaaS--云上虚拟网络(何恺铎《深入浅出云计算》笔记整理)
  9. nanoPi R1 资料
  10. grep的正则匹配使用方式