lxml.etree.XMLSyntaxError: Opening and ending tag mismatch: meta line 4 and head, line 6, column 12 报错分析与解决方案
2024-10-21 07:46:20
报错分析:
我们检查代码没有任何问题,但报错显示:开始和结束标记不匹配。
html:因为html是超文本标记语言,代码不规范也能解析。
python:python是编程语言,代码不规范则解析不了。
解决方案:
我们只要给python指定解析器,他是不是能解析出网页呢?
parser = etree.HTMLParser(encoding="utf-8") #parser:解析器。文件名+网页类型+解析器(指定编码)
把parser解析器放到tree = etree.parse("b.html")里面:tree = etree.parse("b.html", parser=parser)
运行:
指定类型解码:etree.tostring(tree, encoding="utf-8").decode("utf-8")

:这是换行符,这个没有影响
最新文章
- java第三周学习
- php cli配置文件问题
- Sprite(精灵)&;&; 三个特殊的层Layer
- 如何配置pom.xml用maven打包java工程
- 红帽RHEL7版本RHCE认证学习及考试经历
- mongodb下载、安装、配置服务启动、及可视化工具下载、使用
- 对CSS进行wxss思路学习,display属性。
- SnapKit代码约束
- [札记]IL经典指令解析之方法调度
- SqlServer 如何以脚本形式导出数据
- TortoiseSVN文件夹及文件图标不显示解决方法 [转]
- android PreferenceScreen使用笔记
- C语言 - pthread
- Python序列化和反序列化
- Reveal 使用详解
- C# 如何获取可执行文件路径的上上级目录
- ajax得到后端数据一直提示为[object Object]解决方法
- 简单的epub制作
- 在做MVC和WebApi写返回数据时,可以这样定义
- D. Time to go back(思维)
热门文章
- 解决为知笔记docker镜像部署后登录连接mysql报错
- Qt6.2 在Ubuntu20下提示 C++ 和 CMake 错误
- ROS多机通信
- csv文件导入数据库中文乱码
- version libcrypto.so.10 not defined in file libcrypto.so.10 with link time reference
- 手写g++编译命令行工具笔记
- React-Navigation 5.x 的 demo案例
- IaaS--云上虚拟网络(何恺铎《深入浅出云计算》笔记整理)
- nanoPi R1 资料
- grep的正则匹配使用方式