# xml  是一门可拓展的语言
# xml 语法 是用<>包裹的起来的<>就是标签, xml可以由多个<>组成 也可以由单个<>组成,
# <tag></tag> 双标签
# <tag/> 单标签 没有文本 一般用于设计文档结构 例如换行等
# <tr/> 表示换行
# xml的组成部分 1)标签名称 2)文本信息 test 3)标签属性

案例

'''
例如
<tag style="color:red" age="18">12345</tag>
一个标签的完整组成 有三个部分
tag 是标签名称
12345 是文本内容 text
style="color:red" age="18" 是标签的属性 其他的规范
1.又开始就必须有结束
2.所有属性值必须包含在双引号里面
3.只能有一个根标签 (最外层只能有一个标签)
4.开始标签和结束标签的顺序是相反的 最先打开谁 就最后关闭谁 最后打开的最先关闭
'''

xml模块的运用

#   可以理解为解析树的过程 树-根标签-子标签
# 1:首先导入xml文本 ==相当于得到一个树
'''
import xml.etree.ElementTree as ET
tree =ET.parse('test1.xml') # 相当于得到一个树 就是得到xml文档
# 2 获取跟标签
root = tree.getroot() # 获取跟标签
'''
# 3 获取跟下面的标签
# 获取所有子标签root.iter() 获取所有某某子标签root.item('参数')
# 获取单标签 root.find('参数')
# 获取多标签root.fandall(参数) # 遍历所有root跟的标签
# for tag in root:
# print(tag) # 遍历test1.xml文档下的所有标签
# for tag in root.iter(): # iter 可迭代的一种对象
# print(tag) # 从root下查找第一个名字为country的子标签
# country = root.find('country')
# print(country) # <Element 'country' at 0x000001FC622A9638> # 从root下查找所有名字为country的子标签
# countrys = root.findall('country')
# print(countrys) # 从root下查找所有名字为country的子孙标签
'''
for tag in root.iter('country'):
print(tag)
'''
"""

查找标签的4种方式test1.xml

1.
iter()
如果没有参数则查找所有标签
如果有参数则查找所有名字匹配的标签
查找范围
为全文 2.
find()
必须给参数
查找当前标签的子标签
返回第一个名字匹配的 3.
findall()
必须给参数
查找当前标签的子标签
返回所有名字匹配的 4.
直接遍历某个标签
返回的是这个标签的所有子标签
"""

  

与json的区别

'''

    xml 是一种可扩展的标记语言
可以高度自定义文档的结构 数据类型 标签的含义等等
所以扩展性远比JSON要强 json更加适用于 前后台数据交换 优点 轻量级 跨平台 语法简洁
xml更多用来作为配置文件 当然 python不太常用
html就是一种xml
''' # 获取某个标签的内容 (则是找到标签名称 标签属性 和文本信息)
'''
import xml.etree.ElementTree as ET
tree =ET.parse('test1.xml')
root = tree.getroot()
ob = root.findall('country')
# 找到标签名称
for i in ob:
print(i.tag) # 标签名称
print(i.attrib) # 标签的所有属性 返回一个字典
print(i.text) # 标签的文本内容
''' import xml.etree.ElementTree as ET
from xml.etree.ElementTree import Element
# tree = ET.parse("test.xml")
# root = tree.getroot()
# # 修改文本
# root.text = "这是跟标签的文本"
# # 修改属性 没有则添加 有则覆盖
# root.set("name","jack")
# # 修改标签名字
# root.tag = "data"
#
# tree.write("test2.xml",encoding="utf-8",xml_declaration=True) # 把test1.xml 中所有year标签的text加1
# tree = ET.parse("test1.xml")
# root = tree.getroot()
# for e in root.iter("year"):
# e.text = str(int(e.text) + 1)
#
#
# tree.write("test1.xml") #
# 把test1.xml 中所有gdppc删除
# remove 函数 需要一个标签作为参数 即要被删除的标签 然后只能有父标签来删除子标签
# tree = ET.parse("test1.xml")
# root = tree.getroot()
#
# for c in root.iter("country"):
# gdppc = c.find("gdppc")
# if gdppc != None:
# c.remove(gdppc)
#
# tree.write("test4.xml") # 添加标签 tree = ET.parse("test1.xml")
root = tree.getroot() # type:Element
# 创建需要被添加的子标签
new_tag = Element("ThisIsNewTag")
new_tag.text = "123" # 设置文本
root.append(new_tag) # 添加到root下
tree.write("test5.xml") # 写入文件

  

最新文章

  1. Amazon Interview | Set 27
  2. java 装饰者模式与继承的区别
  3. ldap + kerberos + google authentication 实现两步验证
  4. Openstack Basic Networking 翻译
  5. Mysql Condition /Handler(异常处理)
  6. Fragment与FragmentAcitvity间的传值
  7. js打印对象(object)
  8. linux 大量的TIME_WAIT解决办法
  9. Energy Minimization
  10. Palindrome - URAL - 1297(求回文串)
  11. 如何搭建lamp(CentOS7+Apache+MySQL+PHP)环境
  12. Python变量之白首如新,倾盖如故
  13. Linux-基础学习(二)-基本部署
  14. react_app 项目开发
  15. linux 入门学习
  16. python标准库之secrets
  17. yum update软件包冲突
  18. PostMan请求不到接口问题
  19. VM 虚拟机网络配置
  20. 有用的Python代码片段

热门文章

  1. jQuery性能优化与技巧
  2. 分布式消息队列Apache Pulsar
  3. C#函数的基础应用
  4. LeetCode Day 11
  5. 响应式WEB页面开发实践
  6. 3DMAX 卸载工具,完美彻底卸载清除干净3dmax各种残留注册表和文件
  7. python开发时小问题之端口占用
  8. HDU1233 还是畅通工程
  9. 浅谈JobExecutionContext &amp; JobDataMap
  10. springboot oauth 鉴权之——password、authorization_code鉴权