读/写docx文件
2024-09-04 04:14:28
安装 pip install python-docx
1.建立新Word文档
建立新文档需要调用Document对象的save方法,
一个Document对象代表一个Word文档,该方法的参数是保存的文件名。
from docx import Document
doc = Document()
doc.save("test.docx")
2.添加段落和段落文字
调用Document对象的add_paragraph方法,返回值是一个Paragraph对象。
调用Paragraph对象的add_run方法为该段落添加文字。add_run方法的返回值是一个Run对象,需要设置该对象属性。
from docx import Document
doc = Document()
p = doc.add_paragraph('无格式的部分')
p.add_run('加粗部分').bold = True
p.add_run('无格式')
p.add_run('斜体部分').italic = True
doc.save(r".\test.docx")
无格式的部分加粗部分 无格式 斜体部分
3.读取文档的所有段落
Document对象的paragraphs属性是一个包含文档所有Paragraph对象的列表对象,
一个Paragraph对象代表文档的一个段落。对paragraphs属性进行循环遍历可以操作文档的所有段落。
Paragraph对象的text属性代表该段落的文字。
from docx import Document
doc = Document("./test.docx")
for p in doc.paragraphs:
print(p.text)
4.读取文档表格中的文字
Document对象的tables属性是一个包含文档所有Table对象的列表对象,
一个Table对象代表文档的一个表格。Table对象的cells属性是一个包含表格所有_Cell对象的列表
,一个_Cell对象代表表格的一个单元格。对表格的cells属性进行循环遍历可以操作表格的所有单元格。
_Cell对象的text属性代表该单元格的文字。
from docx import Document
doc = Document("./Python.docx")
for t in doc.tables:
for c in t._cells:
print(c.text)
最新文章
- http://note.youdao.com/yws/public/redirect/share?id=2bc2dc6c7df6013e9f8106c005da999a&type=false
- go git 安装配置与使用 (windows 7 64bit)
- CSS的盒子模型
- Spring MVC 前后端 Json 方式交互和处理
- 线性回归&;&;code
- java Jsoup 抓取页面数据
- 当使用母版页时JavaScript客户端获取服务器控件的Id
- TYVJ P1037 阶乘统计2 Label:坑
- php大力力 [011节] PHP常量使用场景
- 【python,排序】几种常用的排序算法,使用python实现
- Android之基于HTTP协议的下载
- Spring AOP (Spring 3.x 企业应用开发实战读书笔记第六章)
- Extjs之combobox联动
- 2013集训.DAY21.A
- Django form模块使用心得
- Unicode、UTF-8 和 ISO8859-1到底有什么区别
- Gitlab-CI持续集成之Runner配置和CI脚本
- python实现散列表的链表法
- 转义字符\(在hive+shell以及java中注意事项):正则表达式的转义字符为双斜线,split函数解析也是正则
- 2,fiddler的基本设置