python文件操作-1.将PDF转成Excel
2024-10-07 02:18:49
# https://www.jianshu.com/p/f33233e4c712
import pdfplumber # 为了操作PDF
from openpyxl import Workbook
wb = Workbook() # 创建文件对象
ws = wb.active # 获取第一个sheet
path="C:/Users/Lenovo/Desktop/中国建筑集团2020届校园招聘需求名录.pdf"
pdf = pdfplumber.open(path)
print('\n')
print('开始读取数据')
print('\n')
print(pdf.pages[].extract_tables()[][])
ws.append(pdf.pages[].extract_tables()[][])
for page in pdf.pages:
# 获取当前页面的全部文本信息,包括表格中的文字
# print(page.extract_text())
for table in page.extract_tables():
# print(table)
for row in table:
if "序号" not in row:
# print(type(row))
rowlist=str(row).replace("[","",).replace("]","").replace("'","").replace("\\n","").split(",")
print(rowlist)
ws.append(rowlist)
print('---------- 分割线 ----------')
pdf.close()
# 保存Excel表
wb.save('中国建筑集团2020届校园招聘需求名录.xlsx')
print('\n')
print('写入excel成功')
print('保存位置:')
print('中国建筑集团2020届校园招聘需求名录.xlsx')
print('\n')
最新文章
- Spring基础学习笔记-Bean的基础知识
- OAF_开发系列01_实现OAF资料主从关系Master-Detail联动(案例)
- TopCoder
- Palindrome Partitioning II Leetcode
- AngularJS 中的 Promise 和 设计模式(转)
- 一模 (1) day2
- Sort Colors —— LeetCode
- [置顶] mkdir函数-linux
- HDU4344(大数分解)
- openstack私有云布署实践【14.2 登录页dashboard-controller(办公网环境)】
- angular2 学习笔记 ( 第3方插件 jQuery and ckeditor )
- Mysql-单表查询的操作和注意事项
- [NewLife.XCode]高级增删改
- git(三) 使用github
- easyui 单元格超出鼠标放上弹出全部
- Java并发编程(二)-- 创建、运行线程
- easyui中combobox 取值
- 滑动CheckBox样式
- win10上Tensorflow的安装教程
- 切图psd to html页面制作技术学习与总结
热门文章
- TextureMerger使用教程
- 基于Bootstrap 3可预览的HTML5文件上传插件
- JavaScript高程第三版笔记(1-5章)
- 【C/C++】对于可重入、线程安全、异步信号安全几个概念的理解
- IIS配置相关问题:Framework 4.5 在IIS 7.5中运行
- [python] 格式化方法 format
- 小记--------spark内核架构原理分析
- 说一下redis中5种数据类型的底层数据结构
- C++学习 之 类中的特殊函数和this指针(笔记)
- GDOI2018游记