import pdfplumber

 with pdfplumber.open('test.pdf') as pdf:
#page_count = len(pdf.pages())
p0 = pdf.pages[0]
# 获取文本,直接得到字符串,包括了换行符【与PDF上的换行位置一致,而不是实际的“段落”】
#print(p0.extract_text())
# 获取本页全部表格,也可以使用extract_table()获得单个表格
for table in p0.extract_tables():
#得到的table是嵌套list类型,转化成DataFrame更加方便查看和分析
for line in table:
print(line) #安装ImageMagick,地址在下面
#http://docs.wand-py.org/en/latest/guide/install.html#install-imagemagick-on-windows
16 #https://blog.csdn.net/blmoistawinde/article/details/82051915

最新文章

  1. was not declared in this scope
  2. 【转】ACM训练计划
  3. javascript类型注意事项
  4. C#判断网站运行状态是否正常
  5. 模拟键盘输入首先要用到一个API函数:keybd_event
  6. css基本属性
  7. log翻硬币
  8. 每天一个JavaScript实例-推断图片是否载入完毕
  9. 【高德地图API】那些年我们一起开发的APP—即LBS应用模式分享
  10. sw代码问题
  11. 阅读MDN文档之CSS选择器介绍(一)
  12. hive入门(一)、什么是hive
  13. 使用axios以及http-proxy-middleware代理处理跨域的问题
  14. MySQL my.cnf 配置文件注释
  15. PAT1008:Elevator
  16. HDU 1212 Big Number(C++ 大数取模)(java 大数类运用)
  17. 使用libcurl 发送post请求
  18. for in,Object.keys和Object.getOwnPropertyNames的区别
  19. render, render_to_response, redirect,
  20. BASIC-10_蓝桥杯_十进制转十六进制

热门文章

  1. Python:日期和时间类型学习
  2. 用UIBezierPath数组对UIView进行镂空处理
  3. 用UIInterpolatingMotionEffect产生透视效果
  4. dip和px的相互转化
  5. 用Handler的post()方法来传递线程中的代码段到主线程中执行
  6. Java Callable接口、Runable接口、Future接口
  7. frp官方中文文档
  8. ArcGisServer根据最大最小坐标换算瓦片行列号【转】
  9. Set Matrix Zeroes leetcode java
  10. win7系统不能用telnet命令的两种解决方法