序言 (https://jq.qq.com/?_wv=1027&k=GmeRhIX0)

老板最近越来越过分了,快下班了发给我几百个表格让我把内容合并到一个表格内去。

还好我会Python,分分钟就搞定了,这要是换个不会Python的,不得加班到第二天天亮去了~

这么好用的技能,必须分享给大家,话不多说,咱们直接开始!

准备工作 (https://jq.qq.com/?_wv=1027&k=GmeRhIX0)

咱们需要先准备表格数据,会爬虫的兄弟可以自己爬一点,不会的,可以找我直接拿数据。

表格内数据


我这里只做展示,所以只用了五个表,咱们今天是将市级合并为省级。

本文思路

  1. 将当前文件夹下所有的 excel 汇总到 广东省.xlsx
  2. 添加一个新的字段 城市,字段内容为商铺所在城市,这个字段放在最前面;
  3. 星级为 star_0 的数据全部不要
  4. 只要一条数据中有三个字段为空字段,整条数据都不需要;
  5. 将价格中的 ¥ 符号去掉

代码实现

全部代码都分享给大家,咱不喜欢藏着掖着。

python学习资料交流群:660193417###
import glob
import openpyxl workbook = openpyxl.Workbook()
sheet_total = workbook.active
sheet_total.append(['城市', '门店名称', '星级', '星级得分', '点评总数', '人均消费', '口味', '环境', '服务', '链接网址', '分类', '商圈', '详细地址', '推荐菜']) python学习资料交流群:660193417###
def count_none(line):
"""返回空内容的数据"""
count = 0
for d in line:
if not d:
count += 1
return count filenames = glob.glob('*/*.xlsx')
for filename in filenames:
# print(filename)
city = filename.split('.')[0].split('\\')[-1]
workbook_temp = openpyxl.load_workbook(filename)
sheet = workbook_temp.active
for row in sheet.iter_rows(min_row=2, min_col=1, max_col=sheet.max_column, max_row=sheet.max_row):
row_data = [col.value for col in row]
if row_data[1] == 'star_0':
continue # 定义一个方法判断空字段的数量
if count_none(row_data) >= 3:
continue # 去掉平均价格中的 ¥
if row_data[4]:
row_data[4] = row_data[4].strip('¥')
row_data.insert(0, city)
# print(row_data)
sheet_total.append(row_data)
# break # 调试只处理一个 workbook.save('广东省.xlsx')

效果

还是刚出炉的,非常新鲜。

这我做了筛选,不然全是显示一个地方了。
可以看到,数据成功的合并到一个表格去了。

喜欢的小伙伴记得点赞收藏呀~
关注我分享更多技术干货
直接拿走代码等于白嫖,点赞收藏才是真情…
你们的支持是我更新的动力!

最新文章

  1. [Unity3D插件]2dToolKit系列三 碰撞检测功能的实现以及障碍物的随机摆放
  2. c语言检测文件是否存在int __cdecl access(const char *, int);
  3. Oracle中的带参数的视图--我们致力于打造人力资源软件
  4. <ASP.NET4 从入门到精通>学习笔记3
  5. xcode6+ios8 横屏下启动画面不显示问题修改
  6. linux动态链接库---一篇讲尽
  7. 【Android Developers Training】 32. 向其它应用发送简单数据
  8. python 操作python
  9. RecyclerView详解
  10. 在 ns-3.25中添加 plc(电力线载波) 模块
  11. reduction_indices in tensorflow
  12. 复用微信小程序源码包后仍然有原小程序的版本管理怎么处理
  13. Linux进程内存分析和内存泄漏定位
  14. python模块部分 re模块 之正则表达式
  15. wx.aui.AuiManager部分/布局翻译
  16. R语言做相关性分析
  17. List与数组的相互转换
  18. 20162325 金立清 S2 W3 C13
  19. CSS实现背景透明,文字不透明
  20. PLSQL_统计信息系列02_统计信息的对象

热门文章

  1. axios 内存泄漏
  2. Windbg调试工具命令详解
  3. Java中日期格式化的实现算法
  4. Postman 正确使用姿势
  5. 【职场必备】6个免费良心网站&职场办公网站(收藏血赚)
  6. python学习-Day8
  7. Django模板相关
  8. css自定义省略实例1
  9. Centos 7以上安装Docker (亲测有效)
  10. Redis设计与实现3.1:主从复制