什么是pandas

pandas是一个python的包,主要用来处理表格格式的文件,可以快速的对表格进行查询,过滤,合并等操作。

pandas的简单使用

pandas读入table格式文件

#读入一个table格式的文件,用制表符分隔,没有头信息
table=pd.read_table("test.lst",header=None,sep="\t")
#对某一列进行正则替换
table[0]=table[0].map(lambda x:x.replace("_","\_"))
#对某一列除以1000*1000取整
table[1]=table[1].map(lambda x: int(x/(1000*1000)))
#对某一列除以1000*1000保留两位小数
table[3]=table[3].map(lambda x: float('%.2f' % (x/(1000*1000))))

pandas写出文件

table.to_table("test.table",sep='\t',index=False)

读取指定的两列

#根据索引取其中两列
mm=df[['Sample_Name','Run']]

将读取的两列存为一个字典

from collections import defaultdict
d = defaultdict(dict)
for date, count in mm.itertuples(index=False):
d[date]=count

最新文章

  1. .NET Framework各版本比较
  2. 利用firebug调试功能辅助了解闭包和this
  3. 采购信息记录修改[BDC]
  4. 【开发必备】吐血推荐珍藏的Chrome插件
  5. OpenGL 回顾——简化版的窗体(包含鼠标控制,普通键位控制,以及镜面反射)
  6. Jq/Js收集
  7. U3D音频系统
  8. ViewController加载顺序与self.view
  9. junit测试延伸--方法的重复测试
  10. 安卓 LayoutInflater参数作用
  11. LinkedStack
  12. Python多进程、多线程、协程
  13. vmdk转qcow2格式
  14. CentOS ping: unknown host 解决方法
  15. NodeJs针对Express框架配置Mysql进行数据库操作
  16. 第三周作业(三)WordCount
  17. Activiti工作流学习要点
  18. Units specified don't exist SHSUCDX can't install
  19. vue 二级列表折叠面板
  20. YS动态口令系统接入流程

热门文章

  1. 为什么 JVM 不用 JIT 全程编译?
  2. Opentrains 1519 G——最小圆覆盖
  3. 【JZOJ6246】【20190627】B
  4. Macbook Pro升级10.15后百度网盘无法登陆,网络连接错误(-1001)
  5. javascript利用canvas解析图片中的二维码
  6. 第08组 Alpha冲刺(5/6)
  7. cesium地下模式(地表透明)2
  8. 这个中秋,我用 Java 画了一个月饼!
  9. Guava Cache 缓存实现与源码分析
  10. 【Gamma】Scrum Meeting 5