pandas 模块
2024-09-08 02:19:21
什么是pandas
pandas是一个python的包,主要用来处理表格格式的文件,可以快速的对表格进行查询,过滤,合并等操作。
pandas的简单使用
pandas读入table格式文件
#读入一个table格式的文件,用制表符分隔,没有头信息
table=pd.read_table("test.lst",header=None,sep="\t")
#对某一列进行正则替换
table[0]=table[0].map(lambda x:x.replace("_","\_"))
#对某一列除以1000*1000取整
table[1]=table[1].map(lambda x: int(x/(1000*1000)))
#对某一列除以1000*1000保留两位小数
table[3]=table[3].map(lambda x: float('%.2f' % (x/(1000*1000))))
pandas写出文件
table.to_table("test.table",sep='\t',index=False)
读取指定的两列
#根据索引取其中两列
mm=df[['Sample_Name','Run']]
将读取的两列存为一个字典
from collections import defaultdict
d = defaultdict(dict)
for date, count in mm.itertuples(index=False):
d[date]=count
最新文章
- .NET Framework各版本比较
- 利用firebug调试功能辅助了解闭包和this
- 采购信息记录修改[BDC]
- 【开发必备】吐血推荐珍藏的Chrome插件
- OpenGL 回顾——简化版的窗体(包含鼠标控制,普通键位控制,以及镜面反射)
- Jq/Js收集
- U3D音频系统
- ViewController加载顺序与self.view
- junit测试延伸--方法的重复测试
- 安卓 LayoutInflater参数作用
- LinkedStack
- Python多进程、多线程、协程
- vmdk转qcow2格式
- CentOS ping: unknown host 解决方法
- NodeJs针对Express框架配置Mysql进行数据库操作
- 第三周作业(三)WordCount
- Activiti工作流学习要点
- Units specified don't exist SHSUCDX can't install
- vue 二级列表折叠面板
- YS动态口令系统接入流程