Pandas处理数据常用方法
# -*- coding: utf-8 -*-
import pandas as pd
"""
(1)利用pandas读取csv文件
"""
def readcsv(path):
df=pd.read_csv(path,sep=',')
print("1 打印索引:",df.index)
print("2 前五行",df[0:5])
print("3 只选择第五行",df.loc[5])
print("4 选择第5行和第七行",df.loc[[5,7]])
print("5 把身高作为该DataFrame的索引:",df.set_index('shengao',inplace=False,drop=True))
print("6 查看各行的数据格式:",df.dtypes)
print("7 查看列名:",df.columns)
print("8 查看数据值:",df.values)
list=df.values
print("9 数据的行数为:",len(list))
print("10 描述性统计:",df.describe)
print("11 转置为:",df.T)
#print("按列名排序",df.sort(columns='shengao'))
#使用DataFrame选择数据:
print("12 显示列名下的数据为:",df['shengao'])
#使用DataFrame筛选数据:
alist=[1.7]
r1=df['shengao'].isin(alist) #将要过滤的数据放入字典中,使用isin对数据进行筛选,返回行索引以及每行筛选的结果,若匹配则返回ture
print("13 结果为:",r1)
index1=df[df['shengao'].isin(alist)]#获取匹配结果为ture的行
print("14 索引值为:",index1)
print("15 统计:",df.sum().values)
print("16 统计:",df.cumsum().values)
print("17 最大值对应的索引:",df.idxmax())
df.insert(2,'s',2)
print("插入一列的结果",df.describe)
#在字典中获得数据http://scikit-learn.org/stable/modules/feature_extraction.html#feature-extraction
if __name__ == '__main__':
pathroad='E:/TestData/testdata/kehu.csv'
readcsv(pathroad)
最新文章
- 【十大经典数据挖掘算法】SVM
- PHP 爬虫
- C 运算符优先级
- CS架构和BS架构的区别
- 一个新人对JavaScript的内容简单介绍
- ci(转)
- C++primer 练习12.27
- 1741. Communication Fiend(dp)
- 执​行​o​r​a​c​l​e​函​数​的​四​种​方​法
- ASP.NET状态服务及session丢失问题解决方案总结
- 360度角转AS3角度
- 如何通过 HSB 颜色模式构建夜间模式
- jira6.3.6创建问题不自动发邮件通知的问题
- 【洛谷P2709】小B的询问
- ubuntu系统中安装eclipse
- Spark学习之路 (十)SparkCore的调优之Shuffle调优
- 网口扫盲三:以太网芯片MAC和PHY的关系(转)
- lnmp源码编译安装zabbix
- [转载]使用SQL Server 2008的事务日志传送功能备份数据库(logshiping)
- REST格式