Pandas模块 -- 实操练习
2024-09-02 12:10:43
如果对序列进行数学函数的运算,首选numpy模块;
如果对序列做统计运算,首选序列的“方法”,因为序列的“方法”更加丰富,如计算序列的偏度、峰度等,而Numpy模块是没有这样的函数。
手工构造数据框DataFrame时,一般首选字典方法。因为通过字典的方法构造数据框,则字典的键构成数据框的变量名。
arr1=pd.DataFrame([['张三',23,'男'],['李四',27,'女'],['王二',26,'女']])
print(arr1)
print("")
print("对比两种方式的区别:\n")
arr2=pd.DataFrame({'姓名':['张三','李四','王二'],'年龄':[23,27,26],'性别':['男','女','女']})
print(arr2)
构造序列时:pd.Series( ) 参数是列表或元组都可以
构造数据框时,pd.DataFrame( ) 使用列表或元组构造时,嵌套的最外层必须是列表list,里面一层是列表或元组都可以
#外层是元组 括号形式,不能运行,会报错
arr1=pd.DataFrame((('张三',23,'男'),('李四',27,'女'),('王二',26,'女')))
#下面两种形式 最外层是列表List的都能正常运行
arr2=pd.DataFrame([('张三',23,'男'),('李四',27,'女'),('王二',26,'女')])
arr3=pd.DataFrame([['张三',23,'男'],['李四',27,'女'],['王二',26,'女']])
读取电子表格pd.read_excel( )时指定header=False,然后报出下面的错误:
TypeError: Passing a bool to header is invalid. Use header=None for no header or header=int or list-like of ints to specify the row(s) making up the column names
如果不将数据集的第一行作为表头,需要设置header=None,而不能是header=0或header=False
最新文章
- ASP.NET Core应用的错误处理[1]:三种呈现错误页面的方式
- MyCAT报java.lang.OutOfMemoryError: Java heap space
- python安装numpy和pandas
- Linux tar (打包.压缩.解压缩)命令说明 | tar如何解压文件到指定的目录?
- 转: unix实际用户ID和有效用户ID解析
- SAP 打开账期
- Windows环境下配置Vim为Python的IDE
- eclipse加速
- 使用贝赛尔曲线画扇形、圆形、弧线、多边形,实现App下载时的动画效果demo
- android93 进程优先级补充
- IPv6-only 的兼容性解决方案-b
- PHP简易计算器方法1
- Deepin 15.3 下罗技蓝牙键盘连接
- [置顶] 浏览器模式和标准对于javascript的影响
- 【01背包】HDU 2546 饭卡
- [ZJOI2007]Hide 捉迷藏
- 什么是基于风险的测试(RBT)?
- [daily][archlinux] TODO LIST
- Mybatis中自定义映射xml参数传递使用
- jQuery调用Asp.Net后台方法
热门文章
- 示例:WPF实现ApplicationCommands.Delete的TextBox
- NuGet包 安装相关指令
- .net core使用ocelot---第二篇 身份验证
- python中用分别用selenium、requests库实现Windows认证登录
- xcode模拟器使用常用的命令。
- Scheduling Tasks
- Django:RestFramework之-------分页
- 服务上的图片直接在浏览器上可以打开,但是在img上报404错误处理方法
- 前端项目中公共方法汇总utils.js
- XmlDocument.load 读文件报异常:文件正被其它线程使用,解决方法