# 1汇总类统计
# 2唯一去重和按值计数
# 3 相关系数和协方差 import pandas as pd # 0 读取csv数据
df = pd.read_csv("beijing_tianqi_2018.csv")
df.head() # 换掉温度后面的后缀
df.loc[:,"bWendu"] = df["bWendu"].str.replace("℃","").astype("int32")
df.loc[:,"yWendu"] = df["yWendu"].str.replace("℃","").astype("int32")
df.head(3) # 1 汇总类统计 # 一下子提取所有数字列的统计结果
df.describe() # 查看单个Series的数据
df["bWendu"].mean() # 最高温
df["bWendu"].max() # 最低温
df["bWendu"].min() # 2 唯一去重和按值计数
# 2.1 唯一性去重 一般不用于数值列,而是枚举、分类列
df["fengxiang"].unique() df["tianqi"].unique()
df["fengli"].unique() # 2.2 按值计数(降序排列)
df["fengxiang"].value_counts()
df["tianqi"].value_counts()
df["fengli"].value_counts() # 3 相关系数和协方差
# 用途:
# 1、两只股票,这不是同涨同落?程度多大?正相关还是负相关?
#2、产品销量的波动,跟哪些因素正相关、负相关,程度有多大? # 1、协方差:衡量同向反向程度。 如果协方差为正,说明想想X,Y同向程度越高;
# 如果协方差为负,说明X,Y反向运动,协方差越小说明反向程度越高 # 2、相关系数:衡量相似度程度。当他们的相关系数为1时,说明两个变量变化时
# 的正向相似度最大,当相关系数为-1时,说明两个变量变化的反向相似度最大 # 协方差矩阵
df.cov() # 相关系数矩阵
df.corr() # 单独查看空气质量和最高温度的相关系数
df["aqi"].corr(df["bWendu"])
df["aqi"].corr(df["yWendu"])
# 空气质量和温差的相关系数
df["aqi"].corr(df["bWendu"]-df["yWendu"])

最新文章

  1. DotLiquid模板引擎简介
  2. 【Oracle基本操作1】 数据库的新建删除
  3. MongoDB C Driver使用教程
  4. 未找到arm-linux-gcc解决办法
  5. Linux摄像头驱动学习之:(三)从零写虚拟驱动(仿照vivi.c)
  6. PHPCMS-首页的二级导航、轮播效果
  7. 008--VS2013 C++ 位图半透明化(另一种显示)
  8. Android获取联系人示例,从数据库加载,带首字母标签
  9. DEDECMS中,引入文件
  10. return和break的区别
  11. python学习之路前端-JavaScript
  12. MATLAB 符号变量表达式 + 方程求解
  13. 使用 Kubeadm 升级 Kubernetes 版本
  14. C# zip -ICSharpCode.SharpZipLib
  15. 我定制的Stylish样式
  16. day11 十一、函数对象,名称空间,作用域,和闭包
  17. 关于Java类和包的那些事
  18. USB主机控制器ECHI
  19. frame标签使用
  20. System.data.sqlite安装

热门文章

  1. 将数据库中带出的列,在gridview中影藏起来
  2. 详解设备PID和VID
  3. SVN更新报错:Checksum mismatch for ……
  4. KVM 记录
  5. C# 读写App.config 配置文件
  6. 阶段3 1.Mybatis_12.Mybatis注解开发_2 mybatis注解开发测试和使用注意事项
  7. vue入门demo:用户管理3
  8. ABAP基本数据类型
  9. Linux安装python3.6 和pip
  10. Babel编译:类继承