Python学习笔记三:数据特征分析
2024-10-08 08:33:14
完成数据清理后,下面通过图表展开对数据的分析。
1.前期初判(分布分析):
1)判断分组区间:
# a.散点图:
plt.scatter(data[字段1],data['字段2'],
s = data[字段3], # 显示大小
c = data[字段4], # 显示颜色
alpha = 0.4, cmap = 'Reds')
# b.直方图:
data[字段].hist(bins=10)
2)求出目标字段下频率分布的统计量:频数,频率,累计频率:
pandas.cut([字段],区间数)
pandas.cut.value_count:区间计数
df.rename(columns ={columnname:'新列名'}, inplace = True) :字段重命名
3)可视化:
# a. bar图
df.style.bar(subset=['频率','累计频率'], color='green',width=100)
# b. 直方图:
df['频率'].plot(kind = 'bar',width = 0.8,figsize = (12,2), rot = 0, color = 'k', grid = True, alpha = 0.5)
plt.title('参考总价分布频率直方图')
# c. 饼图:
plt.pie(df['频数'],labels = df.index, autopct='%.2f%%', shadow = True), plt.axis('equal')
2.对比分析
1)结构化分析:折现图、多系列柱状图、柱状图堆叠图+差值折线图
在分组基础上,各组总量指标与总体的总量指标对比,计算出各组数量在总量中所占比重,反映总体的内部结构。
举例:A产品、B产品的销售情况、消费者类型结构。
2)比例分析:面积图
在分组的基础上,将总体不同部分的指标数值进行对比,其相对指标一般称为“比例相对数”。
比例相对数 = 总体中某一部分数值 / 总体中另一部分数值。
举例: 线上销售Vs线下销售
3)空间比较分析(横向对比分析):柱状图
同类现象在同一时间不同空间的指标数值进行对比,反应同类现象在不同空间上的差异程度和现象发展不平衡的状况
空间比较相对数 = 甲空间某一现象的数值 / 乙空间同类现象的数值
举例:微信/支付宝等指支付方式在不同城市的份额
4)动态对比分析(纵向对比分析)
同一现象在不同时间上的指标数值进行对比,反应现象的数量随着时间推移而发展变动的程度及趋势
最基本方法,计算动态相对数 → 发展速度
动态相对数 = 某一现象的报告期数值 / 同一现象的基期数值
基期:用来比较的基础时期
报告期:所要研究的时期,又称计算期
最新文章
- 如何在arcmap中调试addin或者插件
- Effective java笔记(三),类与接口
- AMAP
- [改善Java代码]使用匿名类的构造函数
- MySQL高可用基础之keepalived+双主复制【转】
- Canvas--2
- select radio readonly
- 使用 getopt() 进行命令行处理
- 【搬运工】——初识Lua(转)
- canvas浅谈 实现简单的自旋转下落
- java 排序的几篇好文章
- 背水一战 Windows 10 (110) - 通知(Tile): secondary tile 模板之基础, secondary tile 模板之文本
- HighCharts基本使用
- 如何去掉linux配置文件的注释行和空行
- 安装完最小化 RHEL/CentOS 7 后需要做的 30 件事情7. 安装 PHP PHP 是用于 web 基础服务的服务器端脚本语言。它也经常被用作通用编程语言。在最小化安装的 CentOS 中安
- 一个表中多个字段对应另一个表的ID(SQL查询)
- spring c3po 连接mysql,sqlserver
- 工作总结 [all]
- 安装hive的web界面
- go语言版本变化
热门文章
- linux shell实用常用命令
- Django设置异步任务
- 【GET TIPS】Chrome所见即所得的截图技巧
- 「C++ 」借来的资源,何如还的潇洒?
- Happycorp:1 Vulnhub Walkthrough
- AndroidStudio更新时报错:Connection Error,Temp directory inside installation
- PyCharm专业版激活+破解到期时间2100年
- Kubernetes label简单使用
- 网页DIV+CSS布局与ifame传统布局对比
- Linux systemctl系统工具常用总结(详)