pandas的qcut()方法
2024-08-26 02:09:12
pandas的qcut可以把一组数字按大小区间进行分区,比如
data = pd.Series([0,8,1,5,3,7,2,6,10,4,9])
比如我要把这组数据分成两部分,一半大的,一半小的,如果是小的数,值就变成'small number',大的数,值就变成'large number':
print(pd.qcut(data,[0,0.5,1],labels=['small number','large number']))
0 small numbers
1 large numbers
2 small numbers
3 small numbers
4 small numbers
5 large numbers
6 small numbers
7 large numbers
8 large numbers
9 small numbers
10 large numbers
dtype: category
Categories (2, object): [small numbers < large numbers]
qcut() 方法第一个参数是数据,第二个参数定义区间的分割方法,比如这里把数字分成两半,那就是 [0, 0.5, 1] 如果要分成4份,就是 [0, 0.25, 0.5, 0.75, 1] ,也可以不是均分,比如 [0, 0.1, 0.2, 0.3, 1] ,这就就会按照 1:1:1:7 进行分布,比如:
data = pd.Series([0,8,1,5,3,7,2,6,10,4,9])
print(pd.qcut(data,[0, 0.1, 0.2, 0.3, 1],labels=['first 10%','second 10%','third 10%','70%']))
0 first 10%
1 70%
2 first 10%
3 70%
4 third 10%
5 70%
6 second 10%
7 70%
8 70%
9 70%
10 70%
dtype: category Categories
(4, object): [first 10% < second 10% < third 10% < 70%]
当然,这里因为数据里有11个数,没法刚好按照 1:1:1:7 分,所以 0和1,都被分到了 'first10%' 这一类.
qcut() 方法第二个参数是要替换的值,就是对应区间的值应该替换成什么值,顺序和区间保持一致就好了,注意有几个区间,就要给几个值,不能多也不能少.
最新文章
- IOS实现自动循环滚动广告--ScrollView的优化和封装
- 软件架构---nop插件学习
- 获取ip ,百度地图坐标点 和 在 后台调用 url()
- Asp.net MVC 示例
- ubuntu上完全卸载package
- ThinkPHP中where()方法的使用
- C# 采用线程重绘图形要点记录
- STM8S TIM1 PWM初始化设置
- JavaScript Style Guide中文总结
- C#中RichEdit控件,保存文本和图片到mysql数据库
- MySQL出现“错误1067:进程意外终止”
- vsCode---中文化
- java学习笔记38(sql注入攻击及解决方法)
- selenium - switch_to.window() - 多窗口切换
- Gym - 100735E Restore
- Redis基本数据类型介绍笔记
- [PHP] constant variable
- 一名优秀的UI设计师应该具备哪些条件?
- 【转】Cookie深度解析
- bzoj 1264 [AHOI2006]基因匹配Match dp + 树状数组
热门文章
- Trident简介
- 图论之二分图-HihoCoder1121
- JSONObject基本内容(三)
- RadGridView添加序号列
- MySql开启远程用户登录GRANTALLPRIVILEGESON*.*TO&#39;root&#39;@&#39;%&#39;I MySql开启远程用户登录GRANTALLPRIVILEGESON*.*TO&#39;root&#39;@&#39;%&#39;I
- [HNOI2011]Problem B
- Django拾遗--pagination、sitemap、admin、form
- Revit API创建标注NewTag
- 三大分析法——SWOT、PEST、波特五力
- CustomJsonDateDeserializer @JsonDeserialize(using = CustomJsonDateDeserializer.class) Jackson 反序列化Date时遇到的问题 java中json日期属性反序列化