pandas.Series.value_counts
2024-08-28 05:55:16
pandas.Series.value_counts
Series.
value_counts
(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
功能:返回包含唯一值计数的对象。结果对象将按降序排列,以便第一个元素是最常出现的元素。 不包括默认的NA值。
参数:normalize : boolean, default False 如果为True,则返回的对象将包含唯一值的相对频率。
sort : boolean, default True 按值排序
ascending : boolean, default False 按升序排序
bins : integer, optional 而不是数值计算,把它们分成半开放的箱子,一个方便的pd.cut,只适用于数字数据
dropna : boolean, default True 不包括NaN的数量。
返回:计数:Serise
Series 情况下
import numpy as np
import pandas as pd
from pandas import DataFrame
from pandas import Series
ss = Series(['Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'Tokyo', 'Tokyo'])
ss.value_counts() #value_counts 直接用来计算series里面相同数据出现的频率
Tokyo 3
Nagoya 2
Osaka 1
dtype: int64
- DataFrame 情况下
import numpy as np
import pandas as pd
from pandas import DataFrame
from pandas import Series
df=DataFrame({'a':['Tokyo','Osaka','Nagoya','Osaka','Tokyo','Tokyo'],'b':['Osaka','Osaka','Osaka','Tokyo','Tokyo','Tokyo']}) #DataFrame用来输入两列数据,同时value_counts将每列中相同的数据频率计算出来
print(df)
df:
a b
0 Tokyo Osaka
1 Osaka Osaka
2 Nagoya Osaka
3 Osaka Tokyo
4 Tokyo Tokyo
5 Tokyo Tokyo
df.apply(pd.value_counts)
a b
Nagoya 1 NaN #在b列中meiynagoya,因此是用NaN 表示。
Osaka 2 3.0
Tokyo 3 3.0
最新文章
- Java类初始化
- IO调度器
- HTML之表格制作
- 招聘一个靠谱的 iOS
- linux 清理内存命令 查看内存命令
- eclipse中启动tomcat报错 java.lang.ClassNotFoundException
- const char*, char const*, char*const的区别
- Mozilla研究—深入理解mozilla所需的背景知识
- IE浏览器下面要实现滤镜(transparent),必须要加filter
- 2017-04-21周Java学习笔记
- 团队作业4---第一次项目冲刺(AIpha版本)第二天
- java中的JSON数据转换方法fastjson
- ubuntu nginx ssl 证书配置
- 腾讯的h5制作工具教程
- DLL补丁劫持制作
- Django model 字段详解
- python学习笔记之二
- 正确识别希捷Backup Plus新睿品1TB正品,杜绝奸商猖獗
- 【Linux】字符转换命令col
- Root :: AOAPC I: Beginning Algorithm Contests (Rujia Liu) Volume 5. Dynamic Programming