python标签值标准化到[0-(#class-1)]
2024-10-19 08:58:19
python 处理标签常常需要将一组标签映射到一组数字,数字还要求连续。
比如 ['a', 'b', 'c', 'a', 'a', 'b', 'c'] ==(a->0, b->1, c->2)=> [0, 1, 2, 0, 0, 1, 2]。 为了便于本文被搜索,加个关键词:重新编码
可以用sklearn.preprocessing.LabelEncoder()
这个函数。
以数字标签为例:
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
le.fit([1,2,2,6,3])
获取标签值#
In [2]: le.classes_
Out[2]: array([1, 2, 3, 6])
将标签值标准化#
In [3]: le.transform([1,1,3,6,2])
Out[3]: array([0, 0, 2, 3, 1], dtype=int64)
将标准化的标签值反转#
即“反向编码”:
In [4]: le.inverse_transform([0, 0, 2, 3, 1])
Out[4]: array([1, 1, 3, 6, 2])
非数字型标签值标准化:
In [5]: from sklearn import preprocessing
...: le =preprocessing.LabelEncoder()
...: le.fit(["paris", "paris", "tokyo", "amsterdam"])
...: print('标签个数:%s'% le.classes_)
...: print('标签值标准化:%s' % le.transform(["tokyo", "tokyo", "paris"]))
...: print('标准化标签值反转:%s' % le.inverse_transform([2, 2, 1]))
...:
标签个数:['amsterdam' 'paris' 'tokyo']
标签值标准化:[2 2 1]
标准化标签值反转:['tokyo' 'tokyo' 'paris']
最新文章
- Problem of saving images in WPF (RenderTargetBitmap)zz
- UVALive-4839 HDU-3686 Traffic Real Time Query System 题解
- OC中协议, 类目, 时间, 延展, 属性
- 要用于尝试,广东移动间接实现“流量不清零”[bubuko.com]
- noi题库(noi.openjudge.cn) 1.7编程基础之字符串T31——T35
- hibernate的hql查询
- iOS JSPatch 热修复使用
- linux 7 常见命令
- android TextView加载html内容并加载图片
- Gson心得小笔记
- 会";说话";的勒索病毒Cerber
- 记一个社交APP的开发过程——基础架构选型(转自一位大哥)
- C# winform只有一个进程
- jsonp 使用示例
- ProgressBar( 进度条) 组件
- win7_32位安装MySQL_5.6以及密码修改方法
- NS2 nam中节点及数据流颜色设置
- c++ 学籍管理系统v 1.0
- 使用navicat连接远程linux的mysql中文显示乱码的问题
- MyBatis学习-SQL 符号篇