python 处理标签常常需要将一组标签映射到一组数字,数字还要求连续。

比如 ['a', 'b', 'c', 'a', 'a', 'b', 'c'] ==(a->0, b->1, c->2)=> [0, 1, 2, 0, 0, 1, 2]。 为了便于本文被搜索,加个关键词:重新编码

可以用sklearn.preprocessing.LabelEncoder()这个函数。

以数字标签为例:

from sklearn import preprocessing
le = preprocessing.LabelEncoder()
le.fit([1,2,2,6,3])

获取标签值#

In [2]: le.classes_
Out[2]: array([1, 2, 3, 6])

将标签值标准化#

In [3]: le.transform([1,1,3,6,2])
Out[3]: array([0, 0, 2, 3, 1], dtype=int64)

将标准化的标签值反转#

即“反向编码”:

In [4]: le.inverse_transform([0, 0, 2, 3, 1])
Out[4]: array([1, 1, 3, 6, 2])

非数字型标签值标准化:

In [5]: from sklearn import preprocessing
...: le =preprocessing.LabelEncoder()
...: le.fit(["paris", "paris", "tokyo", "amsterdam"])
...: print('标签个数:%s'% le.classes_)
...: print('标签值标准化:%s' % le.transform(["tokyo", "tokyo", "paris"]))
...: print('标准化标签值反转:%s' % le.inverse_transform([2, 2, 1]))
...: 标签个数:['amsterdam' 'paris' 'tokyo']
标签值标准化:[2 2 1]
标准化标签值反转:['tokyo' 'tokyo' 'paris']

最新文章

  1. Problem of saving images in WPF (RenderTargetBitmap)zz
  2. UVALive-4839 HDU-3686 Traffic Real Time Query System 题解
  3. OC中协议, 类目, 时间, 延展, 属性
  4. 要用于尝试,广东移动间接实现“流量不清零”[bubuko.com]
  5. noi题库(noi.openjudge.cn) 1.7编程基础之字符串T31——T35
  6. hibernate的hql查询
  7. iOS JSPatch 热修复使用
  8. linux 7 常见命令
  9. android TextView加载html内容并加载图片
  10. Gson心得小笔记
  11. 会"说话"的勒索病毒Cerber
  12. 记一个社交APP的开发过程——基础架构选型(转自一位大哥)
  13. C# winform只有一个进程
  14. jsonp 使用示例
  15. ProgressBar( 进度条) 组件
  16. win7_32位安装MySQL_5.6以及密码修改方法
  17. NS2 nam中节点及数据流颜色设置
  18. c++ 学籍管理系统v 1.0
  19. 使用navicat连接远程linux的mysql中文显示乱码的问题
  20. MyBatis学习-SQL 符号篇

热门文章

  1. Springboot框架,实现请求数据解密,响应数据加密的功能。
  2. 支持pc和移动端的手写签批功能
  3. VM安装centos7
  4. 用户控件 RadioButtonList
  5. uva 202
  6. Javascript 4.4
  7. 在树莓派2或3的kali上 RCA(a/v connector)接口的正确使用方法(多图)(原创)
  8. 改变一下主要发博的方向吧...转scratch!
  9. 汇编实验一 查看CPU和内存,用机器指令和汇编语言指令编程
  10. Docker构建FastDFS镜像