数据预处理包括数据的缺失值处理、标准化、规范化和离散化处理。

数据的缺失值处理:weka.filters.unsupervised.attribute.ReplaceMissingValues 对于数值属性,用平均值代替缺失值,对于nominal属性,用它的mode(出现最多的值)来代替缺失值。

标准化(standardize):类weka.filters.unsupervised.attribute.Standardize。标准化给定数据集中所有数值属性的值到一个0均值和单位方差的正态分布。

规范化(Nomalize):类weka.filters.unsupervised.attribute.Normalize。规范化给定数据集中的所有数值属性值,类属性除外。结果值默认在区间[0,1],但是利用缩放和平移参数,我们能将数值属性值规范到任何区间。如:但scale=2.0,translation=-1.0时,你能将属性值规范到区间[-1,+1]。

离散化(discretize):类weka.filters.supervised.attribute.Discretize和weka.filters.unsupervised.attribute.Discretize。分别进行监督和无监督的数值属性的离散化,用来离散数据集中的一些数值属性到分类属性。

转载自:http://blog.csdn.net/hunauchenym/article/details/5847314

最新文章

  1. js正则匹配过滤 特殊字符
  2. apache 虚拟机配置
  3. JavaScript简易教程(转)
  4. solrj-WiKi
  5. Maven3.0 服务器配置搭建
  6. HDU 4099 Revenge of Fibonacci (数学+字典数)
  7. Python Set集合,函数,深入拷贝,浅入拷贝,文件处理
  8. HDU 2063 过山车 二分图题解
  9. ios 串
  10. Java Web(十) JDBC的增删改查,C3P0等连接池,dbutils框架的使用
  11. Redis安装以及基本数据类型
  12. java_基础_接口和抽象类
  13. PhpSpreadsheet处理表格
  14. jmeter源码导入eclipse并执行
  15. mysql的一些配置优化
  16. 20155225 2016-2017-2 《Java程序设计》第八周学习总结
  17. 20170609批量生成WORD合同
  18. JavaScript 之 ajax
  19. What’s wrong with virtual methods called through an interface
  20. 框架(yii和thinkphp)中实例化php内置或者扩展中的对象问题

热门文章

  1. Matplot相关(二)——统计图
  2. python中json怎么转换成字典
  3. freemarker split字符串分割 遍历map
  4. 让Jackson JSON生成的数据包含的中文以unicode方式编码
  5. $python正则表达式系列(6)——"或"表达式的用法
  6. master: Error: JAVA_HOME is not set and could not be found.问题解决
  7. javascript 中的比较大小,兼 typeof()用法
  8. Nginx rewrite配置
  9. Nginx 配置文件重写
  10. Linux下使用USB模拟ACM串口设备【转】