WEKA中的数据预处理
2024-09-28 13:33:46
数据预处理包括数据的缺失值处理、标准化、规范化和离散化处理。
数据的缺失值处理:weka.filters.unsupervised.attribute.ReplaceMissingValues。 对于数值属性,用平均值代替缺失值,对于nominal属性,用它的mode(出现最多的值)来代替缺失值。
标准化(standardize):类weka.filters.unsupervised.attribute.Standardize。标准化给定数据集中所有数值属性的值到一个0均值和单位方差的正态分布。
规范化(Nomalize):类weka.filters.unsupervised.attribute.Normalize。规范化给定数据集中的所有数值属性值,类属性除外。结果值默认在区间[0,1],但是利用缩放和平移参数,我们能将数值属性值规范到任何区间。如:但scale=2.0,translation=-1.0时,你能将属性值规范到区间[-1,+1]。
离散化(discretize):类weka.filters.supervised.attribute.Discretize和weka.filters.unsupervised.attribute.Discretize。分别进行监督和无监督的数值属性的离散化,用来离散数据集中的一些数值属性到分类属性。
转载自:http://blog.csdn.net/hunauchenym/article/details/5847314
最新文章
- js正则匹配过滤 特殊字符
- apache 虚拟机配置
- JavaScript简易教程(转)
- solrj-WiKi
- Maven3.0 服务器配置搭建
- HDU 4099 Revenge of Fibonacci (数学+字典数)
- Python Set集合,函数,深入拷贝,浅入拷贝,文件处理
- HDU 2063 过山车 二分图题解
- ios 串
- Java Web(十) JDBC的增删改查,C3P0等连接池,dbutils框架的使用
- Redis安装以及基本数据类型
- java_基础_接口和抽象类
- PhpSpreadsheet处理表格
- jmeter源码导入eclipse并执行
- mysql的一些配置优化
- 20155225 2016-2017-2 《Java程序设计》第八周学习总结
- 20170609批量生成WORD合同
- JavaScript 之 ajax
- What’s wrong with virtual methods called through an interface
- 框架(yii和thinkphp)中实例化php内置或者扩展中的对象问题
热门文章
- Matplot相关(二)——统计图
- python中json怎么转换成字典
- freemarker split字符串分割 遍历map
- 让Jackson JSON生成的数据包含的中文以unicode方式编码
- $python正则表达式系列(6)——";或";表达式的用法
- master: Error: JAVA_HOME is not set and could not be found.问题解决
- javascript 中的比较大小,兼 typeof()用法
- Nginx rewrite配置
- Nginx 配置文件重写
- Linux下使用USB模拟ACM串口设备【转】