不多说,直接上干货!

Weka介绍:

  Weka是一个用Java编写的数据挖掘工具,能够运行在各种平台上。它不仅提供了可以直接用于数据挖掘的软件,还提供了src代码,使用者可以修改源代码,进行二次开发。但是,由于其使用了Java虚拟机,导致其不适合处理大型数据,运行缓慢。处理超过一定大小数据,还会溢出heap size,使程序崩溃。但作为初学者,很适合通过处理一些小型数据集,以直观地了解各种数据挖掘方法。它还自带一些典型的数据集,可以直接使用。在安装目录下的data子目录中。

  Weka通常使用ARFF文件格式的文件。也可以直接使用CSV文件格式的文件,但与传统CSV文件不同,Weka能识别的CSV文件要求第一行给各列的定义。因为CSV文件比较容易获得,excel表格文件可以直接另存为csv文件。推荐使用csv文件。

  以著名数据挖掘数据集鸢尾花为例,该数据集对应的iris.csv文件应如下所示:

sepal-length,sepal-width,petal-length,petal-width,class
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa

1、使用Weka工具,将ARFF文件转换成CSV文件

  进入Explorer模块,点击界面上方的按钮“open file”打开文件选择面板,将面板下方的文件类型选择“所有文件”,找到

iris.arff文件即可将数据导入到Explorer如下图所示。

  得到

2、使用Weka工具,将CSV文件转换成ARFF文件

  打开Weka的Explorer界面

  

  比如,这里,我先把iris.arff拷贝到桌面去。

  然后,在preprocess->open file

  将面板下方的文件类型选择“所有文件”,找到iris.csv

  通过save可以将CSV文件另存为ARFF文件。格式如下图所示:

  成功!

最新文章

  1. MongoDB学习笔记一—简介
  2. CapsLock与ctrl的键位修改
  3. jquery点击切换背景色
  4. FeWeb基础之JavaScript简介
  5. Shell 去掉文本中的空格
  6. Maven3下的java web项目
  7. Google OKR 目标管理体系学习
  8. C++ char*,const char*,string的相互转换
  9. UVa 103 Stacking Boxes --- DAG上的动态规划
  10. lassen项目启动
  11. HTML 5缓存机制:Cache Manifest配置实例
  12. 实现简单的cp命令
  13. Computer Science Theory for the Information Age-2: 高维空间中的正方体和Chernoff Bounds
  14. [Reactive Programming] Async requests and responses in RxJS
  15. scikit-learn的主要模块和基本使用
  16. javascript 学习总结(一)
  17. MyBatis_CURD
  18. Java实现将任何编码方式的txt文件以UTF-8编码方式转存
  19. Service启动,绑定与交互
  20. KNN算法 - 数据挖掘算法(3)

热门文章

  1. 关于Oracle 12C pdb用户无法登录的问题
  2. 记录一次在centos下使用gmp的悲伤
  3. DVWA渗透测试环境搭建
  4. Python 编程快速上手 第九章 组织文件
  5. javascript ----> Immediately-Invoked Function Expression (IIFE)(翻译)
  6. linux常用命令及系统常见符号
  7. Children's Game UVA - 10905
  8. NYOJ - 整数划分(四)
  9. Spark分布式安装
  10. android -------- android studio 中设置创建类时的说明信息(包含 作者 ,创建时间,注释说明等)