Weka中数据挖掘与机器学习系列之数据格式ARFF和CSV文件格式之间的转换(五)
2024-10-19 08:47:22
不多说,直接上干货!
Weka介绍:
Weka是一个用Java编写的数据挖掘工具,能够运行在各种平台上。它不仅提供了可以直接用于数据挖掘的软件,还提供了src代码,使用者可以修改源代码,进行二次开发。但是,由于其使用了Java虚拟机,导致其不适合处理大型数据,运行缓慢。处理超过一定大小数据,还会溢出heap size,使程序崩溃。但作为初学者,很适合通过处理一些小型数据集,以直观地了解各种数据挖掘方法。它还自带一些典型的数据集,可以直接使用。在安装目录下的data子目录中。
Weka通常使用ARFF文件格式的文件。也可以直接使用CSV文件格式的文件,但与传统CSV文件不同,Weka能识别的CSV文件要求第一行给各列的定义。因为CSV文件比较容易获得,excel表格文件可以直接另存为csv文件。推荐使用csv文件。
以著名数据挖掘数据集鸢尾花为例,该数据集对应的iris.csv文件应如下所示:
sepal-length,sepal-width,petal-length,petal-width,class
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
1、使用Weka工具,将ARFF文件转换成CSV文件
进入Explorer模块,点击界面上方的按钮“open file”打开文件选择面板,将面板下方的文件类型选择“所有文件”,找到
iris.arff文件即可将数据导入到Explorer如下图所示。
得到
2、使用Weka工具,将CSV文件转换成ARFF文件
打开Weka的Explorer界面
比如,这里,我先把iris.arff拷贝到桌面去。
然后,在preprocess->open file
将面板下方的文件类型选择“所有文件”,找到iris.csv
通过save可以将CSV文件另存为ARFF文件。格式如下图所示:
成功!
最新文章
- MongoDB学习笔记一—简介
- CapsLock与ctrl的键位修改
- jquery点击切换背景色
- FeWeb基础之JavaScript简介
- Shell 去掉文本中的空格
- Maven3下的java web项目
- Google OKR 目标管理体系学习
- C++ char*,const char*,string的相互转换
- UVa 103 Stacking Boxes --- DAG上的动态规划
- lassen项目启动
- HTML 5缓存机制:Cache Manifest配置实例
- 实现简单的cp命令
- Computer Science Theory for the Information Age-2: 高维空间中的正方体和Chernoff Bounds
- [Reactive Programming] Async requests and responses in RxJS
- scikit-learn的主要模块和基本使用
- javascript 学习总结(一)
- MyBatis_CURD
- Java实现将任何编码方式的txt文件以UTF-8编码方式转存
- Service启动,绑定与交互
- KNN算法 - 数据挖掘算法(3)
热门文章
- 关于Oracle 12C pdb用户无法登录的问题
- 记录一次在centos下使用gmp的悲伤
- DVWA渗透测试环境搭建
- Python 编程快速上手 第九章 组织文件
- javascript ---->; Immediately-Invoked Function Expression (IIFE)(翻译)
- linux常用命令及系统常见符号
- Children's Game UVA - 10905
- NYOJ - 整数划分(四)
- Spark分布式安装
- android -------- android studio 中设置创建类时的说明信息(包含 作者 ,创建时间,注释说明等)