针对课件中的例子自己实现k-means算法 调用R语言自带kmeans()对给定数据集表示的文档进行聚类. 给定数据集: a) 数据代表的是文本信息. b) 第一行代表词语,由于保密原因,词语已经被转意.第一列代表了文本的编号. c) 红框中的数字为对应词的词频. 共113个样本,用K-Means算法将样本分为8类. 1.针对课件中的例子自己实现k-means算法 rm(list=ls()) #导入数据 id<-c(1:8) x<-c(1,2,1,
R语言是用于统计分析.画图的语言和操作环境.R是属于GNU系统的一个自由.免费.源码开放的软件.它是一个用于统计计算和统计制图的优秀工具. R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支. 能够觉得R是S语言的一种实现. 而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索.统计分析和作图的解释型语言.最初S语言的实现版本号主要是S-PLUS.S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完好.后来Auckland大学的Robert Gen