机器学习(5): K-means 算法
2024-10-12 10:49:06
3. K-means 算法:
3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一
3.2 算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一
聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
3.3 算法思想:
以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心
的值,直至得到最好的聚类结果
3.4 算法描述:
(1)适当选择c个类的初始中心;
(2)在第k次迭代中,对任意一个样本,求其到c各中心的距离,将该样本归到距离最短的中心所在
的类;
(3)利用均值等方法更新该类的中心值;
(4)对于所有的c个聚类中心,如果利用(2)(3)的迭代法更新后,值保持不变,则迭代结束,
否则继续迭代。
3.5 算法流程:
输入:k, data[n];
(1) 选择k个初始中心点,例如c[0]=data[0],…c[k-1]=data[k-1];
(2) 对于data[0]….data[n], 分别与c[0]…c[k-1]比较,假定与c[i]差值最少,就标记为i;
(3) 对于所有标记为i点,重新计算c[i]={ 所有标记为i的data[j]之和}/标记为i的个数;
(4) 重复(2)(3),直到所有c[i]值的变化小于给定阈值。
最新文章
- (转)SqlServer 数据库同步的两种方式 (发布、订阅),主从数据库之间的同步
- frame里的链接跳转
- minigui移植到arm linux开发板上无法执行
- 20161007 NOIP 模拟赛 T1 解题报告
- 手机端input[type=date]的时候placeholder不起作用解决方案
- Linux TOP命令详解
- IntelliSense: 应输入声明的解决方案
- HTML5与CSS3权威指南.pdf8
- 《Java程序员面试笔试宝典》之 instanceof有什么作用
- 部分GDAL工具功能简介
- Palindrome(Manacher)
- [WP8] Binding时,依照DataType来选择DataTemplate
- php的表单安全处理
- 【uWSGI】实战之Django配置经验
- Data type
- swoole之代码热更新实现 转自https://blog.csdn.net/nep_tune/article/details/81329918
- YouCompleteMe/third_party/ycmd/third_party/cregex"; does not appear to contain CMakeLists.txt.
- [CC-MINXOR]XOR Minimization
- VUE2.0 饿了吗视频学习笔记(二):新版本添加路由和显示Header
- 第三部分:Android 应用程序接口指南---第二节:UI---第十一章 样式和主题
热门文章
- python3 操作sqlSever
- 正则 js分转元带千分符号
- GeSHi Documentation
- [Functional Programming] Build a Linear congruential generator
- java 反射获取属性值 方法
- Office WORD如何在图片上添加文字
- Java从零开始学十三(封装)
- weblogic.servlet.proxy.HttpProxyServlet 进行代理设置
- E信通项目总结[转]
- 算法练习--- DP 求解最长上升子序列(LIS)