语法

sklearn.cluster.KMeans(n_clusters=8, # 簇的个数, 默认为 8
init='k-means++',         # 初始簇中心的获取方法
n_init=10,            # 初始簇中心的更迭次数, 默认为 10
max_iter=300,          # 最大迭代次数,默认为 300
tol=0.0001,          # 容忍度,即kmeans运行准则收敛的条件
precompute_distances='auto', # 是否需要提前计算距离
verbose=0,            # 冗长模式
random_state=None,       # 随机生成簇中心的状态条件
copy_x=True,
n_jobs=1,            # CPU 内核并行数, 默认为 1
algorithm='auto')         # kmeans的实现算法,有:’auto’, ‘full’, ‘elkan’, 其中 ‘full’表示用EM方式实现

具体的参数含义:

参数的意义:

    n_clusters:簇的个数,即你想聚成几类
init: 初始簇中心的获取方法
n_init: 获取初始簇中心的更迭次数,为了弥补初始质心的影响,算法默认会初始10次质心,实现算法,然后返回最好的结果。
max_iter: 最大迭代次数(因为kmeans算法的实现需要迭代)
tol: 容忍度,即kmeans运行准则收敛的条件
precompute_distances:是否需要提前计算距离,这个参数会在空间和时间之间做权衡,如果是True 会把整个距离矩阵都放到内存中,auto 会默认在数据样本大于featurs*samples 的数量大于12e6 的时候False,False 时核心实现的方法是利用Cpython 来实现的
verbose: 冗长模式(不太懂是啥意思,反正一般不去改默认值)
random_state: 随机生成簇中心的状态条件。
copy_x: 对是否修改数据的一个标记,如果True,即复制了就不会修改数据。bool 在scikit-learn 很多接口中都会有这个参数的,就是是否对输入数据继续copy 操作,以便不修改用户的输入数据。这个要理解Python 的内存机制才会比较清楚。
n_jobs: 并行设置
algorithm: kmeans的实现算法,有:’auto’, ‘full’, ‘elkan’, 其中 ‘full’表示用EM方式实现

相关阅读:

https://www.cnblogs.com/mfryf/p/9007530.html

最新文章

  1. <转> Lua使用心得(2)
  2. Python:Sqlmap源码精读之解析xml
  3. LoadRunner监控Linux
  4. UVA 1349(二分图匹配)
  5. 动手写一个Remoting接口测试工具(附源码下载)
  6. QQ一键登录功能的实现过程
  7. PHP版本VC6和VC9、Non Thread Safe和Thread Safe的区别
  8. java的Arrays工具类实战
  9. Hibernate xml格式和anno格式 mappedby
  10. Git学习02 --暂存区,撤销修改,删除文件
  11. Node.js 开发指南笔记
  12. 关于ABP聚合根类AggregateRoot的思考
  13. 苹果应用商店AppStore审核中文指南
  14. 「mysql优化专题」单表查询优化的一些小总结,非索引设计(3)
  15. [LeetCode] Next Greater Element II 下一个较大的元素之二
  16. nginx正则匹配
  17. Spring bean实例化的方式
  18. 分布式监控系统Zabbix-3.0.3-新版微信报警(企业微信取代企业号)
  19. FastReport问题整理(http://129.sqdj.gov.cn/?p=77)
  20. 几种常见NPE

热门文章

  1. Linux引导过程与服务控制
  2. [LeetCode] 374. Guess Number Higher or Lower 猜数字大小
  3. MySQL学习记录(导入Excel表到数据库,并筛选条件输出)
  4. 第四次实验报告:使用Packet Tracer理解RIP路由协议
  5. Golang(十)TLS 相关知识(一)基本概念原理
  6. visual studio远程调试 remote debugger
  7. Linux record
  8. Beta冲刺(9/7)——2019.5.31
  9. vins_fusion学习笔记
  10. orientation属性(判断是否为横竖屏)