更多的关于k近邻算法的思考

KNN(K- Nearest Neighbor)法即K最邻近法,数据挖掘分类技术中最简单的方法之一

对k近邻算法的总结:

优点部分

其可以解决分类问题,同时可以天然的解决多分类问题

其具备着思想简单,效果强大优点

同时,还可以使用k近邻算法来解决回归问题

对于我们要预测的k个节点,可以根据这k个样本的情况来解决,sklearn已经封装好了一个用来解决回归问题

缺点部分

最大的缺点就是效率低下

如果训练集有m个样本,n个特征,则预测每一个新的数据,需要o(m*n)的时间复杂度

当然,也有解决的方法,像是使用树结构:KD-tree,Ball-tree

除此之外,还有其他的问题,像是高度数据相关,虽然机器学习算法基本都是高度数据相关,但是相对而言,影响更加的厉害

同时,预测结果不具有可解释性也是其缺点之一

其很大的一个缺点,就是维度灾难

随着维度的增加,看似相近的两个点之间的距离会越来越大

其解决方法:降维

机器学习的流程回顾

最新文章

  1. HTTP 错误 500.21 - Internal Server Error 处理程序“PageHandlerFactory-Integrated”
  2. MySQL的表的优化和列类型的选择
  3. js地理位置获取、显示、轨迹绘制
  4. 万向节死锁 gimbal lock
  5. JavaWeb学习记录(一)——response响应头之缓存设置与下载功能的实现
  6. 全文索引--自定义chinese_lexer词典
  7. 快速入门:触摸输入(使用 C#/VB/C++ 和 XAML 的 Windows 应用商店应用)
  8. oc深坑測试题及其答案
  9. HorizontalScrollView做页卡的一个小记录
  10. 通过JS将BSAE64生成图片并下载
  11. [leetcode-565-Array Nesting]
  12. hdu-2639 Bone Collector II---第k大背包
  13. MPAndroidChart——饼图
  14. PAT1012:The Best Rank
  15. 转载:Linux命令之查看文件占用空间大小-du,df
  16. oracle问题 ORA-01843:not a valid month
  17. python 随机生成图片验证码背景RGB-浅色或者深色
  18. JavaEE 之 Mybatis
  19. PAT L3-021 神坛
  20. 关于SpringBoot如何返回视图

热门文章

  1. SpringMVC(6)数据验证
  2. Redis的内存回收原理,及内存过期淘汰策略详解
  3. mysql 更换主键
  4. so层反调试方法以及部分反反调试的方法
  5. XCTF command_execution
  6. EF Core3.1 CodeFirst动态自动添加表和字段的描述信息
  7. ffiddler抓取手机(app)https包
  8. PYTHON 错误提示:ModuleNotFoundError: No module named 'cv2'
  9. C语言:位域详解
  10. 【redis前传】redis整数集为什么不能降级