思考

机器学习中哪个算法好?哪个算法差呢?

下面两条线,哪个更好呢?

没有免费午餐定理

如果我们不对特征空间有先验假设,则所有算法的平均表现是一样的。

假设我们的计算机只有两个存储单元,而且每个存储单元只能存储两个标签,一类是class1(圆圈),一类是class2(叉叉)。假设其中一个存储单元是圆圈,另一个存储单元未知,需要我们预测,预测的可能情况如下:

如果不对特征空间有假设,则可以认为这两种情况的概率差不多,也就意味着,我们无论选择预测哪个结果,成功的概率都是50%。

假设计算机的存储单元变成三个,情况变成如下:

如果不对特征空间有假设,则可以认为这四种情况的概率差不多。

三个存储单元的情况,以只两个存储单元的状态,预测第三个存储单元的结果如下:

存储单元更多的情况,"?"处应该是圆圈还是叉叉呢?

大多数人应该选择上面的"?"为圆圈,下面的“?”是叉叉,这样真的对吗?如果我们把圆圈定义成花瓣,叉叉定义成蜜蜂。上边的"?"恰好表示小蜜蜂在花瓣里,也是合理的。但是大多数算法却不这么做。

我们认为:特征差距小的样本更有可能是同一类

但是事实上,没有所谓的世界上最好的算法,只有公认的好方法(支持向量机、决策树、神经网络等)

如果这篇博客对你有用,点个赞再走呗~

最新文章

  1. mongo-c-driver使用VS2013编译
  2. (转)Silverlight 与 JS交互
  3. Android课程---寄存器与存储器的区别
  4. [Appium] 使用Appium过程中遇到的各种坑
  5. hdu 2111 Saving HDU
  6. c# 将字符串转换为逻辑表达式(字符串转换布尔)
  7. Data guard RAC配置【二】
  8. asp.net mvc4中model与Model的区别
  9. java编程接口(5) ------ button和button组
  10. 树莓派Raspberry实践笔记-简单方法安装minicom
  11. component及刚体rigidbody用法
  12. iOS之创建一个常驻线程
  13. java 继承内存分配
  14. Netty实战三之Netty的组件和设计
  15. thinkphp的自动生成
  16. (7)MySQL的事务
  17. Seaweed-FS综合使用测试(转)
  18. 一些JavaScript基本函数
  19. 用shell查找某目录下的最大文件
  20. IO实战-RandomAccessFile在本地实现伪断点续传

热门文章

  1. 利用docker容器运行.net core webapi
  2. MySQL基础篇(03):系统和自定义函数总结,触发器使用详解
  3. Hive性能优化(全面)
  4. C# 将PDF转为Word、Html、XPS、SVG、PCL、PS——基于Spire.Cloud.PDF
  5. Linux三剑客之sed的基本用法介绍
  6. ThreadLocal源码阅读
  7. JVM探秘:内存分配与回收策略
  8. 1063 计算谱半径 (20 分)C语言
  9. FullPage.js-基于 jQuery 的插件全屏滚动插件
  10. CTPN训练自己的数据集过程大白话记录