K-近邻与交叉验证

1 选取超参数的正确方法是:将原始训练集分为训练集和验证集,我们在验证集上尝试不同的超参数,最后保留表现最好的那个。

2 如果训练数据量不够,使用交叉验证法,它能帮助我们在选取最优超参数的时候减少噪音。

3 一旦找到最优的超参数,就让算法以该参数在测试集跑且只跑一次,并根据测试结果评价算法。

4 最近邻分类器能够在CIFAR-10上得到将近40%的准确率。该算法简单易实现,但需要存储所有训练数据,并且在测试时过于消耗计算能力。

5 最后,我们知道了仅仅使用L1和L2范数来进行像素比较是不够的,图像更多的是按照背景和颜色被分类,而不是语义主体本身。

1 预处理你的数据:对你数据中的特征进行归一化(normalize),让其具有零平均值(zero mean)和单位方差(unit variance)。

2 如果数据是高维数据,考虑使用降维方法。如PCA。

3 将数据随机分入训练集和验证集。按照一般规律,70%-90%数据作为训练集。

4 在验证集上调优,尝试足够多的K值,尝试L1和L2两种范数计算方式。

超参数(曼哈顿距离与欧氏距离):

损失函数:

任何一个算法都会有一个损失函数。

我们希望损失为零,为什么呢?损失越多说明我们错的越多,损失为零说明我们没做错啊。o(* ̄︶ ̄*)o

Softmax分类器:

Sigmoid函数:

softmax实例:

最新文章

  1. SpringMVC中servletFileUpload.parseRequest(request)解析为空获取不到数据问题
  2. winform上控件太多,绘制时会逐个出现,通常说双缓冲能解决但实际不能解决的问题的解决方法。
  3. 文本XSS攻击过滤
  4. MJExtension笔记(一)
  5. css3中变形与动画(一)
  6. Windows Server 2008 R2 实现多用户同时登陆
  7. O(1)时间内删除指定链表结点
  8. 《OD大数据实战》HDFS入门实例
  9. sqlserver中的锁与事务
  10. Eclipse用法和技巧二十三:查看JDK源码
  11. 手机游戏产品经理(一)logo的印象非常重要,以促进
  12. 初识html5——试试博文编辑器
  13. 马的遍历 洛谷 p1443
  14. 大白话 Scala 控制抽象
  15. kubernetes 部署
  16. 记一次简单的GetShell案例
  17. Caused by: java.security.InvalidKeyException: Illegal key size or default parameters
  18. .Net core使用EF Core Migration做数据库升级
  19. NOIP2018ty记
  20. 对Array进行排序(按字母顺序)

热门文章

  1. springboot的跨域
  2. ElasticSearch搜索介绍四
  3. 学习windows编程 day4 之 盯裆猫
  4. docker部署路飞学城
  5. 用贪心算法近似求解 Loading Balance 问题(作业调度的负载均衡)
  6. datagrid点删除,弹出一个确认和取消的消息框
  7. 淘淘商城之springmvc前端控制器
  8. 2016年1月7日 隐藏NavigationBar时的一个坑
  9. Python巧用正则表达式,完成接口参数替换
  10. F - 回转寿司 (权值线段树)