结构化机器学习项目

ML项目流程

1,确立目标(确定开发/测试集 + 唯一最优化指标)

确定开发/测试集:开发/测试集应尽可能接近将来应用场景中的数据。

划分数据集:开发集和测试集大小足以评估模型表现即可。

1、正交化
正交化:每次调整对某一性能进行针对性调试和优化,更快地发现影响效应,从而进行综合性的优化。

一个好的模型最好能够同时在训练集,验证集,测试集和实际应用中表现良好,如果:

情况 解决办法
在训练集上表现不好 尝试更大的神经网络或者使用更好的优化算法(如Adam)
在验证集上表现不好 尝试获取更多的训练数据或者加入正则化
在测试集上表现不好 同验证集优化或者使用更有代表性的验证集(如加大数量)
在实际应用上表现不好 没有使用合适的测试集或者代价函数的评估指标不合理,调整测试集或者代价函数

最新文章

  1. tomcat+nginx简单实现负载均衡
  2. hdu1000,hdu1001,hdu1002,hdu1003
  3. php 关联数据库的留言板练习
  4. js高级程序设计(七)函数表达式
  5. Java Annotation认知(包括框架图、详细介绍、示例说明)
  6. Python基本数据结构-元组
  7. html部分---通用标签与属性;
  8. iTween基础之功能简介
  9. javascript 文本框中,判断回车键触发事件 兼容IE&FireFox
  10. 自定义 textField 的清除 button
  11. C#类、静态类
  12. instsrv.exe下载和使用方法(微软Windows Server 2003 Resource Kit Tools工具中的一个)
  13. MonkeyRunner源码分析之工作原理图-attach
  14. sqlite3命令行
  15. springcloud第三步:发布服务消费者
  16. 004-数据结构之ADT-栈与队列【数组方式实现】
  17. Windows系统下安装dig命令
  18. P1378 油滴扩展 dfs回溯法
  19. linux-centos下持续集成工具jenkins部署使用教程
  20. 还原bak到localdb的问题:The logical database file cannot be found ldf

热门文章

  1. 新的征程TestOps
  2. Python3(十) 函数式编程: 匿名函数、高阶函数、装饰器
  3. node - 简单的爬虫案例
  4. qt creator源码全方面分析(2-0)
  5. VFP CursorAdapter 起步二(作者:Doug Hennig 译者:fbilo)
  6. comm diff 文件对比
  7. Linux 磁盘原理与管理 (分区 挂载)
  8. js 递归总结
  9. 十天学会CS之操作系统——进程管理01
  10. 微信小程序如何下载超过大小限制(10M)的视频?(苹果用户仔细看,安卓用户快速看)