使用经验风险最小化ERM方法来估计模型误差 开坑
2024-08-29 01:48:01
虽然已经学习了许多机器学习的方法,可只有我们必须知道何时何处使用哪种方法,才能将他们正确运用起来。
那不妨使用经验最小化ERM方法来估计 。
首先:
其中,
δ代表训练出错的概率
k代表假设类的个数
m代表样本(数据集)个数
γ代表误差阈值
于是我们可以得到:
但我们的假设都是建立在k有限的条件上,那么如果Η为无限类,又该如何估计呢?
先说一个粗略结论:其实根据有限字长效应,我们知道,每个数最多有64字节,例如如果有d个特征,则:
也就是说:
这个粗略结论已经比较实用了,不是吗。
其实,在现实情况中,不一定满足独立同分布的条件,因此真正的结果会比此结果乐观的多。具体的数字意义也不大,只需确定数量级即可。
不妨记住一个简答的结论:所需样本数量与VC维成正比
最新文章
- 关于如何在MVC中 执行JS
- 配置maven环境
- UML实践详细经典教程----用例图、顺序图、状态图、类图、包图、协作图
- POJ 3233 Matrix Power Serie
- Milk Patterns - poj 3261 (求重复k次的最长子串)
- Java ClassLoader基础及加载不同依赖 Jar 中的公共类(转)
- jQuery Lint: enables you to automatically inject jQuery Lint into the page as it is loaded (great for ad-hoc code validation)
- react-router 学习笔记
- JavaScript获取html元素的实际宽度和高度
- Linux学习(十四)磁盘格式化、磁盘挂载、手动增加swap空间
- 在arc模式下 CGImage 释放问题
- Python字典、集合之高山流水
- hdu 1730 Nim博弈
- Ubuntu Linux 环境变量PATH设置
- zz 史上最全--各银行借记卡的年费、小额管理费、转账费等!
- python3.5无法安装pip,报错ImportError: cannot import name 'HTTPSHandler'
- 竖屏拍照,但是sd卡中却是横屏解决方法
- angular-sanitize 插件的使用,获取带html标签的内容
- 表达式过滤器currency
- 配置JAVA_HOME踩得坑 。。