开启一个在线学习和在线凸优化框架专题学习:

1.首先介绍在线学习的相关概念

在线学习是在一系列连续的回合(rounds)中进行的;

在回合,学习机(learner)被给一个question:(一个向量,即为特征向量),为从instance domain:采样得到的。学习机给出一个预测值:,然后得到正确的答案:从target domain:采样得到,定义损失函数为。在大多数情况下,中,但是,允许学习者从更大的集合中选择预测有时很方便,我们用D表示prediction domain。下图展示了在线学习框架:

2在线学习考虑的两个限制

第一个限制特别适合于在线分类的情况:

我们假设所有的answer都是由一些target mapping生成的:取自固定集合,称为假设类,由H表示,这是学习者已知的。由于这种对序列的限制,我们称之为realizable case,学习者应该尽可能少犯错误,假设和问题的顺序可以由对手来选择。对于在线学习算法A,我们用表示A在一系列用标记的例子上可能犯的最大错误数。我们再次强调和问题的顺序可以由对手来选择。的上界称为mistake bound,我们将研究如何设计最小的算法。

第二个限制是relaxation of the realizable assumption:

我们不再假设所有答案都是由产生,但是我们要求学习机与来自H最好的固定预测器竞争。这被算法的regret所捕获,regret度量了回顾过去,学习机有多“抱歉”没有遵循一些假设的预测。形式上,算法相对于的regret当在一系列T实例上运行时定义为:

算法相对于假设类H的regret是:

  学习机的目标是相对于H具有尽可能低的regret。我们有时会对“low regret”算法感到满意,我们认为与轮数T呈次线性增长,其意味着当T变为无穷大时,学习机的平均损失与H中最佳假设的平均损失之间的差异趋于零。

次线性增长:

3.在线学习算法的使用例子

(1)在线回归

(2)专家建议预测

(3)在线排名(推荐系统)

未完,待续。。。。。。

下一节我们将从一个在线分类的例子说起。

最新文章

  1. 2016 - 1 - 24 CSS初步
  2. hdf第一周完了,突然时间静止.,醒了就早点去公司上班,再努力一点
  3. 正确理解ContentPresenter
  4. 最初步的正则表达式引擎:生成nfa
  5. 利用图层的mask属性裁剪图形
  6. hdu1043Eight (经典的八数码)(康托展开+BFS)
  7. cmakelists 语法学习
  8. 设计模式6:Composite
  9. http协议报头信息和主体鉴别
  10. Python3基础 用list()查看filter()返回的对象
  11. WebDriver API 大全
  12. react组件开发规范(一)
  13. Dynamics CRM 2015Online Update1 new feature之表单页Tabs切换
  14. 自定义Chrome浏览器
  15. python要开始记录了20181125
  16. [20170628]11g修改用户名.txt
  17. C# 调整控件的Z顺序
  18. 关于RF对于不在屏幕内的页面元素的处理办法
  19. 【BZOJ2084】【洛谷P3501】[POI2010]ANT-Antisymmetry(Manache算法)
  20. electron安装与使用

热门文章

  1. VS版本号定义、规则和相关的Visual Studio插件
  2. Hi3536DV100 SDK 安装以及升级使用说明
  3. ubuntu设置开机默认进入字符界面方法 ubuntu 12.04 桌面版关闭图形界面(转)
  4. Jmeter使用流程及简单分析监控
  5. oracle 存储过程、游标参考实例
  6. 使用Socket通信--测试叫号
  7. 黄聪:pjax使用心得总结
  8. <亲测>用navicat连接mysql 8.0 报错2059
  9. LeetCode——6. ZigZag Conversion
  10. C++11--时钟和计时器<chrono>