CRF:Conditional Random Field,即条件随机场。

首先介绍一下基础背景知识。机器学习中的分类问题可以分为硬分类和软分类。硬分类常见的模型有SVM、PLA、LDA等。SVM可以称为max margin classifier,基于几何间隔进行分类。软分类一般分为logistic Regnesstion(概率判别模型)和 Naive Bayes(概率生成模型)。概率判别模型和概率生成模型的区别是,概率判别模型是对\(P\left ( y|x \right )\)进行建模,概率生成模型是对\(P\left ( x,y \right )\)进行建模。

1.概率生成模型

Naive即朴素贝叶斯假设,公式表示就是\(P\left ( x|y=y_{0} \right )= \prod_{i=1}^{p}P\left ( x_{i}|y=y_{0} \right )\),通俗的解释就是给定隐变量的条件下,观测变量之间相互独立,即\(x_{i}\perp x_{j}|y,i\neq j\),如图1所示。当\(y\)被观测时,阻断了观测变量之间的路径。



当隐变量一个line的时候,就是HMM(Hidden markov model)模型,如图2所示。



如果大家有学过概率图模型的话,肯定知道有向图中的d-分离。通过有向图的独立性假设,我们可以非常直观的得到HMM的两大假设。即齐次Markov假设和观测独立假设。这两个假设的表达式分别为:

齐次Markov假设:\(P\left ( y_{t}|y_{1:t-1},x_{1:t-1} \right )= P\left ( y_{t}|y_{t-1} \right )\)

观测独立假设:\(P\left ( x_{t}|y_{1:t},x_{1:t-1} \right )= P\left ( x_{t}|y_{t} \right )\)

2.概率判别模型

比如最大熵模型,采用最大熵思想。比如:给定方差和均值,高斯分布熵最大。。

3.两者结合就出现了MEMM:Maximum Entropy Markov Model。这是一种概率判别模型。



进行独立性分析可以发现,该模型打破了HMM的观测独立假设,模型变得更加的合理了。比如,文本标注问题中,上下文对于标注会产生影响。

但是同样存在标注偏差问题,原因是局部归一化。John Lafferty的论文中讲解了该问题为什么存在。用一句话来概括就是:Conditional distribution with low entropy take less notice of observation.

4.Chain-structure CRF

该模型克服了标注偏差问题,CRF的模型如下图4所示,隐变量之间变为无向边,所以是全局归一化。



接下来会写如何利用CRF实现Learning、Inference等任务。

最新文章

  1. 【转】 HTMLCollection和NodeList的区别
  2. loadrunner通过C语言实现字符的替换(只能替换单个字符,慎用)
  3. Android中插件开发篇之----类加载器
  4. 用JavaBean实现数据库的连接和关闭,在jsp页面输出数据库中student表中学生的信息
  5. Less/Sass编译工具
  6. http://www.oschina.net/translate/elasticsearch-getting-started?cmp
  7. 方格取数(1)(HDU 1565状压dp)
  8. python 列表推导的注意点
  9. CGBitmapContextCreate函数
  10. 超链接解决头部fixed问题
  11. centos yum安装ffmpeg
  12. python web开发-flask中response,cookies,session对象使用详解
  13. python +selenium识别不来click事件,出现报错
  14. Delegate & Event
  15. PL/SQL Developer从11.0.6版本开始32/64为之区分
  16. Java基础(1)IntelliJ IDEA入门、常用快捷键和数组操作
  17. browserify 不打包某些文件或者把公共文件提取出来教程
  18. 819. Most Common Word
  19. [清华集训2015 Day1]主旋律-[状压dp+容斥]
  20. synchronized实现可见性

热门文章

  1. 9.深入k8s:调度器及其源码分析
  2. Nginx 路由--Location的使用
  3. Linux:配置apache支持php
  4. Minimizing maximizer(POJ 1769)
  5. 论文:Show and Tell: A Neural Image Caption Generator-阅读总结
  6. grpc服务如何添加sentry监控(添加中间件)
  7. RXJAVA之概述
  8. 虚拟机Ubuntu(18.04.2)下安装配置Hadoop(2.9.2)(伪分布式+Java8)
  9. odoo13之在odoo中添加自定义页面
  10. 【大数据】深入源码解析Map Reduce的架构