1.给定语料,统计语料中的词性为N,词组为M。

2.HMM关注3个参数

  a.初始化概率

  b.状态转移矩阵 N*N

  c.观测状态概率矩阵 N*M

3.状态转移矩阵:词A的词性为词性a,词B的词性为词性b,AB为相连词,从给定的语料中统计从词性a转换到词性b出现的次数/词性a转换到所有可能转换的词性的次数为状态转移矩阵中的aij.所以有N*N个概率。

4.观测状态概率矩阵:词性a下为词A的次数/词性a下所有词的数目,所以为N*M。

5.初始化概率:求的是每个词性的先验概率,即为:词性a出现的次数/总的词性现的次数,长度为N的list,即为初始化概率。

词性标注问题:

  a.第一步是求出初始化状态先验概率,为初始化概率。

  b.求出状态转移矩阵。

  c.求出观测状态概率矩阵,以上这3步为HMM中的学习问题。

  d.利用求出来的这3个参数,那么就是一个HMM模型,那么就可以用着3个参数求出最大概率序列,即为HMM的预测问题,

最新文章

  1. HTML插入FLASH
  2. clang: error: linker command failed with exit code 1 (use -v to see invocati
  3. Linux2 在Linux(CentOS)上配置SSH免登陆
  4. webapi 中的本地登录
  5. GitHub 上 57 款最流行的开源深度学习项目
  6. Appium移动自动化测试之安装Appium
  7. 综合使用spring cloud技术实现微服务应用
  8. 新浪微博客户端(34)-block的细节与本质
  9. TextView & EditText
  10. Android实例-OrientationSensor方向传感器(XE8+小米2)
  11. 分页插件jquery.simplePagination.js使用
  12. MySQL user表root用户误删除后恢复
  13. c++中各种数据类型所占字节
  14. java参数传递
  15. socket.io 入门篇(三)
  16. 在.NetCore中使用Myrmec检测文件真实格式
  17. BZOJ3224/洛谷P3391 - 普通平衡树(Splay)
  18. Loader转换器
  19. 二维数组遍历的方式(for普通循环遍历、foreach循环遍历、toString方式遍历)
  20. has invalid type <class 'numpy.ndarray'>, must be a string or Tensor

热门文章

  1. (网络流 最大流 Dinic || SAP)Control -- hdu --4289
  2. [Ubuntu]管理开机启动项的软件
  3. Get User CustomNotificationAddresses
  4. C#基础复习(1) 之 Struct与Class的区别
  5. c# list修改某一个属性的值
  6. c#中取整方式
  7. event 自定义事件
  8. Caused by: com.mysql.jdbc.MysqlDataTruncation: Data truncation: Data too long for column 'img' at row 1故障
  9. ASP.NET Core获取客户端IP地址
  10. jvm(1)类加载(一)(加载过程,双亲加载)