其中,

A:包含特征词w且属于类别c的文档频数

B:包含特征词w但不属于类别c的文档频数

C:属于类别c但不包含特征词w的文档频数

D:既不属于c也不包含特征词w的文档频数

N:文档总数

CHI统计方法用来度量特征词w和类别c之间的相关度。

当值为零时,表示特征值w和c相互独立;值越大,表示相关性越强,此时特征值w包含类别c相关的鉴别信息越多。

去除特征词与类别负相关情况:

最新文章

  1. 一步步学习javascript基础篇(9):ajax请求的回退
  2. 搭建consul 集群
  3. Battleships in a Board
  4. php判断数据库是否连接成功的测试例子
  5. Unity热门插件推荐
  6. Head First 设计模式 --6 命令模式
  7. pytho day6 <正则表达式、常用模块、反射>
  8. POJ-2352 Stars 树状数组
  9. (转)MySql可视化工具MySQL Workbench使用教程
  10. chrome浏览器打开网页,总是跳转到2345主页的解决方法 2345.com 绑架主页
  11. Unix/Linux环境C编程入门教程(33) 命令和鼠标管理用户和组
  12. Linux虚拟机下安装配置MySQL
  13. typedef struct 是什么意思
  14. Java Web实现IOC控制反转之依赖注入
  15. CSS深入理解学习笔记之line-height
  16. Tomcat优化详解
  17. python面试中被问的最多的10道题
  18. 转://Oracle Golden Gate 概念和原理
  19. BZOJ2288 生日礼物
  20. Sql Server 增加字段、修改字段、修改类型、修改默认值

热门文章

  1. 拾遗:Docker 基本应用
  2. NIO 源码分析(02-2) BIO 源码分析 Socket
  3. 绝对 "牛X" 的代码注释,喜欢就拿去用!
  4. [已解决]报错:报错AttributeError: 'int' object has no attribute 'upper'
  5. APP接口测试和功能测试点
  6. locust性能测试框架随笔
  7. winform 使用webbrowser 打开不了pdf的解决办法
  8. ArrayList、Vector、LinkedList的区别
  9. 2019-3-15-在-Windows-Defender-设置文件夹白名单提升-VisualStudio-编译速度
  10. C#常用设计模式