CHI统计方法度量特征词和类别之间的相关度
2024-09-02 11:53:10
其中,
A:包含特征词w且属于类别c的文档频数
B:包含特征词w但不属于类别c的文档频数
C:属于类别c但不包含特征词w的文档频数
D:既不属于c也不包含特征词w的文档频数
N:文档总数
CHI统计方法用来度量特征词w和类别c之间的相关度。
当值为零时,表示特征值w和c相互独立;值越大,表示相关性越强,此时特征值w包含类别c相关的鉴别信息越多。
去除特征词与类别负相关情况:
最新文章
- 一步步学习javascript基础篇(9):ajax请求的回退
- 搭建consul 集群
- Battleships in a Board
- php判断数据库是否连接成功的测试例子
- Unity热门插件推荐
- Head First 设计模式 --6 命令模式
- pytho day6 <;正则表达式、常用模块、反射>;
- POJ-2352 Stars 树状数组
- (转)MySql可视化工具MySQL Workbench使用教程
- chrome浏览器打开网页,总是跳转到2345主页的解决方法 2345.com 绑架主页
- Unix/Linux环境C编程入门教程(33) 命令和鼠标管理用户和组
- Linux虚拟机下安装配置MySQL
- typedef struct 是什么意思
- Java Web实现IOC控制反转之依赖注入
- CSS深入理解学习笔记之line-height
- Tomcat优化详解
- python面试中被问的最多的10道题
- 转://Oracle Golden Gate 概念和原理
- BZOJ2288 生日礼物
- Sql Server 增加字段、修改字段、修改类型、修改默认值
热门文章
- 拾遗:Docker 基本应用
- NIO 源码分析(02-2) BIO 源码分析 Socket
- 绝对 "牛X" 的代码注释,喜欢就拿去用!
- [已解决]报错:报错AttributeError: &#39;int&#39; object has no attribute &#39;upper&#39;
- APP接口测试和功能测试点
- locust性能测试框架随笔
- winform 使用webbrowser 打开不了pdf的解决办法
- ArrayList、Vector、LinkedList的区别
- 2019-3-15-在-Windows-Defender-设置文件夹白名单提升-VisualStudio-编译速度
- C#常用设计模式