[数据挖掘课程笔记]Naïve Bayesian Classifier
2024-08-29 04:08:16
朴素贝叶斯模型
1) X:一条未被标记的数据
2) H:一个假设,如H=X属于Ci类
根据贝叶斯公式
把X表示为(x1,x2,....xn) x1,x2,....xn表示X在各个特征上的值。
假设有c1,c2,c3...cm个类别。
那么这个对X的分类问题就可以转化为找出使P(ci|X)最大的类别ci作为分类结果
由于我们只需要找出P(ci|X)的相对最大值,那么即找出P(X|ci)P(ci)的最大值即可
N为整个训练集的个数
P(ci)=count(ci)/N
假设X的各个属性是相互独立的:
那么,如何求P(xi|cj)呢?
若第i个属性是离散型的,那么 P(xi|cj) = 所有分类为cj并且第i个属性值等于xi的数据个数/所有分类为cj的数据个数
若第i个属性是连续型的,假设这个连续型属性服从高斯分布:
那么
其中μci为所有数据类型为ci并且第i个属性值为xi的平均值
为所有数据类型为ci并且第i个属性值为xi的方差
最新文章
- php+phpStorm+xdebug配置方法
- PHP之图片上传类(加了缩略图)
- leetcode6:Zigzag Conversion@Python
- C#:org.in2bits.MyXls 文本格式日期 转换,以及设置单元格格式,保留两位小数点
- BZOJ2654 tree
- Android 数据传输之MessagePack使用
- php composer 安装
- linux 下 启动oracle
- MySQL连接问题【如何解决MySQL连接超时关闭】
- 系统的讲解 - SSO单点登录
- c语言static关键字的理解
- 前向传播算法(Forward propagation)与反向传播算法(Back propagation)
- SDL2.0.9源码分析
- 2017-12-14python全栈9期第一天第六节之用户交互
- 构建 Owin 中间件 来获取客户端IP地址
- java_opts 参数与JVM内存调优
- LeetCode contest-95[876,877,👁878]
- Android : 基于alsa库的音乐播放
- out, ref 和 params 的区别和用法
- 使用AppCompat项目模版