相似性度量 Aprioir算法
2024-08-30 06:06:08
第三章
- 标称:转换成0,1来算,或者用非对称二元属性
- 二元:x1,x2的分布取00,01,10,11的二元属性个数,列表,算比例。不对称的二元属性就忽略00的属性个数
- 序数:转换成排位rif,度量:rif-1/mf-1
- 数值:欧几里得距离,曼哈顿距离,范数,切比雪夫距离
混合类型:
第六章:frequent pattern
1.关联分析及其度量
绝对支持度:出现的频次;相对支持度:出现的概率
支持度:联合概率A->B的支持度support=P(AB);置信度:条件概率confidence=P(B|A)=P(AB)/P(A)
找出支持度大于阈值的一些项集,即为频繁项,在这些频繁项中求置信度大于某个阈值的,这些即为关联规则
闭项集:x的超集支持度<x的支持度;x任意的超集都不是频繁项,则x是最大频繁项集。
2.Aprioir算法
Aprioir
- 定理1:如果一个项集是频繁的,那么其所有的子集(subsets)也一定是频繁的。
这个比较容易证明,因为某项集的子集的支持度一定不小于该项集。
- 定理2:如果一个项集是非频繁的,那么其所有的超集(supersets)也一定是非频繁的。
根据定理1,2可以对项集进行剪枝
- 定理3:同时满足最小支持度阀值和最小置信度阀值的规则称为强规则。
Aprioir算法的步骤:生成L1;连枝生成L2候选集,剪枝生成L2,
再连枝,再剪枝。。(连枝:三项集的元素顺序排列生成4项集:前两项相同第三项不同的三项集生成四项集没有重叠)
Aprioir改进:
Aprioir每次计算支持度都要烧苗一遍数据库。
最新文章
- wininet异步InternetReadFile和超时相关问题
- php数字补零的两种方法
- POJ 3761 Bubble Sort 快速幂取模+组合数学
- Java笔记——面向切面编程(AOP模式)
- &#39;dependencies.dependency.(groupId:artifactId:type:classifier)&#39; must be unique
- JavaScript中childNodes、children、nodeValue、nodeType、parentNode、nextSibling详细讲解
- UML--核心元素之包
- 在PreparedStatement中设置空值
- uva 10026 Shoemaker&#39;s Problem(排序)
- 封装ReaderWriterLockSlim
- [转载自阿里丁奇]各版本MySQL并行复制的实现及优缺点
- 用Itextsharp 组件导出PDF 的文档的方法
- 【react】利用shouldComponentUpdate钩子函数优化react性能以及引入immutable库的必要性
- python 实现快速排序
- DevOps“五宗罪”,这样向DevOps过渡注定会失败
- PowerDesigner 缺省值 引号 问题
- UITableViewCell 获取当前位置
- mail命令
- 2java.lang.NoClassDefFoundError异常
- 公司内网成功实现WSUS在不连外网的条件下更新补丁包!
热门文章
- Delphi:基于jcl的Bugsplat Crash收集单元
- Django具体操作(三)
- jQuery和js使用点滴
- idea中快捷键设置为eclipse中快捷键
- python collections 里面的Counter 统计所有出现的字符数量
- iserver-数据库型数据源导入后原dataset名称和数据库表名不一致的问题
- (转)在WinForm中选择本地文件
- hdu 5693 &;&; LightOj 1422 区间DP
- (O)jquery:e.target和this的区别(如何使事件委托后,被选元素的子元素不被选中)
- UIDataPicker 时间选择器