第三章

  1. 标称:转换成0,1来算,或者用非对称二元属性
  2. 二元:x1,x2的分布取00,01,10,11的二元属性个数,列表,算比例。不对称的二元属性就忽略00的属性个数
  3. 序数:转换成排位rif,度量:rif-1/mf-1
  4. 数值:欧几里得距离,曼哈顿距离,范数,切比雪夫距离

混合类型:


第六章:frequent pattern

1.关联分析及其度量

  绝对支持度:出现的频次;相对支持度:出现的概率

  支持度:联合概率A->B的支持度support=P(AB);置信度:条件概率confidence=P(B|A)=P(AB)/P(A)

  找出支持度大于阈值的一些项集,即为频繁项,在这些频繁项中求置信度大于某个阈值的,这些即为关联规则

  闭项集:x的超集支持度<x的支持度;x任意的超集都不是频繁项,则x是最大频繁项集。

2.Aprioir算法

Aprioir  

  • 定理1:如果一个项集是频繁的,那么其所有的子集(subsets)也一定是频繁的。

这个比较容易证明,因为某项集的子集的支持度一定不小于该项集。

  • 定理2:如果一个项集是非频繁的,那么其所有的超集(supersets)也一定是非频繁的。

  根据定理1,2可以对项集进行剪枝

  • 定理3:同时满足最小支持度阀值和最小置信度阀值的规则称为强规则。

Aprioir算法的步骤:生成L1;连枝生成L2候选集,剪枝生成L2,

再连枝,再剪枝。。(连枝:三项集的元素顺序排列生成4项集:前两项相同第三项不同的三项集生成四项集没有重叠)

Aprioir改进:

Aprioir每次计算支持度都要烧苗一遍数据库。

最新文章

  1. wininet异步InternetReadFile和超时相关问题
  2. php数字补零的两种方法
  3. POJ 3761 Bubble Sort 快速幂取模+组合数学
  4. Java笔记——面向切面编程(AOP模式)
  5. &#39;dependencies.dependency.(groupId:artifactId:type:classifier)&#39; must be unique
  6. JavaScript中childNodes、children、nodeValue、nodeType、parentNode、nextSibling详细讲解
  7. UML--核心元素之包
  8. 在PreparedStatement中设置空值
  9. uva 10026 Shoemaker&#39;s Problem(排序)
  10. 封装ReaderWriterLockSlim
  11. [转载自阿里丁奇]各版本MySQL并行复制的实现及优缺点
  12. 用Itextsharp 组件导出PDF 的文档的方法
  13. 【react】利用shouldComponentUpdate钩子函数优化react性能以及引入immutable库的必要性
  14. python 实现快速排序
  15. DevOps“五宗罪”,这样向DevOps过渡注定会失败
  16. PowerDesigner 缺省值 引号 问题
  17. UITableViewCell 获取当前位置
  18. mail命令
  19. 2java.lang.NoClassDefFoundError异常
  20. 公司内网成功实现WSUS在不连外网的条件下更新补丁包!

热门文章

  1. Delphi:基于jcl的Bugsplat Crash收集单元
  2. Django具体操作(三)
  3. jQuery和js使用点滴
  4. idea中快捷键设置为eclipse中快捷键
  5. python collections 里面的Counter 统计所有出现的字符数量
  6. iserver-数据库型数据源导入后原dataset名称和数据库表名不一致的问题
  7. (转)在WinForm中选择本地文件
  8. hdu 5693 &amp;&amp; LightOj 1422 区间DP
  9. (O)jquery:e.target和this的区别(如何使事件委托后,被选元素的子元素不被选中)
  10. UIDataPicker 时间选择器