序言

FP-growth(Frequent Pattern Tree, 频繁模式树),是韩家炜老师提出的挖掘频繁项集的方法,是将数据集存储在一个特定的称作FP树的结构之后发现频繁项集或频繁项对,即常在一块出现的元素项的集合FP树。
FP-growth算法比Apriori算法效率更高,在整个算法执行过程中,只需遍历数据集2次,就能够完成频繁模式发现,其发现频繁项集的基本过程如下:
(1)构建FP树
(2)从FP树中挖掘频繁项集
FP-growth的一般流程如下:
1:先扫描一遍数据集,得到频繁项为1的项目集,定义最小支持度(项目出现最少次数),删除那些小于最小支持度的项目,然后将原始数据集中的条目按项目集中降序进行排列。
2:第二次扫描,创建项头表(从上往下降序),以及FP树。
3:对于每个项目(可以按照从下往上的顺序)找到其条件模式基(CPB,conditional patten base),递归调用树结构,删除小于最小支持度的项。如果最终呈现单一路径的树结构,则直接列举所有组合;非单一路径的则继续调用树结构,直到形成单一路径即可。

内容

构建FP树:

最新文章

  1. php面试 1013总结
  2. Android中Listview展示及其优化好处
  3. WinNTSetup v3.8.7 正式版绿色增强版
  4. struts2、jsp的简单路径的简单拦截
  5. 5.Makefile的原理及应用
  6. Javascript开发之工具归纳
  7. Guardian of Decency(二分图)
  8. What is the Database Initialization Parameter That is Associated to an ORA-32004 Error ?
  9. JS 的Date对象
  10. centos directory server
  11. LeetCode——Linked List Cycle II
  12. 解决Xcode 9.2系统真机测试时出现 could not find developer disk image问题
  13. 巧用UserAgent来解决浏览器的各种问题
  14. c语言第五次作业--函数
  15. 学JAVA第十一天,属性与方法
  16. linux怎么实时查看目录下是否有文件生成
  17. vscode跳转到函数定义处
  18. Spring配置文件中的那些标签意味着什么(持续更新)
  19. AE与C#入门笔记
  20. Java_反射_范型

热门文章

  1. 当我们进行综合和I/O布局后会发生什么QwQ
  2. iris数据集预测
  3. UML-迭代2:更多模式
  4. PES介绍(转载)
  5. reference-based measure|Distribution-based measure|密码子使用偏向性
  6. 美团:WSDM Cup 2019自然语言推理任务获奖解题思路
  7. 1. laravel 学习 环境搭建
  8. 十、GUI编程
  9. CSP模拟赛游记
  10. istio介绍