FP-Grow树
2024-09-07 07:37:11
序言
FP-growth(Frequent Pattern Tree, 频繁模式树),是韩家炜老师提出的挖掘频繁项集的方法,是将数据集存储在一个特定的称作FP树的结构之后发现频繁项集或频繁项对,即常在一块出现的元素项的集合FP树。
FP-growth算法比Apriori算法效率更高,在整个算法执行过程中,只需遍历数据集2次,就能够完成频繁模式发现,其发现频繁项集的基本过程如下:
(1)构建FP树
(2)从FP树中挖掘频繁项集
FP-growth的一般流程如下:
1:先扫描一遍数据集,得到频繁项为1的项目集,定义最小支持度(项目出现最少次数),删除那些小于最小支持度的项目,然后将原始数据集中的条目按项目集中降序进行排列。
2:第二次扫描,创建项头表(从上往下降序),以及FP树。
3:对于每个项目(可以按照从下往上的顺序)找到其条件模式基(CPB,conditional patten base),递归调用树结构,删除小于最小支持度的项。如果最终呈现单一路径的树结构,则直接列举所有组合;非单一路径的则继续调用树结构,直到形成单一路径即可。
内容
构建FP树:
最新文章
- php面试 1013总结
- Android中Listview展示及其优化好处
- WinNTSetup v3.8.7 正式版绿色增强版
- struts2、jsp的简单路径的简单拦截
- 5.Makefile的原理及应用
- Javascript开发之工具归纳
- Guardian of Decency(二分图)
- What is the Database Initialization Parameter That is Associated to an ORA-32004 Error ?
- JS 的Date对象
- centos directory server
- LeetCode——Linked List Cycle II
- 解决Xcode 9.2系统真机测试时出现 could not find developer disk image问题
- 巧用UserAgent来解决浏览器的各种问题
- c语言第五次作业--函数
- 学JAVA第十一天,属性与方法
- linux怎么实时查看目录下是否有文件生成
- vscode跳转到函数定义处
- Spring配置文件中的那些标签意味着什么(持续更新)
- AE与C#入门笔记
- Java_反射_范型