一.简介 FPGrowth算法是关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-tree),但仍保留项集关联信息.在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构.FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成. 相关术语: 1.项与项集 这是一个集合的概念,以购物车为例,一件商品就是一项[item],若干项的集合为项集,如{特步鞋,安踏运动服}为一个二元项集. 2.关联规则 关联规则用于表示数据内隐含的关