这里来挖掘超市购物车数据。

名词:

1、挖掘数据集:购物篮数据

2、挖掘目标:关联规则

3、关联规则:牛奶=>鸡蛋[支持度=2%,置信度=60%]

4、指出度:分析中的全部事务的2%同时购买了牛奶和鸡蛋

5、置信度:购买牛奶的篮子同时也购买了鸡蛋

6、最小支持阈值和最小置信阈值:由挖掘者或领域专家设定

7、项集:由商品组成的集合

8、k-项集:k个项组成的集合

9、频繁项集:满足最小支持度的项集,频繁k-项集一般记为Lk

10、强关联规则:满足最小支持度阈值和最小置信度阈值的规则

在R里面有一个arules包用于分析购物篮问题

library(arules)                              #调用这个包

data("Groceries")                              #调用这个数据集
r<-apriori(Groceries,parameter = list(support=0.01,confidence=0.5))      #这是调用这个包的一个函数,及其参数

summary(r)                                #查看结果
inspect(r)                                #也是查看结果

然后就。。。。。。。结束啦!!! 就这么,简单

其中这个结果中会有一个值:lift  这是一个类似相关系数的指标  当lift=1的时候表示L和R独立  但当这个lift值越大的时候,越表明L和R存在在一个购物篮不是一个偶然现象

最新文章

  1. 2.lvm动态逻辑卷
  2. YII Install 安装
  3. 【2016-11-2】【坚持学习】【Day17】【微软 推出的SQLHelper】
  4. buildroot 制作Linux文件系统初级使用教程
  5. Mahout源码分析之 -- 文档向量化TF-IDF
  6. RabbitMQ学习总结 第五篇:路由Routing
  7. FASTDFS .net 客户端
  8. 重新安装Photoshop CS6以后启动软件出现Licensing for this product has expired
  9. Mac OS X 配置 Apache+Mysql+PHP 详细教程
  10. 【网络流24题】No.18 分配问题 (二分图最佳匹配 费用流|KM)
  11. Jmeter软件测试2--http接口测试
  12. javascript中的继承用法
  13. strtok、strtok_s、strtok_r 字符串切割函数
  14. java常见文件操作
  15. ###服务(Service)
  16. 信息化建设中的IT规划精要
  17. 从码农到技术总监分享Leader经验
  18. Java - Java入门(2-1am)
  19. 怎么把mkv转成mp4,有什么方法
  20. py库: GUI(tkinter)

热门文章

  1. Luogu P5351 Ruri Loves Maschera
  2. urllib基础-利用网站结构爬取网页-百度搜索
  3. Oracle旗下软件官网下载速度过慢解决办法
  4. java 一个对象多少大,占用多少内存
  5. js常用技巧汇总
  6. [POJ]1164 The Castle
  7. docker:安装mysql
  8. jq相关操作
  9. Spark MLlib + maven + scala 试水~
  10. 模板&lt;最小生成树&gt;