代码中Ci表示候选频繁i项集,Li表示符合条件的频繁i项集
  
  # coding=utf-8
  
  def createC1(dataSet): # 构建所有1项候选项集的集合
  
  C1 = []
  
  for transaction in dataSet:
  
  for item in transaction:
  
  if [item] not in C1:
  
  C1.append([item]) # C1添加的是列表,对于每一项进行添加,[[1], [2], [3], [4], [5]]
  
  #print('C1:',C1)
  
  return list(map(frozenset, C1)) # 使用frozenset,被“冰冻”的集合,为后续建立字典key-value使用。
  
  ###由候选项集生成符合最小支持度的项集L。参数分别为数据集、候选项集列表,最小支持度
  
  ###如
  
  ###C3: [frozenset({1, 2, 3}), frozenset({1, 3, 5}), frozenset({2, 3, 5})]
  
  ###L3: [frozenset({2, 3, 5})]
  
  def scanD(D, Ck, minSupport):
  
  ssCnt = {}
  
  for tid in D: # 对于数据集里的每一条记录
  
  for can in Ck: # 每个候选项集can
  
  if can.issubset(tid): # 若是候选集can是作为记录的子集,那么其值+1,对其计数
  
  if not ssCnt.__contains__(can): # ssCnt[can] = ssCnt.get(can,0)+1一句可破,没有的时候为0,加上1,有的时候用get取出,加1
  
  ssCnt[can] = 1
  
  else:
  
  ssCnt[can] += 1
  
  numItems = float(len(D))
  
  retList = []
  
  supportData = {}
  
  for key in ssCnt:
  
  support = ssCnt[key] / numItems # 除以总的记录条数,即为其支持度
  
  if support >= minSupport:
  
  retList.insert(0, key) # 超过最小支持度的项集,将其记录下来。
  
  supportData[key] = support
  
  return retList, supportData
  
  ###由Lk生成K项候选集Ck
  
  ###如由L2: [frozenset({3, 5}), frozenset({2, 5}), frozenset({2, 3}), frozenset({1, 3})]
  
  ###生成
  
  ###C3: [frozenset({1, 2, 3}), frozenset({1, 3, 5}), frozenset({2, 3, 5})]
  
  def aprioriGen(Lk, k):
  
  retList = []
  
  lenLk = len(Lk)
  
  for i in range(lenLk):
  
  for j in range(i + 1,lenLk):
  
  if len(Lk[i] | Lk[j])==k:
  
  retList.append(Lk[i] | Lk[j])
  
  return list(set(retList))
  
  ####生成所有频繁子集
  
  def apriori(dataSet, minSupport=0.5):
  
  C1 = createC1(dataSet)
  
  D = list(map(set, dataSet))
  
  L1, supportData = scanD(D, C1, minSupport)
  
  L = [L1] # L将包含满足最小支持度,即经过筛选的所有频繁n项集,这里添加频繁1项集
  
  k = 2
  
  while (len(L[k - 2]) > 0): # k=2开始,由频繁1项集生成频繁2项集,直到下一个打的项集为空
  
  Ck = aprioriGen(L[k - 2], k)
  
  Lk, supK = scanD(D, Ck, minSupport)
  
  supportData.update(supK) # supportData为字典,存放每个项集的支持度,并以更新的方式加入新的supK
  
  L.append(Lk)
  
  k += 1
  
  return L, supportData
  
  if __name__ == "__main__":
  
  dataSet = [[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5]]
  
  D = list(map(set, dataSet))
  
  L,suppData = apriori(dataSet)
  
  print('L:',L)
  
  print('suppData:',suppData)
  
  '''
  
  C1 = createC1(dataSet)
  
  L1, supportData1 = scanD(D, C1, 0.5)
  
  print('C1:',C1)
  
  print('L1:',L1)
  
  print('supportData1:',supportData1)
  
  C2 = aprioriGen(L1, 2)
  
  L2, supportData2 = scanD(D, C2, 0.5)
  
  print('C2:',C2)
  
  print('L2:',L2)
  
  print('supportData2:www.gcyl152.com/',supportData2)
  
  C3 = aprioriGen(L2, 3)
  
  L3, supportData3 www.michenggw.com= scanD(D, C3, 0.5)
  
  print('C3:',C3)
  
  print('L3:',L3)
  
  print('supportData3:',supportData3)
  
  '''
  
  最终得到的所有支持度大于0.5的频繁子集及其支持度如下:
  
          frozenset({1})www.mcyllpt.com/ : 0.5, 
  
          frozenset({3}): 0.75, 
  
          frozenset({4}): 0.25, 
  
          frozenset({2}): 0.75, 
  
          frozenset({5}): 0.75, 
  
          frozenset({1, 3}): 0.5, 
  
          frozenset({2, 3}): 0.5, 
  
          frozenset({2, 5}): 0.75, 
  
          frozenset({3, 5}): 0.5, 
  
          frozenset({1, 2}): 0.25, 
  
          frozenset({1, 5}): 0.25, 
  
          frozenset({2, 3, 5}): 0.5, 
  
          frozenset({1, 2, 3}): 0.25, 
  
          frozenset({1, 3, 5}): 0.25

最新文章

  1. Hide JSP error icons in Eclipse
  2. 17.iOS App设置icon,启动图,App名称的方法
  3. Cocoa的MVC架构分析 cocoa的mvc实现
  4. MYSQL group_concat() 函数
  5. Delphi 10.1 柏林更新内容简译
  6. studio_svn
  7. esp8266 SDK开发之GPIO中断
  8. a标签传递参数
  9. mongodb 索引的基本命令
  10. iOS下WebRTC音视频通话(一)
  11. .NET开发微信小程序(基础配置)
  12. Kotlin入门学习笔记
  13. YII2 console中引用其他模块(子项目)的model时出现model找不到命名空间的问题解决
  14. 让自己的网站实现在线编辑office文档
  15. 解决python3.5无法导入cv2.so的问题
  16. 3. RNN神经网络-LSTM模型结构
  17. TOJ2470
  18. Beta Scrum Day 1 — 听说
  19. java垃圾回收期如何工作(编程思想)
  20. 博客搬家到blog.wu8685.com

热门文章

  1. React中的全选反选问题
  2. React学习(3)——Router路由的使用和页面跳转
  3. jQuery(二)事件
  4. 一个好用的C# HttpCookieHelper.cs类
  5. linux上面安装LAMP环境
  6. ZooKeeper(3)-内部原理
  7. 关于Linux中mysql中文乱码
  8. JavaSE基础复习---Class类与反射机制
  9. 学习RUNOOB.COM进度一
  10. MVC中路由的修改和浏览器的地址参数