基于FP-Tree的最大频繁项目集挖掘及更新算法

被引:156
作者
宋余庆
朱玉全
孙志挥
陈耿
机构
[1] 东南大学计算机科学与工程系
[2] 东南大学计算机科学与工程系 江苏南京
[3] 河海大学计算机及信息工程学院
[4] 江苏常州
关键词
数据挖掘; 最大频繁项目集; 关联规则; 频繁模式树; 增量式更新;
D O I
10.13328/j.cnki.jos.2003.09.012
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用.
引用
收藏
页码:1586 / 1592
页数:7
相关论文
共 4 条
[1]   快速开采最大频繁项目集 [J].
路松峰 ;
卢正鼎 .
软件学报, 2001, (02) :293-297
[2]  
数据挖掘[M]. - 机械工业出版社 , (加)JiaweiHan, 2001
[3]  
Mining association rules between sets of items in large databases.In: Proceedings of the ACM SIGMOD International Conference Management of Date .2 Agrawal R,Imielinski T,Swami A. Washington . 1993
[4]  
DataMining:Concepts andTechniques .2 HanJ,KambrM. . 2001