基于FP-Tree的最大频繁项目集挖掘及更新算法

被引：156

作者：

宋余庆

朱玉全

孙志挥

陈耿

机构：

[1] 东南大学计算机科学与工程系

[2] 东南大学计算机科学与工程系江苏南京

[3] 河海大学计算机及信息工程学院

[4] 江苏常州

来源：

软件学报 | 2003年 / 09期

关键词：

数据挖掘; 最大频繁项目集; 关联规则; 频繁模式树; 增量式更新;

D O I：

10.13328/j.cnki.jos.2003.09.012

中图分类号：

TP311.13 [];

学科分类号：

1201 ;

摘要：

挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用.

引用

页码：1586 / 1592

页数：7