面向模式图变化的增量图模式匹配

被引:5
|
作者
张丽霞 [1 ,2 ]
王伟平 [1 ]
高建良 [1 ]
王建新 [1 ]
机构
[1] 中南大学信息科学与工程学院
[2] 湖南师范大学数学与计算机科学学院
关键词
图模式匹配; 增量算法; 动态图; 大数据;
D O I
10.13328/j.cnki.jos.004891
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在大数据时代,数据图的规模急剧增长,增量图模式匹配算法能够在数据图或模式图发生变化时避免重新在整个数据图上进行匹配、减少响应时间,因此成为了研究的热点.针对实际应用中数据图不变而模式图发生变化的情况,提出了一种面向模式图变化的增量图模式匹配算法PGCInc GPM,在模式图匹配的过程中记录适当的中间结果作为索引,用于后续的模式匹配.提出了增强的图模式匹配算法GPMS,用于首次整个数据图上的模式匹配.该算法一方面能够建立后续增量匹配所需的索引,另一方面减少了整个数据图匹配的执行时间.设计实现了面向模式图增边和减边的两个核心子算法,通过子算法的组合,能够支持在模式图发生各种变化时进行增量图模式匹配.在真实数据集和合成数据集上进行实验,结果表明:与重新在整个数据图上进行匹配的Re Computing算法相比,当模式图中变化的边的数目不超过不变的边的数目时,PGCInc GPM算法能够有效减少图模式匹配的执行时间;随着数据图规模的增大,PGCInc GPM算法相对于Re Computing算法的执行时间的减少程度更加明显,对于大规模数据图具有更好的适用性.
引用
收藏
页码:2964 / 2980
页数:17
相关论文
共 17 条
  • [1] Fast incremental simrank on link-evolving graphs. Yu WR,Lin XM,Zhang WJ. Proc of the 30th Int’’l Conf on Data Engineering (ICDE 2014) . 2014
  • [2] Classification of Web documents using a graph model. Schenker A,Last M,Bunke H,Kandel A. Proc.of the 7th Int’’l Conf.on Document Analysis and Recognition (ICDAR 2003) . 2003
  • [3] An incremental algorithm for a generalization of the shortest-path problem
    Ramalingam, G
    Reps, T
    [J]. JOURNAL OF ALGORITHMS, 1996, 21 (02) : 267 - 305
  • [4] A distributed vertex-centric approach for pattern matching in massive graphs. Frad A,Nisar MU,Ramaswamy L,Miller J,Saltz M. Proc of the IEEE Int’’l Conf.on Big Data . 2013
  • [5] Continuous pattern detection over billion-edge graph using distributed framework. Gao J,Zhou C,Zhou JS,Yu J. Proc of the30th Int’’l Conf on Data Engineering (ICDE 2014) . 2014
  • [6] Continuous subgraph pattern search over graph streams. Wang C,Chen L. Proc.of the 25th Int’’l Conf on Data Engineering (ICDE 2009) . 2009
  • [7] Incremental graph matching for situation awareness. Stotz A,Nagi R,Sudit M. Proc of the 12th Int’’l Conf on Information Fusion (FUSION 2009) . 2009
  • [8] Incremental maintenance of XML structural indexes. Yi K,He H,Stanoi I,,Yang J. Proceeding of the ACM SIGMOD International Conference on Management of Data (SIGMOD) . 2004
  • [9] GPLAG: Detection of SoftwarePlagiarism by Program Dependence Graph Analysis. Chao Liu,Chen Chen,Jiawei Han,Philip S.Yu. KDD’’06 . 2006
  • [10] Taming verification hardness: an efficient algorithm for testing subgraph isomorphism. Haichuan Shang,Ying Zhang,Xuemin Lin,Jeffrey Xu Yu. Proceedings of the VLDB Endowment . 2008