一种基于LexRank算法的改进的自动文摘系统

被引:16
作者
纪文倩
李舟军
巢文涵
陈小明
机构
[1] 北京航空航天大学计算机学院
关键词
自动文摘; LexRank; 句子相似度; 动态调整; 冗余处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
自动文摘是计算机语言学领域的一个研究重点,其研究和应用受到了计算机科学、语言学、情报信息学等相关学科的广泛关注。首先介绍了基于LexRank算法的自动文摘方法。针对该方法的不足,从句子相似度计算方法、句子权重计算方法以及冗余处理等方面对它进行了改进,从而可以根据输入文本内容动态地调整相关影响因子。实现的文摘系统,可以对中文和英文的单文本或多文本进行自动文摘。在哈工大和DUC的测评语料上进行了实验,结果表明该系统在一定程度上改进了文摘的质量,在多文本文摘中的抗噪声方面也有一定的优越性。最后讨论了自动摘要研究存在的问题,并指出了自动文摘的研究趋势。
引用
收藏
页码:151 / 154+218 +218
页数:5
相关论文
共 11 条
[1]   基于信息融合的多文档自动文摘技术 [J].
徐永东 ;
徐志明 ;
王晓龙 .
计算机学报, 2007, (11) :2048-2054
[2]   文本自动综述系统的研究与实现 [J].
郑义 ;
黄萱菁 ;
吴立德 .
计算机研究与发展, 2003, (11) :1606-1611
[3]   一种篇章结构指导的中文Web文档自动摘要方法 [J].
王继成 ;
武港山 ;
周源远 ;
张福炎 .
计算机研究与发展, 2003, (03) :398-405
[4]   OA中文文献自动摘要系统 [J].
王永成 ;
许慧敏 .
情报学报, 1997, (02) :49-53
[5]  
多文档自动文摘关键技术研究[D]. 徐永东.哈尔滨工业大学. 2007
[6]  
中文自动文摘及评价方法的研究[D]. 黄丽琼.重庆大学. 2007
[7]  
基于概念向量空间模型的中文自动文摘研究[D]. 王萌.华中师范大学. 2005
[8]  
SCISOR: extracting information from on-line news[J] . P. S. Jacobs,Lisa F. Rau.Communications of the ACM . 1990 (11)
[9]   AUTOMATIC ABSTRACTING AND INDEXING - SURVEY AND RECOMMENDATIONS [J].
EDMUNDSON, HP ;
WYLLYS, RE .
COMMUNICATIONS OF THE ACM, 1961, 4 (05) :226-234
[10]  
Columbia university at DUC2004 .2 Blair-Goldensohn S,Evans D,et al. Proceedings of the2004Document Understanding Conference(DUC2004) . 2004