基于浅层分析的多文档自动文摘技术

被引:5
作者
张姝
赵铁军
郑德权
杨沐昀
机构
[1] 哈尔滨工业大学语言语音教育部-微软重点实验室
关键词
多文档文摘; 浅层分析; MMR方法; 自动评测;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出一种基于浅层分析的多文档文摘方法,该方法分析了单文档的结构信息,多文档的统计信息,并利用改进的MMR方法动态地计算文摘候选句子的加入对文摘的贡献,去除冗余信息,最终按照一定时间顺序输出多文档文摘.对生成的英文文摘进行基于n-gram方法的自动评测,结果表明该方法具有较好的信息覆盖率,具有一定的实用价值.
引用
收藏
页码:1102 / 1105
页数:4
相关论文
共 2 条
[1]   文本自动综述系统的研究与实现 [J].
郑义 ;
黄萱菁 ;
吴立德 .
计算机研究与发展, 2003, (11) :1606-1611
[2]  
Sentence Ordering in Multidocument Summarization .2 Barzilay R,Elhadad N,McKeown K.R. Proceedings of the 1st Human Language Technology Conference . 2001