文本自动综述系统的研究与实现

被引:9
作者
郑义
黄萱菁
吴立德
机构
[1] 复旦大学计算机科学与工程系,复旦大学计算机科学与工程系,复旦大学计算机科学与工程系上海,上海,上海
关键词
文本自动综述; 文本分段; 文本聚类; 向量空间模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本自动综述是自动文摘在多文档上的推广.提出了一种基于统计的文本自动综述方法,并描述了它的实现过程.该方法利用文档内和文档之间段落的语义相关性,实现多文档的自动综述.首先对文本进行分段实现信息分割;再对文本段进行聚类实现信息凝聚;最后抽取代表段产生综述结果实现信息压缩.实验结果表明,该方法是有效的,具有一定的实用价值.
引用
收藏
页码:1606 / 1611
页数:6
相关论文
共 5 条
[1]  
D Radev,K McKeown.Generating natural language summariesfrom multiple online sources. Computational Linguistics . 1998
[2]  
I Mani.Automatic Summarization. . 2001
[3]  
J Goldstein,V Mittal,J Carbonell et al.Multi-documentsummarization by sentence extraction. . 2000
[4]  
A K Jain,R C Dubes.Algorithms for Clustering Data. . 1988
[5]  
J Goldstein.Automatic text summarization of multiple documents[Ph D dissertation]. . 1999