一种篇章结构指导的中文Web文档自动摘要方法

被引:41
作者
王继成
武港山
周源远
张福炎
机构
[1] 南京大学软件新技术国家重点实验室,南京大学计算机科学与技术系南京,南京
关键词
自动摘要; 篇章结构; Web; 信息检索;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
“摘要”、“关键词”是对文档内容提供简要概括的元数据 ,在Web信息检索中起着重要作用 针对Web信息检索的需求和Web文档的特点 ,采用拟人思维 ,提出了一种以篇章结构为指导的自动摘要方法 该方法对段落之间的内容语义关系进行分析 ,进而划分出文档的主题层次 ,得到文档的篇章结构 ;在篇章结构的指导下 ,使用统计方法和启发式规则来提取文档的关键词、关键句 ,生成文档的摘要 在实验评估中 ,该方法取得了令人满意的摘要质量和速度
引用
收藏
页码:398 / 405
页数:8
相关论文
共 5 条
[1]   Web文档清洗技术 [J].
张波 ;
王继成 ;
王强 ;
张福炎 .
计算机科学, 2002, (06) :52-54
[2]   Web信息检索研究进展 [J].
王继成 ;
萧嵘 ;
孙正兴 ;
张福炎 .
计算机研究与发展, 2001, (02) :187-193
[3]   基于统计方法的汉语自动文摘系统研究 [J].
王文欣 ;
黄萱菁 ;
吴立德 .
计算机应用与软件, 2000, (09) :28-33
[4]   基于知识的文本摘要系统研究与实现 [J].
孙春葵 ;
李蕾 ;
杨晓兰 ;
钟义信 .
计算机研究与发展, 2000, (07) :874-881
[5]   中文自动文摘原理与方法探索 [J].
吴岩 ;
刘挺 ;
王开铸 ;
陈彬 .
中文信息学报 , 1998, (02) :9-17