SCC——利用分类技术改进的短摘要比较方法

被引:1
作者
龚笔宏 [1 ]
机构
[1] 北京大学计算机科学技术系 北京100871
关键词
信息检索; 文档比较; 摘要; 用户反馈;
D O I
10.16511/j.cnki.qhdxxb.2005.s1.017
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
搜索引擎返回结果的摘要的特点在于文档长度短,大部分关键字最多只出现一次,因此传统文档比较方法所使用的TF-IDF、夹角余弦等方法对摘要比较失去了作用。为了改进传统文档比较方法,该文利用分类技术对短摘要信息进行扩充,以改进摘要比较。将两个摘要分别与参照物进行比较,在较大的一个文档集合中找到与摘要相近的文档集合。用这些文档集合扩充短摘要的含义,以替代短摘要来衡量摘要相似度。实验结果表明,使用改进后的摘要比较算法,相关集合的DCG指标有了明显改进。
引用
收藏
页码:1806 / 1809
页数:4
相关论文
共 5 条
[1]  
Learning to cluster web search results. ZENG Huajun,HE Qicai,CHEN Zheng,et al. Annual International ACM SIGIR Conference 2004 . 2004
[2]  
Improving retrieval performance by relevance feedback. Salton G,Buckley C. J ournal of the American Society for Information Science . 1990
[3]  
Re-examining the potential effectiveness of interactive query expansion. Ruthven I. Annual International ACM SIGIR Conference 2003 . 2003
[4]  
Using latent semantic indexing for information filtering. Foltz P W. Conference on Office Information Systems . 1990
[5]  
Evaluation by highly relevant documents. Voorhees E M. The 24th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval . 2001