基于语义关系查询扩展的文档重构方法

被引:50
作者
张敏
宋睿华
马少平
机构
[1] 清华大学计算机科学与技术系智能技术与系统国家重点实验室,清华大学计算机科学与技术系智能技术与系统国家重点实验室,清华大学计算机科学与技术系智能技术与系统国家重点实验室北京,北京,北京
关键词
文档重构; 查询扩展; 语义相似性; 词不匹配; 概念检索;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
已知文档与用户查询之间相同概念不同表达形式造成的词不匹配问题是影响信息检索效果的重要原因之一 .该文提出了根据词之间的语义关系进行扩展和替换的文档重构方法 .它与传统的查询扩展不同 ,实现了同一概念信息的聚集 ,是更接近于人类进行信息查找的思维方法 .进一步地 ,研究给出一种有效的实时文档重构检索策略 ,解决了文档重构方法在实际应用中的可行性 .在标准测试数据集上的实验表明 ,基于查询扩展的文档重构方法不仅比不扩展的最佳性能始终有 14 %~ 2 3.4 %的提高 ,而且比相对应的传统查询扩展方法也有约 16 %的提高 .
引用
收藏
页码:1395 / 1401
页数:7
相关论文
共 15 条
[1]  
Thresholding postings lists, query expansion by word-word distances and POS tagging of Spanish text. Smeaton A. F,and Berrut. C. Proceedings of the 4th Text Retrieval Conference . 1996
[2]  
Query Expansion using Local and Global Document Analysis. Xu, J,and W. B Croft. Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval . 1996
[3]  
Experimentsinautomaticstatisticalthe saurusconstruction. CrouchC .J,YongB. Proceedingsofthe15thInternationalACM/SIGIRConferenceonR & DinInformationRetrieval (SI GIR’’92) . 1992
[4]  
Identifyingsynonymsamongdistributionallysimilarwords. LinDeKang,ZhaoShaoJunetal. ProceedingsofInternationalJointConferenceofArtificialIntelligence (IJCAI 03) . 2003
[5]  
Using wordnet in a knowledge-based approach to information retrieval. Richardson R,and Smeaton A. Trinity College DublinWorking paper ca-0395 . 1995
[6]  
Acooccurrence basedthesaurusandtwoapplicationstoinformationretrieval. SchutzeH,PedersenJ .O. ProceedingsofIntel ligentMultimediaInformationRetrievalSystemsandManagement (RIAO’’94) . 1994
[7]  
Concept discovery from text. Lin D,Pantel P. Proceedings of Conference on Computational Linguistics 2002 . 2002
[8]  
Atheoreticalbasisfortheuseofco occur rencedataininformationretrieval. vanRijbergenC .J. JournalofDocumentation . 1977
[9]  
WordNetlexicaldatabasehomepage. http://www.cogsci.princeton.edu/-wn .
[10]  
Query expansion using lexical-semantic relations. Voorhees E M. Proceedings of the 17th ACM SIGIR Conference on R&D in Information Retrieval . 1994