语义查询扩展中词语-概念相关度的计算

被引:46
作者
田萱
杜小勇
李海华
机构
[1] 教育部数据工程与知识工程重点实验室
关键词
语义查询扩展; 概念; 本体; 词语-概念相关度;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
在基于语义的查询扩展中,为了找到描述查询需求语义的相关概念,词语.概念相关度的计算是语义查询扩展中的关键一步.针对词语.概念相关度的计算,提出一种K2CM(keyword to concept method)方法.K2CM方法从词语.文档.概念所属程度和词语.概念共现程度两个方面来计算词语.概念相关度问语.文档.概念所属程度来源于标注的文档集中词语对概念的所属关系,即词语出现在若干文档中而文档被标注了若干概念.词语.概念共现程度是在词语概念对的共现性基础上增加了词语概念对的文本距离和文档分布特征的考虑.3种不同类型数据集上的语义检索实验结果表明,与传统方法相比,基于K2CM的语义查询扩展可以提高查询效果.
引用
收藏
页码:2043 / 2053
页数:11
相关论文
共 8 条
[1]   基于语义关系查询扩展的文档重构方法 [J].
张敏 ;
宋睿华 ;
马少平 .
计算机学报, 2004, (10) :1395-1401
[2]   基于用户日志的查询扩展统计模型 [J].
崔航 ;
文继荣 ;
李敏强 .
软件学报, 2003, (09) :1593-1599
[3]   自然语言处理中词语上下文有效范围的定量描述 [J].
鲁松 ;
白硕 .
计算机学报, 2001, (07) :742-747
[4]  
Concept-based knowledge discovery in texts extracted from the Web[J] . Stanley Loh,Leandro Krug Wives,José Palazzo M. de Oliveira.ACM SIGKDD Explorations Newsletter . 2000 (1)
[5]   Improving the effectiveness of information retrieval with local context analysis [J].
Xu, JX ;
Croft, WB .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2000, 18 (01) :79-112
[6]  
Similarity-Based Models of Word Cooccurrence Probabilities[J] . Ido Dagan,Lillian Lee,Fernando C. N. Pereira.Machine Learning . 1999 (1)
[7]   THE VOCABULARY PROBLEM IN HUMAN SYSTEM COMMUNICATION [J].
FURNAS, GW ;
LANDAUER, TK ;
GOMEZ, LM ;
DUMAIS, ST .
COMMUNICATIONS OF THE ACM, 1987, 30 (11) :964-971
[8]  
Efficient and self-tuning incremental query expansion for Top-K query Processing .2 Martin T,Ralf S,Gerhard W. Proc.of the 28th Annual Int‘l ACM SIGIR Conf.on Research and Development in Information Retrieval . 2005