从Web获取部分整体关系语料的方法

被引:4
作者
曹馨宇 [1 ,2 ]
曹存根 [1 ,2 ]
机构
[1] 中国科学院计算技术研究所智能信息处理重点实验室
[2] 中国科学院研究生院
关键词
部分整体关系获取; 语料获取; 查询构造;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
部分整体关系获取是知识获取中的重要组成部分。Web逐步成为知识获取的重要资源之一。搜索引擎是从Web中获取部分整体关系知识的有效手段之一,我们将Web中包含部分整体关系的检索结果集合称为部分整体关系语料。由于目前主流搜索引擎尚不支持语义搜索,如何构造有效的查询以得到富含部分整体关系的语料,从而进一步获取部分整体关系,就成为一个重要的问题。该文提出了一种新的查询构造方法,目的在于从Web中获取部分整体关系语料。该方法能够构造基于语境词的查询,进而利用现有的搜索引擎从Web中获取部分整体关系语料。该方法在两个方面与人工构造查询方法和基于语料库查询构造查询方法所获取的语料进行对比,其一是语料中含有部分整体关系的语句数量;二是从语料中进一步获取部分整体关系的难易程度。实验结果表明,该方法远远优于后两者。
引用
收藏
页码:17 / 23
页数:7
相关论文
共 4 条
[1]   Web检索查询意图分类技术综述 [J].
张森 ;
王斌 .
中文信息学报, 2008, (04) :75-82
[2]   用同义表达形式来扩充信息检索的查询语句例证研究——对于一种基于语义的搜索方式的若干设想 [J].
袁毓林 .
语言文字应用, 2008, (02) :123-131
[3]   一种基于上下文的中文信息检索查询扩展 [J].
贺宏朝 ;
何丕廉 ;
高剑峰 ;
黄昌宁 .
中文信息学报, 2002, (06) :32-37+45
[4]   Automatic discovery of part-whole relations [J].
Girju, Roxana ;
Badulescu, Adriana ;
Moldovan, Dan .
COMPUTATIONAL LINGUISTICS, 2006, 32 (01) :83-135