基于元性质的数量型属性值自动提取系统的实现

被引:5
作者
卢汉 [1 ,2 ]
曹存根 [2 ]
王石 [1 ,2 ]
机构
[1] 中国科学院研究生院
[2] 中国科学院计算技术研究所智能信息处理重点实验室
关键词
属性值抽取; 数量型属性; 属性元性质; 锚文本; 层次分析;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
实体属性值抽取是信息抽取的重要组成部分.针对数量型属性类型多样以及取值易变的问题,设计实现了一种基于元性质的数量型属性值自动抽取系统.对系统的结构、功能框架以及相关核心技术,包括提取文本的选择、候选值的提取及评估、结果的自动验证等进行了详细讨论.通过对百度百科的五大类9个子类实体数量型属性值的抽取,平均准确率和召回率分别达到71%和89%,高于基于简单搜索的方法和传统的基于词汇-句模的方法.该方法适用于开放领域的数量型属性值获取,易于获取单值属性的精确取值.
引用
收藏
页码:1741 / 1748
页数:8
相关论文
共 3 条
[1]   一种基于WWW的Ontology属性值自动提取方法 [J].
赵庆亮 ;
穗志方 .
中文信息学报, 2008, (06) :69-74
[2]  
Decision making with the analytic hierarchy process[J] . Thomas L. Saaty.Int. J. of Services Sciences . 2008 (1)
[3]  
Computation of semantic equivalence for question answering. Takahashi T. Nara Institute of Science and Technology . 2005