基于Web弱指导的本体概念实例及属性的同步提取

被引:4
作者
康为 [1 ,2 ]
穗志方 [1 ,2 ]
机构
[1] 北京大学计算语言学研究所
[2] 北京大学计算语言学教育部重点实验室
关键词
计算机应用; 中文信息处理; Web; 概念实例提取; 属性提取; 弱指导; 上下文模式;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实例和属性后,该文提出两种方法来评价提取的候选实例和属性。第一,利用概念实例和属性的关联性来互相评价对方的准确度;第二,利用候选实例或候选属性与种子实例或属性在上下文模式分布上的相似度来评价准确度。在疾病类实验结果表明,人工确认候选实例的准确率在前500个结果达到94%,前1 000个结果的准确率也高达93%。
引用
收藏
页码:54 / 59
页数:6
相关论文
共 1 条
[1]  
KnowItNow:Fast,Scalable Information Extraction from the Web. M.J.Cafarella,D.Downey,S.Soderland,O.Etzioni. Proceedings of HLT/EMNLP . 2005