开放式文本信息抽取

被引:62
作者
赵军
刘康
周光有
蔡黎
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
关键词
开放式信息抽取; 知识工程; 文本理解;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
信息抽取研究已经从传统的限定类别、限定领域信息抽取任务发展到开放类别、开放领域信息抽取。技术手段也从基于人工标注语料库的统计方法发展为有效地挖掘和集成多源异构网络知识并与统计方法结合进行开放式信息抽取。该文在回顾文本信息抽取研究历史的基础上,重点介绍开放式实体抽取、实体消歧和关系抽取的任务、难点、方法、评测、技术水平和存在问题,并结合课题组的研究积累,对文本信息抽取的发展方向以及在网络知识工程、问答系统中的应用进行分析讨论。
引用
收藏
页码:98 / 110
页数:13
相关论文
共 10 条
[1]   命名实体识别、排歧和跨语言关联 [J].
赵军 .
中文信息学报, 2009, 23 (02) :3-17
[2]  
一种开放式中文命名实体识别的新方法[A]. 齐振宇,赵军,杨帆.第五届全国信息检索学术会议论文集[C]. 2009
[3]   A network analysis model for disambiguation of names in lists [J].
Malin B. ;
Airoldi E. ;
Carley K.M. .
Computational & Mathematical Organization Theory, 2005, 11 (2) :119-139
[4]  
文本倾向性分析技术研究 .2 刘康. 中国科学院自动化研究所 . 2010
[5]  
Towards Robust Unsu-pervised Personal Name Disambiguation .2 Ying Chen,James Martin. Pro-ceedings of EMNLP . 2007
[6]  
HelpingEditors Choose Better Seed Sets for Entity Set Ex-pansion .2 Vishnu Vyas,Patrick Pantel,Eric Crestan. Proceedings of CIKM . 2009
[7]  
DAMSEL:TheDSTO/Macquarie System for Entity-Linking .2 Matthew Honnibal,Robert Dale. Proceeding of TAC . 2009
[8]  
Event Extraction as Dependency Parsing .2 D.McClosky,M.Surdeanu,C.D.Manning. Proceedings of ACL-HLT . 2011
[9]  
Open Infor-mation Extraction from the Web .2 Michele Banko,Michael J Cafarella,Stephen Soder-land,Matt Broadhead,Oren Etzioni. Proceedings ofIJCAI . 2007
[10]  
SENSEVAL:The Evaluation ofWord Sense Disambiguation Systems .2 Philip Edmonds. ELRA Ne-wsletter . 2002