信息抽取研究综述

被引:163
|
作者
李保利
陈玉忠
俞士汶
机构
[1] 北京大学计算机科学与技术系计算语言学研究所
关键词
自然语言处理; 信息抽取; 信息检索; 命名实体识别;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。
引用
收藏
页码:1 / 5+66 +66
页数:6
相关论文
共 1 条
  • [1] Informationextraction犤J犦 .2 CowieJ,LehnertW. CommunicationsoftheACM . 1996