用规则抽取句子中事件信息

被引:10
作者
孙荣 [1 ,2 ]
周文 [1 ]
刘宗田 [1 ]
机构
[1] 上海大学计算机工程与科学学院
[2] 扬州市房地产信息中心
关键词
规则; 本体; 句子; 信息抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
信息抽取是数据挖掘的重要课题.目前的研究主要通过机器学习的方法对信息进行抽取.但是机器学习对训练数据的质量要求高,学习过程中参数设置复杂.而利用事先构建好的规则可以简单有效的从文本中提取事件信息.提出一种基于抽取规则对句子中的事件信息进行抽取的方法,摆脱了繁杂的机器学习过程.该方法利用本体对动词与事件角色匹配规则、事件角色抽取规则、时间信息抽取规则和地点信息抽取规则进行定义,用OWL对这些抽取规则进行了描述,然后应用这些规则抽取句子中的动词词义信息、事件角色信息、时间信息和地点信息,并用本文提出的一种新评测指标对事件信息进行评测.实验表明该方法从句子中抽取事件信息是有效的.
引用
收藏
页码:2309 / 2314
页数:6
相关论文
共 11 条
[1]   基于依存分析的事件识别 [J].
付剑锋 ;
刘宗田 ;
付雪峰 ;
周文 ;
仲兆满 .
计算机科学, 2009, 36 (11) :217-219
[2]   面向事件的本体研究 [J].
刘宗田 ;
黄美丽 ;
周文 ;
仲兆满 ;
付剑锋 ;
单建芳 ;
智慧来 .
计算机科学, 2009, 36 (11) :189-192+199
[3]   基于自动问答系统的信息检索技术研究进展 [J].
汤庸 ;
林鹭贤 ;
罗烨敏 ;
潘炎 .
计算机应用, 2008, (11) :2745-2748
[4]   中文文本时间信息获取及语义计算 [J].
徐永东 ;
徐志明 ;
王晓龙 ;
刘远超 .
哈尔滨工业大学学报, 2007, (03) :438-442
[5]   基于事件框架的信息抽取系统 [J].
梁晗 ;
陈群秀 ;
吴平博 .
中文信息学报, 2006, (02) :40-46
[6]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报, 2006, (02) :87-94
[7]   基于时空分析的线索性事件的抽取与集成系统研究 [J].
吴平博 ;
陈群秀 ;
马亮 .
中文信息学报, 2006, (01) :21-28
[9]   一种事件信息抽取模式获取方法 [J].
姜吉发 .
计算机工程, 2005, (15) :96-98
[10]   基于Ontology的信息检索技术研究 [J].
陈康 ;
武港山 .
中文信息学报, 2005, (02) :51-57