实体关系自动抽取

被引:116
作者
车万翔
刘挺
李生
机构
[1] 哈尔滨工业大学计算机学院
[2] 哈尔滨工业大学计算机学院 黑龙江哈尔滨
[3] 黑龙江哈尔滨
关键词
计算机应用; 中文信息处理; 实体关系抽取; ACE评测; 特征选择;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
实体关系抽取是信息抽取领域中的重要研究课题。本文使用两种基于特征向量的机器学习算法 ,Winnow和支持向量机 (SVM) ,在 2 0 0 4年ACE(AutomaticContentExtraction)评测的训练数据上进行实体关系抽取实验。两种算法都进行适当的特征选择 ,当选择每个实体的左右两个词为特征时 ,达到最好的抽取效果 ,Win now和SVM算法的加权平均F Score分别为 73 0 8%和 73 2 7%。可见在使用相同的特征集 ,不同的学习算法进行实体关系的识别时 ,最终性能差别不大。因此使用自动的方法进行实体关系抽取时 ,应当集中精力寻找好的特征。
引用
收藏
页码:1 / 6
页数:6
相关论文
共 1 条
[1]   Learning Information Extraction Rules for Semi-Structured and Free Text [J].
Stephen Soderland .
Machine Learning, 1999, 34 :233-272