基于直推式学习的半监督属性抽取

被引:6
作者
苏丰龙 [1 ]
谢庆华 [2 ]
黄清泉 [1 ]
邱继远 [1 ]
岳振军 [1 ]
机构
[1] 解放军理工大学通信工程学院
[2] 解放军理工大学国防工程学院
关键词
信息抽取; 半监督学习; 直推式支持向量机; 属性抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对在文本信息抽取研究中传统的监督学习方法存在标注工作量大和时间代价高等缺点,提出一种改进的半监督学习模型。该模型利用支持向量机的分类优势以及直推式学习在未标注样本上的泛化特点,先用少量标注语料进行学习,同时测试新语料,然后再加入到模型当中一起训练,调整预测规律。在领域实体属性抽取试验中,与传统的支持向量机学习方法相比,该模型能够在小语料条件下取得较好的抽取效果,泛化学习能力较强,可以节省大量的人力成本。
引用
收藏
页码:111 / 115
页数:5
相关论文
共 13 条
[1]  
The Nature of Statistical Learning Theory. Vapnik V N. . 1999
[2]  
A novel classification technique based on progressive transductive SVM learning[J] . Anshu Singla,Swarnajyoti Patra,Lorenzo Bruzzone. &nbspPattern Recognition Letters . 2014
[3]   中文实体关系抽取中的特征选择研究 [J].
董静 ;
孙乐 ;
冯元勇 ;
黄瑞红 .
中文信息学报, 2007, (04) :80-85+91
[4]   未定义类型的关系抽取的半监督学习框架研究 [J].
程显毅 ;
朱倩 .
南京大学学报(自然科学版), 2012, 48 (04) :466-474
[5]   领域本体概念实例、属性和属性值的抽取及关系预测 [J].
郭剑毅 ;
李真 ;
余正涛 ;
张志坤 .
南京大学学报(自然科学版), 2012, 48 (04) :383-389
[6]   基于弱监督的属性关系抽取方法 [J].
杨宇飞 ;
戴齐 ;
贾真 ;
尹红风 .
计算机应用, 2014, 34 (01) :64-68
[7]   基于弱监督学习的中文百科数据属性抽取 [J].
贾真 ;
杨燕 ;
何大可 .
电子科技大学学报 , 2014, (05) :758-763
[8]   基于弱监督学习的中文百科数据属性抽取 [J].
贾真 ;
杨燕 ;
何大可 .
电子科技大学学报 , 2014, (05) :758-763
[9]   网络文本蕴涵地理信息抽取:研究进展与展望 [J].
余丽 ;
陆锋 ;
张恒才 .
地球信息科学学报, 2015, 17 (02) :127-134
[10]   基于弱监督学习的主页人物属性抽取方法 [J].
张巧 ;
熊锦华 ;
程学旗 .
山西大学学报(自然科学版), 2015, 38 (01) :8-15