面向科技文献的混合语义信息抽取方法研究

被引:26
作者
冷伏海 [1 ]
白如江 [1 ,2 ]
祝清松 [1 ]
机构
[1] 中国科学院国家科学图书馆
[2] 山东理工大学图书馆
关键词
科技文献; 信息抽取; 语义标注; 正则表达;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
引用
收藏
页码:112 / 119
页数:8
相关论文
共 16 条
[1]   中文自由短文本信息抽取方法的研究 [J].
朱玲玲 ;
杨爱琴 ;
魏晓宁 .
电脑知识与技术, 2012, 8 (15) :3691-3692
[2]   信息过滤中基于统计与规则的关键词抽取研究 [J].
黄先珍 ;
杨玉珍 ;
刘培玉 .
计算机工程, 2012, 38 (02) :57-59
[3]   正则表达式在Web信息抽取中的应用 [J].
胡军伟 ;
秦奕青 ;
张伟 .
北京信息科技大学学报(自然科学版), 2011, 26 (06) :86-89
[4]   开放式文本信息抽取 [J].
赵军 ;
刘康 ;
周光有 ;
蔡黎 .
中文信息学报, 2011, 25 (06) :98-110
[5]   用规则抽取句子中事件信息 [J].
孙荣 ;
周文 ;
刘宗田 .
小型微型计算机系统, 2011, 32 (11) :2309-2314
[6]   短文本信息流的无监督会话抽取技术 [J].
黄九鸣 ;
吴泉源 ;
刘春阳 ;
张旭 ;
贾焰 ;
周斌 .
软件学报, 2012, 23 (04) :735-747
[7]   应用主题词/副主题词关联规则对专题知识的挖掘分析及评价 [J].
侯跃芳 ;
崔雷 ;
朱利娜 .
情报理论与实践, 2008, (02) :234-236
[8]   基于主题词对的文档重排方法 [J].
何婷婷 ;
许婷 ;
瞿国忠 ;
涂新辉 .
计算机工程与应用 , 2007, (11) :161-163
[9]   中文文本的关键词自动抽取和模糊分类 [J].
何新贵 ;
彭甫阳 .
中文信息学报, 1999, (01) :10-16
[10]  
信息抽取技术在情报监测中的应用[J]. 刘剑兰,朱东华.情报学报. 2004 (06)