基于语言特性的中文领域术语抽取算法

被引：11

作者：

傅继彬 ^{[1
,2
]}

樊孝忠 ^{[2
]}

毛金涛 ^{[2
]}

余正涛 ^{[3
]}

机构：

[1] 河南财经学院计算机与信息工程学院

[2] 北京理工大学计算机学院

[3] 昆明理工大学信息工程与自动化学院

来源：

北京理工大学学报 | 2010年 / 30卷 / 03期

基金：

高等学校博士学科点专项科研基金;

关键词：

术语抽取; 领域耦合性; 领域相关性; 领域一致性;

D O I：

10.15918/j.tbit1001-0645.2010.03.020

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高.

引用

页码：307 / 310

页数：4