基于语言特性的中文领域术语抽取算法

被引:11
作者
傅继彬 [1 ,2 ]
樊孝忠 [2 ]
毛金涛 [2 ]
余正涛 [3 ]
机构
[1] 河南财经学院计算机与信息工程学院
[2] 北京理工大学计算机学院
[3] 昆明理工大学信息工程与自动化学院
基金
高等学校博士学科点专项科研基金;
关键词
术语抽取; 领域耦合性; 领域相关性; 领域一致性;
D O I
10.15918/j.tbit1001-0645.2010.03.020
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高.
引用
收藏
页码:307 / 310
页数:4
相关论文
共 2 条
[1]   领域术语自动抽取及其在文本分类中的应用 [J].
刘桃 ;
刘秉权 ;
徐志明 ;
王晓龙 .
电子学报, 2007, (02) :328-332
[2]  
基于规则与统计的本体概念自动获取方法研究[J]. 张新,党延忠.情报学报. 2007 (06)