首页
学术期刊
论文检测
AIGC检测
热点
更多
数据
基于互信息的中文术语抽取系统
被引:34
作者
:
张锋
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系,北京理工大学计算机科学与工程系,广东工业大学计算中心,北京理工大学计算机科学与工程系北京,北京,广东广州,北京
张锋
许云
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系,北京理工大学计算机科学与工程系,广东工业大学计算中心,北京理工大学计算机科学与工程系北京,北京,广东广州,北京
许云
侯艳
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系,北京理工大学计算机科学与工程系,广东工业大学计算中心,北京理工大学计算机科学与工程系北京,北京,广东广州,北京
侯艳
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系,北京理工大学计算机科学与工程系,广东工业大学计算中心,北京理工大学计算机科学与工程系北京,北京,广东广州,北京
樊孝忠
机构
:
[1]
北京理工大学计算机科学与工程系,北京理工大学计算机科学与工程系,广东工业大学计算中心,北京理工大学计算机科学与工程系北京,北京,广东广州,北京
来源
:
计算机应用研究
|
2005年
/ 05期
关键词
:
术语抽取;
互信息;
语料;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
介绍了一个中文术语自动抽取系统,该系统首先基于互信息计算字串的内部结合强度,从而得到术语候选集;接着从术语候选集中去除基本词,并利用普通词语搭配前缀、后缀信息进一步过滤;最后对术语候选进行词法分析,利用术语的词性构成规则进行判别,得到最终的术语抽取结果。实验结果表明,术语抽取正确率为72. 19%,召回率为77. 98%,F 测量为74. 97%。
引用
收藏
页码:72 / 73+77 +77
页数:3
相关论文
共 2 条
[1]
基于转换的汉语基本名词短语识别模型
[J].
赵军
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家实验室,清华大学计算机科学与技术系
赵军
;
论文数:
引用数:
h-index:
机构:
黄昌宁
.
中文信息学报,
1999,
(02)
:2
-8+40
[2]
计算语言学概论.[M].俞士汶主编;.商务印书馆.2003,
←
1
→
共 2 条
[1]
基于转换的汉语基本名词短语识别模型
[J].
赵军
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家实验室,清华大学计算机科学与技术系
赵军
;
论文数:
引用数:
h-index:
机构:
黄昌宁
.
中文信息学报,
1999,
(02)
:2
-8+40
[2]
计算语言学概论.[M].俞士汶主编;.商务印书馆.2003,
←
1
→