一种高稳定性词汇共现模型

被引:2
作者
乔亚男
齐勇
侯迪
机构
[1] 西安交通大学计算机科学与技术系
基金
高等学校博士学科点专项科研基金;
关键词
项场; 词汇共现; 窗口内稳定性; 数据集稳定性;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型.借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围.在此基础上,引入量子场论将项与项的相关度类比为项场的叠加,由此给出了项与项之间距离和相关度的函数关系,并用其建立了词汇共现模型.实验结果证明,在小距离的情况下,所提模型中项的相关度大体呈常数,具有一定的窗口内稳定性,而同范畴的项对相关度振幅只有对照模型中最小振幅的26%,表明它具有较好的数据集稳定性.
引用
收藏
页码:24 / 27
页数:4
相关论文
共 2 条
[1]   基于词汇吸引与排斥模型的共现词提取 [J].
郭锋 ;
李绍滋 ;
周昌乐 ;
林颖 ;
李胜睿 .
中文信息学报, 2004, (06) :16-22
[2]   自然语言处理中词语上下文有效范围的定量描述 [J].
鲁松 ;
白硕 .
计算机学报, 2001, (07) :742-747