基于多特征的汉语句子相似度计算模型的研究

被引:10
作者
李春梅
徐庆生
机构
[1] 云南楚雄师范学院计算机科学系
关键词
自然语言处理; 区分度; 词性; 词序; 句子相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
句子相似度的计算在自然语言处理的各个领域中都占有很重要的地位。文中深入分析了现有的一些句子相似度计算的方法,这些方法各自从词特征、词义特征或句法特征等某一侧面描述了句子相似的情况,未能全面地描述一个句子的完整信息。文中提出了一种新的基于多特征的汉语句子相似度的计算模型。该方法在基于词的基础上,从句子中词的表层到词的逻辑联系,从句子的局部结构到整体结构,用句子的区分度、相同词的相似度、长度相似度、词性相似度及词序相似度五个方面来综合考虑两个句子相似度的计算。实验结果表明,该方法合理、简便、可行。
引用
收藏
页码:136 / 139+144 +144
页数:5
相关论文
共 11 条
[1]   自动问答系统中的句子相似度算法的研究 [J].
周永梅 ;
陶红 ;
陈姣姣 ;
张再跃 .
计算机技术与发展, 2012, 22 (05) :75-78
[2]   基于词性及词性依存的句子结构相似度计算 [J].
蓝雁玲 ;
陈建超 .
计算机工程, 2011, 37 (10) :47-49
[3]   基于本体结构的概念间语义相似度算法 [J].
李文杰 ;
赵岩 .
计算机工程, 2010, 36 (23) :4-6
[4]   基于改进编辑距离和依存文法的汉语句子相似度计算 [J].
刘宝艳 ;
林鸿飞 ;
赵晶 .
计算机应用与软件, 2008, (07) :33-34+47
[5]   基于网络的中文问答系统的研究 [J].
王宇 ;
战学刚 ;
蔡建山 .
计算机工程与应用 , 2006, (07) :162-165
[6]   词汇与中心词的距离信息对问句相似度匹配的影响 [J].
闫宏飞 ;
陈翀 .
清华大学学报(自然科学版), 2005, (S1) :1873-1877
[7]   一种新的句子相似度度量及其在文本自动摘要中的应用 [J].
张奇 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2005, (02) :93-99
[8]   基于词类串的汉语句子结构相似度计算方法 [J].
王荣波 ;
池哲儒 .
中文信息学报, 2005, (01) :21-29
[9]   基于语义依存的汉语句子相似度计算 [J].
李彬 ;
刘挺 ;
秦兵 ;
李生 .
计算机应用研究, 2003, (12) :15-17
[10]  
基于改进编辑距离的中文相似句子检索[J]. 车万翔,刘挺,秦兵,李生.高技术通讯. 2004 (07)