基于词向量的藏文词性标注方法研究

被引:10
作者
郑亚楠 [1 ]
珠杰 [1 ,2 ]
机构
[1] 西藏大学计算机科学与技术系
[2] 西南交通大学信息科学与技术学院
关键词
词向量; 藏文; 词性标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
藏文词性标注是藏文信息处理的基础,在藏文文本分类、自动检索、机器翻译等领域有广泛的应用。该文针对藏文语料匮乏,人工标注费时费力等问题,提出一种基于词向量模型的词性标注方法和相应算法,该方法首先利用词向量的语义近似计算功能,扩展标注词典;其次结合语义近似计算和标注词典,完成词性标注。实验结果表明,该方法能够快速有效地扩大了标注词典规模,并能取得较好的标注结果。
引用
收藏
页码:112 / 117
页数:6
相关论文
共 10 条
[1]  
藏语分词与词性标注研究[D]. 康才畯.上海师范大学 2014
[2]   基于HMM的藏语语料库词性自动标注研究 [J].
苏俊峰 ;
祁坤钰 ;
本太 .
西北民族大学学报(自然科学版), 2009, 30 (01) :42-45
[3]   面向信息处理的藏文分词规范研究 [J].
扎西加 ;
珠杰 .
中文信息学报, 2009, (04) :113-117+123
[4]   基于HMM藏文词性标注的研究与实现 [J].
扎西多杰 ;
安见才让 .
计算机光盘软件与应用, 2012, (12) :100-101
[5]   融合音节特征的最大熵藏文词性标注研究 [J].
于洪志 ;
李亚超 ;
汪昆 ;
冷本扎西 .
中文信息学报, 2013, 27 (05) :160-165
[6]   判别式藏语文本词性标注研究 [J].
华却才让 ;
刘群 ;
赵海兴 .
中文信息学报, 2014, 28 (02) :56-60
[7]   藏文词级处理研究现状及热点方法 [J].
洛桑嘎登 ;
赵小兵 .
电脑知识与技术, 2015, 11 (32) :183-185
[8]  
Linguistic Regularities in Continuous Space Word Representations. Mikolov T,Yih W,Zweig G. NAACL-HLT- 2013 . 2013
[9]  
Text-annotation Oriented Tibetan-Chinese Dictionary and Its Construction. Jiang D. The4th China-Japan Joint Conference to Promote Cooperation in Natural Language Processing. (CJNLP-04) . 2004
[10]  
藏语语料库中词性分类代码的确定[A]. 才让加,吉太加.中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C]. 2006