基于统计方法的Web新词分词方法研究

被引:2
作者
张敏
王春红
机构
[1] 运城学院计算机科学与技术系
关键词
Web; 统计分词; 词典; 特征提取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文对信息处理技术中各种分词方法进行了研究,针对目前分词方法无法识别网络中不断出现的新词,设计了一种新的基于统计的分词方法。该方法避开现有的分词方法中的复杂语法规则,无需词典的支持,很好地解决了新词不断出现的问题,而且分词速度快,具有重要的理论和实用价值。
引用
收藏
页码:133 / 135
页数:3
相关论文
共 3 条
[1]   BBS中文新词语自动挖掘 [J].
吕学强 ;
黄河 ;
李渝勤 ;
施水才 .
现代图书情报技术, 2007, (01) :37-39
[2]   字典与统计相结合的中文分词方法 [J].
翟凤文 ;
赫枫龄 ;
左万利 .
小型微型计算机系统, 2006, (09) :1766-1771
[3]   基于大规模语料库的新词检测 [J].
崔世起 ;
刘群 ;
孟遥 ;
于浩 ;
西野文人 .
计算机研究与发展 , 2006, (05) :927-932