基于统计方法的Web新词分词方法研究

被引：2

作者：

张敏

王春红

机构：

[1] 运城学院计算机科学与技术系

来源：

计算机工程与科学 | 2010年 / 32卷 / 05期

关键词：

Web; 统计分词; 词典; 特征提取;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

本文对信息处理技术中各种分词方法进行了研究,针对目前分词方法无法识别网络中不断出现的新词,设计了一种新的基于统计的分词方法。该方法避开现有的分词方法中的复杂语法规则,无需词典的支持,很好地解决了新词不断出现的问题,而且分词速度快,具有重要的理论和实用价值。

引用

收藏

页码：133 / 135

页数：3

相关论文

共 3 条

[1] BBS中文新词语自动挖掘 [J].

吕学强 ;

黄河 ;

李渝勤 ;

施水才 .

现代图书情报技术, 2007, (01) :37-39

[2] 字典与统计相结合的中文分词方法 [J].

翟凤文 ;

赫枫龄 ;

左万利 .

小型微型计算机系统, 2006, (09) :1766-1771

[3] 基于大规模语料库的新词检测 [J].

崔世起 ;

刘群 ;

孟遥 ;

于浩 ;

西野文人 .

计算机研究与发展 , 2006, (05) :927-932