基于哈希算法的中文分词算法的改进

被引：6

作者：

姚兴山

机构：

[1] 南京大学信息管理系

来源：

图书情报工作 | 2008年 / 06期

关键词：

中文分词; 中文信息处理; 数据结构; 哈希;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

中文分词是中文信息处理一个重要的部分,一些应用不仅要准确率,速度也很重要,通过对已有算法的分析,特别是对快速分词算法的分析,提出一种新的词典结构,并根据新的词典给出新的分词算法,该算法不仅对词首字实现了哈希查找,对词余下的字也实现哈希查找。理论分析和实验结果表明,算法在速度和效率比现有的几种分词算法上有所提高。

引用

页码：60 / 62

页数：3

共 7 条

[1] 一种中文分词词典新机制——双字哈希机制 [J].