基于上下文的短信文本分类方法

被引:14
作者
刘金岭
严云洋
机构
[1] 淮阴工学院计算机工程学院
关键词
短信文本; 词语共现; 上下文; 词语相似度; 短信文本分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对海量短信文本数据中大量词语共现的特点,提出一种基于上下文的短信文本分类方法。利用词语的上下文关系,定义词语相似度和基于上下文的词语权值,科学地表达词语在该类别中的语义表示,以提高短信文本分类效率。实验结果表明,与传统的简单向量距离分类法相比,该方法的分类效果较优。
引用
收藏
页码:41 / 43
页数:3
相关论文
共 5 条
[1]   基于降维的短信文本语义分类及主题提取 [J].
刘金岭 .
计算机工程与应用, 2010, 46 (23) :159-161+174
[2]   基于主题的中文短信文本分类研究 [J].
刘金岭 .
计算机工程, 2010, 36 (04) :30-32
[3]   基于上下文的查询扩展 [J].
李卫疆 ;
赵铁军 ;
王宪刚 .
计算机研究与发展, 2010, (02) :300-304
[4]   基于语义的高质量中文短信文本聚类算法 [J].
刘金岭 .
计算机工程, 2009, 35 (10) :201-202+205
[5]   利用上下文提高文本聚类的效果 [J].
丘志宏 ;
宫雷光 .
中文信息学报, 2007, (06) :109-115