矩阵的奇异值分解在文本分类研究中的应用

被引:14
作者
刘贵龙
王慧玲
宋柔
机构
[1] 北京语言文化大学计算机科学与技术系,北京语言文化大学计算机科学与技术系,北京语言文化大学计算机科学与技术系北京,北京,北京
关键词
奇异值分解; 文本分类; 训练语料; 矢量;
D O I
暂无
中图分类号
TP182 [专家系统、知识工程];
学科分类号
1111 ;
摘要
用向量空间的方法对文本进行分类是指通过对训练语料的学习,对每个类建立反映该类特征的向量,然后对每一个新的文本,提取其反映该文本特征的向量以确定其类别的过程。文章利用矩阵的奇异值分解理论,把被测文本的向量与所建立的标准向量(降维后)逐一比较,自动确定该文本的分类,经过开放式试验,获得了较好的效果。
引用
收藏
页码:17 / 18+100 +100
页数:3
相关论文
共 1 条
[1]  
汉语文本按语体分类的研究.[A].王慧玲;宋柔;戴伟长;.全国第六届计算语言学联合学术会议.2001,