一种基于粗糙集角分类神经网络的文档分类方法(英文)

被引:3
作者
张卫丰 [1 ]
徐宝文 [2 ]
崔自峰 [2 ]
徐峻岭 [2 ]
机构
[1] 南京邮电大学计算机学院
[2] 东南大学计算机科学与工程学院
关键词
文档分类; 神经网络; 粗糙集; 元搜索引擎;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对文档分类过程中不同大小文档表示、文档特征选择和文档特征编码问题,提出了一种基于粗糙集的角分类神经网络Rough-CC4.利用近义词构成等价类,以此表示文档,可以缩小文档表示的维数、解决由于文档不同大小导致的精度问题、模糊近义词之间的差别;利用二进制编码方法对文档特征编码,可以提高Rough-CC4的精度,同时减小Rough-CC4的空间复杂度.Rough-CC4可以广泛用于大量文档集合的自动分类.
引用
收藏
页码:439 / 444
页数:6
相关论文
共 4 条
[1]   基于扩展角分类神经网络的文档分类方法(英文) [J].
陈恩红 ;
张振亚 ;
合源一幸 ;
王煦法 .
软件学报, 2002, (05) :871-878
[2]   基于关联规则的Web文档聚类算法 [J].
宋擒豹 ;
沈钧毅 .
软件学报, 2002, (03) :417-423
[3]  
A neural network-based intelligent metasearch engine[J] . Bo Shu,Subhash Kak.Information Sciences . 1999 (1)
[4]   ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356