基于模糊聚类的文本挖掘算法

被引:20
作者
刘志勇 [1 ,2 ]
耿新青 [2 ]
机构
[1] 大连理工大学管理学院
[2] 鞍山师范学院数学系
关键词
聚类数; 文本聚类; 模糊聚类;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
针对传统FCM算法对孤立点比较敏感,须预先指定聚类数目的缺陷,提出一种新的模糊聚类算法NSFCM,将其应用于文本挖掘中。NSFCM对数据对象的隶属度增加一个权值,以减少孤立点对聚类中心的影响。采用平均信息熵确定聚类数,通过密度函数获得初始聚类中心。仿真结果证明,该算法聚类的精度和执行效率均高于FCM算法,效果较好。
引用
收藏
页码:44 / 45+49 +49
页数:3
相关论文
共 6 条
[1]  
基于改进FCM算法的无字典中文文本聚类方法研究.[D].郑晓亮.浙江大学.2007, 02
[2]   一种改进的模糊C均值聚类算法 [J].
宋清昆 ;
郝敏 .
哈尔滨理工大学学报, 2007, (04) :8-10
[3]   基于PAT-array和模糊聚类的文本聚类方法 [J].
林建敏 ;
谢康林 .
计算机工程, 2004, (12) :126-127+177
[4]   模糊聚类算法在汉语文本聚类中的应用 [J].
李家福 ;
陆建江 ;
张亚非 .
计算机工程, 2002, (04) :15-16+33
[5]   Improving fuzzy c-means clustering based on feature-weight learning [J].
Wang, XZ ;
Wang, YD ;
Wang, LJ .
PATTERN RECOGNITION LETTERS, 2004, 25 (10) :1123-1132
[6]   A fuzzy hybrid hierarchical clustering method with a new criterion able to find the optimal partition [J].
Devillez, A ;
Billaudel, P ;
Lecolier, GV .
FUZZY SETS AND SYSTEMS, 2002, 128 (03) :323-338