基于聚类的文本过滤模型

被引:8
作者
林鸿飞
马雅彬
机构
[1] 大连理工大学计算机系
[2] 内蒙古民族大学外语系 辽宁大连
[3] 内蒙古通辽
关键词
语言处理; 聚类分析/文本过滤; 用户模板; 查询扩张;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了帮助用户在因特网上搜索感兴趣的在线文本 ,提出了基于聚类的文本过滤模型 .其基本思想是 :在预定的层次目录之下 ,根据用户给出的过滤模板进行动态扩张 ,以便于全面地反映用户信息需求 .然后 ,通过对扩张模板的聚类分析 ,使得每一类由表达相同或相近兴趣的用户模板组成 .匹配时 ,先将文本推送到相应的模板类中 ,再计算与具体模板的相似度 ,获得最终的匹配结果 ,以提高过滤效率
引用
收藏
页码:249 / 252
页数:4
相关论文
共 3 条
[1]   中文文本过滤的信息分流机制 [J].
林鸿飞 ;
李业丽 ;
姚天顺 .
计算机研究与发展, 2000, (04) :470-476
[2]   基于概念扩充的中文文本过滤模型 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
计算机科学, 2000, (02) :88-90+82
[3]  
自然语言理解.[M].姚天顺等编著;.清华大学出版社.2002,