基于聚类的文本过滤模型

被引：8

作者：

林鸿飞

马雅彬

机构：

[1] 大连理工大学计算机系

[2] 内蒙古民族大学外语系辽宁大连

[3] 内蒙古通辽

来源：

大连理工大学学报 | 2002年 / 02期

关键词：

语言处理; 聚类分析/文本过滤; 用户模板; 查询扩张;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

为了帮助用户在因特网上搜索感兴趣的在线文本 ,提出了基于聚类的文本过滤模型 .其基本思想是 :在预定的层次目录之下 ,根据用户给出的过滤模板进行动态扩张 ,以便于全面地反映用户信息需求 .然后 ,通过对扩张模板的聚类分析 ,使得每一类由表达相同或相近兴趣的用户模板组成 .匹配时 ,先将文本推送到相应的模板类中 ,再计算与具体模板的相似度 ,获得最终的匹配结果 ,以提高过滤效率

引用

页码：249 / 252

页数：4