WWW上的信息挖掘技术及实现

被引:111
作者
邹涛
王继成
朱华宇
金翔宇
张福炎
机构
[1] 南京大学计算机科学与技术系
[2] 南京大学计算机软件新技术国家重点实验室
关键词
信息挖掘,数据挖掘,VSM,WWW;
D O I
暂无
中图分类号
TP393 [计算机网络];
学科分类号
081201 ; 1201 ;
摘要
随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源.但因Internet所固有的开放性、动态性与异构性,又使得用户很难准确快捷地从WWW上获取所需信息.文中将数据挖掘的思想引入WWW信息处理领域来解决网上信息有效获取的问题,讨论了在WWW上进行信息挖掘所采用的算法和策略,最后简要介绍了一个采用向量空间模型和改进Robot技术的网络信息挖掘系统的设计与实现.经实验表明,系统能够较好地解决WWW上的信息自动获取问题.
引用
收藏
页码:124 / 129
页数:6
相关论文
共 2 条
[1]   WWW上的信息发现与搜索引擎技术 [J].
张晓辉 ;
邵华 ;
常桂然 .
小型微型计算机系统, 1998, (06) :67-72
[2]   数据采掘技术回顾 [J].
李水平 ;
陈意云 ;
黄刘生 .
小型微型计算机系统, 1998, (04) :74-81