基于元搜索引擎的个性化Web信息采集

被引:12
作者
王忠 [1 ]
程磊 [2 ]
机构
[1] 武汉工程大学计算机科学与工程学院
[2] 支付宝(中国)网络技术有限公司
关键词
元搜索引擎; 个性化; Web信息采集; 兴趣向量; 体系结构;
D O I
10.16208/j.issn1000-7024.2009.13.050
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
为了减少传统Web采集系统网络资源的耗费,并增强其个性化支持,结合用户兴趣向量模型,将元搜索引擎技术应用到Web信息采集领域中,设计一个基于元搜索引擎的个性化Web信息采集系统。该系统通过调用成员搜索引擎发现与用户兴趣相关的目标Web站点,通过爬虫程序采集目标站点上的Web页面内容。在发现兴趣站点方面更具有针对性,能有效减少爬虫的数量。重点研究了系统的体系结构、个性化Web采集的工作流程,最后给出了该系统的应用场合。
引用
收藏
页码:3117 / 3119
页数:3
相关论文
共 5 条
[1]  
个性化元搜索引擎的关键技术的研究与设计.[D].王红霞.中北大学.2007, 05
[2]   基于词汇相关度模型的个性化元搜索引擎 [J].
陈枭 ;
刘天华 ;
朱宏峰 ;
刘骏 .
计算机工程与设计, 2007, (19) :4758-4761
[3]   一个个性化的Web信息采集模型 [J].
吴丽辉 ;
王斌 ;
张刚 .
计算机工程, 2005, (22) :96-98
[4]   一个基于Web资源采样特征的元搜索引擎 [J].
胡金化 ;
曾海泉 ;
张川 ;
胡运发 .
模式识别与人工智能, 2003, 16 (01) :39-45
[5]   元搜索引擎及其主要技术 [J].
李广建 ;
黄崑 ;
不详 .
情报科学 , 2002, (02) :175-179