首页
学术期刊
论文检测
AIGC检测
热点
更多
数据
基于元搜索引擎的个性化Web信息采集
被引:12
作者
:
论文数:
引用数:
h-index:
机构:
王忠
[
1
]
程磊
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(中国)网络技术有限公司
武汉工程大学计算机科学与工程学院
程磊
[
2
]
机构
:
[1]
武汉工程大学计算机科学与工程学院
[2]
支付宝(中国)网络技术有限公司
来源
:
计算机工程与设计
|
2009年
/ 30卷
/ 13期
关键词
:
元搜索引擎;
个性化;
Web信息采集;
兴趣向量;
体系结构;
D O I
:
10.16208/j.issn1000-7024.2009.13.050
中图分类号
:
TP393.09 [];
学科分类号
:
080402 ;
摘要
:
为了减少传统Web采集系统网络资源的耗费,并增强其个性化支持,结合用户兴趣向量模型,将元搜索引擎技术应用到Web信息采集领域中,设计一个基于元搜索引擎的个性化Web信息采集系统。该系统通过调用成员搜索引擎发现与用户兴趣相关的目标Web站点,通过爬虫程序采集目标站点上的Web页面内容。在发现兴趣站点方面更具有针对性,能有效减少爬虫的数量。重点研究了系统的体系结构、个性化Web采集的工作流程,最后给出了该系统的应用场合。
引用
收藏
页码:3117 / 3119
页数:3
相关论文
共 5 条
[1]
个性化元搜索引擎的关键技术的研究与设计.[D].王红霞.中北大学.2007, 05
[2]
基于词汇相关度模型的个性化元搜索引擎
[J].
论文数:
引用数:
h-index:
机构:
陈枭
;
刘天华
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳师范大学科信软件学院
刘天华
;
论文数:
引用数:
h-index:
机构:
朱宏峰
;
刘骏
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳师范大学科信软件学院
刘骏
.
计算机工程与设计,
2007,
(19)
:4758
-4761
[3]
一个个性化的Web信息采集模型
[J].
吴丽辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室北京,中国科学院研究生院,北京,北京,北京,中国科学院研究生院,北京
吴丽辉
;
王斌
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室北京,中国科学院研究生院,北京,北京,北京,中国科学院研究生院,北京
王斌
;
张刚
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室北京,中国科学院研究生院,北京,北京,北京,中国科学院研究生院,北京
张刚
.
计算机工程,
2005,
(22)
:96
-98
[4]
一个基于Web资源采样特征的元搜索引擎
[J].
论文数:
引用数:
h-index:
机构:
胡金化
;
论文数:
引用数:
h-index:
机构:
曾海泉
;
论文数:
引用数:
h-index:
机构:
张川
;
论文数:
引用数:
h-index:
机构:
胡运发
.
模式识别与人工智能,
2003,
16
(01)
:39
-45
[5]
元搜索引擎及其主要技术
[J].
李广建
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学管理学院信息技术与管理学系
李广建
;
黄崑
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学管理学院信息技术与管理学系
黄崑
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学管理学院信息技术与管理学系
不详
.
情报科学 ,
2002,
(02)
:175
-179
←
1
→
共 5 条
[1]
个性化元搜索引擎的关键技术的研究与设计.[D].王红霞.中北大学.2007, 05
[2]
基于词汇相关度模型的个性化元搜索引擎
[J].
论文数:
引用数:
h-index:
机构:
陈枭
;
刘天华
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳师范大学科信软件学院
刘天华
;
论文数:
引用数:
h-index:
机构:
朱宏峰
;
刘骏
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳师范大学科信软件学院
刘骏
.
计算机工程与设计,
2007,
(19)
:4758
-4761
[3]
一个个性化的Web信息采集模型
[J].
吴丽辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室北京,中国科学院研究生院,北京,北京,北京,中国科学院研究生院,北京
吴丽辉
;
王斌
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室北京,中国科学院研究生院,北京,北京,北京,中国科学院研究生院,北京
王斌
;
张刚
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室,中国科学院计算技术研究所软件研究室北京,中国科学院研究生院,北京,北京,北京,中国科学院研究生院,北京
张刚
.
计算机工程,
2005,
(22)
:96
-98
[4]
一个基于Web资源采样特征的元搜索引擎
[J].
论文数:
引用数:
h-index:
机构:
胡金化
;
论文数:
引用数:
h-index:
机构:
曾海泉
;
论文数:
引用数:
h-index:
机构:
张川
;
论文数:
引用数:
h-index:
机构:
胡运发
.
模式识别与人工智能,
2003,
16
(01)
:39
-45
[5]
元搜索引擎及其主要技术
[J].
李广建
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学管理学院信息技术与管理学系
李广建
;
黄崑
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学管理学院信息技术与管理学系
黄崑
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学管理学院信息技术与管理学系
不详
.
情报科学 ,
2002,
(02)
:175
-179
←
1
→