基于Spark的海量图像检索系统设计

被引:4
作者
王迅
冯瑞
机构
[1] 复旦大学计算机科学技术学院,上海市视频技术与系统工程研究中心
关键词
图像检索; 海量数据; Spark; HDFS;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
随着互联网,多媒体技术快速发展,互联网上的图像数量飞速增长,如何快速、有效地在海量的图像数据中找到用户需要的图像成为研究的热点。传统的图像检索系统基于单节点的架构,在处理海量图像数据时存在速度慢、并行性差、内存不足等问题。提出了一种基于Spark的海量图像检索方法,将图像检索技术与Spark计算框架相结合。图像集分布式地存储在HDFS中,能够进行分布式地特征提取、模型训练、在线检索。与单节点检索系统相比,该方法在处理大数据图像检索时,具有速度快,可扩展性强等优点,能够处理单机无法处理的海量图像数据。在holiday数据集上的实验结果表明,该方法有效地提高了算法的运行速度。
引用
收藏
页码:11 / 13+17+2 +17
页数:5
相关论文
共 1 条
[1]   Distinctive image features from scale-invariant keypoints [J].
Lowe, DG .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 60 (02) :91-110