共 1 条
基于Spark的海量图像检索系统设计
被引:4
作者:
王迅
冯瑞
机构:
[1] 复旦大学计算机科学技术学院,上海市视频技术与系统工程研究中心
来源:
关键词:
图像检索;
海量数据;
Spark;
HDFS;
D O I:
暂无
中图分类号:
TP391.41 [];
学科分类号:
080203 ;
摘要:
随着互联网,多媒体技术快速发展,互联网上的图像数量飞速增长,如何快速、有效地在海量的图像数据中找到用户需要的图像成为研究的热点。传统的图像检索系统基于单节点的架构,在处理海量图像数据时存在速度慢、并行性差、内存不足等问题。提出了一种基于Spark的海量图像检索方法,将图像检索技术与Spark计算框架相结合。图像集分布式地存储在HDFS中,能够进行分布式地特征提取、模型训练、在线检索。与单节点检索系统相比,该方法在处理大数据图像检索时,具有速度快,可扩展性强等优点,能够处理单机无法处理的海量图像数据。在holiday数据集上的实验结果表明,该方法有效地提高了算法的运行速度。
引用
收藏
页码:11 / 13+17+2
+17
页数:5
相关论文

