基于表示学习的跨模态检索模型与特征抽取研究综述

被引:18
作者
李志义
黄子风
许晓绵
机构
[1] 华南师范大学经济与管理学院
关键词
表示学习; 跨模态检索; 特征抽取; 模型; 综述;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习]; TP391.3 [检索机];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
引用
收藏
页码:422 / 435
页数:14
相关论文
共 35 条
[1]   非负局部Laplacian稀疏编码和上下文信息的图像分类 [J].
万源 ;
史莹 ;
陈晓丽 .
中国图象图形学报, 2017, 22 (06) :731-740
[2]   基于条件随机场模型的“评价特征-评价词”对抽取研究 [J].
李志义 ;
王冕 ;
赵鹏武 .
情报学报, 2017, (04) :411-421
[3]   一种融合AutoEncoder与CNN的混合算法用于图像特征提取 [J].
刘兴旺 ;
王江晴 ;
徐科 .
计算机应用研究, 2017, 34 (12) :3839-3842+3847
[4]   基于表示学习的中文分词 [J].
刘春丽 ;
李晓戈 ;
刘睿 ;
范贤 ;
杜丽萍 .
计算机应用, 2016, 36 (10) :2794-2798
[5]   DNPS:基于阻尼采样的大规模动态社会网络结构特征表示学习 [J].
李志宇 ;
梁循 ;
徐志明 ;
齐金山 ;
陈燕方 .
计算机学报, 2017, 40 (04) :805-823
[6]   卷积神经网络研究综述 [J].
李彦冬 ;
郝宗波 ;
雷航 .
计算机应用, 2016, 36 (09) :2508-2515+2565
[7]   基于潜在语义的双层图像-文本多模态检索语义网络 [J].
董永亮 ;
柴旭清 .
计算机工程, 2016, 42 (07) :299-303+309
[8]   一种基于前向无监督卷积神经网络的人脸表示学习方法 [J].
朱陶 ;
任海军 ;
洪卫军 .
计算机科学, 2016, 43 (06) :303-307
[9]   CNN深度学习模型用于表情特征提取方法探究 [J].
张昭旭 .
现代计算机(专业版), 2016, (03) :41-44
[10]   基于相关性的跨模态信息检索研究 [J].
丁恒 ;
陆伟 .
现代图书情报技术, 2016, (01) :17-23