SA-VQA: Structured Alignment of Visual and Semantic Representations for Visual Question Answering

被引：0

作者：

Xiong, Peixi ^{[1
]}

You, Quanzeng ^{[2
]}

Yu, Pei ^{[2
]}

Liu, Zicheng ^{[2
]}

Wu, Ying ^{[1
]}

机构：

[1] Northwestern University, United States

[2] Microsoft Research

来源：

arXiv | 2022年

关键词：

D O I：

暂无

中图分类号：

学科分类号：

摘要：

Deep learning

引用

共 50 条

[1] VQA: Visual Question Answering
Antol, Stanislaw
Agrawal, Aishwarya
Lu, Jiasen
Mitchell, Margaret
Batra, Dhruv
Zitnick, C. Lawrence
Parikh, Devi
2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV), 2015, : 2425 - 2433
[2] VQA: Visual Question Answering
Agrawal, Aishwarya
Lu, Jiasen
Antol, Stanislaw
Mitchell, Margaret
Zitnick, C. Lawrence
Parikh, Devi
Batra, Dhruv
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2017, 123 (01) : 4 - 31
[3] STRUCTURED SEMANTIC REPRESENTATION FOR VISUAL QUESTION ANSWERING
Yu, Dongchen
Gao, Xing
Xiong, Hongkai
2018 25TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2018, : 2286 - 2290
[4] Visual-Textual Semantic Alignment Network for Visual Question Answering
Tian, Weidong
Zhang, Yuzheng
He, Bin
Zhu, Junjun
Zhao, Zhongqiu
ARTIFICIAL NEURAL NETWORKS AND MACHINE LEARNING, ICANN 2021, PT V, 2021, 12895 : 259 - 270
[5] R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering
Lu, Pan
Ji, Lei
Zhang, Wei
Duan, Nan
Zhou, Ming
Wang, Jianyong
KDD'18: PROCEEDINGS OF THE 24TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY & DATA MINING, 2018, : 1880 - 1889
[6] Graph-Structured Representations for Visual Question Answering
Teney, Damien
Liu, Lingqiao
van den Hengel, Anton
30TH IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR 2017), 2017, : 3233 - 3241
[7] ST-VQA: shrinkage transformer with accurate alignment for visual question answering
Xia, Haiying
Lan, Richeng
Li, Haisheng
Song, Shuxiang
APPLIED INTELLIGENCE, 2023, 53 (18) : 20967 - 20978
[8] ST-VQA: shrinkage transformer with accurate alignment for visual question answering
Haiying Xia
Richeng Lan
Haisheng Li
Shuxiang Song
Applied Intelligence, 2023, 53 : 20967 - 20978
[9] VC-VQA: VISUAL CALIBRATION MECHANISM FOR VISUAL QUESTION ANSWERING
Qiao, Yanyuan
Yu, Zheng
Liu, Jing
2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2020, : 1481 - 1485
[10] R-VQA: A robust visual question answering model
Chowdhury, Souvik
Soni, Badal
KNOWLEDGE-BASED SYSTEMS, 2025, 309

← 1 2 3 4 5 →