SA-VQA: Structured Alignment of Visual and Semantic Representations for Visual Question Answering

被引：0

作者：

Xiong, Peixi ^{[1
]}

You, Quanzeng ^{[2
]}

Yu, Pei ^{[2
]}

Liu, Zicheng ^{[2
]}

Wu, Ying ^{[1
]}

机构：

[1] Northwestern University, United States

[2] Microsoft Research

来源：

arXiv | 2022年

关键词：

D O I：

暂无

中图分类号：

学科分类号：

摘要：

Deep learning

引用

共 50 条

[41] RESCUENET-VQA: A LARGE-SCALE VISUAL QUESTION ANSWERING BENCHMARK FOR DAMAGE ASSESSMENT
Sarkar, Argho
Rahnemoonfar, Maryam
IGARSS 2023 - 2023 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM, 2023, : 1150 - 1153
[42] Cycle-VQA: A Cycle-Consistent Framework for Robust Medical Visual Question Answering
Fan, Lin
Gong, Xun
Zheng, Cenyang
Tan, Xuli
Li, Jiao
Ou, Yafei
PATTERN RECOGNITION, 2025, 165
[43] From image to language: A critical analysis of Visual Question Answering (VQA) approaches, challenges, and opportunities
Ishmam, Md. Farhan
Shovon, Md. Sakib Hossain
Mridha, M. F.
Dey, Nilanjan
INFORMATION FUSION, 2024, 106
[44] Sequential Visual Reasoning for Visual Question Answering
Liu, Jinlai
Wu, Chenfei
Wang, Xiaojie
Dong, Xuan
PROCEEDINGS OF 2018 5TH IEEE INTERNATIONAL CONFERENCE ON CLOUD COMPUTING AND INTELLIGENCE SYSTEMS (CCIS), 2018, : 410 - 415
[45] Visual Question Generation as Dual Task of Visual Question Answering
Li, Yikang
Duan, Nan
Zhou, Bolei
Chu, Xiao
Ouyang, Wanli
Wang, Xiaogang
Zhou, Ming
2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 2018, : 6116 - 6124
[46] Question Modifiers in Visual Question Answering
Britton, William
Sarkhel, Somdeb
Venugopal, Deepak
LREC 2022: THIRTEEN INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, 2022, : 1472 - 1479
[47] LEARNING REPRESENTATIONS FROM EXPLAINABLE AND CONNECTIONIST APPROACHES FOR VISUAL QUESTION ANSWERING
Mishra, Aakansha
Soumitri, Miriyala Srinivas
Rajendiran, Vikram N.
2024 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, ICASSP 2024, 2024, : 6420 - 6424
[48] Bridging the Cross-Modality Semantic Gap in Visual Question Answering
Wang, Boyue
Ma, Yujian
Li, Xiaoyan
Gao, Junbin
Hu, Yongli
Yin, Baocai
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2025, 36 (03) : 4519 - 4531
[49] Indic Visual Question Answering
Chandrasekar, Aditya
Shimpi, Amey
Naik, Dinesh
2022 IEEE INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING AND COMMUNICATIONS, SPCOM, 2022,
[50] Bridging the Cross-Modality Semantic Gap in Visual Question Answering
Wang, Boyue
Ma, Yujian
Li, Xiaoyan
Gao, Junbin
Hu, Yongli
Yin, Baocai
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, : 1 - 13

← 1 2 3 4 5 →