Task-adaptive Pre-training and Self-training are Complementary for Natural Language Understanding

被引：0

作者：

Li, Shiyang ^{[1
]}

Yavuz, Semih ^{[2
]}

Chen, Wenhu ^{[1
,3
]}

Yan, Xifeng ^{[1
]}

机构：

[1] UC Santa Barbara, Santa Barbara, CA 93106 USA

[2] Salesforce Res, Menlo Pk, CA USA

[3] Google Research, New York, NY USA

来源：

FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, EMNLP 2021 | 2021年

基金：

美国国家科学基金会;

关键词：

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

Task-adaptive pre-training (TAPT) and Selftraining (ST) have emerged as the major semisupervised approaches to improve natural language understanding (NLU) tasks with massive amount of unlabeled data. However, it's unclear whether they learn similar representations or they can be effectively combined. In this paper, we show that TAPT and ST can be complementary with simple TFS protocol by following TAPT ! Finetuning ! Selftraining (TFS) process. Experimental results show that TFS protocol can effectively utilize unlabeled data to achieve strong combined gains consistently across six datasets covering sentiment classification, paraphrase identification, natural language inference, named entity recognition and dialogue slot classification. We investigate various semi-supervised settings and consistently show that gains from TAPT and ST can be strongly additive by following TFS procedure. We hope that TFS could serve as an important semi-supervised baseline for future NLP studies.

引用

页码：1006 / 1015

页数：10

共 50 条

[41] Object Adaptive Self-Supervised Dense Visual Pre-Training
Zhang, Yu
Zhang, Tao
Zhu, Hongyuan
Chen, Zihan
Mi, Siya
Peng, Xi
Geng, Xin
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2025, 34 : 2228 - 2240
[42] PreQR: Pre-training Representation for SQL Understanding
Tang, Xiu
Wu, Sai
Song, Mingli
Ying, Shanshan
Li, Feifei
Chen, Gang
PROCEEDINGS OF THE 2022 INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA (SIGMOD '22), 2022, : 204 - 216
[43] Pre-training for Spoken Language Understanding with Joint Textual and Phonetic Representation Learning
Chen, Qian
Wang, Wen
Zhang, Qinglin
INTERSPEECH 2021, 2021, : 1244 - 1248
[44] Survey on Vision-language Pre-training
Yin J.
Zhang Z.-D.
Gao Y.-H.
Yang Z.-W.
Li L.
Xiao M.
Sun Y.-Q.
Yan C.-G.
Ruan Jian Xue Bao/Journal of Software, 2023, 34 (05): : 2000 - 2023
[45] Speech Model Pre-training for End-to-End Spoken Language Understanding
Lugosch, Loren
Ravanelli, Mirco
Ignoto, Patrick
Tomar, Vikrant Singh
Bengio, Yoshua
INTERSPEECH 2019, 2019, : 814 - 818
[46] Unified pre-training for program understanding and generation
Ahmad, Wasi Uddin
Chakraborty, Saikat
Ray, Baishakhi
Chang, Kai-Wei
arXiv, 2021,
[47] Unified Pre-training for Program Understanding and Generation
Ahmad, Wasi Uddin
Chakraborty, Saikat
Ray, Baishakhi
Chang, Kai-Wei
2021 CONFERENCE OF THE NORTH AMERICAN CHAPTER OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS: HUMAN LANGUAGE TECHNOLOGIES (NAACL-HLT 2021), 2021, : 2655 - 2668
[48] MarkupLM: Pre-training of Text and Markup Language for Visually Rich Document Understanding
Li, Junlong
Xu, Yiheng
Cui, Lei
Wei, Furu
PROCEEDINGS OF THE 60TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (ACL 2022), VOL 1: (LONG PAPERS), 2022, : 6078 - 6087
[49] Pre-training Language Models for Comparative Reasoning
Yu, Mengxia
Zhang, Zhihan
Yu, Wenhao
Jiang, Meng
2023 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING (EMNLP 2023), 2023, : 12421 - 12433
[50] Sigmoid Loss for Language Image Pre-Training
Zhai, Xiaohua
Mustafa, Basil
Kolesnikov, Alexander
Beyer, Lucas
2023 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV 2023), 2023, : 11941 - 11952

← 1 2 3 4 5 →