Mixed-Lingual Pre-training for Cross-lingual Summarization

被引：0

作者：

Xu, Ruochen ^{[1
]}

Zhu, Chenguang ^{[1
]}

Shi, Yu ^{[1
]}

Zeng, Michael ^{[1
]}

Huang, Xuedong ^{[1
]}

机构：

[1] Microsoft Cognit Serv Res Grp, Redmond, WA 98052 USA

来源：

1ST CONFERENCE OF THE ASIA-PACIFIC CHAPTER OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS AND THE 10TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING (AACL-IJCNLP 2020) | 2020年

关键词：

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

Cross-lingual Summarization (CLS) aims at producing a summary in the target language for an article in the source language. Traditional solutions employ a twostep approach, i.e. translate!summarize or summarize!translate. Recently, end-to-end models have achieved better results, but these approaches are mostly limited by their dependence on large-scale labeled data. We propose a solution based on mixed-lingual pretraining that leverages both cross-lingual tasks such as translation and monolingual tasks like masked language models. Thus, our model can leverage the massive monolingual data to enhance its modeling of language. Moreover, the architecture has no task-specific components, which saves memory and increases optimization efficiency. We show in experiments that this pre-training scheme can effectively boost the performance of cross-lingual summarization. In Neural Cross-Lingual Summarization (NCLS) (Zhu et al., 2019b) dataset, our model achieves an improvement of 2.82 (English to Chinese) and 1.15 (Chinese to English) ROUGE-1 scores over state-of-the-art results.

引用

页码：536 / 541

页数：6

共 50 条

[1] Alternating Language Modeling for Cross-Lingual Pre-Training
Yang, Jian
Ma, Shuming
Zhang, Dongdong
Wu, Shuangzhi
Li, Zhoujun
Zhou, Ming
THIRTY-FOURTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, THE THIRTY-SECOND INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE AND THE TENTH AAAI SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2020, 34 : 9386 - 9393
[2] On-the-fly Cross-lingual Masking for Multilingual Pre-training
Ai, Xi
Fang, Bin
PROCEEDINGS OF THE 61ST ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, ACL 2023, VOL 1, 2023, : 855 - 876
[3] Multi-Granularity Contrasting for Cross-Lingual Pre-Training
Li, Shicheng
Yang, Pengcheng
Luo, Fuli
Xie, Jun
FINDINGS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, ACL-IJCNLP 2021, 2021, : 1708 - 1717
[4] Cross-lingual Visual Pre-training for Multimodal Machine Translation
Caglayan, Ozan
Kuyu, Menekse
Amac, Mustafa Sercan
Madhyastha, Pranava
Erdem, Erkut
Erdem, Aykut
Specia, Lucia
16TH CONFERENCE OF THE EUROPEAN CHAPTER OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS (EACL 2021), 2021, : 1317 - 1324
[5] Cross-Lingual Natural Language Generation via Pre-Training
Chi, Zewen
Dong, Li
Wei, Furu
Wang, Wenhui
Mao, Xian-Ling
Huang, Heyan
THIRTY-FOURTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, THE THIRTY-SECOND INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE AND THE TENTH AAAI SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2020, 34 : 7570 - 7577
[6] Explicit Cross-lingual Pre-training for Unsupervised Machine Translation
Ren, Shuo
Wu, Yu
Liu, Shujie
Zhou, Ming
Ma, Shuai
2019 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING AND THE 9TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING (EMNLP-IJCNLP 2019): PROCEEDINGS OF THE CONFERENCE, 2019, : 770 - 779
[7] Dual-Alignment Pre-training for Cross-lingual Sentence Embedding
Li, Ziheng
Huang, Shaohan
Zhang, Zihan
Deng, Zhi-Hong
Lou, Qiang
Huang, Haizhen
Jiao, Jian
Wei, Furu
Deng, Weiwei
Zhang, Qi
PROCEEDINGS OF THE 61ST ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, ACL 2023, VOL 1, 2023, : 3466 - 3478
[8] Cross-lingual timeline summarization
Cagliero, Luca
La Quatra, Moreno
Garza, Paolo
Baralis, Elena
2021 IEEE FOURTH INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND KNOWLEDGE ENGINEERING (AIKE 2021), 2021, : 45 - 53
[9] A Survey on Cross-Lingual Summarization
Wang, Jiaan
Meng, Fandong
Zheng, Duo
Liang, Yunlong
Li, Zhixu
Qu, Jianfeng
Zhou, Jie
TRANSACTIONS OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, 2022, 10 : 1304 - 1323
[10] Unicoder: A Universal Language Encoder by Pre-training with Multiple Cross-lingual Tasks
Huang, Haoyang
Liang, Yaobo
Duan, Nan
Gong, Ming
Shou, Linjun
Jiang, Daxin
Zhou, Ming
2019 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING AND THE 9TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING (EMNLP-IJCNLP 2019): PROCEEDINGS OF THE CONFERENCE, 2019, : 2485 - 2494

← 1 2 3 4 5 →