引入标签语义信息的多标签文本分类

被引:2
作者
张万杰
机构
[1] 河北工业大学人工智能与数据科学学院
基金
天津市自然科学基金;
关键词
多标签文本分类; 标签信息嵌入; BERT;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对当前多标签文本分类模型在标签语义信息利用过程中存在文本特征提取不充分、文本特征信息丢失的问题,提出了一种改进标签语义信息嵌入的多标签文本分类模型(label embedding multi label text classification,LEMLTC)。首先利用BERT将待分类文本和标签嵌入成向量,接着将标签向量和文本向量做点乘,然后通过一个注意力层生成文本的注意力向量,从而对文本向量加权,最后通过全连接网络实现多标签文本分类。在AAPD和Reuters-21578数据集上进行实验,F1值分别提高了3.92%和0.3%,证明了该模型在多标签文本分类任务的有效性。
引用
收藏
页码:8 / 11
页数:4
相关论文
共 9 条
[1]   基于局部正、负标记相关性的k近邻多标记分类新算法 [J].
蒋芸 ;
肖潇 ;
侯金泉 ;
陈莉 .
计算机工程与科学, 2019, 41 (10) :1854-1860
[2]   基于联合模型的多标签文本分类研究 [J].
刘心惠 ;
陈文实 ;
周爱 ;
陈飞 ;
屈雯 ;
鲁明羽 .
计算机工程与应用 , 2020, (14) :111-117
[3]   An Efficient Multi-Label SVM Classification Algorithm by Combining Approximate Extreme Points Method and Divide-and-Conquer Strategy [J].
Sun, Zhongwei ;
Liu, Xiuyan ;
Hu, Keyong ;
Li, Zhuang ;
Liu, Jing .
IEEE ACCESS, 2020, 8 :170967-170975
[4]  
Improved sequence generation model for multi-label classification via CNN and initialized fully connection.[J].Weizhi Liao;Yu Wang;Yanchao Yin;Xiaobing Zhang;Pan Ma.Neurocomputing.2020,
[5]   Using Credal-C4.5 with Binary Relevance for Multi-Label Classification [J].
Moral-Garcia, Serafin ;
Mantas, Carlos J. ;
Castellano, Javier G. ;
Abellan, Joaquin .
JOURNAL OF INTELLIGENT & FUZZY SYSTEMS, 2018, 35 (06) :6501-6512
[6]   Classifier chains for multi-label classification [J].
Read, Jesse ;
Pfahringer, Bernhard ;
Holmes, Geoff ;
Frank, Eibe .
MACHINE LEARNING, 2011, 85 (03) :333-359
[7]   ML-KNN: A lazy learning approach to multi-label leaming [J].
Zhang, Min-Ling ;
Zhou, Zhi-Hua .
PATTERN RECOGNITION, 2007, 40 (07) :2038-2048
[8]   Learning multi-label scene classification [J].
Boutell, MR ;
Luo, JB ;
Shen, XP ;
Brown, CM .
PATTERN RECOGNITION, 2004, 37 (09) :1757-1771
[9]   BoosTexter: A boosting-based system for text categorization [J].
Schapire, RE ;
Singer, Y .
MACHINE LEARNING, 2000, 39 (2-3) :135-168