一种基于复杂网络模型的作者身份识别方法

被引:9
作者
李晓军
刘怀亮
杜坤
机构
[1] 西安电子科技大学经济管理学院
关键词
作者识别; 文本分类; 复杂网络; 特征提取; 词共现; 文体学;
D O I
10.13266/j.issn.0252-3116.2015.18.016
中图分类号
O157.5 [图论]; TP391.1 [文字信息处理];
学科分类号
070104 ; 081203 ; 0835 ;
摘要
[目的 /意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法 /过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果 /结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。
引用
收藏
页码:102 / 107
页数:6
相关论文
共 17 条
[1]   典籍英译作者身份识别研究 [J].
祁瑞华 ;
霍跃红 ;
郭旭 ;
刘彩虹 .
现代图书情报技术, 2015, (01) :31-37
[2]   基于文体学的中文UGC作者身份识别研究 [J].
吕英杰 ;
范静 ;
刘景方 .
现代图书情报技术, 2013, (09) :48-53
[3]   语言是一种复杂网络 [J].
刘海涛 .
山西大学学报(哲学社会科学版), 2013, 36 (05) :66-69
[4]   功能语言学视角下的文体风格研究 [J].
李菁菁 .
吉林化工学院学报, 2012, 29 (10) :46-48
[5]   基于语句节奏特征的作者身份识别研究 [J].
王少康 ;
董科军 ;
阎保平 .
计算机工程, 2011, 37 (09) :4-5+8
[6]   基于图模型的文本分类方法的研究 [J].
孟海东 ;
张炼 ;
吕海林 .
计算机与现代化, 2010, (09) :38-40+44
[7]   现当代文学作品的作者身份识别研究 [J].
年洪东 ;
陈小荷 ;
王东波 .
计算机工程与应用 , 2010, (04) :226-229
[8]   向量相似度测度方法 [J].
张宇 ;
刘雨东 ;
计钊 .
声学技术, 2009, 28 (04) :532-536
[9]   基于语义分析的作者身份识别方法研究 [J].
武晓春 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (06) :61-68
[10]  
Small-world patterns in Chinese phrase networks[J]. LI Yong1,2,WEI Luoxia 2,LI Wei2,NIU Yi2,3 & LUO Shiyu2 1.School of Electronic and Information Engineering,South China Uni- versity of Technology,Guangzhou 510640,China;2.Department of Computer Science and Technology,Dongguan Univer- sity of Technology,Dongguan 523106,China;3.School of Computer Science and Engineering,South China University of Technology,Guangzhou 510640,China. Chinese Science Bulletin. 2005(03)