从高频词等级相关角度探析《红楼梦》作者

被引:6
作者
马创新 [1 ]
陈小荷 [2 ]
机构
[1] 江苏师范大学语言科学与艺术学院
[2] 南京师范大学文学院
关键词
高频词; 等级; 相关度; 作者信息;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文提出一种"基于高频词等级相关度的方法"来探析存疑文献的作者信息,把各份语料中的词型均按照出现频次递减排列并确定等级,然后通过计算出语料之间高频词等级的相关度,来推断语料之间语言风格的相似度,并且把这种方法与"基于词型共现率的方法"和"基于词例共现率的方法"相比较。把《红楼梦》的120回均分为12份语料,使用"基于高频词等级相关度的方法"计算这12份语料两两之间的相关度。研究发现《红楼梦》的前8份语料两两之间相关度高,后4份语料两两之间相关度也高,而前8份语料与后4份语料这两部分语料之间相关度低。推断《红楼梦》前80回应是同一人所写,后40回应是另一人所写。
引用
收藏
页码:97 / 102
页数:6
相关论文
共 20 条
[1]   文献中的词语分布、词型等级和风格计算 [J].
马创新 ;
陈小荷 .
中文信息学报, 2017, 31 (04) :20-27
[2]   基于引文分析的古籍文献影响力评估 [J].
马创新 ;
陈小荷 .
大学图书馆学报, 2016, 34 (01) :16-24
[3]   词汇计量研究与常用词知识库建设 [J].
俞士汶 ;
朱学锋 .
中文信息学报, 2015, (03) :16-20
[4]   信息时代的人文计算 [J].
李启虎 ;
尹力 ;
张全 .
科学, 2015, 67 (01) :35-39+4
[5]   古汉语双字词自动获取方法的比较与分析 [J].
段磊 ;
韩芳 ;
宋继华 .
中文信息学报, 2012, 26 (04) :34-42
[6]   基于支持向量机技术的《红楼梦》作者研究 [J].
施建军 .
红楼梦学刊, 2011, (05) :35-52
[7]   《红楼梦》前80回和后40回的词汇差异 [J].
汪维辉 .
古汉语研究, 2010, (03) :35-40+95
[8]   基于句类特征的作者写作风格分类研究 [J].
张运良 ;
朱礼军 ;
乔晓东 ;
张全 .
计算机工程与应用 , 2009, (22) :129-131+223
[9]   是拉辛,还是莎士比亚? [J].
雷思温 .
中国图书评论, 2007, (03) :106-107
[10]   关于《红楼梦》后四十回 [J].
陈炳藻 ;
胡晴 .
红楼梦学刊, 2002, (03) :267-282