本文从(1)词的相关性上下文的相关性;(2)字符数的统计和(3)字符串(相当于词或词组)的统计等三方面来判断《红楼梦》前八十回和后四十回是否同一作者?所用方法是LZM(Lempel-Ziv-Welch)压缩算法。结果如下表所示:表中f1代表1字串出现频率,f2代表2字串出现频率。 从表中结果,我们可以初步得出结论:《红楼梦》前八十回与后四十回写作风格有明显的不同,表现为前八十回词汇量大,喜欢用短字串,文章前后相关性弱。后四十回则词汇量小,喜欢用长字串,文章前后相关性强。从这里可以判断,《红楼梦》很可能是由两位作者所完成。