基于正态分布的词频分析法高频词阈值研究

被引:57
作者
安兴茹
机构
[1] 内蒙古科技大学图书馆
关键词
词频分析法; 正态分布; 高频词; 齐普夫定律;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
1205 ;
摘要
词频分析法高频关键词或主题词的界定是开展信息分析的重要基础。首先,在文献统计分析的基础上,总结了目前词频分析法高频词确定的四种方法:TOPN方法、WF>=M方法、%WF=P方法以及T计算方法,这些方法存在着经验性、随意性、理论基础和适用性上的问题。接着,通过实证方法,验证了关键词和主题词在文献库中的分布符合正态分布,并根据正态分布的特性,提出了词频分析法高频词阈值的F计算方法。最后,在多个数据样本基础上,将F方法与T方法进行了对比分析,认为基于正态分布的高频词阈值F计算方法在理论基础和适用性上都能达到较好的效果。
引用
收藏
页码:129 / 136
页数:8
相关论文
共 36 条
[1]   移动互联网时代中国媒体走向——基于CNKI文献关键词的词频分析 [J].
纪盈如 .
重庆工商大学学报(社会科学版), 2013, 30 (05) :93-99
[2]   学术期刊发文主题演变的实证研究——以《情报学报》为例 [J].
魏瑞斌 .
情报杂志, 2013, (06) :64-69+39
[3]   基于词频分析的2011年国内情报学热点研究 [J].
田越 .
知识管理论坛, 2013, (05) :17-24
[4]   CNKI数据源的关键词共现分析与多维尺度分析的现实方法 [J].
翁胜斌 .
现代情报, 2013, 33 (04) :27-30+38
[5]   国外图书馆学博士学位论文的统计分析(2000—2012) [J].
叶莎莎 .
新世纪图书馆, 2013, (01) :84-88
[6]   近三年国外护理教育研究热点的共词聚类分析 [J].
叶然 ;
徐桂华 ;
陈璇 ;
杜世正 .
解放军护理杂志, 2012, 29 (20) :26-29
[7]   政府意识:从“革命”到“改革”的嬗变 [J].
陈永国 .
上海行政学院学报, 2012, (05) :36-42
[8]   信息素养调查问卷的文献计量分析 [J].
杨晓君 ;
魏向辉 ;
贺培风 ;
于琦 ;
吕艳华 .
中华医学图书情报杂志, 2012, (08) :73-75
[9]   2008—2010年《现代情报》论文关键词统计分析 [J].
熊燕 .
农业图书情报学刊, 2012, 24 (03) :69-72
[10]   关键词分析:影响我国心理康复研究文献增长的主要因素 [J].
张爱民 ;
邱卓英 ;
蔡飞鸣 ;
荀芳 ;
李沁燚 ;
陈迪 .
中国康复理论与实践, 2011, (05) :408-410