基于LDA模型的研究领域热点及趋势分析

被引:13
|
作者
杨星
李保利
金明举
机构
[1] 河南工业大学信息科学与工程学院
关键词
研究热点; LDA模型; Gibbs抽样; 主题数目; 主题演化;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
随着研究的不断深入以及信息传播手段的进步,与某个研究领域相关的科学文献越来越多,也越来越容易得到,然而要阅读和分析这些数以千计的文献,仅凭人力已经难于实现对该领域研究重点、研究热点以及趋势进行全面系统地分析。鉴于此,提出一种基于LDA模型对某研究领域在一定时期内的热点及趋势进行自动识别的方法。该方法利用Gibbs抽样计算模型参数,获取领域热点主题以及热点词语,通过按时间后离散的主题演化方法分析热点主题在时间轴上的强度演化。以中文信息处理领域为例,通过对《中文信息学报》2001—2010十年间发表的学术论文进行分析,自动获取中文信息处理领域十年内的研究热点以及热点主题在时间轴上的演化趋势。实验结果初步证明了该方法的有效性。
引用
收藏
页码:66 / 69+74 +74
页数:5
相关论文
共 6 条
  • [1] 基于LDA话题演化研究方法综述
    单斌
    李芳
    [J]. 中文信息学报, 2010, 24 (06) : 43 - 49+68
  • [2] 互联网媒体信息热点主动发现技术研究与应用
    黄宇栋
    李翔
    林祥
    [J]. 计算机技术与发展, 2009, 19 (05) : 1 - 4+187
  • [3] 基于DK算法的互联网热点主动发现研究与实现
    李若鹏
    李翔
    林祥
    李建华
    [J]. 计算机技术与发展, 2008, (09) : 1 - 4
  • [4] 网络热点信息发现研究
    曾依灵
    许洪波
    [J]. 通信学报, 2007, (12) : 141 - 146
  • [5] 流量内容词语相关度的网络热点话题提取
    周亚东
    孙钦东
    管晓宏
    李卫
    陶敬
    [J]. 西安交通大学学报, 2007, (10) : 1142 - 1145+1150
  • [6] 中文计算技术与语言问题研究[M]. 电子工业出版社 , 萧国政, 2007