基于潜在狄利克雷分配模型的微博主题演化分析

被引:27
作者
唐晓波
王洪艳
机构
[1] 武汉大学信息资源研究中心
关键词
LDA模型; 主题演化; JS距离; 微博;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
微博主题的演化分析会帮助用户快速准确地理解主题脉络结构、跟踪主题发展情况,并根据主题演化做出相应的预测。本文对概率主题模型LDA(Latent Dirichlet Allocation)进行了扩展,使其适合中文微博短文本的处理,并利用LDA建模结果对微博主题进行演化分析。为了体现不同时间片中主题演化的动态性,本文在使用LDA建模之前首先对每个时间片内最优主题数目进行确定,再通过LDA主题抽取结果,追踪不同时间片内主题的变化趋势,实现主题在内容和强度两个方面的演化分析。通过在真实微博语料库上进行实验,结果表明该方法不但可以较好地分析出同一微博主题随时间的强度演化规律,还可以描述主题内容的演化趋势。
引用
收藏
页码:281 / 287
页数:7
相关论文
共 4 条
[1]   基于LDA话题演化研究方法综述 [J].
单斌 ;
李芳 .
中文信息学报, 2010, (06) :43-49+68
[2]  
微博客热点话题发现策略研究[D]. 杨冠超.浙江大学. 2011
[3]  
基于LDA的主题演化研究与实现[D]. 崔凯.国防科学技术大学. 2010
[4]  
A density-based method for adaptive LDA model selection[J] . Juan Cao,Tian Xia,Jintao Li,Yongdong Zhang,Sheng Tang.Neurocomputing . 2008 (7)