基于K近邻的新话题热度预测算法

被引:31
作者
聂恩伦
陈黎
王亚强
秦湘清
金宇
于中华
机构
[1] 四川大学计算机学院
基金
高等学校博士学科点专项科研基金;
关键词
热度预测; 新话题; K-近邻算法; 话题相似性; 网络舆情;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
随着互联网的快速发展,网络舆情成为政府部门和企业以及社会大众关注的焦点,对网络舆情进行有效监管和正确引导是当前亟待解决的问题,话题热度预测是舆情监管和引导的基础。针对现有算法无法对新话题的热度进行有效预测的缺点,提出了一种基于K近邻的新话题热度预测算法。该算法利用与新话题相似的历史话题的点击数时间序列来对新话题的热度进行预测。实验结果表明,在允许相对误差分别低于10%、20%和30%的情况下,算法预测的前3天点击数的平均正确率分别为47.26%、61%和67.7%,点击数变化趋势平均正确率达到73.73%,这也说明了相似的话题在话题出现的初期具有近似的热度变化趋势。
引用
收藏
页码:257 / 260
页数:4
相关论文
共 7 条
[1]   Web舆情的长期趋势预测方法 [J].
高辉 ;
王沙沙 ;
傅彦 .
电子科技大学学报 , 2011, (03) :440-445
[2]   基于网络评论的网络舆情研究 [J].
彭丹 ;
许波 ;
宋仙磊 .
现代情报, 2009, 29 (12) :4-7
[3]   基于K-Modes聚类的自适应话题追踪技术 [J].
任晓东 ;
张永奎 ;
薛晓飞 .
计算机工程, 2009, 35 (09) :222-224
[4]   基于小波多尺度的网络论坛话题热度趋势预测 [J].
张虹 ;
赵兵 ;
钟华 .
计算机技术与发展, 2009, 19 (04) :76-79
[5]   基于数据挖掘的网络论坛话题热度趋势预报 [J].
张虹 ;
钟华 ;
赵兵 .
计算机工程与应用, 2007, (31) :159-161+174
[6]   一种新的主题影响力模型研究 [J].
高俊波 ;
王晓峰 .
计算机工程与应用 , 2007, (25) :182-185
[7]   基于关键词语的文本特征选择及权重计算方案 [J].
刘里 ;
何中市 .
计算机工程与设计, 2006, (06) :934-936