基于文本挖掘和百度指数的投资者情绪指数研究

被引:51
|
作者
孟雪井 [1 ,2 ]
孟祥兰 [3 ]
胡杨洋 [3 ]
机构
[1] 中南财经政法大学博士后流动站
[2] 湖北经济学院统计学院、湖北数据与分析中心
[3] 不详
基金
中国博士后科学基金;
关键词
文本挖掘; 百度指数; 投资者情绪; 股票市场;
D O I
10.16304/j.cnki.11-3952/f.2016.01.014
中图分类号
F124 [经济建设和发展];
学科分类号
摘要
本文首先运用文本挖掘技术对中国知网CSSCI期刊与新浪微博话题信息进行文本分析,并结合百度自身关键词推荐系统,在综合三大词库的基础上确定我国投资者相关的初始网络搜索关键词;其次,以上证指数为参照,对三大词库关键词的百度指数周数据的时间序列采用时差相关系数法、随机森林算法进行筛选,过滤后得到最能反映我国投资者行为的关键词词库;最后利用因子分析法构建了具有领先性的沪市投资者情绪指数。
引用
收藏
页码:144 / 153
页数:10
相关论文
共 19 条