基于内容分析的中文BBS话题检测系统的设计与实现

被引:5
作者
赵艳红
聂哲
机构
[1] 深圳职业技术学院电子与信息工程学院
关键词
BBS话题检测; 网络爬虫; 话题聚类; 热点分析;
D O I
暂无
中图分类号
TP393.094 [];
学科分类号
080402 ;
摘要
通过对BBS话题模型、话题相似度、话题检测评价标准以及话题趋势的分析和研究,提出了基于内容分析的中文BBS话题检测算法:通过爬虫获取BBS信息;采用基于URL和Xpath的网页模板处理BBS信息;应用ICTLAS实现BBS信息的分词;采用Carrot2对BBS话题进行聚类,基于功率谱的热点话题分析以及基于时间序列的话题预测。最后,通过采用J2EE开发包及Eclipse集成开发环境,结合Hibernate、GWT等技术实现了中文BBS话题检测系统,并在多个BBS论坛上进行了测试,取得了良好的效果。
引用
收藏
页码:242 / 246
页数:5
相关论文
共 7 条
[1]   个体间相互影响的网络舆情演变模型 [J].
聂哲 ;
李粤平 ;
温晓军 ;
何国坤 ;
陈健 .
计算机工程与应用 , 2009, (14) :220-222+227
[2]   话题识别与跟踪技术的发展与研究 [J].
张珏 ;
刘云 .
北京电子科技学院学报, 2008, (02) :77-79
[3]   基于子话题分治匹配的新事件检测 [J].
洪宇 ;
张宇 ;
范基礼 ;
刘挺 ;
李生 .
计算机学报, 2008, (04) :687-695
[4]   话题检测与跟踪的评测及研究综述 [J].
洪宇 ;
张宇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (06) :71-87
[5]   基于内容分析的话题检测研究 [J].
赵华 ;
赵铁军 ;
张姝 ;
王浩畅 .
哈尔滨工业大学学报, 2006, (10) :1740-1743
[6]   一种基于动态进化模型的事件探测和追踪算法 [J].
贾自艳 ;
何清 ;
张海俊 ;
李嘉佑 ;
史忠植 .
计算机研究与发展, 2004, (07) :1273-1280
[7]  
基于HowNet的话题跟踪及倾向性分类研究[J]. 金珠,林鸿飞,赵晶.情报学报. 2005 (05)