一种基于文本聚类的web军事情报挖掘系统设计与实现

被引:11
作者
傅畅 [1 ,2 ]
宋佳庆 [1 ,2 ]
机构
[1] 中国电子科学研究院
[2] 电子科技大学
关键词
军事情报; web信息; 网络爬虫; k-means算法,文本聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.09 [];
学科分类号
081203 ; 0835 ; 080402 ;
摘要
为了解决在海量web资源中提取出有用军事情报的问题,本文在分析军事情报和互联网信息特点的基础上,设计并实现了一个包括采集、处理、存储与检索的web军事情报挖掘模型,然后提出了一种面向军事情报应用的文本聚类方法,最后通过实验对聚类效果进行了评估,实验结果表明该方法在聚类纯度、准确率、召回率、F-score指标上有不同程度的提升。
引用
收藏
页码:541 / 545
页数:5
相关论文
共 16 条
[1]   基于开源情报的情报处理系统模型构建 [J].
张恒 .
情报杂志, 2014, 33 (03) :54-57
[2]   关于联合情报体系建设的几点认识 [J].
陈奇伟 ;
代科学 ;
计宏亮 ;
孔瑞远 ;
张林超 ;
武文曦 .
中国电子科学研究院学报, 2015, 10 (01) :1-5
[3]   国外开源情报工作的发展与我国的对策研究 [J].
丁波涛 .
情报资料工作, 2011, (06) :103-106
[4]  
An improved clustering method based on k-means. Lin Y,Luo T,Yao S, et al. Fuzzy Systems and Knowledge Discovery FSKD 2012 9th International Conference on . 2012
[5]  
Introduction to infonnation retrieval. Manning C D,Raghavan P,Schotze H. Cambridge university press . 2008
[6]  
开源情报与网络时代的国家安全. 王飞跃. 科学新闻 . 2007
[7]  
Business Intelligence in Blogs:Understanding Consumer Interactions and Communities. Chau,M,Xu,J. MIS Quarterly . 2012
[8]  
Intelligence analysis;a target-centric approach. Clark R M. CQ press . 2012
[9]  
Mining the Social Web: Data Mining Facebook, Twitter,Linked In, Google+, GitHub, and More. Russell M A. . 2013
[10]   一种基于改进K-means的文档聚类算法的实现研究 [J].
岑咏华 ;
王晓蓉 ;
吉雍慧 .
现代图书情报技术, 2008, (12) :73-79