周期分类和Single-Pass聚类相结合的话题识别与跟踪方法

被引:26
作者
税仪冬
瞿有利
黄厚宽
机构
[1] 北京交通大学计算机与信息技术学院
关键词
话题识别与跟踪; 增量聚类; 文本分类; k-最近邻方法分类;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价.
引用
收藏
页码:85 / 89
页数:5
相关论文
共 3 条
[1]   基于多策略优化的分治多层聚类算法的话题发现研究 [J].
骆卫华 ;
于满泉 ;
许洪波 ;
王斌 ;
程学旗 .
中文信息学报, 2006, (01) :29-36
[2]   一种基于动态进化模型的事件探测和追踪算法 [J].
贾自艳 ;
何清 ;
张海俊 ;
李嘉佑 ;
史忠植 .
计算机研究与发展, 2004, (07) :1273-1280
[3]   话题识别与跟踪研究 [J].
李保利 ;
俞士汶 ;
不详 .
计算机工程与应用 , 2003, (17) :7-10+109