共 3 条
周期分类和Single-Pass聚类相结合的话题识别与跟踪方法
被引:26
作者:
税仪冬
瞿有利
黄厚宽
机构:
[1] 北京交通大学计算机与信息技术学院
来源:
关键词:
话题识别与跟踪;
增量聚类;
文本分类;
k-最近邻方法分类;
D O I:
暂无
中图分类号:
TP391.41 [];
学科分类号:
080203 ;
摘要:
针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价.
引用
收藏
页码:85 / 89
页数:5
相关论文

