基于K-Modes聚类的自适应话题追踪技术

被引:12
作者
任晓东 [1 ,2 ]
张永奎 [1 ,2 ]
薛晓飞 [1 ,2 ]
机构
[1] 山西大学计算机与信息技术学院
[2] 山西大学计算智能与中文信息处理教育部重点实验室
关键词
话题追踪; K-MATT方法; 话题类中心;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
传统自适应话题追踪用向量空间模型表示一个话题模型,通常会对话题模型更新带来错误的反馈。针对传统自适应话题追踪中话题模型的不足,提出基于K-Modes聚类的自适应话题追踪方法(K-MATT方法),用话题类中心代替话题模型,把命名实体向量空间模型作为话题类中心,在追踪过程中不断迭代更新话题类中心,直到话题类中心稳定。实验证明K-MATT方法是有效的。
引用
收藏
页码:222 / 224
页数:3
相关论文
共 4 条
[1]   话题检测与跟踪的评测及研究综述 [J].
洪宇 ;
张宇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (06) :71-87
[2]   基于反馈学习自适应的中文话题追踪 [J].
王会珍 ;
朱靖波 ;
季铎 ;
叶娜 ;
张斌 .
中文信息学报, 2006, (03) :92-98
[3]   话题识别与跟踪研究 [J].
李保利 ;
俞士汶 ;
不详 .
计算机工程与应用 , 2003, (17) :7-10+109
[4]   Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304