Dirichlet混合样本的EM算法与动态聚类算法比较

被引:5
|
作者
夏棒 [1 ]
EMILION Richard [2 ]
王惠文 [3 ]
机构
[1] 中国工商银行博士后科研工作站
[2] 奥尔良大学MAPMO研究所
[3] 北京航空航天大学经济管理学院
关键词
Dirichlet分布; 混合样本; 最大期望(EM)算法; 动态聚类; 机器学习;
D O I
10.13700/j.bh.1001-5965.2018.0752
中图分类号
O211 [概率论(几率论、或然率论)];
学科分类号
摘要
Dirichlet分布是一类包含正参数向量的连续多元概率分布,在比例结构问题中具有广泛的应用。针对Dirichlet混合样本的聚类问题,进行了最大期望(EM)算法和动态聚类算法研究。首先,推导其数学过程,并给出算法迭代步骤。然后,利用数字仿真实验,比较了EM算法与动态聚类算法两种机器学习算法在Dirichlet混合样本中的聚类效果。最后,计算对数似然函数值、程序运行时间、收敛迭代次数、聚类正确率、真正率(TPR)和假正率(FPR) 6个评价指标。仿真实验结果表明,EM算法聚类正确率更高但是运算效率相对较低,而动态聚类算法运算效率较高但是损失了部分聚类正确率。因此,实际应用中建议综合权衡聚类正确率与运算效率的相对需求后,再选取合适算法进行Dirichlet混合样本聚类。
引用
收藏
页码:1805 / 1811
页数:7
相关论文
共 11 条
  • [11] Neural networks for pattern recognition .2 Bishop CM. Oxford;New York . 1995