Dirichlet混合样本的EM算法与动态聚类算法比较

被引:5
|
作者
夏棒 [1 ]
EMILION Richard [2 ]
王惠文 [3 ]
机构
[1] 中国工商银行博士后科研工作站
[2] 奥尔良大学MAPMO研究所
[3] 北京航空航天大学经济管理学院
关键词
Dirichlet分布; 混合样本; 最大期望(EM)算法; 动态聚类; 机器学习;
D O I
10.13700/j.bh.1001-5965.2018.0752
中图分类号
O211 [概率论(几率论、或然率论)];
学科分类号
摘要
Dirichlet分布是一类包含正参数向量的连续多元概率分布,在比例结构问题中具有广泛的应用。针对Dirichlet混合样本的聚类问题,进行了最大期望(EM)算法和动态聚类算法研究。首先,推导其数学过程,并给出算法迭代步骤。然后,利用数字仿真实验,比较了EM算法与动态聚类算法两种机器学习算法在Dirichlet混合样本中的聚类效果。最后,计算对数似然函数值、程序运行时间、收敛迭代次数、聚类正确率、真正率(TPR)和假正率(FPR) 6个评价指标。仿真实验结果表明,EM算法聚类正确率更高但是运算效率相对较低,而动态聚类算法运算效率较高但是损失了部分聚类正确率。因此,实际应用中建议综合权衡聚类正确率与运算效率的相对需求后,再选取合适算法进行Dirichlet混合样本聚类。
引用
收藏
页码:1805 / 1811
页数:7
相关论文
共 11 条
  • [1] Copula analysis of mixture models
    Vrac, M.
    Billard, L.
    Diday, E.
    Chedin, A.
    [J]. COMPUTATIONAL STATISTICS, 2012, 27 (03) : 427 - 457
  • [2] Clustering for sparsely sampled functional data
    James, GM
    Sugar, CA
    [J]. JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION, 2003, 98 (462) : 397 - 408
  • [3] Model-Based Clustering, Discriminant Analysis, and Density Estimation[J] . Chris Fraley,Adrian E Raftery.Journal of the American Statistical Association . 2002 (458)
  • [4] Robust mixture modelling using the t distribution
    Peel, D
    McLachlan, GJ
    [J]. STATISTICS AND COMPUTING, 2000, 10 (04) : 339 - 348
  • [5] Latent class models for time series analysis
    Winsberg, S
    De Soete, G
    [J]. APPLIED STOCHASTIC MODELS IN BUSINESS AND INDUSTRY, 1999, 15 (03) : 183 - 194
  • [6] PIECEWISE HIERARCHICAL-CLUSTERING
    BROSSIER, G
    [J]. JOURNAL OF CLASSIFICATION, 1990, 7 (02) : 197 - 216
  • [7] Mixture Densities, Maximum Likelihood and the Em Algorithm[J] . Richard A. Redner,Homer F. Walker.SIAM Review . 1984 (2)
  • [8] A kth Nearest Neighbour Clustering Procedure[J] . M. Anthony Wong,Tom Lane.Journal of the Royal Statistical Society. Series . 1983 (3)
  • [9] Mapclus: A mathematical programming approach to fitting the adclus model[J] . Phipps Arabie,J. Douglas Carroll.Psychometrika . 1980 (2)
  • [10] Maximum Likelihood from Incomplete Data via the EM Algorithm[J] . A. P. Dempster,N. M. Laird,D. B. Rubin.Journal of the Royal Statistical Society. Series . 1977 (1)