基于AUC的分类器评价和设计综述

被引:48
|
作者
汪云云
陈松灿
机构
[1] 南京航空航天大学信息科学与技术学院计算机科学与技术系
关键词
精度; 接收者操作特性(ROC)曲线; ROC曲线下面积(AUC); 性能评价指标; 分类器设计;
D O I
10.16451/j.cnki.issn1003-6059.2011.01.014
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
尽管精度(或总体错分率)普遍用作分类算法的性能评价指标,但存在诸如敏感于类先验分布和错分代价,忽略分类算法所得的后验概率或排序信息等不足.而接收者操作特性(ROC)曲线下面积则能度量算法在整个类先验分布及错分代价范围内的总体分类性能、后验概率和排序性能,因此在分类学习中受到越来越多的关注,由此涌现出众多研究成果.文章旨在对此作相对全面的回顾和总结,包括AUC作为性能评价指标的优势所在,基于AUC优化的算法设计,基于精度优化和AUC优化的算法间的关系以及AUC存在的不足及改进.
引用
收藏
页码:64 / 71
页数:8
相关论文
共 6 条
  • [1] ON SURROGATE LOSS FUNCTIONS AND f-DIVERGENCES
    Nguyen, XuanLong
    Wainwright, Martin J.
    Jordan, Michael I.
    [J]. ANNALS OF STATISTICS, 2009, 37 (02): : 876 - 904
  • [2] An efficient algorithm for learning to rank from preference graphs
    Pahikkala, Tapio
    Tsivtsivadze, Evgeni
    Airola, Antti
    Jarvinen, Jouni
    Boberg, Jorma
    [J]. MACHINE LEARNING, 2009, 75 (01) : 129 - 165
  • [3] Maximizing area under ROC curve for biometric scores fusion
    Toh, Kar-Ann
    Kim, Jaihie
    Lee, Sangyoun
    [J]. PATTERN RECOGNITION, 2008, 41 (11) : 3373 - 3392
  • [4] Are loss functions all the same?
    Rosasco, L
    De Vito, E
    Caponnetto, A
    Piana, M
    Verri, A
    [J]. NEURAL COMPUTATION, 2004, 16 (05) : 1063 - 1076
  • [5] Support Vector Machines for Classification in Nonstandard Situations
    Yi Lin
    Yoonkyung Lee
    Grace Wahba
    [J]. Machine Learning, 2002, 46 : 191 - 202
  • [6] The use of the area under the roc curve in the evaluation of machine learning algorithms
    Bradley, AP
    [J]. PATTERN RECOGNITION, 1997, 30 (07) : 1145 - 1159