文本分类器性能评估指标

被引:31
作者
宋枫溪
高林
机构
[1] 炮兵学院系,南京理工大学计算机系合肥南京理工大学计算机系,南京,南京
关键词
文本分类; 性能评估; BEP值; ROC曲线;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
讨论了用传统性能评估指标(精度和错误率)评估文本分类器时面临的困难,分析了目前几种常用的文本分类器性能评估指标:查 全率-查准率曲线、AUROC、F1值以及BEP值的优点与不足,并提出了两种新的可用于文本分类器的性能评估指标。
引用
收藏
页码:107 / 109+127 +127
页数:4
相关论文
共 7 条
[1]   基于Bayes潜在语义模型的半监督Web挖掘 [J].
宫秀军 ;
史忠植 .
软件学报, 2002, (08) :1508-1514
[2]   基于主观Bayes方法的渐进式中文文档分类 [J].
汪保友 ;
周益群 ;
周水庚 ;
胡运发 .
模式识别与人工智能, 2001, 14 (04) :470-475
[3]   基于示例的文本标题分类机制 [J].
林鸿飞 .
计算机研究与发展, 2001, (09) :1132-1136
[4]   一个无需词典支持和切词处理的中文文档分类系统 [J].
周水庚 ;
关佶红 ;
胡运发 ;
周傲英 .
计算机研究与发展, 2001, (07) :839-844
[5]   基于支持向量机与无监督聚类相结合的中文网页分类器 [J].
李晓黎 ;
刘继敏 ;
史忠植 .
计算机学报, 2001, (01) :62-68
[6]  
模式识别[M]. 清华大学出版社 , 边肇祺等编著, 2000
[7]   An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90