文本分类器性能评估指标

被引：31

作者：

宋枫溪

高林

机构：

[1] 炮兵学院系,南京理工大学计算机系合肥南京理工大学计算机系,南京,南京

来源：

计算机工程 | 2004年 / 13期

关键词：

文本分类; 性能评估; BEP值; ROC曲线;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

讨论了用传统性能评估指标(精度和错误率)评估文本分类器时面临的困难,分析了目前几种常用的文本分类器性能评估指标:查全率-查准率曲线、AUROC、F1值以及BEP值的优点与不足,并提出了两种新的可用于文本分类器的性能评估指标。

引用

页码：107 / 109+127 +127

页数：4

共 7 条

[1] 基于Bayes潜在语义模型的半监督Web挖掘 [J].

宫秀军 ;

史忠植 .

软件学报, 2002, (08) :1508-1514

[2] 基于主观Bayes方法的渐进式中文文档分类 [J].

汪保友 ;

周益群 ;

周水庚 ;

胡运发 .

模式识别与人工智能, 2001, 14 (04) :470-475

[3] 基于示例的文本标题分类机制 [J].

林鸿飞 .

计算机研究与发展, 2001, (09) :1132-1136

[4] 一个无需词典支持和切词处理的中文文档分类系统 [J].

周水庚 ;

关佶红 ;

胡运发 ;

周傲英 .

计算机研究与发展, 2001, (07) :839-844

[5] 基于支持向量机与无监督聚类相结合的中文网页分类器 [J].

李晓黎 ;

刘继敏 ;

史忠植 .

计算机学报, 2001, (01) :62-68

[6]

模式识别[M]. 清华大学出版社 , 边肇祺等编著, 2000

[7] An Evaluation of Statistical Approaches to Text Categorization [J].

Yiming Yang .

Information Retrieval, 1999, 1 (1-2) :69-90

← 1 →