基于机器学习的中文书目自动分类研究

被引:44
作者
王昊 [1 ]
严明 [2 ]
苏新宁 [1 ]
机构
[1] 南京大学信息管理系
[2] 解放军南京政治学院基础部
关键词
机器学习; 书目自动分类; 特征加权; 中图法; 浅层次分类模型;
D O I
10.13530/j.cnki.jlis.2010.06.002
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
面对与日俱增的图书出版量,图书馆编目人员的手工书目分类显得力不从心,如何实现由计算机自动完成图书分类成为数字图书馆建设中亟待解决的关键问题之一。本文尝试将BP神经网络和支持向量机等机器学习算法引入到书目分类中,建立了面向中图法的基于机器学习的书目层次分类系统模型,提出了采用特征加权方式描述书目和浅层次分类体系构建的设计思路,并通过大规模实验验证了该模型的可行性和合理性,基本上解决了没有主题标注情况下书目的自动分类问题。图9。表5。参考文献14。
引用
收藏
页码:28 / 39
页数:12
相关论文
共 9 条
[1]   基于条件随机场的自动标引模型研究 [J].
章成志 ;
苏新宁 .
中国图书馆学报, 2008, (05) :89-94+99
[2]  
决策树算法研究及应用[J]. 王桂芹,黄道.电脑应用技术. 2008 (01)
[3]  
基于标引经验和机器学习相结合的多层自动分类[J]. 何琳,侯汉清,白振田,张雪英.情报学报. 2006 (06)
[4]  
机器学习[M]. 机械工业出版社 , (美)TomM.Mitchell著, 2003
[5]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47
[6]   Bayesian Network Classifiers [J].
Nir Friedman ;
Dan Geiger ;
Moises Goldszmidt .
Machine Learning, 1997, 29 :131-163
[7]   SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297
[8]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)
[9]  
基于本体的CSSCI学术资源网络模型构建及应用. 王昊. 南京大学 . 2008