现代汉语语料库研制

被引:27
|
作者
刘连元
机构
[1] 国家语委中文信息司
关键词
语料库; 开发规范; 建库; 语库; 选材原则; 汉语词类;
D O I
10.16499/j.cnki.1003-5397.1996.03.001
中图分类号
H087 [数理语言学];
学科分类号
摘要
现代汉语语料库是通用型语料库,采用系统选材方式,共选取1919年至今的现代汉语语料7000万字。本文着重介绍了该库的总体设计原则、选材原则以及汉语语料库的有关规范问题。国外语料库开发通常包括五个阶段:规划(planning)、设计(design)、选材(selection)、建库(creation)和标注(annotation)。现代汉语语料库参照国外语料库开发规范,结合汉语特点进行研制。
引用
收藏
页码:3 / 9+114
页数:8
相关论文
empty
未找到相关数据