审判案例自动抽取与标注模型研究

被引:15
作者
佘贵清
张永安
机构
[1] 北京工业大学经济与管理学院
关键词
语义标注; 本体; 规则抽取; 自然语言处理;
D O I
暂无
中图分类号
D926.2 [法院]; TP391.3 [检索机];
学科分类号
030106 ; 081203 ; 0835 ;
摘要
针对刑事判决书文本,结合刑事审判本体,构建基于本体的案例自动抽取与标注模型。基于法律案例文本的半结构化特征,依据文档组织结构和线索词,运用正则表达式构建抽取规则模板;同时结合自然语言处理技术进行相关语义信息的精准抽取。运用语义标注技术构建刑事审判本体实例库,实现大量案例文本向语义信息网络的转化,便于运用语义信息进行相似案例检索和审判推荐。实验证明,该模型的抽取结果基本达到预期效果。
引用
收藏
页码:23 / 29
页数:7
相关论文
共 6 条
[1]   基于Protege的本体建模研究综述 [J].
章勇 ;
吕俊白 .
福建电脑, 2011, 27 (01) :43-45
[2]  
2009共享版ICTCLAS的分析与使用[J]. 刘克强.科教文汇(上旬刊). 2009(08)
[3]   中文网页语义标注:由句子到RDF表示 [J].
荆涛 ;
左万利 ;
孙吉贵 ;
车海燕 .
计算机研究与发展, 2008, (07) :1221-1231
[4]  
基于Bootstrapping的本体标注方法研究[D]. 高琦.重庆大学. 2010
[5]   Ontologies and semantics for seamless connectivity [J].
Uschold, M ;
Gruninger, M .
SIGMOD RECORD, 2004, 33 (04) :58-64
[6]  
Empirical methods in information extraction .2 CARDIE C. AIMagazine . 1997