审判案例自动抽取与标注模型研究

被引：15

作者：

佘贵清

张永安

机构：

[1] 北京工业大学经济与管理学院

来源：

现代图书情报技术 | 2013年 / 06期

关键词：

语义标注; 本体; 规则抽取; 自然语言处理;

D O I：

暂无

中图分类号：

D926.2 [法院]; TP391.3 [检索机];

学科分类号：

030106 ; 081203 ; 0835 ;

摘要：

针对刑事判决书文本,结合刑事审判本体,构建基于本体的案例自动抽取与标注模型。基于法律案例文本的半结构化特征,依据文档组织结构和线索词,运用正则表达式构建抽取规则模板;同时结合自然语言处理技术进行相关语义信息的精准抽取。运用语义标注技术构建刑事审判本体实例库,实现大量案例文本向语义信息网络的转化,便于运用语义信息进行相似案例检索和审判推荐。实验证明,该模型的抽取结果基本达到预期效果。

引用

页码：23 / 29

页数：7

共 6 条

[1] 基于Protege的本体建模研究综述 [J].

章勇 ;

吕俊白 .

福建电脑, 2011, 27 (01) :43-45

[2]

2009共享版ICTCLAS的分析与使用[J]. 刘克强.科教文汇(上旬刊). 2009(08)

[3] 中文网页语义标注:由句子到RDF表示 [J].

荆涛 ;

左万利 ;

孙吉贵 ;

车海燕 .

计算机研究与发展, 2008, (07) :1221-1231

[4]

基于Bootstrapping的本体标注方法研究[D]. 高琦.重庆大学. 2010

[5] Ontologies and semantics for seamless connectivity [J].

Uschold, M ;

Gruninger, M .

SIGMOD RECORD, 2004, 33 (04) :58-64

[6]

Empirical methods in information extraction .2 CARDIE C. AIMagazine . 1997

← 1 →