基于schema的信息安全标准资源解析研究

被引:3
|
作者
邢玉艳 [1 ]
刘耀 [1 ]
刘茹 [2 ]
机构
[1] 中国科学技术信息研究所
[2] 北京大学
关键词
非结构化数据; 资源解析; XML Schema; 数据存储; 信息安全标准;
D O I
暂无
中图分类号
TP309 [安全保密];
学科分类号
081201 ; 0839 ; 1402 ;
摘要
精准医疗伦理的信息安全标准体系构建过程中,会使用大量的资源类型,其中最为重要的就是标准资源,标准资源具有"非结构化"、"缺少语义信息"的特点,这对资源中重要文本信息和结构信息的提取造成了困难。本文提出针对信息安全标准数据特点的资源解析方法,基于"非结构化数据-半结构化数据"的转换思想和XML Schema技术,设计并实现了针对非结构化PDF文件的资源自动解析工具,将源数据中的非结构化数据转化为半结构化的XML格式数据,并以"整体式存储"方式存入MongoDB数据库中,实现了在Solr服务器中的检索功能和完成信息安全标准体系构建过程中信息提取、资源解析的工作。通过对比实验证明了基于XML数据的资源解析工具比JSON数据作为数据中间件,对信息安全标准的解析效果更佳。
引用
收藏
页码:108 / 118
页数:11
相关论文
共 17 条