共 17 条
基于schema的信息安全标准资源解析研究
被引:3
|作者:
邢玉艳
[1
]
刘耀
[1
]
刘茹
[2
]
机构:
[1] 中国科学技术信息研究所
[2] 北京大学
来源:
关键词:
非结构化数据;
资源解析;
XML Schema;
数据存储;
信息安全标准;
D O I:
暂无
中图分类号:
TP309 [安全保密];
学科分类号:
081201 ;
0839 ;
1402 ;
摘要:
精准医疗伦理的信息安全标准体系构建过程中,会使用大量的资源类型,其中最为重要的就是标准资源,标准资源具有"非结构化"、"缺少语义信息"的特点,这对资源中重要文本信息和结构信息的提取造成了困难。本文提出针对信息安全标准数据特点的资源解析方法,基于"非结构化数据-半结构化数据"的转换思想和XML Schema技术,设计并实现了针对非结构化PDF文件的资源自动解析工具,将源数据中的非结构化数据转化为半结构化的XML格式数据,并以"整体式存储"方式存入MongoDB数据库中,实现了在Solr服务器中的检索功能和完成信息安全标准体系构建过程中信息提取、资源解析的工作。通过对比实验证明了基于XML数据的资源解析工具比JSON数据作为数据中间件,对信息安全标准的解析效果更佳。
引用
收藏
页码:108 / 118
页数:11
相关论文