基于实时数据和历史查询分布的时空索引新方法

被引:3
作者
孟学潮 [1 ]
叶少珍 [1 ,2 ]
机构
[1] 福州大学数学与计算机科学学院
[2] 福建省医疗器械与医药技术重点实验室
关键词
时空索引; 大数据; GeoHash编码; 密度聚类; 热点区域查询;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在大数据时代,数据具有体量大、时空复杂性明显、对实时性要求较高等特点,而传统基于树形结构对大规模时空数据进行索引的方法存在存储空间浪费和查询效率较低的问题。为了解决该问题,提出了一种基于数据和历史查询记录分布建立时空索引的新方法 HDL-index。该算法一方面根据数据在空间上的分布,通过空间划分的思想建立索引网格;另一方面考虑到查询在时间上的延续性,对查询记录对象进行密度聚类后抽象出查询代表模型,然后根据模型的坐标位置和其查询粒度对整体查询区域进行分割。两部分所得到的索引网格都采用Geohash编码,最终合并得到最优的索引编码。HDL-index在考虑数据分布的同时充分考虑用户查询行为,使得频繁查询区域上的索引更加细化。在真实航空数据集上与同类方法进行比较测试的结果表明,其创建索引的效率提高了50%;同时在数据均匀分布的情况下对热点区域的查询效率可提高75%以上。
引用
收藏
页码:860 / 865
页数:6
相关论文
共 15 条
[1]   基于Ex-Dewey前缀编码与R树的GML空间数据索引机制 [J].
陈建华 ;
王卫红 ;
苗放 .
地球信息科学学报, 2010, 12 (02) :2186-2193
[2]  
Indexing of continuously moving objects on road networks. Bok, Kyoung Soo,Yoon, Ho Won,Seo, Dong Min,Kim, Myoung Ho,Yoo, Jae Soo. IEICE Transactions on Information and Systems . 2008
[3]  
Fast greedy algorithms for constructing sparse geometric spanners. Gudmundsson, Joachim,Levcopoulos, Christos,Narasimhan, Giri. SIAM Journal on Computing . 2002
[4]  
The TPR*-tree: an optimized spatio-temporal access method for predictive queries. Tao, Y.,D Papadias,and J. Sun. Proceedings of the 29th international conference on very large data bases . 2003
[5]  
The R*-tree: an efficient and robust access method for points and rectangles[J] . Norbert Beckmann,Hans-Peter Kriegel,Ralf Schneider,Bernhard Seeger. &nbspACM SIGMOD Record . 1990 (2)
[6]   基于Geohash的面数据区域查询 [J].
金安 ;
程承旗 ;
宋树华 ;
陈波 .
地理与地理信息科学 , 2013, (05) :31-35
[7]   基于GPU加速的超精简型编码数据库系统 [J].
骆歆远 ;
陈刚 ;
伍赛 .
计算机研究与发展, 2015, (02) :362-376
[8]  
HTPR*-Tree:An efficient index for moving objects to support predictive query and partial history query. Fang Y,Cao J,Wang J,et al. Web-Age Information Management . 2012
[9]  
A three level search engine index based in query log distribution. Baeza-Yates R,Saint-Jean F. String Processing and Information Retrieval . 2003
[10]  
R-trees:a dynamic index structure for spatial searching. Guttman A. ACM SIGMOD Record . 1984