大数据信息查询检索与整合

1.概述

大数据时代,人类活动所涉及的大数据80%以上与地理信息有关,且呈现海量、多源、异构、动态的特点,传统技术体制在信息查询与整合中存在以下问题:对实体对象空间位置的标识不唯一,查询检索效率低;对实体对象的标识不统一,信息的整合与共享困难;对结构化与非结构化数据进行统一组织管理存在重大障碍。以上不足互相关联、互相影响,极大制约了现有信息系统效能的发挥,方案提出基于北斗网格码的信息查询与整合方式,使得数据查询效率更高,数据整合更便捷。

2.解决方案

在对现有系统不推倒不重来及保护现有数据库独立性的基础上,充分利用数据中的“空间位置”属性,增加北斗网格编码字段,作为ID对各种数据进行统一标识,并以其为纽带构建对象内在的时空关联关系,建立编码动态索引,实现大数据统一组织与高效查询。同时,利用网格编码一维、整型、二进制的特点,实现时空大数据的计算、传输、分发、服务等应用的高效“编码化操作”。

(1)统一标识

图1 空间位置统一标识

(2)数据组织

图2 数据组织与关联

(3)检索与分析

图3 数据检索与统计分析

3.优势特点

(1)基于网格编码的时空大数据快速整合和自动空间关联;

(2)数据检索由多维时空查询简化为一维数值匹配查询,效率大幅提升;

(3)空间计算由经纬度浮点数运算转化为基于二进制编码的位运算,计算效率提升10倍左右。