首页 / 专利库 / 软件 / 无损压缩 / 一种高效的数字高程模型数据无损压缩的方法

一种高效的数字高程模型数据无损压缩的方法

阅读:1032发布:2020-11-13

专利汇可以提供一种高效的数字高程模型数据无损压缩的方法专利检索,专利查询,专利分析的服务。并且本 发明 实现了用最优线性二乘 预测模型 和自适应算术编码技术来实现数字高程模型的快速 无损压缩 。在保持数字高程模型数据信息压缩前后无丢失的情况下,实现数字高程模型数据更高的压缩率、压缩时间更短。压缩过程分为两步:第一步,通过最优线性二乘预测模型识别和消除数字高程模型相邻高程间信息冗余,提取独立的空间信息,减小信息熵,即通过最优线性二乘预测模型去相关后,用一个无冗余或 冗余度 较小的数组代替;下一步,对该数组采用自适应算术编码技术对所提取的信息进行编码,使减少后的信息熵得以具体实现,进一步减少数据量。经过这两步后,得到具有更高压缩比的二进制数据流。,下面是一种高效的数字高程模型数据无损压缩的方法专利的具体信息内容。

1.一种高效的数字高程模型数据无损压缩的方法步骤包括:
步骤一:建立最优线性二乘预测模型
由于数字高程模型(DEM)中任一点(i,j)的高程变量H(i,j)是服从正态分布的随机
变量,其预测值误差可以由相邻点高程获得,DEM中(i,j)点的高程误差νi,j由公式(1)计算得出。
νi,j=Hi,j-κ1Hi-1,j-κ2Hi-1,j-1-κ3Hi,j-1 (1)
公式(1)中,κ1,κ2,κ3是实数,k1+k2+k3=1;νi,j组成一个(m-1)×(n-1)的二维矩阵V,衡量误差矩阵V的重要精度指标是数学期望μ和方差σ,σ越小,V的离散度越小,反之,离散程度越大,为了使预测模型最优,应该满足公式(2):

公式(2)就是最优线性二乘预测模型,其中,αi,j是相关系数,αi,j=1;令
ρ为Lagrange乘数,将Φ对κ1,κ2,κ3求一阶导数并令:

其中,i,j=1,2,3,4。
通过Doolittle分解法解上述方程(4),得到:
k=1,2,3,4;j=k,k+1,...,3;i=k+1,...,n (5)
其 中 i = 1 ,. . . ,4 ;j = 3 ,2 ,1
(6)
通过上式(5)和(6),求得κ1,κ2,κ3的值,保留H(i,j)的第一行和第一列的值不变,利用νi,j=int(Hi,j-κ1Hi-1,j-κ2Hi-1,j-1-κ3Hi,j-1)计算高程改正,结果存储在pVar(i,j),此时1≤i≤n,1≤j≤m。
步骤二:自适应算术编码压缩DEM改正误差
在自适应算术编码高阶上下文模型的实现中,将0阶上下文表存储在线性链表中,链表中的每个元素包含了指向相应的1阶上下文表的指针,1阶上下文表中又包含了指向2阶上下文表的指针,2阶上下文表中又包含了指向3阶上下文表的指针,由此构成整个上下文树,树中只有出现过的上下文才拥有已分配的结点,没有出现过的上下文不必占用内存空间,只有在该上下文后面出现过的字符才拥有计数值,由此可以最大限度地减少空间消耗,经过该过程后,得到DEM具有高压缩比的二进制数据流。

说明书全文

一种高效的数字高程模型数据无损压缩的方法

一、技术领域

[0001] 本发明涉及一种高效的数字高程模型数据无损压缩的方法,属于空间信息技术领域。二、背景技术
[0002] 随着空间信息技术的发展。人们获取高分辨率的数字高程模型(DEM)的自动化程度越来越高,DEM的分辨率和数据量迅速增长,一个系统处理的DEM多达几百个Gbtyte,甚至几个TB,这些数据的存储占用大量硬盘空间,超过了计算机硬件的发展速度;再有就是目前的网络带宽和传输速率都有限,为了加快DEM在网络上的传输,数据的压缩技术提供一种有效的解决方案。此外压缩技术也是维护数据的安全性的重要手段之一。
[0003] 数据压缩根据重建过程中有无信息丢失分为:无损压缩和有损压缩。虽然有损压缩可以获得比无损压缩更高的压缩比,对减小存储设备的占用空间和网络的传输时间具有广泛的意义,但它并不能精确的重建原始DEM的内容,会丢失部分信息,并且压缩过程不可逆。在某些领域人们要求数据具有非常高的可信度,如DEM中涉及到国家主权的边界线以及反映地势变化的高程信息等,有损压缩丢失的这部分信息对我们来说是至关重要的,因此高效的无损压缩算法对保证数据的精度、存储、传输和信息的处理具有非常重要的现实意义。有关文献提出了很多关于文本、影像的有损和无损压缩算法,这些算法虽然在图像压缩时获得很高的压缩率,由于DEM中的高程值是浮点数,且相邻值之间存在某种相关性,这些算法往往难以应用到DEM数据的无损压缩上或压缩率不高、压缩时间较长。
[0004] 本发明实现了用最优线性二乘预测模型和自适应算术编码技术来实现DEM的快速无损压缩。三、发明内容
[0005] 1、目的:本发明的目的是提供一种DEM数据高效无损压缩的方法,在保持DEM数据信息压缩前后无丢失的情况下,实现DEM数据更高的压缩率、压缩时间更短。
[0006] 2、技术方案:本发明涉及一种高效的数字高程模型数据无损压缩的方法,该方法的步骤流程如图1所示。
[0007] DEM的压缩分为两个过程:第一步,通过最优线性二乘预测模型识别和消除DEM相邻高程间信息冗余,提取独立的空间信息,减小信息熵,即,对一个m×n的数字高程模型H[i×n+j]通过预测模型去相关后用一个无冗余或冗余度较小的数组pVar[i×n+j]代替,其中1≤i≤n,1≤j≤m,m、n为正整数;下一步,对pVar[i×n+j]采用自适应算术编码技术对所提取的信息进行编码,使减少后的信息熵得以具体实现,进一步减少数据量。经过这两步后,会得到具有高压缩比的二进制数据流。具体实现过程如下:
[0008] 步骤一:建立最优线性二乘预测模型
[0009] 预测就是利用DEM中相邻数据间的相关性,来估计下一点的信息。因为数据压缩和解压缩过程采用同样的规则进行预测,所以可以从编码后的信息准确的恢复原始DEM数据。
[0010] 本发明采用的自适应算术编码是一种熵编码,熵编码对服从高斯分布的数据要比均匀分布的数据有更高的描述效率。高程数据一般不服从高斯分布,如果离散数据中的每个数据是一个随机变量,则整个数据集服从高斯分布,所以首先引入一个线性预测模型消除DEM之间的相关性,最后生成的DEM改正数近似服从高斯分布。由于DEM数据是一个顺序排列的二维矩阵,后一个点的条件概率分布能够由前一已编码的数据集获得。令C={xmn:n<j,0≤m<N;n=j,0≤m<i},其中DEM的大小为n×m,xi+1是下一个要编码的高程值。为了取得最后的压缩效果,希望xi+1在整个二维矩阵中的概率P(公式1)最大。
[0011]
[0012] 公式(1)中Sij是指定条件的上下文,xi+1的编码长度是-log2P{xi+1|i,j∈(N,M)}位是概率模型熵的平均值,条件概率P{xi+1|i,j∈(N,M)}是从前面的编码值计算出的,因此解码器同样能够按照相同的顺序对其解码。
[0013] 从上面分析知,使用统计编码压缩数据时,若高程改正的频率偏离均衡位置的距离越小,压缩效果就越好。高程变量H(i,j)是服从正态分布的随机变量,其预测值误差可以有相邻点的高程获得,如图2所示,DEM中(i,j)点的高程误差νi,j由公式(2)计算得出。
[0014] νi,j=Hi,j-κ1Hi-1,j-κ2Hi-1,j-1-κ3Hi,j-1 (2)
[0015] 公式(2)中,κ1,κ2,κ3是实数,k1+k2+k3=1;νi,j组成一个(m-1)×(n-1)的二维矩阵V。衡量误差矩阵V的重要精度指标是数学期望μ和方差σ,μ表示V集中位置的数学特征;σ表示围绕集中位置离散程度的数字特征,σ越小,V的离散度越小,反之,离散程度越大。为了使预测模型最优,应该满足公式(3):
[0016] 即
[0017] 公式(3)就是最优线性二乘预测模型,其中,αi,j是相关系数,αi,j=1;令ρ为Lagrange乘数,将Φ对κ1,κ2,κ3求一阶导数并令:
[0018]
[0019]
[0020] 令
[0021] 其中,i,j=1,2,3,4。
[0022] 通过Doolittle分解法解上述方程(5),得到:
[0023]
[0024] k=1,2,3,4;j=k,k+1,...,3;i=k+1,...,n (6)
[0025] 其中i=1,...,4;j=3,2,1 (7)
[0026] 通过上式(6)和(7),可以求得κ1,κ2,κ3的值。保留H(i,j)的第一行和第一列的值不变,利用νi,j=int(Hi,j-κ1Hi-1,j-κ2Hi-1,j-1-κ3Hi,j-1)计算高程改正,结果存储在pVar(i,j),此时1≤i≤n,1≤j≤m。
[0027] 步骤二:算术编码压缩DEM改正误差
[0028] 对预测误差矩阵pVar(i,j)采用自适应算术编码进行编码,最终实现数据压缩。基本思想是将每个不同的序列按照出现频率映像到0与1之间的相应数字区域内,该区域表示成可以改变精度的二进制小数,其中出现频率越低的数据利用精度越高的小数表示。
源数据的出现频率决定该算法的压缩效果,同时也决定编码过程中源数据对应的区间范围,而编码区间则决定算术压缩算法最终的输出数据。
[0029] 在算术编码高阶上下文模型的实现中,随着模型阶数的线性增加,模型占用内存n呈指数的速度增长,需要存储的上下文的数目为m,其中,m为互不重复的符号个数,n为模型的阶数。利用高阶上下文总是建立在低阶上下文的基础上这一规律,将0阶上下文表存储在线性链表中,链表中的每个元素包含了指向相应的1阶上下文表的指针,1阶上下文表中又包含了指向2阶上下文表的指针,2阶上下文表中又包含了指向3阶上下文表的指针,由此构成整个上下文树。树中只有出现过的上下文才拥有已分配的节点,没有出现过的上下文不必占用内存空间,只有在该上下文后面出现过的字符才拥有计数值,由此可以最大限度地减少空间消耗。经过该过程后,得到DEM具有高压缩比的二进制数据流。
[0030] 3、优点及功效:有关文献提出了很多关于影像的有损和无损压缩算法,这些算法虽然在文本、图像压缩时获得很高的压缩率,但难以应用到DEM数据的无损压缩上或压缩率不高、压缩时间较长。本发明提出用最优线性二乘预测模型和自适应算术编码技术来实现DEM的快速无损压缩。在保持DEM数据信息压缩前后无丢失的情况下,实现DEM数据更高的压缩率、压缩时间更短。四、附图说明
[0031] 图1DEM无损压缩过程示意图
[0032] 图2网格DEM相邻点的位置关系五、具体实施方式
[0033] 本发明涉及一种高效的数字高程模型数据无损压缩的方法,该方法的步骤流程如图1所示。
[0034] DEM的压缩分为两个过程:第一步,通过最优线性二乘预测模型识别和消除DEM相邻高程间信息冗余,提取独立的空间信息,减小信息熵,即,对一个m×n的数字高程模型H[i×n+j]通过预测模型去相关后用一个无冗余或冗余度较小的数组pVar[i×n+j]代替,其中1≤i≤n,1≤j≤m,m、n为正整数;下一步,对pVar[i×n+j]采用自适应算术编码技术对所提取的信息进行编码,使减少后的信息熵得以具体实现,进一步减少数据量。经过这两步后,会得到具有更高压缩比的二进制数据流。具体实现过程如下:
[0035] 步骤一:建立最优线性二乘预测模型
[0036] 预测就是利用DEM中相邻数据间的相关性,来估计下一点的信息。因为数据压缩和解压缩过程采用同样的规则进行预测,所以可以从编码后的信息准确的恢复原始DEM数据。
[0037] 本发明采用的自适应算术编码是一种熵编码,熵编码对服从高斯分布的数据要比均匀分布的数据有更高的描述效率。高程数据一般不服从高斯分布,如果离散数据中的每个数据是一个随机变量,则整个数据集服从高斯分布,所以首先引入一个线性预测模型消除DEM之间的相关性,最后生成的DEM改正数近似服从高斯分布。由于DEM数据是一个顺序排列的二维矩阵,后一个点的条件概率分布能够由前一已编码的数据集获得。令C={xmn:n<j and 0≤m<N;n=j and 0≤m<i},其中DEM的大小为n×m,xi+1是下一个要编码的高程值。为了取得最后的压缩效果,希望xi+1在整个二维矩阵中的概率P(公式1)最大。
[0038]
[0039] 公式(1)中Sij是指定条件的上下文,xi+1的编码长度是-log2P{xi+1|i,j∈(N,M)}位是概率模型熵的平均值,条件概率P{xi+1|i,j∈(N,M)}是从前面的编码值计算出的,因此解码器同样能够按照相同的顺序对其解码。
[0040] 本发明提出一种性能较好的最优线性二乘预测模型。从上面分析知,使用统计编码压缩数据时,若高程改正的频率偏离均衡位置的距离越小,压缩效果就越好。高程变量H(i,j)是服从正态分布的随机变量,其预测值误差可以有相邻点的高程获得,如图2所示,DEM中(i,j)点的高程误差νi,j由公式(2)计算得出。
[0041] νi,j=Hi,j-κ1Hi-1,j-κ2Hi-1,j-1-κ3Hi,j-1 (2)[0042] 公式(2)中,κ1,κ2,κ3是实数,k1+k2+k3=1;νi,j组成一个(m-1)×(n-1)的二维矩阵V。衡量误差矩阵V的重要精度指标是数学期望μ和方差σ,μ表示V集中位置的数学特征;σ表示围绕集中位置离散程度的数字特征,σ越小,V的离散度越小,反之,离散程度越大。为了使预测模型最优,应该满足公式(3):
[0043] 即
[0044] 公式(3)就是最优线性二乘预测模型,其中,αi,j是相关系数,αi,j=1;令ρ为Lagrange乘数,将Φ对κ1,κ2,κ3求一阶导数并令:
[0045]
[0046]
[0047] 令
[0048] 其中,i,j=1,2,3,4。
[0049] 通过Doolittle分解法解上述方程(5),得到:
[0050] k = 1,2,3,4;j = k,k+1,...,3;i = k+1,...,n(6)
[0051] 其 中 i = 1 ,. . . ,4 ;j = 3 ,2 ,1(7)
[0052] 通过上式(6)和(7),可以求得κ1,κ2,κ3的值。保留H(i,j)的第一行和第一列的值不变,利用νi,j=int(Hi,j-κ1Hi-1,j-κ2Hi-1,j-1-κ3Hi,j-1)计算高程改正,结果存储在pVar(i,j),此时1≤i<n,1≤j<m。
[0053] 步骤二:算术编码压缩DEM改正误差
[0054] 对预测误差矩阵pVar(i,j)采用自适应算术编码进行编码,最终实现数据压缩。基本思想是将每个不同的序列按照出现频率映像到0与1之间的相应数字区域内,该区域表示成可以改变精度的二进制小数,其中出现频率越低的数据利用精度越高的小数表示。
源数据的出现频率决定该算法的压缩效果,同时也决定编码过程中源数据对应的区间范围,而编码区间则决定算术压缩算法最终的输出数据。
[0055] 在算术编码高阶上下文模型的实现中,随着模型阶数的线性增加,模型占用内存n呈指数的速度增长,需要存储的上下文的数目为m,其中,m为互不重复的符号个数,n为模型的阶数。利用高阶上下文总是建立在低阶上下文的基础上这一规律,将0阶上下文表存储在线性链表中,链表中的每个元素包含了指向相应的1阶上下文表的指针,1阶上下文表中又包含了指向2阶上下文表的指针,2阶上下文表中又包含了指向3阶上下文表的指针,由此构成整个上下文树。树中只有出现过的上下文才拥有已分配的节点,没有出现过的上下文不必占用内存空间,只有在该上下文后面出现过的字符才拥有计数值,由此可以最大限度地减少空间消耗。经过该过程后,得到DEM具有高压缩比的二进制数据流。
[0056] 实施例1:
[0057] 在一台配置有Intel(R)CoreTM 2.4GHz 2处理器,2G内存,ATI Radeon HD图形显卡的计算机上进行了实施。选择三幅DEM数据Asia、ChinaPart和JingPart,分别代表不同的地形:Asia包括海洋和地势起伏很大的山区;ChinaPart绝大部分是山岭地带;JingPart是平原地带。表1列出了该三幅验证数据的相关信息。
[0058] 表1.DEM的信息
[0059]
[0060] 表2分别列出了本发明的DEM压缩方法以及Winrar、CAB对三幅DEM压缩的性能指标。压缩率的公式如(8):
[0061] 压缩比:
[0062] 从表2中可以看出:本发明得到DEM的压缩时间要明显小于后两者,并且也比WINRAR或CAB的压缩率高出10%-20%。
[0063] 表2.三种不同方法算法对DEM压缩率和压缩时间性能的比较
[0064]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈