专利汇可以提供基于深度神经网络的图像降维和重建方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 深度神经网络 的图像 降维 和重建方法,在编码端进行图像降维,减少图片压缩产生的比特流,节约带宽;在解码端进行图像重建。本发明将离散 小波变换 与 深度学习 结合,来提高图像降维和重建性能的潜 力 。本发明将变换、量化、 熵编码 这些模板联合到一起,使得各功能模 块 之间相互影响,联合优化变换、量化等编码步骤,使得 编码器 性能尽可能达到最优。本发明不仅使用神经网络来实现图像的降维和重建,还嵌套使用了 离散小波变换 。在优化率失真时,为了提供更加精确的码字分布,本发明结合使用了上下文网络与超先验网络,后者可以纠正前者的预测信息,共同生成更加准确的均值和标准差参数。,下面是基于深度神经网络的图像降维和重建方法专利的具体信息内容。
1.基于深度神经网络的图像降维和重建方法,其特征在于,构建图像降维和重建网络框架,该网络框架包括编码端和解码端;在编码端进行图像降维,减少图片压缩产生的比特流,节约带宽;在解码端进行图像重建;包括以下步骤:
S1:在编码端,将待编码的图像输入包含离散小波变换DWT的卷积神经网络,得到保存有结构信息的低分辨率图y;
S2:将低分辨率图y量化,得到码字 并将所得码字通过熵编码器,得到熵编码后的码流文件;
且通过混合高斯模型对量化后的码字进行概率建模,来控制码率;并引入上下文及超先验信息,让超先验网络基于上下文来学习概率分布的均值与标准差;
S3:在解码端,将压缩解码后的图像输入包含整数小波变换IWT的卷积网络,得到原始图像重构后的图像;该整数小波变换为离散小波变换的逆变换。
2.根据权利要求1所述的基于深度神经网络的图像降维和重建方法,其特征在于,步骤S1包括以下具体步骤:
1.1)将待编码图像的像素值范围规范至[-1.0,1.0],得到预处理后的图像x;
1.2)对x进行一层卷积操作,提取相关特征信息,得到输出结果x1;
x1=F(x*w+b),其中F为激活函数,以x为输入信息,w为权值,b为偏置,x1为输出结果;
1.3)对x1进行DWT变换,得到输出结果x2;
1.4)对x2进行n次卷积操作,得到x的低分辨率图y。
3.根据权利要求1所述的基于深度神经网络的图像降维和重建方法,其特征在于,步骤S2包括以下具体步骤:
2.1)将低分辨率图像y输入超先验网络,得到输出结果φ;
2.2)对y进行四舍五入的量化,得到
其中U(-0.5,0.5)为值域[-0.5,0.5]的均
匀分布;
2.3)将 输入上下文网络,得到输出结果θ;
该上下文网络在生成某点像素值得时候,将该像素右侧和下侧的像素值掩盖,只通过上侧和左侧的像素值来计算当前点的像素值;
2.4)将φ和θ同时输入熵编码器的参数估计网络,进行多层卷积操作,得到混合高斯分布的参数,即均值μ与标准差δ;
2.5)熵编码器根据μ、δ对 进行编码,得到压缩的比特流。
4.根据权利要求1所述的基于深度神经网络的图像降维和重建方法,其特征在于,步骤S3包括以下具体步骤:
3.1)熵解码器根据μ、δ对压缩的比特流进行解码,得到
3.2)对 进行m次反卷积操作,得到通道数为4的倍数的图 其中
Q为激活函数,w为权值,b为偏置;
3.3)对 进行IWT变换,得到多通道的结果
3.4)对 进行输出通道数为1的卷积操作,得到原始图像x的解码图像,并将解码图像的像素值范围规范至[0,255],得到最终的解码图像
5.根据权利要求2所述的基于深度神经网络的图像降维和重建方法,其特征在于:
编码端结合使用了DWT和卷积操作;
步骤1.2)中,激活函数为GDN;
步骤1.4)中,n为2。
6.根据权利要求3所述的基于深度神经网络的图像降维和重建方法,其特征在于:
步骤2.1)中,超先验网络通过牺牲额外的码字为熵编码器提供额外的参数信息,进一步去除了码字之间的冗余信息;
步骤2.3)中,上下文网络的功能通过掩模卷积操作来实现。
7.根据权利要求6所述的基于深度神经网络的图像降维和重建方法,其特征在于,超先验网络的结构是基于卷积操作的。
8.根据权利要求4所述的基于深度神经网络的图像降维和重建方法,其特征在于:
解码端结合使用了IWT与卷积操作;
步骤3.2)中,激活函数为IGDN;m为2。
9.根据权利要求1所述的基于深度神经网络的图像降维和重建方法,其特征在于,对比传统的图像编码器结构,图像降维和重建网络中的编码器和解码器参数全部由网络训练学习得到;且网络训练时,为了有效进行率失真优化,还对码字的码率进行估计,以方便在训练中对编码器的码率进行控制。
10.根据权利要求1所述的基于深度神经网络的图像降维和重建方法,其特征在于,对码字的码率进行估计时,超先验网络与上下文网络互补;超先验网络中加入上下文信息不会导致潜在的利率损失;在上下文网络中引入超先验信息消除了一定数量的不确定性。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种关联书本与电子资源的系统 | 2020-05-11 | 29 |
卷积神经网络的处理方法及装置 | 2020-05-12 | 222 |
一种基于深度神经网络的数字视频特征提取方法 | 2020-05-13 | 867 |
一种GPU加速的椭球裁剪图地形渲染方法 | 2020-05-14 | 254 |
用于对试样成像的装置 | 2020-05-14 | 598 |
基于视觉显著性的HEVC优化算法 | 2020-05-08 | 670 |
数字预失真的控制方法及电子设备 | 2020-05-12 | 489 |
图片压缩方法、装置、存储介质、计算机设备 | 2020-05-11 | 232 |
一种智能远程书法数字化学习评价信息处理系统及方法 | 2020-05-14 | 615 |
一种车载LVDS信号解析系统 | 2020-05-11 | 275 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。