专利汇可以提供多样本多通道卷积神经网络池化的向量化实现方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种多样本多通道 卷积神经网络 池化 的向量化实现方法,步骤包括:步骤1:将卷积神经网络池化层的输入特征数据集数据按照样本维优先方式存储;步骤2: 向量处理 器按列将输入特征数据集数据矩阵划分为多个矩阵 块 ;步骤3:向量处理器依次按行 抽取 指定 大小矩阵块传输到向量处理器的阵列 存储器 的数据缓冲区中;步骤4:向量处理器的各个核并行的对各自数据缓冲区中矩阵块进行池化向量化计算,计算结果按顺序传输至片外存储器中;步骤5:重复步骤3至步骤4,直到完成全部池化层计算。本发明能够充分发挥向量处理器计算性能,且具有实现方法简单、实现效率高、功耗小且效果好等优点。,下面是多样本多通道卷积神经网络池化的向量化实现方法专利的具体信息内容。
1.一种多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,步骤包括:
步骤1:将卷积神经网络池化层的输入特征数据集数据按照样本维优先方式存储;
步骤2:向量处理器按列将所述输入特征数据集数据矩阵划分为多个矩阵块,得到多个输入特征数据矩阵;
步骤3:向量处理器根据步长、过滤器的大小,依次按行从所述输入特征数据矩阵中抽取指定大小矩阵块传输到向量处理器的阵列存储器AM的数据缓冲区中;
步骤4:向量处理器的各个核并行的对各自阵列存储器AM的数据缓冲区中抽取出的矩阵块进行池化向量化计算,计算结果按顺序传输至片外存储器中;
步骤5:重复步骤3至步骤4,直到完成全部池化层计算,得到按所述样本维优先方式存储的卷积神经网络池化层结果。
2.根据权利要求1所述的多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,所述步骤S1中将卷积神经网络池化层的输入特征数据集数据按照样本维优先的方式存储包括:第一层卷积神经网络卷积层计算时,将输入特征的数据集数据重排序,使得输入特征的数据集数据按照N*M阶的矩阵连续存储在向量处理器的片外存储器,其他层计算的输入特征数据矩阵为上一层计算结果的输出特征矩阵且是按照样本维优先的方式存储在向量处理器的片外存储器中。
3.根据权利要求2所述的多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,所述步骤2中,具体将所述输入特征数据集数据矩阵划分为num个矩阵块,每个矩阵块的大小为N*MB阶,其中MB为每个数据块的大小,且MB=q*p,q为目标向量处理器的核数,p为每个核的向量处理单元VPE的个数。
4.根据权利要求3所述的多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,所述步骤S1中N*M阶矩阵、所述步骤S5执行完成后得到的输出特征数据中,每一列存储单个样本的输入特征,在各列的存储顺序为:先是通道方向优先,接着是图像宽度方向优先,最后是图像高度方向优先。
5.根据权利要求1~4中任意一项所述的多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,所述步骤S3中所述数据缓冲区设置有两个,当对其中一个数据缓冲区执行计算的同时,对另一个数据缓冲区进行数据传输。
6.根据权利要求1~4中任意一项所述的多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,所述步骤S3中具体抽取K*MB阶矩阵块传输到向量处理器的阵列存储器AM的数据缓冲区中,其中K=kernelH*kernelW*preC,kernelH*kernelW为过滤器的大小,preC为通道数,传输到每个核的阵列存储器AM中的矩阵子块规模为K*p阶,抽取的所述K*MB阶矩阵块传输到向量处理器的阵列存储器AM的数据缓冲区中的总次数nextH*nextW分别为:
nextH=((preH-kernelH)/stepLen+1)
nextW=((preW-kernelW)/stepLen+1)
其中,nextH为输出图像数据的高度,nextW为输出图像数据的宽度,stepLen为步长。
7.根据权利要求6所述的多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,所述抽取K*MB阶矩阵块的具体步骤为:
步骤3.1:令执行次数t=nextW*r0+c0,其中0<=r0
步骤3.3:间隔preW*preC行连续抽取kernelW*preC行;
步骤3.4:判断是否已经抽取K行,若不是跳转执行步骤3.3,否则抽取结束。
8.根据权利要求6所述的多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,所述步骤S4的具体步骤包括:
步骤4.1:令i=0;
步骤4.2:向量处理器的各个核对各自的K*p阶矩阵,从第i行开始每preC行取一行,共取kernelH*kernelW行数据;
步骤4.3:将取得的所述kernelH*kernelW行数据分别加载到向量寄存器中,并根据池化类型使用向量处理器的对应指令进行处理,得到对应值向量寄存器,将计算结果按顺序存入阵列存储器AM中;
步骤4.4:判断i是否
10.根据权利要求1~4中任意一项所述的多样本多通道卷积神经网络池化的向量化实现方法,其特征在于,若向量处理器包括SIMD指令同时进行并行数据处理,还包括根据待计算图像元素的数据位数调整p值为d*p,d值表示向量处理器中的每个VPE通过SIMD指令能同时处理的图像元素数据,p为每个核的向量处理单元VPE的个数。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于缓冲区生长模型的岛屿自动选取方法 | 2020-05-08 | 786 |
一种面向分布式机器学习参数同步差异化数据传输方法 | 2020-05-11 | 81 |
一种动态体积云的构建与绘制方法 | 2020-05-15 | 734 |
一种长期参考图像选择方法及装置 | 2020-05-17 | 70 |
一种考虑信号阻隔效应的城市空间5G基站选址优化方法 | 2020-05-11 | 275 |
一种电网山火监测预警系统及方法 | 2020-05-14 | 127 |
一种结构线束统计匹配的高分遥感影像道路提取方法 | 2020-05-19 | 139 |
一种用于烟草打叶复烤生产的排产方法及系统 | 2020-05-11 | 92 |
一种自定义数据格式的方法及数据转换系统 | 2020-05-13 | 765 |
一种实现数据传输的方法、装置和系统 | 2020-05-11 | 218 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。