专利汇可以提供一种针对硬件实现稀疏化卷积神经网络推断的加速方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种针对 硬件 实现稀疏化 卷积神经网络 推断的 加速 方法,包括面对稀疏硬件加速架构的分组 剪枝 参数确定方法、针对稀疏硬件加速架构的分组剪枝训练方法和针对稀疏化卷积神经网络前向推断的部署方法:根据硬件架构中乘法器数量确定分组剪枝的分组长度和剪枝率,基于量级裁剪方式将压缩率以外的权值进行裁剪,通过增量训练方式提升剪枝后的网络准确率及压缩率,剪枝过的网络经微调后保存非剪枝 位置 的权值和索引参数并送入硬件架构下的计算单元中,计算单元同时获取分组长度的激活值完成稀疏网络前向推断。本发明基于硬件架构出发设定 算法 层面的剪枝参数与剪枝策略,有益于降低稀疏加速器的逻辑复杂度提高稀疏加速器前向推断的整体效率。,下面是一种针对硬件实现稀疏化卷积神经网络推断的加速方法专利的具体信息内容。
1.一种针对硬件实现稀疏化卷积神经网络推断的加速方法,其特征在于:首先确定分组剪枝参数,然后基于确定的参数训练卷积神经网络,最后构建针对稀疏化卷积神经网络前向推断的整体架构。
2.如权利要求1所述的加速方法,其特征在于:所述确定分组剪枝参数的方法是:
S1:确定分组剪枝的分组长度g,激活值与权值获取组的长度决定稀疏卷积网络加速器的内部缓冲区大小;
S2:根据预期设定的压缩率Δ=1-p/g定义,其中p/g为分组长度中待剪枝权值占整体分组长度的比值,确定相同分组长度下的非剪枝权值数;
S3:基于量级的裁剪方式,根据权值的大小来评判其重要性,确定待剪枝的获取组剪枝阈值ε;由步骤S1-S2确定分组长度中全部g个权值经过量级排序后挑选前p个较小权值进行裁剪。
3.如权利要求2所述的加速方法,其特征在于:所述步骤S1中,剪枝方向为滤波器方向或通道方向。
4.如权利要求2所述的加速方法,其特征在于:所述步骤S1中,稀疏计算单元的获取组长度g与乘法器个数Nmul相同。
5.如权利要求1所述的加速方法,其特征在于:所述训练卷积神经网络的方法是:
T1:按照正常流程训练一个卷积神经网络;
T2:确定一个待剪枝的层后,根据确定分组剪枝参数的方法划分待修剪的权值获取组,设定待裁剪阈值或比例;
T3:加入掩码矩阵,其中掩码矩阵与权值参数矩阵的尺寸保持一致,其每个位置上取值只为0或1,分别表示此位置是否裁剪,参数在计算之前先乘该掩码矩阵:掩码矩阵位为1的参数值将继续训练通过反向传播调整,而掩码矩阵位为0的部分因为输出始终为0则不对后续部分产生影响;
T4:重复步骤T2-T3,逐步递增待剪枝的层数直到一个完整的网络各层剪枝完成;
T5:对剪枝后的网络按正常训练流程重新训练微调网络精度。
6.如权利要求5所述的加速方法,其特征在于:所述步骤T2中,卷积层剪枝率高于阈值时,同时设置初始剪枝数p0和增量数p+,增量数p+使用过程中获取组中仅将一个权值量级最小的权值剪枝掉,经过一段时间再训练后,接着选择并修剪一个再训练量级最小的权值,直到达到目标数量p。
7.如权利要求1所述的加速方法,其特征在于:所述构建针对稀疏化卷积神经网络前向推断的整体架构包括中央控制模块、片上SRAM、PE阵列和ReLU模块,中央控制模块协调SRAM、PE阵列和ReLU模块间的数据传输,特征图SRAM用于存放中间部分和计算结果、输入特征图以及输出特征图,权值SRAM内部存储剪枝稀疏后的卷积核权值及其索引坐标,片上SRAM和PE阵列通过全局总线进行通信,ReLU模块完成卷积计算后的功能计算。
8.如权利要求7所述的加速方法,其特征在于:所述PE阵列下的单个PE计算单元通过全局总线获取批次的输入特征图和分组剪枝后的稀疏权值,稀疏权值的存取包括未剪枝数及其对应的索引位置,所述PE单元中的选择器通过索引位置将对应分组长度g的特征图挑选出来乘加操作。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
加速腔以及加速器 | 2020-05-11 | 691 |
一种电子加速器内部冷却装置 | 2020-05-13 | 850 |
一种便于检修的加速器 | 2020-05-12 | 48 |
一种电子加速器辐照装置 | 2020-05-13 | 806 |
一种高压型加速器 | 2020-05-11 | 127 |
防磁高电压加速管 | 2020-05-12 | 111 |
一种加速管运输保护装置 | 2020-05-13 | 825 |
一种电子加速器 | 2020-05-11 | 426 |
一种电子加速器 | 2020-05-11 | 370 |
一种电子加速器 | 2020-05-12 | 722 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。