专利汇可以提供基于稀疏学习与遗传算法相结合的神经网络剪枝方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于稀疏学习与遗传 算法 相结合的神经网络 剪枝 方法,主要解决神经网络对存储资源和计算资源消耗大的问题。其实现方案是;通过稀疏学习的方式训练神经网络,得到稀疏化的网络结构;利用 遗传算法 以及一种动态可调节的评价因子对训练好的神经网络中潜在的子网络进行启发式搜索,并在适应度函数的引导下自动搜索出符合需求的最佳子网络;将得到的最佳子网络进行再训练得到最终剪枝结果。本发明减少了神经网络对存储资源和计算资源消耗,保证了剪枝后网络的 精度 ,能实现可调节剪枝,可用于神经网络的压缩。,下面是基于稀疏学习与遗传算法相结合的神经网络剪枝方法专利的具体信息内容。
1.一种基于稀疏学习与遗传算法相结合的神经网络剪枝方法,其特征在于,包括如下:
(1)利用稀疏学习的方式训练神经网络:
(1a)将神经网络各通道中缩放因子的正则作为惩罚项添加到训练的损失函数中,得到新的损失函数fnew(x);
(1b)利用训练数据集和随机梯度下降算法训练神经网络,直到(1a)中新的损失函数收敛;
(2)利用遗传算法搜索最佳子网络:
(2a)设置最大迭代次数,设置通道压缩率为R%,计算训练后神经网络的总参数量p0和计算量c0;
(2b)设置10组权重,每组包括两个比值不同的权重;
(2c)将10组权重编码为10条二进制码,对这些二进制码进行交叉和变异操作产生若干条新的二进制码;
(2d)对(2c)中所有二进制码进行解码,将每条二进制码解码为一组权重;
(2e)对(2d)中的每组权重,利用该组权重计算一组评价因子,每组评价因子中评价因子的个数等于神经网络的通道总数,且评价因子与神经网络中的通道是一一对应的关系;
(2f)将(2e)中的每组评价因子按照从小到大的顺序重新排列,挑选排序后排名前R%的评价因子,并将其所对应的通道从神经网络中删除,从而获得每个子网络;
(2g)测试(2f)中的每个子网络的准确率ηj,纪录每个子网络的参数量pj和计算量cj,并利用ηj,pj和cj算出每个子网络的适应度fj;
(2h)根据(2g)中的适应度,从对所有子网络中筛选出10个子网络,保留这些子网络在(2d)中对应的10组权重,并判断当前迭代次数是否达到(2a)中所设置的最大迭代次数,若达到最大迭代次数,则将具有最大适应度的子网络作为最佳子网络输出,否则,返回(2c);
(3)利用训练数据集和随机梯度下降算法对(2h)中的最佳子网络进行训练,得到训练好的最佳子网络,完成对神经网络的剪枝。
2.根据权利要求1所述的方法,其特征在于:(1a)中新的损失函数,其表达式如下:
fnew(x)=fold(x)+λs·Rs(γ),
其中,fold(x)表示原始的交叉熵损失函数,x表示输入的训练数据,λs表示一个缩放系数,Rs(γ)表示惩罚项,该惩罚项的具体表达式如下:
其中,N表示神经网络的总层数,nl表示神经网络中第l层的总通道数,γl,i表示神经网络中第l层第i个通道的缩放因子,|γl,i|表示γl,i的绝对值,ε表示一个常数约束项。
3.根据权利要求1所述的方法,其特征在于:(1b)利用训练数据集和随机梯度下降算法训练神经网络,其实现如下:
(1b1)从公开数据网站分别下载训练数据集和测试数据集,并将下载的数据转换为张量格式;
(1b2)将张量格式的数据x输入到神经网络,并计算损失函数fnew(x);
(1b3)分别计算损失函数fnew(x)中交叉熵损失fold(x)和惩罚项Rs(γ)关于神经网络中参数的偏导,再利用以下公式更新神经网络中的参数:
其中,θ表示更新前神经网络中的参数,θ'表示更新后神经网络中的参数,μ表示一个步长因子,λs表示一个缩放系数;
(1b4)重复(1b2)-(1b3),直到损失函数fnew(x)收敛。
4.根据权利要求1所述的方法,其特征在于:(2a)中神经网络的参数量p0,通过以下公式获得:
其中,N表示神经网络的总层数,nl表示神经网络中第l层的总通道数,kw和kh分别表示神经网络通道中二维卷积核的宽度和长度。
5.根据权利要求1所述的方法,其特征在于:(2a)中神经网络的计算量c0,通过以下公式获得:
其中,N表示神经网络的总层数,nl表示神经网络中第l层的总通道数,kw和kh分别表示神经网络通道中二维卷积核的宽度和长度, 和 分别表示神经网络第l层的输出特征图的宽度和长度。
6.根据权利要求1所述的方法,其特征在于:(2b)中设置10组权重,是先在0到1的范围内,按照从小到大的顺序均匀抽取10个随机数分别作为10组权重中的第一权重;再在1到0的范围内,按照从大到小的顺序均匀抽取10个随机数分别作为10组权重中的第二权重,得到每组中两个比值不同的权重。
7.根据权利要求1所述的方法,其特征在于:(2e)中利用每组权重计算每一组的评价因子,通过如下公式计算:
其中, 表示第j组评价因子中对应神经网络第l层第i个通道的评价因子, 和 分别表示第j组权重中的第一和第二权重,βl,i表示神经网络中第l层第i个通道的偏置因子。
8.根据权利要求1所述的方法,其特征在于:(2g)中计算子网络的适应度,公式如下:
其中,fj表示第j个子网络的适应度,ηj表示第j个子网络的准确率,pj和cj分别表示第j个子网络的参数量和计算量,W表示一个用来调整适应度的权重因子,当需要子网络具有更少的参数量时,将W设置在[0.5,1]范围内,当需要子网络具有更少的计算量时,将W设置在[0,0.5]范围内。
9.根据权利要求1所述的方法,其特征在于:(3)中利用训练数据集和随机梯度下降算法训练最佳子网络,其实现如下:
(3a)计算损失函数fnew(x)中交叉熵损失fold(x)关于子网络中参数的偏导,再利用以下公式更新子网络中的参数:
其中,表示更新前子网络中的参数, 表示更新后子网络中的参数,μ表示一个步长因子;
(3b)重复(3a),直到损失函数fnew(x)收敛。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于人工智能的医疗服务信息管理方法 | 2020-05-08 | 522 |
运算方法、系统及相关产品 | 2020-05-11 | 854 |
基于深度学习的蛋白质赖氨酸丙二酰化位点预测方法 | 2020-05-08 | 30 |
一种基于射频标签技术的图书馆图书信息管理系统 | 2020-05-11 | 948 |
基于自学习机制的配电网故障恢复方法 | 2020-05-08 | 182 |
深度机器学习所生成的乳腺癌预后的概率识别模型 | 2020-05-08 | 182 |
车联网环境下基于IGA-BP神经网络的车辆碰撞预警系统及方法 | 2020-05-08 | 47 |
一种基于残差密集U形网络模型的丘脑分割方法 | 2020-05-08 | 52 |
一种风电功率预测方法 | 2020-05-08 | 925 |
院内致命性消化道再出血预测关键指标的智能筛选方法 | 2020-05-08 | 844 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。