专利汇可以提供一种基于分布式编码的随机梯度下降优化方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于分布式编码的随机梯度下降优化方法,针对在大规模分布式集群上面临的计算 节点 异构和通讯负载 瓶颈 带来的梯度延迟和效率下降的问题,基于分布式编码提出一种适应节点负载均衡的异步随机梯度下降优化 算法 。主要通过在数据交换阶段针对参数更新时产生的数据通信进行编码优化,并使用一种基于负载均衡策略通过对节点计算能 力 进行实时估计,优化节点间的任务分配,改善梯度延迟问题。本算法可以缓解由于梯度延迟问题导致的 深度神经网络 的损失函数难以收敛的问题,能够对大规模神经网络上的训练性能带来较好的提升,从而保证了提高了分布式神经网络训练算法的性能。,下面是一种基于分布式编码的随机梯度下降优化方法专利的具体信息内容。
1.一种基于分布式编码的随机梯度下降优化方法,其特征在于,包括如下内容:
定义存在一个n个节点分布式集群为 在该集群上训练一个
有K层神经元的深度神经网络,定义前向第l层神经元为 训练的第j批次
的训练样本为Fj,且j∈{1,2,...X},X为整个待处理样本集总个数除以Fj的大小,当前训练任务的运行时间为t,每一个待处理样本块为 的大小为 当t=0时,初始化步骤4至步骤10的运算过程均发生于给定的节点Nq、指定神经网络的层Ll、批次Fj、以及编号为i的样本块 上,使用四元组下标标识所述样本块为F(q,l,j,i);当某个对象的存在与某个下标对应的维度无关时,该维度被标记为任意符号 即与神经网络层编号无关的在节点Nq上、批次为Fj且全局编号为i的样本块表示为
步骤1:对n个节点进行排列组合,取任意r个节点组成一组子集合
将全部的可能的组合 组成集合 集合 有
个元素,
步骤2:将同一个批次的训练集Fj划分为 个样本块,在t时刻,以比例
划分批次样本Fj为 个样本块
同理,集合 也有 个元素;
步骤3:从集合 中取元素 从集合 中取元素 其中 是一个样本块, 是一组节点组成的集合;依次将 包含的样本发送到 表示的节点上,即每一个子集合 中的所有节点均接收到同样的样本块 重复上述过程直到每一个样本块 都被发送给了对应的中所有的节点上;此时,每一个节点上存在的待处理样本块个数一共为 每个样本被拷贝并发送到r个不同的节点上;
步骤4:在每一个节点上分别执行梯度下降计算,其过程为:在每个本地节点Nq上对接收到的所有样本块 执行完整的前向传播,即从输入层到输出层一整套完整的神经网络计算过程,在输出层根据对应的损失函数计算损失;
步骤5:依反向传播算法次序在每一层 上执行如下内容:将损失函数对该层 所算出的梯度矩阵进行编码;对节点Nq拥有的μ个同批次样本块,即: 在层
计算所得的所有梯度矩阵结果,即: 中取任意r个元素进行组合,
将第s个组合结果记作 其中q表示节点下标,l表示层下标,j表示样本批次下标,( 代表可能的一
种排列组合结果),将所有的结果组成的结果集合记作 并存在数据库中留作下一步解码,所述( 共有 个元素, );
步骤6:将集合 中的元素 进行拆分,所述 为矩阵,其行数为
列数为 当 时,进行按行拆分,当 时,进行按列拆
分;
将拆分得到的子矩阵集合记作 其
中q表示节点下标,l表示层下标,j表示样本批次编号, 代表样本块编号,s表示集合的编号,k对应拆分的子矩阵下标;
步骤7:对步骤5中的每一个样本块 找到其在数据分发时对应的分发节点子集合 将 中的节点下标编号cq进行升序排序,获取
当前下标节点Nq在有序排列后的节点列表中的位置,记作α,将节点要发送的矩阵记作将要发送的目标节点集合记作
步骤8:执行以下两步操作:
其中Δ是求对称差集的操作符号;重复执行步骤6至8,直到处理完所有集合 中的所有拆分结果 执行步骤9;
步骤9:对应每个节点Nq,在层 上,使用批次样本Fj计算所得的梯度矩阵组合 生成一个待发送数据矩阵 和一个与之对应的发送目标节点列表 将每一个
逐一发送到对应的节点列表 中的节点上,且使用多播方式进行批量发送;
步骤10:在节点Nq上,将其从节点 上接收的在层 上,使用批次样本Fj计算所得的数据包记作 节点Nq上缺少的样本块为 由 计算
得出的梯度矩阵为 将这些矩阵 的拆分子矩阵记作
其中q表示节点下标,l表示层下标,j表示样本批次编号,iv代
表本节点Nq缺少的样本块编号,k对应子矩阵下标;将本节点Nq在步骤6中,由集合 中的元素 进行拆分得到的所有 集合起来,去除重复元素,所得集合为
其中q表示节点下标,l表示层下标,j表示样本批
次编号,iz代表本节点Nq已有的样本块编号,k对应拆分的子矩阵下标;如公式(2)所示,借助所述 计算缺失部分 其中x对应步骤8中打包的下标α:
当获取到所有的 后,用公式(3)拼接出矩阵M(q,l,j,i):
步骤11:通过M(q,l,j,i)还原完整的全局梯度 其计算公式如下:
使用 更新 层的权值,继续反向传播,重复步骤4,直到反向传播到输入层 执行步骤12;
步骤12:每个节点Nq独立记录从进入步骤4至进入步骤12的运行时间,记作Δtq,将当前时刻记作t,节点Nq的当前计算效率记作λq(t),节点Nq上每个拥有的样本块的大小记作 使用公式(5)进行计算:
节点将λq(t)上传至参数服务器;
步骤13:在每个节点Nq上,从参数服务器下载获取所有的λq(t),q=0,1,…,n-1,使用公式(6)对λq(t)进行归一化:
定义a(t+1)和e(t)为如下形式:
e(t)=(e1(t),e2(t),…,en(t))
将分发矩阵记作 所述分发矩阵的行标代表节点下标,列标代表样本块
下标,元素aq,i=1代表节点q拥有样本块i,aq,i=0代表节点q不拥有样本块i,令A为系数矩阵, 为变量,e(t)为常数项,可得非齐次线性方程组(7)。
步骤14:上述方程组系数矩阵行数为n,列数为 r≥2且n>r,根据Pascal三角形公式知 求解
2.根据权利要求1所述的一种基于分布式编码的随机梯度下降优化方法,其特征在于,步骤6中,所述按行拆分包括如下内容:
取每个子矩阵的行数为 从上往下依次取 行,组成r个行数为 列
数为 的子矩阵,最后剩余的子矩阵行数不足 的话,则将剩余部分与第r个子矩阵合并,拆得r个子矩阵,记作
3.根据权利要求1所述的一种基于分布式编码的随机梯度下降优化方法,其特征在于,步骤6中,所述按列拆分包括如下内容:
取每个子矩阵的列数为 从左向右依次取 列,组成r个行数为rowβ列数为的子矩阵,最后剩余的子矩阵规模不足 的,将剩余部分与第r个子矩阵合并,拆得r个子矩阵,记作
4.根据权利要求1所述的一种基于分布式编码的随机梯度下降优化方法,其特征在于,步骤14中,当方程组的行数等于列数时, 方程组有唯一解
5.根据权利要求1所述的一种基于分布式编码的随机梯度下降优化方法,其特征在于,步骤14中,当方程组的行数大于列数时, 方程组无唯一解,变形为一个线性规划问题,解出一组可行解 使用
作为下一个时刻的分配方案,使用该分配方案依照比例
划分每一批次的训练集Fj,执行步骤2,如果当前损失或精度达到神经网络训练的目标要求,则停止训练,结束流程。
标识一个符
号:例如在节点Na上、层Ll上、批次为Fj且全局编号为i的样本块为F(q,l,j,i)。当某个对象的存
在与某个下标对应的维度无关时,该维度被标记为任意符号 例如,与神经网络层编号无
关的在节点Nq上、批次为Fj且全局编号为i的样本块可以写为
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种克服遮挡效应的驾驶场景双目深度估计方法 | 2020-05-08 | 655 |
一种基于集成神经网络学习的电子鼻信号漂移补偿方法 | 2020-05-11 | 226 |
通用动量方法、基于通用动量方法的目标检测与识别方法 | 2020-05-08 | 741 |
一种交叉对比神经网络在心声智能检测中的应用方法 | 2020-05-08 | 361 |
一种基于概率分布自适应的实体关系分类方法 | 2020-05-08 | 748 |
一种基于分布式编码的随机梯度下降优化方法 | 2020-05-08 | 869 |
一种基于正交角度X光的骨骼三维重建方法 | 2020-05-08 | 312 |
一种基于深度神经网络增广训练的表面缺陷检测方法 | 2020-05-08 | 31 |
一种基于深度学习的手势识别方法 | 2020-05-08 | 519 |
基于深度学习的安全帽佩戴识别方法 | 2020-05-08 | 158 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。