首页 / 专利库 / 视听技术与设备 / 均值漂移过程 / 一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法

一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法

阅读:501发布:2020-05-13

专利汇可以提供一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种基于ECSA的高斯过程回归的对硝基 苯酚 还原催化剂建模预测方法,包括以下步骤:对乌鸦搜索 算法 加入收缩环绕机制和模拟 退火 进行改进,得到增强型乌鸦搜索算法;对原始输入数据通过归一化,核PCA 降维 和均值漂移聚类对数据进行预处理;利用处理好的数据建立基于高斯过程回归模型的对硝基苯酚还原催化剂 预测模型 ;利用增强型的乌鸦搜索算法优化该预测模型的超参数;根据优化后的预测模型,筛选出最优的催化剂。本发明提出一种新的增强型乌鸦搜索算法,并将其用于优化高斯过程回归的对硝基苯酚还原催化剂建模预测,提高的模型预测 精度 和催化剂的筛选效率。,下面是一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法专利的具体信息内容。

1.一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,其特征在于包括以下步骤:
步骤一:获取原始数据,组成基于增强型乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型的数据集:原始数据包括63个化学元素的化生成、第一电离能、第二电离能、电偶极极化率、沸点、熔点、溶化热、汽化热、热导率、密度、离子半径、原子量、电负性、比热容、共价半径和离子价态16个物理化学性质;
步骤二:处理原始数据:对实验所需的原始数据先进行归一化处理,然后对归一化数据进行KPCA降维,将16维的数据降低到包含其80~85%的主成分的维数,再利用数据类型的相似性对元素进行均值漂移聚类,将63个元素分为m类,在这m类中选取具有代表性s个元素,从而得到处理后的建立预测模型的输入数据,利用这s个元素进行化学实验获取相应催化剂的反应活性指标,得到所需的输出数据;
步骤三:利用处理好的输入和输出数据建立基于高斯过程回归的对硝基苯酚还原催化剂预测模型;
步骤四:采用乌鸦搜索算法,优化基于高斯过程回归的对硝基苯酚还原催化剂预测模型的超参数,得到基于乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型;
步骤五:采用建立好的基于增强型乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型对除去s个元素以外的63个元素中其他元素输入数据进行预测,完成对所有元素的催化性能的预测,筛选得到催化性能最好的元素。
2.根据权利要求1所述的一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,其特征在于利用处理好的输入数据和输出数据建立高斯过程回归模型具体实现方法为:将s个输入数据和输出数据分为训练数据(X,Y)和测试数据(X*,Y*),根据训练输入数据和其对应的输出数据建立函数模型:Y=f(X),给予f(X)高斯过程先验即:f(X)~GP(μ(X),k(X ,X')),其中,μ为均值函数,k为核函数,核函数采用RBF核函数,如下:
其中X'为核函数中心,σ为函数的宽度参数,控制了函数的径向
作用范围,由于训练数据和测试数据都属于同种分布,得到训练数据和测试数据的联合高斯分布: 根据训练输入输出数据,利用核函数并结合联合高斯分布,
便能得到高斯过程回归预测模型的输入和输出关系,最后在利用测试输入数据X*输入模型得到预测值 所述的基于增强型乌鸦搜索算法优化高斯过程回归模型的超参数x包括核函数的宽度参数σ和正则化参数C,即x={σ,C}。
3.根据权利要求2所述的一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,其特征在于所述对乌鸦搜索算法进行改进,得到增强型乌鸦搜索算法,包括:乌鸦跟踪飞行阶段和解集更新过程;
在乌鸦跟踪飞行阶段,将乌鸦跟踪飞行按概率拆分成两个阶段,在第一阶段乌鸦飞行策略如下:xi,iter+1=xi,iter+ri×fli,iter×(mj,iter-xi,iter),式中xi,iter+1是位置更新后超参数值,xi,iter是当前迭代位置的超参数值,ri是0到1内的均匀分布的随机数,fli,iter是乌鸦的飞行半径,mj,iter是乌鸦的记忆位置;
在第二个阶段收缩环绕策略公式如下: 式中
gbest为当前种群中的最优个体, a是从2到0线性减小,r是[0,1]内
的均匀分布的随机数;
解集更新过程概率公式如下: 其中f(x)是适应度函数,x是当前位
置超参数值,x'是更新后的超参数值,T是初始温度,令Δf=f(x')-f(x),当Δf≤0,则接受更新超参数值作为下一次的初始超参数值,当Δf≥0,则计算更新超参数值接受的概率r,产生[0,1]区间均匀分布的伪随机数s,若r≤s,则接受更新超参数值作为下一次的初始超参数值,否则,仍取原来的超参数值作为下一次的初始超参数值,
通过基于增强型乌鸦搜索算法对建立的高斯过程回归预测模型进行超参数优化具体包括以下过程:
初始化增强型乌鸦搜索算法的参数设置、乌鸦种群个数和乌鸦记忆位置;
通过适应度函数 评估每个乌鸦个体的适应度值,其中Y*表示
测试输入数据X*对应的真实输出, 表示测试输入数据X*基于高斯过程回归模型的期望输出;
由乌鸦的飞行策略公式更新粒子的位置,评估新位置的适应度函数值,根据模拟退火概率性更新乌鸦的当前位置超参数值的更新,更新乌鸦的记忆位置;
重复上一步直到达到最大迭代次数或适应度值满足误差精度需要则停止该优化过程。

说明书全文

一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测

方法

技术领域

[0001] 本发明涉及一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,属于复杂工业过程的建模和优化领域。

背景技术

[0002] 对硝基苯酚(4-NP)一般用作农药、医药、染料等精细化学品的中间体,在化工生产中应用广泛。然而,4-NP也一种高毒性、难以被生物降解的有机物,所以4-NP一旦进入环境,会有较大的危害,已被列入我国环境优先控制68种污染物及美国EPA水环境129种重点控制污染物之一。因此,开发一种高效的对硝基苯酚还原催化剂具有重要意义。
[0003] 现阶段关于催化剂的筛选只是通过人为经验和盲目的实验获得,实验过程繁琐且低效。

发明内容

[0004] 本发明的目的是提供一种基于ECSA(增强型乌鸦搜索算法)的高斯过程回归的4-NP还原催化剂建模预测方法,该方法不仅能提供了一种优化高斯过程回归预测模型的方法,而且能够利用此预测模型寻找出元素和催化活性的函数关系,并利用此预测模型精确预测元素中催化性能最好的元素。
[0005] 本发明是采用如下的技术方案实现的:一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,包括以下步骤:
[0006] 步骤一:获取原始数据,组成基于增强型乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型的数据集。原始数据包括63个化学元素的化生成、第一电离能、第二电离能、电偶极极化率、沸点、熔点、溶化热、汽化热、热导率、密度、离子半径、原子量、电负性、比热容、共价半径和离子价态16种物理化学性质,63个化学元素为元素周期表中除去气态、放射性、毒性元素外的所有元素;
[0007] 步骤二:处理原始数据:对实验所需的原始数据先进行归一化处理,然后对归一化数据进行KPCA降维,将16维的数据降低到包含其80~85%的主成分的维数。再利用数据类型的相似性对元素进行均值漂移聚类,将63个元素分为m类。在这m类中选取具有代表性s个元素,从而得到处理后的建立预测模型的输入数据,利用这s个元素进行化学实验获取相应催化剂的反应活性指标(即反应时间),得到所需的输出数据;
[0008] 步骤三:并利用的输入和输出数据建立基于高斯过程回归的对硝基苯酚还原催化剂预测模型;
[0009] 步骤四:采用乌鸦搜索算法,优化基于高斯过程回归的对硝基苯酚还原催化剂预测模型的超参数,得到基于增强型乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型;
[0010] 步骤五:采用建立好的基于增强型乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型对除去s个元素以外的63个元素中其他元素输入数据进行预测,完成对所有元素的催化性能的预测,筛选得到催化性能最好的元素。
[0011] 上述的一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,利用处理好的输入数据和输出数据建立高斯过程回归模型具体实现方法为:将s个输入数据和输出数据分为训练数据(X,Y)和测试数据(X*,Y*),根据训练输入数据和其对应的输出数据建立函数模型:Y=f(X),给予f(X)高斯过程先验即:f(X)~GP(μ(X),k(X,X')),其中,μ为均值函数,k为核函数,核函数采用RBF核函数,如下: 其中X'为核函数中心,σ为函数的宽度参数,控制了函数的径向作用范围,由于训练数据和测试数据都属于同种分布,得到训练数据和测试数据的联合高斯分布: 根据训练输入
输出数据,利用核函数并结合联合高斯分布,便能得到高斯过程回归预测模型的输入和输出关系,最后在利用测试输入数据X*输入模型得到预测值 所述的基于增强型乌鸦搜索算法优化高斯过程回归模型的超参数x包括核函数的宽度参数σ和正则化参数C,即x={σ,C}。
[0012] 上述的一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,所述对乌鸦搜索算法进行改进,得到增强型乌鸦搜索算法,包括:乌鸦跟踪飞行阶段和解集更新过程;
[0013] 在乌鸦跟踪飞行阶段,将乌鸦跟踪飞行按概率拆分成两个阶段,在第一阶段乌鸦飞行策略如下:xi,iter+1=xi,iter+ri×fli,iter×(mj,iter-xi,iter),式中xi,iter+1是位置更新后超参数值,xi,iter是当前迭代位置的超参数值,ri是0到1内的均匀分布的随机数,fli,iter是乌鸦的飞行半径,mj,iter是乌鸦的记忆位置;
[0014] 在第二个阶段收缩环绕策略公式如下: 式中gbest为当前种群中的最优个体, a是从2到0线性减小,r是[0,1]内
的均匀分布的随机数;
[0015] 解集更新过程概率公式如下: 其中f(x)是适应度函数,x是当前位置超参数值,x'是更新后的超参数值,T是初始温度,令Δf=f(x')-f(x),当Δf≤0,则接受更新超参数值作为下一次的初始超参数值,当Δf≥0,则计算更新超参数值接受的概率r,产生[0,1]区间均匀分布的伪随机数s,若r≤s,则接受更新超参数值作为下一次的初始超参数值,否则,仍取原来的超参数值作为下一次的初始超参数值,
[0016] 通过增强型乌鸦搜索算法对建立的高斯过程回归预测模型进行超参数优化具体包括以下过程:
[0017] 初始化增强型乌鸦搜索算法的参数设置、乌鸦种群个数和乌鸦记忆位置;
[0018] 通过适应度函数 评估每个乌鸦个体的适应度值,其中Y*表示测试输入数据X*对应的真实输出, 表示测试输入数据X*基于高斯过程回归模型的期望输出;
[0019] 由乌鸦的飞行策略公式更新粒子的位置,评估新位置的适应度函数值,根据模拟退火概率性更新乌鸦的当前位置超参数值的更新,更新乌鸦的记忆位置;
[0020] 重复上一步直到达到最大迭代次数或适应度值满足误差精度需要则停止该优化过程。
[0021] 本发明采用一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,利用增强型乌鸦搜索算法对通过高斯过程回归建模的4-NP还原催化剂预测模型进行优化。选择出精度更高,效果更佳的催化剂预测模型。利用科学的催化剂预测模型筛选出高效的催化剂。
[0022] 与现有技术相比,本发明的优点主要体现在以下几点:
[0023] 1、对现有的乌鸦搜索算法进行改进,克服其搜索精度低,易陷入局部最优解的缺点,改进的增强型乌鸦搜索算法具有收敛精度高,可以跳出局部最优解,具有高效的寻优性能。
[0024] 2、建立基于高斯过程回归的对硝基苯酚还原催化剂预测模型,并用增强型乌鸦搜索算法对预测模型进行优化,在确保预测准确性的前提下提高预测模型性能。同时在对硝基苯酚还原催化剂筛选方面提供了一种科学有效的方法。附图说明
[0025] 图1是增强型乌鸦搜索算法流程图
[0026] 图2是基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法流程图。

具体实施方式

[0027] 本发明的目的是提供一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,该方法不仅能提供了一种优化高斯过程回归预测模型的方法,而且能够利用此预测模型寻找出元素和催化活性的函数关系,并利用此预测模型精确预测元素中催化性能最好的元素。
[0028] 一种基于ECSA的高斯过程回归的4-NP还原催化剂建模预测方法,包括以下步骤:
[0029] 步骤一:获取原始数据,组成基于增强型乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型的数据集。目前,元素周期表中共有112种元素,除去气态,放射性,毒性元素外,还有63个元素作为催化剂的候选元素。原始数据包括63个化学元素的氧化生成焓、第一电离能、第二电离能、电偶极极化率、沸点、熔点、溶化热、汽化热、热导率、密度、离子半径、原子量、电负性、比热容、共价半径和离子价态16个物理化学性质。
[0030] 步骤二:处理原始数据:对实验所需的原始数据先进行归一化处理,然后对归一化数据进行KPCA降维,将16维的数据降低到包含其85%的主成分的维数,再利用数据类型的相似性对元素进行均值漂移聚类,按照每类中最少含有2个元素的准则,可以将63个元素分为7类。在这7类中根据实验室情况和经验选取具有代表性12个元素,从而得到处理后的建立预测模型的输入数据,利用这12个元素进行化学实验获取相应催化剂的反应活性指标,得到所需的输出数据。
[0031] 步骤三:利用处理好的输入和输出数据建立基于高斯过程回归的对硝基苯酚还原催化剂预测模型;具体实现方法为:将12个输入数据和输出数据按7:3分为训练数据(X,Y)和测试数据(X*,Y*),根据训练输入数据和其对应的输出数据建立函数模型:Y=f(X),给予f(X)高斯过程先验即:f(X)~GP(μ(X),k(X,X')),其中,μ为均值函数,k为核函数,核函数采用RBF核函数,如下: 其中X'为核函数中心,σ为函数的宽度参数,控制了函数的径向作用范围,由于训练数据和测试数据都属于同种分布,得到训练数据和测试数据的联合高斯分布: 根据训练输入输出数据,利用核函数并
结合联合高斯分布,便能得到高斯过程回归预测模型的输入和输出关系,最后在利用测试输入数据X*输入模型得到预测值 所述的基于增强型乌鸦搜索算法优化高斯过程回归模型的超参数x包括核函数的宽度参数σ和正则化参数C,即x={σ,C}。
[0032] 步骤四:采用增强型乌鸦搜索算法,优化基于高斯过程回归的对硝基苯酚还原催化剂预测模型的超参数,得到基于增强型乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型。
[0033] 对乌鸦搜索算法进行改进,得到增强型乌鸦搜索算法,包括:乌鸦跟踪飞行阶段和解集更新过程;
[0034] 在乌鸦跟踪飞行阶段,将乌鸦跟踪飞行按概率拆分成两个阶段,在第一阶段乌鸦i,iter+1 i,iter i,iter j,iter i,iter i,iter+1飞行策略如下:x =x +ri×fl ×(m -x ),式中x 是位置更新后超
参数值,xi,iter是当前迭代位置的超参数值,ri是0到1内的均匀分布的随机数,fli,iter是乌鸦的飞行半径,mj,iter是乌鸦的记忆位置;
[0035] 在第二个阶段收缩环绕策略公式如下: 式中gbest为当前种群中的最优个体, a是从2到0
线性减小,r是[0,1]内的均匀分布的随机数;
[0036] 解集更新过程概率公式如下: 其中f(x)是适应度函数,x是当前位置超参数值,x'是更新后的超参数值,T是初始温度,令Δf=f(x')-f(x),当Δf≤0,则接受更新超参数值作为下一次的初始超参数值,当Δf≥0,则计算更新超参数值接受的概率r,产生[0,1]区间均匀分布的伪随机数s,若r≤s,则接受更新超参数值作为下一次的初始超参数值,否则,仍取原来的超参数值作为下一次的初始超参数值,
[0037] 通过增强型乌鸦搜索算法对建立的高斯过程回归预测模型进行超参数优化具体包括以下过程:
[0038] 初始化增强型乌鸦搜索算法的参数设置、乌鸦种群个数和乌鸦记忆位置;
[0039] 通过适应度函数 评估每个乌鸦个体的适应度值,其中Y*表示测试输入数据X*对应的真实输出, 表示测试输入数据X*基于高斯过程回归模型的期望输出;
[0040] 由乌鸦的飞行策略公式更新粒子的位置,评估新位置的适应度函数值,根据模拟退火概率性更新乌鸦的当前位置超参数值的更新,更新乌鸦的记忆位置;
[0041] 重复上一步直到达到最大迭代次数或适应度值满足误差精度需要则停止该优化过程。
[0042] 步骤五:采用建立好的基于增强型乌鸦搜索算法优化高斯过程回归的对硝基苯酚还原催化剂预测模型对除去12个元素以外的63个元素中其他元素输入数据进行预测,完成对所有元素的催化性能的预测,筛选得到催化性能最好的元素。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈