首页 / 专利库 / 物理 / 库仑势垒 / 一种基于抽象凸下界估计的蛋白质结构预测方法

一种基于抽象凸下界估计的蛋白质结构预测方法

阅读:978发布:2020-06-28

专利汇可以提供一种基于抽象凸下界估计的蛋白质结构预测方法专利检索,专利查询,专利分析的服务。并且一种基于抽象凸下界估计的 蛋白质 结构预测方法,包括以下步骤:首先针对蛋白质高维构象空间 采样 难题,采用一系列变换方法将ECEPP/3 力 场模型转换为单位单纯性约束条件下的递增射线凸函数;基于抽象凸理论,证明并分析给出了递增射线凸函数的 支撑 超平面 集;然后,在差分进化群体 算法 框架 下,基于群体极小化构象次微分知识构建下界低估支撑面;进而,通过低估支撑面极值点快速枚举方法,逐步减小构象采样空间以提高采样效率;同时,利用下界低估支撑面快速廉价地估计原 势能 模型 能量 值,有效减少势能模型目标函数的评价次数;最后,甲硫 氨 酸—脑啡肽(TYR1-GLY2-GLY3-PHE4-MET5)构象空间优化实例验证了本 发明 的有效性。本发明提供一种可靠性高、复杂性较低、计算效率高的基于抽象凸下界估计的蛋白质结构预测方法。,下面是一种基于抽象凸下界估计的蛋白质结构预测方法专利的具体信息内容。

1.一种基于抽象凸下界估计的蛋白质结构预测方法,包括以下步骤:
1)选取合适的场模型,本发明采用ECEPP/3力场模型能量函数的表示形式如下:
式中 表示肽链中原子个数, 为第i个原子的坐标 Ebond为键长贡
献项(1-2相互作用),BOND为键长集合,b为1-2原子之间的距离,b0为1-2原子之间平衡状态下键长,kb为键长强度;Eangle为键贡献项(1-3相互作用),ANGLE为键角集合,a为两键矢量之间的夹角,a0为平衡状态下键角,ka为键角的强度;Etorsion为正常二面角贡献项(1-4相互作用),采用余弦函数的形式描述,TOR为正常二面角集合,MUL为二面角多样性集合,τ为正常二面角,m为多样性,Vm,τ为二面角τ对应于多样性m的势垒高度,γm,τ为二面角τ对应于多样性m的初始相位;Eelectrostatic为静电力(库仑力)贡献项,ES为静电作用力原子集合,qi为原子i的部分电荷,qj为原子j的部分电荷,ε为介电常数;Evdw为范德华力相互作用贡献项(6-12作用力),采用Lennard-Jones势描述,VDW为范德华作用力集合,rij为原子i与原子j之间的欧氏距离,参数Aij和Bij依赖于特定原子类型和相互作用的特征;Ehydrogen为氢键相互作用贡献项(10-12作用力),HB为氢键作用力集合,Cij和Dij依赖于相互作用特征;Eother为其它额外的能量贡献项;
2)将力场模型转换为单位单纯形约束下的目标函数,并通过局部优化的方法获得其简化的势能模型;
3)参数初始化:设置群体规模popSize,变异因子F为0.5,交叉因子CR为0.1,低估概率underFactor,常数M,支撑向量规模K=N+1,支撑向量阈值KT,初始群体其中 称为单位单纯形,
计算f5(xi),i∈I,其中f5为简化势能模型对应的目标函数 并设
为区域I上的最小值,其中I={1,2,...,popSize};
i
4)对每一个目标个体x ∈S(i=1,2,…,popSize)作如下处理:
a b c
4.1)任意选取三个个体{x,x,x|a,b,c∈{1,2,...,popSize},a≠b≠c≠i};
a b c
4.2)对{x,x,x}执行变异操作 生成变异个体
i
4.3)对目标个体x 和变异个体 执行交叉操作,生成测试个体
4.3.1)设置j=1;
4.3.2) j=1,2,...,N+1;其中randb(j)产生0到1之间的
随机数;rnbr(i)产生1到N+1之间的任一个整数;
4.3.3)j=j+1;
4.3.4)如果j4.4)i=i+1;如果ii
5)对目标个体x ∈S和测试个体 逐个更新操作:
5.1)设置i=1;
5.2)查询包含 的子区域 计算 其中 为低估支撑面
在 子区域中唯一的最优解, 为唯一对应于子区域 的支撑
向量矩阵对角项;
5.3)如果 转至5.9);
5.4)如果K5.5)如果random(0,1)5.6)计算 其中 为给定区域中的唯一最优解;
5.7)如果 转至5.9);
K
5.8)计算 如果 则置 K=K+1,更新树结构T;
5.9)i=i+1;如果i≤popSize,转至5.2);
6)置
7)判断是否满足终止条件,如不满足转至步骤3);
8)输出结果,退出。
2.如权利要求1所述,步骤2)中模型变换方法为,模型(I)中b,a,τ,rij等变量均为个原子坐标 的函数,经过平移及旋转变换后问题维数为 给定肽链中
所有原子坐标,可计算得到能量值;通常在生物学条件下,键长偏差小于 键角偏差小于2°;因此,考虑肽链分子的键长、键角均固定在平衡状态,设置Ebond=Eangle=Eother=0,可将其维数降至 其中 为肽链分子中共价键总数, 为肽链分子中独立
键角总数;与此同时,该简化过程也引入高价(最高12价)的非线性等式约束条件;为了消除高价非线性等式约束条件,设 代入模型(I),可得到:
式中 为肽链二面角向量;N为肽链中二
面角的自由度(即优化问题维数),NRES表示肽链长度(或残基)个数, 为第i个残基侧链二面角的个数;且满足 为第i个残基主链C–N–Cα–C四个原子之间的
二面角,ψi为第i个残基主链N–Cα–C–N四个原子之间的二面角,ωi为第i个残基主链Cα–C–N–Cα四个原子之间的二面角, 为第i个残基侧链第 个二面角变量。
3.如权利要求1和权利要求2所述,将给定的力场模型转换为单位单纯形,并获得简化的力场模型:
设 常 数 其 中τt(t=1,2,...,N)为 模 型(II)中 二
面角变量,N为二面角自由度(即优化问题维数);则由模型(II)约束条件可知:
采用下列投影变换:
将模型(II)边界约束可行域一对一地映射成单位单纯形 将式
(2)代入模型(II)可得:
min f3(x)=f2(2πNx1-π,2πNx2-π,...,2πNxN-π),x∈S. (III)
近一步,应用局部优化方法,得到以下松弛模型:
其中 为以x为初始点在模型(III)势能曲面上应用局部最小化算法得到的局优解;
显然,模型(IV)为模型(III)松弛势能曲面,即minf3(x)=minf4(x)。

说明书全文

一种基于抽象凸下界估计的蛋白质结构预测方法

技术领域

[0001] 本发明涉及一种生物信息学、计算机应用领域,尤其涉及的是,一种基于抽象凸下界估计的蛋白质结构预测方法。

背景技术

[0002] 生物信息学是生命科学和计算机科学交叉领域的一个研究热点。生物信息学研究成果已经被广泛应用于基因发现和预测、基因数据的存储管理、数据检索与挖掘、基因表达数据分析、蛋白质结构预测、基因和蛋白质同源关系预测、序列分析与比对等。而蛋白质三维结构预测又是生物信息学领域的一个重要分支。著名的Anfinsen实验表明蛋白质的一级结构决定其三维结构,即肽链中的基酸残基序列决定其空间结构。从热学的度来讲,肽链分子天然构型对应于其物理能量的最小状态。目前,根据Anfinsen假设,直接从氨基酸序列出发,基于势能模型,采用全局优化方法,搜索分子系统的最小能量状态,从而能够高通量、廉价地预测肽链的天然构像,已经成为生物信息学最重要的研究课题之一。经过40多年的发展,对于序列相似度较高的情况(>50%),预测精度能够达到 左右;但是序列相似度<30%的情况下并不理想;尤其是对于序列相似度低、或多肽(<10个残基的小蛋白)来说,从头预测方法则是唯一的选择。
[0003] 从头预测方法是选择一种力场势能模型作为目标函数,利用全局优化算法在势能曲面上搜索全局最小能量解,在数学上属于一类极其复杂的非凸多极值优化问题。针对力场模型优化问题,1987年Li开创性地提出了一种蒙特卡洛能量最小化方法(Monte Carlo Minimization,MCM),采用Metropolis Monte Carlo采样策略,结合局部最小化方法,优化得到了脑啡肽(包含5个残基)的最低能量结构;1997年Lee提出的构象空间退火(Conformational Space Annealing,CSA)算法,基于“种子”概念生成构象群体,结合遗传算法和构象集结过程,除了得到脑啡肽的最小能量构象之外,还得到了一系列次稳态构象;1999年Wales提出的Basin-Hopping(BH)方法本质上就是结合局部优化方法的蒙特卡洛退火优化,2005年Bradley在结合蒙特卡洛优化方法开发了分子建模Rosetta程序,成功预测CASP6中T0281目标蛋白(包含70个残基)的Cα-RMSD为 对某些小目标蛋白(<85个残基),甚至得到误差精度小于 的高分辨率三维解析结构;2006年,Zhan采用Basin-Paving(BP)方法得到了脑啡肽在ECEPP/2、ECEPP/3两种力场模型下最小能量构象;2009年Roosi提出几种BP改进策略,并给出了比较结果。另外,其它随机全局优化算法,如遗传算法(Genetic Algorithms,GA)、差分进化(Differential Evolution,DE)算法也应用于力场模型的优化,但是由于模型的复杂性,这些算法极容易陷入某个局优解;同时由于随机算法缺乏全局收敛理论依据及解的不确定性,进一步限制了它们在实际问题中的应用。
[0004] 因此,现有的技术在确定蛋白质稳定构象方面存在着缺陷,需要改进。

发明内容

[0005] 为了克服已有方法复杂度高,易陷入局部极值点而不易得到全局最优稳定构象的不足,本发明在降低力场模型复杂性的同时,结合抽象凸理论,提出了一种基于抽象凸下界估计的蛋白质结构预测方法。
[0006] 本发明解决其技术问题所采用的技术方案是:一种基于抽象凸下界估计的蛋白质结构预测方法,包括以下步骤:
[0007] 1)选取合适的力场模型。
[0008] 力场模型是依赖于原子三维坐标的经验势能函数,由于其忽略了电子的相互作用,使得分子力场模型结构相对简单,计算速度较快,辅以成熟的力场参数,可达到很高的精度,能够用于生物大分子的结构预测。力场模型总势能通常被经验性的划分成若干项,本发明采用ECEPP/3力场模型能量函数的表示形式如下:
[0009]
[0010]
[0011]
[0012] 式中 表示肽链中原子个数, 为第i个原子的坐标 Ebond为键长贡献项(1-2相互作用),BOND为键长集合,b为1-2原子之间的距离,b0为1-2原子之间平衡状态下键长,kb为键长强度;Eangle为键角贡献项(1-3相互作用),ANGLE为键角集合,a为两键矢量之间的夹角,a0为平衡状态下键角,ka为键角的强度;Etorsion为正常二面角贡献项(1-4相互作用),采用余弦函数的形式描述,TOR为正常二面角集合,MUL为二面角多样性集合,τ为正常二面角,m为多样性,Vm,τ为二面角τ对应于多样性m的势垒高度,γm,τ为二面角τ对应于多样性m的初始相位;Eelectrostatic为静电力(库仑力)贡献项,ES为静电作用力原子集合,qi为原子i的部分电荷,qj为原子j的部分电荷,ε为介电常数;Evdw为范德华力相互作用贡献项(6-12作用力),采用Lennard-Jones势描述,VDW为范德华作用力集合,rij为原子i与原子j之间的欧氏距离,参数Aij和Bij依赖于特定原子类型和相互作用的特征;Ehydrogen为氢键相互作用贡献项(10-12作用力),HB为氢键作用力集合,Cij和Dij依赖于相互作用特征;Eother为其它额外的能量贡献项。
[0013] 2)将力场模型转换为单位单纯形约束下的目标函数,并通过局部优化的方法获得其简化的势能模型。
[0014] 模型(I)中b,a,τ,rij等变量均为 个原子坐标 的函数,经过平移及旋转变换后问题维数为 给定肽链中所有原子坐标,可计算得到能量值。通常在生物学条件下,键长偏差小于 键角偏差小于2°。因此,考虑肽链分子的键长、键角均固定在平衡状态,设置Ebond=Eangle=Eother=0,可将其维数降至 其中为肽链分子中共价键总数, 为肽链分子中独立键角总数。与此同时,该简化过程也引入高价(最高12价)的非线性等式约束条件。为了消除高价非线性等式约束条件,设代入模型(I),可得到:
[0015]
[0016]
[0017]
[0018]
[0019]
[0020] 式中 为肽链二面角向量;N为肽链中二面角的自由度(即优化问题维数),NRES表示肽链长度(或残基)个数, 为第i个残基侧链二面角的个数;且满足 为第i个残基主链C–N–Cα–C四个原子之
间的二面角,ψi为第i个残基主链N–Cα–C–N四个原子之间的二面角,ωi为第i个残基主链Cα–C–N–Cα四个原子之间的二面角, 为第i个残基侧链第 个二面角变量。
[0021] 2.1)将力场模型转换为单位单纯形。
[0022] 设 常 数 其 中τt(t=1,2,...,N)为模 型(II)中二面角变量,N为二面角自由度(即优化问题维数);则由模型(II)约束条件可知:
采用下列投影变换:
[0023]
[0024] 将模型(II)边界约束可行域一对一地映射成单位单纯形 将式(2)代入模型(II)可得:
[0025] min f3(x)=f2(2πNx1-π,2πNx2-π,...,2πNxN-π),x∈S. (III)[0026] 近一步,应用局部优化方法,得到以下松弛模型:
[0027]
[0028] 其中 为以x为初始点在模型(III)势能曲面上应用局部最小化算法得到的局优解。
[0029] 显然,模型(IV)为模型(III)松弛势能曲面,即min f3(x)=min f4(x)。图1给出了脑啡肽以ψ1(即τ2,酪氨酸残基中N–Cα–C–N四个原子形成的二面角)为自变量,其余23个二面角固定在平衡态时模型(III)和模型(IV)的势能曲线。
[0030] 3)参数初始化:设置群体规模popSize,变异因子F为0.5,交叉因子CR为0.1,低估概率underFactor,常数M,支撑向量规模K=N+1,支撑向量阈值KT,初始群体其中 称为单位单纯形,
i
计算f5(x),i∈I,其中f5为简化势能模型对应的目标函数 并设
为区域I上的最小值,其中I={1,2,...,popSize};
i
[0031] 4)对每一个目标个体x ∈S(i=1,2,…,popSize)作如下处理:a b c
[0032] 4.1)任意选取三个个体{x,x,x|a,b,c∈{1,2,...,popSize},a≠b≠c≠i};
[0033] 4.2)对{xa,xb,xc}执行变异操作 生成变异个体
[0034] 4.3)对目标个体xi和变异个体 执行交叉操作,生成测试个体
[0035] 4.3.1)设置j=1;
[0036] 4.3.2) j=1,2,...,N+1;其中randb(j)产生0到1之间的随机数;rnbr(i)产生1到N+1之间的任一个整数;
[0037] 4.3.3)j=j+1;
[0038] 4.3.4)如果j
[0039] 4.4)i=i+1;如果i
[0040] 5)对目标个体xi∈S和测试个体 逐个更新操作:
[0041] 5.1)设置i=1;
[0042] 5.2)查询包含 的子区域 计算 其中 为低估支撑面在 子区域中唯一的最优解, 为唯一对应于子区域 的支撑
向量矩阵对角项;
[0043] 5.3)如果 转至5.9);
[0044] 5.4)如果K
[0045] 5.5)如果random(0,1)
[0046] 5.6)计算
[0047] 5.7)如果 转至5.9);
[0048] 5.8)计算 如果 则置 K=K+1,更新树结构TK;
[0049] 5.9)i=i+1;如果i≤popSize,转至5.2);
[0050] 6)置
[0051]
[0052] 7)判断是否满足终止条件,如不满足转至步骤3);
[0053] 8)输出结果,退出。附图说明
[0054] 图1、脑啡肽模型III与模型IV势能曲线比较(其余23个二面角固定在平衡状态);
[0055] 图2、脑啡肽稳定构象(能量值-11.7073Kcal/mol);
[0056] 图3、脑啡肽最优构象解对应的24个二面角的值;

具体实施方式

[0057] 下面结合附图对本发明作进一步描述,参照图1~图3,以脑啡肽为实施例,一种基于抽象凸下界估计的蛋白质结构预测方法,其中包含以下步骤:
[0058] 1)选取合适的力场模型:力场模型是依赖于原子三维坐标的经验势能函数,由于其忽略了电子的相互作用,使得分子力场模型结构相对简单,计算速度较快,辅以成熟的力场参数,可达到很高的精度,能够用于生物大分子的结构预测。力场模型总势能通常被经验性的划分成若干项,本发明采用ECEPP/3力场模型能量函数的表示形式如下:
[0059]
[0060]
[0061]
[0062] 式中 表示肽链中原子个数, 为第i个原子的坐标 Ebond为键长贡献项(1-2相互作用),BOND为键长集合,b为1-2原子之间的距离,b0为1-2原子之间平衡状态下键长,kb为键长强度;Eangle为键角贡献项(1-3相互作用),ANGLE为键角集合,a为两键矢量之间的夹角,a0为平衡状态下键角,ka为键角的强度;Etorsion为正常二面角贡献项(1-4相互作用),采用余弦函数的形式描述,TOR为正常二面角集合,MUL为二面角多样性集合,τ为正常二面角,m为多样性,Vm,τ为二面角τ对应于多样性m的势垒高度,γm,τ为二面角τ对应于多样性m的初始相位;Eelectrostatic为静电力(库仑力)贡献项,ES为静电作用力原子集合,qi为原子i的部分电荷,qj为原子j的部分电荷,ε为介电常数;Evdw为范德华力相互作用贡献项(6-12作用力),采用Lennard-Jones势描述,VDW为范德华作用力集合,rij为原子i与原子j之间的欧氏距离,参数Aij和Bij依赖于特定原子类型和相互作用的特征;Ehydrogen为氢键相互作用贡献项(10-12作用力),HB为氢键作用力集合,Cij和Dij依赖于相互作用特征;Eother为其它额外的能量贡献项。
[0063] 2)将力场模型转换为单位单纯形约束下的目标函数,并通过局部优化的方法获得其简化的势能模型。
[0064] 模型(I)中b,a,τ,rij等变量均为 个原子坐标 的函数,经过平移及旋转变换后问题维数为 给定肽链中所有原子坐标,可计算得到能量值。通常在生物学条件下,键长偏差小于 键角偏差小于2°。因此,考虑肽链分子的键长、键角均固定在平衡状态,设置Ebond=Eangle=Eother=0,可将其维数降至 其中为肽链分子中共价键总数, 为肽链分子中独立键角总数。与此同时,该简化过程也引入高价(最高12价)的非线性等式约束条件。为了消除高价非线性等式约束条件,设代入模型(I),可得到:
[0065]
[0066]
[0067]
[0068]
[0069]
[0070] 式中 为肽链二面角向量;N为肽链中二面角的自由度(即优化问题维数),NRES表示肽链长度(或残基)个数, 为第i个残基侧链二面角的个数;且满足 为第i个残基主链C–N–Cα–C四个原子之
间的二面角,ψi为第i个残基主链N–Cα–C–N四个原子之间的二面角,ωi为第i个残基主链Cα–C–N–Cα四个原子之间的二面角, 为第i个残基侧链第 个二面角变量。
[0071] 2.1)将力场模型转换为单位单纯形。
[0072] 设 其 中τt(t=1,2,...,N) 为 模 型(II)中 二面角变量,N为二面角自由度(即优化问题维数);则由模型(II)约束条件可知:
采用下列投影变换:
[0073]
[0074] 将模型(II)边界约束可行域一对一地映射成单位单纯形 将式(2)代入模型(II)可得:
[0075] min f3(x)=f2(2πNx1-π,2πNx2-π,...,2πNxN-π),x∈S. (III)[0076] 近一步,应用局部优化方法,得到以下松弛模型:
[0077]
[0078] 其中 为以x为初始点在模型(III)势能曲面上应用局部最小化算法得到的局优解。
[0079] 显然,模型(IV)为模型(III)松弛势能曲面,即min f3(x)=min f4(x)。
[0080] 为了获取势能函数低估模型,在抽象凸理论的基础上,引入以下定理。
[0081] 定理1:设 使得模型(III)目标函数f3:S→R满足:
[0082]
[0083] 其中 如果 则f3:S→R+在y∈S处的支y
撑函数h(x)为:
[0084]
[0085] 其中l=f3(y)/y, 索引集合Θ(l)={i:li>0}。
[0086] 证明:首先证明f3:S→R+为严格递增射线凸函数(SICAR)。
[0087] 考虑下列函数
[0088]
[0089] (i)根据引理3, 故 如果x1>x2,则g(x1)>g(x2),即 为严格递增函数;设 由式(5)可知g(x)=f3(x),即
f3:S→R+为严格递增函数;
[0090] (ii)定义f3y(λ)≡{f3(λy)|y∈S,λ∈(0,+∞)},设 有g(y)=f3(y),由式(5)可得出:
[0091]
[0092] 即(f3)y(λ)是在y∈S点关于λ∈(0,+∞)的凸函数。
[0093] 根据定义1,由(i)、(ii)可知:f3:S→R+为严格递增射线凸函数(SICAR);
[0094] 根据引理1,可知f3:S→R+在y∈S点的H-次微分为:
[0095]
[0096]
[0097] 基于凸分析理论可知 非空,且 其中:
[0098]
[0099]
[0100] 故:
[0101]
[0102] 将上式代入(8),得到在y点的支撑向量:
[0103]
[0104] 根据式(7)、(12),hy(x)为关于y点的支撑函数为:
[0105]
[0106] 证毕。
[0107] 推论1:设hy(x)为模型(III)f3(x)关于y点的支撑函数,则可得到:
[0108]
[0109] f3(x)=hy(x),x=y. (15)
[0110] 证明:由式(13)可知,
[0111]
[0112] 不失一般性,假定 根据式(12)可得出:
[0113]
[0114] 假设:
[0115]
[0116] 则对于 满足:
[0117]
[0118] 由于f3:S→R+为严格递增射线凸函数(ICAR),由函数的递增性可知:
[0119]
[0120] 特别地:当x=y时,由式(16)可知:f3(x)=hy(x).
[0121] 证毕。
[0122] 推论2:设y1,y2,...,yK∈S,则
[0123]
[0124] 为f3:S→R+的支撑函数族;则:
[0125]
[0126]
[0127] 证明:由推论1可知:
[0128]
[0129] 故可得到:
[0130]ξ
[0131] 设x=y ,ξ∈{1,2,...,K},由式(15)可知:ξ ξ ξ
[0132] f3(y )=h (y ). (22)
[0133] 另外,由式(21)可知:
[0134]
[0135] 由式(22)、(23)可知:
[0136] f3(yξ)=HK(yξ),ξ∈{1,2,...,K}. (24)
[0137] 证毕。
[0138] 定理2:设模型(III)目标函数f3:S→R满足式(3)。假设 则给定y∈S,
[0139]
[0140] 为模型(III)目标函数f3:S→R在 处的支撑弱函数。其中f4:S→R为模型(IV)目标函数,Θ(y)={i:yi>0}。
[0141] 证明:由于f4(x)≤f3(x), 故:
[0142]
[0143] 证毕。
[0144] 注:定理2表明 虽然不是松弛曲面f4:S→R的支撑弱函数,但仍然为模型(III)目标函数f3:S→R的下界估计曲面。
[0145] 定理3:给定下列势能模型:
[0146]
[0147] 其中f4:S→R为模型(IV)目标函数,M>0为常数。如果选取 式中 满足式(3),f3:S→R为模型(III)目标函数,则给定y∈S:
[0148]
[0149] 为模型(V)的支撑弱函数,式中Θ(y)={i:yi>0}。
[0150] 注:由于f5:S→R+仅仅是在模型(IV)f4:S→R上增加了常数项,故二者的最优解是等价的,又因为 故模型(III)、(IV)、(V)的最优解是等价的。
[0151] 推论3:设x1,x2,...,xK∈S,则
[0152]
[0153] 为模型(V)f5:S→R+的支撑函数族。式中 Θ(l)={i:li>0}。
[0154] 3)参数初始化:设置群体规模popSize,变异因子F为0.5,交叉概率CR为0.1,低估概率underFactor,常数M,支撑向量规模K=N+1,支撑向量阈值KT,初始群i
体 计算f5(x),i∈I。并设 其中
I={1,2,...,popSize}。
[0155] 4)对每一个目标个体xi∈S(i=1,2,…,popSize)作如下处理:
[0156] 4.1)任意选取三个个体{xa,xb,xc|a,b,c∈{1,2,...,popSize},a≠b≠c≠i};
[0157] 4.2)对{xa,xb,xc}执行变异操作 生成变异个体
[0158] 4.3)对目标个体xi和变异个体 执行交叉操作,生成测试个体
[0159] 4.3.1)设置j=1;
[0160] 4.3.2) j=1,2,...,N+1;其中randb(j)产生0到1之间的随机数;rnbr(i)产生1到N+1之间的任一个整数;
[0161] 4.3.3)j=j+1;
[0162] 4.3.4)如果j
[0163] 4.4)i=i+1;如果i
[0164] 5)对目标个体xi∈S和测试个体 逐个更新操作:
[0165] 5.1)设置i=1;
[0166] 5.2)查询包含 的子区域 计算 其中 为低估支撑面在 子区域中唯一的最优解, 为唯一对应于子区域 的支撑
向量矩阵对角项。
[0167] 为了查询给定区域的最优解,引入以下定理。
[0168] 考虑N+1维支持向量矩阵L:
[0169]
[0170] 假定L满足以下两个条件:
[0171] (I)
[0172] (II) 则 使得
[0173] 所有的局优解对应于满足上述两个条件的所有矩阵的集合,对于上述L的局优值d(L)和局优解xmin(L)可分别表示为:
[0174]
[0175] xmin(L)=d(L)Trace(L) (31)
[0176] 枚举所有满足条件(I)、(II)的矩阵L,可以得到 所有的局优解,其计算复杂度为 而且满足上述两个条件的矩阵L位于一个定向的无环图上,通过检查图的K-1叶节点V (对应于 的所有局优解)可发现满足条件(I)、(II)的所有组合,这样计算复杂度简化至O(N|VK-1|)),|VK-1|表示 局优解的数量;同时新的支撑向量lK且满足K-1 K K-1
(I)、(II)的矩阵L可从V 中刚删掉的叶节点得到(v=l 时可能导致V 某些叶节点不满K K
足(II)条件)。通过从旧节点中生成新的组合可创建一个树图T,假设T 为平衡树,在算法K
中保存整棵树结构可使计算复杂度降至logN+1(|V|)。而且, 在可行域S上每一个局u
优解 唯一确定一个子区域S(u=1,2,...,U),且子区域之间互不交叉,即:
[0177]
[0178] 对每一个子区域Su(u=1,2,...,U),有
[0179]
[0180]
[0181] 其中 为满足条件(I)、(II)的支撑向量矩阵。
[0182] 显然, 设 如果 则子区域Su肯定不会包含全局最优解,从而不必计算f5(x),x∈Su而将该区域可靠排除;另一方面式(32)也u
给出了f5(x),x∈S 相对廉价的下界估计值,当K→∞时,
[0183] 5.3)如果 转至5.9);
[0184] 5.4)如果K
[0185] 5.5)如果random(0,1)
[0186] 5.6)计算 其中 为给定区域的有效下界估计值;
[0187] 5.7)如果 转至5.9);
[0188] 5.8)计算 如果 则置 K=K+1,更新树结构TK;
[0189] 5.9)i=i+1;如果i≤popSize,转至5.2);
[0190] 6)置
[0191] 7)判断是否满足终止条件,如不满足转至步骤3);
[0192] 8)输出结果,退出。
[0193] 以脑啡肽为实施例,运用以上方法得到了其最优构象值为-11.7073Kcal/mol。脑啡肽稳态结构如图2所示,稳态结构下对应的24个二面角如图3所示。
[0194] 以上阐述的是本发明给出的一个实施例表现出来的优良优化效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈