组合样品库的设计方法和系统

申请号 CN200510030502.X 申请日 2005-10-13 公开(公告)号 CN100558948C 公开(公告)日 2009-11-11
申请人 亚申科技研发中心(上海)有限公司; 发明人 华新雷; 冯希臣;
摘要 本 发明 提供了一种设计组合样品库的方法,使人们可以最大程度地利用已有的知识或给定的假设来减少样品实验的次数或增加固定次数样品实验的有效信息量。本方法包括以下步骤:(1)提供组成样品的多个组分;(2)为每一组分提供变量,该变量在一定间隔取值;(3)为至少一个变量设定至少一个约束条件;(4)产生伪样品;(5)检测该伪样品,确定其是否为合格样品;(6)重复步骤(4)和(5),直至确定出至少一个合格样品。本发明的方法可避免样品设计时的系统偏差,高效准确。
权利要求

1、一种组合样品库的设计方法,包括以下步骤:
(1)提供组成该样品的诸个组分;
(2)为每一所述的组分提供一变量,该变量在一定区间内取值;
(3)为其中至少一个所述变量设定至少一个约束条件;
(4)产生伪样品;
(5)检验该伪样品,确定其是否为合格样品;
(6)重复步骤(4)和(5),直至确定出至少一个所述的合格样品。
2、权利要求1所述的方法中,组分变量的取值区间由经验知识确定。
3、权利要求1所述的方法中,约束条件是由经验知识确定的上述变量之间 的关系。
4、权利要求1所述的方法进一步包括确定合格样品比率的步骤,该合格样 品比率是用所述的合格样品数量除以所述的伪样品数量得出的。
5、权利要求1所述的方法中,伪样品是通过随机取样的方法产生的。
6、权利要求5所述的方法中,随机取样是一种蒙特卡罗模拟。
7、权利要求5所述的方法中,随机取样是通过利用具有某种概率分布的变 量值来完成的。
8、权利要求7所述的方法中,概率分布是均匀分布。
9、权利要求7所述的方法中,概率分布是非均匀分布。
10、权利要求9所述的方法中,非均匀分布是选自于如下一组中的一个或 多个:柏努利分布、贝它分布、X平方分布、指数分布、F分布、伽分布、高 斯分布、正态分布、非中心X平方分布、非中心F分布、二项式分布、负二项 式分布、多项式分布、帕雷托分布、柏松分布、学生t分布和萨利斯分布。
11、权利要求7所述的方法中,变量值是由随机数发生器随机产生的。
12、权利要求11所述的方法中,随机数字发生器是选自于一组线性同余发 生器、移转寄存序列发生器和准随机数字发生器。
13、一种提供指定数量的合格样品的样品库的方法,包括以下步骤:
(1)提供所需设计的样品的数量;
(2)提供组成所述样品的诸个组分;
(3)为每一所述组分提供一变量,其中该变量在一定区间内取值;
(4)为至少一个所述变量设定至少一个约束条件;
(5)产生伪样品;
(6)检验该伪样品,确定其是否为合格样品;
(7)重复步骤(4)和(5),直至达到(1)中所预定的合格样品数量。
14、权利要求13所述的方法中,组分变量的取值区间是由经验知识确定的。
15、权利要求13所述的方法中,约束条件是由经验知识确定的上述变量之 间的关系。
16、一种确定组合样品库中样品的最佳数量的方法,包括以下步骤:
(1)提供组成所述样品的诸个组分;
(2)为每一所述组分提供一变量,其中该变量在一定区间内取值;
(3)为至少一个所述变量设定至少一个约束条件;
(4)产生伪样品;
(5)从伪样品中确定出合格样品;
(6)确定出合格样品比率,该合格样品比率是用合格样品数量除以伪样品 数量得出的;
(7)决定样品数量;
(8)计算实验的最佳数量,其中,所述的最佳数量是所述合格样品比率与 所述样品数量的乘积。
17、权利要求16所述的方法中,变量取值区间是由经验知识确定的。
18、权利要求16所述的方法中,约束条件是由经验知识确定的上述变量之 间的关系。
19、一种设计组合样品库的系统,其包括:
(1)一种能提供组成所述样品的诸个组分的模
(2)一种能为每一所述的组分提供一变量,且该变量在一区间内取值的模 块;
(3)一种能为其中至少一个所述变量设定至少一个约束条件的模块;
(4)一种能产生伪样品的模块;
(5)一种能检验该伪样品以确定其是否为合格样品的模块;以及
(6)一种能确定出至少一个所述合格样品的模块。

说明书全文

技术领域

发明涉及一种高效的试验方法-高通量实验方法,更具体地讲,涉及其 中的组合样品库的设计领域。

背景技术

针对材料的许多特性,如热传导性、发光性、催化活性等,均可利用组 合材料的发现方法和系统,来鉴别新材料或优化已有的材料。目前的组合研 究方法在样品空间中通过格点搜索,‘用蛮’地合成大量的样品,然后根 据所需特性筛选这些样品。然而,这种方法几乎没有考虑样品有关组分的已 知的经验知识。即使考虑这样的经验知识,也缺乏适当的方法来设计在样品 空间中充分随机化了的样品库。
因此,有必要开发一种全新的组合实验设计体系和方法,以有效地将经 验知识整合到样品库设计中,而在此经验知识之外样品的取样则应是完全随 机的以避免人为因素的干扰。另外,我们需要知道需合成的样品是哪些、最 具代表性的样品的总数是多少等信息。

发明内容

本发明的目的在于提供一种全新的组合实验设计体系和方法,以有效地 将经验知识整合到样本库的设计中。
本发明提供了一种可整合经验知识来设计组合样品库的方法。具体地, 这种经验知识可体现为样品的诸个组分、与组分相关的诸个变量以及这些变 量的约束条件。
本发明同时提供了一种包括以下步骤的设计样品库的方法:
(1)提供目标样品中的组分;
(2)为每一组分设定变量;
(3)为上述变量设定至少一个约束条件;
(4)产生伪样品库;
(5)选取伪样品中满足约束条件的合格样品;
在一实施方案中,变量的约束条件是由经验或以前已知知识决定的变量 之间的关系。在又一实施方案中,经验知识是由变量表示的物理或化学自然 定律。
在一实施方案中,伪样品可通过随机取样产生。在一实施方案中,上述 的随机取样是通过采用一组变量,其中每个变量对应一个组分并且在一定间 隔内随机取值,来进行的。随机取样的一个例子包含蒙特卡罗(Monte Carlo) 模拟。在又一个某实施方案中,随机取值是由通过随机数字发生器产生的。 在又一实施方案中,随机取值与概率分布或概率密度相关。该概率分布是均 匀分布(uniform distribution)或非均匀分布。其中,非均匀分布包括柏努利 分布(Bernoulli distribution)、贝它分布(beta distribution)、X平方分布 (Chi-square distribution)、指数分布、F分布、伽分布、高斯分布(Gaussian distribution)、正态分布(例如对数正态、多变量正态分布和单变量正态分布)、 非中心X平方分布、非中心F分布、二项式分布、负二项式分布、多项式分 布、帕雷托分布(Pareto distribution)、柏松分布(Poisson distribution)、学 生t分布和萨利斯分布(Tsallis distribution)。概率分布包括均匀分布、正态 分布和高斯分布。
本发明的又一方面提供了一种在样品库中得到所需数量的样品的方法, 该方法包括以下步骤:
(1)提供组成样品的诸个组分;
(2)为每一组分设定一个变量;
(3)为变量设定至少一个约束条件;
(4)提供样品的所需数量;
(5)产生随机的伪样品;
(6)根据伪样品的变量是否满足约束条件,确定该伪样品是否为合格样 品;
(7)重复步骤(5)和(6),直至合格样品的数量达到所需数量。
再一方面,本发明提供了一种测算需要进行设计和/或合成的样品最佳数 量的方法,该方法包括以下步骤:
(1)提供组成样品的诸个组分;
(2)为每一组分设定一个变量;
(3)为变量设定至少一个约束条件;
(4)在给定区间为每一变量提供所需的分割段;
(5)产生伪样品;
(6)选择满足约束条件的伪样品作为合格样品;
(7)由合格样品数量除以伪样品数量确定出合格样品比率;
(8)计算样品的数量;以及
(9)确定样品的最佳数量,其中,样品的最佳数量可通过用样品的数量 乘以合格样品比率计算而得。
该方法进一步包括确定由合格样品数量除以伪样品数量得出合格样品比 率的步骤。
另一方面,本发明也提供了一种包含计算机软件的计算机产品。该计算 机软件一旦运行,即可执行本发明的方法和计算。例如。该计算机软件可以 进行随机取样。
附图简介
图1是通过蒙特卡洛模拟方法产生的二组分样品示意图,每一样品由铈 (Ce)和(Fe)组成。图中所有圆点(包括空心、灰色、黑色)代表由各自均匀 分布的、独立随机产生的铈变量和铁变量构成的伪样品;铈变量和铁变量之 间没有任何约束。图中灰点和黑点代表满足第一约束条件的伪样品。黑点代 表同时满足第一和第二两个约束条件的伪样品(详细描述参考实施例1)。
图2是通过蒙特卡洛模拟方法产生的四组分样品的三维图,每一样品由 铈(Ce)、铁(Fe)、钨(W)和镍(Ni)组成。所有点代表由四变量各自均匀分布的、 独立随机产生的伪样品,其间没有任何约束。
图3是图2中满足第一约束条件的伪样品示意图。
图4是图3中进一步满足第二约束条件的伪样品示意图。
图5是允许使用者设计多组分样品库的图形用户界面(GUI),其为每一 组分提供一变量、变量的范围和所需的分隔段。
图6是选定一组分和相应的变量后给出的图形用户界面
图7是允许使用者对变量规定一个或多个约束条件的图形用户界面。
图8所示的图形用户界面允许使用者选择1)是否执行蒙特卡洛模拟方 法;2)如何执行蒙特卡洛模拟方法。
图9所示的图形用户界面允许使用者输入指定的需要获得的样品数以及 输入样品的指定的组分数。
图10所示的图形用户界面允许使用者指定每一组分。
图11所示的图形用户界面允许使用者用变量来定义约束条件。
图12所示的图形用户界面允许使用者指定约束条件公差。

具体实施方式

本发明涉及一种组合样品库的设计策略以便根据样品性质来设计、合成、 筛选并测量样品库。
本发明的一个方面提供了样品库的设计方法,包括提供样品的多个组分。 这里所说的“组合样本库”是指包括多个样品的集合,“样品”是指包含多种 组分的材料。“组分”是指一种物质,包括如元素、分子、化合物、物质、物 等,或这些物质的组合。
在本发明的一实施方案中,某样品包括n种不同的组分,C1、C2、 C3...Ci...Cn,其中n是整数,指样品中不同组分的数量。每一组分Ci所具有 的质量表示为MWi,其中i∈{0,1,2...n},样品中组成数量表示为Xi,相应 组成比率表示为Ri。质量MWi指该组分的分子量或原子量。所谓的组成数 量Xi是指样品中第i个组分的数量,因此该样品可表示为 (C1)X1(C2)X2...(Ci)Xi...(Cn)Xn,其中i∈{0,1,2...n},组成比率可以表征为样品 中一种组分的相对重量数量,其可用公式1表示:
R i = ( MW i × X i ) Σ i = 1 n MW i × X i 公式1
组成数量Xi也可以指样品中第i个组分的摩尔比率。在这种情况下,组 成比率也可以表示为样品中某一组分的摩尔分数,其取值在0到1之间,可 由以下公式2予以定义:
R i = X i Σ i = 1 n X i 公式2
组成比率还可进一步表示为样品中某一组分的百分比,其取值在0%到 100%之间。
在库的任何样品中,所有组分的全部组成比率之和为1。如公式3所示:
Σ i = 1 n R i = 1 公式3
例如,葡萄糖分子C6H12O6可看作是包含三个组分的样品:元素(C)、氢 元素(H)和元素(O),每一组分有组成数量,如C的是6,H的是12,O的是6。 每一组分的物质质量(MW)可以由各原子质量得出,C是12,H是1,而O 是16。因此,C的(重量)组成比率是0.4或40%,(12*6/(12*6+1*12+16*6)); H是0.067或6.7%;O是0.533或53.3%.三个组分的组成比率的总和是1。
组合样品库的另一特征是,样品库中每一样品都由相同类型的组分组成, 但这些组分具有不同的组成比率。
本发明另一方面提供的组合样品库的设计方法包括为多组分样品的每一 组分提供一个变量。换言之,变量与样品中组分一一对应。假设变量V是在 区间[Vmin,Vmax]中的一随机值,其中Vmin不小于0,Vmax不大于1,并且Vmin ≤Vmax。在一实施方案中,该区间为[0,1]。如果假设变量V为离散区间 {V1,V2,...Vx}的中的值,则V可以是离散的,其中该离散值落在区间[Vmin, Vmax](如[0,1])中。如果设定V是区间[Vmin,Vmax]的随机值,则其可以是连续 值。当变量与组分相关而无任何约束条件或与其它变量均无关,则第一变量 随机值的设定不受第二变量假定的约束。如果变量是连续的,则从同一变量 的区间内设定随机值的过程,取决于该变量可能取值的分布概率或概率密度。 如果该变量是离散的,则随机值的设定取决于区间中各自的离散值的特定概 率。
例如,Vi是第一组分Ci的变量,Vj是组分第二Cj的变量。Vi可设定为 [Vi,min,Vi,max]区间的随机值,Vj可设定为[Vj,min,Vj,max]区间的随机值, Vi取值与Vj无关。当Ci、Cj是由C1、C2、...Ci、...Cj、...Cn组成的样品中 的组分,其中I,j∈{0,1,2...n},该合成变量Vi变成了组分Ci的组成比率Ri, 合成变量Vj变成了组成比率Rj,而样品中所有组分的变量总和满足以下公式 4:
Σ i = 1 n V i = 1 公式4
本发明的另一方面在于:在所提供的组合样品库的设计方法中为样品中 的至少一个变量提供或设定至少一个约束条件。“约束条件”一词指至少一变 量的条件或者变量之间的关系。特别是,约束条件是样品中一变量或多个变 量必须满足的限制条件。换言之,在有效或合格的样品中一组取值{Vi}的变 量必须满足至少一个约束条件或一组特定的约束条件。例如,假定样品包括 组分C1、C2...Cn,且每一组分Ci具有变量Vi,其中i∈{0,1,2...n},那么, 在有效样品中,组分变量的总和必须满足以下约束条件,公式5:
1 - Δ Σ i = 1 n V i 1 + Δ 公式5
其中Δ是误差(如约束公差或约束偏差),Δ是0到0.2之间变化的值。在 优选的实施方式中,Δ是0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,或 0.10。当Δ逼近0,该约束逼近如公式5中所示等式。
另外,样品库设计中,关于样品的组分的经验知识可以体现为多个变量 之间的关系,也可以理解为约束。换言之,我们可以通过设定约束来实现经 验知识中的若干个组分之间的关系。例如,根据之前的经验,由C1、C2...Cn 组成的样品中,也许Ci与Cj的组成比率之比应该为2∶1,其中i ∈{0,1,2...n}, j∈{0,1,2...n},且i≠j。此时,除公式4所示的固有的约束外,一有效样品 的组分的变量必须满足第二约束Vi∶Vj=2∶1。再例如,要达到Ci和Cj的组 成比率之和是x,其中x是0到1之间的值。此处,一有效样品的组分的变 量必须满足第二约束Vi+Vj=x,其中i,j∈{0,1,2...n}且i≠j。
本发明提供的组合样品库的设计方法包括产生伪样品。“伪样品”是指一 个多组分的假定样品,其每一个组分都有一个独立的变量使得某一个变量的 任意赋值是相对于另一个变量任意赋值的独立事件并且伪样品的全体变量都 不受任何约束条件的限制。换言之,其变量可以满足或不满足约束条件。例 如,一伪样品包括C1、C2...Ci,...Cj,...Cn,其中i,j ∈{0,1,2...n}且i≠j,Vi 和Vj是[0,1]区间中的随机值,Vi可取[0,1]间的某一个值,Vj可取[0,1]间 的另一个值。这些变量值的和无需符合公式4和5的要求。
伪样品可以对应也可不对应一个真实的物理样品,伪样品是没有任何约 束的独立的假定变量取值的样品点。因此大量的伪样品组成一个样品空间。
伪样品可采用随机取样来产生。随机取样方法是一种通过为一个样品点 的每个组份随机赋值来产生样品点的方法。在区间[Vmin,Vmax]中产生随机数 值的方法是明确的,其中Vmin不小于0,且Vmax不大于1。请参考Carter的《随 机数字的产生和应用(第四维)》(“The Generation and Application of Random Numbers(Fourth Dimensions)”,Vol.XVI,1994)。随机数生成器的算法和计算程序 是计算机科学领域所熟知的,请参考D.E.Knuth的《计算机程序的艺术-半数 值算法》(第2卷,阿狄森-韦斯利第二版,1981年出版)(“The Art of Computer Programming-Seminumerical Algorithms”Vol.2,2nd Ed.Addison-Wesley,1981);Press等 著的《数值法处方-科学计算的艺术》(“Numerical Recipes:The Art of Scientific Computing”Cambridge University Press,1986;及“Numerical Recipes(FORTRAN)”, 第191-225页,1988);以及S.L.Anderson所著《在向量超型计算机和其它先进体 系上的随机数生成器》(“Random Number Generators on Vector Supercomputers and Other Advanced Architectures”,SIAM Rev,,32:221-225,1990年)。
随机产生的数值是事件的发生或在特定区间[Vmin,Vmax]中的可能赋值的 变量(V),其中该事件发生的概率取决于该变量的概率密度或概率分布。因此, 变量进一步由概率函数对变量间隔所包含的值的赋值来定义。例如,离散变 量可通过给区间中的每一离散值指定相关概率来定义。连续变量可通过给包 括所有变量可能取值的区间指定概率分布来定义。
这里所采用的概率分布指反映其观测或理论出现频率的变量取值的排 列。该技术领域中熟知的概率分布包括均衡分布和非均衡分布。非均衡分布 包括柏努利分布、贝它分布、X平方分布、指数分布、F分布、伽马分布、 高斯分布、正态分布(例如,对数正态、多变量正态分布和单变量正态分布)、 非中心X平方分布、非中心F分布、二项式分布、负二项式分布、多项式分 布、帕雷托分布、柏松分布、学生氏t分布、萨利斯分布以及以上分布的任 意联合。
在一实施方案中,随机变量由非均衡概率分布赋值,例如,包括正态分 布、柏松分布和高斯分布。在另一实施方案中,变量的随机产生值由均衡分 布赋值或与其相关,因此,均衡分布的随机变量可在区间[Vmin,Vmax](Vmin ≥0,Vmax≤1)以相同概率假定任何随机值。
本领域一般技术人员可知,非均衡分布随机值(或数)可通过随机数字发 生器产生(如线性叠合发生器)。该线性叠合发生器的一般公式是Vi=(aVi-1+c) mod m,其中a、c和m是预先设定的常数,a是乘数值,c是增量,m是系 数。请参考Park和Miller的《随机数字发生器:好的难找》(“Random Number Generators:Good Ones are Hard to Find”,Comm.ACM 31:1192-1201,1988)。随机数字 发生器包括Kirkpatrick和Stoll所著的《快速移转寄存器序列随机数字发生器》 (“A Very Fast Shift-Register Sequence Random Number Generator”,Journal of Computational Physics 40:517-526,1981)中所描述的移转寄存器序列。此外,随机 数字发生器也包括准随机的数字发生器,请参考Press和Teukolsky的《准随机 数》(“Quasi Random Numbers”,Computers in Physics 3:76-79,1989)。
非均衡分布随机值,如正态分布或高斯分布随机值,也可通过相关领域 熟知的方法产生。请参考鲁宾斯坦《模拟和蒙特卡罗方法》(Rubinstein, “Simulation and the Monte Carlo Method”由John Wiley & Sons出版1981年)。方法 之一包括转化函数,如著名的博克士墨勒转换,用以将均衡分布随机变量转 换成新一组非均衡分布的随机变量(例如,高斯或正态分布),请参考博克士 墨勒的《随机偏离产生的一个注释》(Box & Muller,“A Note on the Generation of Random Deviates”,Annals Math.Stat.29:610-611,1958)。
在一实施方案中,随机取样方法包括蒙特卡罗方法或模拟。这里的“蒙 特卡罗方法”或“蒙特卡罗模拟”一词指随机技术的一种或用来研究问题并 获得解决问题概率近似值的随机取样方法。特别地,这里所用的“蒙特卡罗 方法”或“蒙特卡罗模拟”一词特别是指产生随机事件的过程(如任意给定变 量的随机发生值)。该过程通常通过计算机运算法则达成,该过程重复多次, 且分析和计算所有的试验结果用以提供近似解答。蒙特卡罗模拟请参考米特 罗泊勒斯和乌拉姆的《蒙特卡罗方法》(美国统计协会期刊44:335-341,1949 年)(Metropolis and Ulam,“The Monte Carlo Method”,Journal of American Statistical Association 44:335-341 1949);寿柏尔的《蒙特卡罗方法》(Sobol,“The Monte Carlo Method”,The University of Chicago Press,1974);穆尼的《蒙特卡罗模拟》(Mooney, “Monte Carlo Simulation”,Sage University Paper,1997)。
蒙特卡罗方法在本领域不断得到发展。例如,该方法最初应用于通过在 标准坐标(被正方形外切的一圆周)上投掷飞镖估计π的数值上。通过大量 试验,发现飞镖击中圆周与正方形的数量分别与圆周面积和正方形面积成比 例,并具有相当的精确度。相应地,飞镖击中圆周和正方形次数的比率近似 于π值的分数,请参考罗斯《概率第一课》(Ross,“AFirst Course in Probability” 2nd Edition,Macmillan,1976)。
另一例子,蒙特卡罗模拟可应用于估计以下积分公式6:
N = i , min i , max V ( x ) dx 公式6
在该例中,函数V(x)周围有一范围框,V(x)的积分可理解为范围框中在 V(x)的部分。如果范围框中点的选取随机且非均一,那么点位于V(x)中的概 率则由V(x)在框中所占的面积部分确定。蒙特卡罗模拟于是在框中产生大量 随机点(随机发生值)并计算V(x)中点的数量以获得面积。作为结果,公式6 的积分可表达为以下公式7:
N A B C 公式7
其中A是V(x)中点的数量,B是框中产生的所有点的数量,C是范围框 的面积。另外,比率A/B与V(x)在范围框中相对所占面积比例相关。
蒙特卡罗模拟的另一实例包括生成由经验知识加以侧重的随机变量值。 例如,关于组分(或组分比率)的经验知识要求赋予变量在不同的特定区间以 不同的概率密度(连续变量),或要求赋予变量在不同的值以不同的取值概率 (离散变量)。另一蒙特卡罗模拟的例子包括马尔可夫链运算。马尔可夫运算 是一个随机值序列,它的每一事件发生的概率依赖于产生于前一时刻的值。 请参考弗兰克和史密斯的《了解分子模拟:从算法到应用》(Frenkel & Smith, “Understanding Molecular Simulation:From Algorithm to Applications”Academic Press, 1996)。
本发明另一方面是关于从伪样品中选择合格样品的方法。这里的“合格 样品”一词指通过本发明中所述方法所产生的,变量满足一个或多个特定约 束的伪样品,非合格样品的伪样品被称为不合格样品。本发明一个实施例中, 伪样品通过随机取样方法产生(如蒙特卡罗模拟),即在大量试验中,在区间 [Vmin,Vmax](Vmin≥0且Vmax≤1)中按均匀分布随机产生的值被赋予给若干组 分变量,以产生不受任何约束的伪样品。每一伪样品通过检查(考察),譬如 用一个计算机算法,被判定其是否满足特定的一个或多个约束。挑选满足约 束的伪样品作为合格样品存储起来。同时,与每一合格样品相关的诸个值被 记录成一个矢量,并与组分比率对应起来,以便在样品库中合成和设计合格 样品,因为在合格样品中,该些值正是诸组分比率。
本发明的另外一个方面为在样品库产生给定数量的样品提供了一种方 法。该方法包括以下步骤:
(1)提供组成样品的若干组分;
(2)赋予每一个组分一变量;
(3)为变量设定至少一个约束条件;
(4)提供所需要的样品数量;
(5)产生伪样品;
(6)如果伪样品的变量满足该约束条件,确定该伪样品为合格样品;
(7)重复步骤(5)和(6),直至合格样品数量达到所需数量。
本发明另一方面揭示了一种计算合格样品比率的方法,这里的“合格样 品比率(Rqs)”一词是指,在随机取样方法中,变量满足一个或多个约束的伪 样品的比例。在一实施方案中,合格样品比率(Rqs)可以由随机取样方法中合 格样品数量(Nqs)除以伪样品数量(Nps)来估计(公式8)。
R qs Nqs Nps 公式8
当Nps增大,计算精确度变小,变化规则跟从以下公式9:
Accuracy ~ ± 1 N 公式9
其中N是随机模拟(如蒙特卡罗)试验数量。当进行了大量蒙特卡罗模拟 试验后,随着1/N不断减少,合格样品比率变动减小且精确度增加。换言之, 当进行足够数量的试验后,合格样品的比率可达到相当高的精确度和准确度。 例如,就约束条件 1 - Δ Σ i = 1 n V i 1 + Δ , 蒙特卡罗模拟的样品(Vi)越多,精确度越 高。
在一实施方案中,在采用微软的随机数字发生器(C++编译器7.1.3091版, 2003年)产生随机数字函数的蒙特卡罗试验操作中,观测到获得一个合格样 品(如Nqs=1)的计算的精确度达到-100%到100%;当Nqs达到10时,其精确度 在-30%到30%之间;当Nqs达到102,其精确度在-10%到10%之间;当Nqs 达到103,其精确度在-3%到3%之间;当Nqs达到104,其精确度在-1%到1% 之间。
另一方面,本发明还揭示了估计合格样品最佳数量的方法。这里的“合 格样品最佳数量”一词指,满足特定一个或多个约束且能恰当地表现样品空 间的随机取样的样品数。
在本发明一实施方案中,合格样品最佳数量通过检测所有由离散变量产 生的可能的伪样品并识别满足特定约束的伪样品来获得。对于到离散变量, 通过将区间[Vi,min,Vi,max]分割(均匀或非均匀地)成M部分或格赋予特定变 量Vi来产生一组离散值,从而产生一组该区间的定义值。如果区间被均匀分 成M部分,变量的离散值可为{Vi}中任意值,其中Vi-Vi,min+l*(Vi,max-Vi, min)/Mi,l∈{0,1,2,...M}。M是正整数且可以是1到1,000,000之间的任意 数。在一实施方案中,M∈{1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16 17, 18,...20..25...30...40..50..102.103..104..105.106}。
如果变量仅设定为区间中的离散数值,伪样品(Z)的总数可由变量的特定 格子的数量产生。例如,在任意包含组分C1、C2...Cn的样品中,每一组分 Ci具有变量Vi,其中i∈{0,1,2...n},每个Vi被分隔成Mi部分或格子或点, 因此Vi取在区间[Vmin,Vmax](Vmin≥0且Vmax≤1)的一组离散值。根据我们 对组分所对应的变量的经验来确定这种分隔,它可以是均匀的分段或非均匀 的分段。如果不考虑或没有提供变量的约束条件,基于一组{Mi}的伪样品总 数量(Z)代表了n维样品空间的样品点,Z可以由以下公式10计算得出:
Z = Π i = 1 N M i 公式10
当给定至少一个约束时,可以检测所有伪样品,选出变量满足该约束的 伪样品并存储到矢量中构成合格样品集。当全部样品空间(整个Z个伪样品) 被检测后,合格样品的数量,亦即上述矢量的数目,就是对应于给定一组离 散值的样品空间中合格样品的最佳数量。
如果有关组分(或变量)数量增多,且每个组分的分段数量也增加,则通 过样品空间的完全搜寻会变得相当繁重。例如,对一个由五个组分且每组分 变量的每一特定区间被分隔成100格所构成的样品库,样品空间是五维空间, 所有伪样品(Z)的总数是1005(或1010,10,000,000,000)。当引入一个或多个约 束,计算会变得更复杂。尽管可通过检测每一伪样品来识别其是否满足该一 个或多个约束,但可采用另一方法,即通过进行这里所述的随机取样(如蒙特 卡罗模拟)来提供最佳数值的近似估计。
因此,在一实施方案中,我们通过随机模拟产生伪样品,检测该伪样品 是否满足所述约束,根据本发明所述的方法获得合格样品和合格样品比率。 在该随机模拟中,随机数可以是基于一组离散值来产生的,其中每一离散值 位于变量所假定的区间中并具有一定的概率。随机数也可以是对应某一区间 的具有特定概率分布的任意取值。因此,合格样品的最佳数量取决于Z与 Rqs的乘积。可以预期,合格样品的最佳数量会有变动,这取决于一组参数。 该参数的举例包括样品中变量分割(M)数、产生随机数字的方法、变量的统 计分布状态、蒙特卡罗模拟方式、蒙特卡罗试验次数、变量约束、公差限制 以及所需的准确度或精度
可以理解,随机取样(如蒙特卡罗模拟)与概率分布相关的随机数的产 生,根据本发明所提供方法所作的合格样品的选择与计算,通常都是通过计 算机系统或服务器系统来执行的。
本发明中的计算机系统(如服务器系统)是指设计并配置成用于执行本发 明所描述的部分或全部方法的计算机或计算机可读媒体。这里采用的计算机 (如服务器)可以是任何多种类型普通用途的计算机,如个人电脑、网络服务 器、工作站或现今或日后发展的其它计算机平台。本领域所熟知的,计算机 特别地包括有如处理器、操作系统、计算机存储器、输入设备以及输出设备 这些部件的部分或全部。计算机可进一步包括如高速缓冲存储器、数据备份 单元以及一些其它设备。本领域一般技术人员可以理解,这些计算机部件可 以有许多其它可能的构造。
这里所采用的处理器可包括一个或多个微处理器、可域编程逻辑阵列, 或一个或多个对应于特种应用的专的集成电路。举例说,处理器包括但不 限于英特尔公司的奔腾系列处理器、Sun公司的微处理器、Sun公司的工作 站系统处理器、摩托罗拉公司的个人台式机处理器、MIPS科技有限公司的 MIPs处理器、Xilinx公司的最高系列可域编程逻辑阵列以及其它一些处理器。
这里所采用的操作系统包括机器代码,通过处理器的执行,能协调和执 行计算机内其它部分的功能,且帮助处理器执行可能用多种程序语言编写的 不同计算机程序的功能。除管理计算机中其它部分的数据流之外,操作系统 也提供调度安排、输入输出控制、文件数据管理、内存管理和通讯控制以及 相关服务,所有这些都是现有技术。典型操作系统包括如微软公司的视窗操 作系统、由诸多供应商提供的Unix或Linux操作系统、另外一些或将来发展 的操作系统,以及这些操作系统的组合。
这里所采用的计算机存储器可是任意不同类型的记忆存储装置。例如包 括随处可见的随机存取存储器、永久性硬盘或磁带等磁介质存储、读写激光 唱盘等光学介质,或其它存取存储装置。记忆存储装置可以是任意一种现有 或将来发展的装置,包括激光唱盘驱动器、磁带驱动器、可移动硬盘驱动器 或磁盘驱动器。这些类型的记忆存储装置一般是从计算机程序存储介质中读 取或写入到该介质中,如光盘、磁带、可移动硬盘或软盘。所有这些计算机 程序存储介质都可以被认为是计算机程序的产物。这些计算机程序的产物通 常存储计算机软件程序和/或数据。计算机软件程序一般被存储在系统存储器 和/或记忆存储装置中。
本领域一般技术人员很容易了解到,本发明中的计算机软件程序可以通 过用某种输入设备来载入系统存储器和/或记忆存储装置中从而执行。另一方 面,所有或部分该软件程序也可存在于只读存储器或类似的记忆存储装置中, 这样的装置不需要该软件程序首先通过输入装置被载入。相关领域的一般技 术人员可以理解,该软件程序或其某些部分可以通过现有方式由处理器来载 入至系统存储器或高速缓冲存储器或二者的结合,以利于执行和进行随机取 样。
在本发明一实施方案中,软件被存储在计算机服务器中,该计算机服务 器通过数据线、无线线路或网络系统与使用终端、输入设备或输出设备连接。 本技术领域一般熟知的,网络系统包括在计算机或装置中电性连接在一起的 硬件和软件。例如网络系统可包括互联网、10/1000以太网、电气电子工程 协会802.11x、电气电子工程协会1394、xDSL、蓝牙、局域网、无线局域网、 GSP、CDMA、3G、PACS或任何其它ANSI认可标准的介质基础上的设备。
前面已经对本发明进行一般描述,接下来例举一些特定的实施例进一步 描述,以助了解本发明。
实施例1
本实施例显示如何从蒙特卡罗模拟方式产生的由两个组分(铈和铁)组成 的伪样品中选择合格样品。铈的变量VCe在0到1之间取值,铁的变量VFe 同样也是在0到1之间取值。蒙特卡罗模拟采用均匀分布的随机产生的0到 1之间的VCe和VFe值来进行,该模拟中VCe的随机产生值与VFe的随机产生 值相互独立。且在该模拟中,VCe和VFe并无任何关系或约束的强制限定。蒙 特卡罗模拟的结果是产生了伪样品群。如图1中所示点(包括空心、灰色和 深色)的全部构成伪样品集合。
我们可以利用经验知识来减少合格样品的数目,这是通过引入约束条件 实现的。第一约束条件定义为0.2<VCe<0.8且0.2<VFe<0.8。当选择过程考虑 了第一约束后,选择出的一组伪样品显示为如图1所示的黑点或灰点。第二 约束定义为1-Δ<VCe+VFe<1+Δ,当在第一约束条件的基础上进一步考虑到 该第二约束条件,选择出同时满足两个约束条件的一组伪样品显示为如图1 所示的黑点。
因此,在设计由Ce和Fe组成的样品库时,该蒙特卡罗模拟通过该两个 约束将经验引进了设计,并得到了设计样品库的确定信息。如,既然满足两 个约束的伪样品数量相关的数字已知,那么合格样品的数量可以知道。如表 I中所示,我们可知各个合格样品的组分比率。表I显示通过蒙特卡罗模拟产 生的伪样品值,以斜体字显示数字是满足第一约束的伪样品值,方框中的数 字是满足第一和第二约束的伪样品值。
若变量由特定格点分割,样品的最佳数量可根据本发明所提供的方法获 得。
表I蒙特卡罗模拟中的VCe和VFe的值
Fe          Ce
0.040000    0.160000
0.120000    0.340000
0.440000    0.120000
  0.620000    0.340000
0.160000    0.040000
0.460000    0.020000
0.460000    0.040000
0.460000    1.000000
0.560000    0.060000
0.860000    0.040000
0.960000    0.020000
0.000000    0.180000
0.000000    0.500000
0.000000    0.720000
0.320000    0.560000
0.520000    0.580000
0.540000    0.380000
0.600000    0.000000
0.720000    0.520000
0.760000    0.140000
1.000000    0.260000
1.000000    0.760000
0.180000    0.020000
0.280000    0.080000
0.360000    0.240000
0.660000    0.240000
0.740000    0.480000
0.820000    0.620000
0.820000    0.660000
0.840000    0.440000
0.960000    0.220000
0.560000    0.340000
0.820000    0.740000
0.820000    0.780000
0.860000    0.320000
0.040000    0.620000
0.060000    0.460000
0.120000    0.880000
0.180000    0.280000
0.320000    0.880000
0.420000    0.880000
0.480000    0.220000
0.680000    0.240000
0.940000    0.680000
0.020000    0.960000
0.020000    0.980000
0.520000    0.940000
0.720000    0.980000
0.740000    0.740000
0.760000    0.580000
0.820000    0.940000
0.840000    0.740000
0.880000    0.320000
0.880000    0.360000
0.980000    0.320000
0.980000    0.340000
0.540000    0.840000
0.180000    0.580000
0.240000    0.980000
0.340000    0.920000
0.380000    0.520000
0.760000    0.760000
0.880000    0.580000
0.980000    0.520000
0.280000    0.620000
0.360000    0.820000
0.560000    0.840000
0.860000    0.880000
0.560000    0.960000
0.780000    0.780000
0.860000    0.920000
0.880000    0.760000
0.580000    0.860000
0.680000    0.960000
0.720000    0.500000
0.240000    0.200000
0.240000    0.400000
0.240000    0.600000
0.340000    0.400000
0.440000    0.200000
0.540000    1.000000
  0.720000    0.240000
0.740000    0.060000
0.740000    0.600000
0.100000    0.560000
0.100000    0.640000
0.200000    0.160000
0.400000    0.220000
0.400000    0.520000
  0.400000    0.600000
0.400000    0.760000
0.500000    0.320000
0.500000    0.700000
0.500000    0.740000
0.500000    0.980000
  0.600000    0.420000   0.600000    0.440000
0.600000    0.780000
0.700000    0.120000
0.700000    0.840000
0.800000    0.140000
0.800000    0.280000
0.900000    0.800000
0.060000    0.200000
0.360000    0.100000
0.360000    0.200000
0.460000    0.700000
0.560000    0.500000
0.860000    0.100000
0.860000    0.600000
0.960000    0.700000
0.380000    0.100000
0.380000    0.700000
0.480000    0.800000
0.580000    0.600000
0.120000    0.080000
0.520000    1.000000
0.720000    1.000000
0.920000    0.020000
0.020000    0.180000
0.620000    0.160000
实施例2
本实施例显示如何从蒙特卡罗模拟方式产生的由四个组分(铈、铁、钨和 镍)组成的伪样品中选择合格样品。铈、铁、钨和镍的变量VCe、VFe、VW、 VNi都在0到1之间取值。蒙特卡罗模拟中我们对每个变量采用均匀分布的 随机产生的0到1的数值,该模拟中的随机产生值相互独立且不受任何约束 限定。蒙特卡罗模拟的结果为四维空间的样品点(伪样品),该四维样品点在 三维空间中的投影如图2中所示。
为选择对应于物理上真实的样品这里提出了第一约束条件,它定义为 VCe+VFe+VW+VNi=1。当选择过程中考虑到第一约束时,选择出的满足该第一 约束条件的一组伪样品(第一伪样品)显示在图3中。
假想某种经验使我们得出结论说铈与铁的组分之和总是等于钨和镍的组 分之和,那么我们可以引入第二约束,它定义为VCe+VFe=VW+VNi。当在第一 约束条件的基础上进一步考虑到该第二约束条件,选择出的同时满足该两个 约束条件的一组伪样品(第二伪样品)被显示为分散在三围空间中的一个二维 平面上(如图4所示)。图4中所显示的该合格样品点是从二维平面的一侧观 测的。
因此,考虑到两个约束的该蒙特卡罗模拟提供了关于设计由四个组分组 成的、具备该两个约束的样品库的确定信息。例如,合格样品比率可通过用 伪样品全部数量去除满足两个约束的伪样品数量来计算。既然满足两个约束 的伪样品数量相关的数字已知,那么合格样品的数量可以知道。记录每一合 格样品中变量的组分比率,可知该合格样品的组分比率。若变量被特定格点 分割,样品的最佳数量同样可根据本发明所提供的方法获得。
在上述蒙特卡罗模拟中,获得全部28561个伪样品,其中460个满足第 一约束,47个同时满足两个约束,因此该伪样品满足两个约束的合格样品比 率是0.0016456。
实施例3
本实施例说明了允许使用者通过图形用户界面输入信息并执行计算和模 拟(包括蒙特卡罗模拟)以设计合格样品库的计算机程序。
如图5所示,图形用户界面允许使用者选择设计样品所需组分。例如, 一个由组分A、B和C组成的样品,组分A可以是从由(V)、铌(Nb)和钼(Mo) 组成的元素组中的任意一个,组分A的变量(Va)变化范围在0到1之间(请参 考图5中所示的0.00到1.00的范围),该变量变化范围被分成10部分(如图5 所示的10段)。其结果是,组分A被赋予在0到1之间取值的变量(Va)(请参 考图6),同样地,组分B和C也被赋予相应的变量(Vb和Vc)(请参考图6)。
作为将经验知识纳入取样设计的一种方式,图形用户界面允许使用者提 供指定一个变量或多个变量间的约束条件。变量Va、Vb和Vc默认的或第一 隐藏约束是Va+Vb+Vc=1±Δ。Δ是误差(或约束公差),且在本例中给定为 0.01(请参考图6)。所需的第二约束是Va∶Vb=2∶1,并通过图形用户界面输入(请 参考图7)。
图形用户界面进一步允许使用者决定如何估算合格样品的最佳数量。如 图8所示,图形用户界面提供六个不同准确级别的计算。在其中的精确计算 中,伪样品根据本发明所示的无任何约束的公式10所产生,然后由计算机检 测该伪样品并仅选择满足约束的部分。在该例子中,198个样品满足约束。 另外,还获得了所有198个合格样品的组分比率。
当计算精确度在-100%到100%之间时被认为是很低的,当其在-30%到 30%之间认为是低,在-10%到10%的精确度是中等,而在-3%到3%之间是高, 在-1.0%到1.0%之间则是非常高的精确度。
实施例4
本实施例显示了获得指定数量的合格样品点的计算机程序。该计算机程 序允许使用者通过图形用户界面输入信息并执行计算和模拟(包括蒙特卡罗 模拟),以此得出这些样品点中每一个样品点的诸组分比率。
图9显示图形用户界面允许使用者输入指定的总样品点125,其中每个 样品点都具有4个组分。图形用户界面也允许使用者指定想要的组分(请参考 图10),并定义变量的约束条件(请参考图11)。在定义约束公差后(请参考图 12),开始执行模拟试验,其间每一伪样品都检查是否满足所设约束。当合格 样品的数量达到125时停止模拟,以此得到125样品点中四个组分(元素Pd、 Pt、Ce和V)的组分比率(如表II所示)。
表II
Pd        Pt        Ce        V
0.039474  0.105263  0.039474  0.815789
0.065789  0.118421  0.144737  0.671053
0.078947  0.171053  0.684211  0.065789
0.052632  0.144737  0.776316  0.026316
0.078947  0.184211  0.684211  0.052632
0.013158  0.118421  0.723684  0.144737
0.026316  0.157895  0.697368  0.118421
0.039474  0.105263  0.723684  0.131579
0.052632  0.105263  0.407895  0.434211
0.052632  0.131579  0.697368  0.118421
0.065789  0.105263  0.552632  0.276316
0.065789  0.118421  0.381579  0.434211
0.065789  0.144737  0.381579  0.407895
0.013158  0.184211  0.407895  0.394737
0.026316  0.144737  0.552632  0.276316
0.039474  0.184211  0.381579  0.394737
0.052632  0.105263  0.355263  0.486842
0.065789  0.144737  0.210526  0.578947
0.013158  0.157895  0.815789  0.013158
0.039474  0.157895  0.644737  0.157895
0.078947  0.105263  0.671053  0.144737
0.105263  0         0.644737  0.25
0.184211  0         0.065789  0.75
0.065789  0.131579  0.421053  0.381579
0.078947  0.157895  0.302632  0.460526
0.078947  0.184211  0.447368  0.289474
0.105263  0         0.75      0.144737
0.184211  0         0.315789  0.5
0.026316  0.144737  0.539474  0.289474
0         0         0.302632  0.697368
0.039474  0.157895  0.407895  0.394737
0.078947  0.144737  0.026316  0.75
0.078947  0.144737  0.276316  0.5
0.052632  0.144737  0.552632  0.25
0.013158  0.026316  0.776316  0.184211
0.013158  0.092105  0.618421  0.276316
0.013158  0.092105  0.710526  0.184211
0.092105  0.092105  0.447368  0.368421
0         0.171053  0.526316  0.302632
0.039474  0.118421  0.75      0.092105
0.039474  0.013158  0.513158  0.434211
0.065789  0         0.092105  0.842 105
0.171053  0.013158  0.210526  0.605263
0.171053  0.039474  0.184211  0.605263
0.026316  0.013158  0.342105  0.618421
0.171053  0.026316  0.144737  0.657895
0.171053  0.092105  0.394737  0.342105
0.184211  0.013158  0.184211  0.618421
0.184211  0.092105  0.592105  0.131579
0.013158  0.052632  0.605263  0.328947
0.013158  0.078947  0         0.907895
0.039474  0         0.052632  0.907895
0.026316  0.092105  0.736842  0.144737
0.184211  0.052632  0.434211  0.328947
0.184211  0.092105  0.684211  0.039474
0.026316  0.013158  0.105263  0.855263
0.065789  0.026316  0.776316  0.131579
0.105263  0.039474  0.342105  0.513158
0.118421  0.131579  0.039474  0.710526
0.184211  0.013158  0.592105  0.210526
0.013158  0.013158  0.407895  0.565789
0.013158  0.039474  0.565789  0.381579
0.052632  0.026316  0.342105  0.578947
0.065789  0.092105  0.815789  0.026316
0.078947  0.013158  0.881579  0.026316
0.105263  0.052632  0.131579  0.710526
0.144737  0.026316  0.184211  0.644737
0.144737  0.092105  0.118421  0.644737
0.157895  0.184211  0.026316  0.631579
0.171053  0.092105  0.578947  0.157895
0.184211  0.026316  0.052632  0.736842
0.026316  0.039474  0.552632  0.381579
0.026316  0.092105  0.315789  0.565789
0.052632  0.026316  0.723684  0.197368
0.052632  0.052632  0.592105  0.302632
0.078947  0.092105  0.618421  0.210526
0.092105  0.052632  0.552632  0.302632
0.105263  0.026316  0.276316  0.592105
0.105263  0.052632  0.394737  0.447368
0.184211  0.078947  0.302632  0.434211
0.013158  0.078947  0.723684  0.184211
0.026316  0.065789  0.723684  0.184211
0.039474  0.039474  0.736842  0.184211
0.052632  0.065789  0.789474  0.092105
0.065789  0.039474  0.802632  0.092105
0.105263  0.026316  0.394737  0.473684
0.144737  0.092105  0.026316  0.736842
0.171053  0.039474  0.026316  0.763158
0         0.118421  0.355263  0.526316
0.092105  0.026316  0.236842  0.644737
0.184211  0.026316  0.302632  0.486842
0         0.105263  0.447368  0.447368
0.026316  0.065789  0.552632  0.355263
0.078947  0.026316  0.815789  0.078947
0.131579  0.052632  0.684211  0.131579
0.157895  0.039474  0.184211  0.618421
0.157895  0.052632  0.684211  0.105263
0         0.171053  0.789474  0.039474
0.013158  0.039474  0.144737  0.802632
0.052632  0.039474  0.473684  0.434211
0.052632  0.065789  0.723684  0.157895
0.065789  0.078947  0.789474  0.065789
0.092105  0.171053  0.736842  0
0.105263  0.065789  0.105263  0.723684
0.118421  0.013158  0.842105  0.026316
0.131579  0.078947  0.434211  0.355263
0.157895  0.026316  0.513158  0.302632
0.026316  0.078947  0.736842  0.157895
0.039474  0.052632  0.210526  0.697368
0.065789  0.013158  0.315789  0.605263
0.092105  0.078947  0.118421  0.710526
0.092105 0.078947 0.210526 0.618421
0.105263 0.039474 0.592105 0.263158
0.184211 0.013158 0.210526 0.592105
0        0.157895 0.223684 0.618421
0        0.184211 0.618421 0.197368
0.013158 0.078947 0.315789 0.592105
0.065789 0.078947 0.802632 0.052632
0.078947 0.026316 0.381579 0.513158
0.105263 0.065789 0.684211 0.144737
0.131579 0.013158 0.618421 0.236842
0.157895 0.092105 0.539474 0.210526
0.157895 0.144737 0.078947 0.618421
0.013158 0.118421 0.868421 0
0.105263 0.013158 0.223684 0.657895
本发明申请中所列论文和专利均是作为参考文献所援引的。上述例举的 实施方案中所涉及的描述,举例和数据仅作为演示和例证之用,并非限定本 发明的范围。任何根据本发明所做的非实质性修改加工皆落入本发明权利要 求范围内。因此,附件权利要求书的精神和范围不局限于本申请对该发明的 说明版本。
QQ群二维码
意见反馈