用于检测和校正实时PCR信号中的跳跃的方法和系统

申请号 CN201480071584.X 申请日 2014-12-29 公开(公告)号 CN105849736B 公开(公告)日 2019-08-13
申请人 豪夫迈·罗氏有限公司; 发明人 R.T.库尼克;
摘要 提供了用于检测和可能校正来自生长过程的数据中的跳跃误差或使其无效的系统、方法和装置。可以通过测定数据集的二阶导数并鉴定在二阶导数中具有相反符号的两个连续循环而鉴定跳跃误差。一旦已经检测到跳跃误差,则可以基于各种标准校正数据集或使其无效。是否无效或校正可以基于绝对跳跃高度、相对跳跃高度(例如,相对于净生长或相对于基线)、跳跃的绝对 位置 (循环数)或相对位置。在一种实施方式中,可以通过从跳跃后的点减去跳跃高度或通过将跳跃高度添加至跳跃前的点而校正跳跃。
权利要求

1.检测PCR(聚合酶链式反应)生长过程的PCR扩增曲线中的跳跃误差的方法,所述方法包括:
- 在计算机系统接收代表PCR扩增曲线的数据集,所述数据集包括多个数据点,每个数据点具有循环数和所述PCR生长过程在所述循环数的信号强度的一对坐标值;
- 通过所述计算机系统计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;
- 鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;
- 当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;并且- 基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表所述PCR扩增曲线的数据集中已经发生跳跃误差。
2.根据权利要求1所述的方法,其进一步包括:
- 确定所述第一值和所述第二值两者的大小是否大于一个或多个阈值,其中鉴定具有跳跃误差基于确定所述第一值和所述第二值两者的大小大于所述一个或多个阈值。
3.根据权利要求2所述的方法,其中所述阈值测试所述第一值和所述第二值对于二阶导数相对于其他值是否具有最高的大小。
4.根据权利要求1至3中任一项所述的方法,其中所述阈值是预定值。
5.根据权利要求1至3中任一项所述的方法,其中所述第一值是正的,且所述第二值是负的。
6.根据权利要求1至3中任一项所述的方法,其进一步包括:
- 确定所述跳跃误差的一种或多种特性;且
- 当所述跳跃误差的一种或多种特性满足一种或多种无效标准时,使所述数据集无效。
7.根据权利要求6所述的方法,其中所述一种或多种无效标准包括以下中的至少一种:
- 所述第一值和/或所述第二值的大小,和
- 所述跳跃误差的位置
8.根据权利要求7所述的方法,其中所述第一值和/或所述第二值的大小是相对于所述数据集中的基线或净生长。
9.根据权利要求7所述的方法,其中所述跳跃误差的位置是相对于所述PCR扩增曲线的区域的位置。
10.根据权利要求1至3中任一项所述的方法,其进一步包括:
- 针对所述跳跃误差校正所述数据集。
11.根据权利要求10所述的方法,其进一步包括:
- 确定所述跳跃误差的一种或多种特性,其中当所述跳跃误差的一种或多种特性满足一种或多种校正标准时,校正所述数据集。
12.根据权利要求11所述的方法,其中所述一种或多种校正标准包括以下中的至少一种:
- 所述第一值和/或所述第二值的大小,和
- 所述跳跃误差的循环数。
13.根据权利要求10所述的方法,其进一步包括:
- 将函数拟合至经校正的数据集;且
- 分析经拟合的函数以确定所述PCR生长过程的特性。
14.根据权利要求10所述的方法,其中校正所述数据集包括:
- 鉴定所述跳跃误差的位置X;
- 确定所述跳跃误差的高度;且
- 使用所述大小以校正所述跳跃误差之前的循环数的信号强度或校正所述跳跃误差之后的循环数的数据集。
15.根据权利要求14所述的方法,其中校正所述数据集进一步包括:
- 使大于X+2的循环数的信号强度的值偏移,以对应于少一个循环数。
16.根据权利要求1至3中任一项所述的方法,其进一步包括:
- 在鉴定跳跃误差之后,针对两个连续循环数对于具有不同符号的二阶导数具有值的其他位置搜索所述数据集。
17.存储多个指令的非临时性计算机可读介质,当执行时,所述指令控制计算机系统以检测PCR(聚合酶链式反应)生长过程的PCR扩增曲线中的跳跃误差,所述指令包含:
- 接收代表PCR扩增曲线的数据集,所述数据集包括多个数据点,每个数据点具有循环数和PCR生长过程在所述循环数的信号强度的一对坐标值;
- 计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;
- 鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;
- 当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;且- 基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表所述PCR扩增曲线的数据集中已经发生跳跃误差。
18.根据权利要求17所述的存储多个指令的非临时性计算机可读介质,其中所述指令进一步包括:
- 确定所述跳跃误差的一种或多种特性;且
- 当所述跳跃误差的一种或多种特性满足一种或多种无效标准时,使所述数据集无效;且
- 当所述跳跃误差的一种或多种特性满足一种或多种校正标准时,校正所述数据集。
19.PCR(聚合酶链式反应)系统,其包含:
- 生成代表PCR扩增曲线的PCR数据集的PCR数据获取装置,所述数据集包括多个数据点,每个数据点具有循环数和PCR生长过程在所述循环数的信号强度的一对坐标值;和- 智能模,其经配置以处理所述PCR数据集,以通过以下检测跳跃误差:
- 计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;
- 鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;
- 当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;且- 基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表所述PCR扩增曲线的数据集中已经发生跳跃误差。
20.根据权利要求19所述的PCR系统,其中所述智能模块经进一步配置以:
- 确定所述跳跃误差的一种或多种特性;且
- 当所述跳跃误差的一种或多种特性满足一种或多种无效标准时,使所述数据集无效;且
- 当所述跳跃误差的一种或多种特性满足一种或多种校正标准时,校正所述数据集。

说明书全文

用于检测和校正实时PCR信号中的跳跃的方法和系统

发明领域

[0001] 本公开总体涉及用于处理由样品的生长过程(例如,PCR或细菌)导致的数据的系统和方法,更具体地涉及用于检测跳跃误差的系统和方法。
[0002] 背景
[0003] 聚合酶链式反应是用于酶促合成或扩增定义核酸序列的体外方法。所述反应通常使用两个寡核苷酸引物,其与相反链杂交且侧接待扩增的模板或目标DNA序列。引物的延伸由热稳定的DNA聚合酶催化。涉及模板变性、引物退火和由聚合酶延伸退火引物的重复系列的循环提供特定DNA片断的指数累积。荧光探针或标记通常用于过程中,以便于扩增过程的检测和定量。
[0004] 具体而言,同质(homogeneous)且在扩增开始或反应物理采样用于分析后不需要添加试剂的荧光技术是有吸引的。示例性同质技术使用定位目标区域的寡核苷酸引物和用于生成信号的荧光标记或染料。典型的基于PCR的方法使用具有两个相互作用的发色团的FRET寡核苷酸探针(相邻的杂交探针,TaqMan探针,分子信标,Scorpions),只具有一个荧光团的单一寡核苷酸探针(G-猝灭探针,Crockett, A. O.和C. T. Wittwer, Anal. Biochem. 2001; 290:89-97和SimpleProbes, Idaho Technology),和使用dsDNA染料(例如,SYBR Green I)替代共价的、荧光标记的寡核苷酸探针的技术。PCR中结合所有双链(ds)DNA的DNA结合染料引起结合后染料的荧光。因此,PCR过程中DNA产物的增加因此导致荧光强度的增加,并且在每个循环测量,从而允许DNA浓度得到定量。然而,一个潜在的缺点是与所有dsDNA PCR产物的非特异性结合,这影响精确定量。关于标准稀释,PCR中的dsDNA浓度可以得到测定。
[0005] 荧光报道探针仅检测特异性探针结合的DNA序列,因此显著增加特异性。这允许定量扩增物,甚至在非特异性DNA扩增存在的情况下。为了在相同反应中检测多个目标,荧光探针可以用于多重测定中,其中具有不同颜色标记的特异性探针用于每个目标。荧光报道探针的特异性还防止引物二聚体引起的测量干扰,所述引物二聚体是在扩增过程中不期望的副产物。大多数应用基于荧光报道化合物和结合探针的荧光猝灭剂的相互作用。只要报道分子和猝灭剂化合物密切靠近,则在用激发源(例如,激光,LED等)激发后只有基础荧光可以检测到。一旦扩增发生,则报道分子和猝灭剂化合物的相互作用受到破坏,导致可检测的荧光信号。在每个PCR循环扩增的产物的增加导致荧光的成比例增加,这是由于报道分子和猝灭剂化合物的相互作用减弱。通常,在每个扩增循环中检测和测量荧光,并且其对应于产物的指数增加的几何增加用于测定每个反应中的阈值循环(CT)。
[0006] 典型的动态PCR曲线显示于图1A中,其中绘制了典型PCR过程的荧光强度值相对于循环数。在这种情况下,在PCR过程的每个循环中监测PCR产物的形成。扩增通常在热循环仪中测量,其包括用于测量扩增反应过程中的荧光信号的组分和设备。这样的热循环仪的一个实例是Roche Diagnostics LightCycler (目录号20110468)。扩增产物,例如,借助荧光标记的杂交探针(所述探针只有当结合目标核酸时才发射荧光信号)来检测,或者在某些情况下还借助结合双链DNA的荧光染料来检测。
[0007] 然而,数据中可以出现误差,由此在数据的分析和从所述分析获得的所得物理特性(例如,起始材料的定量)中引起误差。误差的一种特定类型是跳跃误差。这些跳跃的原因可能是由于气泡、覆盖膜上的液滴、弯液面改变、微粒、热或其他问题。
[0008] 因此期望提供用于检测和可能校正来自生长过程的数据中的跳跃误差的系统和方法。
[0009] 概述
[0010] 提供了用于检测和可能校正来自生长过程的数据中的跳跃误差或使其无效的系统、方法和装置。实施方案可以通过测定数据集的二阶导数并鉴定在二阶导数中具有相反符号的两个连续循环而鉴定跳跃误差。一旦已经检测到跳跃误差,则可以基于各种标准校正数据集或使其无效。是否无效或校正可以基于绝对跳跃高度、相对跳跃高度(例如,相对于净生长或相对于基线)、跳跃的绝对位置(循环数)或相对位置(例如,相对于生长曲线的区域,诸如基线或指数期)。在一种实施方式中,可以通过从跳跃后的点减去跳跃高度或通过将跳跃高度添加至跳跃前的点而校正跳跃。其他实施方案涉及与本文描述的方法相关的系统和计算机可读介质。
[0011] 在本发明的一个方面,提供了检测生长过程的生长曲线中的跳跃误差的方法。本文中,所述方法包括在计算机系统接收代表生长曲线的数据集,所述数据集包括多个数据点,每个数据点具有循环数和生长过程在所述循环数的信号强度的一对坐标值;通过计算机系统计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;并且基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表生长曲线的数据集中已经发生跳跃误差。在一些实施方案中,所述方法进一步包括确定所述第一值和所述第二值两者的大小是否大于一个或多个阈值,其中鉴定具有跳跃误差基于确定所述第一值和所述第二值两者的大小大于一个或多个阈值。在某些实施方案中,所述阈值测试所述第一值和所述第二值对于二阶导数相对于其他值是否具有最高的大小。在一些实施方案中,所述阈值是预定值。在一些实施方案中,所述第一值是正的,且所述第二值是负的。在一些实施方案中,所述方法进一步包括确定所述跳跃误差的一种或多种特性;并且当所述跳跃误差的一种或多种特性满足一种或多种无效标准时,使所述数据集无效。在某些实施方案中,所述一种或多种无效标准包括所述第一值和/或所述第二值的大小中的至少一种,和所述跳跃误差的位置。在一个实施方案中,所述第一值和/或所述第二值的大小是相对于数据集中的基线或净生长。在另一个实施方案中,所述跳跃误差的位置是相对于所述生长曲线的区域的位置。在一些实施方案中,所述方法进一步包括针对所述跳跃误差校正所述数据集。在一个实施方案中,所述方法进一步包括确定所述跳跃误差的一种或多种特性,其中当所述跳跃误差的一种或多种特性满足一种或多种校正标准时,校正所述数据集。在特定实施方案中,所述一种或多种校正标准包括所述第一值和/或所述第二值的大小中的至少一种,和所述跳跃误差的循环数。在另一个实施方案中,所述方法进一步包括将函数拟合至经校正的数据集;并且分析经拟合的函数以确定所述生长过程的特性。在又另一个实施方案中,校正所述数据集包括鉴定所述跳跃误差的位置X;确定所述跳跃误差的高度;并且使用所述大小以校正所述跳跃误差之前的循环数的信号强度或校正所述跳跃误差之后的循环数的数据集。在某些实施方案中,校正所述数据集进一步包括使大于X+2的循环数的信号强度的值偏移,以对应于少一个循环数。在一些实施方案中,所述方法进一步包括在鉴定跳跃误差之后,针对两个连续循环数对于具有不同符号的二阶导数具有值的其他位置搜索所述数据集。
[0012] 在另一个方面,本发明涉及计算机产品,其包含存储多个指令的非临时性计算机可读介质,当执行时,所述指令控制计算机系统以检测生长过程的生长曲线中的跳跃误差,所述指令包含:接收代表生长曲线的数据集,所述数据集包括多个数据点,每个数据点具有循环数和生长过程在所述循环数的信号强度的一对坐标值;计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;并且基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表生长曲线的数据集中已经发生跳跃误差。在一些实施方案中,所述指令进一步包括确定所述第一值和所述第二值两者的大小是否大于一个或多个阈值,其中鉴定具有跳跃误差基于确定所述第一值和所述第二值两者的大小大于一个或多个阈值。在某些实施方案中,所述阈值测试所述第一值和所述第二值对于二阶导数相对于其他值是否具有最高的大小。在一些实施方案中,所述阈值是预定值。在一些实施方案中,所述第一值是正的,且所述第二值是负的。在一些实施方案中,所述指令进一步包括确定所述跳跃误差的一种或多种特性;并且当所述跳跃误差的一种或多种特性满足一种或多种无效标准时,使所述数据集无效。
在某些实施方案中,所述一种或多种无效标准包括所述第一值和/或所述第二值的大小中的至少一种,和所述跳跃误差的位置。在一个实施方案中,所述第一值和/或所述第二值的大小是相对于数据集中的基线或净生长。在另一个实施方案中,所述跳跃误差的位置是相对于所述生长曲线的区域的位置。在一些实施方案中,所述指令进一步包括针对所述跳跃误差校正所述数据集。在一个实施方案中,所述指令进一步包括确定所述跳跃误差的一种或多种特性,其中当所述跳跃误差的一种或多种特性满足一种或多种校正标准时,校正所述数据集。在特定实施方案中,所述一种或多种校正标准包括所述第一值和/或所述第二值的大小中的至少一种,和所述跳跃误差的循环数。在另一个实施方案中,所述指令进一步包括将函数拟合至经校正的数据集;并且分析经拟合的函数以确定所述生长过程的特性。在又另一个实施方案中,校正所述数据集包括鉴定所述跳跃误差的位置X;确定所述跳跃误差的高度;并且使用所述大小以校正所述跳跃误差之前的循环数的信号强度或校正所述跳跃误差之后的循环数的数据集。在某些实施方案中,校正所述数据集进一步包括使大于X+2的循环数的信号强度的值偏移,以对应于少一个循环数。在一些实施方案中,所述指令进一步包括在鉴定跳跃误差之后,针对两个连续循环数对于具有不同符号的二阶导数具有值的其他位置搜索所述数据集。
[0013] 在另一个方面,本发明涉及聚合酶链式反应(PCR)系统,其包含PCR数据获取装置,其生成代表PCR扩增曲线的PCR数据集,所述数据集包括多个数据点,每个数据点具有循环数和生长过程在所述循环数的信号强度的一对坐标值;和智能模,所述智能模块经配置以处理PCR数据集,以通过以下检测跳跃误差:计算内核与所述数据集的离散卷积以获得所述数据集在所述循环数的二阶导数;鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;并且基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表生长曲线的数据集中已经发生跳跃误差。在一些实施方案中,所述智能模块经进一步配置以确定所述第一值和所述第二值两者的大小是否大于一个或多个阈值,其中鉴定具有跳跃误差基于确定所述第一值和所述第二值两者的大小大于一个或多个阈值。在某些实施方案中,所述阈值测试所述第一值和所述第二值对于二阶导数相对于其他值是否具有最高的大小。在一些实施方案中,所述阈值是预定值。在一些实施方案中,所述第一值是正的,且所述第二值是负的。在一些实施方案中,所述智能模块经进一步配置以确定所述跳跃误差的一种或多种特性;并且当所述跳跃误差的一种或多种特性满足一种或多种无效标准时,使所述数据集无效。在某些实施方案中,所述一种或多种无效标准包括所述第一值和/或所述第二值的大小中的至少一种,和所述跳跃误差的位置。在一个实施方案中,所述第一值和/或所述第二值的大小是相对于数据集中的基线或净生长。在另一个实施方案中,所述跳跃误差的位置是相对于所述生长曲线的区域的位置。在一些实施方案中,所述智能模块经进一步配置以针对所述跳跃误差校正所述数据集。在一个实施方案中,所述智能模块经进一步配置以确定所述跳跃误差的一种或多种特性,其中当所述跳跃误差的一种或多种特性满足一种或多种校正标准时,校正所述数据集。在特定实施方案中,所述一种或多种校正标准包括所述第一值和/或所述第二值的大小中的至少一种,和所述跳跃误差的循环数。在另一个实施方案中,所述智能模块经进一步配置以将函数拟合至经校正的数据集;并且分析经拟合的函数以确定所述生长过程的特性。在又另一个实施方案中,校正所述数据集包括鉴定所述跳跃误差的位置X;确定所述跳跃误差的高度;并且使用所述大小以校正所述跳跃误差之前的循环数的信号强度或校正所述跳跃误差之后的循环数的数据集。在某些实施方案中,校正所述数据集进一步包括使大于X+2的循环数的信号强度的值偏移,以对应于少一个循环数。在一些实施方案中,所述智能模块经进一步调整,以便在鉴定跳跃误差之后,针对两个连续循环数对于具有不同符号的二阶导数具有值的其他位置搜索所述数据集。
[0014] 本发明的性质和优点的更好的理解可以参考以下详述和附图获得。
[0015] 附图简述
[0016] 图1A说明典型的PCR生长曲线的实例,其绘制为荧光强度相对于循环数。图1B是根据本发明的实施方案模拟的实时PCR曲线。
[0017] 图2A显示来自生长过程的数据的图200,其中所述数据表现出跳跃误差。图2B显示根据本发明的实施方案的生长曲线的二阶导数的图250。
[0018] 图3是根据本发明的实施方案检测生长过程的生长曲线中的跳跃误差的方法300的流程图
[0019] 图4A显示在其它平坦信号中具有跳跃的实际实时PCR数据。图4B显示来自图4A的数据的二阶导数。
[0020] 图5A显示在指数期区域的结束附近具有跳跃的实际实时PCR数据。图5B显示来自图5A的数据的二阶导数。
[0021] 图6A显示在指数期区域的结束附近具有大跳跃的实际实时PCR数据。图6B显示来自图6A的数据的二阶导数。
[0022] 图7A显示在呈现生长的数据集的基线区域(即,在指数期区域之前)中具有跳跃的实际实时PCR数据。图7B显示来自图7A的数据的二阶导数。
[0023] 图8是用于确定是否使已经根据本发明的实施方案鉴定为跳跃误差的正确生长数据无效的方法800的流程图。
[0024] 图9-12显示具有跳跃的生长曲线和根据本发明的实施方案校正的曲线。
[0025] 图13显示根据本发明的实施方案的具有跳跃误差的原始曲线1310、高度校正的曲线1320和偏移和高度校正的曲线1330。
[0026] 图14显示根据本发明的实施方案的系统和方法可使用的示例性计算机系统1400的方框图
[0027] 图15是显示可用于实施本发明的方法和系统的软件硬件资源之间的关系的总体方框图的实例。
[0028] 图16是显示热循环仪设备和计算机系统之间的关系的总体方框图的实例。
[0029] 详述
[0030] 实施方案可以检测在随机循环数发生的实时PCR信号中(或来自其他生长过程的数据中)的(不同高度的)跳跃。这些跳跃的原因可能是由于气泡、覆盖膜上的液滴、弯液面改变、微粒、热、生物化学或其他问题。尽管这些跳跃是非常罕见的,但它们具有给出不准确的循环阈(Ct)值的潜能,并且因此可以无效或校正。提供了用于校正跳跃误差的各种技术。此外,可以基于各种标准决定无效或校正。
[0031] I. 生长曲线
[0032] 在动态PCR过程的背景下的扩增曲线10的一个实例显示于图1A中。如所示,曲线10包括停滞期区域15和指数期区域25。停滞期区域15通常被称为基线或基线区域。这样的曲线包括连接停滞期和指数期的转变区域20。区域20通常被称为弯头(elbow)或弯头区域(elbow region)。弯头区域通常定义末端至基线和基本过程的生长或扩增速率的转变。鉴定区域20中的特定转变点可用于分析基本过程的行为。
[0033] 在典型的PCR曲线中,鉴定被称为弯头值或循环阈值(Ct)值的转变点对于理解PCR过程的效率特征极为有用。例如,Ct值可用于提供分析的样品中存在的DNA量的定量。定量通过进行Log(DNA量) 相对于 Ct值的校准曲线来获得。然后随后的样品可以使用Ct值连同校准曲线以直接获得样品中DNA的估计值。Ct值也可用于提供关于DNA样品的定性信息。通常,对于待分析的所有反应测定定义信号阈值,并且对于目标核酸以及对于参考核酸诸如标准或持家基因测定达到该阈值所需的循环数(Ct)。目标分子(起始材料)的绝对或相对拷贝数可以基于对于目标核酸和参考核酸获得的Ct值进行测定(Gibson等人, Genome Research 6:995-1001; Bieche等人, Cancer Research 59:2759-2765, 1999; WO 97/46707; WO 97/46712; WO 97/46714)。图1A中在基线区域15末端的弯头值20将在循环数30的区域内。
[0034] RNA或DNA的量可以通过将结果与已知量的RNA或DNA的连续稀释物的实时PCR产生的标准曲线进行比较来测定。聚合酶链式反应(PCR)扩增中目标分子的绝对或相对拷贝数可以通过将循环阈值(Ct)值与标准曲线、与参考核酸的循环阈值(Ct)值或与绝对定量的标准核酸进行比较来测定。此外,聚合酶链式反应(PCR)扩增的效率可以通过将待分析的每个反应的循环阈值(Ct)与参考核酸的循环阈值(Ct)进行比较来测定。然而,跳跃误差,例如,被错误鉴定为指数期区域的跳跃误差,可以影响Ct。
[0035] 可以提供类似的生长曲线(例如,S形的生长曲线)的其他过程包括细菌过程、酶促过程和结合过程。在细菌生长曲线中,例如,目标转变点已被称作延迟期中的时间,λ。产生可根据本发明分析的数据曲线的其他特定方法包括链置换扩增(SDA)方法、基于核酸序列的扩增(NASBA)方法和转录介导的扩增(TMA)方法。SDA和NASBA方法和数据曲线的实例分别可见Wang, Sha-Sha, 等人, "Homogeneous Real-Time Detection of Single-Nucleotide Polymorphisms by Strand Displacement Amplification on the BD ProbeTec ET System," Clin Chem 2003 49(10):1599,和Weusten, Jos J.A.M., 等人, "Principles of Quantitation of Viral Loads Using Nucleic Acid Sequence-Based Amplification in Combination With Homogeneous Detection Using Molecular Beacons," Nucleic Acids Research, 2002 30(6):26。因此,尽管本文的剩余部分将在其对于PCR曲线的适用性方面讨论本发明的实施方案和方面,但是应当理解的是,本发明可以应用于与其他方法相关的数据曲线。
[0036] 如图1A中所示,对于典型的PCR生长曲线的数据可以在二维坐标系中代表,例如,其中PCR循环数定义x轴,且累积的多核苷酸生长的指标定义y轴。通常,累积生长的指标是荧光强度值,因为荧光标记的使用可能是最广泛使用的标记方案。然而,应当理解的是,其他指标可以根据使用的具体标记和/或检测方案来使用。累积信号生长的其他有用指标的实例包括发光强度、化学发光强度、生物发光强度、磷光强度、电荷转移、电压电流、功率、能量温度粘度、光散射、放射性强度、反射率、透射率和吸光度。所有这样的实例落在信号强度下。循环的定义也可以包括时间、过程循环、单元操作循环和再生循环。
[0037] 图1B显示图100,其具有模拟实时PCR曲线110。PCR曲线110具有平(x)轴上的循环数和垂直(y)轴上的强度(例如,荧光)。PCR曲线110具有良好定义的基线115。如所示,基线115是在等于2的强度(y)的水平线。为了便于代表,不存在模拟基线115的斜率。然而,基线可以具有任何具有斜率的线性形式。弯头区域120位于基线115和指数期区域125之间。指数期区域125包括拐点128,其中PCR曲线110开始向下弯曲,与弯头区域120中的向上相反。
[0038] 尽管模拟PCR生长曲线110,但PCR生长曲线可以从每个循环采集的强度数据点来确定。可以假设具体函数形式,并且可以确定参数,使得具体函数形式近似于数据点。在一些实施方案中,具有通过Levenberg-Marquardt (LM)回归方法确定的参数的双S形函数可以用来发现数据点的近似值。在其他实施方案中,可以使用其他函数形式,例如,如有限元分析、单一S形函数或在目标区域具有连续二阶导数的一种或多种函数的任何集合中可存在的使用具有连续边界条件(例如,连续至二阶导数)的多项式的内插。在一个方面,曲线近似和参数可用于预先处理数据信号,例如,以归一化数据信号和/或去除可以存在于数据信号中的峰值(spikes)或异常数据点。
[0039] 甚至在没有检测到跳跃的情况下,仍然可以拟合数据(例如,以双S形)。根据跳跃的大小和跳跃的位置,函数拟合可以是令人满意的,并且可能获得可靠的结果;然而,在某些情况下,问题可以更明显。例如,如果在平坦曲线或者其它将具有负斜率的曲线上存在跳跃,则问题变得更明显。在这样的情况下,所述跳跃可以被检测为对应于正生长,这导致假阳性。作为另一个实例,当所述跳跃高和/或所述跳跃发生在生长区中时,的确具有实际生长的过程可能具有错误的定量值(例如,Ct值)。因此,当基本数据具有误差(例如,跳跃误差)时,拟合至数据点的函数形式可以显示误差。跳跃的检测可以防止使用错误的数据,并且防止生长过程中使用的生物样品的错误的诊断或结论。
[0040] II. 跳跃
[0041] 跳跃误差显示为信号强度的非常大的增加。实施方案可用于使检测跳跃误差的过程自动化。因此,实施方案可以制定用于使计算机系统自动检测跳跃误差的技术。
[0042] 图2A显示来自生长过程的数据的图200,其中所述数据表现出跳跃误差。如图1A和1B一样,垂直轴是强度,且水平轴是循环数(X)。图200显示平线,其在X = 10处具有跳跃。没有该跳跃,所述数据集否则将是平坦的。因此,如果进行函数拟合,所述拟合可能错误地鉴定在随机跳跃的位置处的生长(例如,在PCR过程中的扩增),即使实际上没有发生生长。因此,如果进行定性分析以鉴定是否已经发生生长,则在这样的情况下定性分析将是不正确的。
[0043] 问题也可以出现在对应于生长已经实际发生的过程的数据集中,特别是当获得定量数据时。在获得定量数据的曲线上,可以倾斜所述函数拟合以改变弯头区和指数区的位置。在这样的情况下,Ct可以是不正确的。
[0044] III. 跳跃的检测
[0045] 实施方案可以使用生长曲线的二阶导数以鉴定跳跃误差。具体地,实施方案可以进行二阶导数的离散计算,使得在每个循环数获得二阶导数值。可以经由二阶导数内核与所述数据集的卷积来计算二阶导数。可以分析二阶导数值以鉴定代表跳跃误差的行为。
[0046] 图2B显示根据本发明的实施方案的生长曲线的二阶导数的图250。垂直轴是二阶导数的值。水平轴(x)是循环数减一。使用中央精细不同方案(其使用循环数X之前和之后的循环数的值)测定循环数X的二阶导数。在使用在前面循环数的值的实施方案中,不能测定非常早第一循环数的二阶导数,因此图250中未显示第一循环数。因此,水平轴上的九的值将对应于循环10。在一些实施方式中,第一循环数的二阶导数可以被假设为零,其可以在二阶导数值的开始时插入,由此填充二阶导数值,使得水平轴可以对应于循环数。
[0047] 在图250中,可以通过检查在x=9和x=10的两个异常值来确定跳跃的检测。在x=9时,二阶导数具有最大正值。在x=10时,二阶导数具有最大负值。在一个实施方案中,跳跃检测的规则是,如果在二阶导数图中存在两个连续点,一个正的和一个负的,则可以鉴定跳跃。在一种实施方式中,可以要求这些点的大小具有图中所有点的最高和最低值。跳跃可以被鉴定为发生于一加上最高点发生处的x-值处(其为水平轴是循环数减1的反映)。因此,在图2B中,可以推断该跳跃发生于x = 1 + 9 = 10处。
[0048] A. 方法
[0049] 图3是根据本发明的实施方案检测生长过程的生长曲线中的跳跃误差的方法300的流程图。可以通过计算机系统部分或完全进行方法300。可以省略方法300的某些方框。一个实例生长过程是实时PCR扩增。其他生长过程包括细菌过程、酶促过程和结合过程。生长过程可以通过一系列点测量,其中每个数据点提供在循环数的信号强度。
[0050] 在方框310,接收代表生长曲线的数据集。该数据集包括多个数据点。每个数据点具有一对坐标值{循环数,在所述循环数处的生长过程的信号强度}。例如,图1A中的每个数据点由荧光强度和循环数指定。其他类型的信号强度,包括其他类型的强度,在本文中提及。
[0051] 在方框320,计算数据集的二阶导数。例如,可以计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数。所述内核可以是待应用于所述数据集的值的任何合适集合。例如,为了确定在X的二阶导数,所述内核可以是三个值(例如,1、-2、1),其分别乘以X-1、X和X+1,然后求和以获得在X的二阶导数。在其他实施方案中,所述内核可以由多于三个值(例如,更高阶奇数,诸如五和七)组成。可以连续应用所述内核,以便从上面提供的实施例中的第二循环到第二至最后一个循环测定二阶导数。
[0052] 在方框330,鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值。第一循环(即,两个连续循环中的第一个)的二阶导数可以具有正的第一值,且第二循环的二阶导数可以具有负的第二值。或者,所述第一值可以是负的,且所述第二值可以是正的。在一个实施方案中,所述鉴定可以相继从数据集的开始或结束开始来进行。在一些实施方式中,多于一对连续循环数可以被鉴定为具有不同的符号。各种标准可用于确定是否应当进一步分析所有、一些或仅一种这样对的连续循环数。
[0053] 在方框340,确定所述第一值和所述第二值中的至少一种的大小是否大于阈值。相同阈值可以用于第一和第二值两者,或者不同阈值可以用于第一和第二值中的每一种。当如测定和方框330所述第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,可以进行这种与阈值的比较。当多于一对具有不同的符号(例如,通过使用阈值)时,可以使用标准以选择具有不同符号的连续循环的配对
[0054] 在一个实施方案中,所述阈值测试所述正值是二阶导数的最大正值,且所述负值是二阶导数的最大负值。如图2B中可见,所述正值是1,这清楚地大于任何其他值(其中几乎所有都接近于零)。并且,所述负值是-1,这也清楚地具有比任何其他负值更大的大小。也可以使用所述阈值的预定值,例如,基于跳跃误差的经验性证据和与精确生长数据相关的情况。
[0055] 在方框350,基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值,在代表生长曲线的数据集中鉴定跳跃误差。在一个实施方案中,可以需要所述第一值和所述第二值两者均高于阈值(其对于各自值可以是相同或不同的)。除了大小大于阈值以外,可以使用其他标准。例如,可以使用跳跃误差的位置(即,循环数)。其他标准也可以用于确定要采取任何额外操作。例如,当鉴定到跳跃误差时,可以校正所述数据集或使其无效。
[0056] 在其中方法300在PCR数据获取设备(诸如热循环仪)中存在的智能模块(例如,执行指令的处理器)中实施的情况下,数据集可以在收集数据的实时提供至智能模块,或者它可以存储在存储单元或缓冲器中,并且在实验已经完成之后提供至智能模块。类似地,数据集可以经由与获取设备的网络连接(例如,LAN、VPN、内部网、因特网等)或直接连接(例如,USB或其他直接的有线或无线连接)提供给单独系统,诸如台式计算机系统或其他计算机系统,或者在便携式介质诸如CD、DVD、软盘等上提供。在某些方面,数据集包括具有一对坐标值(或2维载体)的数据点。对于PCR数据,该对坐标值通常代表循环数和荧光强度值。
[0057] B. 二阶导数(卷积)
[0058] 如上所述,所述二阶导数可以被计算为内核和所述数据集的卷积。所述卷积可以被实现为在相邻循环的信号值之间的有限差异。可以使用各种内核,如本领域技术人员将显而易见且如下所述。
[0059] 作为实例,考虑内核{x, y, z}与代表来自生长过程的数据集的九成员列表{a,b,c,d,e,f,g,h,i}的卷积,如下面方程(1)中所示。
[0060]
[0061] 下面方程(2)中显示的七成员列表给予该卷积的结果。
[0062]
[0063] 如果内核{x,y,z}被替换为{1,-2,1},列表卷积代表原始列表的二阶导数,并且由下面方程(3)给出。
[0064]
[0065] 图2B显示图2A的二阶导数,其中通过内核[1,-2,1]与图2A中的数据的列表卷积确定所述二阶导数。由于卷积,与图2A中相比,图2B中少两个点。可以通过在开始和结束时填充值校正具有较少点的结果。作为实例,添加的值可以与第二循环或倒数第二循环的值是相等的,或者被确定为一些函数拟合诸如内插的结果。
[0066] 可以使用其他内核。例如,可以使用左侧有限差分格式,其中仅使用先前循环和当前循环。例如,可以在X-2、X-1和X使用(1,-2,1)的各自值以获得在循环X的二阶导数。另一个实例是在X-3、X-2、X-1和X使用值(-1, 4, -5, 2)。可以在右侧格式中使用类似的内核,其中仅使用后续循环和当前循环。方程(1)-(3)中的实例是中央有限差分格式的,其中使用一个或多个先前循环、当前循环和一个或多个后续循环。中央格式的另一个实例是在X-2、X-1、X、X+1和X+2使用值(-1,16,-30, 16, -1)。此外,可以使用与这些值的一些变化,例如,(1.1, -2.05, 1.1)。实施方案不限于本文提供的实施例。
[0067] C. 结果
[0068] 图4A显示在其它平坦信号中具有跳跃的实际实时PCR数据。图4B显示来自图4A的数据的二阶导数。图4B中的数据使用中央有限差分格式的卷积来测定。在图4A中,数据在跳跃之后略微降低,但通常保持相对平坦。因此,该数据集不呈现生长,因为信号的唯一显著增加是由于跳跃。如果没有鉴定到跳跃,则假阳性可能发生,因为该数据集可能被错误地鉴定为呈现生长。这样的不正确的分析可以导致生物样品的潜在生长过程的不正确测量。在图4B中,如可见,存在具有正二阶导数和负二阶导数的一对连续循环(显示为9和10的X值,其对应于循环10和11)。这些值也具有与在其他循环的值相比最大的大小。
[0069] 图5A显示在指数期区域的结束附近具有跳跃的实际实时PCR数据。图5B显示来自图5A的数据的二阶导数。图5B中的数据使用中央有限差分格式的卷积来测定。图5A呈现大致在循环30和44之间的实际生长。然而,在约循环45存在跳跃,其使信号从约6增加至超过14。这种与实际生长相比相对大的跳跃会歪斜与所述数据的任何函数拟合。因此,尽管在定性上函数拟合仍然会鉴定在潜在过程中的确发生生长,但任何定量数据由于函数拟合中的误差是不正确的。在图5B中,如可见,存在具有正二阶导数和负二阶导数的一对连续循环(显示为44和45的X值,其对应于循环45和46)。并且,这些值具有与在其他循环的值相比最大的大小。
[0070] 图6A显示在指数期区域的结束附近具有大跳跃的实际实时PCR数据。图6B显示来自图6A的数据的二阶导数。图6B中的数据使用中央有限差分格式的卷积来测定。图6A呈现大致在循环26和40之间的实际生长。然而,在约循环40存在跳跃,其使信号从约14增加至约30。这种与实际生长相比相对大的跳跃也会歪斜与所述数据的任何函数拟合。因此,尽管在定性上函数拟合仍然会鉴定在潜在过程中的确发生生长,但任何定量数据由于函数拟合中的误差是不正确的。在图6B中,如可见,存在具有正二阶导数和负二阶导数的一对连续循环(显示为39和40的X值,其对应于循环40和41)。并且,这些值具有与在其他循环的值相比最大的大小。
[0071] 图7A显示在呈现生长的数据集的基线区域(即,在指数期区域之前)中具有跳跃的实际实时PCR数据。图7B显示来自图7A的数据的二阶导数。图7B中的数据使用中央有限差分格式的卷积来测定。图7A呈现大致在循环30和42之间的实际生长。然而,在约循环17存在跳跃,其使信号从约2增加至约4。该跳跃在指数期之前发生,但可被误认为指数期。并且,所述跳跃可以歪斜基线的确定且歪斜与所述数据的任何函数拟合。因此,尽管在定性上函数拟合仍然会鉴定在潜在过程中的确发生生长,但任何定量数据由于函数拟合中的误差是不正确的。
[0072] 在图7B中,如可见,存在具有正二阶导数和负二阶导数的一对连续循环(显示为16和17的X值,其对应于循环17和18)。并且,这些值具有与在其他循环的值相比最大的大小。由于所述跳跃相对于由于实际生长导致的增加不是那么大,图7B显示稍微接近于由于跳跃导致的二阶导数值的其他二阶导数值。然而,由于跳跃导致的二阶导数值仍然显著更高。
[0073] 在每种所述的情况下,通过观察在二阶导数图中存在两个连续点(一个正的和一个负的)且这些点的大小是图中所有点的最高和最低的而正确地检测所述跳跃。所述跳跃发生在1加上最高点的X-值处。
[0074] D. 多个跳跃
[0075] 数据集可以具有多个跳跃误差。在这样的情况下,一对连续循环将具有比其他跳跃误差的配对更大的大小。为了检测且可能校正所有跳跃误差,可以进行多次通过所述数据。可以使用所述大小的最小阈值以确保杂散噪声不引起非常小的正二阶导数值、随后在下一循环中非常小的负二阶导数值被鉴定为跳跃误差。
[0076] E. 负跳跃
[0077] 尽管显示正跳跃的实例,但负跳跃也可以出现。负跳跃会引起所述配对的第一循环具有负二阶导数值,且所述配对的第二循环会具有正二阶导数值。所述分析仍然可以以类似的方式来实施。
[0078] IV. 无效和校正
[0079] 一旦检测到跳跃,可以分析所述跳跃和所述数据集以确定是否使数据集无效或校正数据集,或者可能是否应该两者都不进行。可以使用各种标准来进行这些决定。例如,可以使用一种或多种无效标准的集合来确定是否应该使所述数据集无效。可以使用一种或多种校正标准的集合来确定是否应该校正所述数据集。可以将这些标准输入分析数据的计算机系统。可以在收集数据时或在后续后处理步骤时确定是否无效或校正。
[0080] 图8是用于确定是否使已经根据本发明的实施方案鉴定为跳跃误差的正确生长数据无效的方法800的流程图。方法800的各方框可以以各种顺序进行。例如,可以在决定校正数据之前或之后进行是否无效的决定。在一些实施方案中,总是进行无效和/或校正。
[0081] 在方框810,鉴定跳跃。例如,可以使用方法300鉴定跳跃。在一个实施方案中,针对数据集鉴定跳跃,并且与数据集相关的标记可以被设置为指示检测到跳跃。可以使用标记的存在,以便促进关于是否使数据集无效或校正数据集分析数据集。
[0082] 在方框820,确定所述跳跃的一种或多种特性。例如,可以通过取配对的第一循环与第二循环的信号值的差异来确定所述跳跃的高度。在一种实施方式中,所述高度可以被确定为绝对值或相对值。例如,如果指数期存在,则可以将所述跳跃高度与基线截距或净生长进行比较。净生长可以被确定为减去跳跃的生长之后的信号强度,并且可能也减去基线。也可以确定跳跃的位置。所述位置也可以被确定为绝对或相对值。例如,可以确定所述跳跃和生长曲线内的区域的位置之间的相对距离。例如,其他位置可以是弯头区的开始或结束,基线区域的开始或结束,或指数区域的开始或结束。
[0083] 在方框830,确定一种或多种特性是否满足一种或多种无效标准。在一个实施方案中,所述无效标准可以指定使任何具有跳跃的生长曲线无效。在该情况下,会使所有具有跳跃的生长曲线无效,并且不需要确定所述特性。在其他实施方案中,如果所述跳跃具有某些特性,诸如特定高度和/或特定位置,则仅使生长曲线无效。
[0084] 在方框835,如果满足无效标准,则使所述数据集无效。在一种实施方式中,如果使生长曲线无效,则不进行校正。所述生长曲线可以被标记为无效,其中这样的标记可以出现于显示器上。此外,当使生长曲线无效时,则通常不对无效的生长曲线进行进一步分析。
[0085] 在方框840,确定一种或多种特性是否满足一种或多种校正标准。在一个实施方案中,所述校正标准可以指定校正任何具有跳跃的生长曲线。在该情况下,会校正所有具有跳跃的生长曲线,并且不需要确定所述特性。即使校正所述生长曲线,仍可以在后续时间使其无效。在其他实施方案中,如果所述跳跃具有某些特性,诸如特定高度和/或特定位置,则仅校正生长曲线。
[0086] 在方框845,如果满足校正标准,则校正所述数据集。下面提供关于校正的进一步细节。所述数据集可以立即校正或者标记用于在后续时间校正。
[0087] 在方框848,使用经校正的数据集。例如,可以针对数据集确定函数拟合。函数拟合的计算的进一步细节可见于美国专利号8,265,879中。可以使用函数拟合以确定生长是否发生。作为另一种用途,可以从函数拟合确定定量值。定量值的一个实例是Ct值。可以与当从未检测到跳跃时的情况类似的方式进行经校正的数据集的分析和使用。Ct值的计算的进一步细节可见于美国专利申请号13/633,813和美国专利号8,219,366。
[0088] 在方框850,如果所述特性无一满足无效标准或校正标准,则可以使用经校正的数据集。例如,如果跳跃非常小且在基线的开始时,由于跳跃导致的任何误差可相对小。因此,可以使用未校正的数据集,而不太多牺牲精确度。
[0089] A. 无效和/或校正的标准
[0090] 如上所述,可以使用各种标准来确定是否使呈现跳跃的生长数据无效或将其校正。例如,跳跃高度的大小或相对于净生长(例如,总生长减去跳跃高度)的大小、相对于基线截距的大小和跳跃的循环数可能用于决定过程中以便使生长曲线无效或校正生长曲线。
[0091] 类似的特性可用于验证和校正两者,但使用不同的标准。例如,如果跳跃高度高于无效阈值,则可能使生长数据无效。然而,如果跳跃高度低于无效阈值、但高于校正阈值,则可以校正生长数据。
[0092] 可以将跳跃高度与其他值诸如基线值或净生长进行比较。例如,可以计算跳跃高度和其他值之间的比率或差异。然后可以将所述比率或差异与阈值进行比较。
[0093] 作为另一个实例,可以使用跳跃的位置。例如,如果跳跃太接近于Ct值(其中预期或估计的Ct值可以是已知的),则可以使生长数据无效,因为鉴于跳跃的位置,这将太难,而无法获得准确的Ct值。然而,如果该位置与预期的Ct值相对较远,则生长数据可以被鉴定为可校正的,并且可以进行校正程序。
[0094] 此外,早期跳跃(例如,在基线)可能是可校正的。例如,如果Ct的实际情况已知为约20或更高且跳跃在循环10,则可以进行测定以校正数据集。并且,如果跳跃是晚期的(例如,在平台区),则可以进行测定以校正数据集。
[0095] 在一些实施方案中,如果跳跃如此小,则可以进行测定以不使数据集无效或不校正数据集。例如,如果跳跃高度为约0.1(或其他小阈值),则可能检测到跳跃误差,或者等效地,不使跳跃无效或不校正跳跃。
[0096] B. 校正
[0097] 可以以各种方式校正跳跃误差。针对跳跃校正数据的一种方法是从所述跳跃随后的所有数据点减去跳跃高度。另一种方法是将跳跃高度添加至所述跳跃前的所有数据点。跳跃校正后的一种选择是使经校正的跳跃随后的所有荧光值向左偏移一个循环数。这可以防止任何不连续性出现于经校正的跳跃曲线中。当所述跳跃出现于指数期(生长区)中时,这样的偏移可以是有利的。
[0098] 如上所述,所述跳跃高度可以被确定为两个循环之间的强度差异。由于通过分析二阶导数鉴定两个循环的位置,在两个循环的强度可用于确定跳跃高度。
[0099] 无论使用的技术,所述校正不会改变定量值,因为所述定量值从相对强度值(例如,相对于基线)测定。例如,函数拟合可以具有恒定值,这不影响定量值(例如,Ct值)。跳跃高度的添加或减少仅仅有效地提供恒定的变化,因此,所述校正不影响定量结果。
[0100] C. 校正结果
[0101] 图9-12显示具有跳跃的生长曲线和根据本发明的实施方案校正的曲线。生长曲线对应于图4A、5A、6A和7A。如其他图一样,垂直轴是强度,且水平轴是循环数。
[0102] 图9显示原始数据910和经校正数据920。经校正数据920通常是平坦的,除了循环10和20之间的小降低。经校正数据920显示没有发生生长,并且因此精确地反映物理过程。
可以在随后处理步骤中鉴定生长的缺乏。随后处理步骤也可以将经校正数据鉴定为具有减少,其可能从阴性对照发生。
[0103] 图10显示原始数据1010和经校正数据1020。所述校正降低平台区中的总强度,以便与生长区的结束一致。如图9一样,在跳跃之后的两个数据集中看到减少。一个生长曲线(例如,对照)中的减少的量可用于校正其他生长曲线。以该方式,所述校正可以包括添加至紧跟着所述跳跃的循环(即,已经减去跳跃高度之后)。
[0104] 图11显示原始数据1110和经校正数据1120。如图10一样,所述校正降低总强度和平台区,以便与生长区的结束一致。如上所述,也可以校正跳跃之后的减少。
[0105] 图12显示原始数据1210和经校正数据1220。所述校正提供导致生长区的平滑基线。因此,可以获得精确的函数拟合。
[0106] 图13显示根据本发明的实施方案的具有跳跃误差的原始曲线1310、高度校正的曲线1320和偏移和高度校正的曲线1330。高度校正的曲线1320具有不连续性,因为PCR曲线的生长过程中发生跳跃。可以通过使所述跳跃随后的强度值向左偏移一个循环而去除该不连续性。这通过偏移和高度校正的曲线1330显示。
[0107] 该不连续性产生于这样的事实:跳跃的第一循环至第二循环的强度值的差异具有由于误差导致的一种贡献和由于正在发生的实际生长导致的另一种贡献。因此,如果总差异都归因于误差,则保证第二循环具有与第一循环相同的强度。所述偏移使经校正曲线回到与生长区一致。
[0108] 在其他实施方案中,代替偏移,可以针对第一循环至第二循环的生长的实际量进行估计。例如,可以使用线性内插以基于所述跳跃附近的循环的信号值确定在第二循环的预期信号值。这可以为实际增加是多少提供估计值。然后,可以在减去两个循环之间的总差异之后添加回归因于实际生长的增加。或者等效地,可以从总跳跃高度减去生长增加以获得实际跳跃误差。
[0109] 本发明因此在一个方面提供测定生长过程(诸如聚合酶链式反应(PCR)扩增)的生长曲线中的循环阈值Ct的方法。本文中,所述方法包括在计算机系统接收代表生长曲线的数据集,所述数据集包括多个数据点,每个数据点具有循环数和生长过程在所述循环数的信号强度的一对坐标值;通过计算机系统计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;并且基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表生长曲线的数据集中已经发生跳跃误差。
[0110] 在本发明的一个进一步方面,提供了用于测量聚合酶链式反应(PCR)扩增的效率的方法,其包括以下步骤:测量代表扩增的多核苷酸的积累的荧光强度值、发光强度值、化学发光强度值、磷光强度值、电荷转移值、生物发光强度值或吸光度值;确定定义的信号阈值和达到该阈值所需的循环数,其中生长曲线的循环阈值(Ct)通过以下方法步骤确定:接收代表生长曲线的数据集,所述数据集包括多个数据点,每个数据点具有循环数和生长过程在所述循环数的信号强度的一对坐标值;通过计算机系统计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;并且基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表生长曲线的数据集中已经发生跳跃误差;确定所述跳跃误差的一种或多种特性,并且当所述跳跃误差的一种或多种特性满足一种或多种无效标准时使所述数据集无效,或者针对所述跳跃误差校正所述数据集;并且通过将扩增的多核苷酸的循环阈值(Ct)与参考核酸的循环阈值(Ct)进行比较而确定所述聚合酶链式反应(PCR)扩增的效率。
[0111] 在本发明的另一个方面,提供了用于测定聚合酶链式反应(PCR)扩增中的目标分子的绝对或相对拷贝数的方法,其包括以下步骤:测量代表扩增的多核苷酸的积累的荧光强度值、发光强度值、化学发光强度值、磷光强度值、电荷转移值、生物发光强度值或吸光度值;通过以下方法步骤确定生长曲线的循环阈值(Ct):在计算机系统接收代表生长曲线的数据集,所述数据集包括多个数据点,每个数据点具有循环数和生长过程在所述循环数的信号强度的一对坐标值;通过计算机系统计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表生长曲线的数据集中已经发生跳跃误差;确定所述跳跃误差的一种或多种特性,并且当所述跳跃误差的一种或多种特性满足一种或多种无效标准时使所述数据集无效,或者针对所述跳跃误差校正所述数据集;并且基于Ct值测定所述目标分子的绝对或相对拷贝数。
[0112] V. 计算机系统和计算机产品
[0113] 本文提及的任何计算机系统可以利用任何合适数目的子系统。这样的子系统的实例显示于图14中的计算机装置1400中。在一些实施方案中,计算机系统包括单一计算机装置,其中所述子系统可以是计算机装置的组件。在其他实施方案中,计算机系统可以包括多个计算机装置(每个都是子系统)与内部组件。
[0114] 图14中显示的子系统经由系统总线1475互连。显示其他子系统,诸如打印机1474、键盘1478、存储设备1479、与显示适配器1482耦合的监视器1476等。耦合至I/O控制器1471的外围设备和输入/输出(I/O)设备可以通过本领域中已知的任何数目的方式(诸如系列端口1477)连接至计算机系统。例如,系列端口1477或外部接口1481(例如,以太网,Wi-Fi等)可用于将计算机系统1400连接至广域网,诸如因特网、鼠标输入设备或扫描仪。经由系统总线1475互连允许中央处理器1473与每个子系统通信,并且控制来自系统存储器1472或存储设备1479(例如,固定盘)的指令的执行,以及子系统之间信息的交换。系统存储器1472和/或存储设备1479可以体现为计算机可读介质。本文提及的任何值可以从一个组件输出至另一个组件,并且可以输出给使用者。
[0115] 计算机系统可以包括多个相同的组件或子系统,例如,通过外部接口1481或通过内部接口连接在一起。在一些实施方案中,计算机系统、子系统或装置可以经网络通信。在这样的情况下,一台计算机可以被认为是客户端,且另一台计算机可以被认为是服务器,其中每台可以是相同计算机系统的部分。客户端和服务器可以各自包括多个系统、子系统或组件。
[0116] 应当理解的是,本发明的任何实施方案可以以控制逻辑的形式使用硬件(例如,应用特异性集成电路或现场可编程阵列)和/或使用计算机软件用模块化或集成方式的通常可编程处理器来执行。如本文所使用,处理器包括相同集成芯片上的多核处理器,或单一电路板上或联网的多个处理单元。基于本文提供的公开内容和教导,本领域普通技术人员将知道和理解使用硬件以及硬件和软件的组合实施本发明的实施方案的其他方式和/或方法。
[0117] 本申请中描述的任何软件组件或函数可以作为待由处理器执行的软件代码使用任何合适的计算机语言,诸如,例如Java、C++或Perl使用,例如,常规或面向对象的技术来实施。软件编码可以存储为用于存储和/或传输的计算机可读介质上的一系列指令或命令,合适的介质包括随机存取存储器(RAM)、只读存储器(ROM)、磁性介质诸如硬盘-驱动器或软盘、或光介质诸如压缩盘(CD)或DVD(数字多用光盘)、闪存等。计算机可读介质可以是这样的存储或传输设备的任何组合。
[0118] 这样的程序还可以使用适于经由符合各种协议(包括因特网)的有线、光学和/或无线网络传输的载波信号编码和传输。因此,根据本发明的实施方案的计算机可读介质可以使用用这样的程序编码的数据信号来生成。用程序代码编码的计算机可读介质可以用兼容设备包装或与其他设备分开来提供(例如,经由因特网下载)。任何这样的计算机可读介质可以驻留在单个计算机程序产品(例如,硬盘驱动器、CD或整个计算机系统)上或内,并且可以存在于系统或网络内的不同计算机程序产品上或内。计算机系统可以包括监视器、打印机或用于为使用者提供本文提及的任何结果的其他合适的显示器。
[0119] 任何本文描述的方法可以用包括一个或多个处理器(其可以被配置以执行步骤)的计算机系统完全或部分地进行。因此,实施方案可以涉及计算机系统,包括配置以执行本文所述的任何方法的步骤的一个或多个处理器,可能还有执行各个步骤或各个步骤的组的不同组件。尽管出现为编号的步骤,但本文方法的步骤可以在相同时间或以不同顺序来执行。此外,这些步骤的部分可以与来自其他方法的其他步骤的部分使用。此外,步骤的全部或部分可以是任选的。此外,任何方法的任何步骤可以用模块、电路或用于进行这些步骤的其他方式来进行。
[0120] 在一些实施方案中,本发明的方法在计算机产品中实施。因此,这样的计算机产品包含存储多个指令的非临时性计算机可读介质,当执行时,所述指令控制计算机系统以测定生长过程的生长曲线中的循环阈值Ct,其中所述指令包括接收代表生长曲线的数据集,所述数据集包括多个数据点,每个数据点具有循环数和生长过程在所述循环数的信号强度的一对坐标值;计算内核与所述数据集的离散卷积,以获得所述数据集在所述循环数的二阶导数;鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;且基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表所述生长曲线的数据集中已经发生跳跃误差。
[0121] VI. PCR系统
[0122] 在某些方面,本发明还提供了PCR系统。示例性PCR系统显示于图15和图16。图15显示解释可用于实施本发明的方法和系统的软件和硬件资源之间的关系的总体方框图。图16中描绘的系统包含动态PCR分析模块(其可以位于热循环仪设备中)和智能模块(其是计算机系统的部分)。数据集(PCR数据集)经由网络连接或直接连接从分析模块传送至智能模块,或反之亦然。数据集可以例如根据如图3上所描绘的流程图进行处理。该流程图可以方便地例如根据如图15上所描绘的流程图通过计算机系统的硬件上存储的软件来实施。参考图15,计算机系统(2000)可以包含例如用于接收在PCR反应过程中获得的荧光数据的接收装置(2100),用于通过计算内核与所述数据集的离散卷积以获得所述数据集在所述循环数的二阶导数而处理所述数据的计算装置(2200),用于鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值的第一鉴定装置(2300),用于确定当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时所述第一值和所述第二值中的至少一个的大小是否大于阈值的确定装置(2400),和用于基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表生长曲线的数据集中已经发生跳跃误差的第二鉴定装置(2500)。在某些实施方案中,所述系统还可以包括用于在计算机屏幕上显示结果的显示装置。图16说明热循环仪设备和计算机系统之间的相互作用。所述系统包括动态PCR分析模块(其可以位于热循环仪设备中)和智能模块(其是计算机系统的部分)。数据集(PCR数据集)经由网络连接或直接连接从分析模块传送至智能模块,或反之亦然。所述数据集可以根据图15通过在处理器上运行并且存储在智能模块的存储装置上的计算机代码进行处理,并且在处理后传送回分析模块的存储装置,其中改变的数据可以显示在显示装置上。在一些实施方案中,智能模块还可以在热循环仪上实施。
[0123] 在某些方面,本发明提供了聚合酶链式反应(PCR)系统,其包含PCR数据获取装置,其生成代表PCR扩增曲线的PCR数据集,所述数据集包括多个数据点,每个数据点具有循环数和生长过程在所述循环数的信号强度的一对坐标值;和智能模块,所述智能模块经配置以处理PCR数据集,以通过以下检测跳跃误差:计算内核与所述数据集的离散卷积以获得所述数据集在所述循环数的二阶导数;鉴定两个连续循环数是否对于具有不同符号的二阶导数具有值;当第一循环数和第二循环数分别对于具有不同符号的二阶导数具有第一值和第二值时,确定所述第一值和所述第二值中的至少一个的大小是否大于阈值;且基于确定所述第一值和所述第二值中的至少一个的大小大于所述阈值来鉴定在代表所述生长曲线的数据集中已经发生跳跃误差。
[0124] 具体实施方案的具体细节可以任何合适的方式组合,而不脱离本发明的实施方案的精神和范围。然而,本发明的其他实施方案可以涉及关于每个个别方面或这些个别方面的特定组合的特定实施方案。
[0125] 本发明的示例性实施方案的以上描述已经出于说明和描述的目的进行呈现。其并非旨在是穷尽的或将本发明限于所述精确形式,并且鉴于上述教导,许多改变和变化是可能的。选择并描述实施方案以便最好地解释本发明的原则和其实际应用,从而使得本领域技术人员以各种实施方案和适用于所考虑的具体应用的各种改变最好地利用本发明。
[0126] 记载“一个/种(a)”、“一个/种(an)”或“该(the)”旨在意指“一个/种或多个/种”,除非明确地相反指示。
QQ群二维码
意见反馈