密度生化阵列芯片

申请号 CN201180050914.3 申请日 2011-08-31 公开(公告)号 CN103180496A 公开(公告)日 2013-06-26
申请人 考利达基因组股份有限公司; 发明人 布赖恩·P·斯泰克;
摘要 本 发明 提供了用于生化阵列的阵列芯片,其中,所述芯片包括根据第一 节距 的附着位点排列的场区域和具有根据第二节距排列的单一维度点图形的至少一个示踪区域,其中,所述第二节距稍稀疏并且为非整数的多个第一节距,从而单一维度Moiré求平均数可以应用在所述示踪区域,因此实现芯片与具有更高 密度 的附着位点的光学仪器的对准。
权利要求

1.用于测定的芯片,其包括:
基板,其包括至少一个场区域和至少一个示踪区域;
实验位点,其被设置在所述至少一个场区域的第一图形化阵列中,所述第一图形化阵列由第一节距所限定;和
对准位点,其被设置在所述至少一个示踪区域的第二图形化阵列中,所述第二图形化阵列由沿着单一维度的第二节距所限定;
其中,所述第一节距与第二节距的区别为非整数倍,从而允许基于Moiré求平均数的对准。
2.如权利要求1所述的芯片,其中,所述至少一个场区域具有一个目标空间像素/个实验位点的密度
3.如权利要求1所述的芯片,其中,所述至少一个场区域具有两个目标空间像素/个实验位点的密度,以及其中,所述实验位点以棋盘图形排列在所述至少一个场区域。
4.如权利要求1所述的芯片,其中,所述至少一个场区域具有四个目标空间像素/个实验位点的密度。
5.如权利要求1所述的芯片,其中,所述对准位点适合于支持生化实验。
6.如权利要求1所述的芯片,其中,根据预选的图形删除选择的一些对准位点。
7.如权利要求1所述的芯片,其中,根据伪随机的图形删除选择的一些对准位点。
8.如权利要求1所述的芯片,其中,所述实验位点和所述对准位点被设置为支持生化实验。
9.如权利要求1所述的芯片,其中,除了所述实验位点和所述对准位点之外的基板的区域被设置为抑制靶核酸的结合。
10.如权利要求1所述的芯片,其中,所述实验位点和所述对准位点被设置为支持DNA纳米球的附着。
11.如权利要求1所述的芯片,其中,所述单一维度为平维度。
12.如权利要求1所述的芯片,其中,所述单一维度为垂直维度。
13.如权利要求1所述的芯片,其中,通过无位点带将所述至少一个示踪区域与所述至少一个场区域分离。
14.如权利要求1所述的芯片,其中,所述单一维度为垂直维度,以及所述至少一个示踪区域的宽度为如下之一:目标空间像素的尺寸的三倍;和目标空间像素的尺寸的五倍。
15.如权利要求1所述的芯片,其中:
所述基板进一步包括水平示踪区域,其被设置为基本垂直于所述至少一个示踪区域;
以及
所述水平示踪区域包括根据沿着基本垂直于所述单一维度的第二维度的第二图形化阵列设置的示踪位点。
16.方法,其包括:
用成像仪器捕获芯片的图像,在所述芯片上已经设置有靶核酸,所述芯片包括:
基板,其包括至少一个场区域和至少一个示踪区域;
实验位点,其被设置在所述至少一个场区域的第一图形化阵列中,所述第一图形化阵列由第一节距所限定;和
对准位点,其被设置在所述至少一个示踪区域的第二图形化阵列中,所述第二图形化阵列由沿着单一维度的第二节距所限定;
其中,所述第一节距与第二节距的区别为非整数倍;以及
其中,所述靶核酸被附着到所述实验位点上和所述对准位点上;
根据相关逻辑基于在图像中记录的信号通过使用,至少部分地使用,Moiré求平均数来确定所述单一维度的第一校正对准项,所述信号是从附着到所述至少一个示踪区域的对准位点上的靶核酸发出的;以及
使芯片与成像仪器基于校正对准项沿所述单一维度自动地对准。
17.如权利要求16所述的方法,其中:
所述芯片的基板进一步包括:水平示踪区域,其被设置成基本垂直于所述至少一个示踪区域,其中,所述水平示踪区域包括根据沿着基本垂直于所述单一维度的第二维度的第二图形化阵列设置的示踪位点;
所述方法进一步包括:
根据相关逻辑基于在图像中记录的信号通过使用,至少部分地使用,Moiré求平均数来确定所述第二维的第二校正对准项,所述信号是从附着到所述第二示踪区域的示踪位点上的靶核酸发出的;以及
使芯片与成像仪器基于所述第二校正对准项沿所述第二维自动地对准。
18.如权利要求16所述的方法,其中,确定单一维度的校正对准项的相关逻辑进一步包括:
作为校正对准项的一部分,至少部分地基于如下确定示踪节距未对准误差:
在图像中记录的信号,所述信号是从附着到所述至少一个示踪区域中的对准位点上的靶核酸发出的;和
表示在所述至少一个示踪区域中的删除位点的图形的信息。
19.如权利要求16所述的方法,其中,所述靶核酸包括DNA纳米球。
20.如权利要求16所述的方法,其中,选择性地删除所述对准位点的亚集以形成缺失的图形,并且确定校正对准项的校正逻辑进一步包括:至少部分地基于表示缺失的图形的有序数据集计算所述校正对准项。

说明书全文

密度生化阵列芯片

[0001] 优先权要求;相关申请的交叉引用
[0002] 根据35U.S.C.§119(e),本申请要求于2010年8月31日提交的名称为“高密度生化阵列芯片”的美国临时专利申请第61/378,844号的优先权和权益,其全部内容以引用的方式并入本文,如同在本说明书中完全描述一样;根据35U.S.C.§119(e)本申请还要求了于2010年8约31日提交的名称为“具有同步跟踪的高密度生化阵列芯片”的美国专利临时申请第61/378,848号,其全部内容以引用的方式并入本文,如同在本说明书中完全描述一样。
[0003] 在联邦政府资助的研究和发展下作出的发明的权利的声明不适用
[0004] 参照“序列表”、表格、或以磁盘上提交的计算机程序列表附录不适用[0005] 发明背景
[0006] 本说明书涉及化学阵列芯片,特别是生化阵列芯片,用于通过光学技术用于化学分析。
[0007] 阵列芯片,例如在化学和生物分析中使用的那些阵列芯片,允许平行地进行大量的生化实验。例如,生化阵列芯片可以为用于平行地处理生化实验的系统的一部分。阵列芯片具有由或玻璃晶片,或其它材料制成的固体的平面玻璃基板。生物分子、试剂荧光标志物和其它化合物可以以常规的方式应用于阵列芯片。
[0008] 根据精确的操作方案通过用试剂洗涤阵列芯片可以在阵列芯片上进行生化实验,所述操作方案指定了使用的特定化合物和混合物、温度、孵育时间和适合于特定类型实验的其它参数。
[0009] 在一些操作环境下,生化实验可以与荧光成像一起被用于鉴定DNA基-A、C、G或T–通过设计生化反应使得不同颜色的染料(例如,红色、绿色、蓝色或黄色)对应各碱基。例如,荧光显微镜或其它合适的光学系统可以被用于拍摄在阵列芯片上设置的和/或进行的生化实验的图像。观察到的颜色指示在具体的实验步骤中的DNA碱基。因此用这种DNA实验从阵列芯片中提取数据依赖于记录下由可能存在于所述芯片上的数百万或者甚至数十亿的生化实验发出的荧光的颜色。
[0010] 然而,由于空间分辨率、准确度和速度的收益冲突,从致密的生化阵列芯片的荧光图像中得到有用的信息是非常复杂的。对于单个的实验,必须以足够的放大率得到图像以清楚地分辨。同时,图像必须覆盖足够大的视野以便于实验被准确的确认。最后,对于大规模的研究,成像和图像处理必须足够快地进行以提供足够的处理量,并且使后续的操作商业化可行。
[0011] 发明概述
[0012] 在此描述的是高密度阵列芯片的原则和多个实施方式,其处理设置在所述芯片上的生化实验的成像和图像处理所涉及的收益冲突。例如,在本书明书中描述的高密度阵列芯片处理如下问题:在允许从所述芯片的图像中快速提取数据的同时怎样实现在所述芯片上的非常高密度的生化实验。此外,在本文所述的高密度阵列芯片还处理如下问题:怎样提供阵列芯片与成像仪器之间的实时对准,所述成像仪器用于在操作过程中拍摄设置在所述芯片上的生化实验的图像。如本文所述的多个实施方式和原则中所示,这些问题是通过在具有与所述芯片的其它区域不同的节距和/或不同的密度的一个或多个示踪区域(track region)的形式的阵列芯片上的编码信息处理的。
[0013] 例如,在本文所述的高密度阵列芯片提供占据所述芯片的总面积的小的百分比的示踪区域,而所述芯片的其它面积被具有不同的和/或更致密的阵列栅格(array grid)所占据。编码为阵列芯片的一个或多个示踪区域的信息被在操作中以减少用所述芯片校准成像仪器(例如,荧光显微照相机)的必要的时间,而同时提供这种对准的实时调整。所述成像仪器的实时对准是通过基于从所述阵列芯片上的示踪区域的图像提取的信息持续地监测对准误差而实现的,然后基于对准误差随着所述成像仪器移动穿过阵列芯片并且拍摄设置在其上的生化实验的照片而校正所述对准。
[0014] 根据在说明书中描述的原则和实施方式,提供了适合于生化测定的阵列芯片设计,其中,所述芯片包括根据第一节距的附着位点排列的场区域和具有根据第二节距排列的单一维度点图形的至少一个示踪区域,其中,所述第二节距稍稀疏并且为非整数的多个第一节距,从而单一维度Moiré求平均数可以应用在所述示踪区域,因此实现芯片与具有更高密度的附着位点的光学仪器的对准。
[0015] 在示例性的实施方式中,用于测定的芯片包括:基板,其包括场区域和示踪区域;实验位点,其被设置在场区域的第一图形化阵列中,所述第一图形化阵列由第一节距所限定;和对准位点,其被设置在示踪区域的第二图形化阵列中,所述第二图形化阵列由沿着单一维度的第二节距所限定。所述第二节距与第一节距的区别为非整数多个,从而允许基于Moiré求平均数的对准。
[0016] 在该实施方式的一个方面,所述场区域具有一个目标空间像素(object space pixel)/个实验位点的密度。在另一方面,所述场区域具有两个目标空间像素/个实验位点的密度,其中,实验位点以棋盘图形排列在所述场区域。在又一方面,所述场区域具有四个目标空间像素/个实验位点的密度。
[0017] 在一个方面,在所述示踪区域的对准位点是有效的以支持生化实验。在另一方面,根据预选的图形删除选择的一些对准位点。在又一方面,根据伪随机的图形删除选择的一些对准位点。
[0018] 在一个方面,在所述场区域的实验位点和在示踪区域的对准位点都被设置成支持生化实验。在一个方面,在所述场区域的实验位点和在示踪区域的对准位点都被设置成支持DNA纳米球的附着。
[0019] 在一个方面,不同于实验位点(在场区域)和对准位点(在示踪区域)的阵列芯片的基板的区域进行化学处理以抑制结合靶核酸。
[0020] 在单一维度的一个方面,沿着单一维度设置的示踪区域为横向维度。在一个方面,所述单一维度为垂直维度。
[0021] 在一个方面,通过无位点带将所述示踪区域与所述场区域分离。在另一方面,所述示踪区域的尺寸为如下之一:目标空间像素的尺寸的三倍,和目标空间像素的五倍。
[0022] 在一个方面,所述阵列芯片的基板进一步包括:平示踪区域,其被设置成基本垂直于所述垂直示踪区域,其中,所述水平示踪区域包括根据沿着基本垂直于单一维度的第二维度的第二图形化阵列设置的示踪位点,所述示踪区域沿着所述示踪位点设置。
[0023] 在一个示例性的实施方式中,一种方法包括:成像仪器对芯片进行成像,在所述芯片上已经设置了靶核酸,其中,所述芯片包括:包括场区域和示踪区域的基板、设置在由第一节距限定的且设置在场区域中的第一图形化阵列中的实验位点,和对准位点,其被设置在由沿着单一维度的第二节距限定的且设置在示踪区域中的第二图形化阵列中,其中,所述第二节距与第一节距的区别在于非整数倍,以及所述靶核酸被附着到实验位点和对准位点上;通过使用基于图像中记录的从附着至示踪区域的附着位点上的靶核酸发出的信号的至少部分的Moiré求平均数,相关逻辑确定单一维度校正对准项(correction alignment term);和基于所述校正对准项使所述芯片和成像仪器沿着单一维度自动对准。
[0024] 在本实施方式的一个方面,所述芯片的基板进一步包括:水平示踪区域,其被设置成基本垂直于所述垂直示踪区域,其中,所述水平示踪区域包括根据沿着基本垂直于单一维度的第二维度的第二图形化阵列设置的示踪位点。在这个方面,所述方法进一步包括:通过使用基于图像中记录的从附着至示踪区域的附着位点上的靶核酸发出的信号的至少部分的Moiré求平均数,相关逻辑确定所述第二维校正对准项(correction alignment term);和基于所述第二校正对准项使所述芯片和成像仪器沿着第二维自动对准。
[0025] 在本实施方式的一个方面,所述相关逻辑确定所述单一维度的校正对准项的步骤进一步包括:作为校正对准项的一部分,至少部分地基于图像中记录的从附着到所述示踪区域中的附着位点上的靶核酸发出的信号和表示在至少一个示踪区域中删除位点的图形的信息确定示踪节距未对准偏差。
[0026] 在一个方面,所述附着到芯片上的靶核酸包含DNA纳米球。在另一方面,选择性地删除在所述示踪区域中的对准位点的亚集(subset)以形成缺失的图形,并且确定校正对准项的校正逻辑的步骤进一步包括:至少部分地基于表示缺失的图形的有序数据集计算所述校正对准项。
[0027] 通过结合附图参考下面的详细的描述可以更好地理解本发明。
[0028] 附图简述
[0029] 图1为具有显示场区域和示踪区域的示例性图形的插入物的高密度生化阵列芯片的俯视图(非比例尺寸)。
[0030] 图2为具有显示一个场区域和一个示踪区域的细节的示例性的高密度生化阵列芯片的一个场的插入物的俯视图。
[0031] 图3为一个示例性的高密度生化阵列芯片的一个场区域和一个示踪区域的部分的子域的俯视图,所述高密度生化阵列芯片显示相对于显示根据本发明的相对比例和位置的像素的重叠的附着位点的布置图形的一个实施方式。
[0032] 图4为一个示例性的高密度生化阵列芯片的一个场区域和一个示踪区域的部分的子域的俯视图,所述高密度生化阵列芯片显示相对于显示相对比例和位置的目标空间像素的重叠的附着位点的布置图形的另一个实施方式。
[0033] 图5为图4的部分的细节,其用于显示场区域和示踪区域的周期彼此为非整数倍。
[0034] 图6为显示单一维度“Moiré求平均数”技术的图。
[0035] 图7为使用缺失图形显示偏移测定(offset determination)的图。
[0036] 发明详述
[0037] 在下面的描述中,为了解释的目的,提出了多个具体的细节以提供对本发明的透彻的理解。然而,显而易见的是,对于本领域的技术人员而言,这些具体的细节全部不存在或一些不存在的情况下也可以作出本发明。
[0038] 选择的定义
[0039] “阵列芯片”(或简单地“芯片”)指的是固相载体(例如,基板),其具有表面,优选但不限于,平坦的或基本平坦的表面,其负载位点的阵列,核酸或大分子可以附着至位点上以形成生化测定。当附着到位点上时,所述核酸或大分子可以共价地结合到,或者可以非共价地结合到所述阵列芯片的固体载体上。通常地,所述附着的核酸或大分子的身份从它们的位点位置是不可辨别的,至少开始时是不可辨别的,但是通过在阵列上的特定的操作是可以确定的,例如,通过测序、杂交、译码探针等。参见,例如,美国专利第6,396,995号;第6,544,732号;第6,401,267号;和第7,070,927号;WO公开WO2006/073504和2005/082098;以及美国公开第2007/0207482号和第2007/0087362号。
[0040] “荧光团”为包括在特定的吸收光谱内吸收能量并以不同的发射光谱(但是同样的明确)重新辐射能量(例如,如光)的官能团的任何分子,或者由所述官能团组成的任何分子。用作标记的优选的荧光团包括,但不限于,荧光素、瀑布蓝(cascade blue)、六氯荧光素、四氯荧光素、TAMRA、ROX、FAM、Cy3、Cy3.5、Cy5、Cy5.5、德克萨斯红、曙红、购自萨诸塞州的Waltham的Thermo Fisher Scientific的DyLight Fluor系列和俄勒冈州的Eugene的Molecular Probes的Alexa Fluor系列。
[0041] “像空间”指的是在相机中的像素集覆盖的面积,以及“像空间像素”指的是相机像素。
[0042] “逻辑”指的是指令集,当由一个或多个处理器执行时,其是可运行的以实施一个或多个功能和/或以一个或多个结果的形式返回数据。在多个实施方式和执行中,任何这样的逻辑可以实现为通过一个或多个处理器执行的一个或多个软件部件、一个或多个硬件部件,例如,专用集成电路(ASIC)和/或现场可编程阵列(FPGA),或一个或多个软件部件与一个或多个硬件部件的任何组合。任何特定的逻辑的软件部件可以实现为单独的或客户端-服务器软件应用、一个或多个软件模、一个或多个函数库和一个或多个静态和/或动态链接库,而不受限制。
[0043] 关于核酸使用的“大分子”表示具有可测量的三维结构的核酸,包括:包括二级结构的直链核酸分子(例如,扩增子)、支链核酸分子和具有相互反应的结构元件的单个序列的多个分开的拷贝,例如,互补序列、回文序列、或在所述核酸中导致三维结构元件的其他序列插入物。
[0044] 在本说明书中使用的“核酸”、“寡核苷酸”、“多核苷酸”、“寡聚物”或语法等同成分通常是指共价地连接在一起的至少两个核苷酸。核酸将通常包含磷酸二酯键,尽管在一些情况下,可以包括具有替代的主链的核酸类似物,例如,亚磷酰胺、二硫代磷酸酯、或甲基亚磷酰胺键;或肽核酸主链和键。其它核酸类似物包括具有双环结构的那些,包括核酸、阳性主链、非离子主链和非核糖主链。可以进行所述核糖-磷酸酯主链的修饰以增加分子的稳定性,例如,PNA:DNA杂交在某些环境下可以显示更高的稳定性。
[0045] “目标空间”指的是目标(例如,阵列芯片)的面积,而因此“目标空间像素”指的是在目标(例如,阵列芯片)上的面积单位。所述目标空间像素的尺寸通常是由图像空间像素的尺寸(例如,相机像素)和当相机被用于对目标空间成像时应用的放大率确定的。所述放大率为图像空间像素(即,相机像素)与对应于通过相机观察到的图像空间像素的目标空间面积的实际尺寸的比率。例如,16×的放大率允许相机使用8μm的像素观察500nm的目标空间像素。在多个实施方式中,目标空间像素的尺寸可以为:宽度为200-1000nm之间,以及长度为200-1000nm之间;在优选的方面,目标空间像素的尺寸可以为320nm×320nm,更优选600nm×600nm,甚至更优选500nm×500nm。在一些实施方式中,选择目标空间像素的尺寸为与在阵列芯片上的位点的尺寸基本相同,或稍大,从而仅仅单个的离散位点将装入目标空间像素。这确保在操作上,从所述阵列芯片的位点发出的能量(例如,光)的强度可以被单个的相机像素记录。
[0046] “节距”(又称作“周期(period)”)指的是限定图形(例如阵列)的均一的距离。阵列芯片或其区域的节距,指的是任何设置在芯片上的阵列格栅中的任何两个相邻的位点的中心之间的均一的距离,因此限定了芯片的阵列,或其区域。相机的节距指的是任何两个相邻的相机像素的中心之间的均一的距离,并且限定了相机的像素阵列。
[0047] 关于靶核酸的“序列测定”表示涉及在靶核酸中的核苷酸序列的信息的测定。这种信息可以包括所述靶核酸的部分或全部序列信息的确定或测定。所述序列信息可以被测定而具有变化程度的统计可信度或置信度。在一方面,所述术语包括身份的测定和从靶核酸中不同的核苷酸开始的在靶核酸中的多个连续核苷酸的排序。
[0048] “位点”(又称作“点(spot)”)表示不与芯片上的其它位点重叠的空间地限定在阵列芯片上的区域;也就是,在阵列芯片上的位点是空间离散的,并且可以以特定的图形排列。在阵列芯片上,位点通常被设定为具有适合于核酸或大分子附着的尺寸(例如,长度、宽度和可能的深度或高度)。位点的实例包括,但不限于,凹陷、凸起区域、微孔、珠等。
[0049] “靶核酸”指的是来自基因、调控元件、基因组DNA(包括,但不限于,人DNA)、cDNA、RNA(包括mRNA、rRNA、siRNA、miRNA等)及其片段的核酸(或其大分子)。靶核酸可以为来自样品的核酸,或二级核酸,例如,扩增反应的产品。
[0050] 阵列芯片成像
[0051] 基于图像的技术通过实验被设置在芯片上的位点的位置确认在阵列芯片上的单个的生化实验。例如,从所述位点发出的能量(例如,如光)的强度被记录为图像,然后处理图像以测定所述位点在芯片上的位置。生化实验可以通过它的位点在芯片上的在二维(例如,X-Y),例如平面坐标系的坐标确定。阵列芯片的图像通常包括足够大的区域使得可以关于使用的坐标系测量和/或计算实验位点的位置。一些现有方法使用常规的对准标记(例如,如交叉蚀刻)以达到该目的;然而,这种标记的缺点包括用荧光显微镜难以观察它们,材料的不相容性和浪费的芯片面积。相比较而言,在本文所述高密度阵列芯片使用生化实验本身(以特定的图形排列),和从其中发出的能量,以协助确认。
[0052] 在多个操作环境下,设置在阵列芯片上的生化实验的图像可以使用成像仪器得到,所述成像仪器包括附着到荧光显微镜上的相机。所述显微镜的放大率确定由所述相机像素一次可以“看到”的生化实验位点的数目;同样地,所述放大率确定相机像素的尺寸(在像空间)与观察到的且对应于相机像素的芯片区域的尺寸(在目标空间中)的比率。例如,16×的放大率允许相机使用8μm的像素记录来自500nm芯片区域的信号(例如,目标空间像素)。因此,从阵列芯片上可以提取的数据的速率部分地取决于多少相机像素对应于芯片上的各点(假定点的尺寸小于目标空间像素的尺寸)。例如,以二十个相机像素/点运行的一兆像素的相机可以照出50,000个点。如果相同的相机以两个(或甚至一个)相机像素/点运行,则每张图像上点的数目为十倍(或二十倍)。低的像素-点的比率(例如,如1:1、2:1和4:1)是非常合意的,因为它们大大提高的成像处理量,它们还对在运行过程中的相机像素与阵列点的对准提出了非常高的要求。
[0053] 根据在本文所述的原则和实施方式,仔细设计的在阵列芯片上用于生化实验的位点的空间图形有利于通过荧光成像获得数据的精度和速度。在下文中描述的特定的设计原则使得非常高密度的生化阵列能够快速成像,而因此提高大规模成像系统的处理量,例如基因组测序系统。此外,所述的新型芯片涉及有利于芯片对准和确认的精度,同时使可以用于生化实验位点的芯片的面积最大化。
[0054] 如在本说明书中所述,通过使用Moiré求平均数校正亚像素X-Y对准的误差实现分数偏移(fractional offset)的精确对准校正。在Moiré求平均数中,有意地设定放大率从而使得对应于成像元件的像素(例如,相机)的目标空间像素的周期为限定芯片的示踪区域中位点的周期的非整数倍。通过提供预定的和伪随机地设置的位点集(在本文中称作删除或保留位点)实现精确的像素水平的对准,在位点集上防止生化材料附着到所述芯片基板上从而阵列的删除位点可以用于图形匹配组合(pattern matching scheme)中作为绝对位置确认的定位标记。高密度阵列芯片的比例、旋转和X-Y偏移的初始定位和后续校正在如下文献中有所描述:(1)在2011年4月22日提交的标题为“用于DNA测序的阵列的精确定位的方法和系统(METHOD AND SYSTEM FOR ACCURATE REGISTRATION OF ARRAY FOR DNA SEQUENCING)”的美国专利申请序列号第13/092,618号,其全部内容以引用的方式并入本文,如同在本说明书中完全描述一样;和(2)在2010年10月26日提交的标题为“用于具有亚像素对准的高密度生化阵列芯片成像的方法和系统(METHOD AND SYSTEM FOR IMAGING HIGH DENSITY BIOCHEMICAL ARRAYS WITH SUB-PIXEL ALIGNMENT)”的美国专利申请序列号第12/912,641号,其全部内容以引用的方式并入本文,如同在本说明书中完全描述一样。
[0055] 具有示踪区域的高密度阵列芯片
[0056] 现在转向图1,其示出了根据一实施方式的高密度生化阵列芯片。芯片100基于固体的平面基板,以及便利地设置规格为长度和宽度为数厘米。例如,通常的芯片尺寸可以为2.5cm×7.5cm×0.1cm。更小的芯片(例如,边长小于约0.5cm)是可能的,但是在某些操作环境中可能不方便处理,并且其可能难以保持更大的芯片(例如,边长大于约10cm)所需的平整性。在一些实施方式中,根据本文所述原则设计的芯片可以支持超过10亿个生化实验。例如,在使用DNA纳米球(其在后面将作为单独的章节描述)的cPAL测序中,各实验是在直径约为300nm的圆形区域内进行的。在另一实施方式中,生化实验可以在直径为30-1000nm之间(或长度和宽度),或者甚至在直径为200-500nm之间(或长度和宽度)的芯片位点上进行。
[0057] 为了使成像问题分成可管理的大块,阵列芯片被分为微米至毫米尺寸的场;例如,场105。在一个实施方式中,通常的场可以为500μm×500μm;因此,通常芯片被分为数百或数千个场。在其它实施方式中,场的尺寸可以为320-1600μm×320-1600μm,600μm×600μm,或者甚至1.6mm×700μm。
[0058] 图2为高密度阵列芯片的一个场205的图。所述场被分为子域(例如,210、212、214),所述子域是被基本沿着水平X维对齐的示踪区域(例如,示踪区域220)和基本垂直于X维区域的沿着垂直Y维对齐的示踪区域(例如,示踪区域224、226)分开的。放大的视图230显示在被示踪区域226分开的两个子域中的点。除了分开所述子域的示踪区域之外,图1和2的芯片不包括用于对齐的任何标记或特征。下面将详细描述示踪区域的性能、布置它们的原则以及它们与子域的关系。
[0059] 图3为根据示例性的实施方式的高密度阵列芯片的一个场的子域的一部分的图。圆形区域330表示与图2中的视图230的场的相同的放大视图。在该视图中,仅为了显示的目的,示踪区域326被加粗虚线380和381所界定;然而,实际上,所述阵列芯片本身不存在这种虚线。
[0060] 在图3示出的实施方式中,垂直示踪区域326的宽度被设定为等于3个目标空间像素的长度,其对应于根据可应用的放大倍数的相机(或像空间)像素。在这个实施方式中,水平示踪区域的高度可以与示踪区域326的宽度相同。在一些实施方式中,垂直示踪区域的宽度(或类似地,水平示踪区域的高度)可以等于相邻的非示踪区域的阵列格栅的5个目标空间像素。如在图3中所示,无位点带将示踪区域326与各相邻的区域340和345分开。在运行时,这些无位点带防止从设置在更致密地植入的区域340和345上的实验发出的光信号干扰设置在示踪区域326的位点上的实验发出的信号。在其它实施方式中,所述示踪区域不需要用无位点带与场区域分离,而是,在这些实施方式中,即使所述示踪区域被嵌入在场区域中,没有无位点带分离,可以使用相关逻辑正确地处理记录在示踪区域的图像中的信号。例如,可以设置相关逻辑来区分来自场区域的“在节距上的(on-pitch)”信号和示踪区域的不同的“不在节距上的(off-pitch)”信号,这种区分依赖于“在节距上的”信号趋于通过平均为零而容易被抵消的性质。
[0061] 在图3的实施方式中,区域340和345为与示踪区域326的任一侧相邻的子域的一部分。荧光点(例如,351、352和353)出现在子域中;在示踪区域326中也观察到了荧光点(例如,360和362)。在这个实施方式中,设置在子域点上和示踪区域点上的生化实验,或者用于标记(tag)实验的荧光标志物没有任何差异。空心圆(例如,361)表示点的有意缺失,例如,删除点。通过删除在用于图形化阵列芯片上的位点的光刻掩膜上的相应的特征可以方便地形成这种删除点。根据在本文所述的原则,所述删除点优选总计多于在所述示踪区域中可用的点位置的5%,但是少于15%。在所述示踪区域中的点可以为生化或荧光分子的附着位点,与场区域中的位点相同或类似。所述删除点可以为不存在附着位点,或者它们可以为已经被后续地化学处理以抑制或防止结合生化或荧光分子的附着位点。
[0062] 仅为了说明的目的,在图3中的细虚线(例如,370、371)表示对应于相机中的物理像素(例如,图像空间像素)的边界的目标空间像素之间的边界,所述相机被用于以特定的放大率对芯片成像。因此,当图3以比相机的像素周期更精细的分辨率画出时,用具有由图中的细虚线界定的像素的相机拍摄的区域330的图像不能分辨比所述像素周期更精细的空间特征。尽管这种局限,如下所述,示踪区域中的点的布置允许点与具有亚像素分辨率的像素对准。
[0063] 在示于图3中芯片上的点的布置(而因此在运行中在芯片上的生化实验的布置)提供了目标空间像素与区域340和345中的阵列点的2:1的比率,所述区域340和345为在所述阵列芯片上子域的一部分。也就是,在区域340和345中的面积被设置为两个目标空间像素/个阵列点。在示踪区域仅占据场的总面积的几个百分比的程度上,2:1的像素对点的比率大致在整个芯片上保持。然而,如在下文中进一步描述,更高密度的布置也是可能的。
[0064] 例如,图3示出了阵列芯片,其中,子域区域的点以棋盘的图形设置在阵列上。具有棋盘图形的阵列具有如下的点节距:
[0065] *阵列节距,
[0066] 并且其为任意两个相邻点的中心之间的对线距离。例如,对于具有500nm的目标空间节距的阵列而言,限定棋盘图形的点节距为:
[0067] *500=707nm。
[0068] 以另一种方式看,在具有以棋盘图形排列的点的阵列中,在各相邻行中的点偏移±1栏。
[0069] 在荧光成像中,在阵列芯片上使用棋盘图形是有利的,因为从芯片点发出的光可以垂直地或水平地扩散到(bleed)相邻的点上但是不会扩散到角落的点上。因此,以棋盘图形设置阵列芯片的点允许非常高密度的两个目标空间像素(而因此两个相机像素)/个点,同时使由在成像仪器的电子器件内的信号扩散引起的串扰最小化。
[0070] 图4为根据示例性的实施方式的高密度阵列芯片的一个场的子域的一部分的图。图4类似于图3,除了在图4中子域中的目标空间像素(而因此,相机像素)与阵列点比率为1:1之外。圆形区域430表示与图2中的视图230和在图3中的视图330的场的相同的放大视图。在该视图中,仅为了显示的目的,示踪区域426被加粗虚线所界定;然而,实际上,所述阵列芯片本身不存在这种虚线。
[0071] 在图4示出的实施方式中,垂直示踪区域426的宽度被设定为等于3个阵列(或目标空间)像素的长度,其对应于根据应用的放大倍数的相机(或像空间)像素。在这个实施方式中,在阵列芯片上的水平示踪区域的高度可以与示踪区域426的宽度相同。在其它实施方式中,垂直示踪区域的宽度(或类似地,水平示踪区域的高度)可以等于相邻的非示踪区域的阵列格栅的5个目标空间像素。如在图4中所示,无位点带将示踪区域426与各相邻的区域440和445分开。在运行时,这些无位点带防止从设置在更致密地植入的区域440和445上的实验发出的光信号干扰设置在示踪区域326的位点上的实验发出的信号。在其它实施方式中,所述示踪区域不需要用无位点带与场区域分离,而是,在这些实施方式中,即使所述示踪区域被嵌入在场区域中,没有无位点带分离,可以使用相关逻辑正确地处理记录在示踪区域的图像中的信号。例如,可以设置相关逻辑来区分来自场区域的“在节距上的(on-pitch)”信号和示踪区域的不同的“不在节距上的(off-pitch)”信号,这种区分依赖于“在节距上的”信号趋于通过平均为零而容易被抵消的性质。
[0072] 区域440和445为与示踪区域426的任一侧相邻的子域的一部分。荧光点(显示为黑色点)出现在子域和示踪区域中。由子域点和示踪点、或用于观察它们的荧光标志物表示的生化实验没有任何区别。空心圆(例如,461)表示点的有意缺失(例如,删除点)。通过删除在用于图形化阵列芯片上的位点的光刻掩膜上的相应的特征可以方便地形成这种删除点。
[0073] 在示于图4中的点的布置(而因此在运行中在芯片上的生化实验的布置)提供了目标空间像素与区域440和445中的阵列点的1:1的比率,所述区域340和345为在所述阵列芯片上子域的一部分。也就是,在区域440和445中的面积被设置为一个目标空间像素(而因此,一个相机像素)/个阵列点。这种布置导致在各场图像中包含大量的信息。例如,在图4中示出的实施方式中,大约5%的芯片面积被用于示踪区域,而余下的95%的芯片面积被以一个目标空间像素(而因此,一个相机像素)/个阵列点的最高密度使用。
[0074] 在根据本文所述的原则的其它实施方式中,在阵列芯片的非示踪区域中的位点可以以提供4个目标空间像素(而因此4个相机像素)/个位点的密度的布置设置。即使这种4:1像素/位点的密度低于在图3和图4中示出的位点密度,当与常规的阵列芯片相比,其仍然是非常高的密度;在提交本申请时,市售可得的生化阵列芯片具有10:1至25:1像素/位点密度的密度。
[0075] 在本文所述的高密度阵列芯片的设计几乎没有留下任何成像错误的空间,因为相机像素与阵列点的仅为四分之一(0.25)的像素周期的未对准可以导致不可接受的数据采集错误。针对此,下文中描述了用于设计具有示踪区域的阵列芯片的技术和用于在校正对准误差方面使用Moiré求平均数的技术,所述示踪区域提供在所需的公差内的对准。
[0076] 示踪区域结构的参数的确定
[0077] 根据本文所述的原则和实施方式,在示踪区域中的位点(又被称作“示踪位点”)的布置是根据对准相机像素与在阵列芯片上的位点的所需公差而确定的。为了确定实现特定的亚像素对准公差(而因此为示踪区域的节距)所必需的示踪位点的数目,可以使用下面的计算式。
[0078] 作为一个实例,假定优选的预对准系统需要5nm的对准公差测量误差,并且Moiré求平均数将被用于使相机像素与在阵列芯片上的位点对准。对阵列的示踪中的任何位点的测量误差可以为大至±0.5个像素,而因此单个的目标空间像素i的平均误差大约为0.25个像素,例如,
[0079] |[误差]↓i|≈0.25*目标空间像素的尺寸
[0080] 为了Moiré求平均数的目的,平均的对准误差为所有对准误差的总和的平均值与校正对准值之间的差,也就是
[0081] 目标空间像素的尺寸(1)
[0082] 其中,N为测量的数目(例如,发出信号的示踪位点的数目),并且“校正_值”为实际(但是未知)的对准值。例如,如果所需的精度为1/40的目标空间像素,则所需的N为大约100。
[0083] 在具有8个示踪区域,所述示踪区域各自具有8个子区域,所述各子区域各自具有59个示踪位点的阵列芯片中,总共有
[0084] 8*8*59=3776
[0085] 个示踪位点。由于在DNA测序中,靶核酸将会在平均四分之一的时间产生信号(例如,靶核酸将会产生A、T、C或G的信号),仅有四分之一的示踪位点可以预期发出信号。也就是,可以预期大约944个位点(例如,3776/4)将会在运行过程中发出信号。根据上述方程(1),N=944,所述理论平均对准误差可以表达为
[0086] 目标空间像素的尺寸。
[0087] 因此,对于500nm的目标空间像素,所述理论平均对准误差为
[0088]
[0089] 实际观察具有500nm的目标空间像素的阵列芯片已经证实,对于59个示踪位点/示踪子区域,所述实际测量误差为约5nm,其接近于理论值。
[0090] 上述计算结果表示一定数目的示踪位点在示踪区域沿着单一维度排列(例如,如水平X维度或垂直Y维度)使得允许使用Moiré求平均数来计算X-Y对准误差并使相机像素与阵列芯片位点对准在所需的公差内。(应该注意到,在一个实施方式中,5nm的公差足以在DNA测序中进行准确的信号强度测量。)此外,上述计算结果表示非常低的对准公差(例如,如5nm)可以通过仅损失5%的阵列芯片面积至示踪区域,其在执行(例如,高处理量的DNA测序)中是非常有用的,其中高密度的阵列点为有效运行所必要的。
[0091] 使用Moiré求平均数的对准校正
[0092] 设计本文所述的高密度阵列芯片的示踪区域(如在图3和图4中所示)使得成像系统可以使用它们用于几个同步操作:(1)具有亚像素精确度的场对准;和(2)在像素坐标系中的点的绝对位置。作为这些操作基础的首要原则,具有亚像素精确度的场的对准,将参照图5和6讨论。
[0093] 图5为显示在高密度生化芯片上的子域点与对准示踪点的周期之间关系的图。图5显示在具有2:1的相机像素比阵列点比例的芯片的场中的小部分的子域505和临近的示踪510,其中,以棋盘图形排列点。(然而,如果像素与点比例为1:1,图5中的整个讨论将不变。)细虚线(例如515,520)显示目标空间像素之间的边界,所述目标空间像素对应于相机中的物理像素(例如,图像空间像素)的边界,所述相机被用于以特定的放大率对芯片成像,而加粗虚线530标记子域区域505和示踪区域510之间的边界。(应该注意图5中的细虚线515、520和加粗虚线530仅用于说明的目的;实际上,所述阵列芯片本身不存在这种虚线。)
[0094] 在子域505中的场点(例如,540、541和542)在X和Y维度以周期λF重复,其中,λF为场点的周期。在示踪区域510中的示踪点(例如,550、551和552)在X和Y维度以周期λT重复,其中,λT为示踪区域的点的周期。(当测量示踪点的重复周期时,包括作为空心圆画出(例如,560)的删除点。)通过阵列芯片的设计,在λF和λT之间存在有意的非整数倍的不匹配,即,λT≠nλF,其中n为整数。在图5中可以容易地看到这种不匹配,因为一些示踪点位于靠近目标空间像素的中间(例如,示踪点552),而其它位于靠近像素边界(例如,示踪点550)。
[0095] 当场点的周期与对应于用于对芯片成像的相机中的像素周期(在应用放大率的情况下)的目标空间像素周期相同,或为它的整数倍时,场点的周期与示踪点的周期的非整数倍的仔细选择提高了在运行过程中使相机与芯片上的点精确对准的能。因为在目标空间像素内的示踪点位置的多样性可以被平均以计算平均示踪点位置,得到提高的精确性。如果示踪点周期与相机像素的周期相同,则产生多达 的误差(其中,λP目标空间像素周期,等于λF,或为其整数分数倍)。这种单一维度Moiré求平均数对准技术示于图6中。
[0096] 示踪点周期,λT,其不为目标空间像素周期λP的整数倍,被概念性地示于图6的成像示踪点的单一维度实例中。在图6中,包括点600、605等的示踪点的线具有λT之间的点的周期或节距。包括点600、605等的示踪点的线具有λT的周期或点节距。包括像素620、625、630等的目标空间像素的线(其经过应用的放大,1:1对应于相机像素)具有λP的周期。为了说明的目的,在图6的实例中,8λT=9λP(相当于,λT=1.125λP)。当所述示踪点用像素线(如在640中所示,其中所述像素标注为“1”至“9”)观察时,所述示踪点和目标像素每9个像素对准。示踪点和像素的相对位置在居间像素中相互扫过。插入物650为相互重叠的目标空间像素“1”至“9”的放大视图。示踪点均匀地展开在重叠的像素上。
示踪点节距和像素周期之间的区别导致示踪点在等同梯级取样像素的长度。在重叠650中的所有轨道点位置的平均导致像素坐标中的示踪点位置的最佳适配的估计,所述像素坐标具有通过因子 减少的误差,其中,N为各重复之间的像素的数目;在该实例中,N=9。实际上,在一个实施方式中,阵列芯片被设置具有N=59个示踪点,其被均匀地分散在125个目标空间像素中,因此产生 或λT=2.119λP的示踪点节距。在另一实施方式
中,阵列芯片被设置具有N=67个示踪点,其被均匀地分散在125个目标空间像素中,因此产生 或λT=1.866λP的示踪点节距。
[0097] 因此,如在下文中所述,示踪点的位置可以使用Moiré求平均数以亚像素精度测定。
[0098] 用于测定在像素坐标系中点的绝对位置的操作可以基于在如下的示踪区域中的点的布置中的编码的信息进行。如果已知示踪点的位置,场点的位置可以基于芯片上已知的子域和示踪点的布置计算。然而,示踪点的位置还可能遭受示踪点周期的整数倍的偏移误差。也就是,如上所述,在运行过程中,所述相机可以以亚像素精度与目标空间像素对准,但是仍然可能会一个或多个像素的未对准使得特定的相机像素与错误的目标空间像素对准。这种“模1(modulo one)”示踪点节距不定性可以通过使用删除示踪点来解决,例如,在图5中的删除点560。
[0099] 示踪点的绝对位置(而因此当制备阵列芯片时,相对于所述示踪点固定的场点)可以通过分析如在图7中所示的示踪点删除图形而确定。在图7中,示踪705同时具有分别对应于在芯片上的活性的和删除的附着位点的正常示出位点(例如,706)和删除位点(例如707)。为了说明的目的,示出掩膜710、715和720以辅助已知的删除图形与示踪点图像的相关联的概念化。掩膜710和715未对准(正负一个点),而掩膜720与删除图形对准。当未对准的掩膜710或715与示踪705重叠,则光透过透明的开口,例如712。另一方面,当掩膜720(其与示踪705的删除图形正确地对准)与示踪705重叠时,非常少量的光穿透其透明开口,因为它们与删除的图形位置对齐。曲线725显示在掩膜图形与用删除图形编码的示踪图像的互相关过程中,透过的光对偏移。当所述掩膜和示踪处于关于彼此的适当的偏移时,透过的光的强度急剧下降。掩膜与删除点的这种相关性通过相关逻辑被用于实践中,设置相关逻辑从而将表示从示踪点记录的强度的有序的数据集和表示删除点的掩膜的有序数据集(其是已知的,且相对于目标空间像素坐标系固定)作为输入,并产生对准误差项作为输出,对准误差项指示示踪点从像素坐标系中的示踪点正确位置的偏移(以全像素)。
[0100] 如果示踪区域的删除图形是伪随机的,则所述图形具有宽的空间范围,例如,将仅有一个峰出现在图形和示踪区域的图像的互相关(cross correlation)中。如果删除图形是周期性的,或者部分周期性的,则超过一个峰可能出现在互相关中。因此,当没有推理的信息而必须确认示踪区域的位置时,伪随机删除图形是鲁棒性的。另一方面,初始的粗对准可以足够好使得删除图形无需严格地伪随机。
[0101] 使用Moiré求平均数用于对准校正的示例性方法
[0102] 在运行中,当靶核酸被设置在阵列芯片上时,Moiré求平均数可以用于计算校正对准项,并在初始芯片注册的过程中(例如,当在成像之前所述芯片被固定在测序机器中时)和在对芯片进行连续成像的过程中(例如,在成像过程中的连续校正成像仪器的对准的进给控制中)应用这种项。所述校正对准项,单一维度(例如,X维度或Y维度)的ET,表达如下:
[0103] ET=λT*еd+еsp (2)
[0104] 其中,ET为特定单一维度的校正对准项,λT为在示踪区域沿着所述单一维度的位点的节距,ed为示踪节距(全像素)未对准误差,其为表示全像素的整数值,以及esp为由Moiré求平均数决定的亚像素误差。亚像素误差的尺寸,esp,小于目标空间像素的尺寸(长度或宽度),由如下的不等式表示:
[0105]
[0106] 其中,λT为在示踪区域中沿着单一维度(例如,X维度或Y维度)的位点的节距。由于实际上在X维度和Y维度都可能需要校正对准,基于来自芯片上的水平示踪区域的信息计算X维度的第一校正对准项,以及基于来自芯片上的垂直示踪区域的信息计算Y维度的第二校正对准项。然后,同时应用两个校正对准项,从而实现相机像素与阵列芯片上的点之间所需的对准。
[0107] 在示例性的实施方式中,用于使阵列芯片对准的方法包括几个步骤。在第一步骤中,对在示踪区域(已经在其上设置靶核酸)中的位点进行成像,并将记录在图像中的信号强度转换为有序的数据集。例如,在成像仪器中的相机可以对沿着单一维度设置的示踪区域拍下一张或多张图像,以及图像处理逻辑可以产生有序的数据集(在说明书中称作“示踪位点数据集”),其表示(例如,作为线性曲线图)从示踪位点发出的信号的强度和位置。
[0108] 在接下来的步骤中,使示踪位点数据集关联到有序的数据集(在本说明书中称作“预期的数据集”),其表示(例如,作为线性曲线图)由示踪区域的位点节距所限定的示踪位点的已知/预期的位置。使用Moiré求平均数,相关性返回特定维度的亚像素误差,所述示踪区域沿着所述特定维度设置。例如,相关逻辑可以基于示踪位点数据集乘以预期的数据集得到亚像素误差。在另一实施例中,相关逻辑将示踪位点数据集和预期的数据集作为输入,然后将记录在示踪位点数据集中的各个信号关联(离散)至示踪位点数据集的一个离散项。为了进行Moiré求平均数,相关逻辑使预期的数据集相对于示踪位点数据集以亚像素的增量位移±1个示踪节距(~2像素)目标空间像素。对于各位移,相关逻辑计算:2
(a)示踪位点数据集的各项的χ 误差,所述示踪位点数据集表示基于该项与在表示预期示踪位点的预期数据集中最接近的项的距离的记录的信号;和(b)由所述位移计算的所有的
2
χ 误差的平方之和。然后,相关逻辑基于由所有的位移的最小计算平方误差之和确定亚像素误差。这种类型的Moiré求平均数确定整个示踪区域沿着单一维度的亚像素误差,因此,还确定芯片的场区域的亚像素误差,当制备芯片时其相对于示踪区域固定。Moiré求平均数机理有效地平均了已经发出信号的所有示踪位点的误差项,误差i,而无需实际了解或确定各单个的示踪位点从一些目标空间像素的中心的确切偏移。在该步骤中的操作可以分别在X维度(在表示水平X维度的示踪区域的示踪位点数据集上)和Y维度(在表示垂直Y维度的示踪区域的示踪位点数据集上)上进行,以分别确定X维度的亚像素误差和Y维度的亚像素误差。
[0109] 在接下来的步骤中,示踪位点数据集被关联到有序的数据集上,所述有序的数据集表示(例如,作为线性图像)在示踪区域中的删除点的一个或多个图形(在本文中称作删除数据集)。相关性返回特定维度的亚像素未对准误差,所述示踪区域沿着所述特定维度设置。例如,相关逻辑可以将示踪位点数据集和删除数据集作为输入。然后,相关逻辑比较示踪位点数据集和删除数据集以确定与示踪位点数据集最紧密匹配的一个删除数据集。然后,相关逻辑计算示踪位点数据集与匹配删除数据集之间在整个像素中的示踪节距未对准误差作为偏移。在该步骤中的操作可以分别在X维度(在表示水平X维度的示踪区域的示踪位点数据集上)和Y维度(在表示垂直Y维度的示踪区域的示踪位点数据集上)上进行,以分别确定X维度的示踪节距对准误差和Y维度的示踪节距对准误差。
[0110] 在接下来的步骤中,上述等式(2)被用于基于示踪区域的位点的节距(已知),计算的示踪区域的亚像素误差,和计算的示踪区域的示踪节距对准误差,来确定设置示踪区域所沿着的维度的校正对准项。例如,校正逻辑可以使用等式(2)和计算的亚像素误差和示踪节距对准误差以计算示踪区域的校正对准项。在该步骤中的操作可以分别在X维度(沿着水平X维度的示踪区域)和Y维度(沿着垂直Y维度的示踪区域)上进行,以分别确定X维度的校正对准项和Y维度的校正对准项。
[0111] 在最终的步骤中,相机像素与阵列芯片的阵列格栅可以通过X维度和Y维度的校正对准项的量来对准。例如,基于X维度的校正对准项,成像仪器中的侧偏移系统(lateral offset system)可以调整检流计以移动相机中的图像的位置。例如,基于Y维度的校正对准项,成像仪器中的延时积分(TDI)偏移系统可以调整相机的脉冲计时。以这种方式,相机像素和芯片的阵列格栅可以在公差内彼此对准,其中,芯片中的示踪区域的布置已经如前述所设计。
[0112] 本文所述的设计示踪区域的布置的原则和基于Moiré求平均数的对准可以在设置在阵列芯片上的生化实验的检查中的各个阶段用于多种方法。例如,在一些实施方式中,当在成像之前,芯片被固定至测序机器中时初始芯片注册的过程中,基于在本文所述的示踪区域信息可以用于对准阵列芯片。
[0113] 在其它实施方式中,基于如在本文所述的示踪区域信息的Moiré求平均数对准可以用于在持续对芯片成像的过程中的前馈控制回路,其中,在每次进行芯片的扫描之后校正成像仪器的对准。例如,由于扫描芯片的两个相邻的栏导致可忽略的误差偏移(例如,10-20nm或以下),可以跨扫描累计X和Y校正对准项,而不会明显损失对准精度。因此,在扫描一栏并计算其X和Y校正对准项之后,前馈逻辑可以将这两项加入到对应的校正对准项中,校正对准项在之前的扫描过的栏中已经被累计。以这种方式,在进行接下来的芯片栏扫描之前,当前扫描的芯片栏的X和Y维度的校正对准项被用于调整成像仪器,因此实现前馈对准。
[0114] 总的来说,高密度生化阵列芯片的布置影响可以从芯片中提取的生化实验数据的速率。高密度的实验可以通过使实验的成像重复周期与相机的像素周期(或者像素周期的小的整数倍)匹配而实现。数据采集速度取决于例如通过荧光显微镜得到的实验图像中的对准、绝对位置和特征的确认。具有异步示踪的芯片布置使对准能够在要求的公差内。Moiré求平均数可以与异步示踪一起使用以确定亚像素对准,同时示踪删除图形促进模1误差的解决,其可用于精确示踪节距对准。为了Moiré求平均数的目的,在X和Y维度的校正对准项是从反映在制备过程中在示踪区域的位点与栅格之间的有意的未对准的信息中得到的,其中,正常的场区域的位点位于所述格栅上。质数(例如,如59或67)被用于限定这种有意的未对准,并确定对准以实现在要求的公差内的必要的精确性。
[0115] 在DNA测序的操作环境中,具有本文所述的示踪区域的阵列芯片的示例性的实施方式允许测序机器至少与所述机器成像一样快地提取关于阵列芯片的快照的位置。例如,在包括各自以30每秒(fps)的速度对阵列芯片成像的两个相机的测序机器中,通过所述机器每15秒出来1000张图像。通过使用具有如在本文所述的示踪区域的阵列芯片,所述测序机器(或其部件)可以在15毫秒或更短的时间之内测定各图像关于芯片的X-Y位置。特别地,通过使用具有本文所述的示踪区域的阵列芯片,在一个执行中测序机器能够以10毫秒的速度以5nm的精度确定图像的X-Y位置。
[0116] 阵列芯片构建
[0117] 在一些实施方式中,通过在基板上设置一层以上的层(例如,如反射层和/或荧光增强层)来构建阵列芯片。例如,阵列芯片的基板本身可以由反射材料(例如,金属或布拉格反射器)组成,或者其可以为基本上任何可涂布的材料的基底,所述材料提供固体支持,在其上可以设置荧光反射材料。基板的荧光反射层可以由薄的透明介电层组成,或者由薄的透明介电层的层叠组成,其中这类介电材料包括,但是不限于,SiO2、TiO2、Ta2O5、HfO2、ZrO2、MgO、Si3N4、MgF2和YF3。
[0118] 在一些实施方式中,在阵列芯片上的位点(例如,如在示踪区域中的位点和在场区域中的位点)可以由芯片基板的荧光反射层中的凹陷或凸起区域限定。在这种实施方式中,所述阵列芯片位点的宽度和/或长度可以在30-1000nm之间,以及在优选的方面,所述位点的宽度和/或长度可以为200-500nm,甚至更优选地,宽度和/或长度为大约300nm。在另一特定的方面,所述阵列芯片位点可以以0.2μm至10μm之间的距离分开。靶核酸(例如,如核酸大分子)可以被放置在阵列芯片位点上以形成阵列。所述靶核酸可以以提供非常高的密度和在其中包含的单个的核酸结构的离散分析的方式被完美地设置在各离散的位点中。在特定的方面,设置阵列芯片的各位点以接受单个的大分子,当大分子被设置在芯片上时,单个的大分子附着在各位点上。在一些实施方式中,已经附着到阵列芯片上的位点上的靶核酸分子之间的距离提供靶核酸分子中的至少30%的核酸结构,优选至少50%的核酸结构,更优选至少70%的核酸结构,并且甚至更优选90%的核酸结构的离散分析。
[0119] 在本文所述的阵列芯片的基板层可以使用多种多层涂布技术形成。所述多层涂布设计的优化可以通过应用一种或多种目前已知或后续开发的技术完成。例如,基板基底可以通过下面的任一种方法涂布:热和/或电子束蒸汽沉积、复制、转印、膜沉积、通过CVD型(例如,如LPCVD、PECVD等)或PVD型,例如,溅射(例如,如,DC磁控溅射)方法。可以使用离子辅助沉积方法和溶胶-凝胶法。基板层可以通过粘结或分子粘附任选地转印到基板基底上。
[0120] 在其中需要阵列芯片基板的荧光层上具有凹陷或凸起区域的实施方式中,在反射基板基底上(或者在其反射层上)的多层沉积可以被用于制备所需的结构。例如,使用设置在具有较低光学折射率的介电材料(例如,SiO2(n=1.48))上的具有较高折射率的材料(例如,Si3N4(折射率n=2.0))的层可以设计多层介电荧光层。也可以使用其它的涂布材料,包括包含超过两种材料的多层涂布。在一些实施方式中,在荧光层中可以形成多种结构从而提高从分散在其上的材料发出的荧光信号的探测;这种增强结构的实例在于2008年10月30日提交的美国专利申请序列第12/261,447号中有所描述,其全部内容以引用的方式并入到本说明书中,就象在本文描述一样。
[0121] 通过多种现有的技术可以进行蚀刻,例如,镶嵌技术,从而开口被选择性地蚀刻至介电层中。一般而言,光刻胶材料被层叠到介电层上,并且使用光刻技术在光刻胶层上画出开口的图形的轮廓。然后使用各向异性蚀刻以在介电层中形成开口。然后除去光刻胶材料。如果需要多层和深度,这种方法需要使用对所述各向异性的蚀刻方法具有不同的抗性的超过一层的掩膜层。
[0122] 具有示踪区域的阵列芯片在生化测定中的用途
[0123] 本文所述的原则和实施方式提供了改进的阵列芯片,其可以被用作用于生物测定的总系统的一部分。在优选的方面,本文所述的阵列芯片可以被用于多核苷酸分析,包括,但不限于,使用核酸微阵列、PCR和其它多核苷酸扩增反应的表达和转录组分析,SNP分析,蛋白质组分析等,并且特别地,核酸序列测定。下面的专利申请提供了关于可以与本文所述的阵列芯片一起使用的多种测定的额外的信息:在2006年1月13日提交的美国专利申请序列号第11/451,691号,在2007年2月24日提交的美国专利申请序列号第11/679,124号,在2008年12月1日提交的美国专利申请序列号第12/325,922号,以及例如,在2008年10月30日提交的美国专利申请序列号第12/261,548号所述的多种系统;在该段落中参考的申请的全部内容以引用的方式并入本说明书中,就像其完全在本文中描述一样。
[0124] 在一些实施方式中,可以调整在本文所述的阵列芯片从而适合于在附着到芯片的基板上的样品上进行复制和/或扩增(例如,滚环复制(circle dependent replication)、滚环扩增(circle dependent amplification)或聚合酶反应扩增),例如,通过使用捕获寡聚物。
[0125] 在某些实施方式中,例如,预计与其中需要严格受控的温度调节的PCR或其它反应一起使用的实施方式,本文所述的阵列芯片可以装配有温度控制装置以允许样品或PCR混合物快速加热和冷却(例如,热循环)。通常地,阵列芯片将被设置有电加热元件或珀贴装置(Peltier device)。还可以调整阵列芯片以提供改善的空气冷却(例如,通过提供冷却装置)。3°C-105°C的温度控制足以适合大多数的应用。
[0126] 序列测定
[0127] 本文所述的具有示踪区域的阵列芯片可以用于多种生化分析。这种分析的一个实例为未知序列的靶核酸的序列测定。在多个实施方式中,多种测序方法可以用于使用本文所述的阵列芯片测定靶核酸大分子的序列,包括,但不限于,在美国专利第6,864,052号、第6,309,824号和第6,401,267号中所公开的杂交方法;在美国专利第6,210,891号、第6,828,100号、第6,833,246号、第6,911,345号、Margulies等人,(2005),Nature437:376-380 和 Ronaghi, 等 人,(1996),Anal.Biochem.242:84-89中公开的通过合成的测序法;在美国专利第6,306,597号,Shendure等人(2005)Science309:1728-1739中公开的基于连接的方法,参照这些文献以提供教导。
[0128] 在一些实施方式中,本文所述的阵列芯片可以用于全人类基因组的DNA测序。人基因组测序服务的商业生存能力部分地取决于快速和精确地测序DNA的能力。因此,生化阵列芯片可以用于DNA测序,可以支持大量的平行的DNA实验,而因此促进快速和准确基因组数据采集。在DNA测序中,根据精确的操作方案通过用试剂洗涤阵列芯片可以在阵列芯片上进行生化实验,所述操作方案指定了使用的特定化合物和混合物、浓度、温度、孵育时间和适合于特定类型实验的其它参数。
[0129] 人基因组的DNA测序的一个实例为由加利福尼亚的Mountain View的Complete Genomics公司商业开发的高精确度、组合的探针-锚定连接(combinatorial probe-anchor ligation(cPAL))测序。所述cPAL测序技术依靠独立地测定来自载入到图形化阵列芯片中的自组装DNA纳米球(在本说明书中又称作“DNB”)的各碱基。在cPAL测序中的第一步为将随机分配的DNB载入到生化阵列芯片上。DNB为大分子串联体,其包含多份的、系列相连的相同序列的适配子和DNA片段;这种串联体的制备在如下文献中描述,例如,在2006年6月13号由Radoje Drmanac等人提交的美国专利申请序列号第11/451,691号,其全部内容以引用的方式并入到本说明书中,如同在本说明书中完全描述一样。一组DNB包含可以整体地跨过全部人基因组的DNA片段,但是当将DNB首次附着到阵列芯片上的位点(包括在示踪区域中的位点和在场区域的位点)时,在没有特定的DNB到达的地方没有对照。另一方面,一旦DNB已经附着到芯片位点上,则它们在后续的液体处理步骤保持在那里,并且不从一个位点移至另一个位点。在后续的处理步骤中,多种试剂和缓冲液洗涤在阵列芯片上的DNB,来自DNB的荧光信号被荧光成像仪器记录。
[0130] 更特别地,所述cPAL测序技术包括使下面的步骤循环。首先,锚定被杂交至所述DNB中的第一适配子上(通常立刻地杂交到适配子之一的5'或3'末端上)。然后用锚定进行酶连接反应以完全地简并探针组(probe population)(例如,例如用荧光染料标记的8-mer探针)。探针可以具有例如,大约6-20个碱基,或者,优选大约7-12个碱基的长度。在任何给定的循环中,构建使用的8-mer探针组使得一个或多个位置的身份与附着到8-mer探针上的荧光基团的身份关联。例如,当采用7-mer探针时,一组用于确认刚好临近散布的适配子的碱基的荧光基团标记探针可以具有如下的结构:3'-F1-NNNNNNAp、3'-F2-NNNNNNGp、3'-F3-NNNNNNCp和3'-F4-NNNNNNTp(其中,“p”为可用于连接的磷酸酯)。在又一实施例中,一组用于确认进入来自散布的适配子的靶核酸中的一个碱基或三个碱基的荧光基团标记的7-mer探针可以具有如下结构:3'-F1-NNNNANNp、3'-F2-NNNNGNNp、
3'-F3-NNNNCNNp和3'-F4-NNNNTNNp。在那个疑问的位置,在到达连接酶鉴别互补性的程度,所述荧光信号提供该碱基的身份。
[0131] 在进行连接和四色成像之后,锚定8-mer探针复合物被除去,并开始新的循环。使用T4DNA连接酶,可以从连接结合中得到多达六个碱基或以上的精确的序列信息,允许每适配子接近(access to)至少12对碱基对(bp)(来自5'和3'末端的6个碱基),对于每4-适配子DNB总共48bp,对于每5-适配子DNB共60bp等。
[0132] 根据给定的循环所针对查询(interrogate)的位置,构造不同的8-mer探针。特别地,在各8-mer探针中的单个位置与标记的荧光基团的身份关联。此外,所述荧光基团分子被附着到8-mer探针的相对于连接结合所靶向的末端的相反末端。例如,锚定可以被杂化使得其3'末端临近靶核酸。为了查询5个碱基进入靶核酸中的位置,可以使用简并8-mer探针组,其中,所述探针与来自所述8-mer探针的5'末端的第五核酸关联,其为将连接到锚定上的8-mer探针的末端。所述8-mer探针各自被四个荧光基团之一标记,其中,Cy5的荧光基团与A关联,Cy3与G关联,德克萨斯红与C关联,以及FITC与T关联,(虽然该实例描述了四种荧光基团的用途以查询单个的碱基/循环,但是应该认识到可以使用8种或16种荧光基团或更多/循环,增加在任一循环中可以被确认的碱基的数量。)
[0133] 根据多种因素,例如,待测序的量、采用的标签的类型、在各库构建中使用的不同的适配子的数量、每循环被查询的碱基的数量、DNB怎样附着到阵列芯片的表面上的位点上、测序操作的预期速度、信号探测方法等,可以选择cPAL的不同的变形或其它连接法测序法。
[0134] 简并的(e.g.,8-mer)探针可以以多种方式标注,包括直接或间接附着放射部分、荧光部分、比色部分、化学发光部分、荧光基团等。用于标记DNA和形成DNA适配子的方法的许多综述提供了应用于形成本发明的寡核苷酸探针的指导。这样的综述包 括:Kricka(2002),Ann.Clin.Biochem.,39:114-129, 和 Haugland(2006);Handbook of Fluorescent Probes and Research Chemicals,10th Ed.(Invitrogen/Molecular Probes,Inc.,Eugene);Keller and Manak(1993),DNA Probes,2nd Ed.(Stockton Press,New York,1993);以及Eckstein(1991),Ed.,Oligonucleotides and Analogues:A Practical Approach(IRL Press,Oxford)等。
[0135] 图像采集可以通过本领域已知的方法进行,例如,使用商业的成像套装软件Metamorph。数据提取可以通过逻辑进行,所述逻辑包括以例如C/C++写的一系列二进制,以及可以通过一系列的Matlab和Perl脚本进行碱基读取和片段定位(read-mapping)。如上所述,对于在待查询的靶核酸中的各碱基(例如,对于12碱基,从各DNB的各靶核酸部分的5'和3'末端读取6个碱基),进行杂交反应、连接反应、成像和引物除去反应(primer stripping reaction)。为了确定在给定的位置附着在阵列芯片的位点中的各DNB的身份,在进行生物测序反应后,使用对应于四种荧光的四种不同的波段对各场的视图(“帧”)成像,例如使用8-mer。在成像的过程中,如在本说明书中所述,基于如在阵列芯片的示踪区域中的位点所编码的信息的Moiré求平均数可以被用于使成像仪器的相机像素与芯片上的位点对准。来自各循环的图像可以被保存在循环目录中,其中,图像的数量为帧的数量的四倍(例如,如果使用四-荧光基团技术)。然后可以将循环图像数据保存至分配用于下游处理的目录结构中。
[0136] 数据提取通常需要两种数据类型:亮场图像以区分在阵列芯片中所有的DNB的位置;和在各测序循环的过程中得到的荧光图像集。所述数据提取软件用亮场图像确认所有的目标,然后对于这样的各目标,计算各测序循环的平均荧光值。对于任意给定的循环,存在四个数据点,对应于在不同的波长下拍摄的四张图像以查询所述碱基是否为A、G、C或T。这些原始数据被合并,产生各DNB的间断的配对测序读数。每个这样的各配对的读数包括两个臂,各自表示大约35bp的序列,其中,已经从可以具有200-500bp长度的DNA片段的两个末端提取两个臂;因此,配对读数的两个臂可以关于潜在的DNA片段分离大约200-300bp。然后,提取的测序读数可以通过使用多种技术和可以通过一个或多个计算机系统进行算法与参考基因组匹配。
[0137] 尽管本发明具有许多不同形式的实施方式,如结合本发明的优选的实施方式所详细描述,应该理解本公开仅被认为本发明的原则的示例,而不是打算将本发明限制为在本说明书中示出和描述的特定的实施方式。本领域的技术人员在不偏离本发明的实质的情况下可以作出许多变化。本发明的范围将由权利要求和从本申请中发表的等同物所确定。附图和标题不能被解释为限制本发明的范围,因为它们的目的是使官方和一般的大众能够快速地确定本发明的一般的类型。在下面的权利要求书中,除了使用术语“装置(means)”,在其中引用的任何特征或元件不应该被解释为根据35U.S.C.§112, 的“装置加功能(means-plus-function)限定。
QQ群二维码
意见反馈