首页 / 专利库 / 诊断设备和程序 / 羊膜穿刺术 / 用于确定包含核酸的混合物的样品中的拷贝数变异的方法

用于确定包含核酸的混合物的样品中的拷贝数变异的方法

阅读:155发布:2020-05-16

专利汇可以提供用于确定包含核酸的混合物的样品中的拷贝数变异的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种用于确定已知是或被认为在一个或多个靶序列的量方面有所不同的核酸的混合物中的拷贝数变异的方法,并且更具体地,涉及一种用于确定拷贝数变异的方法,其包括用于解释在 染色 体之间以及在测序之间存在的变异性的 生物 信息分析方法和统计分析方法。根据本发明的变异确定可用来确定染色体拷贝数变异,其与或被认为与 胎儿 的医学状况相关。可根据本发明的方法确定的染色体拷贝数变异可以包含来自染色体1-22、X和Y中的任何一个或多个的三体和 单体 ,整个核酸序列的多体,和染色体中的任何一个或多个序列 片段 的缺失和/或重复,并且因此,对分析胎儿的性别和拷贝数变异是有用的。,下面是用于确定包含核酸的混合物的样品中的拷贝数变异的方法专利的具体信息内容。

1.一种用于检测胎儿性别和拷贝数异常的方法,所述方法包括:
a)从由母体生物样品中提取的DNA中获得读段;
b)将所述获得的读段与参考基因组数据库比对;
c)计算所述比对的读段的Q评分,并且仅选择等于或低于截断值的读段;和
d)计算所述选择的读段的G评分,并且将所述G评分与参考染色体组合的G评分进行比较,由此确定胎儿性别和拷贝数变异。
2.权利要求1的方法,其中,当所述选择的读段为染色体13时,步骤d)中的所述参考染色体组合为染色体4和6,当所述选择的读段为染色体18时,所述参考染色体组合为染色体
4、7、10和16,当所述选择的读段为染色体21时,所述参考染色体组合为染色体7、11、14和
22,当所述选择的读段为染色体X时,所述参考染色体组合为染色体16和20,和当所述选择的读段为染色体Y时,所述参考染色体组合为染色体1、2、3、4、5、6、7、8、9、10、11、12、14、15、
17和19。
3.权利要求1的方法,其中,步骤a)包括以下步骤:
(i)从通过羊膜穿刺术获得的羊膜液、通过绒毛膜绒毛取样获得的绒毛、通过经皮脐带血取样获得的脐带血、自然流产胎儿组织或人外周血中获得胎儿和母体核酸的混合物;
(ii)通过盐析方法、柱色谱方法或基于珠粒的方法从所述获得的胎儿和母体核酸的混合物中去除蛋白质、脂肪和其他残余物,并收集纯化的核酸;
(iii)对所述纯化的核酸或通过酶切割、粉碎化或液压剪切方法随机片段化的核酸构建单端测序或双端测序文库;
(iv)使所述构建的文库经受下一代测序仪;和
(v)从所述下一代测序仪获得核酸读段。
4.权利要求1的方法,其中,步骤c)包括以下步骤:
(i)指定每个所述比对的核酸序列的区域;
(ii)指定满足映射质量评分和GC含量的截断值的序列;
(iii)通过使用以下等式1计算所述指定的序列中的任何病例1的染色体N(ChrN)的分数:
等式1:
(iv)通过以下等式2计算所述染色体N区域的Z评分;
等式2:
(v)从任何病例1的除对应于染色体13、18和21的区域之外的染色体区域的Z评分的标准偏差计算Q评分;和
(vi)确定所述Q评分的截断值,并且当所述计算的Q评分超过所述截断值时,确定所述Q评分在标准以下,并且从所述感兴趣的样品再次产生读段。
5.权利要求4的方法,其中,步骤(ii)中的所述映射质量评分为15-70分,并且所述GC含量满足30至60%。
6.权利要求4的方法,其中,步骤(vi)中的所述截断值为4。
7.权利要求1的方法,其中,步骤d)包含以下步骤:
(i)从染色体1至22中随机选择参考染色体;
(ii)通过以下等式3计算任何染色体N的分数值:
等式3:
(iii)通过以下等式4计算任何病例1的染色体N的G评分:
等式4:
(iv)重复进行步骤(i)至(iii),由此选择使正常组与异常组之间的G评分差最大化的染色体组合;和
(v)使用步骤(iv)中获得的所述染色体组合计算G评分,并且当所述计算的G评分低于截断值时,确定拷贝数减少,并且当所述计算的G评分高于截断值时,确定拷贝数增加。
8.权利要求1的方法,其中,步骤d)中确定胎儿性别的步骤包括以下步骤:
(i)在其中的胎儿核型为46、XX或46、XY的母体参考组中进行权利要求7的步骤(i)至(iv),由此获得X和Y染色体的G评分截断值;和
(ii)将任何病例的X和Y染色体的G评分与截断值进行比较,由此确定性别。
9.权利要求8的方法,其中,当所述X染色体的G评分低于所述截断值时,确定性染色体为XO,其中,当所述X染色体的G评分高于所述截断值时,确定存在三个或更多个X染色体,和其中,当所述Y染色体的G评分高于所述截断值时,确定存在一个或多个Y染色体。
10.权利要求9的方法,其中,当存在一个或多个Y染色体时,通过以下等式5计算X染色体胎儿分数,并通过以下等式6计算Y染色体胎儿分数,以由此通过以下等式7来计算所述Y染色体分数与所述X染色体分数的比率,从而当所述比率为0.7至1.4时,确定性染色体为XY,并且当所述比率为1.4至2.6时,确定性染色体为XYY:
等式5:
等式6:

等式7:
11.权利要求7至10中任一项的方法,其中,所述截断值为-2或2。
12.权利要求7的方法,其中,步骤(iv)中的重复次数为100或更多。
13.一种用于检测胎儿性别和拷贝数异常的仪器,所述仪器包含:
读取部件,用于从由母体生物样品中提取的DNA中读取读段和从所述DNA中读取读段;
比对部件,用于将所述读取读段与参考基因组数据库比对;
质量控制部件,用于计算所述比对的读段的Q评分,和仅选择等于或低于截断值的样品的读段;和
性别和拷贝数变异确定部件,用于计算所述选择的读段的G评分,和将所述G评分与参考染色体组合的G评分进行比较,由此确定胎儿性别和拷贝数变异。
14.一种包含配置成由处理器执行的指令的计算机可读介质,其通过以下步骤检测胎儿性别和拷贝数异常:
a)从由母体生物样品中提取的DNA中获得读段;
b)将所述获得的读段与参考基因组数据库比对;
c)计算所述比对的读段的Q评分,并且仅选择等于或低于截断值的读段;和
d)计算所述选择的读段的G评分,并且将所述G评分与参考染色体组合的G评分进行比较,由此确定胎儿性别和拷贝数变异。

说明书全文

用于确定包含核酸的混合物的样品中的拷贝数变异的方法

技术领域

[0001] 本发明涉及一种用于检测胎儿性别和拷贝数异常的方法,并且更具体地涉及一种用于检测胎儿染色体异常的非侵入性方法,其包括从母体生物样品中提取DNA,从所述DNA获得读段,标准化染色体区域,和随机排列(permuting)参考染色体。

背景技术

[0002] 用于胎儿染色体异常的常规产前测试包括声波扫描术、血液标记物测试、羊膜穿刺术、绒毛膜绒毛取样、经皮脐带血取样等(Malone FD,et al.2005;Mujezinovic F,et al.2007)。其中,超声波扫描术和血液标记物测试被归为筛选测试,并且羊膜穿刺术被归为证实测试。超声波扫描术和血液标记物测试,为非侵入性方法,是安全的方法,其不包括从胎儿直接取样,但是显示80%或更小的测试灵敏度(ACOG Committee on Practice Bulletins.2007)。羊膜穿刺术、绒毛膜绒毛取样和经皮脐带血取样,为侵入性方法,能够证实胎儿染色体异常,但是具有的缺点在于由于侵入性医疗实践有失去胎儿的可能性(Mujezinovic F,et al.2007)。在1997年,Lo等在来自母体血浆和血清的胎源遗传物质的Y染色体测序中取得成功,并且从那时起,母体身体中的胎儿遗传物质已经用于产前测试(Lo YM,et al.1997)。当在胎盘重构过程中经过凋亡过程的滋养层细胞的一部分通过物质交换机制进入母体血液时,产生母体血液中的胎儿遗传物质。胎儿遗传物质实际上起源于胎盘,并且被定义为cff DNA(无细胞胎儿DNA)。在快速的情况下自胚胎转移后18天发现cff DNA,并且在胚胎转移后37天在大多数母体血液中发现cff DNA(Guibert J,et al.2003)。cff DNA具有的特征在于它是具有300bp或更小的长度的短链,并且以少量存在于母体血液中。由于这些特征,为了将cff DNA应用于检测胎儿染色体异常,已经使用了使用下一代测序仪(NGS)的大规模平行测序技术。尽管使用大规模平行测序技术检测胎儿染色体异常的非侵入性方法根据染色体显示出90至99%或更多的检测灵敏度,但是该方法的假阳性和假阴性率达到1至10%,并且因此急需用于修正这些假阳性和假阴性率的技术(Gil MM,et al.2015)。
[0003] 因此,本发明的发明人已经做出广泛努来解决上述问题,并且开发了一种用于检测胎儿染色体异常的具有高灵敏度和低的假阳性和假阴性率的方法,并且作为结果,已经发现了,当标准化胎儿染色体区域并且随机排列参考染色体时,可获得具有高灵敏度和低的假阳性/假阴性率的分析结果,由此完成本发明。

发明内容

[0004] 技术问题
[0005] 本发明的目的是提供一种用于非侵入性地检测胎儿性别和拷贝数异常的方法。
[0006] 本发明的另一个目的是提供一种用于非侵入性地检测胎儿性别和拷贝数异常的仪器。
[0007] 本发明的又另一个目的是提供一种包含配置成由处理器执行的指令的计算机可读介质,其通过上述方法来检测胎儿性别和拷贝数异常。
[0008] 技术方案
[0009] 为了实现上述目的,本发明提供了一种用于检测胎儿性别和拷贝数异常的方法,所述方法包括以下步骤:
[0010] a)从由母体生物样品中提取的DNA中获得读段;
[0011] b)将获得的读段与参考基因组数据库比对;
[0012] c)计算比对的读段的Q评分,并且仅选择等于或低于截断值的读段;和
[0013] d)计算选择的读段的G评分,并且比较所述G评分与参考染色体组合的G评分,由此确定胎儿性别和拷贝数变异。
[0014] 本发明还提供了一种用于检测胎儿性别和拷贝数异常的仪器,所述仪器包含:
[0015] a)读取部件,用于从由母体生物样品中提取的DNA中读取读段和从所述DNA中读取读段;
[0016] b)比对部件,用于将读取读段与参考基因组数据库比对;
[0017] c)质量控制部件,用于计算比对的读段的Q评分,和仅选择等于或低于截断值的样品的读段;和
[0018] d)性别和拷贝数变异确定部件,用于计算选择的读段的G评分,和比较所述G评分与参考染色体组合的G评分,由此确定胎儿性别和拷贝数变异。
[0019] 本发明还提供了一种包含配置成由处理器执行的指令的计算机可读介质,其通过以下步骤来检测胎儿性别和拷贝数异常:a)从由母体生物样品中提取的DNA中获得读段;b)将获得的读段与参考基因组数据库比对;c)计算比对的读段的Q评分,并且仅选择等于或低于截断值的读段;和d)计算选择的读段的G评分,并且比较所述G评分与参考染色体组合的G评分,由此确定胎儿性别和拷贝数变异。附图说明
[0020] 图1为显示根据本发明的用于检测胎儿性别和拷贝数异常的方法的总流程图
[0021] 图2描绘了显示在读段数据的质量控制(QC)过程中通过LOESS算法标准化GC之前或之后获得的修正结果的图。
[0022] 图3描绘了显示在读段数据的质量控制(QC)过程中通过LOESS算法标准化变异系数(CV)值之前或之后获得的修正结果的图。
[0023] 图4描绘了根据本发明的方法比较对染色体异常组和正常组计算的G分值的图。具体实施方案
[0024] 除非另有定义,本文所使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。一般地,将在以下描述的本文所使用的命名和实验方法是本领域中公知和通常采用的那些。
[0025] 在本发明中,已经发现了当通过标准化从样品中获得的测序数据、基于截断值比对标准化的数据、然后随机排列参考染色体的组合以确定其中正常组的染色体和测试受试者的染色体之间的G评分差的绝对值满足最大值的参考染色体组合来检测胎儿性别和拷贝数异常时,可以以高灵敏度和低的假阳性/假阴性率进行分析。
[0026] 即,在本发明的一个实施方案中,开发了一种方法,其包括:对从母体血液中提取的DNA测序;使用LOESS算法控制序列的质量;计算G评分;随机排列参考染色体组合,直到正常人组的染色体和测试受试者的染色体之间的G评分差的绝对值满足最大值;基于排列结果确定G评分的截断值;和确定当测试受试者的G评分超过截断值时,测试受试者的染色体拷贝数存在异常(图1)。
[0027] 因此,在一方面,本发明涉及一种用于检测胎儿性别和拷贝数异常的方法,所述方法包括以下步骤:
[0028] a)从由母体生物样品中提取的DNA中获得读段;
[0029] b)比对获得的读段与参考基因组数据库;
[0030] c)计算比对的读段的Q评分,并且仅选择等于或低于截断值的读段;和
[0031] d)计算选择的读段的G评分,并且比较所述G评分与参考染色体组合的G评分,由此确定胎儿性别和拷贝数变异。
[0032] 在本发明中,当所述选择的读段为染色体13时,所述参考染色体组合可为染色体4和6,但不限于此,当所述选择的读段为染色体18时,所述参考染色体组合可为染色体4、7、10和16,但不限于此,和当所述选择的读段为染色体21时,所述参考染色体组合可为染色体
7、11、14和22,但不限于此。另外,当所述选择的读段为染色体X时,所述参考染色体组合可为染色体16和20,但不限于此,和当所述选择的读段为染色体Y时,所述参考染色体组合可为染色体1、2、3、4、5、6、7、8、9、10、11、12、14、15、17和19,但不限于此。
[0033] 在本发明中,步骤a)包括以下步骤:
[0034] (i)从通过羊膜穿刺术获得的羊膜液、通过绒毛膜绒毛取样获得的绒毛、通过经皮脐带血取样获得的脐带血、自然流产胎儿组织或人外周血中获得胎儿和母体核酸的混合物;
[0035] (ii)通过盐析方法、柱色谱方法或基于珠粒的方法从获得的胎儿和母体核酸的混合物中去除蛋白质、脂肪和其他残余物,并收集纯化的核酸;
[0036] (iii)对所述纯化的核酸或通过酶切割、粉碎化或液压剪切(hydroshear)方法随机片段化的核酸构建单端测序或双端测序文库;
[0037] (iv)使构建的文库经受下一代测序仪;和
[0038] (v)从所述下一代测序仪获得核酸读段。
[0039] 在本发明中,下一代测序仪可为Hiseq系统(Illumina Co.)、Miseq系统(Illumina Co.)、Genome Analyzer(GA)系统(Illumina Co.)、454FLX测序仪(Roche Co.)、SOLiDTM系统(Applied Biosystems Co.)或Ion terrent系统(Life Technology Co.),但不限于此。
[0040] 在本发明中,比对步骤可使用BWA算法和GRch38序列进行,但不限于此。
[0041] 在本发明中,步骤c)可包括以下步骤:
[0042] (i)指定每个比对的核酸序列的区域;
[0043] (ii)指定满足映射质量评分和GC含量的截断值的序列;
[0044] (iii)通过使用以下等式1计算指定的序列中的任何病例1的染色体N(ChrN)的分数:
[0045] 等式1:
[0046]
[0047] (iv)通过以下等式2计算染色体N区域的Z评分;
[0048] 等式2:
[0049]
[0050] (v)从任何病例1的除对应于染色体13、18和21的区域之外的染色体区域的Z评分的标准偏差计算Q评分;和
[0051] (vi)确定Q评分的截断值,并且当计算的Q评分超过所述截断值时,确定Q评分在标准以下,并且从感兴趣的样品再次产生读段。
[0052] 在本发明中,在(i)指定每个比对的核酸序列的区域的步骤中,每个核酸序列的区域可为20kb-1MB,但不限于此。
[0053] 在本发明中,步骤(ii)中的映射质量评分可根据所希望的标准改变,但可优选地为15-70分、更优选地为50-70分、最优选地为60分。
[0054] 在本发明中,步骤(ii)中的GC含量可根据所希望的标准改变,但是可优选地为20%至70%,最优选地为30%至60%。
[0055] 在本发明中,步骤(vi)中的截断值可为4,优选为3,最优选为2。
[0056] 在本发明中,病例组意指用于检测胎儿性别和染色体拷贝数异常的样品,并且参考组意指可比较的参考染色体组,诸如参考基因组数据库,但不限于此。
[0057] 在本发明中,步骤d)中确定拷贝数变异的步骤可包括以下步骤:
[0058] (i)从染色体1至22中随机选择参考染色体;
[0059] (ii)通过以下等式3计算任何染色体N的分数值:
[0060] 等式3:
[0061]
[0062] (iii)通过以下等式4计算任何病例1的染色体N的G评分:
[0063] 等式4:
[0064]
[0065] (iv)重复进行步骤(i)至(iii),由此选择使正常组与异常组之间的G评分差最大化的染色体组合;和
[0066] (v)使用步骤(iv)中获得的染色体组合计算G评分,并且当计算的G评分低于所述截断值时,确定拷贝数下降,并且当计算的G评分高于截断值时,确定拷贝数增加。
[0067] 在本发明中,步骤(iv)中的重复次数可为100或更多,优选地为1,000或更多,最优选地为100,000或更多。
[0068] 在本发明中,可以无限制地使用步骤(v)中的G评分的截断值,只要它是对正常染色体计算的值,但是可优选地为-2或2,最优选为-3或3,但不限于此。
[0069] 在本发明中,步骤d)中确定胎儿性别的步骤可包括以下步骤:
[0070] (i)在其中的胎儿核型为46、XX或46、XY的母体参考组中进行确定拷贝数异常步骤(i)至(iv),由此获得X和Y染色体的G评分截断值;和
[0071] (ii)将任何病例的X和Y染色体的G评分与截断值进行比较,由此确定性别。
[0072] 在本发明中,X和Y染色体的G评分截断值可为-2或2,最优选地为-3或3,但不限于此。在本发明中,当X染色体的G评分低于所述截断值时,确定性染色体为XO,当X染色体的G评分高于所述截断值时,确定存在三个或更多个X染色体,和当Y染色体的G评分高于截断值时,确定存在一个或多个Y染色体。
[0073] 在本发明中,当存在一个或多个Y染色体时,可以通过以下等式5计算X染色体胎儿分数,并可以通过以下等式6计算Y染色体胎儿分数,以由此通过以下等式7来计算Y染色体分数与X染色体分数的比率,从而当所述比率为0.7至1.4时,确定性染色体为XY,并且当所述比率为1.4至2.6时,确定的是所述性染色体为XYY:
[0074] 等式5:
[0075]
[0076] 等式6:
[0077]
[0078] 和
[0079] 等式7:
[0080]
[0081] 在另一方面,本发明涉及一种用于检测胎儿性别和拷贝数异常的仪器,所述仪器包含:读取部件,用于从母体生物样品中提取DNA和从所述DNA中读取读段;比对部件,用于将读取读段与参考基因组数据库比对;质量控制部件,用于计算比对的读段的Q评分,和仅选择等于或低于截断值的读段;和性别和拷贝数变异确定部件,用于计算选择的读段的G评分,和将所述G评分与参考染色体组合进行比较,由此确定胎儿性别和拷贝数变异。
[0082] 在本发明中,当选择的读段为染色体13时,参考染色体组合可为染色体4和6,但不限于此,当选择的读段为染色体18时,参考染色体组合可为染色体4、7、10和16,但不限于此,和当选择的读段为染色体21时,参考染色体组合可为染色体7、11、14和22,但不限于此。另外,当选择的读段为染色体X时,参考染色体组合可为染色体16和20,但不限于此,和当选择的读段为染色体Y时,参考染色体组合可为染色体1、2、3、4、5、6、7、8、9、10、11、12、14、15、
17和19,但不限于此。
[0083] 在本发明中,读取部件可包含:(i)取样部件,用于从通过羊膜穿刺术获得的羊膜液、通过绒毛膜绒毛取样获得的绒毛、通过经皮脐带血取样获得的脐带血、自然流产胎儿组织或人外周血获得胎儿和母体核酸的混合物;(ii)核酸收集部件,用于通过盐析方法、柱色谱方法或基于珠粒的方法从获得的胎儿和母体核酸的混合物中去除蛋白质、脂肪和其他残余物,并收集纯化的核酸;(iii)文库构建部件,用于对所述纯化的核酸和通过酶切割、粉碎化或液压剪切方法随机片段化的核酸构建单端测序或双端测序文库;(iv)下一代测序部件,用于使构建的文库经受下一代测序仪;和(v)读段获得部件,用于从所述下一代测序仪获得核酸读段。
[0084] 在本发明中,下一代测序仪可为Hiseq系统(Illumina Co.)、Miseq系统(Illumina Co.)、Genome Analyzer(GA)系统(Illumina Co.)、454FLX测序仪(Roche Co.)、SOLiDTM系统(Applied Biosystems Co.),或Ion Torrent系统(Life Technology Co.),但不限于此。
[0085] 在本发明中,比对部件可使用BWA算法和GRch38序列,但不限于此。
[0086] 在本发明中,质量控制部件可包含:
[0087] (i)区域指定部件,用于指定每个比对的核酸序列的区域;
[0088] (ii)序列指定部件,用于指定满足映射质量评分和GC含量的截断值的序列;
[0089] (iii)染色体分数计算部件,用于通过使用以下等式1计算指定的序列中的任何病例1的染色体N(ChrN)的分数:
[0090] 等式1:
[0091]
[0092] 等式2:
[0093]
[0094] (iv)Q评分计算部件,用于从任何病例1的除对应于染色体13、18和21的区域之外的染色体区域的Z评分的标准偏差计算Q评分;和
[0095] (vi)质量控制部件,用于确定Q评分的截断值,并且当计算的Q评分超过所述截断值时,确定Q评分不满足所述截断值,并且从感兴趣的样品再次产生读段。
[0096] 在本发明中,在区域指定部件中,每个核酸序列的区域可为20kb-1MB,但不限于此。
[0097] 在本发明中,序列指定部件中的映射质量评分可根据所希望的标准改变,但是可优选地为15-70分,更优选地为50-70分,最优选地为60分。
[0098] 在本发明中,序列指定部件中的GC含量可根据所希望的参考改变,但是可优选地为20至70%,最优选地为30至60%。
[0099] 在本发明中,质量控制装置的截断值可为4,优选地为3,最优选地为2。
[0100] 在本发明中,病例组意指用于检测胎儿性别和染色体拷贝数异常的样品,并且参考组意指可比较的参考染色体组,诸如参考基因组数据库,但不限于此。
[0101] 在本发明中,性别和拷贝数变异确定部件中的用于确定拷贝数变异的拷贝数变异确定部件可包含:
[0102] (i)随机排列部件,用于从染色体1至22中随机选择参考染色体;
[0103] (ii)染色体分数计算部件,用于通过以下等式3计算任何染色体N的分数值:
[0104] 等式3:
[0105]
[0106] (iii)G评分计算部件,通过以下等式4计算任何病例1的染色体N的G评分:
[0107] 等式4:
[0108]
[0109] (iv)参考染色体组合选择部件,用于重复进行部件(i)至(iii)的操作,由此选择使正常组与异常组之间的G评分差最大化的染色体组合;和
[0110] (v)拷贝数变异确定部件,用于使用在参考染色体组合选择部件中选择的染色体组合来计算G评分,并且当计算的G评分低于所述截断值时,确定拷贝数减少,并且当计算的G评分高于截断值时,确定拷贝数增加。
[0111] 在本发明中,最佳参考染色体组合G评分计算部件的重复次数可为100或更多,优选地为1,000或更多,最优选地为100,000或更多。
[0112] 在本发明中,可以无限制地使用拷贝数变异确定部件的G评分的截断值,只要它是对正常染色体计算的值,但是可优选地为-2或2,最优选地为-3或3,但不限于此。
[0113] 在本发明中,胎儿性别和拷贝数变异确定部件中的性别确定部件可包含:
[0114] (i)G评分截断计算部件,用于进行用于确定其中的胎儿核型为46、XX或46、XY的母体参考组中的用于确定拷贝数变异的拷贝数变异确定部件的部件(i)至(iv)的操作,由此获得X和Y染色体的G评分截断值;和
[0115] (ii)性别确定装置,用于将任何病例的X和Y染色体的G评分与截断值进行比较,由此确定性别。
[0116] 在本发明中,X和Y染色体的G评分截断值可为-2或2,最优选地为-3或3,但不限于此。在本发明中,当X染色体的G评分低于截断值时,确定性染色体为XO,当X染色体的G评分高于截断值时,确定存在三个或更多个X染色体,和当Y染色体的G评分高于截断值时,确定存在一个或多个Y染色体。
[0117] 在本发明中,当存在一个或多个Y染色体时,通过以下等式5计算X染色体胎儿分数,并通过以下等式6计算Y染色体胎儿分数,以由此通过以下等式7来计算Y染色体分数与X染色体分数的比率,从而当所述比率为0.7至1.4时,确定所述性染色体为XY,并且当所述比率为1.4至2.6时,确定所述性染色体为XYY:
[0118] 等式5:
[0119]
[0120] 等式6:
[0121]
[0122] 和
[0123] 等式7:
[0124]
[0125] 在又另一个方面,本发明涉及一种包含配置成由处理器执行的指令的计算机可读介质,其通过以下步骤来检测胎儿性别和拷贝数异常:a)从由母体生物样品中提取的DNA中获得读段;b)将获得的读段与参考基因组数据库比对;c)计算比对的读段的Q评分,并且仅选择等于或低于截断值的读段;和d)计算选择的读段的G评分,并且将所述G评分与参考染色体组合的G评分进行比较,由此确定胎儿性别和拷贝数变异。
[0126] 实施例
[0127] 以下,将参考实施例进一步详细描述本发明。对本领域普通技术人员将显而易见的是这些实施例仅用作示例说明的目的并且不被解释为限制本发明的范围。
[0128] 实施例1:从母体血液提取的DNA的下一代测序
[0129] 从总共358个妊娠妇女的每个中取样10mL的母体血液,并保存在EDTA管中。在取样后2小时内,在4℃以1200g离心血液15分钟以仅获得血浆,并且在4℃以16000g进一步离心通过离心获得的血浆10分钟以将血浆上清液与沉淀物分离。,使用QIAamp循环核酸试剂盒从分离的血浆中提取无细胞DNA。将2至4ng的DNA制成文库,并且在NextSeq系统中产生测序数据。
[0130] 实施例2:测序数据的质量控制
[0131] 预处理对于母体-胎儿遗传物质的混合物的测序数据,并且在计算z评分之前如下进行一系列程序。将在下一代测序仪(NGS)系统中产生的Bcl文件(包括测序信息)转换成fastq形式,然后通过使用BWA-mem算法将在fastq文件中的文库序列比对到参考基因组Hg19序列上。因为在文库序列比对过程中可能出现错误,进行用于修正错误的3个程序。首先,进行去除重叠文库序列的操作。然后,在通过BWA-mem算法比对的文库序列中,去除没有达到映射质量评分60的序列。最终,去除具有0.75或更小的映射能力的区域,并且使用LOESS算法修正根据染色体GC含量比对的文库序列的数量。在进行如上所述的一系列程序之后,产生对比对错误修正的bed文件。
[0132] 对于测序错误的质量控制,如下进行一系列程序。第一,计算每个染色体的相对分数。例如,可如下表达染色体1的相对分数:
[0133]
[0134] 在计算所有染色体的相对分数后,可如下表示病例1的染色体N区域的Z评分:
[0135]
[0136] 除对应于染色体13、18和21的区域之外的染色体区域的Z评分的标准偏差可表示为Q评分。
[0137] 因此,当病例1的Z评分分布的标准偏差值超过2时,其被确定为QC失败(测序错误),并且进行重新实验和数据再生。进行上述QC程序,并且作为结果,如图2和3所见,读段的分布是均匀的。
[0138] 实施例3:计算G评分和使用排列确定胎儿性别/拷贝数变异
[0139] 为了计算G评分,进行以下程序。第一,计算感兴趣的染色体的相对分数。例如,可如下表示特定染色体的相对分数:
[0140]
[0141] 可通过以下等式3表示特定染色体的相对分数:
[0142] 等式3:
[0143]
[0144] 另外,对于所有染色体,可如下表示受试者A的G评分:
[0145]
[0146] 可如以下等式4表示G评分:
[0147] 等式4:
[0148]
[0149] 计算正常人组的染色体N和受试者A的染色体N之间的G评分差的绝对值,并且进行随机排列,由此确定参考染色体组合,其中,该绝对值满足最大值。当比较结果时,随着随机排列增加,可通过大量排列分析获得如下表1所示具有50%或更多改善的结果。
[0150] 表1:染色体13、18和21的随机排列分析的结果
[0151]
[0152] 可通过每次分析中的最佳化操作改变参考染色体组合,并且如下表2所示,可获得在为了确定染色体13、18、21、X和Y的G评分所进行的10次操作中的5次或更多次中检测到的组合。
[0153] 表2:用来计算染色体13、18、21、X和Y的主要参考染色体组合
[0154]
[0155] 为了确定测试样品中的感兴趣的染色体是否会是非整倍性,计算并建立正常组的G评分范围。当发现脱离正常组的最大和最小G评分的异常值时,确定检测到染色体非整倍性。当异常值大于正常组的最大G评分时,确定添加感兴趣的染色体的拷贝数,并且当异常值小于正常组的最小G评分时,失去感兴趣的染色体的拷贝数。通过上述方法比较染色体异常组(三体性21、三体性18和三体性13)与正常组,并且作为结果,可见最大和最小G评分在染色体异常组和正常组之间不一致(图4)。另外,如下表3可见,当染色体非整倍性的G评分截断值分别为3(三体性21)、2.55(三体性18)和3.5(三体性13)时,以100%的灵敏度和100%的特异性检测到染色体异常(增加的拷贝数),并且特异性的90%置信区间的下限高于98%。
[0156] 表3:通过G评分计算方法进行的染色体异常检测的灵敏度和特异性
[0157]
[0158] 尽管已经参考具体特征详细描述了本发明,对本领域技术人员将显而易见的是这些描述仅用于优选的实施方式,并且不限制本发明的范围。因此,本发明的实质性范围将通过所附权利要求及其等同物定义。
[0160] 如上所述,根据本发明的用于确定胎儿性别和染色体拷贝数异常的方法可通过下一代测序(NGS)以更高的准确度检测胎儿性别,并且还可以更高的准确度检测难以检测的性染色体异常,诸如XO、XXX、XXY等,从而可增加该方法的商业使用。因此,本发明的方法可有效地用于产前诊断以在早期检测由胎儿性染色体异常导致的畸形。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈