首页 / 专利库 / 生物学 / 细胞增殖 / 分析细胞增殖性病症的方法和核酸

分析细胞增殖性病症的方法和核酸

阅读:37发布:2020-05-13

专利汇可以提供分析细胞增殖性病症的方法和核酸专利检索,专利查询,专利分析的服务。并且本 发明 提供用于检测,或用于检测和区分肝 细胞增殖 性病症或用于检测和区分结肠直肠细胞增殖性 疾病 的方法、核酸和 试剂 盒 。具体方面公开和提供基因组序列,其甲基化模式对于所述病症种类的改进的检测和区分有重要的用途,由此使得对患者的改进的诊断和 治疗 成为可能。,下面是分析细胞增殖性病症的方法和核酸专利的具体信息内容。

1.用于确定至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列的表达平的装置在制备用于检测和/或分类个体中细胞增殖性病症的方法的试剂盒中的用途,其中所述方法包括确定分离自所述个体的生物样品中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列的表达水平,其中欠表达和/或CpG甲基化表明所述病症存在或其种类。
2.如权利要求1所述的用途,其中癌性细胞增殖性病症区别于良性细胞增殖性病症,所述方法特征在于欠表达和/或CpG甲基化的存在表明癌性细胞增殖性病症的存在,而其不存在表明良性细胞增殖性病症的存在。
3.如权利要求1所述的用途,其中所述细胞增殖性病症为癌症。
4.如权利要求3所述的用途,其中所述细胞增殖性病症为肝细胞或结肠直肠癌。
5.如权利要求1-4任一项所述的用途,其中所述表达水平通过检测从所述基因转录的mRNA的存在与否或水平来确定。
6.如权利要求1-4任一项所述的用途,其中所述表达水平通过检测由所述基因或其序列编码的多肽的存在与否或水平来确定。
7.如权利要求6所述的用途,其中所述多肽通过一种或多种选自western印迹分析、色谱法、免疫分析、ELISA免疫分析、放射免疫分析、抗体法及其组合来检测。
8.如权利要求1-4任一项所述的用途,其中所述表达通过检测所述基因内CpG甲基化的存在与否来确定,其中甲基化的存在表明细胞增殖性病症的存在。
9.区分基因组DNA至少一个靶区域内甲基化和未甲基化CpG二核苷酸的至少一种试剂或成组试剂在制备用于检测和/或分类个体中细胞增殖性病症的方法的试剂盒中的用途,其中所述方法包括使从所述个体生物样品中分离的基因组DNA与所述至少一种试剂或成组试剂接触
其中所述靶区域包含或在严紧条件下杂交于至少一种分别选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少16连续核苷酸的序列,其中所述连续核苷酸包含至少一个CpG二核苷酸序列,由此至少部分地提供对细胞增殖性病症的检测和/或分类。
10.将其5位未甲基化的胞嘧啶基转化为尿嘧啶或在杂交性能方面可检测地不同于胞嘧啶的其它碱基的一种或多种试剂,和
扩增酶和至少一种包含至少9核苷酸连续序列的引物
在制备用于检测和/或分类个体中细胞增殖性病症的方法的试剂盒中的用途,其中所述方法包括:
a.提取或以其它方式从所述个体生物样品分离基因组DNA;
b.用所述一种或多种试剂处理a)的所述基因组DNA或其片段
c.使所述经处理的基因组DNA或其经处理的片段与所述扩增酶和所述至少一种引物接触,所述引物包括至少9核苷酸的连续序列,其互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO.42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203及其互补序列的序列,其中所述经处理的基因组DNA或其片段被扩增以产生至少一种扩增产物或不被扩增;以及
d.基于所述扩增物是否存在或其性质,确定选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的甲基化状态或水平,或者反映选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:
28、SEQ ID NO:159至SEQ ID NO:167的序列的多个CpG二核苷酸平均甲基化状态或水平的均值或值,由此至少部分地提供至少检测和分类细胞增殖性病症之一。
11.如权利要求9所述的用途,其中b)中处理所述基因组DNA或其片段包括使用选自亚硫酸氢盐、酸式亚硫酸盐、disulfite及其组合的试剂。
12.如权利要求9所述的用途,其中c)中的接触或扩增包括使用至少一种选自如下的方法:使用耐热DNA聚合酶作为所述扩增酶;使用缺乏5’-3’外切酶活性的聚合酶;使用聚合酶链式反应(PCR);产生带有可检测标记的扩增产物核酸分子。
13.如权利要求1-11中任一项所述的用途,其中从所述个体获得的所述生物样品选自细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。
14.如权利要求10所述的用途,其中所述方法还在步骤d)中包括使用至少一种核酸分子或肽核酸分子,其在各种情况下都包含互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:
31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203序列及其互补序列的至少9核苷酸长度的连续序列,其中所述核酸分子或肽核酸分子抑制其所杂交的所述核酸的扩增。
15.如权利要求10所述的用途,其中d)中的确定包括至少一种核酸分子或肽核酸分子的杂交,所述至少一种核酸分子或肽核酸分子在各种情况下包含互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:10至SEQ IDNO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203序列及其互补序列的至少9核苷酸长度的连续序列。
16.如权利要求15所述的用途,其中至少一种这种杂交核酸分子或肽核酸分子被连接到固相。
17.如权利要求15所述的用途,其中所述方法还包括使至少一种这种杂交的核酸分子延伸至少一个碱基。
18.如权利要求10所述的用途,其中d)中的确定包括对所述扩增产物的测序。
19.如权利要求10所述的用途,其中c)中的接触或扩增包括使用甲基化特异的引物。
20.一种或多种甲基化敏感限制酶和
扩增酶和适于扩增包含选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的至少两种引物在制备用于检测和/或分类细胞增殖性病症的方法的试剂盒中的用途,其中所述方法包括:
a.提取或以其它方式从得自所述个体的生物样品分离基因组DNA;
b.以一种或多种甲基化敏感限制酶消化a)的所述基因组DNA或其片段;
使b)的DNA限制酶消化产物与所述扩增酶和所述至少两种引物接触;以及
c.基于扩增产物存在与否,确定选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的甲基化状态或水平,由此至少部分地提供至少检测和分类细胞增殖性病症之一。
21.如权利要求20所述的用途,其中通过杂交至少一种核酸或肽核酸来确定扩增产物的存在与否,所述至少一种核酸或肽核酸等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ IDNO:167的序列的至少16碱基长片段。
22.衍生自基因组SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:
159至SEQ ID NO:167的经处理的核酸,其中所述处理适合于将所述基因组DNA序列的至少一个未甲基化的胞嘧啶碱基转化至尿嘧啶或在杂交上可检测地不同于胞嘧啶的其它碱基。
23.核酸,其包含选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:
39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203的经处理的基因组DNA序列及其互补序列的至少16连续核苷酸,其中所述处理合适于将所述基因组DNA序列的至少一个未甲基化的胞嘧啶碱基转变为尿嘧啶或在杂交上可检测地不同于胞嘧啶的其它碱基。
24.核酸,包含选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO.50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203及其互补序列的DNA序列的至少50连续核苷酸。
25.如权利要求22-24中任一项所述的核酸,其中所述连续碱基序列包含至少一个CpG、TpG或CpA二核苷酸序列。
26.核酸,包含用作诊断工具的选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167、SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203的核酸序列及其互补序列的至少16连续核苷酸。
27.适合于实施权利要求3所述的方法的试剂盒,包括a)多种能够在严紧或中等严紧条件下杂交至少一种选自Septin9(包括其所有转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT和SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列转录产物的寡核苷酸或多核苷酸;(b)适合于容纳所述寡核苷酸或多核苷酸以及包含所述转录产物的患者生物样品的容器,其中所述寡核苷酸或多核苷酸能在严紧或中等严紧条件下杂交所述转录产物,(c)检测(b)的杂交的工具;以及任选地,(d)使用和解释试剂盒结果的说明书
28.适合于实施权利要求5所述的方法的试剂盒,包括(a)检测至少一种选自
Septin9(包括其所有转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT和SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列的多肽的工具;(b)适合于容纳所述工具和包含所述多肽的患者生物样品的容器,其中所述工具能与所述多肽形成复合物;(c)检测(b)的复合物的工具。
29.适合于实施权利要求9的方法的试剂盒,包括(a)亚硫酸氢盐试剂;(b)适合于容纳所述亚硫酸氢盐和患者生物样品的容器;(c)含有两种寡核苷酸的至少一套寡核苷酸,其序列在各种情况下都等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:
10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203的序列的9或更优选18碱基长片段。
30.适合于实施权利要求9的方法的试剂盒,包括(a)甲基化敏感限制酶试剂;(b)适合于容纳所述试剂和患者生物样品的容器;(c)含有一种或多种核酸或肽核酸的至少一套寡核苷酸,其等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少9碱基长片段;以及任选地,(d)使用和解释试剂盒结果的说明书。
31.权利要求22-26的核酸和/或权利要求27-30的试剂盒在制备用于细胞增殖性病症的诊断和/或分类的试剂盒中的用途。

说明书全文

分析细胞增殖性病症的方法和核酸

[0001] 本申请是申请号为200680012490.0、发明名称为“分析细胞增殖性病症的方法和核酸”的中国专利申请的分案申请,该母案申请是2006年4月17日提交的PCT国际专利申请TPC/US2006/014131进入中国国家阶段的申请。

技术领域

[0002] 本发明涉及在相对于正常状态的疾病状态中表现出改变的表达模式的基因组序列。具体的实施方案提供了检测或者检测和区别细胞增殖性病症的方法、核酸、核酸阵列和试剂盒等。优选地,用于检测和诊断细胞增殖性病症的方法、核酸、核酸阵列和试剂盒可用于诊断癌症,尤其是结肠直肠和/或肝癌。
[0003] 相关申请的参考
[0004] 本申请要求2005年4月15日递交的美国临时专利申请60/672,242;2005年5月2日递交的60/676,997;2005年7月8日递交的60/697,521;2005年8月1日递交的60/704,860;2005年8月17日递交的60/709,318;2005年10月4日递交的60/723,602;以及2006年3月30日递交的60/787,402的优先权,将它们的整体都以参考方式并入本文。
[0005] 序列表
[0006] 按照37C.F.R.§1.52(e)(5)要求的序列表已作为1.82MB文本文件在以光盘(一张)提供,标题为“47675-187Sequence Listing.txt”,将其整体通过参考方式并入本文。

背景技术

[0007] 癌症的发病率和诊断。癌症在美国是第二位的主要死因。如果当前的筛选方法在患者顺应性、敏感性和易于筛选方面有所改进,则死亡率会有明显改善。现有的建议用来诊断癌症的方法一般是昂贵的,并且不适于用作人群广泛筛选测试。
[0008] 肝细胞癌(HCC)是世界上第四常见的癌症,其发生率从北美的每100,000人中2.1个至中国每100,000人中80个。在美国,据估计在2005年会有17,550新诊断病例并且15,420人因此死亡。肝脏超声、α甲胎蛋白平和常规CT扫描通常用于HCC(肝细胞或原发肝癌)的诊断评估,但是它们通常太不灵敏而不能用来检测多病灶的小损伤和用于作出治疗计划。
[0009] 在美国,结肠直肠癌的年发病率大约为150,000,每年有56,600个体死于结肠直肠癌。在普通群体中结肠直肠癌的终生险(lifetime risk)是约5至6%。尽管最近几年在筛选和早期检测结肠癌方面有不少努,但至今很多病例仍是在具有局部或远处转移的晚期被诊断出来。尽管治疗选择包括手术和辅助或姑息性化学治疗,但很多患者还是在几个月内死于它们癌症的进展。鉴定结肠癌发展中的分子变化可以帮助开发新的监测、筛选、诊断和治疗手段,它们会改善这些患者总的不良预后
[0010] 依照美国癌症协会,用于结肠直肠筛选的现有指导是使用五种不同手段之一在50岁或更大年龄平均风险个体中筛选。这些手段包括1)每年大便潜血测试(FOBT),2)每五年进行可曲性乙状结肠镜检查,3)每年的FPBT加上每五年的可曲性乙状结肠镜检查,4)每五年的双重对比钡剂灌肠法或5)每10年的结肠镜检查。尽管这些测试程序被医学界广泛接受,实施对结肠直肠癌的广泛筛选还没有实现。由于与这些操作相关的不适或不便,患者依从性是限制使用的主要因素。尽管FOBT测试是非侵入性操作,但是需要测试前3-5天的饮食和其它限制。这些测试的敏感性水平对于结肠直肠腺癌来说也非常低,依赖于试验而有较大波动。由于大多数腺瘤并不出血,对于检测腺瘤的敏感性测量来说则更差。相反,因为直接观察到结肠的内腔,更侵入性的操作如乙状结肠镜检查和结肠镜检查的敏感性则相当高。非随机的试验已评估了这些技术的有效性,但是使用病例对照研究的数据和来自国家息肉研究(National Polyp Study)(美国)的数据已显示除去腺瘤性息肉将导致CRC发病率76-90%的降低。乙状结肠镜检查的局限性在于仅观察结肠的左例,右侧结肠的损伤不被检测到。两种镜检操作都是昂贵的,要求使用泻药制剂,并具有增加的发病率和死亡率风险。显然,在结肠直肠癌的通用广泛筛选变得普通之前,需要具有增加的敏感性、特异性、易于使用和降低的费用的改进测试。
[0011] 早期结肠直肠检测通常是基于在无症状个体上每年进行的大便潜血测试(FOBT)。由包括美国癌症协会在内的几个医疗组织改编的当前建议要求大便潜血测试在年龄50开始,每年重复,直至患者不再能从筛查受益。阳性FOBT导致对肠的结肠镜检查;这是昂贵和侵入生的操作,具有每5,000检查中1个的严重并发症发病率。只有12%的具有血红素阳性大便的患者在结肠镜检时被诊断为癌症或大息肉。许多研究显示FOBT筛查不改善癌症相关的死亡率或整体存活率。对大便潜血测试的依从性很差,少于20%的群体按建议提供或完成FOBT。如果FOBT恰当地完成,则患者从三个顺序的肠运动收集粪样品。在患者遵从饮食指导并避免已知引起隐蔽胃肠道出血的药物时获得样品。实际上,医师常常没有恰当地指导患者,患者常常不按试验计划进行,并且一些患者发现收集大便样品的任务很困难或令人不快,从而与大便潜血测试有关的依从性很差。如果能相对于当前方法改进测试敏感性和特异性,则可降低测试的频率,消除连续收集样品、消除饮食和药物计划变动并改善患者依从性。伴随依从性问题的还有,FOBT检测结肠癌的敏感性和特异性很差。差的特异性导致不必要的结肠镜检,使结肠癌筛查增加了相当的费用。
[0012] FOBT的特异性已被计算为至多96%,而敏感性为43%(腺瘤)和50%(结肠直TM肠癌)。采用免疫测定FOBT可改进敏感性,如商标为“InSure ”的产品,具有改进的敏感性77%(腺瘤)和88.9%(结肠直肠癌)。
[0013] 分子疾病标志物。分子疾病标志物比其它类型的标志物具有几个优势,一个优势是即使样品量很小的样品和/或组织结构没有被维持的样品也能够相当有效地分析。在最近10年中,很多基因已显示在正常和结肠癌之间差异表达。但是,没有单一标志物或标志物组合被证实足以诊断结肠癌。基于大尺寸mRNA(High-dimensional mRNA)的方法最近被证实能够提供更好的手段来区分不同的肿瘤类型以及良性和恶性病变。但是,其作为常规诊断工具在临床环境中的应用被以下原因所阻碍:mRNA的极度不稳定、在某些触发物作用下快速出现的表达变化(例如样品收集)以及,更重要地,分析需要大量的mRNA(Lipshutz,R.J.等人,Nature Genetics21:20-24,1999;Bowtell,D.D.L Nature genetics suppl.21:25-32,1999),其通常不能从常规活检获得。
[0014] 已建议使用生物标志物来进一步改善FOBT的敏感性和特异性,这类测试的实例TM包括可从EXACT Sciences获得的PreGen-Plus 大便分析测试,其具有20%(腺癌)和52%(结肠直肠癌)的敏感性,两种情况下特异性均为95%。这种测试测定与结肠瘤的发生有关的23种DNA突变的存在。将DNA甲基化用作结肠癌标志物是已知的。例如,Sabbioni等人(Molecular Diagnosis7:201-207,2003)在98%结肠癌患者外周血中检测由TPEF、HIC1、DAPK和MGMT组成的一组基因的超甲基化。但是,这并没有为商业上可市场化的测试提供适合的基础,由于这种测试的特异性也必须足够高。
[0015] 结肠直肠癌的现有病理发生倾向于腺瘤的逐步进展,其包括异常发育的发生和最终的侵入性癌症迹象。以这种腺瘤-癌顺序发生的分子变化包括肿瘤抑制基因(APC、p53、DCC)的遗传和表观遗传变化,癌基因(K-ras)的活化以及DNA错配修复基因的失活。最近,又揭示了其它的分子变化和遗传缺陷。因而,Wnt信号通路的活化不仅包括APC基因的突变,也可由β-连环蛋白(catenin)突变引起。此外,TGF-β信号通路连同其信号转导蛋白SMAD4和SMAD2的改变已与结肠癌的发生相关。
[0016] 尽管有在理解结肠腺瘤和癌的病理学以及它们的遗传和分子变化方面的进步,但是在转移发生中的遗传和表观遗传变化方面了解不够。然而,被广泛接受的是,侵入过程和细胞外基质的蛋白水解以及渗透血管基底膜涉及粘附蛋白例如整合素受体家族的成员,粘素,免疫球蛋白超家族、层粘联蛋白结合蛋白以及CD44受体。除了粘附之外,转移形成的过程还包括诱导和调节血管发生(VEGF、bFGF)、诱导细胞增殖(EGF、HGF、IGF)以及活化蛋白水解酶(MMPs,TIMPs,uPAR)和抑制凋亡(Bcl-2、Bcl-X)。最近,其它的研究小组已将转移损伤中的遗传和分子变化与原发性结肠直肠癌中发现的变化进行了比较。这样,Kleeff等人报道了在原发和转移结肠直肠癌中候选肿瘤抑制基因DOC-2的缺失。此外,Zauber等人报道在他们一系列的42结肠直肠癌中,原发癌症中Ki-ras突变在全部42对原发和同时的转移性损伤中相同。类似地,在39对癌和同时的转移灶中APC位点的杂合性丢失是相同的。这些作者得出结论,对于Ki-ras和APC基因来说,在转移灶中的遗传变化与原发性结肠直肠癌中是相同的。但是,其它小组发现在转移性结肠癌中的遗传和分子变化,但它们不存在于原发癌中。这样,已报道了结肠直肠转移灶中染色体3p的LOH的出现。此外,使用比较基因组杂交,发现肝转移灶中的几种变化是转移损伤所独有的(-9q、-11q和-17q)。
[0017] CpG岛甲基化。除了突变,CpG岛的异常甲基化已被证实导致某些以前与多种癌症的病理发生有关的基因的转录沉默。CpG岛为富含CpG二核苷酸的短序列,通常在大约50%的全部人类基因的5’区域被发现。在这些岛中胞嘧啶的甲基化导致基因表达丧失,并在X染色体的失活和基因组印迹中有报道。
[0018] 最近,几个研究小组也分析了多种基因在结肠直肠癌中的甲基化,并报道通过启动子甲基化转录沉默p l6INK4、p l4ARF、p15INK4b、MGMT、hMLH1、GSTP1、DAPK、CDH1、TIMP-3、APC等等。因此,除了突变失活某些基因之外,这些基因的高甲基化也显著促进了这些疾病的病理发生。
[0019] 近些年来,在结肠癌中甲基化的几个基因已通过MS-APPCR被鉴别。除了其它以外,这些基因中还包括TPEF/HPP1,其常常在结肠癌中被甲基化,并且被两个不同的小组采用MS-APPCR方法鉴定(参见,例如Young J,Biden KG,Simms LA,Huggard P,Karamatic R,Eyre HJ,Sutherland GR,Herath N,Barker M,Anderson GJ,Fitzpatrick DR,Ramm GA,Jass JR,Leggett BA.HPP1:a transmembrane protein-encoding gene commonly methylated in colorectal polyps and cancers(在结肠直肠息肉和癌症中跨膜蛋白编码基因通常被甲基化).Proc NatlAcad Sci USA98:265-270,2001)。
[0020] 多因子途径。传统上,癌症诊断依赖于检测单一分子标志物(例如基因突变,升高的PSA水平)。遗憾的是,癌症是这样的一种疾病状态,其中单一标志物通常不能检测或区分多种形式的疾病。因此,仅识别单一标志物的测定已被证实仅具有限的预测价值。本发明的主要方面是,通过多种标志物的选择使用,基于甲基化的癌症诊断学以及筛查、诊断和治疗性监测这类疾会相对于使用单一标志物分析的现有技术提供显著的进步。这种多路的分析途径尤其适合于癌症诊断,因为癌症不是简单的疾病,这种多因子的“团组(panel)”途径在细胞学和临床上都与癌症的异质性一致。
[0021] 成功地将该团组方法用于基于甲基化的诊断测试的关键在于设计和开发可表征并区分疾病状态的优化的标志物团组。本发明描述了多种尤其有效和独特的基因团组,对该团组的一个或多个成员组合的甲基化分析使得能以特别高的敏感性、特异性和/或预测价值检测结肠细胞增殖性病症。
[0022] 医学测试的开发。任何医学筛查或诊断测试的两个关键性的可评估的衡量是其敏感性和特异性,其衡量该测试没有遗漏地精确检测所有受影响个体以及不错误地将没有目标疾病的个体包括在内(预测价值)进行得有多好。历史上,任何诊断检测受到非难都是由于较差的敏感性和特异性。
[0023] 真阳性(TP)结果是测试为阳性且该疾病状态存在的情况。假阳性(FP)结果是测试为阳性但该疾病状态不存在的情况。真阴性(TN)结果是测试为阴性且该疾病状态不存在的情况。假阴性(FN)结果是测试为阴性但该疾病状态不存在的情况。在这一点上:敏感性=TP/(TP+FN);特异性=TN/(FP+TN)以及预测价值=TP/(TP+FP)。
[0024] 敏感性是对在所测试的个体中测试正确检测靶疾病的测试能力的衡量。具有较差敏感性的测试产生高比例的假阴性,即个体具有该疾病,但被错误的鉴定为没有该特定疾病。假阴性的潜在危险是该患病个体仍保持为不能诊断和不治疗一段时间,在这段时间该疾病可能进展至晚期,这时即使有治疗方法,效果也可能不太有效。具有低敏感性的测试的实例为基于蛋白的HIV血液测试。这种类型的测试显示出较差的敏感性,因为其在疾病完全确立和病毒以相当数量侵入血流之前不能检测到病毒的存在。相反,具有高敏感性的测试的实例为采用聚合酶链式反应(PCR)的病毒载量检测。因为这种类型的测试可检测非常少量的病毒,所以得到高的敏感性。当遗漏诊断的后果重大时,高敏感性就尤其重要。
[0025] 另一方面,特异性是对测试准确鉴别患者没有该疾病状态的能力的衡量。具有较差特异性的测试产生高比例的假阳性,即个体被错误地诊断为具有该疾病。假阳性的缺陷是它们迫使患者接受不必要的医学程序治疗,连同它们的伴随性风险、精神和经济压力,并且其会对患者健康带来不良影响。导致难以开发具有高特异性的诊断测试的疾病的特征在于该疾病机制(尤其是癌症中)通常涉及多种基因和蛋白。此外,某些蛋白可因为与疾病状态不相干的原因而升高。具有高特异性的测试的实例为可检测p53突变的基于基因的测试。当与进一步的诊断操作或进一步的医学介入有关的费用或风险很高时,特异性就很重要。
[0026] 现有技术中的明确需求。公认的是现有技术中亟需改善癌症的筛查和早期检测。举例而言,如果可增加结肠癌筛查特异性,就会减少导致不必要结肠镜检查的假阳性测试结果的问题,产生成本的节约和改善的安全性。鉴于癌症的总体发病率,尤其是与现有的结肠直肠和肝细胞增殖性病症筛查方法相关的缺点,现有技术中很需要早期检测癌症,尤其是结肠癌的方法,以补充或替代现有的测试。
[0027] 本发明基因背景。人类Septin9基因(也称为MLL septin样融合蛋白、MLL septin样融合蛋白MSF-A、Slpa、Eseptin、Msf、septin样蛋白卵巢/乳腺septin(Ov/Br septin)以及Septin D1)位于染色体17q25位于叠连群AC068594.15.1.168501内,为Septin基因家族的成员。图1提供了Septin9基因的Ensembl注解,并显示了4个转录本变体,Septin9变体和Q9HC74变体(其为Septin9转录本的截短形式)。SEQ ID NO:1提供了所述基因的序列,包括Septin9和Q9HC74转录本的区域和启动子区域。SEQ ID NO:2和SEQ ID NO:3为其亚区域,分别提供了Septin9和Q9HC74转录本富含CpG的启动子区域的序列。
[0028] 据推测,Septin基因家族的成员与从膜泡运输到胞质分裂的多种细胞功能相关。破坏Septin9的作用将导致不完全的细胞分裂,参见Surka,M.C,Tsang,CW,and Trimble,W.S.Mol Biol Cell,13:3532-45(2002)。Septin9和其它的蛋白已显示为原癌基因MLL的融合伴侣分子(fusion partner),这表明了在肿瘤发生中的作用,参见Osaka,M,Rowley,J.D.和Zeleznik-Le,N.J.PNAS,96:6428-6433(1999)。Burrows等人报道了对卵巢癌中Septin9基因的多种亚型表达的深入研究,显示了多种转录本的组织特异性,参见Burrows,J.F.,Chanduloy等人,S.E.H.Journal of Pathology,201:581-588(2003)。
[0029] 近期对超过7000正常和肿瘤组织的研究(优先权日后发表的现有技术)表明Septin9亚型在数种肿瘤组织中始终过表达,参见Scott,M.,Hyland,P.L.等人,Oncogene,24:4688-4700(2005)。这些作者考虑该基因很可能是II型癌基因,其中RNA转录本加工的变化控制了不同蛋白产物的调节,并且这些改变的蛋白亚型的水平可以为恶性肿瘤中基因的作用提供答案。
[0030] 从FN1基因转录的MSF(迁移刺激因子)蛋白也已参与了致癌作用(参见WO99/31233),但是应注意的是,这种蛋白不是本申请的主题,目前未知其与Septin9/MSF基因及其转录产物有关。
[0031] 从以上引用的参考文献可以看出,连接所述基因和肿瘤发生的生物机制仍不清楚。在WO200407441中,声称该基因的增加的拷贝数和过表达是癌症标志物,并根据该观察结果进一步提供了诊断和治疗该癌症的手段。相应地,WO200407441是最接近的现有技术,因为其与本发明的方法和核酸有最多数目的共同特征,并且其涉及相同领域(癌症诊断)。本发明和WO200407441的主要区别在于本发明首次显示基因Septin9的欠表达(under-expression)与癌症相关。更具体地,这是通过甲基化分析来阐明的。表达和DNA甲基化的相关性,以及用于确定DNA甲基化的方法在现有技术中是已知的(参见WO99/28498)。但是,该欠表达与癌症的发生相关对于本领域技术人员并非显而易见,尤其是WO200407441描述了将所述表达调节至低水平作为对癌症的潜在治疗。
[0032] SEQ ID NO:28提供了位于染色体17q上的在Vitronectin(VTN,OMIM193190,登录号NM000638)和SARM基因(Stenl Alpha And Heat/Armnadillo Motifs-Containing Protein,OMIM607732)的重叠启动子区域中的富含CpG的序列。
[0033] VTN基因编码75-kD的糖蛋白(也称为血清扩散因子或补体S蛋白),该糖蛋白促进动物细胞在体外的粘附和扩展,抑制通过补体C5b-9复合物的细胞溶解,并在血液凝集中调节抗凝血酶III-凝血酶作用。在结肠癌细胞中观察到较高的Vitronectin表达(Exp Cell Res.1994Sep;214(1):303-12.)。此外,该基因的表达与癌细胞的进展和侵入性有关。表明VTN在肿瘤中被活化,通过特异性肽阻断vitronectin能够减小肿瘤大小(Bloemendal HJ,de Boer HC,Koop EA,van Dongen AJ,Goldschmeding R,Landman WJ,Logtenberg T,Gebbink MF,Voest EE.Cancer ImmunolImmunother.2004Sep;53(9):799-808.;Haier J,Goldmann U,Hotz B,Runkel N,Keilholz U.Clin Exp Metastasis.2002;19(8):665-72.)。
[0034] SARM蛋白由690基酸组成并含有被短的HEAT/armadillo重复序列包围的65氨基酸不育α(SAM)结构域。Northern印迹分析显示SARM反义RNA在癌细胞系中可以升高的水平被检测,与组织起源或转移潜力无关(Mink,M.;Fogelgren,B.;Olszewski,K.;Maroy,P.;Csiszar,K.Genomics74:234-244,2001.)。所述研究进一步证实,编码蛋白的SARM转录本仅在所研究的那些中的一个前列腺癌细胞系中表达。
[0035] SEQ ID NO:24提供了位于染色体3q23上基因叉头转录因子L2(FOXL2,脑垂体叉头因子,OMIM605597)下游的富含CpG序列。迄今为止,SEQ ID NO:1还不与任何种类的癌症相关。FOXL2编码区在哺乳动物中是高度保守的,免疫组织化学证据表明FOXL2是特异地在眼睑和胎儿以及成人卵巢滤泡细胞中表达的核蛋白。这表明FOXL2可能在卵巢体细胞分化和进一步的滤泡发育和/或维持中起作用(J.Med.Genet.39:916-922,2002.)。
[0036] 此外,FOXL2基因中的突变与睑裂狭小/上睑下垂/内眦赘皮/倒向性内眦赘皮综合征(BPES)有关,该综合征影响到眼睑和卵巢(Am.J.Hum.Genet.72:478-487,2003.;Hum.Mutat.24:189-193,2004)。因此,到目前为止,FOXL2并没有与癌症相关,但是其它的FOX家族成员已参与了癌症发生。FOXAl基因在食管和癌中被扩增和过表达,FOXM1基因在胰腺癌和基底细胞癌中上调,这是由于通过Sonic Hedgehog(SHH)途径的转录调节。
[0037] SEQ ID NO:27代表Six6(同源异形盒蛋白SIX6)基因的一部分,位于染色体14q上,别名包括同源结构域蛋白OPTX2、视力同源异形盒2、OPTX2、Sine眼同源异型盒同源物6、sine眼同源异型盒同源物6(果蝇)、Six9、SIX9。Six6基因与发育途径相关,其异常表达已与T细胞急性成淋巴细胞白血病癌症发生相关。
[0038] SEQ ID NO:25位于染色体17q21.31上,包含NGFR基因的启动子区以及NGFR基因自身(神经生长因子受体,也称为p75,OMIMl62010)的一部分。NGFR单独或与其它受体组合后结合到神经营养因子和神经突向外生长抑制因子。已证实NGFR在凋亡、外周神经的髓鞘化以及抑制轴突损伤后中枢神经细胞的再生中起作用(DobroWSky,R.T.;Werner,M.H.;Castellino,A.M.;Chao,M.V.;Hannun,Y.A.Science265:1596-1599,1994;Cosgaya,J.M.;Chan,J.R.;Shooter,E.M.Science298:1245-1248,2002;Wang,K.C;Kim,J.A.;Sivasankaran,R.;Segal,R.;He,Z.Nature420:74-78,2002.)。NGFR基因的甲基化之前已与结肠癌的发生相关(PCT/US04/020336)。
[0039] SEQ ID NO:26位于染色体17q2131上,包括基因TMEFF2的启动子区域。TMEFF2的甲基化已与结肠癌相关联Cancer Res.2000Sep1;60(17):4907-12。

发明内容

[0040] 本发明提供了检测和/或分类个体中细胞增殖性病症的方法,包括确定分离自所述个体的生物样品中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARMl、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的表达水平,其中欠表达(underexpression)和/或CpG甲基化表明所述病症存在或其种类。本发明的多个方面提供了有效和独特的遗传标志物,由此对所述标志物的表达分析使得能以特别高的敏感性、特异性和/或预测价值检测细胞增殖性病症。此外,所述标志物使得能区分癌性细胞增殖性病症(包括癌前状况)和良性细胞增殖性病症。本发明的标志物尤其适合于检测结肠直肠癌和肝细胞癌。在结肠直肠癌方面,本发明测试方法尤其适用于风险人群的筛查。本发明的方法优于现有技术的方法(包括行业中标准的FOBT),因为其改善的敏感性、特异性和可能的患者依从性。
[0041] 本发明的方法和核酸最优选地用于检测肝癌或将其与其它肝细胞增殖性病症区分开,或者用于检测结肠直肠癌或癌前结肠直肠细胞增殖性病症。
[0042] 在一个实施方案中,本发明提供了检测和/或分类个体中细胞增殖性病症的方法,包括确定分离自所述个体的生物样品中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列的表达水平,其中欠表达和/或CpG甲基化是所述病症存在或其种类的指示。在一个实施方案中,所述表达水平通过检测转录自所述基因的mRNA存在与否或水平来确定。在另一实施方案中,所述表达水平通过检测所述基因或其序列编码的多肽的存在与否或水平来确定。
[0043] 在另一优选的实施方案中,所述表达通过检测所述基因内CpG甲基化存在与否来确定,其中存在甲基化表明存在细胞增殖性病症。所述方法包括以下步骤:i)使从得自所述个体的生物样品(优选地选自血浆、血清、全血、分离的血细胞、分离自血液的细胞)中分离的基因组DNA与至少一种试剂或成组试剂接触,所述至少一种试剂或成组试剂区分所述基因组DNA至少一个靶区域内甲基化和未甲基化CpG二核苷酸,其中所述靶区域的核苷酸序列包含至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的至少一个CpG二核苷酸序列;及ii)至少部分地检测和/或分类细胞增殖性病症。优选地,所述靶区域包括或在严紧条件下杂交至少一种选自SEQ ID NO:1至SEQ ID NO3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少16连续核苷酸的序列。
[0044] 优选地,所述检测的敏感性为约75%至约96%,或约80%至约90%,或约80%至约85%。优选地,所述特异性为约75%至约96%,或约80%至约90%,或约80%至约85%。
[0045] 所述方法是新颖的,因为目前没有方法能通过分析体液来检测癌症,并且具有足够高的敏感性和特异性以用在商业上可行的和管理机构许可的测定中。例如,现有的用于检测并诊断结肠直肠癌的方法包括结肠镜检、乙状结肠镜检和大便潜血结肠癌。与这些技术相比,所公开的发明比结肠镜检的侵入性更小,并且如同(如果不高于)乙状结肠镜检和FOBT的特异性。体液测定的开发代表了比现有技术中已知的现有方法有明显的技术优势,其在于至少对于结肠直肠癌筛选来说,患者对单一的基于体液的测试的依从性会高于目前所推荐的用于FOBT的三次大便分析。
[0046] 作为进一步的说明,用于检测和诊断肝癌的现有方法包括PET和MRI成像以及抽吸物或活检组织的细胞学筛查。放射学筛查方法通常不在早期检测癌症,并且实施起来昂贵和耗时。细胞学筛查存在与活检(内出血)和抽吸(针迹散播和出血、胆汁性腹膜炎以及气胸)有关的风险。因而,在早期阶段检测癌症目前还是不可能的,并且由于早期检测大大改善患者预后,所以现有技术中亟需这样的筛查测试。
[0047] 在具体的实施方案中,所述方法包括使用至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列作为标志物来检测并区分细胞增殖性病症。本发明尤其适合于检测癌性细胞增殖性病症(包括在癌前阶段)。此外,本发明的方法和核酸使得能区分恶性细胞增殖性病症和良性细胞增殖性病症。本发明的方法和核酸在检测结肠直肠或肝癌性病症和癌前病症中尤其有效。此外,它们在区分癌性和良性细胞增殖性结肠直肠和肝细胞病症中有用。
[0048] 所述基因的用途可通过对基因表达的任何分析、通过mRNA表达分析或蛋白表达分析来实现。但是,在大多数本发明优选的实施方案中,是通过分析至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列及其启动子或调节元件的甲基化状态来实现区别和区分结肠直肠或肝细胞增殖性病症的。
[0049] 本发明提供了分析生物样品与细胞增殖性病症的产生相关的特征的方法,所述方法特征在于使至少一种选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的核酸或其片段与能够区分所述基因组序列或目的序列内甲基化和未甲基化CpG二核苷酸的试剂或成组试剂接触。
[0050] 本发明提供了确定基因组DNA的与瘤性细胞增殖性病症(例如癌症)有关的表观遗传参数的方法。所述方法在改善诊断、治疗和监测所述疾病方面有实用性。
[0051] 优选地,测试样品的来源选自细胞或细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、精液、粪便、尿、血及其组合。更优选地,所述来源选自粪便、血浆、血清、全血、分离的血细胞、从得自所述个体的血中分离的细胞。
[0052] 具体地,本发明提供了用于检测包括早期癌前阶段在内的瘤性细胞增殖性病症(优选结肠直肠和/或肝细胞)以及用于区分癌性和良性细胞增殖性病症的方法,包括:获得包含基因组核酸的生物样品;使所述核酸或其片段与一种试剂或多种试剂接触,所述一种试剂或多种试剂足以区分所述个体核酸的至少一种靶序列内的甲基化和未甲基化的CpG二核苷酸序列,其中所述靶序列包含或在严紧条件下杂交包含特定序列的至少16连续核苷酸的序列,该特定序列选自SEQ ID NO:1至SEQ ID NO3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO.159至SEQ ID NO:167,包含至少一个CpG二核苷酸序列的所述连续核苷酸;以及至少部分地基于所述区分,确定至少一个靶CpG二核苷酸序列的甲基化状态,或反映多个靶CpG二核苷酸序列的平均甲基化状态的均值或值。
[0053] 优选地,对靶序列内甲基化和未甲基化CpG二核苷酸序列的区分包括使至少一个这类CpG二核苷酸序列甲基化状态依赖地转变或不转变为对应的转变的或未转变的二核苷酸序列,所述至少一个这类CpG二核苷酸序列位于选自SEQ ID NO:10至SEQ ID NO:15,SEQ ID NOS:28至SEQ ID NO:33,SEQ ID NO:30至SEQ ID NO:31,SEQ ID NO:42至SEQ ID NO:43,SEQ ID NO:38至SEQ ID NO:39,SEQ ID NO:50至SEQ ID NO:51,SEQ ID NO:168至SEQ ID NO:203的序列及对应于该靶序列的其连续区域内。
[0054] 其它的实施方案提供了检测癌性细胞增殖性病症(或将它们与良性细胞增殖性病症区分开)的方法,尤其是结肠直肠或肝细胞的癌性细胞增殖性病症,包括:获得具有个体基因组DNA的生物样品;提取该基因组DNA;以一种或多种试剂处理基因组DNA或其片段,以将5位的未甲基化的胞嘧啶基转化为尿嘧啶或其它在杂交性质上可检测地不同于胞嘧啶的碱基;使经处理的基因组DNA或其经处理的片段与扩增酶和至少两种引物接触,所述引物在各种情况下都包含互补于或在中等严紧或严紧条件下杂交选自SEQ ID NO:10至SEQ ID NO:15,SEQ ID NO.28至SEQ ID NO:33,SEQ ID NO:30至SEQ ID NO:31,SEQ ID NO:42至SEQ ID NO:43,SEQ ID NO:38至SEQ ID NO:39,SEQ ID NO:50至SEQ ID NO:51,SEQ ID NO:168至SEQ ID NO:203序列及其互补序列的至少9核苷酸长连续序列,其中经处理的DNA或其片段被扩增以产生扩增产物或未被扩增;以及基于所述扩增产物的存在与否或性质,确定选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个、更优选多个CpG二核苷酸的甲基化状态或均值,或反映其甲基化水平的均值的值。
[0055] 优选地,确定包括使用至少一种以下方法:I)使至少一种包含至少9核苷酸长度的连续序列的核酸分子杂交,该连续序列互补于或在中等严紧或严紧条件下杂交选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203及其互补序列的序列;ii)使至少一种结合到固相的核酸分子杂交,该核酸分子包含至少9核苷酸长度连续序列,其互补于或在中等严紧或严紧条件下杂交选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:
30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203的序列;iii)使至少一种核酸分子杂交,该核酸分子包含互补于或在中等严紧或严紧条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列的序列的至少9核苷酸长度连续序列,并且延伸至少一种这种杂交的核酸分子至少一个核苷酸;以及iv)对扩增产物测序。
[0056] 其它的实施方案提供了分析(例如检测和/或分类)细胞增殖性病症的方法,包括:获得具有个体基因组DNA的生物样品;提取该基因组DNA;使包含一种或多种选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列或在严紧条件下与其杂交的序列的该基因组DNA或其片段与一种或多种甲基化敏感的限制酶接触,其中该基因组DNA被消化以产生消化片段或没有因此而被消化;以及基于至少一种这样的片段的存在与否或其性质,确定至少一种选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的基因组序列的至少一个CpG二核苷酸序列的甲基化状态,或者反映其多个CpG二核苷酸序列的平均甲基化状态的均值或值。优选地,在所述确定之前扩增被消化的或未被消化的基因组DNA。
[0057] 其它的实施方案提供了新的基因组和化学修饰的核酸序列以及寡核苷酸和/或PNA寡聚体,用于分析选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列内胞嘧啶甲基化模式。附图说明
[0058] 图1显示了Septin9和Q9HC74基因转录本的Ensembl人基因组注解。也显示了SEQ ID NO:2和SEQ ID NO:3的相对位置
[0059] 图2提供了三个图。左边的两个图显示了实施例2中结肠直肠癌和血液样品中测定SEQ ID NO:1(测定2)的敏感性。右边的图提供了结肠直肠癌检测的ROC。
[0060] 图3显示了实施例4的其它癌症中测定的甲基化水平。
[0061] 图4显示实施例4的其它非癌性疾病中测定的甲基化水平。
[0062] 图5至图29提供了实施例5的酸式亚硫酸盐测序数据的矩阵。该矩阵的每列代表一个样品的重复测序数据,每个样品的所有重复被分在一个中。矩阵的每行代表片段内的单一CpG位点。扩增产物的CpG数显示在矩阵的左侧。在每个CpG位置测量的甲基化的量由从浅灰色(0%甲基化)、至中灰(50%甲基化),至黑灰(100%甲基化)表示。一些扩增产物、样品或CpG位置未被成功测序,它们显示为白色。
[0063] 图5至图12提供了在4个以前被定量(通过HeavyMethyl分析)具有10%至20%甲基化的样品中,根据表21的基因组序列的酸式亚硫酸盐转化扩增产物的测序概况。
[0064] 图13至图20提供了在2个以前被定量(通过HeavyMethylTM分析)具有高于20%甲基化的样品中,根据表21的基因组序列的酸式亚硫酸盐转化扩增产物的测序概况。
[0065] 图21至图22提供了在3个健康个体血液样品中根据表21的基因组序列的酸式亚硫酸盐转化扩增产物的测序概况。
[0066] 图23至图29提供了在6个以前被定量(通过HeavyMethyl分析)具有低于10%甲基化(但高于0%)的样品中,根据表21的基因组序列的酸式亚硫酸盐转化扩增产物的测序概况。
[0067] 图30至图37每一个提供了3个图。左侧的两个图显示了实施例2中结肠直肠癌和血液样品中根据表12的测定的敏感性。上方的图显示了两种样品的二元分布,而下方的图提供了多类分布。所述图的Y轴显示具有大于显示在X轴上的定量值的甲基化水平的经分析样品的比例。

具体实施方式

[0068] 定义:
[0069] 术语“观测/预期比”(“O/E比”)指CpG二核苷酸在特定DNA序列中的频率,对应于[CpG位点数/(C碱基数x G碱基数)]/每一片段的带长(band length).
[0070] 术语“CpG岛”指满足以下标准的基因组DNA的连续区域:(1)对应于“观测/预期比”的CpG二核苷酸频率>0.6,以及(2)“GC含量”>0.5。CpG岛的长度通常但并非总是在约0.2至约1KB,或至2kb之间。
[0071] 术语“甲基化状态”或“甲基化状况”指DNA序列内一个或多个CpG二核苷酸处存在或不存在5-甲基胞嘧啶(“5-mCyt”)。DNA序列内一个或多个特定CpG甲基化位点(每处具有两个CpG二核苷酸序列)处的甲基化状态包括“未甲基化的”、“全甲基化的”和“半甲基化的”。
[0072] 术语“半-甲基化”或“半甲基化”指双链DNA的甲基化状态,其中只有一条链被甲基化。
[0073] 用在本文时,术语“AUC”为area under a curve(曲线下面积)的缩写。具体地,它指受试者工作特征(ROC)曲线下的面积。ROC曲线为真阳性率相对假阳性率的曲线,用于诊断测试的不同可能性临界值。其显示取决于所选临界值的敏感性和特异性之间的折中(敏感性的任何提高都会伴随有特异性的下降)。ROC曲线下的面积(AUC)是对诊断测试精确性的衡量(面积越大越好,最佳值是1,随机测试的ROC曲线位于对线,面积为0.5;参见J.P.Egan.Signal Detection Theory and ROC Analysis(信号检测理论和ROC分析),Academic Press,New York,1975)。
[0074] 术语“超甲基化”指相对于正常对照DNA样品内对应CpG二核苷酸处发现的5-mCyt的量来说,对应于测试DNA样品的DNA序列内一个或多个CpG二核苷酸处5-mCyt的出现率增加的平均甲基化状态。
[0075] 术语“低甲基化”指相对于正常对照DNA样品内对应CpG二核苷酸处发现的5-mCyt的量来说,对应于测试DNA样品的DNA序列内一个或多个CpG二核苷酸处5-mCyt的出现率减少的平均甲基化状态。
[0076] 术语“微阵列”在广义上,如本领域所接受地,指“DNA微阵列”和“DNA芯片”,包括所有已认可的固体支持物,并包括用于将核酸分子附于其上或在其上合成核酸的所有方法。
[0077] “遗传参数”为基因和序列的突变和多态性,为它们的调节进一步所需。被认为是突变的尤其是插入、删除、点突变、倒位以及多态性,并且尤其优选SNP(单核苷酸多态性)。
[0078] “表观遗传参数(epigenetic parameter)”尤其是指胞嘧啶甲基化。其它的表观遗传参数例如包括组蛋白的乙酰化,但是其不能采用所述的方法直接分析,但是其与DNA甲基化相关。
[0079] 术语“亚硫酸氢盐试剂”指包括亚硫酸氢盐(bisulfite)、disulfite、酸式亚硫酸盐(hydrogen sulfite)或其组合,如本文所公开的,用于区分甲基化的和未甲基化的CpG二核苷酸序列。
[0080] 术语“甲基化测定”指确定DNA序列内一个或多个CpG二核苷酸序列的甲基化状态的任何测定。
[0081] 术语“MS.AP-PCR”(甲基化敏感的随机引物聚合酶链式反应)指采用富含CG的引物全面扫描基因组以便能集中于最可能含有CpG二核苷酸的区域的本领域已知技术,如Gonzalgo等人,Cancer Research57:594-599,1997所描述的。
[0082] 术语“MethyLightTM”指本领域已知的由Eads等人,Cancer Res.59:2302-2306,1999描述的基于荧光的实时PCR技术。
[0083] 在本文使用的其实施方案中,术语“HeavyMethylTM”测定法指这样的测定,其中覆盖位于扩增引物之间或被扩增引物覆盖的CpG位置的甲基化特异的阻断探针(本文也称为阻断剂)使得甲基化特异的选择性扩增核酸样品成为可能。
[0084] 在本文使用的其实施方案中,术语“HeavyMethylTM MethyLightTM”测定法指TM TM TM TMHeavyMethyl MethyLight 测定,其是MethyLight 测定的变体,其中MethyLight 测定与覆盖扩增引物之间CpG位置的甲基化特异阻断探针联合。
[0085] 术语“Ms-SNuPE”(甲基化敏感单核苷酸引物延伸)指已知的由Gonzalgo&Jones,Nucleic Acids Res.25:2529-2531,1997描述的测定。
[0086] 术语“MSP”(甲基化特异PCR)指已知的由Herman等人,Proc.Natl.Acad.Sci.USA93:9821-9826,1996以及由美国专利5,786,146描述的甲基化测定。
[0087] 术语“COBRA”(联合的亚硫酸氢盐限制性分析)指已知的由Xiong &Laird,Nucleic Acids Res.25:2532-2534,1997描述的甲基化测定。
[0088] 术语“MCA”(甲基化的CpG岛扩增)指由Toyota等人,Cancer Res.59:2307-12,1999以及WO00/26401A1中描述的甲基化测定。
[0089] 术语“杂交作用”应被理解为寡核苷酸与互补序列沿样品DNA中Watson-Crick碱基配对线的键合,形成双链体结构。
[0090] 本文中定义的“严紧杂交条件”包括在68℃下在5x SSC/5x Denhardt溶液/1.0%SDS中杂交,并在室温下在0.2x SSC/0.1%SDS中洗涤,或者包括其已知的等同条件(例如这样的条件:杂交在60℃下在2.5x SSC缓冲液中进行,随后是在37℃下在低缓冲浓度下的几个洗涤步骤,并保持稳定)。本文中定义的中等严紧条件包括在42℃下在在3x SSC中洗涤,或其已知的等同条件。可改变盐浓度和温度参数以获得探针和靶核酸之间最佳水平的同一性。在现有技术中可获得对这些条件的指导,例如Sambrook等人,1989,Molecular Cloning,A Laboratory Manual(分子克隆实验指南),Cold Spring Harbor Press,N.Y.以及Ausubel等人,Current Protocols in Molecular Biology(最新分子生物学实验),(John Wiley&Sons,N.Y.)单元2.10。
[0091] 术语“甲基化特异限制酶”或“甲基化敏感限制酶”应被理解为根据其识别位点的甲基化状态而选择性消化核酸的酶。对于当识别位点未被甲基化或半甲基化时才特异剪切的限制酶来说,当识别位点被甲基化时,不会发生剪切,或以显著降低的效率剪切。对于当识别位点被甲基化时才特异剪切的限制酶来说,当识别位点未被甲基化时,不会发生剪切,或以显著降低的效率剪切。优选的是甲基化特异的限制酶,其识别序列含有CG二核苷酸(例如cgcg或cccggg)。对一些实施方案来说,进一步优选的为当该二核苷酸中的胞嘧啶在C5原子被甲基化时不切割的限制酶。
[0092] “非甲基化特异的限制酶”或“非甲基化敏感的限制酶”为与甲基化状态无关而以基本相同的效率切割核酸序列的限制酶。它们也被称为“甲基化非特异性限制酶”。
[0093] 术语“基因”应被认为是包括其所有的转录本变体(例如,术语“Septin9”应包括例如其截短的转录本Q9HC74)以及其所有的启动子和调节元件。此外,由于已知在所述基因内有多个SNP,所以该术语应被认为包括其所有的序列变体。
[0094] 术语“癌变前的”或“瘤变前的”或其等同用语应被认为是指正经历恶性转变的任何细胞增殖病症。就结肠直肠细胞增殖性病症来说,这类状况的实例包括高度发育异常的细胞增殖性疾病,包括以下类别的腺瘤:
[0095] 等级1:恶性腺体从肌粘膜渗透入息肉头部(polyp head)内的粘膜下层:
[0096] 等级2:相同的粘膜下层侵入,但存在于头部至茎部的接合处;
[0097] 等级3:侵入茎部;以及
[0098] 等级4:在连接至结肠壁的连接处侵入茎的基部(该等级对应于Dukes A期)。
[0099] 概述
[0100] 本发明提供检测和/或分类个体中细胞增殖性疾病的方法,包括确定分离自所述个体的生物样品中至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ1D NOS:160至SEQ ID NO:165的基因或基因组序列的表达水平,其中欠表达和/或CpG甲基化表明所述病症的存在或类别。所述标志物可以用于诊断瘤性细胞增殖性病症(癌症),包括疾病的癌变前期期间的早期检测,以及还用于区分瘤性和良性细胞增殖病症。本发明公开方法,其中瘤性细胞增殖性疾病和良性细胞增殖性疾病被区分开,所述方法的特征在于欠表达和/或存在CpG甲基化表明存在瘤性细胞增殖疾病或瘤前病症,其不存在则表明存在良性细胞增殖性疾病。
[0101] 本发明的标志物在检测或区分肝细胞增殖性病症或者检测或区分结肠直肠细胞增殖性病症方面尤其有效,由此提供了早期检测、分类和治疗所述病症的改良的手段。
[0102] 除了以上分析至少一个选自选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的甲基化的实施方案之外,本发明还提供具有新的应用的用于检测癌症尤其是肝癌和/或结肠直肠癌的成组的基因,包括选自至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列。
[0103] 在第一其它实施方案中,本发明是基于对至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的CpG甲基化状态的分析。进一步优选所述基因的序列如表1所示。
[0104] DNA的亚硫酸氢盐修饰为已知的用于评估CpG甲基化状态的工具。在真核细胞的DNA中,5-甲基胞嘧啶是最常见的共价碱基修饰。其例如在调节转录、遗传印迹以及肿瘤发生中起作用。因此确认5-甲基胞嘧啶作为遗传信息组分有相当大的意义。但是,5-甲基胞嘧啶不能通过测序来鉴定,因为5-甲基胞嘧啶与胞嘧啶有相同的碱基配对行为。此外,例如在PCR扩增过程中,5-甲基胞嘧啶携带的表观遗传信息则完全丢失。
[0105] 最常用于分析DNA中5-甲基胞嘧啶存在的方法是基于亚硫酸氢盐与胞嘧啶的特异反应,由此在随后的碱性水解后,胞嘧啶被转变为在配对行为上对应胸腺嘧啶的尿嘧啶。但重要的是,在这些条件下5-甲基胞嘧啶保持不被修饰。结果,原始的DNA以此方式被转变,使得原来在其杂交行为上不能与胞嘧啶区分开的甲基胞嘧啶现在可作为仅剩的胞嘧啶被常规的已知分子生物学技术检测到,例如通过扩增和杂交。所有这些技术都基于不同的碱基配对特性,现在可被充分利用了。
[0106] 就敏感性而言,现有技术由方法确定,该方法包括将待分析的DNA包封在琼脂糖基质中,由此防止DNA扩散和复性(亚硫酸氢盐仅与单链DNA反应),并且用快速透析替代所有的沉淀和纯化步骤(Olek A等人,A modified and improved methodfor bisulfite based cytosine methylation analysis(用于基于亚硫酸氢盐的胞嘧啶分析的改变和改进的方法),NucleicAcids Res.24:5064-6,1996))。因而有可能分析单个细胞的甲基化状态,说明该方法的实用性和敏感性。Rein,T等人,Nucleic Acids Res.,26:2255,1998提供了对检测5-甲基胞嘧啶的已知方法的综述。
[0107] 除了极个别例子外(例如,Zeschnigk M等人,Eur J Hum Genet.5:94-98,1997),该亚硫酸盐技术目前仅用于研究。在所有情况下,在亚硫酸氢盐处理后扩增已知基因的短的特异性片段,并且或者完全测序(Olek&Walter,Nat Genet.199717:275-6,1997),或者进行一个或多个引物延伸反应(Gonzalgo&Jones,NucleicAcids Res.,25:2529-31,1997;WO95/00669;美国专利6,251,594)以分析各个胞嘧啶位置,或者通过酶消化处理(Xiong&Laird,Nucleic Acids Res.,25:2532-4,1997)。通过杂交作用的检测在现有技术中也有描述(Olek等人,wO99/28498)。此外,也描述了使用亚硫酸氢盐技术针对单个基因的甲基化检测(Grigg&Clark,Bioessays,16:431-6,1994;Zeschnigk M等人,Hum Mol Genet.,6:387-95,1997;Feil R等人,NucleicAcids Res.,22:695-,1994;Martin V等人,Gene,157:261-4,1995;wO9746705以及WO9515373)。
[0108] 本发明还提供该亚硫酸氢盐技术与一种或多种甲基化测定的联合使用,用于确定至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列内的CpG二核苷酸序列的甲基化状态。基因组CpG二核苷酸可被甲基化或未被甲基化(或者分别称为上和下甲基化(up-and down-methylated))。但是,本发明的方法适于分析异质的生物样品,例如血液或粪便中的低浓度肿瘤细胞。因此,当分析这种样品中CpG位置的甲基化状态时,本领域技术人员可以使用定量测定法来确定特定CpG位置处的甲基化水平(例如百分比、份数、比率、比例或程度),而不是甲基化状态。相应地,术语甲基化状况或甲基化状态还应被认为是指反映CpG位置处甲基化程度的值。除非有明确说明,术语“超甲基化”或“上甲基化”应被认为是指甲基化水平超过特定的临界值,其中所述的临界值可以是代表给定群体的平均或中值甲基化水平的值,或优选为优化的临界水平。在本文中“临界”也可指“阈值”。在本发明的上下文中,对于在选自以下序列的基因或基因组序列内的或与其有关的(例如在启动子或调节区内)所有CpG位置来说,术语“甲基化的”、“超甲基化的”或“上甲基化的”应被认为是包括甲基化水平高于临界值零(0)%(或其等同值)甲基化,所述序列为Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165。
[0109] 根据本发明,确定SEQ ID NOS:1至SEQ ID NO:3,SEQ ID NO:24,SEQ ID NO:28,SEQ ID NOS:159至SEQ ID NO:167内CpG二核苷酸序列的甲基化状态在诊断和表征细胞增殖性疾病方面均有用处。甲基化测定方法。现有技术中已知多种甲基化测定方法,并且可与本发明联合使用。这些测定使得能够确定DNA序列内一个或多个CpG二核苷酸(例如CpG岛)的甲基化状态。其中,这类测定包括经亚硫酸氢盐处理的DNA的DNA测序、PCR(用于序列特异性扩增)、Southem印迹分析、使用甲基化敏感的限制酶以及其它技术。
[0110] 例如,通过使用亚硫酸氢盐处理,基因组测序被简化用来分析DNA甲基化模式和5-甲基胞嘧啶的分布(Frommer等人,Proc.Natl.Acad.Sci.USA89:1827-1831,1992)。此外,使用限制酶消化从经亚硫酸氢盐转变的DNA扩增的PCR产物,例如Sadri& Hornsby(Nucl.Acids Res.24:5058-5059,1996), 或 COBRA(Combined Bisulfite Restriction Analysis(联合的亚硫酸氢盐分析))(Xiong&Laird,Nucleic Acids Res.25:
2532-2534,1997)所描述的方法。
[0111] COBRA.COBRATM是可用于确定小量基因组DNA中特定基因座处的DNA甲基化水平的定量甲基化测定(Xiong&Laird,Nucleic Acids Res.25:2532-2534,1997)。简言之,将限制酶消化用于揭示经亚硫酸氢钠处理的DNA的PCR产物中甲基化依赖的序列差异。根据Frommer等人描述的方法(Proc.Natl.Acad.Sci.USA89:1827-1831,1992)首先通过标准亚硫酸氢盐处理将甲基化依赖的序列差异引入基因组DNA。随后采用对目的CpG岛特异的引物进行经亚硫酸氢盐转变的DNA的PCR扩增,接着是限制性内切酶消化、凝胶电泳以及采用特异的被标记的杂交探针检测。在原始DNA样品中的甲基化水平由被消化的和未被消化的PCR产物的相对量表示,其在大范围的DNA甲基化水平范围内为线性定量的。此外,这种技术可可靠地用于从显微解剖的石蜡包埋的组织样品获得的DNA。
[0112] 用于COBRATM分析的典型试剂(例如,可以在典型的基于COBRATM的试剂盒中找到)可以包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;限制性酶和适合的缓冲液;基因杂交寡核苷酸;对照杂交寡核苷酸;用于寡核苷酸探针的激酶标记试剂盒;以及标记的核苷酸。另外,亚硫酸氢盐转变试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);脱磺酸基缓冲液;以及DNA回收组分。
[0113] 优选地,诸如“MethyLightTM”(基于荧光的实时PCR技术)(Eads等人,Cancer TMRes.59:2302-2306,1999)、Ms-SNuPE (甲基化敏感的单核苷酸引物延伸)反应(Gonzalgo&Jones,NucleicAcidsRes.25:2529-2531,1997)、甲基化特异性PCR(“MSP”;Herman等人,Proc.Natl.Acad.Sci. USA93:9821-9826,1996;美国专利5,786,146)以及甲基化的CpG岛扩增(“MCA”;Toyota等人,Cancer Res.59:2307-12,1999)的测定被单独或与这些方法中的其它方法联合使用。
[0114] “HeavyMethylTM”测定技术是用于评估甲基化差异的定量方法,其基于对经亚硫酸氢盐处理的DNA的甲基化特异扩增。覆盖位于扩增引物之间或被扩增引物覆盖的CpG位置的甲基化特异阻断探针(在本文中也被称为阻断剂)使得甲基化特异选择性扩增核酸TM TM样品称为可能。在本文应用的其实施方案中,术语“HeavyMethyl MethyLight ”测定指TM TM TM
HeavyMethyl MethyLight 测定,其中MethyLight 测定与覆盖扩增引物之间CpG位置的TM
甲基化特异阻断探针联合。HeavyMethyl 测定也可与甲基化特异的扩增引物联合使用。
[0115] 通常用于HeavyMethylTM分析的典型试剂(例如,可在典型的基于MethyLightTM的试剂盒中找到)可以包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;阻断寡核苷酸;优化的PCR缓冲液和脱核苷酸;以及Taq聚合酶。
[0116] MSP.MSP(甲基化特异的PCR)使得能评估CpG岛内基本上任何CpG位点组的甲基化状态,而与甲基化敏感的限制酶的使用无关(Herman等人,Proc.Natl.Acad.Sci.USA93:9821-9826,1996:美国专利5,786,146)。简言之,用亚硫酸氢钠修饰DNA,将所有未甲基化的而不是甲基化的胞嘧啶转变为尿嘧啶,接着用相对于未甲基化DNA而特异于甲基化DNA的引物扩增。MSP仅需要小量的DNA,对给定CpG岛部位的0.1%的甲基化等位基因敏感,并且可在从石蜡包埋的样品中提取的DNA上进行。用于MSP分析的典型试剂(例如,可能在典型的基于MSP的试剂盒中找到)包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的甲基化的和未甲基化的PCR引物、优化的PCR缓冲液以及脱氧核苷酸和特异探针。
[0117] MethyLightTM.MethyLightTM测定为高通量定量甲基化测定,其使用基于荧光的实时PCR( )技术,在PCR步骤后不需要进一步的操作(Eads等人,Cancer Res.59:2302-2306,1999)。简言之,MethyLightTM方法以基因组DNA的混合样品开始,该混合样品根据标准操作(亚硫酸氢盐过程将未甲基化的胞嘧啶残基转变成尿嘧啶)在亚硫酸氢钠反应中被转变为甲基化依赖的序列差异的混合池。随后在“偏移的(biased)”反应(采用重叠已知CpG二核苷酸的PCR引物)中进行基于荧光的PCR。可在扩增过程水平以及在荧光检测过程水平上产生序列差别。
[0118] MethyLightTM测定可以用作基因组DNA样品中甲基化模式的定量测试,其中序列区分发生在探针杂交水平上。在该定量方式中,在重叠特定的推定甲基化位点的荧光探针存在下,PCR反应提供了甲基化特异的扩增。用于输入DNA量的无偏移对照由以下反应提供:其中引物和探针都不覆盖任何CpG二核苷酸。或者,通过以不“覆盖”已知甲基化位点TM的对照寡核苷酸(HeavyMethyl 和MSP技术的基于荧光的方式),或者以覆盖潜在甲基化位点的寡核苷酸探测偏移的PCR池来实现对基因组甲基化的定量测试。
[0119] MethyLightTM方法 可与任 何适 合的探 针一起 使用,如“ ”、等等。例如,用亚硫酸氢钠处理双链基因组DNA,并对其进行采用
探针的两套PCR反应之一;例如,采用MSP引物和/或HeavyMethyl阻断剂寡
核苷酸和 探针。该 探针为荧光“报道物”和“淬灭”分子双标记的,
并被设计为特异于相对高GC含量区,以至于其在PCR循环中以比正向或反向引物高约10℃的温度熔解。这使得 探针在PCR退火/延伸步骤中保持充分杂交。当Taq聚合
酶在PCR中酶合成新链时,其最终会遇到退火的 探针。Taq聚合酶5’至3’内
切酶活性随后将通过消化 探针而顶替它,从而释放荧光报道物分子用于采用实
时荧光检测系统定量检测其现在未被淬灭的信号。
[0120] 用于MethyLightTM分析的典型试剂(例如,可以在基于MethyLightTM的试剂盒中找到的)可以包括,但不限于:用于特定基因(或亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物; 或 探针;优化的PCR缓冲液以及脱氧核苷酸;以及Taq聚合酶。
[0121] QMTM(定量甲基化)测定为基因组DNA样品中甲基化模式的另一种定量测试,其中序列区分出现在探针杂交水平上。在这种定量方式中,PCR反应在荧光探针的存在下提供无偏移的扩增,其中该荧光探针重叠特定的推定甲基化位点。由这样的反应来提供输入DNA量的无偏移的对照:即其中引物或探针都不重叠任何CpG二核苷酸。或者,通过以不“覆盖”TM已知甲基化位点的对照寡核苷酸(HeavyMethyl 和MSP技术的基于荧光的方式),或者以覆盖潜在甲基化位点的寡核苷酸探测偏移的PCR池来实现对基因组甲基化的定量测试。
TM
[0122] QM 方法在扩增过程中可与任何适合的探针一起使用,如等等。例如,用亚硫酸氢钠处理双链基因组DNA,并对其使用无偏移的引物
和 探针。该 探针为荧光“报道物”和“淬灭”分子双标记的,并被设
计为特异于相对高GC含量区,以至于其在PCR循环中以比正向或反向引物高约10℃的温度熔解。这使得 探针在PCR退火/延伸步骤中保持充分杂交。当Taq聚合酶在
PCR中酶合成新链时,其最终会遇到退火的 探针。Taq聚合酶5’至3’内切酶活
性随后将通过消化 探针而顶替它,从而释放荧光报道物分子用于采用实时荧光
TM
检测系统定量检测其现在未被淬灭的信号。用于QM 分析的典型试剂(例如,可以在基于TM
QM 的试剂盒中找到的)可以包括,但不限于:用于特定基因(或亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物; 或 探针;优化的PCR缓冲液以及脱氧
核苷酸;以及Taq聚合酶。
[0123] Ms-SNuPE.Ms-SNuPETM技术是用于评估特定CpG位点的甲基化差异的定量方法,其基于亚硫酸氢盐处理DNA,接着是单核苷酸引物延伸(Gonzalgo&Jones,NucleicAcids Res.25:2529-2531,1997)。简言之,使基因组DNA与亚硫酸氢钠反应以将未甲基化的胞嘧啶转变为尿嘧啶,而保持5-甲基胞嘧啶不变。随后采用特异于经亚硫酸氢盐转变的DNA的PCR引物扩增所需的靶序列,分离所得到的产物并用作分析目的CpG位点处甲基化的模板。可分析小量的DNA(例如显微解剖的病理切片),其避免了使用限制酶确定CpG位点处的甲基化状态。
[0124] 用于Ms-SNuPETM分析的典型试剂(例如,可以在典型的基于COBRATM的试剂盒中找到)可以包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒、阳性对照引物;用于特定基TM因的Ms-SNuPE 引物;反应缓冲液(用于Ms-SNuPE反应);以及标记的核苷酸。另外,亚硫酸氢盐转变试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);脱磺酸基缓冲液;以及DNA回收组分。
[0125] SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ IDNO:28、SEQ ID NOS:159至SEQ ID NO:167的基因组序列,以及其非天然发生的经处理的变体SEQ ID NOS:1O至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ IDNO:31、SEQIDNOS:42至SEO ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203被确定在细胞增殖性病症尤其是结肠直肠和/或肝细胞增殖性病症的早期检测、分类和/或治疗方面具有新的应用。
[0126] 在一个实施方案中,本发明的方法包括以下步骤:i)使从个体获得的基因组DNA(优选从体液分离的)与至少一种试剂或一组试剂接触,所述试剂区分至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165(包括其启动子和调节区域)的基因或基因组序列内的甲基化和未甲基化的CpG二核苷酸;以及ii)以大于或等于80%的敏感性和大于或等于80%的特异性检测、或检测并区分结肠或肝细胞增殖性病症。
[0127] 优选地,所述敏感性为约75%至约96%、或约80%至约90%、或约80%至约85%。优选地,所述特异性为约75%至约96%、或约80%至约90%、或约80%至约85%。
[0128] 可通过任何的现有技术中的标准方法分离基因组DNA,包括使用可商购的试剂盒。简言之,当目的DNA在生物样品中被包裹在细胞膜中时,该生物样品必须被破碎并通过酶、化学或机械手段被裂解。随后例如通过蛋白激酶K的消化而清除蛋白和其它的污染物。接着从溶液中回收基因组DNA。这可以通过各种方法来实现,包括盐析、有机提取或将DNA结合到固相支持物。对方法的选择会受到多种因素的影响,包括时间、费用和所需的DNA的量。所有的临床样品种类,包括瘤性物质或瘤前物质,都适合用在本发明方法中,优选的为细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。体液为优选的DNA源;尤其优选的为血浆、血清、全血、分离的血细胞和从血液分离的细胞。
[0129] 随后,用区分基因组DNA至少一个靶区域内甲基化和未甲基化CpG二核苷酸的至少一种或成组试剂处理基因组DNA样品,其中所述靶区域包括或在严紧条件下杂交至至少一个序列的长度为至少16个连续核苷酸的序列,所述至少一个序列选自分别选自SEQ ID NOS:1至SEQ TD NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167,其中所述连续核苷酸包括至少一个CpG二核苷酸序列。
[0130] 尤其优选的是,所述试剂将未在5’位甲基化的胞嘧啶碱基转变为尿嘧啶、胸腺嘧啶或其它在杂交行为上不同于胞嘧啶的的另一碱基。但是,在另一实施方案中,所述试剂可以为甲基化敏感的限制酶。
[0131] 当基因组DNA被这种方式处理,以便使在5’位未甲基化的胞嘧啶碱基转变为尿嘧啶、胸腺嘧啶或其它在杂交行为上不同于胞嘧啶的的其它碱基时,优选这种处理用亚硫酸氢盐进行(酸式亚硫酸盐、亚硫酸氢盐(disulfite))并且随后碱性水解。这种处理导致SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167(分别)被转变为SEQ ID NOs:10至SEQ ID NO:15、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:168至SEQ ID NO:185,其中所述CpG二核苷酸为甲基化的,或SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOs:42至SEQ ID NO:43、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:186至SEQ ID NO:203,其中所述CpG二核苷酸为未甲基化的。
[0132] 随后分析经处理的DNA,以便确定靶基因序列(处理前至少一个基因或基因组序列选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165)的甲基化状态。尤其优选的是,该靶区域包括或在严紧条件下杂交至至少一个基因或基因组序列的至少16连续核苷酸,所述至少一个基因或基因组序列选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165。优选分析SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的基因序列。所述分析方法可以选自现有TM技术中已知的那些,包括那些列在本文中的。尤其优选的是MethyLight 、MSP以及使用本TM
文描述的阻断寡核苷酸(HeavyMethyl )。进一步优选的是,用在这种分析中的任何寡核苷酸(包括引物、阻断寡核苷酸以及检测探针)应该反向互补于、等同于或在严紧或高度严紧条件下杂交SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:
30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列中的一种或多种碱基序列的至少16个碱基对长的片段。
[0133] 异常甲基化,更具体地是选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165(包括它们的启动子和/或调节区)的基因或基因组序列的超甲基化与瘤性细胞增殖性病症的存在有关,在结肠直肠和肝细胞瘤中尤其普遍。因此,当生物样品表现出任何程度的甲基化时,所述样品应被确定为瘤性的。
[0134] 对选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列之一的分析首次使得能够以高于或等于80%的敏感性以及高于或等于80%的特异性检测或检测并区分结肠或肝细胞增殖性病症。敏感性的计算为:(检测到的瘤/所有的瘤);例如(检测到的结肠瘤/所有的结肠瘤);特异性的计算为(未检测到的阴性/总的阴性)。
[0135] 优选地,所述敏感性为约75%至约96%、或约80%至约90%、或约80%至约85%。优选地,所述特异性为约75%至约96%、或约80%至约90%、或约80%至约85%。
[0136] 本文所定义的瘤为所有的大于1cm结肠恶性肿瘤以及腺瘤,或其亚型。阴性可被定义为健康个体。
[0137] 在一个实施方案中,所述方法公开了选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165(或其启动子和/或调节区)的至少一个基因或基因组序列用作区别、检测和区分细胞增殖性病症(尤其是瘤性的结肠或肝脏病症)的标志物。
[0138] 所述方法可以通过任何分析从它们转录的RNA的表达或从所述RNA翻译的多肽或蛋白的表达来实现,优选通过mRNA表达分析或多肽表达分析。因此,本发明还提供诊断测定和方法,定量和定性地检测个体中至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的表达,并由此确定在所述个体中是否存在癌症。
[0139] 自选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列转录的mRNA的异常表达与个体中癌症的存在相关。根据本发明,欠表达(和/或存在甲基化)与癌症的存在相关,反之过表达(和/或不存在甲基化)与不存在癌症相关。尤其优选地,确定至少一个如SEQ ID NOS:16至SEQ ID NO:19中公开的基因Septin9的转录变体的表达。
[0140] 为了检测编码基因或基因组序列的mRNA的存在,从患者去得样品。该样品可以是任何适合的包含肿瘤的细胞物质的样品。适合的样品种类包括细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,及其所有可能的组合。优选地,所述样品种类为粪便或体液,选自结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞。
[0141] 所述样品可以被处理以提取其中所含的RNA。随后分析从该样品所得的核酸。现有技术中已知很多用于确定基因表达的绝对和相对水平的技术,适合用在本发明中的常用技术包括原位杂交(例如FISH)、Northern分析、RNA酶保护测定(RPA)、微阵列和基于PCR的技术,例如定量PCR和差异显示PCR或任何其它的核酸检测方法。
[0142] 尤其优选的是使用逆转录/聚合链式反应技术(RT-PCR)。RT-PCR方法在现有技术中是公知的(例如,参见上文Watson and Fleming)。
[0143] RT-PCR方法可如下进行。通过例如标准的异硫氰酸胍方法分离细胞总RNA,并且逆转录该总RNA。该逆转录方法包括采用逆转录酶和3’端寡核苷酸dT引物和/或随机六聚体引物在RNA模板上合成DNA。由此产生的cDNA随后被PCR扩增(Belyavsky等人,Nucl Acid Res17:2919-2932,1989;Krug and Berger,Methods in Enzymology(酶学中的方法),Academic Press,N.Y.,Vol.152,pp.316-325,1987,通过参考将它们引入)。进一步优选的是RT-PCR的“实时”变体,其中所述PCR产物通过杂交探针(例如TaqMan、Lightcyc1er、Mo1ecu1ar Beacons&Scorpion)或SYBR绿来检测。然后,参照标准曲线或通过将Ct值与校准标准的Ct值比较而将从探针或SYBR绿检测到的信号定量。对看家基因的分析经常用来标准化结果。
[0144] 在Northern印迹分析中,在变性琼脂糖凝胶上分离总mRNA或po1y(A)+mRNA,并在该干燥的凝胶自身中或膜上杂交至标记的探针。所得的信号与RNA群中靶RNA的量成比例。
[0145] 对来自两个或多个细胞群或组织的信号的比较揭示基因表达水平的相对差异。可通过将信号与采用已知量的对应于靶RNA的体外转录本产生的标准曲线进行比较来进行绝对定量。对看家基因的分析经常用于标准化结果,排除了由于转移至膜上的RNA的不同或上样到凝胶上的RNA的不同所引起的任何明显差异,所述看家基因是表达水平与条件无关而预期保持相对恒定的基因。
[0146] Northern分析中的第一步是从目的细胞或组织分离纯的、完整的RNA。因为Northern印迹通过大小来区分RNA,样品的完整性影响信号在单条带中的集中度。部分降解的RNA样品将导致信号模糊或分布在几个条带,导致敏感性的总体上的降低并可能导致对数据的错误解释。在Northern印迹分析中,可使用DNA、RNA以及寡核苷酸探针,这些探针优选被标记(例如,放射性标记物、质谱标记物(mass1abe1)或荧光标记物)。靶RNA,而不是探针的大小将决定检测到的条带的大小,所以诸如产生不同长度探针的随机引物标记的方法适用于探针分析。探针的特异活性将决定敏感性的水平,所以优选使用具有高特异活性的探针。
[0147] 在RNA酶保护测定中,RNA靶和具有确定长度的RNA探针在溶液中杂交。杂交后,用特异于单链核酸的RNA酶(RNase)消化RNA以除去任何未杂交的单链靶RNA和探针。使RNA酶失活,并且例如通过变性聚丙烯酰胺凝胶电泳来分离RNA。完整RNA探针的量与RNA群中的靶RNA的量成比例。RPA可用于基因表达的相对和绝对定量,并且也用于绘制RNA结构,例如内含子/外显子边界和转录起始位点。RNA酶保护测定优于Northern印迹分析,因为其具有较低的检测限
[0148] 用于RPA中的反义RNA探针通过体外转录具有明确端点的DNA模板而生成,通常在50-600核苷酸的范围内。使用包括额外的不与靶RNA同源的序列的RNA探针使得被保护的片段与全长探针区分开。RNA探针通常替代DNA探针使用,这是因为易于产生单链RNA探针以及用RNase消化RNA:RNA双链体的重现性和可靠性(AuSube1等人,2003),尤其优选的是具有高特异活性的探针。
[0149] 尤其优选的是使用微阵列。微阵列方法可被划分为两个主要部分。第一个是将已知的基因序列固定到载玻片或其它固体支持物上,随后是荧光标记的cDNA(包含待研究的序列)与该固定到载玻片(或其它固相)上的已知基因的杂交。杂交后,采用荧光微阵列扫描仪扫描阵列。对不同基因相对荧光强度的分析提供了对基因表达差异的衡量。
[0150] 可通过将预先合成的寡核苷酸固定到制备的载玻片或其它固体表面来产生DNA阵列。这种情况下,采用标准寡核苷酸合成和纯化方法来加工和制备代表性的基因序列。这些合成的基因序列互补于目的基因的RNA转录本(这种情况下,基因或基因组序列选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165),并且倾向于25-70核苷酸范围内的短序列。在优选的实施方案中,所述寡核苷酸或多核苷酸包括与选自SEQ ID NOS:16至SEQ ID NO:19以及其互补序列的至少一个序列互补或杂交的序列的至少9、18或25个碱基。或者,固定的寡聚体可在载玻片表面上原位化学合成。原位寡核苷酸合成涉及将合适的核苷酸连续地添加至微阵列上的点;未接受核苷酸的点在该方法的每个阶段采用物理或实际掩蔽物来保护。优选地,所述合成的核酸为定的核酸。
[0151] 在分析表达的微阵列实验中,所用的RNA模板代表所研究的细胞或组织的转录谱。首先从待比较的细胞群或组织中分离RNA。然后将每一RNA样品用作模板通过逆转录反应来产生荧光标记的cDNA。该cDNA的荧光标记可通过直接标记或间接标记方法来实现。在直接标记中,荧光修饰的核苷酸(例如, -或 -dCTP)在逆转录反应中被直接
掺入到cDNA中。或者,可通过在cDNA合成期间掺入氨基烯丙基修饰的核苷酸,接着在逆转录反应结束后将N-羟基琥珀酰亚胺(NHS)-脂染料偶联到该氨基烯丙基修饰cDNA来完成间接标记。或者,该探针可为未标记的,但可以通过与直接或间接标记的配体特异结合而被检测。用于标记配体(和探针)的标记物和方法在本领域是已知的,包括例如可通过已知方法(例如缺口平移或激酶磷酸化(kinasing))掺入的放射性标记物。其它合适的标记物包括但不限于生物素、荧光团、化学发光团(例如二氧杂环己烷,尤其是引发的二氧杂环己烷、酶、抗体等。
[0152] 为了进行差别基因表达分析,从不同RNA样品产生的cDNA被 标记。所得到的标记的cDNA被纯化以除去未掺入的核苷酸、游离染料和残留RNA。纯化之后,标记的cDNA样品被杂交至微阵列。该杂交的严紧性由杂交过程中和洗涤过程中的多种因素决定,包括温度、离子强度、时长和甲酰胺的浓度。例如在Sambrook et al.(Molecular Cloning:
A Laboratory Manual(分子克隆:实验室手册),2nd ed.,1989)中概述了这些因素。杂交后使用荧光微阵列扫描仪扫描微阵列。每个点的荧光强度表示所分析基因的表达水平;亮点对应于强表达的基因,而暗点表示弱表达。
[0153] 一旦获得了图像,需要分析原始数据。首先,必须从每个点的荧光中减去背景荧光。然后将数据相对对照序列标准化,对照序列例如外源添加的核酸(优选RNA或DNA),或看家基因组,以弥补任何非特异的杂交、阵列缺陷或测定装置、cDNA标记、杂交或洗涤的差异。数据标准化使得可对多个测定的结果进行比较。
[0154] 本发明的另一方面涉及用于根据本发明的方法诊断个体中癌症中的试剂盒,所述试剂盒包括:测量选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列转录水平的组件。在优选的实施方案中,用于测量转录水平的组件包含能够在严紧或中等严紧条件下与选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQID NO:165的基因或基因组序列的转录产物杂交的寡核苷酸或多核苷酸。优选地,所述寡核苷酸或多核苷酸能够在严紧或中等严紧条件下与选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:
165的基因或基因组序列的至少一种转录产物杂交,如SEQ ID NOS:16至SEQ ID NO:19中所提供的。在一个实施方案中,所述寡核苷酸或多核苷酸包含与选自SEQ ID NOS:16至SEQ ID NO:19及其互补序列的至少一个序列互补或杂交的序列的至少9、18或25个碱基。
[0155] 在最优选的实施方案中,通过选自Northern印迹分析、逆转录酶PCR、实时PCR、RNA酶保护、以及微阵列的技术来确定转录水平。在本发明的另一实施方案中,该试剂盒还包含用于从患者获得生物样品的装置。优选地,试剂盒还包括容器,其最优选适合于盛装用于测定转录水平的组件和患者的生物样品,最优选地,还包括使用以及解释试剂盒结果的说明书
[0156] 在优选的实施方案中,该试剂盒包括(a)能够在严紧或中等严紧条件下与选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的至少一种基因或基因组序列的转录产物杂交的多种寡核苷酸或多核苷酸;(b)容器,优选适于盛装所述寡核苷酸或多核苷酸以及包含转录产物的患者生物样品,其中所述寡核苷酸或多核苷酸能够在严紧或中等严紧条件下与所述转录产物杂交;(c)用于检测(b)的杂交的组件,以及任选地,(d)使用和解释试剂盒结果的说明书。进一步优选地,所述(a)的寡核苷酸或多核苷酸的每一种都包含与选自SEQ ID NOS:16至SEQ ID NO:19及其互补序列的至少一个序列互补或杂交的序列的至少9、18或25个碱基。
[0157] 所述试剂盒也可含有其它的组分,诸如包装在分开容器中的杂交缓冲液(其中寡核苷酸将被用作探针)。或者,当所述寡核苷酸将被用于扩增靶区域时,所述试剂盒可以含有包装在分开容器中的聚合酶和优化的用于聚合酶介导的引物延伸的反应缓冲液,如PCR。优选地,所述聚合酶是逆转录酶。进一步优选的是所述试剂盒还含有RNA酶试剂。
[0158] 本发明还提供用于检测从患者获得的样品中是否存在由所述基因序列编码的多肽的方法。
[0159] 由选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列编码的多肽的多肽表达水平异常与癌症的存在相关。
[0160] 根据本发明,所述多肽的欠表达与癌症的存在相关。尤其优选地,所述多肽为转录自Septin9基因的SEQ ID NOS:20至SEQ ID NO:23多肽提供的至少一种氨基酸序列。
[0161] 可以使用任何现有技术中已知的用于检测多肽的方法。这类方法包括,但不限于质谱法、免疫扩散法、免疫电泳法、免疫化学方法、结合物-配体测定法、免疫组化技术、凝集和补体测定法(例如,参见Basic and Clinical Immunology(基础和临床免疫学),Sites and Terr,eds.,Appleton&Lange,Norwalk,Conn,pp217-262,1991,将其通过参考并入本文)。优选的是结合物-配体免疫测定方法,包括使抗体与一个或多个表位反应,并竞争性地置换标记的多肽或其衍生物。
[0162] 本发明的某些实施方案包括使用特异于由选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列编码的多肽的抗体。尤其优选的是,所述多肽为SEQ ID NOS:20至SEQ ID NO:23提供的至少一种氨基酸序列。
[0163] 这类抗体可用于癌症诊断。在某些实施方案中,单克隆或多克隆抗体的产生可通过用由SEQ ID NOS:20至SEQ ID NO:23的多肽编码的表位作为抗原来诱导。这类抗体叉可用于检测作为癌症诊断标记物的表达的多肽。可通过常规方法定量这些多肽的存在水平。可以通过多种现有技术中已知的手段来检测和定量抗体-多肽结合,诸如用荧光或放射性配体标记。本发明还包括用于进行上述方法的试剂盒,其中这些试剂盒含有特异于所研究多肽的抗体。
[0164] 本领域公知多种竞争性和非竞争性多肽结合免疫测定法。在这些测定中使用的抗体可以是未被标记的,例如用在凝集测试中,或被标记的,用于多种测定方法。可使用的标记物包括放射性核素、酶、荧光剂、化学发光剂、酶底物或辅因子、酶抑制剂、颗粒、染料等等。优选的测定包括但不限于放射免疫测定(RIA),酶免疫测定,例如酶联免疫吸附测定(ELISA)、荧光免疫测定等。可通过本领域已知的多种方法中的任何方法来制备用于免疫测定的多克隆或单克隆抗体或其表位。
[0165] 在所述方法的其它实施方案中,所述蛋白可以用western印迹分析来检测。所述分析在本领域中是标准的。简言之,通过电泳如SDS-PAGE将蛋白分开。随后将分开的蛋白转移至适合的膜(或纸)上,如硝酸纤维素,同时保持通过电泳获得的空间分离。接着将膜与结合膜上剩余的有结合性位置的封闭试剂一起孵育,通常使用的试剂包括一般蛋白(例如乳蛋白)。然后,加入特异于目的蛋白的抗体,所述抗体被可检测地标记,例如通过染料或酶学方法(例如碱性磷酸酶或辣根过氧化物酶)。随后检测所述抗体在膜上的位置。
[0166] 在该方法的其它实施方案中,所述蛋白可以通过免疫组化方法来检测(使用抗体来探测样品中的特异抗原)。所述分析在现有技术中是标准的,其中对组织中抗原的检测被称为免疫组织化学,而在培养细胞中的检测通常称为免疫细胞化学。简言之,初级抗体通过结合到其特异抗原而被检测。随后,该抗体-抗原复合物被次级酶偶联的抗体结合。在必要的底物和发色团存在下,根据在抗体-抗原结合位点处的有色沉积来检测结合的酶。适合的样品种类、抗原-抗体亲和性、抗体种类以及检测增强方法都有多种。因此,用于免疫组织化学或免疫细胞化学检测的最优条件必须由本领域技术人员为每个个例单独确定。
[0167] 一种制备针对多肽的抗体的方法为:选择并制备该多肽的全部或部分氨基酸序列,化学合成该氨基酸序列并将其注射进适合的动物,通常是兔或小鼠(Milstein and Kohler Nature256:495-497,1975;Gulfre and Milstein,Methods in Enzymology:Immunochemical Techniques(酶学中的方法:免疫化学技术)73:1-46,Langone and Banatis eds.,Academic Press,1981,将其整体通过参考并入本文)。制备多肽或其表位的方法包括,但不限于化学合成、重组DNA技术或从生物样品分离。
[0168] 在该方法的最后步骤中,确定患者的诊断结果,其中(选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的至少一种基因或基因组序列的)欠表达表明存在癌症。术语欠表达应被认为是指检测到的水平少于预先确定的临界值,该临界值可以从均值、中值或优化的阈值中选择。
[0169] 本发明的另一方面提供用于根据本发明方法诊断个体中癌症的试剂盒,包括:用于检测至少一个选自Septin9(包括其所有的转录本变体)、FOXL2、SARMl、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的多肽的组件。优选地,所述多肽的序列如SEQ ID NOS:20至SEQ ID NO:23所提供的。用于检测所述多肽的组件优选包括抗体、抗体衍生物或抗体片段。所述多肽最优选通过利用标记的抗体的Western印迹来检测。在本发明的另一实施方案中,该试剂盒还包括获得患者生物样品的组件。优选地,试剂盒还包括适于盛装检测患者生物样品中多肽的容器,最优选还包括使用和解释试剂盒结果的说明书。在优选的实施方案中,所述试剂盒包括:(a)用于检测至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列多肽的组件;(b)适于盛装所述组件和包含所述多肽的患者生物样品的容器,其中所述组件能够与所述多肽形成复合物;(c)检测(b)的复合物的组件;以及任选地(d)使用和解释试剂盒结果的说明书。优选地,所述检测至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM l、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的多肽的组件特异于至少一种选自SEQ ID NOS:20至SEQ ID NO:23的多肽序列。所述试剂盒还可以含有包装在分开容器中的其它组分,例如用于阻断、洗涤或包被的缓冲液或溶液。
[0170] 本发明的具体实施方案提供对所述序列内甲基化水平和/或模式的分析的新应用,其使得精确的检测、表征和/或治疗肝和/或结肠直肠细胞增殖性病症成为可能。癌症的早期检测直接与疾病预后相联系,因而这里公开的方法使得医师和患者能够做出更好更合理的治疗决定。
[0171] 进一步的改进
[0172] 本发明提供基因组序列SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的新用途。其它的实施方案提供了SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的经修饰的变体,以及用于分析SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:
159至SEQ ID NO:167内胞嘧啶甲基化模式的寡核苷酸和/或PNA-寡聚体。
[0173] 本发明的目的包括分析至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167及其互补序列的序列内的一个或多个CpG二核苷酸的甲基化状态。
[0174] 所公开的发明提供衍生自基因组SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的经处理的核酸,其中所述处理适合于将所述基因组DNA序列的至少一个未甲基化的胞嘧啶碱基转变为尿嘧啶或其它在杂交上可检测地不同于胞嘧啶的其它碱基。所讨论的基因组可以包括一个或多个连续的甲基化CpG位置。所述处理优选包括使用选自亚硫酸氢盐、酸式亚硫酸盐、disulfite及其组合的试剂。在本发明优选的实施方案中,本发明提供非天然产生的经修饰的核酸,其包含选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS.50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的序列的长度为至少16个连续核苷酸碱基的序列。在进一步优选的实施方案中,所述核酸是至少50、100、150、200、250或500个碱基对长度的公开在SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203中的核酸序列的片段。尤其优选的是不与SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203而不是SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167或其它天然产生的DNA的全部或部分序列相同或互补的核酸分子。
[0175] 优选的是,所述序列包含CpG、TpA或CpA二核苷酸以及与其互补的序列中的至少一个。SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS.42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的序列提供了SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的非天然产生的经修饰的形式,其中每一基因组序列的修饰导致合成如下的具有独特和不同于所述基因组序列的序列的核酸。对于每一有义链基因组DNA如SEQ ID NO:1来说,公开了4种被转变的形式。第一种形式是“C”被转变成“T”,但是“CpG”仍保持“CpG”(即,对应于这样的情况:
其中对于基因组序列来说,所有的“CpG”二核苷酸序列中的“C”残基被甲基化,因此不被转变);第二种形式公开了所公开的基因组DNA序列的互补序列(即反义链),其中“C”被转变成“T”,但是“CpG”仍保持“CpG”(即,对应于这样的情况:其中对于基因组序列来说,所有的“CpG”二核苷酸序列中的“C”残基被甲基化,因此不被转变)。SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的“上甲基化的”转变的序列对应于SEQ ID NOS:1O至SEQ ID NO:15、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:
38至SEQ ID NO:39、SEQ ID NOS:168至SEQ ID NO:185。提供每一基因组序列的第三种化学转变形式,其中对于所有的“C”残基“C”都被转变为“T”,包括“CpG”二核苷酸序列中的那些(即,对应于这样的情况:其中对于基因组序列来说,“CpG”二核苷酸序列中的所有“C”残基是未被甲基化的);每一序列的最后一种化学转变形式公开了所公开的基因组DNA序列的互补序列(即反义链),其中对于所有的“C”残基“C”都被转变为“T”,包括“CpG”二核苷酸序列中的那些(即,对应于这样的情况:其中对于每一基因组序列的互补序列(反义链)来说,“CpG”二核苷酸序列中的所有“C”残基是未被甲基化的)。SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的“下甲基化的”转变的序列对应于SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:5O至SEQ ID NO:51、SEQ ID NOS:186至SEQ ID NO:203的序列。
[0176] 因此,重要的是,SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的核酸序列和分子不涉及或与细胞增殖性病症的检测、分类或治疗相联系。
[0177] 在其它优选的实施方案中,本发明还提供适于用在本发明方法中的寡核苷酸或寡聚体,用于检测SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOD:42至SEQ ID NO:43、SEQ ID NOD:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的基因组或经处理的(化学修饰的)DNA内的胞嘧啶甲基化状态。所述寡核苷酸或寡聚体核酸提供了新的诊断手段。所述寡核苷酸或寡聚体包含具有至少九(9)个核苷酸的核酸序列,其相同于或在中等严紧或严紧条件下(如上文所定义的)杂交经处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203和/或其互补序列,或者基因组序列SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NOS:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167和/或其互补序列。
[0178] 因此,本发明包括在中等严紧和/或严紧杂交条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:
51、SEQ ID NOS:168至SEQ ID NO:203或其互补序列的全部或部分序列的核酸分子(例如寡核苷酸和肽核酸(PNA)分子(PNA-寡聚体))。尤其优选的是在中等严紧和/或严紧杂交条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203而不是SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167或其它人基因组DNA的全部或部分序列的核酸分子。
[0179] 所述杂交核酸的相同或杂交部分通常长为至少9、16、20、25、30或35个核苷酸。但是,更长的分子具有本发明的应用,因此也包含在本发明的范围内。
[0180] 优选地,本发明杂交核酸分子的杂交部分与选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203或其互补序列的序列或其一部分有至少95%或至少98%或100%的一致性。
[0181] 本文描述的杂交核酸类型可例如用作引物(例如,PCR引物)、或诊断和/或预后探针或引物。优选地,所述寡核苷酸探针与核酸样品的杂交在严紧条件下进行,并且该探针与靶序列100%相同。核酸双链体或杂交稳定性被表达为熔解温度或Tm,其为探针与靶DNA解离的温度。此熔解温度可用于确定所需的严紧条件。
[0182] 对于与相应序列SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167相关或基本相同而不是相同的靶序列(例如等位变体和SNP)而言,有用的是首先用特定浓度的盐(例如SSC或SSPE)确定只发生同源杂交的最低温度。然后,假定1%的错配导致Tm降低1℃,杂交反应中最后洗涤的温度也相应降低(例如,如果检测与探针有>95%同一性的序列,则最终的洗涤温度降低5℃)。实际上,Tm的变化可在每1%错配0.5℃至1.5℃之间。
[0183] 长度为X(以核苷酸计)的本发明寡核苷酸的实例,如通过参照例如SEQ ID NO:1的多核苷酸位置表明的,包括对应于那些长度X的连续重叠寡核苷酸集(有义集和反义集),其中每一连续重叠集内的寡核苷酸(对应于给定的X值)被定义为来自核苷酸位置:
[0184] n至(n+(X-1))
[0185] 的Z寡核苷酸的有限集;
[0186] 其中n=1,2,3,...(Y-(X-1));
[0187] 其中Y等于SEQ ID NO:1的长度(核苷酸或碱基对)(219909);
[0188] 其中X等于所述集中每一寡核苷酸的共同长度(以核苷酸计)(例如对于连续重叠的20聚体(20-mer),X=20);并且
[0189] 其中对于长度为Y的给定SEQ ID NO来说,长度为X的连续重叠寡聚体的数量(Z)等于Y-(X-1)。例如,当X=20时,对于SEQ ID NO:1的有义或反义集而言
Z=219909-19=219890。
[0190] 优选地,所述集被限制于包含至少一个CpG、TpG或CpA二核苷酸的那些寡聚体。
[0191] 本发明20聚体寡核苷酸的实例包括以下219890个寡聚体的集(以及与其互补的反义集),通过参照SEQ ID NO:1的多核苷酸位置来表示:
[0192] 1-20,2-21,3-22,4-23,5-24,………….和219890-219909。
[0193] 优选地,所述集限制在包含至少一个CpG、TpG或CpA二核苷酸的那些寡聚体。
[0194] 同样地,本发明的25聚体寡核苷酸的实例包括以下219885个寡聚体的集(以及与其互补的反义集),通过参照SEQ ID NO:1的多核苷酸位置来表示:
[0195] 1-25,2-26,3-27,4-28,5-29…………和219885-219909。
[0196] 优选地,所述集限制在包含至少一个CpG、TpG或CpA二核苷酸的那些寡聚体。
[0197] 对于SEQ ID NOS:1至SEQ ID NO3、SEQ ID NO.24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203(有义和反义的)中的每一个,本发明包括长度为X的寡核苷酸或修饰的寡核苷酸的多个连续重叠集。
[0198] 本发明的寡核苷酸或寡聚体构成可用于确定选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的基因组序列的遗传和表观遗传参数的有效工具。这类长度为X的寡核苷酸或经修饰的寡核苷酸的优选集为那些对应于SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:2O3(及其互补序列)的寡聚体的连续重叠集。优选地,所述寡聚体包含至少一个CpG、TpG或CpA二核苷酸。
[0199] 本发明尤其优选的寡核苷酸或寡聚体为其中CpG二核苷酸(或对应的转变的TpG或CpA二核苷酸)序列的胞嘧啶位于该寡核苷酸的中部三分之一的那些;即其中该寡核苷酸例如是13个碱基长,则CpG、TpG或CpA二核苷酸位于从5’端起的第五至第九氨基酸。
[0200] 本发明的寡核苷酸也可通过将该寡核苷酸化学连接至一个或多个部分或偶联物进行修饰,以提高该寡核苷酸的活性、稳定性或检测。这类部分或偶联物包括生色团,荧光团,诸如胆固醇、胆酸、硫醚、脂族链、磷脂的脂类,多胺,聚乙二醇(PEG),棕榈基部分以及其它例如公开在美国专利5,514,758、5,565,552、5,567,810、5,574,142、5,585,481、5,587,371、5,597,696和5,958,773中的。所述探针也可以为PNA(肽核酸)的形式,其具有特别优选的配对性能。因此,所述寡核苷酸可以包括其它附加的基团、例如肽,并可以包括杂交触发的切割剂(Kro1等人,BioTechniques6:958-976,1988)或插入剂(Zon,Pharm.Res.5:539-549,1988)。为此,所述寡核苷酸可以被偶联至另一分子,例如生色团、荧光团、肽、杂交触发的交联剂、转运剂、杂交触发的切割剂等。
[0201] 所述寡核苷酸也可以包含至少一种已知的修饰的糖和/或碱基部分,或可以包含修饰的主链或非天然核苷间键。
[0202] 根据本发明的特定实施方案,所述寡核苷酸或寡聚体通常被用在“集”中,其含有至少一个寡聚体,用于分析选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167以及互补序列的基因组序列的每个CpG二核苷酸,或经处理的核酸SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列内对应的CpG、TpG或CpA二核苷酸。但是,预期出于经济或其它因素,可优选分析所述序列内有限选择的CpG,并相应地改变所述寡核苷酸集的容量。
[0203] 因此,在特定实施方案中,本发明提供含有至少两(2)个(寡核苷酸和/或PNA寡聚体)的集,可用于检测经处理的基因组DNA(SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:
203)或基因组DNA(SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOD:
159至SEQ ID NO:167及其互补序列)中的胞嘧啶甲基化状态。这些探针使得诊断、分类和/或治疗肝和/或结肠直肠细胞增殖性病症的遗传和表观遗传参数成为可能。这套寡聚体也可以用于检测经处理的基因组DNA(SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203)中,或基因组DNA(SEQ ID NOS:1至SEQ II NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NOS:167及其互补序列)中的单核苷酸多态性(SNPs)。
[0204] 在优选的实施方案中,至少一种,更优选寡核苷酸集的所有成员都被结合至固相。
[0205] 在其它实施方案中,本发明提供含有至少两(2)个核苷酸的集,他们被用作“引物”寡核苷酸用于扩增SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列或其片段之一的DNA序列。
[0206] 预期所述寡核苷酸可以构成整个或部分“阵列”或“DNA芯片”(即,结合到固相的不同寡核苷酸和/或PNA-寡聚体的排列)。这种不同核苷酸和/或PNA-寡聚体序列的阵列的特征可例如在于在固相上以矩形或六角形点阵排列。所述固相表面可以由、玻璃、聚苯乙烯、、镍、或金构成。也可以使用硝酸纤维素以及塑料如尼龙,其可以以沉积物的形式或作为树脂基质存在,也可以被使用。寡聚体阵列制备方面现有技术的综述可从Nature Genetics的特别版(Nature Genetics Supplement,Volume21,January1999,及其中所引用的文献)获得。荧光标记的探针通常用于扫描固定化的DNA阵列。将Cy3和Cy5染料简单的附着到特定探针的5’-OH上对于荧光标记物尤其适用。对杂交的探针荧光的检测可以例如通过共聚焦显微镜进行。Cy3和Cy5染料以及很多其它的染料都是可商购的。
[0207] 还预期所述寡核苷酸或其特定序列可以构成“虚拟阵列”的全部或部分,其中所述寡核苷酸或其特定序列用作例如“指定物(specifier)”,作为独特的被标记探针的多样群的一部分,或与其组合来分析被分析物的复杂混合物。这种方法例如描述在US2003/0013091(美国序列号09/898,743,2003年1月16日公开)中。在这些方法中,产生足够多的标记物,以便该复杂混合物(即每种分析物)中的每种核酸可被独特标记物唯一结合,从而被检测(每种标记物是直接计数的,获得混合物中每种分子的数字读出值)。
[0208] 尤其优选的是,本发明的寡聚体被至少用于以下用途之一:检测、检测并区分亚型、诊断、预后、治疗、监测、以及治疗并监测肝和/或结肠直肠细胞增殖性病症。这通过使用所述集来检测或检测并区分下列组织类型中的一种或多种来实现:结肠直肠癌、结肠癌、炎性结肠组织、小于1cm的2级发育异常结肠腺瘤、大于1cm的3级发育异常结肠腺瘤、正常的结肠组织、非结肠健康组织以及非结肠癌组织。
[0209] 尤其优选的是实施例中的那些寡聚体集。
[0210] 在所述方法的最优选实施方案中,确定是否存在细胞增殖性病症,最优选确定瘤性细胞增殖或将其与良性病症区分开。这通过分析至少一种包含至少一个CpG位置的靶序列的甲基化状态来实现,其中所述序列包含或在严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167及其互补序列的序列的至少16个连续核苷酸。本发明还提供通过分析胞嘧啶甲基化和单核苷酸多态性来确定个体中基因组序列SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的遗传和/或表观遗传参数的方法。所述方法包括使从所述个体获得的生物样品中包含SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的核酸与至少一种试剂或成组试剂接触,其中所述试剂或成组试剂区分所述靶核酸内的甲基化和非甲基化CpG二核苷酸。
[0211] 在优选的实施方案中,所述方法包括以下步骤:在第一步中,获得待分析的组织样品。该来源可以是任何适合的来源,例如细胞系、组织学切片、活检组织、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液分离的细胞及其所有可能的组合。优选地,DNA的所述来源为粪便或体液,选自结肠流出物、尿、血浆、血清、全血、分离的血细胞、分离自血液的细胞。
[0212] 然后从所述样品分离基因组DNA。可通过现有技术中的任何标准手段来分离,包括使用可商购的试剂盒。简言之,当目的DNA被包裹在细胞膜中时,该生物样品必须被破碎并通过酶、化学或机械手段被裂解。随后例如通过蛋白激酶K的消化而清除蛋白和其它的污染物。接着从溶液回收基因组DNA。这可以通过各种方法来实现,包括盐析、有机提取或将DNA结合到固相支持物。对方法的选择会受到多种因素的影响,包括时间、费用和所需的DNA的量。
[0213] 当所述样品DNA未被包裹在细胞膜中时(例如来自血液样品的循环DNA),可以使用现有技术中分离和/或纯化DNA的标准方法。这些方法包括使用蛋白降解试剂,例如离液盐,如盐酸胍或脲;或去污剂,如十二烷基磺酸钠(SDS)、溴化氰。其它方法包括但不限于乙醇沉淀或丙醇沉淀、通过离心的真空浓缩等。本领域技术人员也可以利用装置,例如诸如超滤的滤器,硅表面或膜,磁性颗粒,聚苯乙烯颗粒,聚苯乙烯表面,带正电荷的表面以及带阳性电荷的膜,带电膜,带电表面,带电转换膜,带电转换表面。
[0214] 一旦核酸被提取,就将基因组双链DNA用于分析。
[0215] 在所述方法的第二步中,将所述基因组DNA样品处理以使得在5’位未甲基化的胞嘧啶碱基被转变为尿嘧啶、胸腺嘧啶或在杂交行为上不用于胞嘧啶的另一碱基。这应被理解为本文所述的“预处理”或“处理”。
[0216] 这优选通过亚硫酸氢盐试剂处理来实现。术语“亚硫酸氢盐试剂”指包括亚硫酸氢盐、亚硫酸氢盐(disulfite)、酸式亚硫酸盐或其组合的试剂,如这里所公开的可用于区分甲基化和未甲基化的CpG二核苷酸序列。所述处理在本领域中是已知的(例如PCT/EP2004/011715,通过参考将其整体并入本文)。优选地,该亚硫酸氢盐处理在变性溶剂存在下进行,所述变性溶剂诸如但不限于正烷基二醇,尤其是二乙二醇二甲基醚(DME),或者在二 烷或二 烷衍生物存在下进行。在优选的实施方案中,所述变性溶剂以1%至35%(v/v)的浓度使用。还优选该亚硫酸氢盐反应在清除剂存在下进行,例如但不限于色原烷衍生物,如6-羟基-2,5,7,8,-四甲基色原烷2-羧酸或三羟基苯甲酸及其衍生物,例如没食子酸(参见:PCT/EP2004/011715,将其整体通过参考并入本文)。该亚硫酸氢盐转变优选在30℃至70℃的反应温度下进行,其中在反应期间温度短时间地增加至超过85℃(参见:PCT/EP2004/011715,将其整体通过参考并入本文)。经亚硫酸氢盐处理的DNA优选在定量之前进行纯化。这可通过任何现有技术中已知的方法来进行,例如但不限于超滤,优选通过Microcon^(TM)柱(由Millipore^(TM)生产)进行。该纯化根据改良的制造商的方案进行(参见:PCT/EP2004/011715,将其整体通过参考并入本文)。
[0217] 在所述方法的第三步中,采用本发明的成套引物寡核苷酸以及扩增酶扩增经处理的DNA的片段。可在同一个反应容器中同时进行几种DNA片段的扩增。通常,该扩增反应采用聚合酶链式反应(PCR)进行。优选地,所述扩增产物的长度为100至2,000个碱基对。所述成套的引物寡核苷酸包括至少两种寡核苷酸,每一种的序列都反向互补于、相同于、或在严紧或高度严紧条件下杂交SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:
33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOs:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列之一的碱基序列的至少16个碱基长的片段。
[0218] 在所述方法的其它实施方案中,至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的核酸序列内预选的CpG位置的甲基化状态可以通过使用甲基化特异的引物寡核苷酸来检测。这项技术(MSP)已描述在授予Herman的美国专利6,265,171中。使用甲基化状态特异引物来扩增经亚硫酸氢盐处理的DNA使得能区分甲基化和未甲基化的核酸。MSP引物对含有至少一个杂交经亚硫酸氢盐处理的CpG二核苷酸的引物。因此,所述引物的序列包含至少一个CpG二核苷酸。特异于未甲基化DNA的MSP引物在CpG的C位置处含有“T”。优选地,因而所述引物的碱基序列需要包含具有至少9个核苷酸长度的序列,其杂交经处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS.30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列之一,其中所述寡聚体的碱基序列包含至少一个CpG二TM
核苷酸。本发明进一步优选的实施方案包括使用阻断寡核苷酸(HeavyMethyl 测定)。对这类阻断寡核苷酸的使用已由Yu等人,BioTechniques23:714-720,1997描述。阻断探针寡核苷酸与PCR引物同时杂交至经亚硫酸氢盐处理的核酸。该核酸的PCR扩增在阻断探针的5’位置处终止,以便在存在互补于阻断探针的序列时核酸的扩增被抑制。所述探针可以被设计为以甲基化状态特异的方式杂交经亚硫酸氢盐处理的核酸。例如,为了检测未甲基化核酸群内的甲基化核酸,对在所讨论位置处未甲基化的核酸的扩增的抑制可通过使用阻断探针进行,该阻断探针在所讨论位置处包含“CpA”或“TpA”,这与希望抑制甲基化核酸的扩增时的“CpG”相反。
[0219] 对于采用阻断寡核苷酸的PCR方法来说,有效破坏聚合酶介导的扩增需要阻断剂不被聚合酶延伸。优选地,这通过使用3’-脱氧寡核苷酸阻断剂或在3’位具有除“自由”羟基基团之外的衍生的寡核苷酸阻断剂来实现。例如,3’-O-乙酰基寡核苷酸为阻断分子的优选类别的代表。
[0220] 此外,应排除聚合酶介导的阻断寡核苷酸降解。优选地,这种排除包括使用缺少5’-3’外切酶活性的聚合酶,或者使用修饰的阻断寡核苷酸,其例如在其5’末端具有硫酯桥,这赋予该阻断分子核酸酶抗性。特定的应用可以不需要阻断剂的这种5’修饰。例如,如果阻断和引物结合位点重叠因而防止了引物的结合(例如,阻断剂过量),则阻断寡核苷酸的降解将基本上防止。这是因为聚合酶不会向前延伸引物并穿过(5’-3’方向)阻断剂-一种通常导致杂交的阻断寡核苷酸降解的过程。
[0221] 出于本发明的目的以及如这里所实施的,尤其优选的阻断剂/PCR实施方案包括使用肽核酸(PNA寡聚体作为阻断寡核苷酸。这种PNA阻断寡聚体极好地适合,因为它们不被降解也不被聚合酶延伸。
[0222] 优选地,因此所述阻断寡核苷酸的碱基序列要求包含具有至少9个核苷酸长度的序列,其杂交经处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOs:168至SEQ ID NO:203及其互补序列之一,其中。所述寡核苷酸的碱基序列包含至少一个CpG、TpG或CpA二核苷酸。
[0223] 通过扩增获得的片段可携带有可直接或间接地检测的标记物。优选的是,标记物为荧光标记物、放射性核素或可附着的分子片段的形式,该可附着的分子片段通常具有可在质谱中检测的质量。当所述标记物为质谱标记物时,优选的是标记的扩增产物具有单个阳性或阴性净电荷,使得能在质谱仪中更好地被检测。可通过例如基质辅助激光解吸/电离质谱(MALDI)或使用电喷雾质谱(ESI)来检测和观察。
[0224] 基质辅助激光解吸/电离质谱(MALDI-TOF)为分析生物分子非常有效的进展(Karas&Hillenkamp,Anal Chem.,60:2299-301,1988)。分析物被包埋在吸收光的基质中。该基质被短激光脉冲蒸发,由此以非片段化的方式将分析物分子输送进蒸气相。该分析物通过与基质分子的碰撞而被离子化。施加的电压加速该离子进入无场飞行管。由于它们不同的质量,离子以不同的速率被加速。小离子比大离子更快到达检测器。MALDI-TOF质谱很适于分析肽和蛋白。对核酸的分子稍有些困难(Gut&Beck,Current Innovations and Future Trends,1:147-57,1995)。核酸分析的敏感性大约比肽小100倍,并且与增加的片段大小成反比。此外,对于具有多个负电荷的主链来说,经由基质的离子化过程明显效率较低。在MALDI-TOF质谱中,对基质的选择极其关键。对于肽的解吸,已发现了几种非常有效的基质,其产生极好的结晶作用。现在有几种用于DNA的应答基质,但是,在肽和核酸之间敏感性的差异并没有被消除。然而敏感性的差异可通过化学修饰DNA使其变得更加类似于肽来减少。例如,采用简单的烷基化化学,硫代磷酸酯(phosphorothioate)核酸(其中通常的磷酯主链被硫代磷酸酯(thiophosphate)替换)可被转变进电中性的DNA中(Gut&Beck,Nucleic Acids Res.23:1367-73,1995)。将电荷标签连接到这种经修饰的DNA导致MALDI-TOF敏感性增加至肽的水平。电荷标签的其它优点为克服杂质的增加的分析稳定性,其中杂质使得检测未修饰的底物明显更加困难。
[0225] 在所述方法的第四步中,分析在所述方法的第三步中获得的扩增产物,以便确定处理之前CpG二核苷酸的甲基化状态。
[0226] 在通过MSP扩增获得扩增产物的实施方案中,根据所述引物的碱基序列,扩增产物存在与否自身就表明了由该引物覆盖的CpG位置的甲基化状态。
[0227] 通过标准和甲基化特异PCR获得的扩增产物均可以通过基于碱基的方法进一步分析,例如但不限于阵列技术和基于探针的技术,以及通过诸如测序和模板指导延伸的技术。
[0228] 在所述方法的一个实施方案中,在第三步中合成的扩增产物随后杂交至寡核苷酸和/或PNA探针阵列或寡核苷酸和/或PNA探针集。这种情况下,杂交按如下方式进行:杂交过程中使用的探针集优选由至少两个寡核苷酸或PNA寡聚体组成;在该过程中,扩增产物用作探针,其杂交之前结合到固相的寡核苷酸;随后除去未杂交的片段;所述寡核苷酸含有至少一个具有至少9个核苷酸长度的碱基序列,其逆向互补或相同于在本发明序列表中给出的碱基序列的片段;并且所述片段包含至少一个CpG、TpG或CpA二核苷酸。杂交核酸的杂交部分的长度典型地为至少9、15、20、25、30或35个核苷酸。但是,更长的分子具有本发明的应用,因此也落入本发明的范围内。
[0229] 在优选的实施方案中,所述核苷酸存在于所述寡聚体的中间三分之一内。例如,当所述寡聚体包含一个CpG二核苷酸时,所述二核苷酸优选为13聚体的从5’端起的第五至第九核苷酸。对于选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列内的每一CpG二核苷酸以及SEQ ID NOS:10至SEQ ID NO.15、SEQ ID NOS:28至SEQ ID NO.33、SEQ ID NOs:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203内的等同位置,均存在一种寡核苷酸用于其分析。
[0230] 所述寡核苷酸也可以以肽核酸的形式存在。然后除去未杂交的扩增产物。随后检测杂交的扩增产物。这种情况下,优选地,连接到扩增产物的标记物在固相的寡核苷酸所处的每个位置处均可鉴别。
[0231] 在其它实施方案中,CpG位置的基因组甲基化状态可以通过与PCR扩增引物(其中所述引物可以是甲基化特异的或标准的)同时杂交经亚硫酸氢盐处理的DNA的寡核苷酸探针(如上所详述的)来确定。
[0232] 在该方法的尤其优选的实施方案中,使用采用双标记的荧光寡核苷酸探针TM(TaqMan PCR,采 用ABI Prism7700Sequence Detection System,Perkin Elmer Applied Biosystems,Foster City,California)的基于荧光的实时定量PCR(Heid等人,Genome TM
Res.6:986-994,1996;还参见美国专利6,331,393)。该TaqMan PCR反应采用不可延伸的TM
探测寡核苷酸,称为TaqMan 探针,在优选的实施方案中,其被设计为与位于正向和反向扩TM
增引物之间的富含CpG的序列杂交。该TaqMan 探针还包含荧光“报道物部分”和“淬灭TM
部分”,它们共价连接到附着于所述TaqMan 寡核苷酸的核苷酸的接头部分(例如亚磷酰胺)。为了在亚硫酸氢盐处理后分析核酸内的甲基化,需要探针为甲基化特异的,如美国专TM
利6,331,393(通过参考将其整体并入本文)中所述,也被称为MethyLightTM 测定。也适TM TM
用于本发明的TaqMan 检测方法的变化包括使用双探针技术(Lightcycler )或荧光扩增TM
引物(Sunrise 技术)。这两种技术均可被改变以适用于经亚硫酸氢盐处理的DNA,以及用于CpG二核苷酸内的甲基化分析。
[0233] 在所述方法的进一步优选的实施方案中,所述方法的第四步包括使用模板指导的寡核苷酸延伸,如Gonzalgo&Jones,Nucleic Acids Res25:2529-2531,1997描述的MS-SNuPE。
[0234] 在所述方法的其它实施方案中,所述方法的第四步包括对所述方法第三步中产生的扩增产物测序和随后的序列分析(Sanger F.等人,Proc Natl Acad Sci USA74:5463-5467,1977)。
[0235] 最佳方案
[0236] 在所述方法的最优选的实施方案中,所述基因组核酸根据上述方法的前三步骤被分离和处理,即:
[0237] a)从个体获得具有个体基因组DNA的生物样品;
[0238] b)提取或以其它方式分离所述基因组DNA;
[0239] c)用一种或多种试剂处理b)的基因组DNA或其片段,以将在5’位未甲基化的胞嘧啶碱基转变为尿嘧啶或在杂交性能方面可检测地不同于胞嘧啶的另一碱基;以及其中[0240] d)c)中处理之后的扩增以甲基化特异的方式进行,即通过甲基化特异的引物或阻断寡核苷酸,以及进一步地,其中
[0241] e)对扩增产物的检测是通过实时检测探针来进行,如上所述。
[0242] 优选地,当d')的随后扩增通过如上所述的甲基化特异引物的方式进行时,所述甲基化特异的引物包含具有至少9个核苷酸长的序列,该序列杂交经处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID N0:33、SEQ ID NOS:30至SEQ ID N0:31、SEQ ID NS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOs:l68至SEQ ID NO:203及其互补序列之一,其中所述寡聚体的碱基序列包含至少一个CpG二核苷酸。
[0243] 所述方法的步骤e),即对表明SEQ ID NOS:l至SEQ ID NO:3、SEQ ID NO:24、SEQ ID N0:28、SEQ ID NOS:159至SEQ ID NO:167中至少一种序列的一个或多个CpG位置甲基化状态的特异扩增产物的检测通过如上所述的实时检测方法进行。
[0244] 本发明的其它实施方案提供无需亚硫酸氢盐转变的分析本发明基因组DNA(SEQ ID NOs:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167及其互补序列、)甲基化状态的方法。现有技术中已知这样的方法,包括但不限于DMH,其中甲基化敏感的限制酶试剂或包含甲基化敏感限制酶试剂的一系列限制酶试剂被用于确定甲基化,该甲基化敏感限制酶试剂可区分靶区域内甲基化和未甲基化CpG二核苷酸。
[0245] 在这种其它实施方案的第一步中,从组织或细胞源分离基因组DNA。基因组DNA可以通过现有技术中任何标准手段分离,包括使用可购得的试剂盒。简言之,当目的DNA被包裹在细胞膜中时,该生物样品必须被破碎并通过酶、化学或机械手段被裂解。随后例如通过蛋白激酶K的消化而清除蛋白和其它的污染物。接着从溶液回收该基因组DNA。这可以通过各种方法来实现,包括盐析、有机提取或将DNA结合到固相支持物。对方法的选择会受到多种因素的影响,包括时间、费用和所需的DNA的量。所有的临床样品种类,包括瘤性物质或潜在瘤性物质,都适合用在本发明方法中,优选的为细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,及其组合。体液为优选的DNA源;尤其优选的为血浆、血清、全血、分离的血细胞和从血液分离的细胞。
[0246] 一旦核酸被提取后,基因组双链DNA就被用在分析中。
[0247] 在优选的实施方案中,所述DNA可以在用甲基化敏感的限制酶处理前被切割。这类方法在现有技术中是已知的,可以包括物理和化学手段。尤其优选的是使用一种或多种非甲基化敏感的限制酶,且它们的识别位点富含AT并且不包含CG二核苷酸。这类酶的使用使得能在片段化的DNA中保留CpG岛和富含CpG的区域。所述非甲基化特异的限制酶优选地选自MseI、BfaI、Csp6I、Tru1I、Tvu1I、Tru9I、Tvu9I、MaeI和XspI。尤其优选的是使用两种或三种这类酶。尤其优选的是使用MseI、BfaI和Csp6I的组合。
[0248] 片段化的DNA随后可被连接到接头寡核苷酸,以有利于随后的酶法扩增。将寡核苷酸连接到平末端和粘性末端的DNA片段在现有技术中是已知的,通过使末端去磷酸化(例如使用或虾碱性磷酸酶)并随后在dATPs存在下使用连接酶(例如T4DNA连接酶)连接来完成。所述的接头寡核苷酸通常为至少18个碱基对长。
[0249] 在第三步中,随后用一种或多种甲基化敏感的限制酶消化所述DNA(或其片段)。进行所述消化以使得DNA在限制位点的水解提供至少一种选自Septin9(包括其所有转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQIDNO:165的基因或基因组序列的特定CpG二核苷酸的甲基化状态信息。
[0250] 优选地,甲基化特异的限制酶选自BsiEI、HgaIHinPI、Hpy99I、AvaI、BceAI、Bsa HI、BisI、BstUI、Bshl236I、AccII、BstFNI、McrBC、GIaI、MvnI、HpaII(HapII)、HhaI、AciI、SmaI、HinPlI、HpyCH4IV、EagI以及以上两种或多种酶的混合物。优选的是含有限制酶BstUI、HpaII、HpyCH4IV和HinPlI的混合物。
[0251] 在第四步中,其为任选但优选的实施方案,所述限制性片段被扩增。这可通过聚合酶链式反应来进行,并且所述扩增产物可以带有如上所述适合的检测标记物,即荧光标记物、放射性核素以及质谱标记物。尤其优选的是通过扩增酶和至少两种每一种都包含至少16个核苷酸长的连续序列的引物来扩增,所述连续序列互补于或在中等严紧或严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列及其互补序列的序列。优选地,所述连续序列为至少16、20或25个核苷酸长。在其它实施方案中,所述引物可以互补于连接到所述片段的任何接头。
[0252] 在第五步中,检测所述扩增产物。该检测可以使现有技术中的任何标准手段,例如但不限于凝胶电泳分析、杂交分析、将可检测标记物掺入PCR产物内、DNA阵列分析、MALDI或ESl分析。优选地,所述检测通过杂交至少一种每一个都包含至少16个核苷酸长的连续序列的核酸或肽核酸进行,所述连续序列互补于或在中等严禁或严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167及其互补序列的序列。优选地,所述连续序列为至少16、20或25个核苷酸长。
[0253] 在确定所述基因组核酸的甲基化状态或水平之后,基于至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸序列的甲基化状态或水平,或反映至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的多个CpG二核苷酸序列的平均甲基化状态的均值或值来推定细胞增殖性病症是否存在或其类别,其中甲基化与瘤性或瘤前细胞增殖性病症相关。当所述甲基化通过定量手段确定时,用于确定所述甲基化存在的临界值优选为零(即当样品表现出任何程度的甲基化时,确定为在分析的CpG位置具有甲基化的状态)。然而,可预知本领域技术人员可能希望调整所述临界值以便为测定提供特别优选的敏感性或特异性。相应地,所述临界值可以提高(因此提高特异性),所述临界值可以在0%-5%、5%-10%、10%-15%、15%-20%、20%-30%或
30%-50%的范围内。尤其优选的是临界值10%、15%、25%以及30%。
[0254] 在所述方法的其它实施方案中,其中成组基因包含Septin9或其截短的转录本Q9HC74和至少一种选自FOXL2、NGFR、TMEFF2、SIX6、SARM1、VTN和ZDHHC22的基因,在确定所述基因组核酸的甲基化状态之后,根据SEQ ID NO:1的至少一个CpG二核苷酸序列和SEQ ID NO:24至SEQ ID NO:29的至少一个CpG二核苷酸序列的甲基化状态,或反映其多个CpG二核苷酸的平均甲基化状态的均值或值来推定是否存在细胞增殖性病症或其亚型,尤其是肝和/或结肠直肠细胞增殖性病症,其中甲基化与癌症,尤其是肝和/或结肠直肠癌相关。
[0255] 细胞增殖性病症的诊断和预后测定
[0256] 本发明使得能够诊断不利于患者或个体的事件,其中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列内的重要遗传和/或表观遗传参数可以用作标志物。通过本发明方法获得的所述参数可以与另一套遗传和/或表观遗传参数进行比较,其差异用作不利于患者或个体的事件的诊断和/或预后的基础。
[0257] 更具体地,本发明使得能够筛选风险人群以早期检测癌症,最优选的是肝癌和/或结肠直肠癌。此外,本发明使得能够区分瘤性(例如恶性肿瘤)和良性(非癌性)细胞增殖性病症。例如,其使得能区分结肠直肠癌和小细胞结肠腺瘤或息肉。瘤性细胞增殖性病症在至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列内表现降低的甲基化(即降低的表达),与不表现降低的甲基化的所述良性病症相反。
[0258] 具体地,本发明提供癌症诊断和分类测定法,其基于对至少一种包含CpG二核苷酸的选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的基因的一个或多个CpG二核苷酸的差异表达的测量。通常,这种测定包括从个体获得样品,进行测定以衡量至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的表达,优选地通过确定衍生自所述样品的至少一种选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的相对于对照样品或已知标准品的甲基化状态,并由此做出诊断。
[0259] 在特别优选的实施方案中,本发明的寡聚体被用于评估CpG二核苷酸的甲基化状态,例如基于SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167、SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的那些或其阵列,以及位于基于它们的试剂盒中并且可用于细胞增殖性病症的诊断和/或分类。
[0260] 试剂盒
[0261] 此外,本发明的另一方面是试剂盒,其包括:用于确定至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的甲基化的组件。所述用于确定甲基化的组件优选包括含亚硫酸氢盐的试剂;一种或多种寡核苷酸,其每一种的序列都相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:3O至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的序列的9或更优选18个碱基长的片段;以及优选地,用于进行和评估所描述的甲基化分析方法的说明书。在一个实施方案中,所述寡核苷酸的碱基序列包含至少一个CpG、CpA或TpG二核苷酸。
[0262] 在其它实施方案中,所述试剂盒还可以包括用于进行CpG位置特异的甲基化分TM析的标准试剂,其中所述分析包括一种或多种下列技术:MS-SNuPE、MSP、MethyLight 、HeavyMethyl、COBRA以及核酸测序。但是,属于本发明的试剂盒还可仅含有前述组分的一部分。
[0263] 在优选的实施方案中,所述试剂盒可以包含选自以下试剂的其它亚硫酸氢盐转变试剂:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);脱磺酸基缓冲液;以及DNA回收组分。
[0264] 在其它实施方案中,所述试剂盒可含有包装在分开容器中的聚合酶和经优化用于例如PCR的聚合酶介导的引物延伸的反应缓冲液。在本发明的另一实施方案中,所述试剂盒还包含用于获得患者生物样品的组件。优选的是这样的试剂盒,其还包括适于盛装用于确定患者生物样品中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的甲基化的组件的容器,最优选还包含使用和解释试剂盒结果的说明书。在优选的实施方案中,所述试剂盒包括:(a)亚硫酸氢盐试剂;(b)适于盛装所述亚硫酸氢盐试剂以及患者生物样品的容器;(c)至少一套包含两种寡核苷酸的引物寡核苷酸,所述每一种寡核苷酸的序列都相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的序列的9或更优选18个碱基长的片段;以及优选地,(d)用于使用和解释试剂盒结果的说明书。在另一优选的实施方案中,所述试剂盒包含:(a)亚硫酸氢盐试剂;(b)适于盛装所述亚硫酸氢盐试剂和患者生物样品的容器;(c)具有至少9或16个核苷酸长度的至少一种寡核苷酸和/或PNA-寡聚体,其相同于或杂交预先处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列之一;以及任选地,(d)关于使用和解释试剂盒结果的说明书。
[0265] 在另一实施方案中,所述试剂盒包括:(a)亚硫酸氢盐试剂;(b)适于盛装所述亚硫酸氢盐试剂和患者生物样品的容器;(c)至少一套含有两种寡核苷酸的引物寡核苷酸,其每一种的序列相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203的9或更优选18个碱基长的片段;(d)具有至少9或16个核苷酸长度的至少一种寡核苷酸和/或PNA-寡聚体,其相同于或杂交预先处理的核酸序列SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列之一;以及任选地(e)关于使用和解释试剂盒结果的说明书。
[0266] 所述试剂盒还可含有包装在分开容器中的其它的组分,如用于阻断、洗涤或包被的缓冲液或溶液。
[0267] 用于COBRATM分析的典型试剂(例如可能在典型的基于COBRATM的试剂盒中找到)可以包括,但不限于:用于至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的PCR引物;限制酶和合适的缓冲液;基因杂交寡聚体;对照杂交寡聚体;用于寡聚体探TM针的激酶标记试剂盒;以及标记的核苷酸。用于MethyLight 分析的典型试剂(例如可TM
能在典型的基于MethyLight 的试剂盒中找到)可以包括,但不限于:用于至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的经亚硫酸氢盐转化的序列的PCR引物;亚TM TM
硫酸氢盐特异的探针(例如TaqMan 或Lightcycler );优化的PCR缓冲液和脱氧核苷酸;
以及Taq聚合酶。
[0268] 用于Ms-SNuPETM分析的典型试剂(例如可能在典型的基于Ms-SNuPETM的试剂盒中找到)可以包括,但不限于:用于特定基因(或经亚硫酸氢盐处理的DNA序列或CpG岛)的PCR引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;用于至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的经亚硫酸氢盐转化的序列的TMMs-SNuPE 引物;反应缓冲液(用于Ms-SNuPE反应);以及标记的核苷酸。
[0269] 用于MSP分析的典型试剂(例如可能在典型的基于MSP的试剂盒中找到)可以包括,但不限于:用于选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的经亚硫酸氢盐转化的序列基因或基因组序列的甲基化和未甲基化的PCR引物,优化的PCR缓冲液和脱氧核苷酸,以及特异的探针。
[0270] 此外,本发明的其它方面为可供选择的试剂盒,其包括用于确定至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列的甲基化的组件,其中所述组件优选包括至少一种甲基化特异的限制酶;一种或多种适于扩增包含选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的序列的引物寡核苷酸(优选一个或多个引物对);以及任选地,用于进行和评估所述的甲基化分析方法的说明书。在一个实施方案中,所述寡核苷酸的碱基序列相同于、互补于、或在严紧或高度严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的长度为至少18个碱基的片段。
[0271] 在其它的实施方案中,所述试剂盒可以包括一种或多种用于分析所述消化片段的寡核苷酸探针,优选所述寡核苷酸相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的长度为至少16个碱基的片段。
[0272] 在优选的实施方案中,所述试剂盒可以包括其它试剂,该其它试剂选自:缓冲液(例如限制酶、PCR、储存或洗涤缓冲液);DNA回收试剂或试剂盒(例如沉淀、超滤、亲和柱)以及DNA回收组分。
[0273] 在另外的其它实施方案中,所述试剂盒可以含有包装在分开容器中的聚合酶和反应缓冲液,所述反应缓冲液被优化用于所述聚合酶介导的引物延伸,例如PCR。在本发明的另一实施方案中,所述试剂盒还包括用于获得患者生物样品的组件。在优选的实施方案中,所述试剂盒包括:(a)甲基化敏感的限制酶试剂;(b)适合于盛装所述试剂和所述患者生物样品的容器;(c)含有一种或多种肽核酸的至少一套寡核苷酸,其相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的长度为至少16个碱基的片段;以及任选地(d)使用和解释试剂盒结果的说明书。
[0274] 在其它优选的实施方案中,所述试剂盒包括:(a)甲基化敏感的限制酶试剂;(b)用于盛装所述试剂和患者生物样品的容器;(c)至少一套适合于扩增包含选自SEQ ID NOs:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的序列的引物寡核苷酸;以及任选地,(d)使用和解释试剂盒结果的说明书。
[0275] 在另一实施方案中,所述试剂盒包括:(a)甲基化敏感的限制酶;(b)适合于盛装所述试剂和患者生物样品的容器;(c)至少一套适合于扩增包含选自SEQ ID NOs:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的至少一个CpG 二核苷酸的序列的引物寡核苷酸;(d)至少一套包含一种或多种核酸或肽核酸的寡核苷酸,其相同于、互补于或在严紧或高度严紧条件下杂交选自SEQ ID NOs:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167的序列的长度为至少9个碱基的片段以及任选地,(e)使用和解释试剂盒结果的说明书。
[0276] 所述试剂盒还可含有包装在分开容器中的其它组分,例如缓冲液或溶液,其适合于阻断、洗涤或包被。
[0277] 本发明还涉及试剂盒用于提供对个体中细胞增殖性病症是否存在的诊断中的用途,其通过甲基化敏感的限制酶分析来实现。所述试剂盒包括容器和DNA微阵列组分。所述DNA微阵列组分为一表面,在其上指定的位置固定有多种寡核苷酸,其中所述寡核苷酸包含至少一个CpG甲基化位点。至少一种所述寡核苷酸特异于至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NOS:160至SEQ ID NO:165的基因或基因组序列,并且包含SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167之一的至少15个碱基对长但不超过200bp的序列。优选地,所述序列是SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167之一的至少15个碱基对长但不超过80bp的序列。进一步优选地,所述序列是SEQ ID NOS:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NOS:159至SEQ ID NO:167之一的至少20个碱基对长但不超过30bp的序列。
[0278] 所述测试试剂盒优选地还包括包含一种或多种甲基化敏感限制酶的限制酶组分。
[0279] 在另一实施方案中,所述测试试剂盒的特征还在于其包含至少一种甲基化特异的限制酶,并且其中所述寡核苷酸包含所述至少一种甲基化特异的限制酶的限制性位点。
[0280] 所述试剂盒还可以包含一种或几种在现有技术中已知的用于DNA富集的以下组分:蛋白组分,所述蛋白选择性结合甲基化的DNA;任选地处于适合溶液中的三链体形成核酸组分、一种或多种接头;用于进行连接的物质或溶液,例如连接酶或缓冲液;用于进行柱层析的物质或溶液;用于进行基于免疫学的富集(例如免疫沉淀)的物质或溶液;用于进行例如PCR的核酸扩增的物质或溶液;如果可与偶联剂一起使用、如果可在溶液中使用的一种或多种染料;用于进行杂交的物质或溶液;和/或用于进行清洗步骤的物质或溶液。
[0281] 本发明还提供可用于检测、区分和区别结肠细胞增殖性病症的组合物。所述组合物包含至少一种18个碱基对长的核酸,其为公开在SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS.42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203中的核酸序列的片段,以及一种或多种取自以下的物质:1-5mM的氯化镁、100-500μM dNTP、O.5-5单位的taq聚合酶、牛血清白蛋白、寡聚体尤其是寡核苷酸或肽核苷酸(PNA)寡聚体,所述寡聚体的每一个都包含至少一个长度为至少9个核苷酸的碱基序列,其互补于或在中等严紧或严紧条件下杂交预处理的基因组DNA SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:
43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203及其互补序列之一。优选的是所述物质的组合物包含这样的缓冲溶液:其适合于在水溶液中稳定所述核酸并使得基于聚合酶的反应能在所述溶液中进行。适合的缓冲液在现有技术中是已知和可商购的。
[0282] 在本发明进一步优选的实施方案中,所述至少一种核酸为公开在SEQ ID NOS:10至SEQ ID NO:15、SEQ ID NOS:28至SEQ ID NO:33、SEQ ID NOS:30至SEQ ID NO:31、SEQ ID NOS:42至SEQ ID NO:43、SEQ ID NOS:38至SEQ ID NO:39、SEQ ID NOS:50至SEQ ID NO:51、SEQ ID NOS:168至SEQ ID NO:203中的核酸序列的至少50、100、150、200、250或500个碱基对长的片断。
[0283] 本发明已经参照其某些优选实施方案具体地进行了描述,以下的实施例仅用于解释本发明,无意在本发明的原理和最广义解释的范围及其等同物内对其进行限制。
[0284] 实施例
[0285] 实施例1
[0286] 在以下的实施例中,以下列出的序列通过MSP和/或HeavyMethyl测定来分析。该测定被设计为在LightCycler平台(Roche Diagnostics)上运行,但其它在现有技术中通常使用的这类仪器也是适合的。
[0287] MSP扩增产物通过Taqman类型荧光标记的检测探针来检测,HeavyMethyl扩增产物通过Lightcycler类型双探针来检测。
[0288] 目的基因组区域:
[0289] SEQ ID NO:165
[0290] 测定类型:HeavyMethyl
[0291] 引物:
[0292] SEQ ID NO:249
[0293] SEQ ID NO:250
[0294] 阻断剂:
[0295] SEQ ID NO:251
[0296] 探针:
[0297] SEQ ID NO:252
[0298] SEQ ID NO:253
[0299] 温度循环程序:
[0300] 活化:95℃ 10分钟
[0301] 55个循环:95℃ 10秒(20℃/s)
[0302] 56℃ 30秒(20℃/s)
[0303] 72℃ 10秒(20℃/s)
[0304] 熔解:
[0305] 95℃ 10秒20
[0306] 35℃ 20秒20检测
[0307] 95℃ 0秒0,1
[0308] 目的基因组区域
[0309] SEQ ID NO:24
[0310] 测定类型:HeavyMethyl
[0311] 引物:
[0312] SEQ ID NO:254
[0313] SEQ ID NO:255
[0314] 阻断剂:
[0315] SEQ ID NO:256
[0316] 探针:
[0317] SEQ ID NO:257(荧光标记的)
[0318] SEQ ID NO:258(Red640标记的)
[0319] 温度循环程序:
[0320] 95℃ 变性
[0321] 95℃ 10分钟
[0322] 55个循环:
[0323] 95℃ 变性10秒(20℃/s)
[0324] 56℃ 退火30秒(20℃/s)
[0325] 72℃ 延伸10秒(20℃/s)
[0326] 熔解:
[0327] 95℃ 10秒20
[0328] 35℃ 20秒20
[0329] 95℃ 0秒0,1
[0330] 目的基因组区域
[0331] SEQ ID NO:24
[0332] 测定类型HeavyMethyl
[0333] 引物:
[0334] SEQ ID NO:264
[0335] SEQ ID NO:265
[0336] 阻断剂:
[0337] SEQ ID NO:266
[0338] 探针:
[0339] SEQ ID NO:267(荧光标记的)
[0340] SEQ ID NO:268(Red64Q标己的)
[0341] 温度循环程序:
[0342] 95℃ 变性
[0343] 95℃ 10分钟
[0344] 55个循环:
[0345] 95℃ 变性10秒(20℃/s)
[0346] 56℃ 退火30秒(20℃/s)
[0347] 72℃ 延伸10秒(20℃/s)
[0348] 熔解:
[0349] 95℃ 10秒20
[0350] 35℃ 20秒20
[0351] 95℃ 0秒0,1
[0352] 目的基因组区域:
[0353] SEQ ID NO:28
[0354] 测定类型:MSP
[0355] 引物:
[0356] SEQ ID NO:274
[0357] SEQ ID NO:275
[0358] Taqman探针:
[0359] SEQ ID NO:276
[0360] 温度循环程序:
[0361] 活化:95℃ 10分钟
[0362] 55个循环:95℃ 15秒(20℃/s)
[0363] 62℃ 45秒(20℃/s)
[0364] 冷却:40℃ 5秒
[0365] 目的基因组区域:
[0366] SEQ ID NO:1
[0367] 测定类型:MSP
[0368] 引物:
[0369] SEQ ID NO:277
[0370] SEQ ID NO:278
[0371] Taqman探针:
[0372] SEQ ID NO:279
[0373] 温度循环程序:
[0374] 活化:95℃ 10分钟
[0375] 55个循环:95℃ 15秒(20℃/s)
[0376] 62℃ 45秒(20℃/s)
[0377] 冷却:40℃ 5秒
[0378] 目的基因组区域:
[0379] SEQ ID NO:28
[0380] 测定类型:MSP
[0381] 引物:
[0382] SEQ ID NO:280
[0383] SEQ ID NO:281
[0384] Taqman探针:
[0385] SEQ ID NO:282
[0386] 温度循环情况:
[0387] 活化:95℃ 10分钟
[0388] 55个循环:95℃ 15秒(20℃/s)
[0389] 62℃ 45秒(20℃/s)
[0390] 目的基因组区域:
[0391] SEQ ID NO:1
[0392] 测定类型:MSP
[0393] 引物:
[0394] SEQ ID NO:283
[0395] SEQ ID NO:284
[0396] Taqman探针:
[0397] SEQ ID NO:285
[0398] 温度循环情况:
[0399] 活化:95℃ 10分钟
[0400] 55个循环:95℃ 15秒(20℃/s)
[0401] 62℃ 45秒(20℃/s)
[0402] 目的基因组区域:
[0403] SEQ ID NO:28
[0404] 测定类型:HeavyMethyl
[0405] 引物:
[0406] SEQ ID NO:286
[0407] SEQ ID NO:287
[0408] 阻断剂:
[0409] SEQ ID NO:288
[0410] 探针:
[0411] SEQ ID NO:289
[0412] SEQ ID NO:29O
[0413] 温度循环情况:
[0414] 95℃ 活化
[0415] 95℃ 10分钟
[0416] 50个循环:
[0417] 95℃ 变性 10秒(20℃/s)
[0418] 56℃ 退火 30秒(20℃/s)
[0419] 72℃ 延伸 10秒(20℃/s)
[0420] 熔解
[0421] 95℃ 10秒20
[0422] 40℃ 10秒20
[0423] 70℃ 0秒0,1
[0424] 冷却
[0425] 40℃ 5秒
[0426] 目的基因组区域
[0427] SEQ ID NO:1
[0428] 测定类型:HeavyMethyl
[0429] 引物:
[0430] SEQ ID NO:291
[0431] SEQ ID NO:292
[0432] 阻断剂:
[0433] SEQ ID NO:293
[0434] 探针:
[0435] SEQ ID NO:294
[0436] SEQ ID NO:295
[0437] 温度循环情况:
[0438] 95℃ 活化
[0439] 95℃ 10分钟
[0440] 50个循环:
[0441] 95℃ 变性 10秒(20℃/s)
[0442] 56℃ 退火 30秒(20℃/s)
[0443] 72℃ 延伸 10秒(20℃/s)
[0444] 熔解
[0445] 95℃ 10秒20
[0446] 40℃ 10秒20
[0447] 70℃ 0秒0,1
[0448] 冷却
[0449] 40℃ 5秒
[0450] 目的基因组区域
[0451] SEQ ID NO:1
[0452] 测定类型:HeavyMethyl
[0453] 引物:
[0454] SEQ ID NO:296
[0455] SEQ ID NO:297
[0456] 阻断剂:
[0457] SEQ ID NO:289
[0458] 探针:
[0459] SEQ ID NO:299
[0460] SEQ ID NO:300
[0461] 温度循环情况:
[0462] 95℃ 活化
[0463] 95℃ 10分钟
[0464] 50个循环:
[0465] 95℃ 变性 10秒(20℃/s)
[0466] 56℃ 退火 30秒(20℃/s)
[0467] 72℃ 延伸 10秒(20℃/s)
[0468] 熔解
[0469] 95℃ 10秒20
[0470] 40℃ 10秒20
[0471] 70℃ 0秒0,1
[0472] 冷却
[0473] 40℃ 5秒
[0474] 目的基因组区域
[0475] SEQ ID N0:166
[0476] 测定类型:HeavyMethyl
[0477] 引物:
[0478] SEQ ID NO:259
[0479] SEQ ID NO:260
[0480] 阻断剂:
[0481] SEQ ID NO:261
[0482] 探针:
[0483] SEQ ID NO:262
[0484] SEQ ID NO:263
[0485] 温度循环情况:
[0486] 活化:95℃ 10分钟
[0487] 55个循环:95℃ 10秒
[0488] 58℃ 30秒
[0489] 72℃ 10秒
[0490] 熔解曲线:95℃10秒
[0491] 35℃ 20秒
[0492] 95℃ 0秒
[0493] 冷却:40℃ 5秒
[0494] 目的基因组区域:
[0495] SEQ ID NO:167
[0496] 测定类型:HeavyMethyl
[0497] 引物:
[0498] SEQ ID NO:269
[0499] SEQ ID NO:270
[0500] 阻断剂:
[0501] SEQ ID NO:271
[0502] 探针:
[0503] SEQ ID NO:272
[0504] SEQ ID NO:273
[0505] 温度循环情况:
[0506] 95℃ 变性
[0507] 95℃ 10分钟
[0508] 55个循环:
[0509] 95℃ 变性 10秒
[0510] 56℃ 退火 30秒
[0511] 72℃ 延伸 10秒
[0512] 熔解
[0513] 95℃ 10秒
[0514] 40℃ 10秒
[0515] 实施例2
[0516] 进行以下的分析,以便根据对全血内DNA甲基化的分析选择适合于结肠直肠癌筛查和/或诊断的优选组(panel)。
[0517] 采用测定平台(Lightcycler)和实时测定法(MSP和/或HeavyMethyl)分析每种标志物的性能,如适合于用在参照或临床实验室装置中的。在结肠直肠癌组织和全血中独立地测试每种标志物的性能,以便提供每种标志物的精确度的指示。
[0518] 所述组选自以下标志物:
[0519] SEQ ID NO:376
[0520] SEQ ID NO:378
[0521] SEQ ID NO:27
[0522] SEQ ID NO:26
[0523] SEQ ID NO:24
[0524] SEQ ID NO:1
[0525] SEQ ID NO:165
[0526] SEQ ID NO:25
[0527] SEQ ID NO:28
[0528] SEQ ID NO:378
[0529] SEQ ID NO:163
[0530] 每种标志物通过至少一种甲基化特异的测定法,即MSP和/或HeavyMethyl,进行分析,如表2所示。
[0531] 进行以下称为C3测定的进一步测定(非甲基化特异的),以便定量每种样品中的总DNA。所述C3测定为亚硫酸氢盐DNA测定,其独立于甲基化状态检测总DNA。使用了以下的引物和探针:
[0532] 引物:GGAGTGGAGGAAATTGAGAT SEQ ID NO:62
[0533] 引物:CCACACAACAAATACTCAAAAC SEQ ID NO:63
[0534] 探针:TGGGTGTTTGTAATTTTTGTTTTGTGTTAGGTT SEQ ID NO:64
[0535] 每种测定在结肠直肠癌、正常临近组织和/或全血样品上重复运行两次,如表3所示。
[0536] 采用可商购的试剂盒进行DNA提取,根据稍有修改的Olek et al.(1996)中描述的方法进行亚硫酸氢盐转化。
[0537] 所有的测定(C3和甲基化特异的)都采用Lightcycler平台进行。
[0538] 数据解释
[0539] DNA浓度的计算
[0540] Lightcycler仪器软件计算的Cp(交叉点值)和强度曲线被用于确定DNA浓度。对于甲基化测定和C3测定来说,都通过使每孔的CP值参照标准曲线来计算DNA浓度。
[0541] 样品重复
[0542] 在多数情况下,每种测定都要对每种样品运行两次,对每种样品得到多个测量结果。对于每种样品,分值计算如下:
[0543] 1.计算所有样品对的比例v1/v2
[0544] 2.如果二者都低于阈值0.1ng,则比例设为=,如果一个是=,而另一个高于阈值,则将比例设为100
[0545] 3.对于比例超过2.5的每个测定样品不再进一步分析
[0546] 4.对于不精确地具有两次重复的样品,取均值,不取任何分值甲基化百分比[0547] 采用C3测定的经测量小于1ng DNA的样品不再进一步考虑。对于每种样品,所检测的甲基化百分比被计算为采用甲基化测定定量测量的DNA浓度相对于通过C3测定定量测量的样品中DNA浓度。
[0548] 在三个不同的阈值水平上(参见表)以及在所有甲基化水平上(即检测甲基化的任何样品被视为阳性)确定甲基化的检测。
[0549] 每种测定的灵敏度从结肠直肠癌样品阳性检出率来确定,其中灵敏度确定为甲基化被阳性检出(即真阳性)的样品%。
[0550] 每种测定的特异性从全血样品阴性检出率(即真阴性检出率)来确定,其中从所分析的样品总数中扣除假阳性。
[0551] 结果
[0552] 测量的甲基化位于通过单独测定各种阈值内的所分析样品的比例显示在表4(结肠直肠癌组织)、5(正常临近组织)以及6(全血)。
[0553] 图30至37显示二元分布图(图的左上侧)以及测量的甲基化水平高于特定临界值(X轴)的结肠直肠癌组织和全血(以及某些情况下正常临近组织)样品的比例(Y轴)的相关多类型分布图(图的左下侧)。每张图的右侧是灵敏度相对于特异性的ROC图。ROC曲线是用于诊断测试的不同可能临界值的真阳性率相对假阳性率的图。其显示灵敏度和特异性之间取决于所选择的临界值的折中(灵敏度的任何增加将伴随有特异性的降低)。ROC曲线下面积(AUC)是对诊断测试准确性的衡量(面积越大越好,最佳是1,随机测试会具有沿对角线的ROC曲线,面积0.5;参考:J.P.Egan.Signal Detection Theory and ROC Analysis,Academic Press,New York,1975)。每个ROC图的AUC和Wilcoxon p-值显示在表12中。
[0554] 阶段
[0555] 根据癌症分期对结肠直肠癌结果的进一步的分析显示在表7中。在所述表中,显示了对CRC所有阶段的基于两个不同甲基化阈值(>10%和>20%)的标志物灵敏度。对于大多数标志物,灵敏度在所有CRC阶段都是一致的,所以这些标志物会适合于在筛查或监测测试中CRC所有阶段的检测。看起来在II期癌症中有灵敏度升高的趋势。灵敏度越低,更多的特异性标志物趋于鉴定更早期的癌症(例如,SEQ ID NO:25(测定3))并会增加筛查和/或监测测试的灵敏度,但也可用于其它的应用(活检,大便测试等)。
[0556] 组
[0557] 表8-11中显示了在结肠直肠癌和全血中通过测定组合测量甲基化位于各种阈值内的所分析样品的比例。每种情况下,表格显示了给定阈值内的样品比例,以及采用两种标志物相较于仅第一种标志物样品检测的改进。
[0558] 实施例3
[0559] 进行以下的分析,以证实基因Septin9(包括其转录本变体Q9HC74)及其组为用于结肠直肠癌筛查和/或诊断的适合的标志物,其基于在全血中的DNA甲基化分析,通过在大量样品组中验证测定的性能.
[0560] 标志物的性能通过采用测定平台(Lightcycler)和实时测定法(MSP和/或HeavyMethyl)来分析,如适合于用在参照或临床实验室装置中的。在结肠直肠组织(正常的临近组织)、结肠直肠癌组织和全血中独立地测试每种标志物的性能,以便提供对标志物精确性的指示。
[0561] 采用了以下的引物和探针:
[0562] 采用表2的Lightcycler探针的SEQ ID NO:1(测定7)采用以下方案进行:
[0563]
[0564] DNA
[0565] LightCycler程序:
[0566]
[0567] 采用表2Taqman探针的SEQ ID NO:1(测定7)采用以下方案进行:
[0568] 方案:
[0569]
[0570] 循环条件
[0571]
[0572] 进行C3测定以定量每种样品中的总DNA。该C3测定如以上实施例2进行。
[0573] 每种测定在结肠直肠癌、正常临近组织和/或全血样品上重复进行两次。分析了两组样品,样品组1显示在表13中,样品组2显示在表14中。
[0574] 样品组1采用以下测定进行分析,如表2中详述的:
[0575] SEQ ID NO:1(测定2)
[0576] SEQ ID NO:26(测定6)
[0577] SEQ ID NO:24(测定5)
[0578] SEQ ID NO:25(测定3)
[0579] 样品组2采用以下测定进行分析,如表2中详述的:
[0580] SEQ ID NO:1(测定7)LightCycler(LC)和Taqman(Taq)变体以及以下的测定[0581] SEQ ID NO:28(测定2)
[0582] SEQ ID NO:24(测定5b)
[0583] SEQ ID NO:29(测定2b)
[0584] 如表7中所详述的。
[0585] 仅分析含有大于4ng DNA的样品。在样品组1中,分析了27个血液样品和91个结肠直肠癌样品。在样品组2中,分析了26个血液样品,22个非临近的结肠直肠样品以及81个结肠直肠癌样品。
[0586] 所有的测定(C3和甲基化特异的)均采用Lightcycler平台进行。
[0587] DNA提取知亚硫酸氢盐处理
[0588] 按照制造商的说明通过Magna Pure方法(Roche)从所有的样品中分离DNA。然后根据以下的亚硫酸氢盐反应转化从纯化中得到的流出物。使流出物与354μl的亚硫酸氢盐溶液(5.89mol/1)和146μl的含有自由基清除剂的二氧杂环己烷((98.6mg的6-羟基-2,5,7,8-四甲基色原烷2-羧酸在2.5ml二氧杂环己烷中))混合。在99℃下使反应混合物变性3分钟,然后在以下温度程序下孵育总共7h分钟5O℃;一次热峰值(99.9℃)3分TM钟;1.5h50℃;一次热峰值(99℃)3分钟;3h50℃。随后采用Millipore Microcon 柱通过超滤纯化反应混合物。基本上按照制造商的说明书进行纯化。为此,使反应混合物与300μl的水混合、上样到超滤膜、离心15分钟,接着以1x TE缓冲液洗涤。在这种处理中DNA仍保留在膜上。然后进行脱磺酸基。为此,加入0.2mol/lNaOH并孵育10分钟。然后顺序进行离心(10分钟)和1x TE缓冲液的洗涤步骤。此后,洗脱DNA。为此,使膜与75μl加热的1x TE缓冲液(50℃)混合10分钟。按照制造商的说明书将膜翻转。随后进行重复的离心,以此使DNA从膜移开。10μl的流出物被用于Lightcycler实时PCR测定。
[0589] 反应溶液和热循环条件
[0590] SEQ ID NQ:26测定6(HeaVvMethyl测定)
[0591] 反应溶液:
[0592] 水
[0593]
[0594] 热循环条件:
[0595]
[0596] SEQ ID NO:25测定3(HeavvMethvl测定)
[0597] 反应溶液:
[0598] 水
[0599]
[0600]
[0601] 热循环条件:
[0602]
[0603] SEQ ID NO:24Assay5B(HeayvMethyl Assay)
[0604] 反应溶液:
[0605] 水
[0606]
[0607] 热循环条件:
[0608]
[0609]
[0610] SEQ ID NO:24测定5(HeavvMethyl测定)
[0611] 反应溶液:
[0612] 水
[0613]
[0614] 热循环条件:
[0615]
[0616] SEQ ID NO:1测定2(MSP测定)
[0617] 反应溶液:
[0618] 水(3315932)
[0619]
[0620] 热循环条件:
[0621]
[0622] SEQ ID NQ:1测定7(LiqhtCycler探针HeawMethyl测定)
[0623] 反应溶液:
[0624] 水
[0625]
[0626]
[0627] SEQ ID NO:1测定7(Taqman HeavyMethyl测定)
[0628] 反应溶液:
[0629] 水
[0630]
[0631] 热循环条件:
[0632]
[0633] SEQ ID NO:28测定2(HeavyMethy)测定)
[0634] 反应溶液:
[0635] 水
[0636]
[0637] 热循环条件:
[0638]
[0639] SEQ ID NO:29测定2B(HeavvMethyl测定)
[0640] 反应溶液:
[0641] 水
[0642]
[0643] 热循环条件:
[0644]
[0645] S EQ ID NO:29测定2(HeavvMethyl测定)
[0646] 反应溶液:
[0647] 水
[0648]
[0649] 热循环条件:
[0650]
[0651] 数据解释
[0652] DNA浓度的计算
[0653] Lightcycler仪器软件计算的Cp(交叉点值)被用于确定DNA浓度。对于甲基化测定和C3测定来说,都通过使每孔的CP值参照标准曲线来计算DNA浓度
[0654] 在多数情况下,每种测定都要对每种样品运行两次,对每种样品得到多个测量结果。
[0655] 甲基化百分比
[0656] 采用C3测定的经测量小于4ng DNA的所有样品不再进一步考虑。对于每种样品,所检测的甲基化百分比被计算为采用甲基化测定定量测量的DNA浓度相对于通过C3测定定量测量的样品中DNA浓度。
[0657] 在多个个不同阈值水平上(参见表)以及在所有甲基化水平上(即检测甲基化的任何样品均被视为阳性)确定甲基化的检测。
[0658] 每种测定的灵敏度从结肠直肠癌样品阳性检出率来确定,其中灵敏度确定为甲基化被阳性检出(即真阳性)的样品%。
[0659] 每种测定的特异性从全血样品阴性捡出率(即真阴性检出率)来确定,其中从所分析的样品总数中扣除假阳性。
[0660] 结果
[0661] 各个测定法测量的甲基化位于给定阈值内的经分析样品的比例或数量显示在表15(样品组1)和16(样品组2)中。其中至少两次重复的一次在给定阈值内测试为阳性,则该样品被认为是阳性。通过确定使用该组的至少一种测定被测量为具有给定阈值内的甲基化的被分析样品的比例或数量来汇编该组数据。当两个重复中的至少一个被测试为给定阈值内的阳性时,则该样品被认为是阳性。
[0662] 在14个乳腺癌样品、12个结肠直肠癌样品和10个全血样品(样品组3)中进一步测试SEQ ID NO:1测定2。各个测定法测量的甲基化位于给定阈值内的经分析样品的比例或数量显示在表18中。
[0663] 实施例4:其它癌症
[0664] 进行以下的分析,以证实基因Septin9(包括其转录本变体Q9HC74)及其组为用于筛查和/或诊断其它癌症的适合的标志物,其基于在全血中的DNA甲基化分析,通过在大量样品组中验证测定的性能。
[0665] 采用表2的SEQ ID NO:1HeavyMethyl测定7分析标志物的性能,反应条件按照实施例2。
[0666] 表20显示了在每类中测试的样品数量,以及两次重复测定甲基化为阳性的样品的数量。图3显示了在其它癌症中测量的甲基化水平,可以看到该基因在多种类型的癌症中被甲基化。但是,只有肝癌以等于或高于结肠直肠癌的比例甲基化。图4显示了在其它非癌疾病中测量的甲基化水平,可以看出只有肾盂肾炎以等于或高于结肠直肠癌的比例被甲基化。
[0667] 实施例5:亚硫酸氢盐测序
[0668] Septin9基因的测序
[0669] 据推测Septin9具有4(参见之前关于Ensembl数据库的讨论)至至少6个不同的转录本变体(在5’端,参见Russell,Oncogene.2001Sep13;20(41):5930-9)。对于Russell等人所提及的变体,扩增子被设计为覆盖四种变体(α、β、γ和ε)的CpG岛或富含CpG区域。有两个CpG岛重叠2个变体,ε和γ。β变体看起来被γCPG岛调节。
[0670] 分析了来自12患者的样品,Septin9甲基化的水平已通过HeavyMethyl分析被定量,如上所述。两个样品具有大于20%的甲基化(样品C组),4个样品具有l0%至20%甲基化(样品B组)以及6个样品具有之前显示了至多10%甲基化(样品A组)。
[0671] 此外,来自没有明显疾病的个体的3个全血样品的DNA也用于α和β扩增子(样品N组)。
[0672] DNA提取和亚硫酸氢盐处理
[0673] 采用QIAGEN Genomic-Tip500/G或100/G,按照制造商的说明书分离DNA。随后根据以下的亚硫酸氢盐反应转化所纯化的基因组DNA。
[0674] 100μl中的2μlDNA与354μl的亚硫酸氢盐溶液(22ml无核酸酶水中10.36g亚硫酸氢钠和2.49g亚硫酸钠)以及含有自由基清除剂(6-羟基-2,5,7,8-四甲基色原烷2-羧酸,8.2ml二 烷中323mg)的146μl二 烷混合。该亚硫酸氢盐反应如下:
[0675]时间 速度 作用
3分钟 水浴99.9℃
30分钟 1000rpm Thermomixer60℃
3分钟 水浴99.9℃
1.5小时 1000rpm Thermomixer60℃
3分钟 水浴99.9℃
3小时 1000rpm Thermomixer60℃
[0676] 反应混合物随后采用Millipore MicroconTM柱通过超滤纯化。该纯化按照制造商的说明书进行。更具体地,用脱磺酸基和洗涤:
[0677]
[0678]
[0679] 然后,将50μl的亚硫酸氢盐TE缓冲液(预热至50℃;10mM Tris中0.1mM EDTA)加至膜,并在搅动下(1000rpm)孵育10分钟。将该柱反向放入1.7ml低截留管并以1000g旋转7分钟以洗脱DNA。采用对照序列(HB14)的实时PCR测定确定DNA浓度。
[0680] 扩增
[0681] 扩增子和PCR引物参见表21。在其名称中带有“rc”的扩增子从Bis2链扩增,而其它从Bisl链扩增。
[0682] 目的片段采用以下条件在25μl反应中扩增。
[0683] PCR反应:
[0684]
[0685] 循环条件:
[0686] 3min94℃;20s94℃;30s54℃;45s72℃(38-42循环);10min72℃PCR产物的纯化[0687] 采用MontageTM DNA凝胶提取试剂盒,根据制造商的说明书纯化PCR产物。简言之,PCR反应物在1%改良的TAE(含有0.1mM EDTA,而不是标准TAE中1.0mM EDTA)琼脂糖凝胶上跑胶。切下目的DNA带并剪碎。将胶块至于Montage凝胶提取设备中,并以5000g旋转10分钟收集DNA溶液。纯化的DNA被进一步浓缩至10μl。
[0688] TA克隆
[0689] 采用Invitrogen TA克隆试剂盒,按照制造商的说明克隆并扩增所述PCR产物。简言之,将2μl纯化和浓缩的PCR产物用在TOPO克隆反应中以将其克隆进载体
2.1-TOPO。转化采用化学上能胜任的E.coli株TOP10进行。
[0690] 测序
[0691] 挑取单个克隆并在LB(50μg卡比西林/ml LB用于选择)中培养。1μl的过夜培养物被用于在20μ1体积中的菌落PCR:
[0692] PCR混合物
[0693] 2.5μl10×DyNAzyme缓冲液
[0694] 2.5μl2mM dNTPs
[0695] 1.25μlM13F引物(10μM)
[0696] 1.25μl M13R引物(10μM)
[0697] 0.25μl DyNAzyme聚合酶
[0698] 12.25μl ddH20
[0699] 循环条件:
[0700] 3min94℃;1min94℃;1min55℃;1min72℃(36循环);10min72℃
[0701] 采用标准操作进行菌落PCR扩增子纯化和序列阅读。所用的测序引物为M13反向引物或产生最初PCR产物的扩增子特异引物之一。
[0702] 结果
[0703] 图5至29提供了从通过申请人知识产权软件(进一步的信息,参见wO2004/000463)分析的γ扩增子的亚硫酸氢盐测序数据产生的矩阵。矩阵的每列代表用于一个样品重复的测序数据,每种样品的所用重复被划分进一个块中。矩阵的每行代表片段内的单个CpG位点。扩增产物的CpG数目显示在矩阵的左侧。
[0704] 在每个CpG位置测量的甲基化的量由从浅灰色(0%甲基化)、至中灰(50%甲基化),至黑灰(100%甲基化)表示。一些扩增产物、样品或CpG位置未被正确测序,它们显示为白色,
[0705] 图5至29提供了实施例5的亚硫酸氢盐测序数据的矩阵。该矩阵的每列代表一个样品的重复测序数据,每个样品的所有重复被分在一个块中。矩阵的每行代表片段内的单一CpG位点。扩增产物的CpG数显示在矩阵的左侧。
[0706] 在每个CpG位置测量的甲基化的量由从浅灰色(0%甲基化)、至中灰(50%甲基化),至黑灰(100%甲基化)表示。一些扩增产物、样品或CpG位置未被成功测序,它们显示为白色。
[0707] 图5至12提供了在4个以前被定量(通过HeavyMethyl分析)具有10%至20%甲基化的样品中,根据表21的基因组序列的亚硫酸氢盐转化扩增产物的测序概况。
[0708] 图13至20提供了在2个以前被定量(通过HeavyMethyl分析)具有高于20%甲基化的样品中,根据表21的基因组序列的亚硫酸氢盐转化扩增产物的测序概况。
[0709] 图21至22提供了在3个健康个体血液样品中根据表21的基因组序列的亚硫酸氢盐转化扩增产物的测序概况。
[0710] 图23至29提供了在6个以前被定量(通过HeavyMethyl分析)具有低于10%甲基化(但高于0%)的样品中,根据表21的基因组序列的亚硫酸氢盐转化扩增产物的测序概况。
[0711] 实施例6
[0712] 适合于分析SEQ ID NO:159至SEQ ID NO:163的基因组序列的经亚硫酸氢盐处理的变体的其它测定显示在表22中。基因组DNA的亚硫酸氢盐处理可以按现有技术中已知的方案(例如Olek A等人,A modified and improved methodfor bisulfite based cytosine methylation analysis(基于亚硫酸氢盐的胞嘧啶甲基化分析的改变和改进的方法),Nucleic Acids Res.24:5064-6,1996)进行。适合的循环条件为本领域技术人员所知,并且可以从寡聚体的熔解温度得出,如表22中所示。
[0713] 表1:根据序列表的基因组序列
[0714]
[0715]
[0716]
[0717] *Ensembl数据库
[0718] 表2
[0719]
[0720]
[0721] 表3:根据实施例2所分析的样品
[0722]
[0723] 表4:具有位于不同阈值内甲基化的结肠直肠癌样品的比例
[0724]
[0725]
[0726] 表5:具有位于不同阈值内甲基化的正常临近组织样品的比例
[0727]
[0728] 表6:具有位于不同阈值内甲基化的全血样品的比例
[0729]
[0730] 表7:根据疾病阶段的不同甲基化阈值内的结肠直肠癌的比例
[0731]
[0732] 表8:检测到的位于1%至10%甲基化阈值内的结肠直肠癌样品的比例
[0733]
[0734]
[0735] 表9检测到的位于15%至25%甲基化阈值内的结肠直肠癌样品的比例
[0736]
[0737]
[0738] 表10检测到的位于30%至50%甲基化阈值内的结肠直肠癌样品的比例
[0739]
[0740]
[0741] 表11经检测位于0.01%至0.1%甲基化阈值内的全血样品比例
[0742]
[0743]
[0744] 表12:如图30-37中说明的血液和结肠直肠癌样品之间的差异*
[0745]
[0746] *置信区间显示在括号内
[0747] 表13:实施例3的样品组1
[0748]样品类型 性别 年龄 期 T N M 位置
CRC F 39 III 4 1 0 乙状结肠
CRC F 65 III 3 2 0 回盲肠
CRC M 58 IV 直肠
CRC M 63 III 3 1 0 直肠
CRC M 71 II 升结肠
CRC F 69 I 2 0 0 盲肠
CRC F 54 III 3 2 0 盲肠
CRC M 44 IV
CRC F 75 IV 横结肠
CRC F 60 II 直肠
CRC M 76 I 降结肠
CRC M 69 IV 乙状结肠
CRC M 73 I 1 0 0 直肠
[0749]CRC M II 3 0 0 升结肠
CRC M 62 III 3 1
CRC F 49 IV 升结肠
CRC F 58 III 3 1 X 升结肠
CRC M 42 IV 3 0 1
CRC M 64 I 2 0 0 乙状结肠
CRC F 64 III 直肠
CRC F 70 III 3 1 0 终末回肠
CRC M 67
CRC M 80 III 3 1 0 直肠乙状结肠
CRC F 72 IV 乙状结肠
CRC M III 直肠
CRC M 56 I 2 0 0 乙状结肠
CRC M 72 III 2 1 0 直肠
CRC M 45 IV 4 2 1 盲肠
CRC F II 3 0 0
CRC M 74 III 3 1 0 直肠乙状结肠
CRC F 75 III 4 2 0 盲肠壁
CRC M II川 3 1 0
CRC M I 2 0 0 升结肠
CRC F 74 I 2 0 0 盲肠
CRC M 62 I 2 0 0 直肠乙状结肠
CRC F 60 II 3 0 0 直肠
CRC F 80 II 升结肠
CRC F 70 III 4 2 0 直肠
CRC M III 3 1 0
CRC F 75 III 3 1 0 升结肠
CRC F 49 IV 4 X 1 直肠
CRC F 47 I 肛
CRC M 81 IV 1
CRC F 89 III 3 1 0 直肠
CRC M 85 III 3 1 0 盲肠
[0750]CRC M 52 III 2 1 0
CRC M 75 II 乙状结肠
CRC M
CRC F 71
CRC M III 直肠
CRC M 61 3 X 0 降结肠
CRC F 56 未知 乙状结肠
CRC F 68 IV 3 2 1 乙状结肠
CRC F 65 III 3 2 0 回盲肠
CRC M 88 II 3 0 0 曲段
CRC F 72 III 盲肠
CRC M 61 IV 3 2 1 直肠
CRC M III 3 2
CRC M 52 II 3 0 0 横结肠
CRC M 66 IV 2 0 1 直肠
CRC M 64 III 升结肠
CRC F 65 II 3 0 0
CRC M 61 IV 3 2 1 乙状结肠
CRC M 64 III 3. 1 0 升结肠
CRC M 76 0 0 乙状结肠
CRC M 64 I 2 0 0 升结肠
CRC M 56 I 2 0 0 横结肠
CRC F 67 II 3 0 0 乙状结肠
CRC M II 3 0 0 升结肠
CRC M 66 III 4 1 0
CRC M II 3 0 0
CRC F III
CRC F 65 I 2 0 X 直肠
CRC M II 3 0 0
CRC M 40 I FAP
CRC M 77 I 2 0 0 直肠乙状结肠
CRC M 65 III 4 2 0 降结肠
CRC M 68 IV 乙状结肠
CRC M 67 II 直肠
CRC M unk 直肠
CRC F 63 3 X 0
CRC M 68 unk 降结肠
CRC F 53 III 3 1 0 升结肠
[0751]CRC M II 3 0 0
CRC M 68 I 2 0 0 直肠
CRC M 84 III 直肠
CRC F 53 1 1 0 0 降结肠
CRC M 72 III 4 1 0
CRC F 69 I 1 0 0 乙状结肠
CRC M I 3 0 0 降结肠
CRC M I 3 0 0 盲肠
正常血液 F 62 n.a. n.a. n.a. n.a. n.a.
正常血液 M 62 n.a. n.a. n.a. n.a. n.a.
正常血液 F 44 n.a. n.a. n.a. n.a. n.a.
正常血液 F 57 n.a. n.a. n.a. n.a. n.a.
正常血液 F 51 n.a. n.a. n.a. n.a. n.a.
正常血液 M 66 n.a. n.a. n.a. n.a. n.a.
正常血液 M 65 n.a. n.a. n.a. n.a. n.a.
正常血液 M 55 n.a. n.a. n.a. n.a. n.a.
正常血液 F 70 n.a. n.a. n.a. n.a. n.a.
正常血液 M 40 n.a. n.a. n.a. n.a. n.a.
[0752]正常血液 F 42 n.a. n.a. n.a. n.a. n.a.
正常血液 F 68 n.a. n.a. n.a. n.a. n.a.
正常血液 F 67 n.a. n.a. n.a. n.a. n.a.
正常血液 F 53 n.a. n.a. n.a. n.a. n.a.
正常血液 F n.a. n.a. n.a. n.a. n.a.
正常血液 F 50 n.a. n.a. n.a. n.a. n.a.
正常血液 M 50 n.a. n.a. n.a. n.a. n.a.
正常血液 M 51 n.a. n.a. n.a. n.a. n.a.
正常血液 M 56 n.a. n.a. n.a. n.a. n.a.
正常血液 M 58 n.a. n.a. n.a. n.a. n.a.
正常血液 M 67 n.a. n.a. n.a. n.a. n.a.
正常血液 M 55 n.a. n.a. n.a. n.a. n.a.
正常血液 M 62 n.a. n.a. n.a. n.a. n.a.
正常血液 M 66 n.a. n.a. n.a. n.a. n.a.
正常血液 F 56 n.a. n.a. n.a. n.a. n.a.
正常血液 M 56 n.a. n.a. n.a. n.a. n.a.
正常血液 F 69 n.a. n.a. n.a. n.a. n.a.
[0753] 表14:实施例3的样品组2
[0754]样品类型 性别 年龄 期 T N M 位置
CRC F 49 IV 升结肠
CRC F 72 IV 乙状结肠
CRC M 69 IV 乙状结肠
CRC F 58 III 3 1 X 升结肠
CRC F 60 I 直肠
CRC F 74 I 2 0 0 盲肠
CRC F 70 III 3 1 0 终末回肠
CRC F 69 I 2 0 0 盲肠
CRC F 39 III 4 1 0 乙状结肠
CRC M. 56 I 2 0 0 乙状结肠
CRC F II 3 0 0
CRC M 64 I 2 0 0 乙状结肠
CRC M 45 IV 4 2 1 盲肠
CRC F 54 III 3 2 0 盲肠
CRC M 42 IV 3 0 1
CRC M 73 I 1 0 0 直肠
CRC M 62 III 3 1
CRC M I 2 0 0 升结肠
CRC F 75 III 3 1 0 升结肠
CRC M 74 III 3 1 0 直肠乙状结肠
CRC F 68 IV 3 2 1 乙状结肠
CRC F 75 IV 横结肠
CRC M 85 III 3 1 0 盲肠
CRC M 80 III 3 1 0 直肠乙状结肠
CRC M 66 III 4 1 0
CRC F 70 III 4 2 0 直肠
CRC F 89 III 3 1 0 直肠
[0755]CRC M 67
CRC F 67 II 3 0 0 乙状结肠
CRC M 66 IV 2 0 1 直肠
CRC F 56 unk 乙状结肠
CRC M 72 III 2 1 0 直肠
CRC F 80 II 升结肠
CRC M 75 II 乙状结肠
CRC F 49 IV 4 X 1 直肠
CRC M III 直肠
CRC F 60 II 3 0 0 直肠
CRC M 62 I 2 0 0 直肠乙状结肠
CRC M 88 II 3 0 0 曲段
CRC M 61 IV 3 2 1 乙状结肠
CRC M 61 3 X 0 降结肠
CRC F 64 III 直肠
CRC M III 直肠
CRC M 52 II 3 0 0 横结肠
CRC F 71
CRC M 81 IV 1
CRC F 65 III 3 2 0 回盲肠
CRC M
CRC F 65 II 3 0 0
CRC F 72 III 盲肠
CRC M 61 IV 3 2 1 直肠
CRC M 52 III 2 1 0
CRC M II 3 0 0
CRC F 47 I 肛门
CRC M I 3 0 0 升结肠
CRC M 64 III 3 1 0 升结肠
CRC M 64 I 2 0 0 升结肠
CRC M 76 0 0 乙状结肠
CRC M 56 I 2 0 0 横结肠
CRC M 65 III 4 2 0 降结肠
[0756]CRC M 40 I FAP
CRC F 53 I 1 0 0 降结肠
CRC M II 3 0 O
CRC M III 3 2
CRC M 未知 直肠
CRC M 68 I 2 0 O 直肠
CRC F 63 3 × O
CRC F III
CRC M 67 II 直肠
CRC F 65 I 2 0 X 直肠
CRC M 64 III 升结肠
CRC M 68 IV 乙状结肠
CRC M II 3 0 0
CRC M 72 III 4 1 0
CRC M 77 I 2 0 O 直肠乙状结肠
CRC F 53 III 3 1 0 升结肠
CRC F 69 I 1 0 0 乙状结肠
CRC M 84 III 直肠
CRC M II 3 0 0 降结肠
CRC M 68 未知 降结肠
CRC M II 3 O 0 盲肠
正常血液 M 55 n.a. n.a. n.a. n.a. n.a.
正常血液 M 62 n.a. n.a. n.a. n.a. n.a.
正常血液 F 57 n.a. n.a. n.a. n.a. n.a.
正常血液 F 62 n.a. n.a. n.a. n.a. n.a.
正常血液 M 65 n.a. n.a. n.a. n.a. n.a.
正常血液 F n.a. n.a. n.a. n.a. n.a.
[0757]正常血液 F 44 n.a. n.a. n.a. n.a. n.a.
正常血液 F 68 n.a. n.a. n.a. n.a. n.a.
正常血液 F 70 n.a. n.a. n.a. n.a. n.a.
正常血液 M 58 n.a. n.a. n.a. n.a. n.a.
正常血液 M 62 n.a. n.a. n.a. n.a. n.a.
正常血液 F 53 n.a. n.a. n.a. n.a. n.a.
正常血液 F 42 n.a. n.a. n.a. n.a. n.a.
正常血液 F 51 n.a. n.a. n.a. n.a. n.a.
正常血液 M 66 n.a. n.a. n.a. n.a. n.a.
正常血液 M 51 n.a. n.a. n.a. n.a. n.a.
正常血液 M 40 n.a. n.a. n.a. n.a. n.a.
正常血液 M 56 n.a. n.a. n.a. n.a. n.a.
正常血液 F 56 n.a. n.a. n.a. n.a. n.a.
正常血液 F 50 n.a. n.a. n.a. n.a. n.a.
正常血液 M 50 n.a. n.a. n.a. n.a. n.a.
正常血液 F 67 n.a. n.a. n.a. n.a. n.a.
正常血液 M 67 n.a. n.a. n.a. n.a. n.a.
[0758]正常血液 M 55 n.a. n.a. n.a. n.a. n.a.
正常血液 M 66 n.a. n.a. n.a. n.a. n.a.
正常血液 M 56 n.a. n.a. n.a. n.a. n.a.
[0759] 表15:具有位于不同阈值内甲基化的来自实施例3样品组1的样品比例
[0760]
[0761]
[0762] *两次重复测试阳性
[0763] **两次重复测试之一阳性或经测量位于阈值内
[0764] 表16具有位于不同阈值内甲基化的来自实施例3样品组2的样品比例
[0765]
[0766] *两次重复测试之一阳性或经测量位于阈值内
[0767] 表17根据实施例3的测定
[0768]
[0769]
[0770] 表18:具有位于不同阈值的甲基化的来自实施例3样品组1的样品比例
[0771]
[0772] 表19:实施例3的样品组3
[0773]
[0774]
[0775]
[0776]
[0777]
[0778] 表20:实施例4的结果
[0779]
[0780] 表21根据实施例5的引物和扩增产物的基因组等价物
[0781]
[0782] 注意:在名称中具有“rc”的扩增子是从Bis2链扩增的,
[0783] 而其它是从Bisl扩增的。
[0784] 表22:根据实施例6的寡聚体
[0785]
[0786] 表21根据实施例5的引物和扩增产物的基因组等价物
[0787]
[0788] 注意:在名称中具有“rc”的扩增子是从Bis2链扩增的,
[0789] 而其它是从Bisl扩增的。
[0790] 表22:根据实施例6的寡聚体
[0791]
[0792]
[0793]
[0794] 以下是原申请的权利要求书,作为说明书的一部分并入此处:
[0795] 1.检测和/或分类个体中细胞增殖性病症的方法,包括确定分离自所述个体的生物样品中至少一种选自Septin9(包括其所有的转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT以及SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列的表达水平,其中欠表达和/或CpG甲基化表明所述病症存在或其种类。
[0796] 2.如权利要求1所述的方法,其中癌性细胞增殖性病症区别于良性细胞增殖性病症,所述方法特征在于欠表达和/或CpG甲基化的存在表明癌性细胞增殖性病症的存在,而其不存在表明良性细胞增殖性病症的存在。
[0797] 3.如权利要求1所述的方法,其中所述细胞增殖性病症为癌症。
[0798] 4.如权利要求3所述的方法,其中所述细胞增殖性病症为肝细胞或结肠直肠癌。
[0799] 5.如权利要求1-4任一项所述的方法,其中所述表达水平通过检测从所述基因转录的mRNA的存在与否或水平来确定。
[0800] 6.如权利要求1-4任一项所述的方法,其中所述表达水平通过检测由所述基因或其序列编码的多肽的存在与否或水平来确定。
[0801] 7.如权利要求6所述的方法,其中所述多肽通过一种或多种选自western印迹分析、色谱法、免疫分析、ELISA免疫分析、放射免疫分析、抗体法及其组合来检测。
[0802] 8.如权利要求1-4任一项所述的方法,其中所述表达通过检测所述基因内CpG甲基化的存在与否来确定,其中甲基化的存在表明细胞增殖性病症的存在。
[0803] 9.检测和/或分类个体中细胞增殖性病症的方法,包括使从所述个体生物样品中分离的基因组DNA与至少一种试剂或成组试剂接触,所述至少一种试剂或成组试剂区分所述基因组DNA至少一个靶区域内甲基化和未甲基化CpG二核苷酸,其中所述靶区域包含或在严紧条件下杂交于至少一种分别选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少16连续核苷酸的序列,其中所述连续核苷酸包含至少一个CpG二核苷酸序列,由此至少部分地提供对细胞增殖性病症的检测和/或分类。
[0804] 10.检测和/或分类个体中细胞增殖性病症的方法,包括:
[0805] a.提取或以其它方式从所述个体生物样品分离基因组DNA;
[0806] b.用一种或多种试剂处理a)的所述基因组DNA或其片段,以便将其5位未甲基化的胞嘧啶碱基转化为尿嘧啶或在杂交性能方面可检测地不同于胞嘧啶的其它碱基;
[0807] c.使所述经处理的基因组DNA或其经处理的片段与扩增酶和至少一种引物接触,所述引物包括至少9核苷酸的连续序列,其互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO.42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:5O至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203及其互补序列的序列,其中所述经处理的基因组DNA或其片段被扩增以产生至少一种扩增产物或不被扩增;以及
[0808] d.基于所述扩增物是否存在或其性质,确定选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的甲基化状态或水平,或者反映选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的多个CpG二核苷酸平均甲基化状态或水平的均值或值,由此至少部分地提供至少检测和分类细胞增殖性病症之一。
[0809] 11.如权利要求9所述的方法,其中b)中处理所述基因组DNA或其片段包括使用选自亚硫酸氢盐、酸式亚硫酸盐、disulfite及其组合的试剂。
[0810] 12.如权利要求9所述的方法,其中c)中的接触或扩增包括使用至少一种选自如下的方法:使用耐热DNA聚合酶作为所述扩增酶;使用缺乏5’-3’外切酶活性的聚合酶;使用聚合酶链式反应(PCR);产生带有可检测标记的扩增产物核酸分子。
[0811] 13.如权利要求1-11中任一项所述的方法,其中从所述个体获得的所述生物样品选自细胞系、组织学切片、组织活检、石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。
[0812] 14.如权利要求10所述的方法,还在步骤d)中包括使用至少一种核酸分子或肽核酸分子,其在各种情况下都包含互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203序列及其互补序列的至少9核苷酸长度的连续序列,其中所述核酸分子或肽核酸分子抑制其所杂交的所述核酸的扩增。
[0813] 15.如权利要求10所述的方法,其中d)中的确定包括至少一种核酸分子或肽核酸分子的杂交,所述至少一种核酸分子或肽核酸分子在各种情况下包含互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:10.至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203序列及其互补序列的至少9核苷酸长度的连续序列。
[0814] 16.如权利要求15所述的方法,其中至少一种这种杂交核酸分子或肽核酸分子被连接到固相。
[0815] 17.如权利要求15所述的方法,还使至少一种这种杂交的核酸分子延伸至少一个碱基。
[0816] 18.如权利要求10所述的方法,其中d)中的确定包括对所述扩增产物的测序。
[0817] 19.如权利要求10所述的方法,其中c)中的接触或扩增包括使用甲基化特异的引物。
[0818] 20.检测和/或分类细胞增殖性病症的方法,包括:
[0819] a.提取或以其它方式从得自所述个体的生物样品分离基因组DNA;
[0820] b.以一种或多种甲基化敏感限制酶消化a)的所述基因组DNA或其片段:
[0821] 使b)的DNA限制酶消化产物与扩增酶和至少两种适于扩增序列的引物接触,所述序列包含选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸;以及
[0822] c.基于扩增产物存在与否,确定选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少一个CpG二核苷酸的甲基化状态或水平,由此至少部分地提供至少检测和分类细胞增殖性病症之一。
[0823] 21.如权利要求20所述的方法,其中通过杂交至少一种核酸或肽核酸来确定扩增产物的存在与否,所述至少一种核酸或肽核酸等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少16碱基长片段。
[0824] 22.衍生自基因组SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ TD NO:159至SEQ ID NO:167的经处理的核酸,其中所述处理适合于将所述基因组DNA序列的至少一个未甲基化的胞嘧啶碱基转化至尿嘧啶或在杂交上可检测地不同于胞嘧啶的其它碱基。
[0825] 23.核酸,其包含选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ IDNO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203的经处理的基因组DNA序列及其互补序列的至少16连续核苷酸,其中所述处理合适于将所述基因组DNA序列的至少一个未甲基化的胞嘧啶碱基转变为尿嘧啶或在杂交上可检测地不同于胞嘧啶的其它碱基。
[0826] 24.核酸,包含选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ1DNO.50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203及其互补序列的DNA序列的至少50连续核苷酸。
[0827] 25.如权利要求22-24中任一项所述的核酸,其中所述连续碱基序列包含至少一个CpG、TpG或CpA二核苷酸序列。
[0828] 26.核酸,包含用作诊断工具的选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167、SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50.至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203的核酸序列及其互补序列的至少16连续核苷酸。
[0829] 27.适合于实施权利要求3所述的方法的试剂盒,包括a)多种能够在严紧或中等严紧条件下杂交至少一种选自Septin9(包括其所有转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT和SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列转录产物的寡核苷酸或多核苷酸;(b)适合于容纳所述寡核苷酸或多核苷酸以及包含所述转录产物的患者生物样品的容器,其中所述寡核苷酸或多核苷酸能在严紧或中等严紧条件下杂交所述转录产物,(c)检测(b)的杂交的工具;以及任选地,(d)使用和解释试剂盒结果的说明书。
[0830] 28.适合于实施权利要求5所述的方法的试剂盒,包括(a)检测至少一种选自Septin9(包括其所有转录本变体)、FOXL2、SARM1、VTN、PRDM6、NR2E1、FAT和SEQ ID NO:160至SEQ ID NO:165的基因或基因组序列的多肽的工具;(b)适合于容纳所述工具和包含所述多肽的患者生物样品的容器,其中所述工具能与所述多肽形成复合物;(c)检测(b)的复合物的工具。
[0831] 29.适合于实施权利要求9的方法的试剂盒,包括(a)亚硫酸氢盐试剂;(b)适合于容纳所述亚硫酸氢盐和患者生物样品的容器;(c)含有两种寡核苷酸的至少一套寡核苷酸,其序列在各种情况下都等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:10至SEQ ID NO:15、SEQ ID NO:28至SEQ ID NO:33、SEQ ID NO:30至SEQ ID NO:31、SEQ ID NO:42至SEQ ID NO:43、SEQ ID NO:38至SEQ ID NO:39、SEQ ID NO:50至SEQ ID NO:51、SEQ ID NO:168至SEQ ID NO:203的序列的9或更优选18碱基长片段。
[0832] 30.适合于实施权利要求9的方法的试剂盒,包括(a)甲基化敏感限制酶试剂;(b)适合于容纳所述试剂和患者生物样品的容器;(c)含有一种或多种核酸或肽核酸的至少一套寡核苷酸,其等同于、互补于或在严紧或高度严紧条件下杂交于选自SEQ ID NO:1至SEQ ID NO:3、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:159至SEQ ID NO:167的序列的至少
9碱基长片段;以及任选地,(d)使用和解释试剂盒结果的说明书。
[0833] 31.权利要求1-21的方法、权利要求22-26的核酸和/或权利要求27-30的试剂盒在细胞增殖性病症的诊断和/或分类中的用途。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈