评价化学实体与其靶标分子之间的相互作用的全基因组方
法
[0002] 本申请要求2012年6月14日提交的美国临时申请No.61/659,750和2012年7月6日提交的美国临时申请No.61/668,718和2012年9月14日提交的美国临时申请No.61/701,434和2013年3月15日提交的美国临时申请No.61/800,060的利益。
[0003] 将以上申请的完整教导按引用并入本文中。
[0004] 政府支持
[0005] 本
发明是用来自国家卫生研究院(National Institutes of Health)的RO1-HG002688和来自美国癌症协会的PF-11-042-01-DMC下的政府支持进行的。政府在本发明中具有一定的权利。
[0006] 发明背景
[0007] 最近的技术发展已经允许通过将
蛋白质定位于特定的DNA区域或相关
染色质的基因调控网络的全基因组(genome-wide)研究。与目标蛋白质相关的DNA的深度测序,使用定向
抗体的下拉(pulled-down),提供了基因组组织的高
分辨率空间图谱。所称的具有深度测序的染色质免疫沉淀(ChIP-seq),
生物学家现在具有新的透镜,他们可以通过其了解细胞和
疾病生物学。然而,对于这个技术存在重大的限制。该程序需要验证的、特定的免疫球蛋白的存在,并且仅单个蛋白质/DNA复合物可以分离。这种实验的复杂性限制了使用ChIP-seq来了解和表征染色质定向的小分子的作用。
[0008] 发明概述
[0009] 本文中描述的是化学实体与其靶标分子之间的相互作用的全基因组评价,称为Chem-seq技术。
[0010] 因此,在一个方面中,本发明涉及对药物或药物候选物与基因组相关的一个或多个因子的相互作用进行基因组范围的作图的方法。所述方法包括将包含染色质的细胞、细胞裂解物或核提取物与药物
接触。将所述包含染色质的细胞、细胞裂解物或核提取物维持在所述药物或药物候选物可以与基因组相关的一个或多个因子相互作用的条件下。将所述包含染色质的细胞、细胞裂解物或核提取物的基因组
片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与一个或多个与药物相互作用的因子相关。测定与药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段的全部或部分的序列,由此对药物或药物候选物与基因组相关的一个或多个因子的相互作用进行基因组范围的作图。
[0011] 在另一个方面中,本发明涉及
鉴别基因组上药物或药物候选物与其相互作用的一个或多个位点的方法。所述方法包括将包含染色质的细胞、细胞裂解物或核提取物接触药物或药物候选物,并将所述包含染色质的细胞、细胞裂解物或核提取物维持在所述药物或药物候选物可以与基因组相关的一个或多个因子相互作用的条件下。将所述包含染色质的细胞、细胞裂解物或核提取物的基因组片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与一个或多个与药物相互作用的因子相关。测定与药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段的全部或部分的序列,由此鉴别基因组上药物或药物候选物与其相互作用的一个或多个位点。
[0012] 在另一个方面中,本发明涉及一种在基因组范围鉴别病症或疾病(例如,综合征)印记的方法。所述方法包括将包含染色质的细胞、细胞裂解物或核提取物接触用于或可能潜在用于
治疗所述疾病的药物或药物候选物,并将所述包含染色质的细胞、细胞裂解物或核提取物维持在所述药物或药物候选物可以与基因组相关的一个或多个因子相互作用的条件下。在一些方面中,所述细胞或其裂解物是获自一个或多个患病个体的细胞或其裂解物。将所述包含染色质的细胞、细胞裂解物或核提取物的基因组片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与一个或多个与药物相互作用的因子相关。测定与所述药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段每一个的全部或部分的序列,由此在基因组范围鉴别所述病症或疾病的印记。
[0013] 还在另一个方面中,本发明涉及一种确定药物或药物候选物是否有效地治疗需要的个体中的病症(例如,综合征;疾病,如癌症、心脏病等)的方法。所述方法包括将包含个体的染色体的细胞、细胞裂解物或核提取物接触药物或药物候选物,并将所述包含染色质的细胞、细胞裂解物或核提取物维持在所述药物或药物候选物可以与基因组相关的一个或多个因子相互作用的条件下。将所述包含染色质的细胞、细胞裂解物或核提取物的基因组片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与一个或多个与药物相互作用的因子相关。测定与药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段的全部或部分的序列,由此获得个体基因组范围的药物相互作用的印记,其中如果个体基因组范围的药物相互作用的印记与阳性对照的印记相似、基本上相似或相同,则所述药物或药物候选物将有效地治疗所述个体的病症,和/或如果个体基因组范围的药物相互作用的印记与阴性对照的印记相似、基本上相似或相同,则所述药物或药物候选物将不能有效地治疗所述个体中的病症。
[0014] (a)在一个方面中,本公开特征在于一种
试剂盒,所述试剂盒包含以下的一个或多个(例如,以下的每一个);
[0015] (b)包含染色质的细胞或细胞裂解物或核提取物或者用于制备包含染色质的细胞裂解物或核提取物的试剂;
[0016] (c)药物或药物候选物,其中所述药物或药物候选物连接可检测标记(如,生物素)或与固体支持物偶联(例如,直接或间接地);
[0017] (d)与标记相互作用的因子(例如,其中所述因子连接固体支持物,如珠子)(示例性因子包括抗体(例如,连接于固体支持物));
[0018] (e)任选地,用于测序通过试剂盒的
说明书的方法鉴别的一个或多个序列的试剂,例如,引物或寡聚物,如PCR寡聚物;和
[0019] 将所述药物或药物候选物和所述包含染色质的细胞或细胞裂解物或核提取物维持在所述药物或药物候选物可以与基因组相关的一个或多个因子相互作用的条件下的说明,并且所述与基因组相关的一个或多个因子与细胞的基因组共价连接;将包含染色质的细胞或细胞裂解物或核提取物的基因组片段化从而产生包含基因组片段的混合物的说明,其中一个或多个基因组片段与一个或多个药物或药物候选物与其相互作用的因子相关;和测定与药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段的序列的全部或一部分,由此在基因组范围将所述药物或药物候选物与基因组相关的一个或多个因子的相互作用进行作图的说明。
[0021] 图1是Chem-Seq方法的示意图。
[0022] 图2显示了JQ1-PEG-生物素的合成。
[0023] 图3显示了JQ1-PEG-生物素的差示扫描
荧光测定法(DSF)的结果。
[0024] 图4显示了bio-JQ1和接近MYC和MITF基因座的基因组区域的关系的chem-seq分析。针对DMSO(阴性对照)、bio-JQ1和Brd4(JQ1的蛋白质靶标)的测序阅读片段的富集显示出在基因组范围的区域处bio-JQ1和Brd4的高重叠度,包括在接近MYC(A)和MITF(B)基因的区域。
[0025] 图5是体内和体外方法的Chem-seq的图示。体内Chem-Seq允许活细胞中药物-基因组结合的分析。体外Chem-Seq是用于测定非细胞渗透的药物或化学实体的基因组结合位点的可选Chem-Seq方法。
[0026] 图6显示了癌细胞中bio-JQ1和基因组区域的关系的Chem-Seq体内分析。体内Chem-Seq揭示了活细胞中药物JQ1结合的基因组位点。为了比较,显示了JQ1靶标蛋白BRD4的基因组
位置分析(ChIP-Seq)。注意体内JQ1结合的位点和BRD4占据的那些之间的重叠程度。A:染色体1的区域上JQ1占据位点的
可视化。B:CCNL1基因座的JQ1体内Chem-Seq分析。
[0027] 图7说明了癌细胞中结合于基因组区域的bio-JQ1的Chem-Seq体外分析。体外Chem-Seq揭示了药物JQ1结合的基因组位点(红色)。为了比较,显示了JQ1靶标蛋白BRD4(黑色)的基因组位置分析(ChIP-Seq)。注意体外JQ1结合的位点和BRD4占据的那些之间的重叠程度。A:染色体1的区域上JQ1占据位点的可视化。B:IRF4基因座的JQ1体外Chem-Seq分析,其说明了体外Chem-Seq产生了与体内Chem-Seq相同的结果:JQ1靶标位点与BRD4-结合的位点重叠。
[0028] 图8显示了用于通过本文中所述的Chem-Seq方法分析的生物素化化合物的实例。
[0029] 图9显示了化合物Bio-JQ1(S)的合成。
[0030] 图10.生物素化JQ1(bio-JQ1)的生化表征。A.使用纯化的BRD4布罗莫结构域(bromodomain),BRD4(1)和DMSO、JQ1、bio-JQ1和JQ1R的差示扫描荧光测定法的结果。B.生物素化JQ1(nio-JQ1)的等温滴定
量热法的结果和解离常数的测定。
[0031] 图11.基于Chem-Seq和ChIP-Seq数据之间的重叠的特异性分析。A.在MM1.S细胞中CCND2基因处通过ChIP-Seq的BRD4和通过Chem-Seq的JQ1的重复的占据。B.在25060个合并的BRD4/JQ1区域处针对BRD4
信号的标准化JQ1的倍数变化。差异结合分析揭示了在25060个合并的BRD4/JQ1区域中仅有10个显示出差异结合的统计学显著区域(红点,FDR<=0.25,红圈中突出显示的)。C.在MM1.S细胞中的10个差异结合位点中的一个处,通过ChIP-Seq的BRD4和通过Chem-Seq的JQ1的重复的占据。D.当引入可变数量的CTCF峰作为差异结合位点时,显示了模拟的JQ1峰的识别率(%)。在模拟的JQ1数据集中,其中等同于~1%、2%、5%或10%的JQ1区的随机CTCF区以计算方式引入作为差异结合位点的真实阳性的情况下,识别率分别为95.3%、98.5%、99.8%和99.7%。
[0032] 图12.CDK9的全基因组占据和CDK
抑制剂AT7519对基因转录的影响。A.如通过ChIP-Seq分析测定的,MM1.S细胞中CCND2基因座处CDK9、BRD4、H3K27Ac、MED11和RNA Pol II的占据。B.细胞周期蛋白D2(CCND2)基因处的RNA聚合酶II占据。用DMSO(蓝色)或2μM AT7519(红色)处理MM1.S细胞6h,接着进行RNA Pol II ChIP-Seq分析。C.用DMSO(蓝色)或2μM AT7519(红色)处理的MM1.S细胞中RNA聚合酶II移动比率(traveling ratio)分布。
[0033] 图13.通过Chem-seq揭示的蛋白激酶抑制剂AT7519的全基因组结合谱。A.泛-CDK抑制剂AT7519,及其生物素化形式,bio-AT7519的化学结构。B.AT7519(左图)及其生物素化形式(bio-AT7519,右图)对MM1.S
细胞增殖的作用。如所示的,用不同浓度的药物处理细胞72h。C.显示在PRCC基因座处bio-AT7519(红色)和DMSO(媒介,蓝色)体外Chem-Seq以及CDK9ChIP-Seq分析(品红色)的占据的基因轨迹(gene tracks)。
D.bio-AT7519Chem-Seq信号和CDK9ChIP-Seq信号之间的校正(左图,斯皮尔曼相关:r=
0.785)。相反,在源自与CDK9不相关的蛋白质的bio-AT7519Chem-Seq信号和ChIP-Seq信号之间没有观察到相关性(r=0.472)(CTCF,右图)。
[0034] 发明详述
[0035] 治疗性实体通过结合特定的蛋白质或其他分子来引起它们的作用;这些靶标分子中的一些与基因组相关。染色质生物学的蛋白质组分作为癌症、
炎症和心
血管疾病中的迫切治疗靶标而出现。实际上,癌症测序工作已经鉴别出许多突变的、重排的或扩增的染色质相关的因子和转录因子,从而促进全世界染色质药物发现中的协同努
力。不可能直接确定药物与基因组相关的蛋白质或其他分子实体怎样相互作用。尽管可能使用质谱来鉴别小分子化学物质结合的蛋白质,但这种方法没有鉴别整个基因组中这样的化学结合的蛋白质占据的位点。尽管可能使用ChIP-seq来鉴别整个基因组中特定蛋白质结合的位点,但这种方法没有揭示这些蛋白质是否被目标分子结合。
[0036] 本文中描述了鉴别整个基因组中被分子(例如,化合物、药物)直接和/或间接结合的位点的方法的开发。有效地,这些数据提供了基因组上化合物(例如,治疗性的)作用的位点的分子解析,从而提供了空间靶标解析。这种信息对于例如确定潜在治疗性化学物质的靶标、整个基因组中化学物质作用的位点(基因),对于评价化学物质的特异性和/或对于鉴别针对疾病和治疗的生物标志物是有价值的。
[0037] 宽范围的核酸(例如,DNA;RNA)相互作用配体(已知直接或间接(通过它们的靶标蛋白质)结合核酸)可以用作
亲和性“分子”以富集源自细胞、组织或其他
生物材料的DNA或RNA。
[0038] 在一些方面中,所述方法包括以下图1中所示步骤中的一个或多个,其可以按以下提供的顺序或按可选的顺序进行。细胞蛋白质或蛋白质复合物连接(例如,共价或非共价地)细胞核酸(例如,DNA或RNA)。在其中细胞蛋白质或蛋白质复合物共价连接的实施方案中,可以通过例如用化学交联剂(如,甲
醛)处理来实现连接。可以在体内、在细胞中或在体外中实现交联(图1)。将交联的生物样品在化学缓冲剂中溶解和稀释。将溶解的交联生物样品中含有的核酸片段化。例如,这可以通过适时受控的超声处理来实现(图1)。将修饰的药物、酶抑制剂和其他化学物质或天然小分子化合物与珠子或使得能够与其他材料分离的其他实体化学连接(例如,共价地;非共价地)。将所获得的化合物结合的珠子/实体加入生物
流体或生物样品中,混合并孵育(图1)。在生物样品中孵育后,收集所述化合物结合的珠子/实体并纯化。在纯化后,核酸从所述化合物结合的珠子/实体洗脱。在洗脱后,核酸进行纯化、浓缩和检测。例如,可以通过测序、定量聚合酶链式反应或其他定量方法来实现检测。如果经过测序,所获得的测序结果揭示药物或药物候选物直接或间接地(例如,通过所述药物靶标蛋白)结合的结合位点(图2)。
[0039] 在包括交联步骤的方法中,可以在交联后加入药物或药物候选物,或在替换的方案中,所述方法可以包括例如在交联之前使用用药物或药物候选物或化合物(例如,使用细胞可渗透的化合物或脂质体包含的化合物,或将化合物引入细胞中的其他方法)处理细胞(例如,活细胞或其裂解物)。另一种应用是使用具有健康或患病细胞的
组织切片。
[0040] 因此,在一个方面中,本文中提供的是对(一个或多个)药物或药物候选物与基因组的相互作用进行基因组范围的作图的方法。在一些方面中,所述药物或药物候选物可以与基因组直接相互作用。在其他方面中,所述药物或药物候选物可以与基因组间接相互作用,例如,所述药物或药物候选物与基因组相关的一个或多个因子相互作用。
[0041] 在所述方法中,基因组接触目标药物或药物候选物(待评价的药物或药物候选物),由此产生组合。在特别的方面中,所述药物或药物候选物接触细胞和/或细胞裂解物中存在的基因组。将所述组合维持于其中药物或药物候选物可以与基因组直接和/或间接(例如,通过与基因组(例如,包含染色质的细胞、细胞裂解物或核提取物的基因组)相关的一个或多个因子的相互作用)相互作用的条件下。将所述基因组片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与药物或药物候选物直接和/或间接相关。然后测定与所述药物或药物候选物直接或间接相关的一个或多个基因组片段的全部或部分的序列,由此对所述药物或药物候选物与基因组的相互作用进行基因组范围的作图。
[0042] 在特别的方面中,本发明涉及一种对药物或药物候选物与一个或多个基因组相关的因子的相互作用进行基因组范围的作图的方法。所述方法包括将包含染色质的细胞、细胞裂解物或核提取物接触所述药物或药物候选物。将所述包含染色质的细胞、细胞裂解物或核提取物维持于其中所述药物或药物候选物可以与一个或多个基因组相关的因子相互作用的条件下。将所述包含染色质的细胞、细胞裂解物或核提取物的基因组片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与一个或多个与所述药物或药物候选物相互作用的因子相关。测定与所述药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段的全部或部分的序列,由此对所述药物或药物候选物与一个或多个基因组相关的因子的相互作用进行基因组范围的作图。
[0043] 如本文中所述的“对包含染色质的细胞、细胞裂解物或核提取物的相互作用进行基因组范围的作图”是指特定药物或药物候选物与其直接或间接(例如,在体内;在体外)相互作用的基因组区域的鉴别。所鉴别的区域可以包括所述药物或药物候选物的靶标位点(药物预期或意图与其相互作用的基因组位点)及其脱靶(off-target)位点(药物或药物候选物没有预期或意图与其相互作用的基因组位点)。
[0044] 在另一个方面中,本发明涉及一种鉴别基因组上药物或药物候选物与其相互作用的一个或多个位点的方法。所述方法包括将包含染色质的细胞、细胞裂解物或核提取物接触所述药物或药物候选物,并将所述包含染色质的细胞、细胞裂解物或核提取物维持于其中所述药物或药物候选物可以与一个或多个基因组相关的因子相互作用的条件下。将所述包含染色质的细胞、细胞裂解物或核提取物的基因组片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与一个或多个与所述药物或药物候选物相互作用的因子相关。测定与所述药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段的全部或部分的序列,由此鉴别基因组上所述药物或药物候选物与其相互作用的一个或多个位点。
[0045] 在另一个方面中,本发明涉及一种鉴别基因组范围内病症或疾病(例如,综合征)的印记的方法。所述方法包括将包含染色质的细胞、细胞裂解物或核提取物接触用于或可能潜在地用于治疗所述疾病的药物或药物候选物,并将所述包含染色质的细胞、细胞裂解物或核提取物维持在所述药物或药物候选物可以与基因组相关的一个或多个因子相互作用的条件下。在一些方面中,所述细胞或其裂解物是获自一个或多个患有所述疾病个体的细胞或其裂解物。将所述包含染色质的细胞、细胞裂解物或核提取物的基因组片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与一个或多个与药物相互作用的因子相关。测定与所述药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段每一个的全部或部分的序列,由此鉴别在因组范围内所述病症或疾病的印记。
[0046] 再在另一个方面中,本发明涉及一种确定药物或药物候选物是否有效地治疗需要的个体中的病症(例如,综合征;疾病,如癌症、心脏病等)的方法。所述方法包括将包含个体的染色质的细胞、细胞裂解物或核提取物接触所述药物或药物候选物并将所述包含染色质的细胞、细胞裂解物或核提取物维持在其中所述药物或药物候选物可以与一种或多种基因组相关的因子相互作用的条件下。将所述包含染色质的细胞、细胞裂解物或核提取物的基因组片段化,由此产生包含基因组片段的混合物,其中一个或多个基因组片段与所述药物或药物候选物与其相互作用的一个或多个因子相关。测定与所述药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段的全部或部分的序列,由此获得个体的基因组范围内所述药物或药物候选物相互作用的印记,其中如果所述个体基因组范围内药物或药物候选物相互作用的印记与阳性对照的印记相似、基本上相似或相同,则所述药物或药物候选物将有效地治疗所述个体中的病症和/或如果个体基因组范围内的药物或药物候选物相互作用的印记与阴性对照的印记相似、基本上相似或相同,则所述药物或药物候选物将不能有效地治疗所述个体中的病症。如本领域技术人员显而易见的,可以使用多种阳性和/或阴性对照。阳性对照的实例是从一个或多个用所述药物或药物候选物成功治疗或已经成功治疗的个体获得的细胞或其细胞裂解物的基因组范围内所述药物或药物候选物相互作用的印记。阴性对照的实例是从一个或多个未用所述药物或药物候选物成功治疗或治疗已经失败的个体获得的细胞或细胞裂解物的基因组范围内所述药物或药物候选物相互作用的印记。
[0047] 通常,与基因组紧密相关的因子(例如,组蛋白)在本文中所述的分析条件下保持结合;然而,与基因组不是密切相关的因子在本文中所述的分析条件下没有保持结合。因此,如本文中所述的,所述方法可以进一步包括将一个或多个基因组相关的因子与基因组共价连接。所述一个或多个因子可以在所述基因组接触所述药物或药物候选物之前或在所述基因组接触所述药物或药物候选物之后与基因组共价连接。在一个方面中,包含染色质的细胞、细胞裂解物或核提取物可以在一个或多个基因组相关的因子与基因组共价连接后接触所述药物或药物候选物。在另一个方面中,所述包含染色质的细胞、细胞裂解物或核提取物可以在一个或多个基因组相关的因子与基因组共价连接前接触所述药物或药物候选物。
[0048] 用于共价连接一个或多个与包含染色质的细胞、细胞裂解物或核提取物的基因组相关的因子的方法是本领域技术人员已知的。在一个方面中,将所述包含染色质的细胞、细胞裂解物或核提取物接触交联剂,如甲醛或低聚甲醛。在另一个方面中,将所述包含染色质的细胞、细胞裂解物或核提取物暴露于UV光(例如,使用透照仪(transilluminator))。
[0049] 如本文中所述的,所述方法可以进一步包括逆转一个或多个因子与基因组之间的共价连接(例如,交联)。在一些方面中,可以在测定与所述药物或药物候选物直接和/或间接相互作用的一个或多个基因组片段的全部或部分的序列之前逆转所述共价连接。在其他方面中,可以在与所述药物或药物候选物与其相互作用的一个或多个因子相关的基因组片段与混合物中与所述药物或药物候选物与其相互作用的一个或多个因子不相关的其他基因组片段分离后,逆转所述共价连接。
[0050] 可以用于本发明的方法中的基因组的实例包括原核生物的基因组(例如,细菌基因组)和真核生物基因组(例如,
哺乳动物基因组)。在一个方面中,所述基因组是哺乳动物(例如,灵长类、犬科动物、猫科动物、鼠科动物等)的基因组。在特定的方面中,所述基因组是人类基因组。
[0051] 可以鉴别为与药物或药物候选物相互作用的基因组区域包括一个或多个基因组异染色质区域(异染色质)和/或一个或多个基因组常染色质区域(常染色质)。在特定的实施方式中,本文中提供的方法对药物或药物候选物与常染色质的相互作用进行基因组范围的作图。
[0052] 如本文中所述的,所述药物或药物候选物可以接触存在于细胞(体内Chem-Seq)或细胞裂解物(体外Chem-seq)中的基因组。因此,所述方法可以进一步包括获得包含染色质的细胞、细胞裂解物或核提取物。获得细胞和/或其裂解物的方法是本领域公知的(例如,参见,Marson等,Cell,134(3):521-533(2008)和美国
专利No.6,410,243,将其按引用并入本文中)。例如,(一个或多个)细胞可以获自个体(例如,病人)或商业来源,例如,细胞和/或组织库或存储机构。在特定的方面中,细胞可以从来自一个或多个个体的样品(例如,生物流体(例如,血液、尿液、淋巴等)、组织样品、活检样品)获得。如本领域技术人员清楚的,细胞可以机械地和/或化学地(例如,通过将细胞悬浮于本文中所述的多种裂解缓冲液中的任何一种中)操作来获得细胞裂解物。
[0053] 本发明中可以使用多种细胞及其裂解物。细胞及其裂解物的实例包括原核生物细胞、真核生物细胞及其裂解物。在特定的方面中,使用哺乳动物(例如,灵长类、犬科动物、猫科动物、鼠科动物等)细胞或其裂解物。在再另一个方面中,使用人类细胞或其裂解物。还是在另一个方面中,使用活细胞。所述方法的其他方面包括使用正常细胞、异常细胞和/或其裂解物。异常细胞包括患病细胞,如癌细胞、心脏病细胞等。在一些实施方式中,所述细胞是新鲜的、冷冻的或保存的(例如,其中所述细胞是来自人类样品或来自非人哺乳动物样品的保存的细胞)。在一些实施方式中,包含细胞的样品可以获自受试者,例如,人类或非人哺乳动物,其中已经将药物或药物候选物
给药于该受试者。细胞可以是原代细胞、永生化细胞、细胞系的细胞、遗传修饰的细胞等。在各种不同的实施方式中,细胞可以是任何细胞类型或可以源自任何器官或组织。细胞可以是例如上皮细胞、造血细胞、免疫系统细胞、神经系统细胞、肌肉细胞、
成纤维细胞。
[0054] 在一些实施方式中,术语“药物或药物候选物”是指具有针对(对于)目标靶标的活性的化合物(例如,低于约1mM或低于约100μM(例如,低于约10μM、低于约1μM或低于约低于约0.1μM)的针对靶标(例如,转录因子)的IC50)。如将会得知的,化合物不需要由FDA(或以任何权限负责管理药物的任何政府机构)批准作为本文中使用的药物。本文中包括的是针对一个或多个靶标如,蛋白质(例如,与转录相关的蛋白质,如转录因子)有活性的化合物(例如,小分子)。在一些实施方式中,已经在一个或多个体外或体内试验中测试所述药物或药物候选物,并且已经显示出活性。活性可以是例如结合活性(例如,对于靶标)、抑制或激活活性(例如,对于靶标)、改变细胞表型或细胞状态的活性、潜在表明或指示化合物可以用于治疗疾病的活性,等等。示例性药物候选物包括具有已知的针对靶标的活性的工具化合物或参照化合物以及在试验(如筛选试验)中鉴别的化合物,或此类化合物的类似物或衍生物,如至少部分地基于筛选中的命中化合物合成、涉及或鉴别的类似物或衍生物。药物或药物候选物可以调节(例如,抑制或激活)目标靶标。在各种不同的实施方式中,药物或药物候选物可以以多种方式中的任何一种调节靶标。例如,药物或药物候选物可以结合靶标、可以结合一个或多个与靶标结合的其他组分、可以改变靶标的
稳定性或构象、可以改变靶标的定位。
[0055] 此外,多种化合物或药物或药物候选物可以用于本发明的方法、组合物、试剂盒中。例如,所述药物或药物候选物可以是核酸(例如,反义RNA、小干扰RNA(siRNA)、短发夹RNA(shRNA))、肽、小分子(例如,小的
有机化学物质)、天然产物(例如,大环)。在特定的方面中,所述药物或药物候选物是治疗性药物或药物候选物。在另一个方面中,所述药物或药物候选物是药理学活性的小分子。还是在另一个方面中,所述药物或药物候选物是抗癌药物或药物候选物(例如,JQ1、他莫西芬)。在一些实施方式中,所述药物或药物候选物靶向蛋白质,例如,抑制或激活蛋白质如转录因子或激酶。在一些实施方式中,所述药物或药物候选物直接靶向DNA或染色质。
[0056] 术语“小分子”是指具有低于约7500amu,低于约5000amu,低于约2500amu,优选低于约2000amu,甚至更优选低于约1500amu,再更优选低于约1000amu,或最优选低于约750amu的分子量的化合物。
[0057] 如本领域技术人员所知的,药物或药物候选物可以以多种方式与基因组“相互作用”。例如,药物或药物候选物可以通过直接结合基因组而与基因组相互作用,和/或药物或药物候选物可以通过结合与基因组相关(例如,与基因组结合)的因子而与基因组间接相互作用。
[0058] 在再进一步的方面中,所述药物或药物候选物可以包含允许在本文中所述方法的一个或多个步骤中检测和/或分离药物或药物候选物的多种可检测标记(例如,柄(handle))中的一个或多个。这样的可检测标记是本领域技术人员公知的。可检测标记的实例包括(一个或多个)荧光分子、肽(例如,抗生物素蛋白、链霉抗生物素)、半
抗原(例如,二硝基苯基(DNP)、地高辛、硝基酪
氨酸)、小分子(例如,生物素)或其组合。用于将标记引至药物或药物候选物上的方法是本领域技术人员公知的。参见,例如,Becer,CR.等,Angew Chem Int Ed,48:4900-4908(2009)和Hein,CD等,Pharm Res,25(10):2216-2230(2008),将其按引用并入本文中。
[0059] 在各种实施方式中,将本文中所述的药物或药物候选物连接于标记,例如,通过衔接物连接。以下通式(I)的化合物提供了示例性的本文中所述的药物或药物候选物:
[0060]
[0061] 式(I)
[0062] 其中:
[0063] 药物或药物或药物候选物是小分子;
[0064] 衔接物包括共价键-Xn-共价键;
[0065] 每个X独立地是共价键或二价的、直链或支链、饱和或不饱和、任选取代的C1-C50
烃链,其中一个或多个亚甲基单元任选和独立地被-O-、-S-、-Se-、-OP(O)OH-O-、-N(R)P(O)OH-N(R)-、-Si(R)2-、-N(R)-、-C(O)-、-C(O)O-、-OC(O)-、-N(R)C(O)-、-C(O)N(R)-、-(R)NC(O)N(R)-、-(R)C=NN(R)-、-N=N-、-S(O)-、-S(O)2-、-N(R)SO2-、-SO2N(R)-、卤代烷基(例如,-CF2-)、杂环基团、芳基或杂芳基(例如,三唑)基团替代;
[0066] 其中R的每次出现独立地是氢、合适的保护基团或酰基部分、芳烷基部分、脂族部分、芳基部分、杂芳基部分或杂脂族部分;
[0067] n是1至50的整数;和
[0068] 标记是可以用于在本文中所述的方法或试剂盒中分离和/或鉴别所述药物或药物候选物的部分(例如,荧光分子、肽、半抗原或含卤素化合物)。
[0069] 在一些实施方式中,所述衔接物包括聚乙二醇部分(PEG)或其衍生物(例如,PEG2、PEG 6、PEG 8、PEG 20、PEG 40、PEG 100、PEG 300、PEG 400、PEG 1000)。
[0070] 在一些实施方式中,所述衔接物包括肽(例如,多达15个氨基酸残基的肽)。
[0071] 在一些实施方式中,衔接物包括使用“点击(click)化学”形成的部分(例如,如WO 2006/115547中所述的)。在一个实施方式中,所述衔接物包括酰胺键、酯键、二硫键或三唑。
[0072] 如本文中所述的,所述药物或药物候选物可以与基因组间接相互作用,例如,通过与基因组相关的一个或多个因子相互作用。如本文中所用的,“基因组相关的因子”包括在一个或多个特定区域处与基因组相关的单一因子或因子的组合(因子的复合物,如转录复合物)。基因组相关的多种因子是本领域技术人员公知的。如也是本领域技术人员公知的,这些因子可以以多种方式与基因组“相关”。例如,因子可以通过结合基因组与基因组相关。这样的因子的实例包括蛋白质,如组蛋白、转录蛋白(例如,转录调节蛋白或其复合物)、涉及维持基因组完整性的蛋白质或其复合物(例如,DNA复制和修复蛋白;拓扑异构酶)、染色质-修饰蛋白、染色质关联因子(chromatin associating factor)、受体(例如,类固醇受体;核
激素受体)、激酶、
磷酸酶、蛋白酶体(proteasome)、蛋白酶体(proteosomal)组分、结构或
支架因子及其复合物。表1-4中提供了特定的实例。
[0073] 图8中显示了通过本文中所述的Chem-Seq方法分析的生物素化化合物的特定实例,其包括BDR抑制剂(BRDi)、HDAC抑制剂(HDACi)、EZH2抑制剂(EZH2i)、DOT1L抑制剂(DOT1Li)和CDK抑制剂(CDKi)。SAHA是泛-HDAC(I类和II类HDAC)抑制剂,如相关的
氧肟酸HDACi。FK228抑制I类HDAC。I类包括HDAC1、2、3和8。II类(A和B)包括HDAC4、5、6、7、9、10。对于CDKi,AT7519是Cdk9抑制剂。PD0332991化合物是Cdk4/6抑制剂。DOT1Li是来自Epizyme的Daigle等Cancer Cell 2011的EPZ004777的bio-PEG形式。EZH2抑制剂描述于例如WO2011/140324中。表1中提供了其他实例。
[0074] 在本文中提供的方法中,将包含染色质的细胞、细胞裂解物或核提取物接触药物或药物候选物,由此产生组合,并且将所述组合维持在其中所述药物或药物候选物可以与一个或多个基因组相关因子相互作用的条件下。在进一步包括将一个或多个基因组相关因子与基因组交联(例如,通过将包含染色质的细胞、细胞裂解物或核提取物接触交联剂)的方法中,还将所述组合维持在其中一个或多个基因组相关因子与细胞的基因组共价连接的条件下。在一些实施方式中,靶标是基因组自身。如本领域技术人员将清楚的,这样的条件包括合适的
温度、pH、孵育时间段、缓冲剂等,并且将取决于分析条件(例如,待测试的药物或药物候选物)。
[0075] 本文中提供的方法还包括将包含染色质的细胞、细胞裂解物或核提取物的基因组片段化的步骤,由此产生包含基因组的片段(基因组片段)的混合物,其中一个或多个片段与所述药物或药物候选物直接或间接相关。将基因组片段化的方法是本领域技术人员公知的。例如,可以机械地(例如,使用超声处理和/或剪切-诱导方法)和/或通过化学地(例如,使用酶消化(例如,微球菌核酶))将基因组片段化。
[0076] 本发明的方法进一步包括测定与所述药物或药物候选物直接和/或间接相互作用的一个或多个基因组片段的全部或部分(鉴别(例如,不同的、独特的)部分、允许鉴别基因组内的序列的部分)的(一个或多个)序列。在特定的方面中,所述方法包括测定与所述药物或药物候选物与其相互作用的一个或多个因子相关的一个或多个基因组片段的全部或部分的序列。用于测定与所述药物或药物候选物相互作用的序列的全部或部分的方法是本领域公知的。这样的方法的实例包括聚合酶链式反应(PCR)、大规模并行测序、固定化核酸
聚合物、下一代测序等等。
[0077] 如本领域技术人员将清楚的,本文中所述的方法可以进一步包括将与所述药物或药物候选物直接或间接相关的基因组片段的一个或多个(例如,全部)从基因组片段混合物分离(例如,将一个或多个与所述药物或药物候选物相关的基因组片段与所述药物或药物候选物不相关的基因组片段分离)。
[0078] 多种方法可以用于从基因组片段的混合物分离或分开一个或多个与所述药物或药物候选物相关的基因组片段。在特定的方面中,分离这样的基因组片段包括将基因组片段的混合物接触直接和/或间接地特异性结合药物或药物候选物的试剂。可以特异性结合所述药物或药物候选物上存在的标记(例如,可检测标记)的试剂的实例包括肽(例如,生物素、抗生物素蛋白、链霉抗生物素)、酶(例如,
碱性磷酸酶、辣根过氧化物酶)和抗体(例如,一级抗体、二级抗体)。
[0079] 在特定的方面中,将基因组片段的混合物接触固体支持物,所述固体支持物包含直接和/或间接地特异性结合所述药物或药物候选物的试剂。用于所述方法中的固体支持物的实例包括珠子、阵列、
载玻片、孔、柱等。
[0080] 本文中所述的方法可以进一步包括将结果与合适的对照进行比较。所述方法中使用的对照可以是阳性对照和/或阴性对照。如本领域技术人员将清楚的,可以使用多种这样的对照。用于对药物或药物候选物与一个或多个基因组相关因子的相互作用进行基因组范围的作图的方法和/或鉴别基因组上药物或药物候选物与其相互作用的一个或多个位点的方法中的对照的实例包括获自一个或多个具有已知作用机理的药物或药物候选物的(一个或多个)基因组图谱(例如,来自多个具有相似作用机理的药物或药物候选物(例如,一类药物或药物候选物)的基因组图谱;来自具有不同(例如,多种)作用机理的多个药物或药物候选物(例如,多类药物或药物候选物)的基因组图谱)。在鉴别基因组范围的疾病印记的方法中使用的对照的实例包括使用相同或相似药物或药物候选物(例如,具有或认为具有相似作用机理的药物或药物候选物)针对相似疾病(病症、综合征)获得的印记(例如,已知印记)。在确定药物或药物候选物是否有效地治疗需要的个体中的病症的方法中使用的对照的实例包括获自用所述药物或药物候选物(例如,阳性对照)成功治疗或已经成功治疗的一个或多个个体的细胞或其细胞裂解物的基因组范围的药物或药物候选物相互作用的印记,和/或获自未用所述药物或药物候选物(例如,阴性对照)成功治疗或治疗已经失败的一个或多个个体的细胞或其细胞裂解物的基因组范围的药物或药物候选物相互作用的印记。
[0081] 示例
[0083] 方法/材料
[0084] 从本文中称为(S)-JQ1或JQ1S的JQ-1的S对映异构体合成生物素化JQ1。将(S)-JQ1溶解于
甲酸中并且在室温下搅拌,产生游离酸1。然后将酸与单保护的PEG-二胺偶联,获得酰胺2。在酸性条件下除去保护基团(Trt),并且将所得到的胺与生物素偶联,获得最终的JQ1-PEG-生物素(例如,参见图4;参见WO2011/143669,将其按引用并入本文中)。
[0085] 图2显示了与布罗莫结构域4(BRD4)结合的JQ1-PEG-生物素的差示扫描荧光测定法(DSF)的结果。小分子(例如,JQ1S)与蛋白质(例如,Brd4)的结合通常将产生更高的蛋白质稳定性。因此,与未结合的Brd4解折叠的温度相比,结合的Brd4蛋白解折叠的温度较高。可以通过对BRD4蛋白质的疏
水性部分具有亲和性的染料的荧光增加来测量这种温度变化。通过将小分子、二甲亚砜(DMSO,作为对照)、JQ1的S对映异构体(JQ1S)、JQ1的R对映异构体(JQ1R,作为对照)和JQ1-生物素(JQ1-PEG-生物素)与蛋白质和染料混合来进行实验。由于独特的结构以及BRD4和JQ1之间的结合,只有S对映异构体是有活性的,并且因此,R对映异构体可以用作对照。因此,使用PCR仪,将溶液缓慢升温并且测量与各小分子结合的蛋白质解折叠的温度。如图2中所示,数据证实了JQ1-S和JQ1-生物素结合BRD4以使其更稳定并且对于解折叠与JQ1S和JQ1-生物素结合的BRD4需要高的温度。
[0086] 对于每个位置分析反应,将人SK-MEL-5细胞生长至80%汇合,具有1-2×108细胞的最终计数。通过添加十分之一体积的新鲜11%甲醛溶液,在使细胞在室温下化学交联15分钟。使用
硅刮棒
收获细胞,离心并用1×PBS将产生的团
块物洗涤三次。将细胞团在液氮中快速冷冻并且在使用前储存在-80℃。
[0087] 将细胞重悬浮、在裂解缓冲液中裂解并且超声处理以溶解和剪切交联的DNA。超声处理条件根据细胞、培养条件、交联、设备和药物或药物候选物改变。使用了Misonix Sonicator 3000并且在功率8下进行了超声处理10×30秒脉冲(脉冲之间60秒停顿)。在所有时间,将样品保持在
冰上。
[0088] 将所得到的完整细胞提取物在4℃下使用如下已经用JQ1预先孵育的100μl Streptavidin Dynal(MyOne Streptavidin T1)
磁珠孵育过夜(亲和性纯化):将5ul 10mM JQ1/DMSO溶液与100ul Streptavidin Dynal珠悬浮液混合并且孵育过夜(o.n.)。用BSA封闭溶液将药物结合的珠子洗涤四次以除去未结合的药物。
[0089] 使亲和性纯化持续过夜。用以下缓冲液按序洗涤珠子:(1)裂解缓冲液1,(2)裂解缓冲液2,(3)超声处理缓冲液,(4)高盐超声处理缓冲液,(5)LiCl缓冲液和(6)含有50mM NaCl的TE。通过在65℃下加热,伴随偶尔涡旋,从珠子洗脱结合的复合物,并且通过在65℃下孵育过夜逆转交联。全细胞提取物DNA(从超声处理步骤保留的)也进行处理用于交联逆转。
[0090] 然后用RNAse A、蛋白酶K处理亲和性纯化的DNA和全细胞提取物DNA,并用多次
苯酚:氯仿:异戊醇提取进行纯化。
[0091] 将纯化的DNA准备用于测序,根据改进形式的Illumina/Solexa Genomic DNA实验方案。将片段化DNA准备用于Solexa衔接物的连接,其通过修复末端和添加单个腺嘌呤核苷酸突出端以允许定向连接。将1:100稀释的Adaptor Oligo Mix(Illumina)用于连接步骤中。使用具有有限(18)个扩增循环的后续PCR步骤将另外的衔接物序列添加至所述片段,以将其制备用于与基因组分析仪流动池(Genome Analyzer flow-cell)
退火。扩增后,通过在2%琼脂糖凝胶上分离并且
切除150-300bp之间的条带(表示50至200nt长度的剪切片段和~100bp的引物序列)来选择窄范围的片段大小。从琼脂糖纯化DNA并且稀释至10nM用于加载到流动池上。
[0092] 使用来自Illumina的Cluster Station装置,将DNA文库(2-4pM)施加于流动池(每个流动池8个样品)。校准施加于流动池的文库浓度,使得在源自单链DNA的桥扩增步骤中产生聚合酶克隆(polonies)。在桥扩增步骤中,将多轮扩增试剂流过所述池,以在1μm直径的点中产生大约1,000条链的聚合酶克隆。通过用1:5000稀释的SYBR Green I(Invitrogen)染色并在荧光照明下用
显微镜观察,目视检查双链聚合酶克隆的
密度和形态。将确认的流动池储存在4℃下直至测序。
[0093] 流动池从存储中取出,并且在Cluster Station上进行线性化和测序引物的退火。将引物处理的(primed)流动池加载于Illumina Genome Analyzer 1G中。将第一碱基结合至合成测序(Sequencing-by-Synthesis)反应中后,将过程暂停,进行关键的
质量控制检验点。将每个道的小部分进行成像,并且将所有四个碱基的平均强度值与最小
阈值比较。
将具有低的第一碱基强度的流动池重新进行引物处理,并且如果信号没有恢复,放弃该流动池。具有满足最小阈值的信号强度的流动池恢复,并且测序26个循环。
[0094] 结果:
[0095] JQ1是BET布罗莫结构域抑制剂,在多种人类癌症中具有潜在应用(Delmore,J.E. 等,Cell 146,904-917;Filippakopoulos,P. 等,Nature 468,1067-1073;Zuber,J.等,Nature 478,524-528)。其是与乙酰基-赖氨酸结合竞争的竞争性Brd2、Brd3、Brd4和BrdT抑制剂。JQ1作用机理主要是通过靶向BET布罗莫结构域,结果是Myc基因表达的损失,但其怎样结合基因组范围的靶标分子仍然是未知的。使用生物素化-JQ1,将Chem-seq用于测定它在哪与SKMEL5黑素瘤细胞的基因组相关。DMSO用于测定单独珠子的背景水平。如图4中所示,存在通过Chem-Seq测定的bio-JQ1占据模式与通过ChIP-Seq测定的其蛋白质靶标Brd4的基因组范围的占据的高重叠度。这些结果证明JQ1在基因组范围内结合Brd4。
[0096] 图4显示了bio-JQ1与接近MYC和MITF基因座的基因组区域的关系的chem-seq分析。针对DMSO(阴性对照)、bio-JQ1和Brd4(JQ1的蛋白质靶标)的测序阅读片段的富集显示出在基因组范围的区域处bio-JQ1和Brd4的高重叠度,包括在接近MYC(A)和MITF(B)基因的区域处。
[0097] 所述方法对其中目标蛋白质靶标的配体可用的情况中补充常规ChIP(其使用抗体或亲和性标签来定位蛋白质:DNA相互作用)具有宽的适用性。重要地,这些配体的可用性和多样性在过去几年中急剧上升。
[0098] 其可以用于揭示药物作用机理以及药物的特异性。具体地,所述方法允许对小分子治疗物质的特异性和机理进行精确的全基因组评价,所述小分子治疗物质通过结合蛋白质或核酸引发其作用,其中一些蛋白质表达与基因组相关。本文中所述的技术允许药物-基因组相互作用的定靶(on-target)测定和脱靶表征。
[0099] 所述方法可用于共有限定的作用机理的整个酶和蛋白质家族的总体DNA/RNA-结合研究。在这种情况中,通过使用靶向整个蛋白质家族的修饰化合物的单一分析可获得这样的完整蛋白质家族与基因组的功能和结合。实例是全基因组分析并且因此Kinome、HTMome、HDACome等的表征。
[0100] 其作为疾病(如,癌症)的诊断和控制中的工具是有用的,并且因此可以用于诊断实验室中。药物通常比抗体具有更高的稳定性,但是,如图4中所示,根据本文中记载的发明使用时,作为富集核酸的亲和性试剂相似地有效,从而描述了DNA,可以以高灵敏度检测的相对稳定的分子的选择性富集。
[0101] 实施例2.体内Chem-Seq
[0102] 使用实施例1中所述的体外Chem-Seq的相同实验方案进行体内Chem-Seq,但以下步骤不同于体外Chem-Seq实验方案:
[0103] 1.用5uM bio-JQ1处理人多发性骨髓瘤(MM1.S)细胞(最终计数1-2×108)不同的孵育时间(0、10、20、30min),接着加入新鲜甲醛溶液(细胞培养基中的最终甲醛浓度为1%),在室温下持续20min。然后用1×PBS洗涤细胞两次,接着将细胞团在液氮中快速冷冻并且在使用前存储在-80度。
[0104] 2.将核细胞提取物(源自用化合物处理的细胞)与200ul Streptavidin Dynal磁珠孵育过夜(o.n.)。
[0105] 结果显示于图5和6中。重复所述体外方法并与体内方法相比较(参见图7)。
[0106] 实施例3
[0107] 材料和方法
[0108] 细胞培养和未生物素化药物的处理
[0109] 将多发性骨髓瘤MM1.S细胞(CRL-2974,ATCC)维持在补充了10%胎
牛血清和1%GlutaMAX(Invitrogen,35050-061)的RPMI-1640中。对于JQ1处理实验,用不同浓度的JQ1或媒介(DMSO)处理不同步的细胞6的时间。或者,用2μM AT7519(Selleck Chemicals)处理细胞6h。
[0110] 药物靶标蛋白质的全基因组占据分析(ChIP-Seq)
[0111] 按照之前所述的(33),进行了与大规模并行DNA测序偶联的ChIP(ChIP-Seq)。将以下抗体用于染色质免疫沉淀(ChIP):抗-BRD4(Bethyl Labs,A301-985A)、抗-MED1(Bethyl Labs,A300-793A)、抗-H3K27Ac(Abcam,ab4729)、抗-RNA-Pol II(Santa Cruz,sc-899)、抗-CTCF(Millipore,07-729)和抗-CDK9(sc-484)。Illumina测序、文库构建和ChIP-Seq分析方法是之前所述的(33)。
[0112] Bio-JQ1(S)的合成
[0113] 从(S)-JQ1开始活性Bio-JQ1(S)的合成,(S)-JQ1是抑制布罗莫结构域额外-末端(bromodomain extra-terminal)(BET)亚家族的活性对映异构体。如以下方案S1中所示的,(S)-JQ上的酯的叔-丁基的去除产生了酸S1。然后将所得到的酸与单保护的(PEG)2连接的二胺偶联,获得酰胺S2。在酸性条件下除去化合物S2的末端胺上的Trt保护基团,产生游离胺,将其进一步与生物素偶联,获得最终活性Bio-JQ1(S)。使用无活性对映异构体(R)-JQ1,以相同的合成途径合成了生物素化的无活性对映异构体Bio-JQ1(R)。参见图9。
[0114] 重组BRD4(1)的表达
[0115] 按照之前所述的(18),作为大肠杆菌中表达的聚-组氨酸-标记的重组人蛋白质纯化BRD4的第一布罗莫结构域。
[0116] 差示扫描荧光测定法
[0117] 使用7300实时PCR仪(AB Applied Biosystems)进行了热
熔化实验。将蛋白质在10mM HEPES pH7.5,500mM NaCl中缓冲,并且以20μL体积中的1μM终浓度在96-孔平板中测定。以10μM的终浓度加入化合物。SYPRO橙(Molecular Probes)以1:1000的稀释度作为荧光探针加入。将用于SYPRO-橙染料的激发和发射
滤波器分别设定为465nm和590nm。用每分钟4℃的步幅将温度从25℃升至96℃,并且在每个间隔获取荧光读数。将所观察到的温度变化ΔTm obs记录为相同平板中样品和含有蛋白质但不含配体的参照(DMSO)孔之间的转变中点之间的差异。
[0118] 等温滴定量热法
[0119] 使用来自MicroCalTM(Northampton,MA)的ITC2000微热量计进行了ITC。所有实验在25℃下进行,同时在1000rpm下搅拌,在ITC缓冲液(50mM HEPES pH 7.4,25℃,150mM NaCl)中。给微
注射器加载蛋白质样品的溶液(190μM,在ITC缓冲液中)。使用0.2μl的初始注射,接着2μl的19次相同注射,持续5sec(每次注射)和注射之间90sec的间隔,进行所有滴定。通过独立的滴定(蛋白质到缓冲液中)测定稀释的热并且从实验数据中减TM去。将收集的数据输入与仪器一起提供的MicroCal Origin
软件中,产生结合的
焓(ΔH)和结合常数(Ka)。使用单一结合位点模型。解离常数和
热力学参数呈现于表5中。
[0120] 生物素化JQ1的体内全基因组占据分析(体内Chem-Seq)
[0121] 用细胞培养基中的5uM生物素化JQ1(Bio-JQ1)或DMSO(媒介)和1%甲醛同时8
处理指数生长的MM1.S细胞(2×10细胞/样品)20min。通过加入TRIS缓冲液pH 7.5至
300mM TRIS的最终浓度来终止化学交联。使用硅刮棒收获细胞,离心并用PBS洗涤获得的沉淀物三次。如下制备细胞核:将细胞在50mM HEPES,pH 7.5,140mM NaCl,1mM EDTA,10%甘油,0.5%NP-40,0.25%Triton X-100加蛋白酶抑制剂混合物‘complete’(Roche)中裂解,并且用10mM Tris-HCL,pH 8.0,200mM NaCl,1mM EDTA,0.5mM EGTA和蛋白酶抑制剂洗涤细胞核一次。将核重悬浮并在50mM Hepes-KOH,pH 7.5,140mM NaCl,1mM EDTA,1mM EGTA,
1%Triton X-100,0.1%脱氧胆酸钠,0.1%SDS(超声处理缓冲液)和蛋白酶抑制剂混合物中在18W下在冰上超声处理10个循环(每个30s),循环之间30s间隔。通过离心澄清超声处理的裂解物并且在4℃下与
磁性Streptavidin Dynabeads(MyOne Streptavidin T1,Invitrogen)孵育16-20h(在该孵育步骤之前,将珠子在含有0.5%BSA的PBS中封闭)。在核超声处理的裂解物中孵育后,将珠子在超声处理缓冲液中洗涤两次,在含有500mM NaCl的超声处理缓冲液中洗涤一次,在LiCl缓冲液(20mM Tris-HCL,pH 8.0,1mM EDTA,250mM LiCl,0.5%NP-40,0.5%脱氧胆酸钠)中洗涤一次并在10mM TRIS,pH 7.5,0.1mM EDTA中洗涤一次。随后将结合的蛋白质-DNA复合物在50mM Tris-HCL,pH 8.0,10mM EDTA,10%SDS中在65℃下洗脱15min,并通过将洗脱液在65℃下孵育过夜逆转交联。分别通过加入RNase和蛋白酶K消化污染的RNA和蛋白质,并且按照之前所述的(34)纯化DNA。最后,将纯化的DNA片段大规模并行测序并按照所述的(33)分析测序数据。
[0122] 生物素化JQ1的体外全基因组占据分析(体外Chem-Seq)
[0123] 在细胞培养基中用1%甲醛固定指数生长的未处理MM1.S细胞20min。按照以上所述的,终止化学交联、制备细胞核和超声处理所获得的核裂解物。然而,与体内实验方案不同,Streptavidin Dynabeads在含有0.5%BSA和200μM生物素化药物或媒介(DMSO)的PBS中预孵育6h。随后在PBS/0.5%BSA中洗涤药物结合的珠子四次以除去未结合的药物,并且在核超声处理裂解物中在4℃下孵育16-20h。所有以下步骤与以上描述的那些(体内Chem-Seq方法)相同。
[0124] 使用生物素化AT7519的体外全基因组占据分析(体外Chem-Seq)
[0125] 在细胞培养基中用0.5%甲醛固定指数生长的、未处理的MM1.S细胞5min。通过加入TRIS缓冲液,pH 7.5至300mM TRIS的最终浓度来终止化学交联。将细胞在PBS中洗涤3×,并如下制备细胞核:将细胞核在50mM HEPES,pH 7.5,140mM NaCl,1mM EDTA,10%甘油,0.5%NP-40,0.25%Triton X-100加蛋白酶抑制剂混合物‘complete’(Roche)中裂解,并且用10mM Tris-HCL,pH 8.0,200mM NaCl,1mM EDTA,0.5mM EGTA和蛋白酶抑制剂洗涤细胞核一次。将核重悬浮并在50mM Hepes-KOH,pH 7.5,140mM NaCl,1mM EDTA,1mM EGTA,0.5%NP-40,0.5%Triton X-100(超声处理缓冲液)中进行超声处理。将沉淀物在Misonix
超声波仪中在冰上在9-12W下超声处理4个循环(每个30s),循环之间1min的静息间隔。将药物结合的珠子加入澄清的超声处理液中,并且使沉淀继续12-18小时。随后将药物结合的珠子在超声处理缓冲液中洗涤四次,在1%SDS中洗脱蛋白质,并通过将洗脱液在1%SDS中在65℃下孵育过夜逆转交联。通过用RNase A和蛋白酶K按序孵育来消化污染RNA和蛋白质,并且按照之前所述的(34)纯化DNA。将纯化的DNA片段大规模并行测序(Illumina)并按照所述的(33)分析测序数据。
[0126] Chem-seq和ChIP-Seq数据分析
[0127] 使用Bowtie(版本0.12.2)(35)排列所有ChIP-Seq和Chem-seq数制集,以构建人基因组的版本NCBI36/HG18。我们使用了MACS版本1.4.1(基于ChIP-Seq分析的模型)(36)的峰发现
算法以鉴别超过背景的ChIP-Seq富集的区域。将1e-9的富集p-值阈值用于所有数据集。为了获得任何区域中ChIP-Seq数据集的标准化阅读片段(read)密度,通过MACS自动延伸与该区域对齐的ChIP-Seq阅读片段,并且计算每碱基对(bp)的阅读片段密度。将每个区域中的阅读片段密度相对于百万作图阅读片段的总数标准化,产生以每bp的每百万作图阅读片段的单位(rpm/bp)计的阅读片段密度。
[0128] GEO登录号
[0129] 比对的和原始数据可以在GEO登录号GSE43743下找到。
[0130] 转录的基因的定义
[0131] 如果针对H3K4me3或RNA Pol II的富集区域位于TSS的+/-5kb内,则将基因定义为转录的。H3K4me3是与转录启动相关的组蛋白修饰(37)。
[0132] 活性增强子的定义
[0133] 将活性增强子定义为启动子外侧针对H3K27Ac富集的区域(距离任何TSS大于5kb)。H3K27Ac是与活性增强子相关的组蛋白修饰(38,39)。活性增强子与启动子形成环,其通过介质复合物来促进(25)。因此,使用针对介质亚基Med1的ChIP-Seq数据来验证增强子的H3K27Ac定义。在所有数据集中,来自Med1的富集区域与H3K27Ac区域具有>90%的重叠。
[0134] RNA Pol II移动比率(traveling ratio)的测定
[0135] 测定了启动区域(initiating region)与延伸区域中RNA Pol II ChIP-Seq水平的比例(40),其为称为移动比率(TR)的一种量度。将初始区域限定为TSS周围的+/-300bp。将延伸区域限定为从TSS的+300bp到基因末端后的+3,000bp。为了进行更高
置信度的比较,将分析限于在所有样品的启动区域和延伸区域中具有高于噪音的可检测信号的基因。使用双侧t检验确定移动比率分布变化的统计学显著性。
[0136] 最接近的启动子处ChIP-seq占据的差异的定量
[0137] 按照启动子区域(转录起始位点(TSS)的+/-1kb)中RNA Pol II ChIP-Seq阅读片段密度的提高将所有基因分级并以100个基因的增量作为分组(bin)。针对Pol II、BRD4、MED1、H3K27Ac、CDK9,以rpm/bp计算每个分组内启动子区域的中值ChIP-Seq密度。
[0138] 复合ChIP-seq占据谱
[0139] 活性增强子对齐在ChIP-Seq密度谱的复合视图的中心处。计算50bp分组中以活性增强子为中心的周围+/-5kb的平均ChIP-Seq阅读片段密度。基因使用它们的转录起始位点和转录终止位点的位置和方向对齐。将数据表示为50bp分组中的全基因组ChIP-Seq阅读片段密度平均数。使用来自ChIP-seq的小分子(BRD4和CDK9)的靶标的富集区域计算Chem-seq和ChIP-Seq信号之间的相关性。将CTCF富集的区域用作比较。将Chem-seq和ChIP-seq的阅读片段密度谱呈现为散点图。
[0140] 基于Chem-Seq和ChIP-Seq数据之间的重叠的特异性分析
[0141] 分析Chem-Seq和ChIP-Seq数据以鉴别具有显著JQ1Chem-Seq信号但没有明显BRD4ChIP-Seq信号的基因组区域,推理这些位点可能表示JQ1的脱靶相互作用。广义线性模型(GLM方法)用于鉴别具有差异信号的区域(41,42)。首先鉴别的是在考虑的六个数据集(3个重复的JQ1Chem-Seq数据集和3个重复的BRD4ChIP-Seq数据集)的任一个中JQ1Chem-Seq或BRD4ChIP-Seq信号富集的基因组区域的集合。将与来自另一个数据集的区域重叠的来自某一数据集的区域合并在一起,以形成跨越组合的基因组区域的代表性区域。鉴别了总共25,060个区域。针对每个数据集以每bp的每百万作图阅读片段的阅读片段单位(rpm/bp)计算每个区域中的阅读片段密度。使用edgeR包对在三重数据集中由于噪音导致的技术变异以及由于JQ1Chem-Seq和BRD4ChIP-Seq数据集之间的差异引起的生物学差异建模(41)。在估算常见和tagwise离差后,将测序深度和TMM技术用于标准化数据集。使用精确检验计算JQ1Chem-Seq信号和BRD4ChIP-Seq信号之间差异的统计学显著性,并且将所得到的P值进行Benjamini-Hochberg多重检验校正。所述分析从检查的25,060个基因组区域中鉴别出10个显示出JQ1Chem-Seq和BRD4ChIP-Seq信号的显著差异(FDR<=0.25)。所有10个区域显示出相对于JQ1Chem-Seq信号的更高的BRD4ChIP-Seq信号;我们没有检测到任何显示出显著JQ1Chem-Seq信号和缺乏BRD4ChIP-Seq信号的区域。这些数据表明在这些实验条件下,在不具有BRD4的基因组的区域处不存在导致JQ1Chem-Seq信号的可鉴别的脱靶相互作用。
[0142] 为了检查本文所述的差异结合分析的限制,产生了将在不与BRD4ChIP-Seq信号重叠的区域处JQ1Chem-Seq信号的存在建模的模拟数据集。然后问题是该分析能够多好地鉴别这些通过计算引入的差异信号的区域。为了产生模拟数据集,JQ1Chem-Seq的各个重复数据集用一组来自CTCF ChIP-Seq实验的作图阅读片段掺入(spike)。将对于CTCF富集的区域特异性作图的阅读片段和
选定的区域选择为避免与JQ1Chem-Seq信号或BRD4ChIP-Seq信号的重叠。添加可变数目的阅读片段以模拟JQ1Chem-Seq数据集中附加的1%、2%、5%或10%的富集区域的存在。因为CTCF ChIP-Seq阅读片段没有添加至BRD4ChIP-Seq数据中,因此在测试鉴别差异信号的能力时,将模拟数据集中CTCF ChIP-Seq来源信号的区域用作真阳性。然后按照以上所述的进行基于GLM的分析。发现了GLM分析鉴别出模拟数据集中引入的基本上所有差异信号的区域。在其中通过计算引入另外1%的区域作为真阳性的模拟数据集中,这些区域的95%鉴别为具有差异信号。在其中通过计算引入另外2%、5%或10%的区域作为真阳性的数据集中,鉴别率分别为98.5%、99.8%和99.7%。总之,这些数据表明GLM方法能够准确地鉴别差异信号的情况,即使在它们很少发生时。
[0143] 表1
[0144]蛋白质靶标或类 生物素-药物缀合物 调控家族
雌激素受体 18b雌二醇 核受体
雌激素受体 他莫昔芬 核受体
雌激素受体 雷洛昔芬(raloxifine) 核受体
雄激素受体 二氢睾
酮 核受体
雄激素受体 比卡鲁胺 核受体
糖皮质激素受体 地塞米松 核受体
视黄酸受体 全反式视黄酸(ATRA) 核受体
甲状腺激素受体 三碘甲状腺氨酸 核受体
孕酮受体 孕酮 核受体
孕酮受体 米非司酮 核受体
过氧化物酶体增殖剂激活受体 罗格列酮 核受体
CDK4/6 PD0332991 蛋白质激酶
CDK4/6 LEE011 蛋白质激酶
CDK7 THZ 蛋白质激酶
CDK9 AT7519 蛋白质激酶
泛-CDK抑制剂 夫拉平度 蛋白质激酶
泛-蛋白质激酶抑制剂 染料木黄酮 蛋白质激酶
DNA相互作用剂(interactor) 阿霉素 DNA
DNA相互作用剂 放线菌素 DNA
DNA相互作用剂 博来霉素 DNA
DNA相互作用剂 依托泊苷 DNA
DNA相互作用剂 沙利度胺 DNA
DNA链交联 卡铂 DNA
DNA链交联 奥沙利铂 DNA
EZH2 EZH2-A 染色质调节剂
EZH2 EZH2-B 染色质调节剂
BDR2,4 JQ1(S) 染色质调节剂
BDR2,4 JQ1(R) 染色质调节剂
BDR2,4 JQ1(M) 染色质调节剂
BDR2,4 iBET 151 染色质调节剂
HDAC FK228 染色质调节剂
[0145]HDAC SAHA 染色质调节剂
HDAC LBH589 染色质调节剂
HDAC 丙戊酸 染色质调节剂
Dot1L EPZ004777 染色质调节剂
Dot1L FED1 染色质调节剂
Dot1L FED2 染色质调节剂
PARP Iniparib 基因组完整性
PARP Rucaparib 基因组完整性
PARP Veliprib 基因组完整性
DNA聚合酶 Amphidicolin 基因组完整性
[0146] 表2
[0147]
[0148]
[0149]
[0150]
[0151]
[0152]
[0153]
[0154]因子 ALIAS UNIPROT ID 类
TET2 KIAA1546,甲基胞嘧啶双加氧酶TET2 Q6N021 其它
MENIN SCG2,MEN1 O00255 其它
ASXL1 KIAA0978 Q8IXJ9 其它
DNMT1 AIM,CXXC9,DNMT P26358 其它
[0155] 表3
[0156]
[0157]
[0158] 表4
[0159]
[0160]
[0161]
[0162]
[0163]
[0164]
[0165]
[0166]
[0167]
[0168]
[0169]
[0170]
[0171]
[0172]
[0173]
[0174]
[0175]
[0176]
[0177]
[0178] 表5.此处显示的是生物素化JQ1(bio-JQ1)与BRD4的第一布罗莫结构域BRD4(1)的结合的热动力学参数和解离常数(KD)。
[0179]参数 值bio-JQ1
N 1.38±0.0148
KD 109±27.5M-9
ΔH -7159±117.8cal/mol
ΔS 7.85cal/mol/deg
[0180] 全部参考文献
[0181] 1.O.Bell,V.K.Tiwari,N.H.Thoma,D.Schubeler,Nat Rev Genet12,554(Aug,2011).
[0182] 2.D.M.Gilbert,Nat Rev Genet 11,673(Oct,2010).
[0183] 3.V.W.Zhou,A.Goren,B.E.Bernstein,Nat Rev Genet 12,7(Jan,2011).[0184] 4.R.D.Hawkins,G.C.Hon,B.Ren,Nat Rev Genet 11,476(Jul,2010).[0185] 5.K.L.MacQuarrie,A.P.Fong,R.H.Morse,S.J.Tapscott,TrendsGenet27,141(Apr,2011).
[0186] 6.S.Neph等,Cell 150,1274(Sep 14,2012).
[0187] 7.S.H.Orkin,K.Hochedlinger,Cell 145,835(Jun 10,2011).
[0188] 8.R.A.Young,Cell 144,940(Mar 18,2011).
[0189] 9.D.L.Northrup,K.Zhao,Immunity 34,830(Jun 24,2011).
[0190] 10.H.H.Ng,M.A.Surani,Nat Cell Biol 13,490(May,2011).
[0191] 11.J.S.You,P.A.Jones,Cancer Cell 22,9(Jul 10,2012).
[0192] 12.J.Sandoval,M.Esteller,Curr Opin Genet Dev 22,50(Feb,2012).[0193] 13.C.H.Arrowsmith,C.Bountra,P.V.Fish,K.Lee,M.Schapira,Nat Rev Drug Discov 11,384(2012).
[0194] 14.R.A.Copeland,M.E.Solomon,V.M.Richon,Nat Rev Drug Discov8,724(Sep,2009).
[0195] 15.M.A.Dawson,T.Kouzarides,Cell 150,12(Jul 6,2012).
[0196] 16.A.J.Deshpande,J.Bradner,S.A.Armstrong,Trends Immunol33,563(Nov,2012).
[0197] 17.Y.Feng,T.J.Mitchison,A.Bender,D.W.Young,J.A.Tallarico,Nat Rev Drug Discov 8,567(Jul,2009).
[0198] 18.P.Filippakopoulos等,Nature 468,1067(Dec 23,2010).
[0199] 19.E.Nicodeme等,Nature 468,1119(Dec 23,2010).
[0200] 20.M.A.Dawson等,Nature 478,529(Oct 27,2011).
[0201] 21.C.W.Chung等,J Med Chem 54,3827(Jun 9,2011).
[0202] 22.J.E.Delmore等,Cell 146,904(Sep 16,2011).
[0203] 23.J.Zuber等,Nature 478,524(Oct 27,2011).
[0204] 24.S.Malik,R.G.Roeder,Nat Rev Genet 11,761(Nov,2010).
[0205] 25.M.H.Kagey等,Nature 467,430(Sep 23,2010).
[0206] 26.Y.W.Jiang等,Proc Natl Acad Sci U S A 95,8538(Jul 21,1998).[0207] 27.M.K.Jang等,Mol Cell 19,523(Aug 19,2005).
[0208] 28.Z.Yang等,Mol Cell 19,535(Aug 19,2005).
[0209] 29.D.Houzelstein等,Mol Cell Biol 22,3794(Jun,2002).
[0210] 30.L.Santo等,Oncogene 29,2325(Apr 22,2010).
[0211] 31.M.S.Squires等,Mol Cancer Ther 9,920(Apr,2010).
[0212] 32.Q.Zhou,T.Li,D.H.Price,Annu Rev Biochem 81,119(2012).
[0213] 33.A.Marson等,Cell 134,521(Aug 8,2008).
[0214] 34.T.I.Lee,S.E.Johnstone,R.A.Young,Nat Protoc 1,729(2006).[0215] 35.B.Langmead,C.Trapnell,M.Pop,S.L.Salzberg,Genome Biol 10,R25(2009).[0216] 36.Y.Zhang等,Genome Biol 9,R137(2008).
[0217] 37.M.G.Guenther,S.S.Levine,L.A.Boyer,R.Jaenisch,R.A.Young,Cell130,77(Jul 13,2007).
[0218] 38.A.Rada-Iglesias等,Nature,(Dec 15,2010).
[0219] 39.M.P.Creyghton等,Proc Natl Acad Sci U S A,(Nov 24,2010).[0220] 40.P.B.Rahl等,Cell 141,432(Apr 30,2010).
[0221] 41.M.D.Robinson,D.J.McCarthy,G.K.Smyth,Bioinformatics 26,139(Jan1,2010).
[0222] 42.C.S.Ross-Innes等,Nature 481,389(Jan 19,2012).
[0223] 将本文中引用的所有专利、公开的申请和参考文献的教导全部按引用并入。
[0224] 尽管已经参考其实例实施方式特别地显示和描述了本发明,但本领域技术人员将理解其中可以进行形式和细节上的各种改变而不脱离由所附
权利要求涵盖的本发明的范围。