首页 / 专利库 / 遗传学 / 基因治疗 / 涉及核糖开关的基于结构的化合物设计

涉及核糖开关的基于结构的化合物设计

阅读:712发布:2023-03-08

专利汇可以提供涉及核糖开关的基于结构的化合物设计专利检索,专利查询,专利分析的服务。并且核糖 开关 和修饰形式的核糖开关可被用作受特异性效应化合物控制的设计基因开关。这类可激活核糖开关的效应化合物在本文中被称为触发分子。天然开关是抗生素和其它小分子 治疗 剂的靶标。此外,核糖开关的建造使得天然开关的实际 片段 可被用于构建新的非免疫原性基因控制元件,例如适体(分子识别)结构域可与其它的非适体(或修饰的)结构域相交换,这样新的识别结构域可导致由使用者定义的效应物化合物引起的基因调节。这种改变的开关可成为 治疗方案 的一部分——可以打开或关闭,或调节 蛋白质 的合成。新构建的基因调节网络可以应用于一些领域,例如活体 生物 传感器 、生物的代谢工程以及基因疗法的高级形式。可使用化合物来刺激、激活、抑制和/或失活核糖开关。可以利用核糖开关的 原子 结构来设计可刺激、激活、抑制和/或失活核糖开关的新化合物。,下面是涉及核糖开关的基于结构的化合物设计专利的具体信息内容。

1.天然嘌呤应答性核糖开关原子结构,包括图6中所示的原子结 构。
2.根据权利要求1的原子结构,其中所述原子结构的原子坐标包括图6 中所示原子的表6中所列的原子坐标。
3.根据权利要求1的原子结构,其中所述原子结构的原子坐标包括表6 中所列的原子坐标。
4.一种识别与核糖开关相互作用的化合物的方法,包括:
(a)使用权利要求1的原子结构与待测化合物进行建模;和
(b)测定待测化合物是否与核糖开关相互作用。
5.根据权利要求4的方法,其中所述测定待测化合物是否与核糖开关相 互作用的步骤包括测定核糖开关模型中的待测化合物的预计最小相 互作用能、预计结合常数、预计解离常数或它们的组合。
6.根据权利要求4的方法,其中所述测定待测化合物是否与核糖开关相 互作用的步骤包括测定待测化合物和核糖开关模型中的一个或多 个预计的键、一种或多种预计的相互作用或它们的组合。
7.根据权利要求4的方法,其中所述核糖开关为鸟嘌呤核糖开关。
8.根据权利要求7的方法,其中所述鸟嘌呤核糖开关为表5中的核糖开 关。
9.根据权利要求4的方法,其中在(b)步骤中测定原子接触,由此测定 待测化合物与核糖开关的相互作用。
10.根据权利要求9的方法,还包括下述步骤:
(c)识别待测化合物的类似物;
(d)测定待测化合物的类似物是否与核糖开关相互作用。
11.根据权利要求10的方法,其中所述化合物为次黄嘌呤。
12.一种杀菌方法,包括将细菌与权利要求10的方法所识别的类似物相 接触。
13.一种杀菌方法,包括将细菌与权利要求4的方法所识别的化合物相接 触。
14.根据权利要求4的方法,其中使用基于凝胶的分析来测定待测化合物 是否与核糖开关相互作用。
15.根据权利要求4的方法,其中使用基于芯片的分析来测定待测化合物 是否与核糖开关相互作用。
16.根据权利要求4的方法,其中所述待测化合物的相互作用是通过范德 华相互作用、氢键、静电相互作用、疏相互作用或它们的组合。
17.根据权利要求4的方法,其中所述核糖开关含有RNA切割核酶。
18.根据权利要求4的方法,其中当含有淬灭部分的核酸被切割时产生荧 光信号
19.根据权利要求4的方法,其中使用分子信标技术来产生荧光信号
20.根据权利要求4的方法,其中使用高通量筛选来实行所述方法。
21.一种识别与核糖开关相互作用的化合物的方法,包括将核糖开关与待 测化合物相接触,其中在核糖开关与待测化合物相互作用时产生荧 光信号。
22.一种识别与核糖开关相互作用的化合物的方法,包括:
(a)识别核糖开关的晶体结构
(b)对核糖开关和待测化合物进行建模;和
(c)测定待测化合物是否与核糖开关相互作用。
23.根据权利要求22的方法,其中所述核糖开关为鸟嘌呤核糖开关。
24.根据权利要求23的方法,其中所述鸟嘌呤核糖开关为表5中的核糖 开关。
25.一种可调节的基因表达构建体,包括编码RNA的核酸分子,所述RNA 包括与编码区域可操作地连接的核糖开关,其中所述核糖开关为表5 中的核糖开关,其中所述核糖开关调节RNA的表达,其中所述核糖 开关和编码区域为异源的。
26.根据权利要求25的基因表达构建体,其中所述核糖开关被触发分子 所激活,其中所述核糖开关在被触发分子激活时产生信号。
27.一种检测目的化合物的方法,所述方法包括使样本与核糖开关相接 触,其中所述核糖开关为表5中的核糖开关,其中所述核糖开关被 目的化合物所激活,其中所述核糖开关在被目的化合物激活时产生 信号,其中所述核糖开关在样本中含有目的化合物时产生信号。
28.根据权利要求27的方法,其中所述核糖开关在被目的化合物激活时 改变构象,其中所述的构象的改变通过构象依赖性标签产生信号。
29.根据权利要求27的方法,其中所述核糖开关在被目的化合物激活时 改变构象,其中所述的构象的改变导致与核糖开关相连的RNA的表 达改变,其中所述表达的改变产生信号。
30.根据权利要求29的方法,其中通过与所述核糖开关相连接的RNA所 表达的报告蛋白产生信号。
31.一种抑制基因表达的方法,所述方法包括:
(a)使细胞与一种化合物相接触,
(b)其中所述化合物具有式I的结构:

其中当所述化合物与鸟嘌呤应答性核糖开关相结合时,R1和R2 作为氢键供体,R7作为氢键受体,R9作为氢键供体,R10作为氢键受 体,
其中每个独立地代表单键或双键,
其中所述化合物不是鸟嘌呤、次黄嘌呤或黄嘌呤,
其中所述细胞含有编码RNA的基因,所述RNA含有鸟嘌呤应答性核糖 开关,其中所述化合物通过结合鸟嘌呤应答性核糖开关来抑制所述 基因的表达。
32.根据权利要求31的方法,其中R3为氢键受体。
33.根据权利要求31的方法,其中R1、R2、R9或它们的组合分别独立地 为-NR11-、-CHR11-、=CR11-和-C(=NR11)-,其中R11为-H、-NH2、-OH、 -SH、-CO2H,取代或未取代的烷基、烷基、芳基、芳基氧基或苯甲 氧基,-NH烷基、-NH烷氧基、-NHC(O)烷基、-NHCO2烷基、-NHC(O)NH2、 -NH-NH2、-NH-NH烷基、-NH-NH烷氧基、-NH-SO2烷基、-NH-SO2-R12、 -NHCO2CH2-R12、-NH-OR12、-N+H2-R12、-NH-NH-R12和-NH-NH-CH2-R12,其 中R12为:

其中n为1至5,R13为一个或多个-H、-NH2、-OH、烷氧基、-N-吗啉 代或卤化物。
34.根据权利要求31的方法,其中R8和R7一起代表-CH=N-、-CH2-O-、 -CH2-S-或-CH2SO2-。
35.根据权利要求31的方法,其中R10为-OH、-SH、-NH2、-CO2H、-烷氧 基、-芳基氧基、-苯甲氧基、-卤化物、-NH烷基、-NH烷氧基、-NHC(O) 烷基、-NHCO2烷基、-NHCO2CH2-R12、-NHC(O)NH2、-NH-NH2、-NH-NH烷 基、-NH-NH烷氧基、-SO2烷基、-SO2芳基、-NH-SO2烷基、-NH-SO2-R12、 -NH-OR12、-NH-R12、-NH-NH-R12、-NH-NH-CH2-R12或-NH-CH2-R12,其中 R12为:

其中n为1至5,R13为一个或多个-H、-NH2、-OH、烷氧基、-N-吗啉 代或卤化物。
36.根据权利要求31的方法,其中R10为NR14,其中R14为-H、-NH2、-OH、 -SH、-CO2H、-CO2烷基、-CO2芳基、-C(O)NH2,取代或未取代的烷基、 烷氧基、烷氧基、芳基氧基或苯甲氧基,-NH烷基、-NH烷氧基、-NHC(O) 烷基、-NHCO2烷基、-NHC(O)NH2、-SO2烷基、-SO2芳基、-NH-SO2烷基、 -NH-SO2-R12、-NH-OR12、-NH-R12或-NH-CH2-R12,其中R12为:

其中n为1至5,R13为一个或多个-H、-NH2、-OH、烷氧基、-N-吗啉 代或卤化物。R12的定义如上所述。
37.根据权利要求31的方法,其中所述化合物具有式II的结构:

其中R7为N或CH;
其中R10为=O、=S、=NH、=NOH、=N烷基、=N烷氧基、=N-芳基、=N 芳基氧基、=N-苯甲基、-N苯甲氧基、=N-NH2、=N-NHOH、=N-NH烷基、 =N-NH烷氧基、=N-NH芳基、=N-NH芳基氧基、=N-NH苯甲基、=N-NH 苯甲氧基、=N-NH-(对基苯基)、=N-NH-(对甲氧基苯基)、=N-NH-(对 -N-吗啉代-苯基);以及
其中R2为=CR15-,其中R15为-NH2、-NHNH2、-NHOH、-NH烷基、-NH烷 氧基、-NH芳基、-NH芳基氧基、-NH苯甲基、-NH苯甲氧基、-N+H2 芳基、-N+H2-(对-N-吗啉代-苯基)、-N+H2-(对氨基苯基)、-N+H2-(对 甲氧基苯基)、-NHCO2烷基、-NHCO2苯甲基、-NHNH烷基、-NHNH芳基、 -NHNH苯甲基或-NHC(O)烷基。
38.根据权利要求31的方法,其中所述化合物具有式III的结构:

其中R7为N或CH;
其中R10为-H、-OH、-SH、-烷氧基、卤化物、-NH2、-NHOH、-NH烷 基、-NH烷氧基、-NH芳基、-NH芳基氧基、-NH苯甲基、-NH苯甲氧 基、-NHC(O)烷基、-NHCO2烷基、NHCO2苯甲基、-NHNH2、-NHNH烷基、 -NHNH芳基或-NHNH苯甲基;以及
其中R2为=CR15-,其中R15为-NH2、-NHNH2、-NHOH、-NH烷基、-NH烷 氧基、-NH芳基、-NH芳基氧基、-NH苯甲基、-NH苯甲氧基、-N+H2 芳基、-N+H2-(对-N-吗啉代-苯基)、-N+H2-(对氨基苯基)、-N+H2-(对 甲氧基苯基)、-NHCO2烷基、-NHCO2苯甲基、-NHNH烷基、-NHNH芳基、 -NHNH苯甲基或-NHC(O)芳基。
39.一种方法,包括:
(a)检测一种化合物对于编码包括核糖开关的RNA的基因的基因表 达的抑制作用,其中所述核糖开关为表5中的核糖开关,其中所述 的抑制作用是通过核糖开关进行的,
(b)通过使细胞与步骤(a)中抑制基因表达的化合物相接触,从而抑 制基因表达,
其中所述细胞含有编码包括核糖开关的RNA的基因,其中所述化合物 通过结合所述核糖开关来抑制基因的表达。

说明书全文

技术领域

发明主要涉及基因表达领域,具体涉及基因表达调节的领域。

背景技术

活体系统的一个本质特征是精确基因控制,例如细胞必须通过改变 基因表达模式来对大量的生物化学信号和环境信息做出应答。大多数已 知的基因控制机制都涉及蛋白质因子的使用,所述蛋白质因子感受化学 或物理刺激然后通过与相关DNA或信使RNA序列的选择性相互作用来调 节基因表达。蛋白质可以采用多种复杂的形状并带有各种功能,这使得 活体系统可以精确的感知它们的化学和物理环境。对代谢产物应答的蛋 白质因子通常通过与DNA结合来调节转录的启动(例如乳糖抑制体蛋白; Matthews,K.S.,and Nichols,J.C.,1998,Prog.Nucleic Acids Res. Mol.Biol.58,127-164),或者通过与RNA结合来控制转录终止(例如 PryR蛋白;Switzer,R.L.,et al.,1999,Prog.Nucleic Acids Res.Mol. Biol.62,329-367)或翻译(例如TRAP蛋白;Babitzke,P.,and Gollnick, P.,2001,J.Bacter iol.183,5795-5802)。蛋白质因子通过例如变构 修饰或翻译后修饰的各种机制对环境刺激做出应答,并且经常利用这些 机制起到高应答性基因开关的作用(参见例如Ptashne,M.,and Gann,A. (2002).Genes and Signals.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)。
除了蛋白质因子广泛参与基因控制之外,还已知RNA也在基因调节 中有活跃的作用。最近的研究逐渐揭示出小的非编码RNA在选择性靶向 和破坏mRNA方面的重要作用,这导致基因表达的下调(参见例如Hannon, GJ.2002,Nature 418,244-251和该文章的参考文献)。这种RNA干扰过 程利用了短RNA通过Watson-Crick基互补而选择性识别目标mRNA靶标 的能上的优势,在该过程之后被结合的mRNA通过蛋白质的作用而被破 坏。在这一系统中RNA为分子识别的理想媒介物,因为通过进化过程产生 新的靶标特异性RNA因子要比产生具有新的高特异性RNA结合位点的蛋白 质因子容易得多。
虽然蛋白质可以满足生物学对于酶、受体和结构功能的大部分需求, 但是RNA也具有这些能力。例如,RNA具有足够的结构弹性,能形成多种 具有很大的酶活力和精确的分子识别能力的核酶结构域(Cech&Golden, Building a catalytic active site using only RNA.In:The RNA World R.F.Gesteland,T.R.Cech,J.F.Atkins,eds.,pp.321-350(1998); Breaker,In vitro selection of catalytic polynucleotides.Chem.Rev. 97,371-390(1997))和受体结构域(Osborne&Ellington,Nucleic acid selection and the challenge of combinatorial chemistry.Chem.Rev. 97,349-370(1997);Hermann&Patel,Adaptive recognition by nucleic acid aptamers.Science 287,820-825(2000))。此外,上述能力还可以 组合产生被效应物分子选择性调节的变构核酶(Soukup&Breaker, Engineering precision RNA molecular switches.Proc.Natl.Acad.Sci. USA 96,3584-3589(1999);Seetharaman et al.,Immobilized riboswitches for the analysis of complex chemical and biological mixtures.Nature Biotechnol.19,336-341(2001))。
RNA的这些属性与一些研究的结论相一致(Gold et al.,From oligonucleotide shapes to genomic SELEX:novel biological regulatory loops.Proc.Natl.Acad.Sci.USA 94,59-64(1997);Gold et al.,SELEX and the evolution of genomes.Curr.Opin.Gen.Dev. 7,848-851(1997);Nou&Kadner,Adenosylcobalamin inhibits ribosome binding to btuBRNA.Proc.Natl.Acad.Sci.USA 97,7190-7195(2000); Gelfand et al.,A conserved RNA structure element involved in the regulation of bacterial riboflavin synthesis genes.Trends Gen.15, 439-442(1999);Miranda-Rios et al.,A conserved RNA structure(thi box)is involved in regulation of thiamin biosynthetic gene expression in bacteria.Proc.Natl.Acad.Sci USA 98,9736-9741 (2001);Stormo&Ji,Do mRNAs act as direct sensors of small molecules to control their expression?Proc.Natl.Acad.Sci USA 98,9465-9467 (2001)),上述研究表明某些mRNA可能利用变构机制来对存在的特异性代 谢产物做出基因调节性应答。虽然推测有一种硫胺素焦磷酸(TPP)依赖性 的感应物/调节性蛋白可能参与了对硫胺素生物合成基因的控制(Webb& Downs,Characterization of thiL,encoding thiamin-monophosphate kinase,in Salmonella typhimurium.J.Biol.Chem.272,15702-15707 (1997)),但是还未发现有这类蛋白质因子的存在。
虽然枯草芽孢杆菌(B.subtilis)的lysC基因的转录受到高浓度 的赖酸的抑制(Kochhar,S.,and Paulus,H.1996,Microbiol. 142:1635-1639;Mader,U.,et al.,2002,J.Bacteriol. 184:4288-4295;Patte,J.C.1996.Biosynthesis of lysine and threonine.In:Escherichia coli and Salmonella:Cellular and Molecular Biology,F.C.Neidhardt,et al.,eds.,Vol.1,pp. 528-541.ASM Press,Washington,DC;Patte,J.-C,et al.,1998,FEMS Microbiol.Lett.169:165-170),但是还没有识别到作为该基因调节物 的蛋白质因子(Liao,H.-H.,and Hseu,T.-H.1998,FEMS Microbiol. Lett.168:31-36)。lysC基因编码天冬氨酸激酶II,该酶催化L天冬氨 酸转化为L赖氨酸的代谢途径的第一步(Belitsky,B.R.2002. Biosynthesis of amino acids of the glutamate and aspartate families, alanine,and polyamines.In:Bacillus subtilis and its Closest Relatives:from Genes to Cells.A.L.Sonenshein,J.A.Hoch,and R. Losick,eds.,ASM Press,Washington,D.C.)。

发明内容

现已发现,某些天然mRNA可作为对代谢产物敏感的基因开关,其中 所述RNA直接结合小有机分子。这种结合过程改变了mRNA的构型,由此 通过多种不同机制引起了基因表达的变化。这些天然“核糖开关 (riboswitch)”的修饰形式(通过各种核酸工程策略而产生)可被用作 受特异性效应物化合物控制的设计基因开关。这类激活核糖开关的效应 物化合物在本文中被称为触发分子。天然开关是抗生素和其它小分子治 疗剂的靶标。此外,核糖开关的建造使得天然开关的实际片段可被用于 构建新的非免疫原性基因控制元件,例如适体(aptamer)(分子识别) 结构域可与其它的非天然适体相交换(或以其他方式修饰),这样新的识 别结构域可导致由使用者定义的效应物化合物引起的基因调节。这种改 变的开关可成为治疗方案的一部分--可以打开或关闭,或调节蛋白质 的合成。新构建的基因调节网络可以应用于一些领域,例如活体生物传 感器、生物的代谢工程以及基因疗法的高级形式。
公开了分离的和重组的核糖开关、含有这类核糖开关的重组构建体、 与这类核糖开关可操作地连接的异源序列、带有这类核糖开关的细胞和 转基因生物、核糖开关重组构建体以及与异源序列可操作地连接的核糖 开关。异源序列可为例如编码目的蛋白质或肽的序列,包括报告蛋白或 报告肽。优选的核糖开关为天然存在的核糖开关或由天然存在的核糖开 关衍生的核糖开关。
还公开了核糖开关的晶体原子结构。这些结构可用于建模和评估核 糖开关与结合配体之间的相互作用。它们还可用于识别与核糖开关相互 作用的化合物的方法中。
还公开了含有异源的适体结构域和表达平台结构域(expression platform donaim)的嵌合核糖开关。也就是说,嵌合核糖开关有来自一 种来源的适体结构域和来自另一种来源的表达平台结构域。异源来源可 来自例如不同特异性的核糖开关或不同类别的核糖开关。异源适体也可 来自非核糖开关适体。异源表达平台结构域也可来自非核糖开关来源。
还公开了用于筛选和识别可以激活、失活或阻断核糖开关的化合物 的方法和组合物。核糖开关的激活指的是结合触发分子后核糖开关状态 的改变。核糖开关可被触发分子以外的其他化合物激活和以结合触发分 子以外的其它方式激活。本文使用的术语触发分子指的是可以激活核糖 开关的分子和化合物。这包括核糖开关的天然或正常的触发分子和其它 可激活核糖开关的化合物。天然或正常的触发分子是指给定的天然核糖 开关的触发分子,或者对于一些非天然核糖开关而言,是指设计该核糖 开关时所针对的触发分子或筛选该核糖开关时使用的触发分子(筛选通 过例如体外筛选或体外进化技术)。非天然触发分子可被称为非天然触发 分子。
核糖开关的失活指的是不再结合触发分子时核糖开关的状态改变。 核糖开关可通过与触发分子以外的其他化合物结合失活和以移除触发分 子以外的其它方式失活。核糖开关的阻断指的是核糖开关的一种状态或 情况,此时存在触发分子却不激活核糖开关。
还公开了识别与核糖开关相互作用的化合物的方法,包括利用待测 化合物和核糖开关的原子结构进行建模并确定待测化合物与核糖开关是 否相互作用。这可通过测定核糖开关和待测化合物的原子接触来进行。 此外,通过分析原子接触然后优化类似物的原子结构以使得相互作用最 大化,可以产生已知与核糖开关相互作用的化合物的类似物。上述方法 可以高通量筛选进行。
还公开了可以激活、失活或阻断核糖开关的化合物以及含有这类化 合物的组合物。还公开了可以激活、失活或阻断核糖开关的组合物和方 法。核糖开关通过结合或移除触发分子而实现控制基因表达的功能。可 使用化合物来激活、失活或阻断核糖开关。可以使用核糖开关的触发分 子(以及其它激活性化合物)来激活核糖开关。通常可使用触发分子以 外的化合物来失活或阻断核糖开关。还可以通过例如从核糖开关所在处 移除触发分子来失活核糖开关。核糖开关可通过例如结合不激活核糖开 关的触发分子的类似物而被阻断。
还公开了通过使化合物与RNA分子相接触,从而改变RNA分子表达 或改变编码RNA分子的基因表达的方法和组合物,其中所述RNA分子包 括核糖开关。核糖开关通过结合或移除触发分子而实现控制基因表达的 功能。因此,将包括核糖开关的目的RNA分子置于可激活、失活或阻断 核糖开关的条件下就可用来改变RNA的表达。例如转录终止或核糖体与 RNA的结合被阻断可以导致表达被改变。根据核糖开关的性质,与触发分 子的结合可以减少或阻止RNA分子的表达或者促进或增加RNA分子的表 达。
还公开了通过将核糖开关与RNA分子可操作地连接,来调节RNA分子 或编码NRA分子的基因的表达的方法和组合物。核糖开关可与RNA分子以 任何合适的方式可操作地连接,所述方式包括例如通过将核糖开关与RNA 分子物理连接,或者通过将编码RNA分子的基因用基因工程改造使其包括 和编码核糖开关,这样由基因工程改造的核酸产生的RNA就具有了与RNA 分子可操作连接的核糖开关。将与目的RNA分子可操作连接的核糖开关置 于可激活、失活或阻断核糖开关的条件下就可用来改变RNA的表达。
还公开了通过激活、失活或阻断核糖开关,来调节含有核糖开关的天 然存在的基因或RNA的表达的方法和组合物。如果该基因对含有该基因的 细胞或生物的存活而言十分重要,那么激活、失活或阻断该核糖开关可导 致细胞或生物的死亡、停滞或虚弱。例如(如果该核糖开关的激活关闭或 抑制表达),激活某个对微生物的存活而言十分重要的天然存在的基因中的 天然存在的核糖开关,可能导致该微生物的死亡。这是所公开的化合物和 方法用于抗微生物和抗生素效果的一个理论基础
还公开了通过激活、失活或阻断核糖开关,来调节含有核糖开关的分 离的、基因工程改造的或重组的基因或RNA的表达的方法和组合物。基因 或RNA可通过任何方式进行基因工程改造或重组。例如,核糖开关和RNA 的编码区域可以是异源的,核糖开关可被重组或嵌合或二者均有。如果基 因编码一种所需的表达产物,则激活或失活该核糖开关可被用于诱导该基 因的表达,并由此导致表达产物的产生。如果该基因编码对于基因表达或 另一细胞过程的一种诱导物或抑制物,则激活、失活或阻断该核糖开关可 导致其他被调节基因或细胞过程的诱导、抑制或脱抑制。已知多种这样的 次级调节效应,它们也可适用于核糖开关。核糖开关作为这类调节的初级 控制的一个优势是核糖开关的触发分子可为小的非抗原性分子。
还公开了通过将适体结构域与核糖开关的表达平台结构域可操作地连 接(为嵌合核糖开关),来改变核糖开关的调节的方法和组合物。这样该适 体结构域可以通过例如适体结构域的触发分子的作用介导核糖开关的调 节。适体结构域可以以任何合适的方式与核糖开关的表达平台结构域可操 作地连接,所述方式包括例如用新的适体结构域替换核糖开关的正常的或 天然的适体结构域。通常,可以激活、失活或阻断该适体结构域所来源的 核糖开关的任何化合物或条件都可被用于激活、失活或阻断该嵌合核糖开 关。
还公开了通过共价改变核糖开关(通过例如交联核糖开关的部分或将 一种化合物偶联至核糖开关)来灭活核糖开关的方法和组合物。这种方式的 核糖开关的灭活可由例如一些改变来获得,所述改变阻止了核糖开关的触 发分子的结合,阻止了核糖开关与触发分子结合后的状态改变,或阻止了在 与触发分子结合后核糖开关的表达平台结构域对表达的影响。
还公开了识别可激活、失活或阻断核糖开关的化合物的方法。例如,可 以通过使待测化合物和核糖开关相接触并评估核糖开关的激活来识别可激 活核糖开关的化合物。如果核糖开关被激活,则待测化合物被识别为可激活 核糖开关的化合物。可以以任意合适的方式评估核糖开关的激活。例如,核 糖开关可以与报告RNA相连接,并可在存在和不存在待测化合物的条件下 测量报告RNA的表达、表达平或表达水平的改变。作为另一个实例,核 糖开关可包括构象依赖性标签,由该标签产生的信号随核糖开关的激活状 态而改变。优选地,这种核糖开关使用天然存在的核糖开关的适体结构域 或由天然存在的核糖开关衍生的适体结构域。由此可见,可以使用对照测 定或测量或者不使用对照测定或测量来进行核糖开关激活的评估。识别可 以失活核糖的开关化合物的方法可以以类似的方式进行。
对阻断核糖开关的化合物的识别可以以任何合适的方式完成。例如, 可以在存在已知可激活或失活核糖开关的化合物以及存在待测化合物的条 件下来进行用于评估核糖开关的激活或失活的分析。如果没有观察到如同 在不存在待测化合物的情况下应当观察到的激活或失活情况,则该待测化 合物被识别为可阻断核糖开关的激活或失活的化合物。
还公开了生物传感器核糖开关。生物传感器核糖开关是经过基因工程 改造的核糖开关,它们在存在它们的同种触发分子时产生可检出的信号。 可用的生物传感器核糖开关可以在触发分子达到或超过阈值水平时被触 发。生物传感器核糖开关可被设计为体内应用或体外应用。例如,报告RNA 编码作为信号的蛋白质或参与产生信号的蛋白质,与该报告RNA可操作地 连接的生物传感器核糖开关可在体内被用于通过基因工程改造细胞或生 物,使其含有编码核糖开关/报告RNA的核酸构建体。用于体外的生物传感 器核糖开关的一个实例是包括构象依赖性标签的核糖开关,由该标签产生 的信号依赖于核糖开关的激活状态。优选地,这种生物传感器核糖开关使 用天然存在的核糖开关的适体结构域或由天然存在的核糖开关衍生的适体 结构域。还公开了使用生物传感器核糖开关检测化合物的方法。该方法可 包括使待测样本和生物传感器核糖开关相接触,并评估生物传感器核糖开 关的激活。生物传感器核糖开关的激活表明在待测样本中存在该生物传感 器核糖开关的触发分子。
还公开了由识别激活、失活或阻断核糖开关的化合物和对识别出的化 合物进行加工而制备的复合物。这可以通过例如将本文其他部分公开的化 合物识别方法与对识别出的化合物进行加工的方法结合使用而实现。例如, 可通过下述方法制备复合物:使待测化合物和核糖开关相接触,评估核糖 开关的激活,以及如果核糖开关被待测化合物激活,则制备该激活核糖开 关的待测化合物作为复合物。
还公开了由核实某种化合物对核糖开关的激活、失活或阻断作用和对 经核实的化合物进行加工而制备的复合物。这可以通过例如将本文其他部 分公开的化合物激活、失活或阻断评估方法与对经核实化合物的加工方法 结合使用而实现。例如,可通过下述方法制备复合物:使待测化合物和核 糖开关相接触,评估核糖开关的激活,以及如果核糖开关被待测化合物激 活,则制备该激活核糖开关的待测化合物作为复合物。核实化合物激活、 失活或阻断核糖开关的能力指的是对以前并不知道可否激活、失活或阻断 核糖开关的化合物的鉴定,以及对已知可激活、失活或阻断核糖开关的化 合物激活、失活或阻断核糖开关的能力的评估。
还公开了筛选、设计或产生可以识别新的触发分子的新核糖开关和/ 或新适体的方法。这类方法可包括:在核糖开关中产生一系列适体变异体、 在目的化合物存在的条件下评估变异体核糖开关的激活、筛选被激活的变 异体核糖开关(或者例如筛选激活度最高或激活选择性最强的核糖开关) 和重复上述步骤,直至得到具有所需活性、特异性、活性和特异性的结合 或其他性质的结合的变异体核糖开关。还公开了由上述方法生产的核糖开 关和适体结构域。
所公开的核糖开关(包括它们的衍生形式和重组形式)通常可来自任 何来源,包括天然存在的核糖开关和从头设计的核糖开关。任何这类核糖 开关均可被用于公开的方法中或与公开的方法一起使用。然而,还可以确 定不同类型的核糖开关,一些这样的亚类可能可用于特定的方法中或与特 定的方法一起使用(通常如本文其他部分所述)。核糖开关的类型包括例如: 天然存在的核糖开关、天然存在的核糖开关的衍生形式和修饰形式、嵌合 核糖开关和重组核糖开关。天然存在的核糖开关是这样一种核糖开关,它 具有自然界中存在的核糖开关的序列。这类天然存在的核糖开关可以是自 然界中存在的天然存在的核糖开关的分离形式或重组形式。也就是说,该 核糖开关还具有相同的一级结构,但是已在新的基因背景或核酸背景中被 分离或被基因工程改造。嵌合核糖开关可由例如下列的部分构成:任意或 特定类别或类型的核糖开关的一部分和相同或任意不同类别或类型的核糖 开关中不同的核糖开关的一部分;任意或特定类别或类型的核糖开关的一 部分和非核糖开关序列或元件。重组核糖开关是在新的基因背景或核酸背 景中被分离或被基因工程改造的核糖开关。
不同类别的核糖开关指的是(预计、测得或二者结合的)具有相同或 相似的触发分子的核糖开关或具有相同或相似的总体结构的核糖开关。同 一类别的核糖开关通常但不必需具有相同或相似的触发分子以及相同或相 似的总体结构。核糖开关的类别包括:甘氨酸应答性核糖开关、嘌呤应 答性核糖开关、腺嘌呤应答性核糖开关、赖氨酸应答性核糖开关、硫胺素 焦磷酸应答性核糖开关,腺苷钴胺素应答性核糖开关、黄素单核苷酸应答 性核糖开关和S-腺苷蛋氨酸应答性核糖开关。
所公开的方法和组合物的其他优点一部分将在下文的描述中阐明,一 部分可以从说明书中获知,或者通过实施公开的方法和组合物而得知。所 公开的方法和组合物的优点将通过所附权利要求书中具体指明的要素和组 合的方式实现和获得。应当理解的是,上文的一般性描述和下文的具体描 述都仅仅是示例性和解释性的,并不是对本发明要求保护范围的限制。
附图说明
附图包含于本说明书中并作为本说明书的一部分,阐述了所公开方法 和组合物的一些实施方案,它与文字描述一起作为对所公开方法和组合物 的原理的解释。
图1A、1B和1C显示的是枯草芽孢杆菌中对鸟嘌呤变构应答的xpt-pbuX mRNA的G盒RNA。图1A显示的是存在于广泛参与嘌呤代谢的基因5’UTR 的G盒RNA结构域的共有序列和二级结构模型(SEQ ID NO:1)。种系发 育分析的结果与三个茎结构(three-stem)(P1至P3)连接点的形成是一 致的。以小写字母和大写字母显示的核苷酸分别表示存在于90%以上和80% 以上的被检测的代表物中。圆圈内的核苷酸表现出碱基互补,这也许表明 假结体(pseudoknot)的形成。图1B显示xpt-pbuX转录单位的5’UTR的 序列和配体诱导的结构改变(SEQ ID NO:2)。大方框代表推测的抗终止子 相互作用。通过串联标记(in-line probing)(从C开始)测定的经过结 构改变的核苷酸用小方框标出。201xpt RNA的93xpt片段(大方框中)仍 然保留了鸟嘌呤结合功能。星号标出了促进体外转录(5’端)或产生限制 性酶切位点(3’端)的RNA序列的改变。核苷酸编号从天然转录起点的第 一个核苷酸开始。翻译起始密码子从第186位开始。图1C显示的是鸟嘌呤 和相关的嘌呤选择性诱导93xpt mRNA片段的结构性调节。通过对前体RNA (Pre;5’32P标记)培养40小时来进行串联标记,所述培养在不含有(-) 或含有鸟嘌呤(G)、次黄嘌呤(H)、黄嘌呤(X)和腺嘌呤(A)的条件下 进行。标有NR、T1和-OH的泳道分别代表未反应的RNA、经过RNA酶T1(G- 特异性切割)部分消化的RNA或经过碱部分消化的RNA。识别了选出的对 应于G-特异性切割的条带。1至4区域识别了自发性RNA切割的配体诱导 调节的主要位点。
图2A、2B和2C显示由xpt-pbuX mRNA的鸟嘌呤结合适体进行的分子 辨别。图2A显示的是鸟嘌呤、次黄嘌呤和黄嘌呤(枯草芽孢杆菌中xpt-pbuX 基因表达的活性天然调节物)与腺嘌呤(无活性)的化学结构和表观KD值 的比较。相对于鸟嘌呤的化学结构的差异用圆圈表示。图2中显示的KD值 是以201xpt RNA测定的。鸟嘌呤上的数字表示环上氮原子的位置。图2B 显示鸟嘌呤的各种类似物的化学结构和KD值,表明该嘌呤的所有改变都会 导致结合亲和力的丧失。空心圆圈表示KD值很可能显著高于示出值,这是 由于在本分析中没有检测500μM以上的类似物浓度。G、H、X和A的表观 KD值用三表示以便于比较。图2C显示的是201xpt中鸟嘌呤适体的分子 识别特征的示意图。预计在鸟嘌呤的第9位形成了氢键,因为鸟苷(KD>100 μM)和肌苷(KD>100μM)(分别为鸟嘌呤和次黄嘌呤的9-核糖基衍生物) 并未表现出可测量的结合。
图3A、3B和3C显示了鸟嘌呤特异性和腺嘌呤特异性的核糖开关。图 3A显示了本研究中检测的两种鸟嘌呤特异性适体结构域(purE和xpt)和 三种腺嘌呤特异性适体结构域的序列和结构特征:BS2-purE、BS3-xpt、 BS5-ydhL、CP4-add和VV1-add,它们分别示于SEQ ID NO:3-7。P1至P3 示出了含有适体结构域的二级结构的三个碱基对茎结构。小写字母的核苷 酸表示在系统发育中代表物的碱基同一性保守性达到90%以上的位置。箭 头表示配体特异性决定簇的适体的保守性核心之中的核苷酸。BS、CP和VV 分别表示枯草芽孢杆菌(B.subtilis)、产气荚膜梭菌(Clostridium perfringens)和创伤弧菌(Vibrio vulnificus)。图3B显示的是xpt适 体和ydhL适体的序列(SEQ ID NO:8)和二级结构。圆圈内的核苷酸表示 的是ydhL适体中与xpt适体中不同的位置。图3C中公开的序列为SBQ ID NO:9。xpt中的核苷酸按照美国专利申请No.2005-0053951的实施例6中 所述进行编号。其他标记如图3A中所述。
图4A和4B显示的是来自ydhL的腺嘌呤适体的分子识别的特异性。图 4A中的上图:对80ydhL RNA表现出可测量的结合的腺嘌呤、鸟嘌呤和其 他嘌呤类似物的化学结构。用圆圈表示相对于结合最紧密的化合物2,6-DAP 的化学改变。下方左图:各种嘌呤的表观KD值图。下方右图:作为分子识 别而与ydhL接触的腺嘌呤上的化学特征的模式图。注:N7和N9的重要性 未进行测定。圆圈中的箭头表示如果在C2处附带有氢键供体则会存在接 触。图4B显示的是不与80ydhL RNA结合(KD值低于300μM)的各种嘌呤 的化学结构。
图5A、5B、5C和5D显示的是鸟嘌呤核糖开关-次黄嘌呤复合物的二级 结构和三级结构。图5A左侧显示的是枯草芽孢杆菌的鸟嘌呤核糖开关的 xpt-pbuX鸟嘌呤结合结构域(SEQ ID NO:213)的二级结构。在已知的90% 以上鸟嘌呤核糖开关中保守的核苷酸用红色表示;编号与全长mRNA中的编 号一致。有颜色的区域对应于图6和图7中的结构特征。右侧显示的是次 黄嘌呤结合形式的三级结构。在环与环之间关键的三级相互作用以粗虚线 表示;由水连接的三聚体用带圆圈的“w”表示。图5B显示的是mRNA的5’ 非翻译区内的鸟嘌呤核糖开关的基因抑制(SEQ ID NO:214)。初始的转录 产生结合结构域,该结合结构域在鸟嘌呤的浓度足够高时主要快速地结合 鸟嘌呤(G)。次黄嘌呤(HX,上右)可稳定鸟嘌呤结合结构域特别是P1螺 旋,使mRNA形成终止转录的终止子元件。在不存在配体时(下右)形成抗 终止子促进继续转录。图5C显示的是RNA-次黄嘌呤复合物的三维结构的 带状代表物。红色表示次黄嘌呤配体,其表面用点表示。图5D显示的是复 合物的俯视图,着重显示P2和P3螺旋的紧密堆积。
图6A、6B和6C显示的是鸟嘌呤结合结构域对次黄嘌呤(HX)的识别。 图6A:在三边连接中的次黄嘌呤结合袋的立体视图。图6B:次黄嘌呤和 RNA之间的氢键相互作用(灰色虚线)。(在棍状图中显示的)最终模式与 模拟的退火2Fo-Fc省略图(橙色框)相重叠,在该省略图中显示的原子被 排除在图计算之外。图6C为三种结合袋的分子表面视图比较,左图:鸟嘌 呤核糖开关与次黄嘌呤结合;中图:茶碱结合适体与茶碱结合;右图:大 肠杆菌purR抑制子与次黄嘌呤结合。
图7A、7B和7C显示的是三级结构的稳定化。图7A:形成环-环接触 的核心的两个碱基四聚体中的一个。原子的颜色与图5中一样。图7B: 环-环相互作用的侧视图,着重显示碱基对和四聚体的排布。图7A中显示 的四聚体中A65和U34之间用于定向的以氢键结合的碱基被着上蓝色;另 一四聚体的碱基被着上绿色。A35A64对以及着重表示它与U34的2’羟基之 间相互作用的氢键用黄色显示。顶端的G62U63对用红色表示。
图8A和8B显示的是核糖开关对次黄嘌呤的亲和力的评估。显示了在 30℃,含有10mM K+-HEPES(pH7.5)、100mM KCl和5mM MgCl2的缓冲溶液 中,用次黄嘌呤分别对野生型鸟嘌呤结合结构域(图8A)和无三级相互作 用的鸟嘌呤结合结构域(图8B)进行测量的等温滴定量热曲线。
图9A和9B显示的是可用于高通量筛选的两类核糖开关结合测定的示 意图。图9A:可用的利用自切割核酶的固有作用进行的基于核酶的测定。 X代表被测试的化合物,GlcN6P为葡萄糖胺-6-磷酸。F和Q分别代表荧光 团和淬灭部分(例如TAMRA和CY3)。图9B:可用于非核酶核糖开关例如鸟 嘌呤结合RNA的分子信标测定。标示与图9A中相同。
图10显示的是与鸟嘌呤核糖开关结合的六氨合钴离子。左侧的RNA(灰 色)与图5B中的RNA为相同的视图,结合的次黄嘌呤为红色,Co(NH3)6 3+ 为绿色和蓝色。右侧的RNA是相对于左侧的旋转了180°。
图11显示的是GR-minimal RNA(SEQ ID NO:215)的二级结构。设计 该RNA以检测L2和L3环在配体结合后形成的三级相互作用的效果。在该 构建体中,L2和L3环与P2和P3的一部分一起被切除,代之以极其稳定 的UUCG四元环。
图12A和12B显示的是基于结构设计抗核糖开关化合物。图12A:与 鸟嘌呤类似物次黄嘌呤(HX)结合的鸟嘌呤核糖开关的原子分辨模型。鸟 嘌呤结合可包括由嘌呤环的环外2位氨基和C60和U37的原子之间形成 的两种附加的接触。蓝色阴影表示存在的通道,它可以使得鸟嘌呤环被修 饰。这些通道和它们末端的附近是适体和特异性鸟嘌呤衍生物之间形成新 的接触的机会。图12B:为利用鸟嘌呤核糖开关结构中的通道而合成的代 表性鸟嘌呤类似物(共26种,命名为G-001至G-26)。在这一集合中的大 多数化合物都可以以小于1纳摩尔的解离常数与核糖开关相结合(见图 13)。这些化合物可被进一步修饰,以获得化合物和通道附近的官能团之 间的新接触。
图13显示的是在揭示各种类似物对鸟嘌呤适体的变构调节作用的串 联标记研究中的代表性聚丙烯酰胺凝胶电泳分析。NR、T1和OH分别表示 未反应、经核酸酶T1部分消化和经碱部分消化。串联标记测定进行大约1 天,在J1/2、J2/3和J3/1区域的自发RNA切割条带的模糊(dampening) 是配体结合的标志。这种模糊即使在加入1nM化合物的时候也会出现,表 明解离常数等于或优于1nM。
图14显示的是鸟嘌呤核糖开关体内功能的GFP报告物分析。在无鸟嘌 呤的条件下,全长mRNA被转录并表达GFP。在存在高浓度的鸟嘌呤或活性 鸟嘌呤类似物时,形成转录终止子,抑制GFP的表达。建立了一个类似的 系统,其中用核糖开关控制β-半乳糖苷酶基因。
图15显示的是G-014的时间-杀菌测定。G-014随着时间减少存活的 枯草芽孢杆菌细胞的数量,其杀菌速度与羧苄西林相等。

具体实施方式

通过参考对下文中包括的实施例和具体实施方案的具体描述,以及参 考附图及其上下文的描述,可以更容易地理解所公开的方法和组合物。
某些天然mRNA可作为代谢物敏感性基因开关,其中RNA直接结合小的 有机分子。这种结合过程改变了mRNA的构象,这可通过多种不同的机制而 导致基因表达的改变。(通过使用各种核酸工程策略产生的)这些天然“核 糖开关”的被修饰形式可被用于设计被特异性效应物化合物(在本文中被 称为触发分子)控制的基因开关。天然的开关是抗体和其它小分子治疗剂 的靶标。此外,核糖开关的结构可使得天然开关的实际片段被用于构建新 的非免疫原性基因控制元件,例如,适体(分子识别)结构域可与其它的 非天然适体相交换(或以其他方式修饰),这样新的识别结构域可导致由 使用者定义的效应物化合物引起的基因调节。改变的开关成为治疗方法 的一部分--开启或关闭或调节蛋白质合成。新构建的基因调节网络可 以应用于一些领域,例如活体生物传感器、生物的代谢工程以及基因疗 法的高级形式。
信使RNA通常被认为是遗传信息的被动载体,它可在翻译过程中被蛋 白调节因子或小分子RNA调节因子和核糖体所调节。已发现某些mRNA带有 天然适体结构域,并且特异性代谢物与这些RNA结构域的结合可导致基因 表达的调节。天然核糖开关具有天然RNA通常不具有的两种特殊的功能。 其一,mRNA元件可变为不同的结构状态,其中一种结构可作为其靶标代谢 物的精确的结合袋。其二,由代谢物诱导的在结构状态之间的变构互变可 导致通过几种不同机制之一的基因表达水平的改变。核糖开关通常可被划 分为两个独立的结构域:一个选择性地结合靶标(适体结构域),另一个影 响基因控制(表达平台)。这两个结构域之间的动态相互作用导致对基因表 达的依赖于代谢物的变构控制。
已识别了不同类别的核糖开关,这些不同类别的核糖开关表现出选择 性地识别激活化合物(在本文中被称为触发分子)。例如,辅酶B12、甘氨 酸、硫胺素焦磷酸(TPP)和黄素单核苷酸(FMN)激活存在于基因中的核糖开 关,所述基因编码这些化合物的代谢或转运途径中关键的酶。每一类核糖 开关的适体结构域与高度保守的共有序列和结构相一致。因此,可使用序 列同源性检索来识别相关的核糖开关结构域。已在细菌、太古生物和真核 生物等多种生物中发现了核糖开关结构域。
发现了一类可识别鸟嘌呤而不识别其他大部分嘌呤类似物的核糖开 关。带有鸟嘌呤核糖开关的共有序列和结构特征的代表性RNA位于原核生 物的多种基因的5’非翻译区(UTR),它们控制参与嘌呤补救和生物合成的 蛋白质的表达。在这一系统发生学集合中有三种代表物结合腺嘌呤的表观 解离常数值(表观KD)比结合鸟嘌呤的大几个数量级。这种对腺嘌呤的优 先结合是由于在核糖开关的核心有一个核苷酸的替换,其中每种代表物最 可能是通过形成Watson/Crick碱基对来识别其相应的配体。此外,与枯草 芽孢杆菌的ydhL基因相关的腺嘌呤特异性核糖开关起“开”基因开关的作 用,其中腺嘌呤的结合导致结构性重排,这种重排会防止内部转录终止子 茎结构的形成。鸟嘌呤感受性核糖开关是这样一类RNA基因控制元件,它 们对鸟嘌呤浓度的改变做出应答而调节基因表达。
推测大肠杆菌(Escherichia coli)btuB mRNA的5’非翻译序列在代 谢监控和基因控制方面有积极的作用。该mRNA通过选择性结合辅酶B12, 不需要蛋白质就能起到代谢物敏感性基因开关的作用。该结合事件形成一 种不同的RNA结构,这种RNA结构似乎可抑制核糖体结合和并由此降低钴 胺素转运蛋白BtuB的合成。这一发现结合本文所述的观察结果支持了以下 假设:通过RNA-代谢物相互作用进行的代谢物监控是基因控制中的一种广 泛的机制。
RNA结构探查数据表明硫胺素焦磷酸(TPP)核糖开关是作为其靶标化合 物的变构感受器,其中通过适体结构域与TPP的结合稳定了适体内和相邻 的表达平台内的构象状态,由此阻止了翻译。表达平台的多样性似乎相当 广泛。thiM RNA使用Shine-Dalgarno(SD)-阻断机制来控制翻译。与之不 同,thiC RNA在转录水平和翻译水平上均控制基因表达,因此可能使用了 更复杂一些的表达平台,该表达平台将TPP结合事件转化为转录终止事件 和对完整mRNA的翻译的抑制。
还已知多种其它的核糖开关,它们可一起使用或作为嵌合核糖开关的 一部分与甘氨酸感受性核糖开关及其元件一起使用。这类核糖开关的实例 以及它们的使用描述于美国专利申请公布No.2005-0053951中,该文献的 全部内容特别是其中关于具体核糖开关的结构和操作的描述以援引的方式 纳入本文。
A.核糖开关RNA的一般性结构
细菌核糖开关RNA是主要位于特定mRNA主编码区域的5’非翻译区 (5’-UTR)的基因控制元件。结构性探查研究(下文将详述)发现核糖开 关元件通常包括两个结构域:作为配体结合结构域的天然适体(T.Hermann, D.J.Patel,Science 2000,287,820;L.Gold,et al.,Annua1 Review of Biochemistry 1995,64,763)和与参与基因表达的RNA元件相接的“表 达平台”(例如Shine-Dalgarno(SD)元件;转录终止茎)。上述结论是基于 下述观察结果:体外合成的适体结构域在不存在表达平台的条件下与合适 的配体相结合(见美国专利申请公布No.2005-0053951的实施例2、3和6)。 此外,结构性探查研究表明,在独立检测的时候大多数核糖开关的适体结 构域采用一种特定的二级和三级结构折叠,这基本上与存在完整的5’前导 RNA时检测到的适体结构相同。这表明在许多情况下,适体结构域作为与 表达平台互相独立折叠的一个模单元(见美国专利申请公布 No.2005-0053951的实施例2、3和6)。
适体结构域的配体结合状态或未结合状态最终通过表达平台来解释, 表达平台可以对基因表达产生影响。核糖开关作为一个模块元件的观点被 以下事实进一步支持:适体结构域在各种生物之间是高度保守的(例如TPP 核糖开关甚至在不同生物界之间都是保守的)(N.Sudarsan,et al.,RNA 2003,9,644),而表达平台在序列、结构和控制附带可译框架的表达的机 制方面都有所变化。例如,配体结合到枯草芽孢杆菌tenA mRNA的TPP核 糖开关上可导致转录终止(A.S.Mironov,et al.,cell 2002,111,747)。 这种表达平台与大肠杆菌thiM mRNA的TPP核糖开关的表达平台在序列和 结构上均不同,大肠杆菌thiM mRNA的TPP核糖开关与TPP结合时会通过 SD阻断机制导致对翻译的抑制(见美国专利申请公布No.2005-0053951的 实施例2)。这两种转录单位的TPP适体结构域很容易被识别,并且具有几 乎相同的功能特征,但是基因控制机制和实现该机制的表达平台则相当不 同。
核糖开关RNA的适体结构域通常长度为~70至170个核苷酸(美国专 利申请公布No.2005-0053951的附图11)。这一结果有些出人意料,因为 体外进化试验识别了多种结合小分子的适体,它们的长度相当短,并且结 构也不复杂(T.Hermann,D.J.Patel,Science 2000,287,820;L.Gold, et al.,Annual Review of Biochemistry 1995,64,763;M.Famulok, Current Opinion in Structural Biology 1999,9,324)。虽然天然适体 序列相对于人工适体在复杂性和信息含量上的显著增加的原因还需要进一 步的研究,但是相信这种复杂性是形成具有高亲和力和高选择性功能的RNA 报告物所需要的。配体-核糖开关复合物的表观KD值从几纳摩尔至几微摩 尔不等。还值得注意的是,当一些适体结构域与附带的表达平台相分离时, 表现出比完整核糖开关更高的(~10至100倍)对靶配体的亲和力(见美 国专利申请公布No.2005-0053951的实施例2)。可以推测,由完整的核糖 开关RNA对多种不同的RNA构象进行采样时需要消耗能量,这一点通过配 体亲和力的损失而反映出来。由于适体结构域必须作为分子开关,这可能 提高了天然适体的功能性要求,这一点可能也有助于解释它们为什么有更 复杂的结构。
B.细菌中的转录终止的核糖开关调节
细菌主要使用两种方法来终止转录。某些基因含有依赖于Rho蛋白的 终止信号(J.P.Richardson,Biochimica et Biophysica Acta 2002,1577, 251)。而另一些基因使用不依赖于Rho的终止子(内在终止子)来破坏转 录延伸复合物(I.Gusarov,E.Nudler,Molecular cell 1999,3,495;E. Nudler,M.E.Gottesman,Genes to cells 2002,7,755)。后者的RNA 元件包括富含GC的茎环结构以及与之相连的6-9个尿苷酸残基。内在终止 子在细菌基因组中广泛存在(F.Lillo,et al.,2002,18,971),通常位 于基因或操纵子的3’端。值得注意的是,已观察到有许多内在终止子位于 5’UTR的实例。
在细菌使用的多种基因调节策略中,RNA聚合酶对5’UTR中的终止信 号以调节方式应答的这类实例越来越多(T.M.Henkin,Current Opinion in Microbiology 2000,3,149)。在某种条件下,RNA聚合酶复合物在外 部信号的驱使下对终止信号做出应答或不做应答。虽然转录的启动可能不 需要调节,但是对mRNA合成(和基因表达)的控制最终要由内在终止子来 指导。据推测,至少两种互不相容的mRNA构象中的一种会导致引发转录终 止的RNA结构的形成或破坏。通常需要一种反式作用因子来接收细胞内的 特定信号并随后稳定RNA的构象之一,在有些情况下反式作用因子为RNA(F. J.Grundy,et al.Proceedings of the National Academy of Sciences of the United States of America 2002,99,11121;T.M.Henkin,C. Yanofsky,Bioessays 2002,24,700),在另一些情况下为蛋白质(J. Stulke,Archives of Microbiology 2002,177,433)。核糖开关在RNA 结构调节以及被基因控制系统解析的代谢物信号之间提供了一种直接的联 系。下面对来自枯草芽孢杆菌的mRNA的FMN核糖开关进行简单的描述以 阐明这种机制。
由对鸟嘌呤具有高亲和力和高选择性的核糖开关控制xpt-pbuX操纵 子(Christiansen,L.C.,et al.,1997,J.Bacteriol.179,2540-2550)。 这类核糖开关存在于枯草芽孢杆菌中的五种转录单位(包括12-基因pur 操纵子)的5’非翻译区(5’-UTR)中。mRNA与鸟嘌呤的直接结合是某些细 菌的嘌呤代谢作用中维持代谢平衡的一个关键性决定因素。此外,所发现 的这几类对七种不同靶分子应答的核糖开关,至少控制着在枯草芽孢杆菌 的中心代谢途径中十分重要的68个基因。
还公开了已在枯草芽孢杆菌中识别出的鸟嘌呤核糖开关。已经阐明了 与次黄嘌呤相结合的来自枯草芽孢杆菌xpt-pbuX操纵子的鸟嘌呤核糖开 关嘌呤结合结构域在1.95_分辨率晶体结构,其中次黄嘌呤是细菌嘌呤 补救途径中普遍的代谢物。这一结构显示,几个系统发生上保守的核苷酸 参与了复杂的RNA折叠而形成一个结合袋,该结合袋几乎完全包裹了配体。 次黄嘌呤起到稳定这一结构和促进下游转录终止元件形成的作用,由此提 供了对细胞内代谢物浓度升高做出应答而直接抑制基因表达的机制。
某些参与硫胺素生物合成的mRNA不需要蛋白质因子参与就可以结合 硫胺素(维生素B1)或其生物活性的焦磷酸衍生物(TPP)。mRNA-效应物复 合物采用可隔离核糖体结合位点的不同结构,导致基因表达的减少。这种 代谢物感受性mRNA系统提供了基因“核糖开关”(在本文中被称为核糖开 关)的实例,它在进化上的起源可能在蛋白质之前。已经发现大肠杆菌btuB 基因的mRNA前导序列可以选择性地结合辅酶B12,而且这种结合事件导致 对基因控制十分重要的RNA的结构改变(见美国专利申请公布 No.2005-0053951的实施例1)。还发现编码硫胺素生物合成蛋白质的mRNA 也使用了核糖开关机制(见美国专利申请公布No.2005-0053951的实施例 2)。
在细菌中发现了一类被甘氨酸选择性触发的核糖开关。来自枯草芽孢 杆菌的这类甘氨酸感受性RNA的一个代表物对于gcvT操纵子具有罕见的打 开基因的开关作用,gcvT操纵子编码甘氨酸切割系统中的蛋白质。大多数 甘氨酸核糖开关整合了两个配体结合结构域,它们共同作用以便更接近于 双状态的基因开关。进化出这种高级形式的核糖开关可能是为了保证过量 的甘氨酸被有效利用,从而为三羧酸循环提供碳源并保持足够量的氨基酸 用于蛋白质合成。因此,核糖开关执行了重要的调节功能并具有复杂的表 现特征,这些性质以前都只能在蛋白质因子中观察到。
虽然本文公开的特异性天然核糖开关是首次公开的mRNA元件通过结 合代谢物控制基因表达的实例,但是应该料到这一基因控制策略在生物界 中是广泛存在的。已经证明TPP、辅酶B12和FMN在RNA世界中是作为生物 辅助因子出现的(White III,Coenzymes as fossils of an earlier metabolic state.J.MoL Evol.7,101-104(1976);White III,In:The Pyridine nucleutide Coenzymes.Acad.Press,NY pp.1-17(1982); Benner et al.,Modern metabolism as a palimpsest of the RNA world. Proc.Natl.Acad.Sci USA 86,7054-7058(1989))(Joyce,The antiquity of RNA-based evolution.Nature 418,214-221(2002))。如果这些代谢 物的生物合成和使用是在蛋白质出现之前,那么某些核糖开关可能是最古 老的基因控制形式的现代实例。基因组序列数据库的检索显示,对应于TPP 适体的序列广泛存在于细菌、太古生物和原核生物的生物中,而且不同物 种间的相应序列并没有太大的变化。虽然随着进化过程似乎出现了新的结 合代谢物的mRNA,但是已知的核糖开关很可能是RNA世界中的分子化石。
应当理解的是,除非特别指明,所公开的方法和组合物并不限于具体 的合成方法、具体的分析技术或特定的试剂,同样可以有所改变。还应理解 的是,本文中使用的术语学仅是出于描述具体实施方案的目的,而并不意 在限制。
物质
公开了可用于所公开方法和组合物的、可与所公开方法和组合物一起 使用的、可用于制备所公开组合物的和作为所公开方法和组合物的产品的 物质、组合物和组分。在本文中公开了这些物质和其他物质,应当理解的 是,在公开这些物质的组合、子集、相互作用和群组等的时候,尽管关于 这些化合物的每种不同的个体和集体的组合和排列可能并未明确地公开, 但每种都在此被特别地考虑和描述。例如,如果公开和讨论了一种具体的 核糖开关或适体结构域,并且讨论了可以制备许多包括核糖开关或适体结 构域在内的分子的许多修饰物,则除非另外特别指明,可能的核糖开关或 适体结构域以及修饰物的每种和各种组合和排列均得到特别地考虑。因此, 如果公开了一类分子A、B和C,并且还公开了一类分子D、E和F以及组 合分子A-D的实例,则即使没有每个逐一列举,每个也单独和共同得到考 虑。因此,在这个实例中,A-E,A-F,B-D,B-E,B-F,C-D,C-E以及C-F的每 个组合也被特别地予以考虑,并且认为上述每一个组合也因为A、B和C; D、E和F;以及组合分子A-D的公开而被公开。同样,这些分子的任何子 集或组合也被特别地予以考虑和公开。因此,例如,A-E,B-F和C-E的子 群也因为A、B和C;D、E和F;以及组合分子A-D的公开而被公开。将这 一概念适用于本申请的所有方面,包括但不限于制备和应用公开组合物的 方法中的步骤。因此,如果有多个其他步骤可以实施,应当理解的是,所 述其他步骤的每一步都可以以所公开方法的任何具体实施方案或实施方案 的组合来实施,并且每种这样的组合都被特别地予以考虑和公开。
A.核糖开关
核糖开关为表达控制元件,它是待表达的RNA分子的一部分,并且在 与触发分子结合时改变状态。核糖开关通常可被划分为两个独立的结构域: 一个选择性地结合靶标(适体结构域),另一个影响基因控制(表达平台结 构域)。这两个结构域之间的动力学相互作用导致了对基因表达的依赖代谢 物的变构控制。公开了分离的和重组的核糖开关;含有这类核糖开关的重 组构建体;与这类核糖开关可操作地连接的异源序列;以及含有这类核糖 开关、核糖开关重组构建体和与异源序列可操作地连接的核糖开关的细胞 和转基因生物。异源序列可以是:例如编码目的蛋白或肽包括报告蛋白或 肽的序列。优选的核糖开关为天然存在的核糖开关或由天然存在的核糖开 关产生。
所公开的核糖开关,包括它们的衍生物和重组形式,通常可以来自任 何来源,包括天然存在的核糖开关和从头设计的核糖开关。任何这类的核 糖开关都可被用于公开的方法或与公开的方法一起使用。然而,可能识别 出不同类型的核糖开关,某些这样的亚类可能适用于特定的方法或与特定 的方法一起使用(通常如本文中其他部分所述)。核糖开关的类型包括例如: 天然存在的核糖开关、天然存在的核糖开关的衍生物和经修饰的形式、嵌 合核糖开关和重组核糖开关。天然存在的核糖开关是这样一种核糖开关, 它具有自然界中存在的核糖开关的序列。这类天然存在的核糖开关可以是 自然界中存在的天然存在的核糖开关的分离形式或重组形式。也就是说, 该核糖开关还具有相同的一级结构,但是已在新的基因背景或核酸背景中 被分离或被基因工程改造。嵌合核糖开关可由例如下列的部分构成:任意 或特定类别或类型的核糖开关的一部分和相同或任意不同类别或类型的核 糖开关中的不同核糖开关的一部分;任意或特定类别或类型的核糖开关的 一部分和非核糖开关序列或元件。重组核糖开关是在新的基因背景或核酸 背景中被分离或被基因工程改造的核糖开关。
核糖开关可有一个或多个适体结构域。具有多个适体结构域的核糖开 关中的各适体结构域可以表现出对触发分子的协同结合,或可以不表现出 对触发分子的协同结合(也就是说适体不必要表现出协同结合)。在后一种 情况中,适体结构域可被称为独立结合物。含有多个适体的核糖开关可含 有一个或多个表达平台结构域。例如,含有两个协同结合其触发分子的适 体结构域的核糖开关可以与被两个适体结构域调节的一个表达平台结构域 相连接。含有多个适体的核糖开关可含有一个或多个以接头相连的适体。 当适体对触发分子表现出协同结合时,接头可为协同式接头。
对于进行协同结合分析的适体结构域而言,如果适体结构域的数目(或 者适体结构域上的结合位点的数目)为x,而它们的希尔系数n在x和x-1 之间,那么就称这些适体结构域有协同结合。因此,例如,具有两个适体 结构域的核糖开关(例如甘氨酸应答性核糖开关)如果其希尔系数在2和 1之间,则称它具有协同结合。应当理解的是,所用的x值对应的是参与 协同结合分析的适体结构域的数目,而不一定是核糖开关中存在的适体结 构域的数目。这一点是有一定意义的,因为一个核糖开关可能含有多个适 体结构域,但只有其中几个具有协同结合性质。
不同类别的核糖开关指的是(预计、测得或二者结合的)具有相同或 相似的触发分子的核糖开关或具有相同或相似的总体结构的核糖开关。同 一类别的核糖开关通常但不必需具有相同或相似的触发分子以及相同或相 似的总体结构。核糖开关的类别包括:甘氨酸应答性核糖开关、鸟嘌呤应 答性核糖开关、腺嘌呤应答性核糖开关、赖氨酸应答性核糖开关、硫胺素 焦磷酸应答性核糖开关,腺苷钴胺素应答性核糖开关、黄素单核苷酸应答 性核糖开关和S-腺苷蛋氨酸应答性核糖开关。
还公开了含有异源的适体结构域和表达平台结构域的嵌合核糖开 关。也就是说,嵌合核糖开关有来自一种来源的适体结构域和来自另一 种来源的表达平台结构域。异源来源可来自例如不同特异性的核糖开关、 不同类型的核糖开关或不同类别的核糖开关。异源适体也可来自非核糖 开关适体。异源表达平台结构域也可来自非核糖开关来源。
核糖开关可以由其他已知的、开发出的或天然存在的核糖开关经修饰 而得到。例如,开关结构域部分可进行如下修饰:改变一个或多个核苷酸, 但是还保持该核糖开关已知或预计的二级结构、三级结构或二级和三级结 构。例如,一个碱基对中的两个核苷酸可被变为仍可配对的核苷酸。使得 碱基仍保持配对的改变在本文中被称为碱基对保守性改变。
可以使用体外的筛选和进化技术产生经修饰的或衍生的核糖开关。通 常,应用于核糖开关的体外进化技术包括产生一系列的变异体核糖开关, 其中所述核糖开关序列的一个或多个部分有所改变而核糖开关的其他部分 保持不变。然后可评估这一系列变异体核糖开关的激活、失活或阻断(或 其他的功能性或结构性标准),符合所用标准的那些变异体核糖开关就被选 择出来备用或用于下一轮进化。可用于产生变异体的基础核糖开关是本文 公开的那些特异性和一致性的核糖开关。可使用一致性核糖开关来获知核 糖开关的哪些部分在体外筛选和进化中有所变化。
还公开了调节作用发生改变的经修饰的核糖开关。可以通过将一个适 体结构域和核糖开关的表达平台结构域可操作地连接(这就是嵌合核糖开 关),来改变该核糖开关的调节作用。适体结构域可以通过例如适体结构域 的触发分子的作用来介导核糖开关的调节作用。可用任何合适的方式来将 适体结构域和核糖开关的表达平台结构域可操作地连接,所述方式包括, 例如用新的适体结构域代替核糖开关的正常的或天然的适体结构域。通常, 可以激活、失活或阻断适体结构域所来源的核糖开关的任何化合物或条件 都可以用来激活、失活或阻断嵌合核糖开关。
还公开了灭活的核糖开关。核糖开关可通过共价改变核糖开关的方式 来灭活(通过例如使核糖开关的某部分交联或将化合物偶联至核糖开关)。 可通过以下方法导致核糖开关的这种方式的灭活:例如,阻止触发分子与 核糖开关结合的改变,阻止核糖开关与触发分子结合后状态改变的改变, 或在核糖开关与触发分子结合后阻止其表达平台结构域影响表达的改变。
还公开了生物传感器核糖开关。生物传感器核糖开关是经过基因工程 改造的核糖开关,它们在存在它们的同种触发分子时产生可检出的信号。 可用的生物传感器核糖开关可以在触发分子达到或超过阈值水平时被触 发。生物传感器核糖开关可被设计为体内应用或体外应用。例如,报告RNA 编码作为信号的蛋白质或参与产生信号的蛋白质,与该报告RNA可操作地 连接的生物传感器核糖开关可在体内被用于通过基因工程改造细胞或生 物,使其含有编码核糖开关/报告RNA的核酸构建体。用于体外的生物传感 器核糖开关的一个实例是包括构象依赖性标签的核糖开关,由该标签产生 的信号随核糖开关的激活状态而变化。优选地,这种生物传感器核糖开关 使用天然存在的核糖开关的适体结构域或由天然存在的核糖开关衍生的适 体结构域。生物传感器核糖开关可用于各种环境和平台中。例如,生物传 感器核糖开关与例如平板、芯片、条带和孔的固体载体一起使用。
还公开了识别新的触发分子的经修饰的或衍生的核糖开关。识别新的 触发分子的新核糖开关和/或新适体可以从已知核糖开关中选择、从已知核 糖开关开始设计或来源于已知核糖开关。这可通过下述步骤实现:例如, 产生核糖开关中的一系列适体变异体;在存在目的化合物的条件下评估变 异体核糖开关的激活;筛选被激活的变异体核糖开关(或者例如筛选激活 度最高或激活选择性最强的核糖开关)和重复上述步骤,直至得到具有所 需活性、特异性、活性和特异性的结合或其他性质的结合的变异体核糖开 关。
特别有用的的适体结构域可形成本文中称为P1茎结构(或简称P1) 的茎结构。美国专利申请公布No.2005-0053951的附图11中显示了多种 核糖开关的P1茎结构。P1茎结构中的杂交链被称为适体链(也被称为P1a 链)和控制链(也被称为P1b链)。控制链可以与适体链和所连接的表达平 台的序列形成一种茎结构,所连接的表达平台被称为调节链(也被称为P1c 链)。因此,控制链(P1b)可以与适体链(P1a)和调节链(P1c)形成可 互变的茎结构。核糖开关的激活和失活会导致一种茎结构转变为另一种(由 P1a/P1b变为P1b/P1c或与此相反)。P1b/P1c茎结构的形成影响含有核糖 开关的RNA分子的表达。通过这种机制起作用的核糖开关在本文中被称为 互变茎结构核糖开关(或称为互变茎核糖开关)。一些具有两个适体的甘氨 酸应答性核糖开关使用第二适体中的P1茎来利用上述机制。
通常,通过设计或调整表达平台结构域中的调节链,使其与适体结构 域中的控制链互补,可以使任何适体结构域适用于任何表达平台结构域。 或者,可以调整适体结构域中的适体和控制链的序列,使得控制链与表达 平台中有功能意义的序列互补。例如,可调整控制链使其与RNA中的 Shine-Dalgarno序列互补,以使得在控制链和SD序列之间形成茎结构后 核糖体难以接近SD序列,由此减弱或阻止翻译的启动。注意适体链在序列 上也应有相应的改变,以使得可以在适体结构域中形成P1茎。对于含有表 现出协同结合的多个适体的核糖开关的情况,需要设计激活的适体(与表 达平台结构域相互作用的适体)中的一个P1茎,使其与SD序列形成茎结 构。
作为另一个实例,可以在RNA分子上加上一个转录终止子(最方便的 是在RNA的非翻译区加入),使得转录终止子序列的部分与适体结构域的控 制链互补(该序列可为调节链)。这可使得适体结构域的控制序列与适体链 和调节链形成可互变的茎结构,由此可在核糖开关激活或失活后形成或破 坏转录终止子。通过对互变茎结构的类似设计方法可以将任意其它表达元 件置于核糖开关的控制之下。
对于由核糖开关控制的转录终止子而言,转录的速度以及核糖开关和 表达平台元件的间隔对于合适的控制会十分重要。转录速度可通过下述方 式调整:例如包含聚合酶停止元件(例如一系列尿嘧啶残基)以停止转录 并使得核糖开关形成和感受触发分子。例如对于FMN核糖开关而言,如果 FMN结合到它的适体结构域上,则抗终止子序列就被隔离而不可能形成抗 终止子结构(美国专利申请公布No.2005-0053951的附图12)。然而,如 果没有FMN,一旦由聚合酶形成抗终止子的核苷酸,就能形成抗终止子。 然后RNAP会脱离停止位点,并仅到达另一个U延伸区而再次停止。这样仅 仅当抗终止子不再阻碍终止子核苷酸时才形成转录终止子。
公开了可调节的基因表达构建体,包括编码RNA的核酸分子,所述RNA 包括与编码区可操作地连接的核糖开关,其中所述核糖开关调节RNA的表 达,其中所述核糖开关和编码区域为异源的。核糖开关可包括适体结构域 和表达平台结构域,其中所述适体结构域和表达平台结构域为异源的。核 糖开关可包括一个适体结构域和一个表达平台结构域,其中所述适体结构 域包括P1茎,其中所述P1茎包括适体链和控制链,其中所述表达平台结 构域包括调节链,其中所述调节链、所述控制链或此二者均被设计为能形 成茎结构。核糖开关可包括两个或两个以上的适体结构域和一个表达平台 结构域,其中至少一个适体结构域和所述表达平台结构域为异源的。核糖 开关可包括两个或两个以上的适体结构域和一个表达平台结构域,其中至 少一个适体结构域包括P1茎,其中所述P1茎包括适体链和控制链,其中 所述表达平台结构域包括调节链,其中所述调节链、所述控制链或此二者 均被设计为能形成茎结构。
公开了核糖开关,其中所述核糖开关为天然存在的核糖开关的非天然 衍生物。核糖开关可包括一个适体结构域和一个表达平台结构域,其中所 述适体结构域和表达平台结构域为异源的。核糖开关可来源于天然存在的 鸟嘌呤应答性核糖开关、腺嘌呤应答性核糖开关、赖氨酸应答性核糖开关、 硫胺素焦磷酸应答性核糖开关、腺苷钴胺素应答性核糖开关、黄素单核苷 酸应答性核糖开关、甘氨酸应答性核糖开关或S腺苷蛋氨酸应答性核糖开 关。核糖开关可被触发分子激活,其中所述核糖开关在被触发分子激活时 产生传号。
表5公开了各种鸟嘌呤核糖开关的实例。表5中的序列比对为 Stockholm格式,它是由INFERNAL软件包的cmalign程序输出的。表5中 的最后两项反映了由计算机算法所计算出的基序的共有序列和结构,所述 计算机算法是Eddy,S.R.(2003)所述的INFERNAL 0.55版本,由算法的 作者华盛顿大学医学院遗传系(Dept.of Genetics,Washington University School of Medicine.St.Louis,Missouri)赠送。美国专 利申请公布No.2005-0053951的附图41描述了共有核糖开关序列、天然 核糖开关序列和核糖开关序列比对。与腺嘌呤核糖开关RNA结合的各种核 碱基的热力学参数示于表7。与鸟嘌呤核糖开关RNA结合的各种核碱基的 热力学参数示于表8。
在本文中描述和提到了多种核糖开关和核糖开关构建体。特别考虑了 可能被本发明公开内容的一些方面排除的任何特异性核糖开关或核糖开关 构建体,或核糖开关或核糖开关构建体的群组。例如,xpt-pbuX核糖开关 与报告基因的融合体可能被与报告基因融合的核糖开关的系列所排除。作 为另一个实例,表5中所列的核糖开关的任意组合可能被公开的方法和组 合物的任意方面特别地包括或特别地排除。
1.适体结构域
适体为可选择性结合特定化合物和化合物类别的核酸区段和结构。核 糖开关具有适体结构域,该适体结构域在与触发分子结合后导致核糖开关 状态或结构的改变。在功能性核糖开关中,当触发分子结合至适体结构域 时,与适体结构域相连的表达平台结构域的状态或结构发生改变。核糖开 关的适体结构域可有任何来源衍生,所述来源包括例如:核糖开关的天然 适体结构域,人工适体,基因工程改造的、选择的、进化的或衍生的适体 或适体结构域。核糖开关中的适体通常具有至少一个可以所连接的表达平 台结构域的部分相互作用的部分,所述相互作用是通过例如形成茎结构。 这种茎结构可能在结合触发分子后形成或被破坏。
美国专利申请公布No.2005-0053951的附图11和本文其他部分中描 述了多种天然核糖开关的共有适体结构域。这些适体结构域(包括由此包 含的所有直接变异体)可被用于核糖开关中。共有序列和结构表明了序列 和结构中的可变形式。这些可变形式中包括的适体结构域在本文中被称为 直接变异体。可以修饰这些适体结构域以产生经修饰的或变异的适体结构 域。保守性修饰包括碱基对核苷酸中的任何修饰,只要每一对中的核苷酸 仍然互补即可。中度修饰包括对茎或环长度(对于已给出茎或环的长度或 长度范围)所作的小于或等于所给出长度范围的20%的改变。当共有结构 显示了特定长度的茎或环时或者当列出或说明了长度范围时,就认为“给 出了”环和茎的长度。中度修饰包括对茎或环长度(对于已给出茎或环的 长度或长度范围)所作的小于或等于所给出长度范围的40%的改变。中度 修饰还包括适体结构域的未指明部分的功能性变异体。在美国专利申请公 布No.2005-0053951的附图11中用实线标出了适体结构域的未指明部分。
在和表达平台和RNA分子一起使用的改变的适体结构域中,P1茎和它 的组成链可被修饰。这类修饰广泛存在,在本文中被称为P1修饰。P1修 饰包括对适体结构域的P1茎的序列和/或长度所作的改变。
美国专利申请公布No.2005-0053951的附图11中显示的适体结构域 (包括任意的直接变异体),在通过体外筛选或体外进化技术生产衍生适体 结构域时可以特别有用地作为初始序列。
所公开的核糖开关的适体结构域也可用于其他目的,以及在任何其他 背景中用作适体。例如,当结构的改变可影响RNA的功能时,可使用适体 来控制核酶、其他分子开关和任意RNA分子。
2.表达平台结构域
表达平台结构域是核糖开关的一部分,它可以影响含有该核糖开关的 RNA分子的表达。表达平台结构域通常具有至少一个可以所连接的适体结 构域的部分相互作用的部分,所述相互作用是通过例如形成茎结构。这种 茎结构可能在结合触发分子后形成或被破坏。茎结构通常为表达调节性结 构或者阻止表达调节性结构的形成。表达调节性结构为这样一种结构,它 可以允许、阻止、增强或抑制含有该结构的RNA分子的表达。实例包括 Shine-Dalgarno序列、启动密码子、转录终止子和稳定性信号和加工信号。
B.触发分子
触发分子是可以激活核糖开关的分子和化合物。这包括核糖开关的天 然的或正常的触发分子和可以激活核糖开关的其他化合物。天然或正常的 触发分子是对于给定的天然核糖开关的触发分子,或者对于一些非天然核 糖开关而言,天然或正常的触发分子是指该核糖开关在设计时或筛选时所 针对的触发分子(设计和筛选例如体外筛选或体外进化技术)。
C.化合物
还公开了能够激活、失活或阻断核糖开关的化合物以及包括这类化合 物的组合物。核糖开关通过结合或移去触发分子而发挥控制基因表达的功 能。化合物可被用于激活、失活或阻断核糖开关。核糖开关的触发分子(以 及其它激活性化合物)可被用于激活核糖开关。通常可使用触发分子以外 的化合物来失活或阻断核糖开关。核糖开关也可以通过例如从核糖开关所 在处移去触发分子而被失活。核糖开关可通过例如结合不激活核糖开关的 触发分子的类似物而被阻断。
还公开了用于改变RNA分子表达或改变编码RNA分子的基因表达的 化合物,其中所述RNA分子包括核糖开关。这可通过使化合物与RNA分 子相接触而实现。核糖开关通过结合或移除触发分子而实现控制基因表 达的功能。因此,将包括核糖开关的目的RNA分子置于可激活、失活或 阻断核糖开关的条件下就可用来改变RNA的表达。例如转录终止或核糖 体与RNA的结合被阻断可以导致表达被改变。根据核糖开关的性质,与 触发分子的结合可以减少或阻止RNA分子的表达或者促进或增加RNA分 子的表达。
还公开了用于调节RNA分子表达或调节编码RNA分子的基因表达的 化合物。还公开了通过激活、失活或阻断核糖开关,来调节含有核糖开关 的天然存在的基因或RNA的表达的化合物。如果该基因对含有该基因的细 胞或生物的存活而言十分重要,那么激活、失活或阻断该核糖开关可导致 细胞或生物的死亡、停滞或虚弱。
还公开了通过激活、失活或阻断核糖开关,来调节含有核糖开关的分 离的、基因工程改造的或重组的基因或RNA的表达的化合物。如果基因编 码一种所需的表达产物,则激活或失活该核糖开关可被用于诱导该基因的 表达,并由此导致表达产物的产生。如果该基因编码对于基因表达或另一 细胞过程的一种诱导物或抑制物,则激活、失活或阻断该核糖开关可导致 其他被调节基因或细胞过程的诱导、抑制或脱抑制。已经已知多种这样的 次级调节效应,它们也可适用于核糖开关。核糖开关作为这类调节的初级 控制的一个优势是核糖开关的触发分子可为小的非抗原性分子。
还公开了识别可激活、失活或阻断核糖开关的化合物的方法。例如,可 以通过使待测化合物和核糖开关相接触并评估核糖开关的激活来识别可激 活核糖开关的化合物。如果核糖开关被激活,则待测化合物被识别为可激活 核糖开关的化合物。可以以任意合适的方式评估核糖开关的激活。例如,核 糖开关可以与报告RNA相连接,并可在存在和不存在待测化合物的条件下 测量报告RNA的表达、表达水平或表达水平的改变。作为另一个实例,核 糖开关可包括构象依赖性标签,由该标签产生的信号随核糖开关的激活状 态而变化。优选地,这种核糖开关使用天然存在的核糖开关的适体结构域 或由天然存在的核糖开关衍生的适体结构域。由此可见,可以使用对照测 定或测量或者不使用对照测定或测量来进行核糖开关激活的评估。识别可 以失活核糖开关的化合物的方法可以以类似的方式进行。
对阻断核糖开关的化合物的识别可以以任何合适的方式完成。例如, 可以在存在已知可激活或失活核糖开关的化合物以及存在待测化合物的条 件下来进行用于评估核糖开关的激活或失活的分析。如果没有观察到如同 在不存在待测化合物的情况下应当观察到的激活或失活情况,则该待测化 合物被识别为可阻断核糖开关的激活或失活的化合物。
还可以使用核糖开关的原子晶体结构来识别化合物。天然鸟嘌呤应答 性核糖开关的这类晶体原子结构的一个实例示于图5。原子结构的原子坐 标列于表6。图5中显示的核糖开关是与次黄嘌呤结合的。在这个实例中 显示了与次黄嘌呤相结合的来自枯草芽孢杆菌xpt-pbuX操纵子的鸟嘌呤 核糖开关嘌呤结合结构域在1.95_分辨率的晶体结构,次黄嘌呤是细菌嘌 呤补救途径中普遍的代谢物。这一结构显示,几个系统发生上保守的核苷 酸参与了复合物RNA的折叠而形成一个结合袋,该结合袋几乎完全包裹了 配体。次黄嘌呤起到稳定这一结构和促进下游转录终止元件形成的作用, 由此提供了对细胞内代谢物浓度升高做出应答而直接抑制基因表达的机 制。
可以使用核糖开关的晶体结构来识别化合物,这可通过例如利用待测 化合物和核糖开关的原子结构进行建模并确定待测化合物与核糖开关是 否相互作用来实现。这可通过使用核糖开关模型中待测化合物的预计最 小相互作用能、预计结合常数、预计解离常数或它们的组合来实现。还 可以通过下述方法识别化合物,例如,评估核糖开关和一种已知可与核糖 开关结合的化合物(例如触发分子)的匹配程度,识别化合物上可以改变 而不会对化合物的结合带来较大或明显不良影响的位点,以及引入这样的 一个或多个改变以产生新的化合物。识别与核糖开关相互作用的化合物的 方法可以包括像这样识别出的化合物的生产。
通常,该方法首先利用了核糖开关与化合物的三维结构,这也被称为 “已知化合物”或“已知靶标”。本文公开的任何触发分子和化合物均可被 用作这种已知化合物。核糖开关的结构可使用任何已知方式测定,例如晶 体学或溶液NMR光谱学。可通过例如AutoDock的计算机分子模型模拟程序 来获得上述的结构。该方法可包括测定结合量,例如测定核糖开关和针对 该核糖开关的潜在化合物之间的结合能。对核糖开关具有某些活性的化合 物为活性化合物,例如可抑制核糖开关的活性或增强核糖开关的活性的化 合物。此外,潜在化合物可以是与针对该分子的化合物在结构上有一定关 系的类似物。任何触发分子、已知化合物和本文公开的化合物均可用作潜 在化合物的基础或者衍生潜在化合物的基础。
可通过多种方式来认识已知化合物和潜在化合物在结构、性质、相互 作用或结合参数等方面的同一性或关系。例如,可使用结构模型测量或评 估的任何量度和相互作用参数以及对于已知化合物和潜在化合物获得的这 类量度和参数之间都可以进行比较。可以观察总体上已知化合物和潜在化 合物之间的同一性。也可以观察潜在化合物例如类似物和已知化合物之间 仅在潜在化合物与核糖开关相互作用的结构域位置的同一性。还可以观察 潜在化合物和已知化合物之间亚结构域水平的同一性,例如仅在7_、6_、 5_、4_、3_或2_范围内观察核糖开关与已知化合物接触的原子或部分以 及相应的潜在化合物的原子或部分。通常,亚结构域越具体,潜在化合物 和已知化合物的部分之间的同一性就越高。例如,在总体上,已知化合物 和潜在化合物之间的同一性可能为30%或更高、35%或更高、40%或更高、 45%或更高、50%或更高、55%或更高、60%或更高、65%或更高、70%或更高、 75%或更高、80%或更高、85%或更高、90%或更高、95%或更高;在已知化合 物和潜在化合物的结合结构域之间的同一性可能为50%或更高、55%或更高、 60%或更高、65%或更高、70%或更高、75%或更高、80%或更高、85%或更高、 90%或更高、95%或更高;而在已知化合物和潜在化合物的相应的与核糖开 关相互作用的原子或部分的周围5_范围以内,它们的同一性可为70%或更 高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高。另一亚 结构域是真正与核糖开关接触的部分或原子的亚结构域。在这种情况下, 同一性可为例如大于50%、55%、60%、65%、70%、75%、80%、85%、90%、 95%或更高。
通常,潜在化合物是以潜在化合物家族即一系列类似物的形式存在, 该家族中所有的化合物都与该核糖开关的已知化合物在结构上有一定关 系。可能筛选出由任何数量的成员组成的家族。家族中成员的最大数量仅 仅由计算机的数量所限制,所述计算机要具有在所需的一定时间内能筛选 出每个成员的能力。该方法可包括核糖开关的至少一种模板结构和一种靶 标,通常靶标应为已知靶标。由于在一些情况下上述结构可以由本文公开 的方法使用标准的结构测定技术产生,因此并不需要目前存在该结构。优 选地,在使用该方法时存在真实的结构。
该方法还可以包括使用由已知化合物的结构得到的信息来对潜在化合 物的结构建模。所述建模可以用本文所述的方法和任何方法进行。
潜在化合物的构象和位置可以在计算过程中保持固定;也就是说可以 假定核糖开关与潜在化合物结合的方向和它与已知化合物结合的方向完全 一样。
然后可以测定核糖开关与潜在化合物之间的结合能(或其他性质或参 数),如果结合能(或其他性质或参数)符合某种标准,则该潜在化合物就 可被认为是现实化合物,即可能与核糖开关相互作用的化合物。应当理解 的是,虽然下述讨论的是使用结合能的情况,但也可以使用任何涉及化合 物和核糖开关模型或相互作用的任何性质或参数。该标准可为核糖开关与 潜在化合物的计算结合能相当于或优于核糖开关与已知化合物的计算结合 能。例如,现实化合物可以是这样一种化合物,它按本文所述计算出的结 合能是已知化合物结合能的例如至少60%、65%、70%、75%、80%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、 100%、101%、102%、103%、104%、105%、106%、107%、108%、109%、110%、 120%、130%、140%、150%、200%、250%、300%、350%、400%、450%、500%、 600%、700%、800%、900%、1000%或更高。现实化合物也可以是这样一种化 合物,在对所有潜在化合物按其结合能强度进行排序之后,该化合物位于 例如一系列潜在化合物的计算结合强度的前20%、19%、18%、17%、16%、 15%、14%、1 3%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%; 所述一系列潜在化合物至少有3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、 150、175、200、225、250、275、300、350、400、500、700或1000种潜 在化合物。
还应该理解的是,在如本文公开内容所述地识别出一种潜在化合物之 后,可进行常规的检测和分析,例如使用核糖开关和现实化合物进行生物 学分析以进一步确定现实化合物与核糖开关相互作用的能力和/或调节核 糖开关的能力。所公开的方法可以包括分析核糖开关和化合物的活性的步 骤,以及使用例如基于核糖开关的文库进行例如组合化学研究。
能量计算可以基于例如分子力学或量子力学。分子力学通过将一系列 经验函数进行加和来模拟系统的能量,所述一系列经验函数代表了例如键 拉力、范德华力或静电相互作用的能量的总体组合。量子力学使用不同程 度的近似度来解薛定谔方程。这些方法对电学结构进行处理,使得可以对 化学反应进行表征。
可以识别核糖开关的潜在化合物。这可通过用与已知化合物的给定相 似性进行筛选而实现。例如,与已知化合物为同一家族的化合物可被选择。
为给每个核糖开关做计算准备,可以建立潜在化合物晶体结构中未解 析的或不存在的原子。这可使用下述工具来完成:例如PRODRG网络服务器 http://www.davapcl.bioch.dundee.ac.uk./programs/prodrg,或例如 InsightII、Quanta(均在www.accelrys.com网站)和CNS(Brunger et al., Crystallography&NMR system:a new software suite for macromelecular structure determination.Acta Crystallogr.D 54, 905-921(1998))的标准分子建模程序,或者任何其它能够作出核糖开关结 构的分子建模系统。
然后可以计算潜在化合物和核糖开关的结合能(或其他性质或参数)。 有许多方法可用于进行这一计算。例如,通过使用经验函数可以实现侧链 位置的采样和结合热力学的计算,所述经验函数将潜在化合物-分子的能量 建模为模型中所有原子对之间的静电相互作用和范德华相互作用的总和。 还可使用其他任何对潜在化合物和核糖开关的结合能进行评分的计算方法 (H.Gohlke,&G.Klebe.Approaches to the description和prediction of the binding affinity of small-molecule ligands to macromolecular receptors.Angew.Chem.Int.Ed.41,2644-4676(2002)).这类评分 方法的实例包括但不限于下列程序中实现的方法,所述程序例如: AutoDock(G.M.Morris et al.Automated docking using a Lamarckian genetic algorithm and an empirical binding free energy function.J. Comput.Chem.19,1639-1662(1998))、Gold(G.Jones et al.Molecular recognition of receptor sites using a genetic algorithm with a description of desolvation.J.MoI.Biol.245,43-53(1995))、 Chem-Score(M.D.Eldridge et al.J.Comput-Aided Mol.Des.11, 425-445(1997))和Drug-Score(H.Gohlke et al.Knowledge-based scoring function to predict protein-ligand interactions.JMoI.Biol. 295,337-356(2000))。
旋转异构体文库为本领域技术人员已知,并可从包括互联网的各种来 源获得。旋转异构体为低能量侧链构象。使用旋转异构体文库可以对结构 建模以尝试最可能的侧链构象、节省时间并产生最可能正确的构象。旋转 异构体文库的使用限于潜在化合物给定区域内的残基,例如在结合位点的 残基或化合物特定距离内的残基。所述特定距离可以设定为任何所需的长 度,例如,潜在化合物与分子的任意原子的距离可为2_、3_、4_、5_、 6_、7_、8_或9_。
可以通过例如使用具有以下公式的Coulombic模型来计算每一对原子 之间的静电相互作用:
Eelec=332.08q1q2/εr。其中q1和q2为部分原子电荷,r为它们之间 的距离,ε为介电常数
可以使用为描述分子中的电荷分布而开发的现有参数集来计算部分原 子电荷。参数集的实例包括但不限于:PARSE(D.A.Sitkoff et al. Accurate calculation of hydration free-energies using macroscopic solvent models.J.Phys.Chem.98,1978-1988(1994))、CHARMM (MacKerell et al.All-atom empirical potential for molecular modeling and dynamics studies of proteins.J.Phys.Chem.B 102, 3586-3616,1998)和AMBER(W.D.Cornell et al.A 2nd generation force-field for the simulation of proteins,nucleic-acids,和 organic-分子.J.Am.Chem.Soc.117.5179-5195(1995))。部分原子 电荷可通过它们与相似官能团的类比来分配,或通过例如PRODRG服务器上 实施的经验性分配方法来分配(D.M.F.van Aalten et al.PRODRG,a program for generating molecular topologies and unique molecular descriptors from coordinates of small molecules.J.Comput.-Aided Mol.Design 10,255-262(1996))或通过使用标准量子力学计算方法来分 配(例如,C.I.Bayly et al.A well-behaved electrostatic potential based method using charge restraints for deriving atomic charges- the RESP model.J.Phys.Chem.91,10269-10280,(1993))。
静电相互作用可以通过引入静电去溶剂化效应的更精密的方法学来计 算。这可包括显式溶剂模式和隐式溶剂模式:在前一种方法中水分子直接 包括在计算之中,而后一种方法中是通过介电连续介质的方式描述水的效 应。用于计算静电相互作用的隐式溶剂方法的具体实例包括但不限于:基 于Poisson-Boltzmann的方法和Generalized Born方法(M.Feig&C.L. Brooks.Recent advances in the development and application of implict solvent models in biomolecule simulations.Curr.Opin. Struct.Biol.14,217-224(2004))。
可以使用简单的Lennard-Jones形式和下列公式来计算原子对(两个 原子为硫原子或碳原子时)之间的范德华力和疏水相互作用:
Evdw=E{σatt 12/r12-σatt 6/r6}。其中E为能量,r为两个原子之间的 距离,σatt为相互作用能为零时的距离。
可以使用简单的相斥能术语来计算原子对(一个或两个原子既不是硫 原子也不是碳原子时)之间的范德华力:
Evdw=E{σrep 12/r12}。其中E为能量,r为两个原子之间的距离,σrep 为相斥相互作用等于E时的距离。
原子间的疏水相互作用还可以使用本领域技术人员已知的各种方法来 计算。例如,能量分布可以按照下述方式计算:在配体和受体复合物形成 时会把一些溶剂可接近的表面积包埋起来,而能量分布与被包埋的溶剂可 接近的表面积的量成比例。这种分布可以用原子对之间相互作用的形式表 示,例如由Street和Mayo提出的方法(A.G.Street&S.L.Mayo. Pairwise calculation of protein solvent-accessible surface areas. Folding&Design 3,253-258(1998))。这种计算中可以包括用于描述疏 水作用或范德华力或其他能量分布的任何形式的实施方法。
可以针对每种潜在化合物-核糖开关相互作用来计算结合能。例如,可 在存在或不存在核糖开关的条件下进行Monte Carlo采样并计算每个模型 的平均能量。然后可按照两个计算出的平均能量的差别计算出核糖开关与 潜在化合物的结合能。
可以将计算出的潜在化合物与核糖开关的结合能和计算出的已知化合 物与核糖开关的结合能相比较,来确定潜在化合物是否可能为现实化合物。 上述结果可以用实验数据来加以证实,实验中可以测量核糖开关和化合物 实际的相互作用。这种可用于测定核糖开关和化合物实际的相互作用的方 法的实例包括但不限于:平衡透析测量法(其中检测放射形式的化合物与 核糖开关的结合)、酶抑制测定(其中可在存在或不存在化合物的条件下监 测核糖开关的活性)和化学位移扰动测量(其中通过原子在NMR中的化学 位移的变化来监测核糖开关与潜在化合物的结合)。
在上文公开的方法中,核糖开关可为例如鸟嘌呤核糖开关。这种核糖 开关可由例如表5中所列的核糖开关来筛选。
在使用一种潜在化合物对核糖开关的原子晶体结构进行建模之后,可 以进行进一步测试以测定核糖开关和化合物实际的相互作用。例如,可使 用多种不同的手段来检测结合的RNA,包括使用基于凝胶和基于芯片检测 方法的变构核酶测定和串联标记测定。可以通过使用例如荧光检测方法来 实现高通量检测。例如,可以使用通过激活RNA切割核酶来控制基因表达 的葡萄糖胺-6-磷酸感受性核糖开关的天然催化活性。可以重构该核酶以便 以多种翻转动力学切割分离的底物分子。因此,如果化合物触发了核酶功 能,则保持在淬灭基团附近的荧光基团就会解偶联(因此变得荧光更强)。 或者可使用分子信标技术。如果化合物可阻碍信标与核糖开关RNA的对接, 则可产生抑制荧光的系统。通过使用本文公开的RNA基因工程策略,可以 使上述任一种手段适用于任意类别的核糖开关。
本文还公开了可与本文公开的鸟嘌呤核糖开关相互作用的类似物。这 类类似物的实例示于图12B。这26种合成和检测过的化合物中,有许多种 化合物和鸟嘌呤核糖开关结合的常数与鸟嘌呤(-5nM)相等或优于鸟嘌呤。 具有高度可变的附加物的化学组合物都具有功能,这一事实表明可以产生 和检测这些化学骨架的多种变种以用于体外和细胞内的功能。特别地,可 以通过与RNA结构中其他官能团产生新的接触的方式,使得经过进一步修 饰的上述化合物具有改善的与鸟嘌呤核糖开关的结合力。此外,如同核糖 开关的结构模型显示的在这些位点可能的多种修饰那样,通过在骨架的这 两个区域加以修饰,可以对生物活性、毒性和合成难度(以及其它特征) 进行调节。
高通量筛选还可用于发现也可与核糖开关RNA结合的全新的化学骨 架,所述结合可以通过标准的或非标准的分子识别模式进行。由于核糖开 关是首先发现的天然的结合代谢物的RNA的主要形式,因此在以前很少有 人进行建立适用于高通量筛选的结合测定方法的工作。有多种手段都可用 于检测结合代谢物的RNA,包括使用基于凝胶和基于芯片检测方法的变构 核酶测定和串联标记测定。还公开了由识别激活、失活或阻断核糖开关的 化合物和对识别出的化合物进行加工而制备的复合物。这可以通过例如将 本文其他部分公开的化合物识别方法与对识别出的化合物进行加工的方法 结合使用而实现。例如,可通过下述方法制备复合物:使待测化合物和核 糖开关相接触,评估核糖开关的激活,以及如果核糖开关被待测化合物激 活,则制备该激活核糖开关的待测化合物作为复合物。
还公开了由核实某种化合物对核糖开关的激活、失活或阻断作用和对 经核实的化合物进行加工而制备的复合物。这可以通过例如将本文其他部 分公开的化合物激活、失活或阻断评估方法与对经核实化合物的加工方法 结合使用而实现。例如,可通过下述方法制备复合物:使待测化合物和核 糖开关相接触,评估核糖开关的激活,以及如果核糖开关被待测化合物激 活,则制备该激活核糖开关待测化合物作为复合物。核实化合物激活、失 活或阻断核糖开关的能力指的是对以前并不知道可否激活、失活或阻断核 糖开关的化合物的鉴定,以及对已知可激活、失活或阻断核糖开关的化合 物激活、失活或阻断核糖开关的能力的评估。
本文中使用的术语“取代的”意在包括有机化合物的所有允许的取代 基。广义上讲,允许的取代基包括有机化合物的非环状的和环状的、分支 的和未分支的、碳环的和杂环的以及芳香族的和非芳香族的取代基。示例 性的取代基包括例如下述的那些基团。对于合适的有机化合物,可有一个 或多个相同或不同的允许的取代基。出于本发明公开的目的,例如氮原子 的杂原子可以具有氢取代基和/或任何本文所述的允许取代基,以满足杂原 子的价位。有机化合物的允许取代基并不意在以任何方式限制本发明的公 开内容。此外,术语“取代”或“用......取代”包括下述隐含条件:这类 取代应符合取代原子和取代基的价位,并且这类取代产生的是稳定的化合 物,例如不会自发地经过例如重排、环化、消去等转化反应的化合物。
本文中使用的“A1”、“A2”、“A3”和“A4”是一般性标记,表示不同的 具体取代基。这些标记可以是任何取代基,并不限于本文公开的那些取代 基,在一种情况中它们指代某种取代基,也可能在另一种情况中它们就指 代别的取代基。
本文中使用术语“烷基”指的是1至24个碳原子的分支或不分支的饱 和基,例如甲基、乙基、正丙基、异丙基、正丁基、异丁基、叔丁基、 戊基、己基、庚基、辛基、壬基、癸基、十二烷基、十四烷基、十六烷基、 二十烷基、二十四烷基等等。烷基可为取代的或未取代的。烷基可以被一 个或多个下述基团取代,所述基团包括但不限于下文所述的烷基、卤化烷 基、烷氧基、烯基、炔基、芳基、杂芳基、、氨基、羧酸、酯、醚、卤 化物、羟基、、硫代氧基、磺酰基、砜、亚砜或硫氢基。术语“低级烷 基”是具有6个或6个以下碳原子的烷基,例如甲基、乙基、正丙基、异 丙基、丁基、仲丁基、异丁基、叔丁基、戊基、己基等等。
在本说明书通篇中,一般用“烷基”指代未取代的烷基和取代的烷基; 然而取代的烷基在本文中提及时也要指出烷基上具体的取代基。例如,术 语“卤化烷基”专指被一个或多个例如氟、氯、溴和碘的卤原子取代的 烷基。术语“烷氧基烷基”专门指被一个或多个如下所述的烷氧基取代的 烷基。术语“烷基氨基”专门指被一个或多个如下所述的氨基取代的烷基 等等。当在一种情况中使用“烷基”而在另一种情况中使用例如“卤化烷 基”的具体术语时,并非意在暗示术语“烷基”就不包括例如“卤化烷基” 等的具体术语。
这一习惯也适用于本文所述的其它基团。也就是说,例如术语“环烷 基”指的是未取代和取代的环烷基部分,而取代的部分可在本文中另外具 体地指明;例如,具体取代的环烷基可被称为例如“烷基环烷基”。类似地, 一种取代的烷氧基可被具体地称为例如:“卤化烷氧基”,一种具体的取代 烯基可被地称为例如:“烯基醇”等等。此外,使用例如“环烷基”的一般 性术语和例如“烷基环烷基”的具体术语的习惯,并非意在暗示一般性术 语不包括具体术语。
本文中所使用的术语“烷氧基”是指烷基键合一个单独的醚键;也就 是说“烷氧基”可被定义为-OA1,其中A2为上文定义的烷基。
本文中使用的术语“烯基”为有2至24个碳原子的烃基,它们的结构 式中含有至少一个碳-碳双键。例如(A1A2)C=C(A3A4)的这种不对称结构 意在包括E型和Z型异构体。可以假设在本文的结构通式中存在不对称的 烯,或者由键的标记C=C明确地表示出来。烯基可被一个或多个下述基团 所取代,所述基团包括但不限于下文所述的烷基、卤化烷基、烷氧基、烯 基、炔基、芳基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、 硫代氧基、磺酰基、砜、亚砜或硫氢基。
本文中使用的术语“炔基”为有2至24个碳原子的烃基,它们的结构 式中含有至少一个碳-碳叁键。炔基可被一个或多个下述基团所取代,所述 基团包括但不限于下文所述的烷基、卤化烷基、烷氧基、烯基、炔基、芳 基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代氧基、 磺酰基、砜、亚砜或硫氢基。
本文中使用的术语“芳基”为含有任意以碳为基础的芳香基团的基团, 包括但不限于苯、、苯基、联苯、苯氧基苯等。术语“芳基”还包括“杂 芳基”,“杂芳基”指的是含有的芳基环上至少掺入一个杂原子的基团,杂 原子的实例包括但不限于氮、氧、硫和磷。类似地,术语“非杂芳基”也 包括在术语“芳基”之内,指的是包括不合杂原子的芳基的基团。芳基可 为取代的或未取代的。芳基可被一个或多个下述基团所取代,所述基团包 括但不限于本文所述的烷基、卤化烷基、烷氧基、烯基、炔基、芳基、杂 芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代氧基、磺酰基、 砜、亚砜或硫氢基。术语“联芳基”是芳基基团的一种具体形式,也包括 在芳基的定义之内。联芳基指的是结合在一起的两个芳基,它们可例如萘 那样通过稠环结构相连接,或者例如联苯那样通过一个或多个碳碳键相连 接。
本文中使用的术语“环烷基”为由至少三个碳原子组成的非芳香性的 以碳为基础的环。环烷基基团的实例包括但不限于环丙烷基、环丁烷基、 环戊烷基、环己烷基等等。术语“杂环烷基”为前面定义的环烷基的一种, 但是它的环上至少有一个碳原子被杂原子取代,所述杂原子包括但不限于 氮、氧、硫或磷。环烷基和杂环烷基可为取代的或未取代的。环烷基和杂 环烷基可被一个或多个下述基团所取代,所述基团包括但不限于本文所述 的烷基、卤化烷基、烷氧基、烯基、炔基、芳基、杂芳基、醛、氨基、羧 酸、酯、醚、卤化物、羟基、酮、硫代氧基、磺酰基、砜、亚砜或硫氢基。
本文中使用的术语“环烯基”为由至少三个碳原子组成的非芳香性的 以碳为基础的环,在环上含有至少一个双键即C=C。环烷基基团的实例包 括但不限于环丙烯基、环丁烯基、环戊烯基、环戊二烯基、环己烯基、环 己二烯基等等。术语“杂环烯基”为前面定义的环烷基的一类并且包括在 术语“环烯基”的含义之内,但是它的环上至少有一个碳原子被杂原子取 代,所述杂原子包括但不限于氮、氧、硫或磷。环烯基和杂环烯基可为取 代的或未取代的。环烯基和杂环烯基可被一个或多个下述基团所取代,所 述基团包括但不限于本文所述的烷基、卤化烷基、烷氧基、烯基、炔基、 芳基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代氧基、 磺酰基、砜、亚砜或硫氢基。
本文中使用的术语“环状基团”指的是芳基基团和非芳基基团(即环 烷基、杂环烷基、环烯基和杂环烯基)或二者皆有。环状基团具有一个或 多个可为取代或未取代的环系统。环状基团可包括一个或多个芳基基团、 一个或多个非芳基基团,或者一个或多个芳基基团、一个或多个非芳基基 团。
本文中所使用的术语“醛”用通式-C(O)H表示。在本说明书通篇中 “C(O)”都是C=O的简写形式。
本文中使用的术语“胺”或“氨基”用通式NA1A2A3表示,其中A1、A2 和A3可以独立地为上文所述的氢、烷基、卤化烷基、烯基、炔基、芳基、 杂芳基、环烷基、环烯基、杂环烷基或杂环烯基。
本文中所使用的术语“羧酸”用通式-C(O)OH表示。本文中所使用的 “羧酸根”用通式-C(O)O-表示。
本文中所使用的术语“酯”用通式-OC(O)A1或-C(O)OA1表示,其中A1 可以为上文所述的烷基、卤化烷基、烯基、炔基、芳基、杂芳基、环烷基、 环烯基、杂环烷基或杂环烯基。
本文中所使用的术语“醚”用通式A1OA2表示,其中A1和A2可以独立地 为上文所述的烷基、卤化烷基、烯基、炔基、芳基、杂芳基、环烷基、环 烯基、杂环烷基或杂环烯基。
本文中所使用的术语“酮”用通式A1C(O)A2表示,其中A1和A2可以独 立地为上文所述的烷基、卤化烷基、烯基、炔基、芳基、杂芳基、环烷基、 环烯基、杂环烷基或杂环烯基。
本文中所使用的术语“卤化物”指的是卤素氟、氯、溴和碘。
本文中所使用的术语“羟基”用通式-OH表示。
本文中所使用的术语“硫代氧基”用下列通式表示:-S(O)A1(即“磺 酰基”)、A1S(O)A2(即“亚砜”)、-S(O)2A1、A1SO2A2(即“砜”)、-OS(O)2A1 或-OS(O)2OA1,其中A1和A2可以为上文所述的氢、烷基、卤化烷基、烯基、 炔基、芳基、杂芳基、环烷基、环烯基、杂环烷基或杂环烯基。在本说明 书通篇中“S(O)”都是S=O的简写形式。
本文中所使用的术语“磺酰氨基”或“磺酰胺”用通式-S(O)2NH-表示。
本文中所使用的术语“硫氢基”用通式-SH表示。
本文所使用的“Rn”(其中n为整数)可以独立地具有一个或多个上述 的基团。例如,如果R10含有一个芳基,则该芳基上的一个或多个氢原子可 以任选地被羟基、烷氧基、氨基、烷基或卤化物等基团所取代。根据所选 择的基团,第一基团可能掺入第二基团中,或者第一基团可能在第二基团 的侧翼(即附着于第二基团)。例如,使用短语“包括氨基的烷基”时,氨 基可能掺入于烷基的主链上。或者氨基可能是附着在烷基主链上。所选择 的基团的性质将决定第一基团是包含在第二基团中还是附着在第二基团 上。
如果没有明确指出,在一个通式中只是以实线表示而未用楔形线或虚 线表示的化学键包括了每种可能的异构体,例如对映异构体和非对映异构 体,以及异构体的混合物,例如外消旋混合物或成比例的(scalemic)混 合物。
本文公开的某些物质、化合物、组合物和组分可以由商购得到,或是 使用本领域技术人员公知的技术容易地合成得到。例如,在制备所公开的 化合物和组合物中使用的起始物质和试剂可以从下述的供应商处商购:例 如Aldrich Chemical Co.,(Milwaukee,Wis.)、Acros Organics(Morris Plains,NJ.)、Fisher Scientific(Pittsburgh,Pa.)或Sigma(St.Louis, Mo.);或者使用本领域技术人员已知的方法,参考下述文献中所述的工艺 来制备:Fieser and Fieser’s Reagents for Organic Synthesis,Volumes 1-17(John Wiley和Sons,1991);Rodd′s Chemistry of Carbon compounds, Volumes 1-5 and Supplementals(Elsevier Science Publishers,1989); Organic Reactions,Volumes 1-40(John Wiley and Sons,1991);March′s Advanced Organic Chemistry,(John Wiley and Sons,4th Edition)和 Larock′s Comprehensive Organic Transformations(VCH Publishers Inc., 1989)。
可用于鸟嘌呤应答性核糖开关(以及由鸟嘌呤应答性核糖开关衍生 的核糖开关)的化合物包括用通式I表示的化合物:

该化合物可结合鸟嘌呤应答性核糖开关或其衍生物,其中当该化合物与鸟 嘌呤应答性核糖开关或衍生物结合时,R1和R2作为氢键供体,R7作为氢键 受体,R9作为氢键供体,R10作为氢键受体,其中每个独立地代表 单键或双键。在一些实例中,R3可为氢键受体。
应当理解的是,当某一特定部分或基团可被称为氢键供体或氢键受体 时,使用这一术语仅仅是为了便于参照而将各种取代基进行分类。这一用 语并不应被理解为某一特定部分真正参与了与核糖开关或其他化合物形成 氢键的过程。也有这种可能,例如,在本文中被称为氢键受体(或氢键供 体)的某一部分可能是唯一地或另外地参与了与核糖开关或其他化合物形 成疏水相互作用、离子键、范德华力或其他类型相互作用的过程。
还应理解的是,本文公开的某些基团在本文中既可以被称为氢键受体, 也可以被称为氢键供体。例如,-OH可以通过贡献一个氢原子而成为氢键 供体;-OH也可以通过氧原子上的一个或多个非键合电子对而成为氢键受 体。因此在本说明书通篇中,多种部分可为氢键供体和氢键受体,并且可 照这样称谓。
可存在于所公开化合物中的合适的氢键供体,例如R1、R2和R9中的一 个或多个,为含有极性氢键的部分,所述极性氢键例如氢原子与电负性更 强的原子例如C、N、O或S结合时形成的氢键。对于R1、R2和R9而言合适 的氢键供体的实例包括但不限于下述部分:-NR11-、-CHR11-、=CR11-和 -C(=NR11)-,其中R11为-H、-NH2、-OH、-SH、-CO2H,取代或未取代的烷基、 烷氧基、芳基、芳基氧基或苯甲氧基,-NH烷基、-NH烷氧基、-NHC(O)烷 基、-NHCO2烷基、-NHC(O)NH2、-NH-NH2、-NH-NH烷基、-NH-NH烷氧基、-NH-SO2 烷基、-NH-SO2-R12、-NHCO2CH2-R12、-NH-OR12、-N+H2-R12、-NH-NH-R12和 -NH-NH-CH2-R12,其中R12可为:

其中n为1至5,R13可为-H、-NH2、-OH、烷氧基、-N-吗啉代或卤化物中 的一个或多个。
可存在于所公开化合物中的合适的氢键受体,例如R3、R7和R10中的一 个或多个,为含有非键合电子对的部分。通常在N、O、S和卤原子上存在 非键合电子对。对于R3和R7而言合适的氢键受体的实例包括但不限于N、O、 S和SO2。例如,R8和R7可以一起用-CH=N-、-CH2-O-、-CH2-S-或-CH2SO2-来 表示。R3可为N、O或S,这在通式I的结构中就会分别生成-N=R2、-O-R2 和-S-R2部分,其中R2的定义如前所述。
对于R10部分,合适的氢键受体可为O或S,例如O=R6或S=R6中的O或 S,其中R6为C。对于R10而言氢键受体的其他实例包括但不限于:-OH、-SH、 -NH2、-CO2H、-烷氧基、-芳基氧基、-苯甲氧基、-卤化物、-NH烷基、-NH 烷氧基、-NHC(O)烷基、-NHCO2烷基、-NHCO2CH2-R12、-NHC(O)NH2、-NH-NH2、 -NH-NH烷基、-NH-NH烷氧基、-SO2烷基、-SO2芳基、-NH-SO2烷基、-NH-SO2-R12、 -NH-OR12、-NH-R12、-NH-NH-R12、-NH-NH-CH2-R12或-NH-CH2-R12,其中R12的定 义如前所述。
对于R10部分,其他合适的氢键受体可为NR14,例如R14N=R6中的NR14, 其中R6为C。在这些实例中,R14可为-H、-NH2、-OH、-SH、-CO2H、-CO2烷 基、-CO2芳基、-C(O)NH2,取代或未取代的烷基、烷氧基、烷氧基、芳基氧 基或苯甲氧基,-NH烷基、-NH烷氧基、-NHC(O)烷基、-NHCO2烷基、 -NHC(O)NH2、-SO2烷基、-SO2芳基、-NH-SO2烷基、-NH-SO2-R12、-NH-OR12、 -NH-R12或-NH-CH2-R12,其中R12的定义如前所述。
所公开的一些特异性的化合物可用通式II表示,其中R7为N或CH:

R10为=O、=S、=NH、=NOH、=N烷基、=N烷氧基、=N-芳基、=N芳基氧 基、=N-苯甲基、-N苯甲氧基、=N-NH2、=N-NHOH、=N-NH烷基、=N-NH烷氧 基、=N-NH芳基、=N-NH芳基氧基、=N-NH苯甲基、=N-NH苯甲氧基、=N-NH-(对 氨基苯基)、=N-NH-(对甲氧基苯基)、=N-NH-(对-N-吗啉代-苯基);以及
R2为=CR15-,其中R15为-NH2、-NHNH2、-NHOH、-NH烷基、-NH烷氧基、 -NH芳基、-NH芳基氧基、-NH苯甲基、-NH苯甲氧基、-N+H2芳基、-N+H2-(对 -N-吗啉代-苯基)、-N+H2-(对氨基苯基)、-N+H2-(对甲氧基苯基)、-NHCO2 烷基、-NHCO2苯甲基、-NHNH烷基、-NHNH芳基、-NHNH苯甲基或-NHC(O) 烷基。其他的化合物可用通式III表示:

其中R10为-H、-OH、-SH、-烷氧基、卤化物、-NH2、-NHOH、-NH烷基、-NH 烷氧基、-NH芳基、-NH芳基氧基、-NH苯甲基、-NH苯甲氧基、-NHC(O) 烷基、-NHCO2烷基、NHCO2苯甲基、-NHNH2、-NHNH烷基、-NHNH芳基或-NHNH 苯甲基;R2和R7的定义如前所述。
化合物的其他具体实例示于图12B。
可用于鸟嘌呤应答性核糖开关(以及由鸟嘌呤应答性核糖开关衍生的 核糖开关)的化合物还包括具有通式IV的化合物:

该化合物可结合鸟嘌呤应答性核糖开关或其衍生物,其中当该化合物与鸟 嘌呤应答性核糖开关或衍生物结合时,R7作为氢键受体,R10作为氢键供体, R11作为氢键受体,R12作为氢键供体,其中R13为H、H2或者不存在,其中R1、 R2、R3、R4、R5、R6、R8和R9分别独立地为C、N、O或S,其中每个 独立地代表单键或双键。
在上述定义范围内的每一种化合物都意图在并应被认为是在本文中具 体地公开。此外,在上述定义范围内可识别的每个亚群都意图在并应被认 为是在本文中具体地公开。因此,特别考虑了化合物的列表中可具体包括 或排除的或者在用途中可具体包括或排除的任意化合物或化合物的亚群。 例如,作为一种选择,如果有某组化合物,其中每种化合物都符合上述定 义但不是鸟嘌呤、次黄嘌呤、黄嘌呤或N2-甲基鸟嘌呤,那么该组也是被考 虑到的。作为另一种实例,如果有某一组化合物,其中每种化合物都符合 上述定义而且能激活鸟嘌呤应答性核糖开关,那么该组也是被考虑到的。
应该理解的是,对于化合物与核糖开关的相互作用,本文所述的特定 接触和相互作用方式(例如氢键供给或接受)对于化合物与核糖开关的相 互作用来说是优选的而非必需的。例如,化合物与核糖开关的相互作用与 本文公开的化合物与核糖开关的接触和相互作用相比,可能亲和力和/或特 异性要低一些。此外,化合物上不同的或其他的官能团可能会带来与核糖 开关的新的、不同的和/或补偿性的接触。例如,对于鸟嘌呤核糖开关而言, 在例如R10和R2位置可使用大的官能团。这类官能团可以或被设计为可以与 核糖开关的其他部分有接触和相互作用。这种接触和相互作用可以补偿触 发分子和核心结构的接触和相互作用。
可用于腺嘌呤应答性核糖开关(以及由腺嘌呤应答性核糖开关衍生的 核糖开关)的化合物包括具有以下通式的化合物:

该化合物可结合腺嘌呤应答性核糖开关或其衍生物,其中当该化合 物与腺嘌呤应答性核糖开关或衍生物结合时,R1、R3和R7作为氢键受体, R10和R11作为氢键供体,其中R12为H、H2或者不存在,其中R1、R2、R3、R4、 R5、R6、R8和R9分别独立地为C、N、O或S,其中每个独立地代表 单键或双键。
在上述定义范围内的每一种化合物都意图在并应被认为是在本文中 具体地公开。此外,在上述定义范围内可识别的每个亚群都意图在并应被 认为是在本文中具体地公开。因此,特别考虑了化合物的列表中可具体包 括或排除的或者在用途中可具体包括或排除的任意化合物或化合物的亚 群。例如,作为一种选择,如果有某一组化合物,其中每种化合物都符合 上述定义但并不是腺嘌呤、2,6-二氨基嘌呤或2-氨基嘌呤,那么该组也是 被考虑到的。作为另一种实例,如果有某一组化合物,其中每种化合物都 符合上述定义而且能激活腺嘌呤应答性核糖开关,那么该组也是被考虑到 的。
可用于赖氨酸应答性核糖开关(以及由赖氨酸应答性核糖开关衍生的 核糖开关)的化合物包括具有以下通式的化合物:

该化合物可结合赖氨酸应答性核糖开关或其衍生物,其中R2和R3每一个均 带正电,R1带负电,R4为C、N、O或S,并且其中每个独立地代表 单键或双键。还考虑了在按上述定义的化合物中其中R2和R3均为NH3 +并且 R1为O-的情况。
在上述定义范围内的每一种化合物都意图在并应被认为是在本文中具 体地公开。此外,在上述定义范围内可识别的每个亚群都意图在并应被认 为是在本文中具体地公开。因此,特别考虑了化合物的列表中可具体包括 或排除的或者在用途中可具体包括或排除的任意化合物或化合物的亚群。 例如,作为一种选择,如果有某一组化合物,其中每种化合物都符合上述 定义但都不是赖氨酸,那么该组也是被考虑到的。作为另一种实例,如果 有某一组化合物,其中每种化合物都符合上述定义而且能激活赖氨酸应答 性核糖开关,那么该组也是被考虑到的。
可用于TPP应答性核糖开关(以及由赖氨酸应答性核糖开关衍生的 核糖开关)的化合物包括具有以下通式的化合物:

该化合物可结合TPP应答性核糖开关或其衍生物,其中R1带正电,R2和R3 每一个均独立地为C、O或S,R4为CH3、NH2、OH、SH、H或不存在,R5为 CH3、NH2、OH、SH或H,R6为C或N,并且其中每个独立地代表单 键或双键。还考虑了在按上述定义的化合物中其中R1为磷酸根、二磷酸根 或三磷酸根的情况。
在上述定义范围内的每一种化合物都意图在并应被认为是在本文中具 体地公开。此外,在上述定义范围内可识别的每个亚群都意图在并应被认 为是在本文中具体地公开。因此,特别考虑了化合物的列表中可具体包括 或排除的或者在用途中可具体包括或排除的任意化合物或化合物的亚群。 例如,作为一种选择,如果有某一组化合物,其中每种化合物都符合上述 定义但并不是TPP、TP或硫胺素,那么该组也是被考虑到的。作为另一种 实例,如果有某一组化合物,其中每种化合物都符合上述定义而且能激活 TPP应答性核糖开关,那么该组也是被考虑到的。
D.构建体、载体和表达系统
所公开的核糖开关可在任何合适的表达系统中使用。重组表达可以使 用例如质粒等载体来实现。载体可包括与核糖开关编码序列可操作地连接 的启动子和待表达的RNA(例如,编码一种蛋白的RNA)。载体还可包括转 录和翻译所需的其它元件。本文所述的载体指的是包含外源DNA的任何载 体。因此,载体是可将外源核酸不降解地转移至细胞中的媒介,它包括启 动子,可在它转入的细胞中获得核酸的表达。载体包括但不限于:质粒、 病毒核酸、病毒、噬菌体核酸、噬菌体、粘粒和人工染色体。可以生产多 种适于携带核糖开关-调节构建体的原核和真核的表达载体。这类表达载体 包括例如:pET、pET3d、pCR2.1、pBAD、pUC和酵母载体。载体可在例如 各种体内和体外环境中使用。
病毒载体包括腺病毒、腺伴随病毒、疱疹病毒、痘病毒、脊髓灰质 炎病毒、AIDS病毒、神经营养病毒(neuronal trophic virus)、辛德毕 斯病毒(Sindbis)和其他RNA病毒,包括具有HIV骨架的那些病毒。还可 使用与上述病毒具有共同性质从而适于用作载体的任意病毒家族。由Verma (1985)描述的逆转录病毒载体包括鼠类罗尼白血病病毒MMLV和表现 MMLV作为载体所需性质的逆转录病毒。通常,病毒载体包括非结构性早期 基因、结构性晚期基因、RNA聚合酶III转录物、复制和壳体化必需的反向 末端重复序列以及控制病毒基因组的转录和复制的启动子。当被基因工程 改造用作载体时,通常要移除病毒的一个或多个早期基因,并将一种基因 或基因/启动子盒插入到病毒基因组中代替被移除的病毒DNA。
“启动子”通常为位于与转录起始位点相对固定的位置时可以发挥功 能的一个或多个DNA序列。“启动子”包括与RNA聚合酶发生基本相互作用 所需的核心元件和转录因子,还可包括上游元件和应答元件。
“增强子”通常指的是为位于与转录起始位点相对不固定的位置时就 可以发挥功能的DNA序列,它可以在转录单位的5’(Laimins,1981)或 3’(Lusky et al.,1983)。此外,增强子可以在内含子中(Banerji et al., 1983),也可以在编码序列本身之中(Osborne et al.,1984)。它们的长度 通常为10bp至300bp之间,并且以顺式方式发挥作用。增强子的功能是增 加邻近的启动子的转录。增强子与启动子类似,也经常含有介导转录的调 节的应答元件。增强子经常对表达的调节有决定性作用。
用于真核宿主细胞(酵母、真菌、昆虫、植物、动物、人类或有核细 胞)中的表达载体还可包括可以影响mRNA表达的转录终止所必需的序列。 这些区域在编码组织因子蛋白的mRNA的非翻译部分中以多腺苷酸化区段 的形式被转录。3’非翻译区还包括转录终止位点。优选地,转录单位还包 括多腺苷酸化区域。这一区域的一个优点是它增加了被转录的单位像mRNA 一样被加工和转运的可能性。多腺苷酸化信号在表达构建体中的鉴定和用 途已经广为人知。优选地,在转基因构建体中使用同源的多腺苷酸化信号。
载体可包括编码标记物产物的核酸序列。使用这种标记物产物来确定 基因是否被送递至细胞以及在送递后是否被表达。优选的标记物基因为编 码β-半乳糖苷酶的大肠杆菌lacZ基因和绿色荧光蛋白。
在一些实施方案中,标记物可为可选择的标记物。当这类可选择的标 记物被成功地转移至宿主细胞中时,如果将宿主细胞置于筛选压力下,则 被转化的宿主细胞可以存活。目前广泛使用的有两类不同的筛选策略。第 一类是基于细胞代谢的,使用离开添加培养基就不能生长的突变细胞系。 第二类为显性选择,它指的是在任何细胞类型中都可使用而不必使用突变 细胞系的筛选方案。这些方案通常使用抑制宿主细胞生长的药物。含有新 基因的那些细胞可以表达使细胞具有药物抗性的蛋白质,从而可以在筛选 中存活。这类显性筛选的实例中使用的药物有新霉素(Southern and Berg, 1982)、霉酚酸(Mulligan and Berg,1980)或潮霉素(Sugden et al.,1985)。
可以使用遗传物质的直接转移来获得基因转移,所述遗传物质包括但 不限于质粒、病毒载体、病毒核酸、噬菌体核酸、噬菌体、粘粒和人工染 色体,或者通过细胞或载体例如阳离子脂质体中的遗传物质的转移来获得 基因转移。这类方法为本领域所熟知,并且可以很容易的使之适用于本文 所述的方法。转移载体可为任何可将基因送递至细胞内的核苷酸构建体(例 如质粒),或者作为送递基因的总体策略的一部分,例如作为重组逆转录病 毒或重组腺病毒的一部分(Ram et al.Cancer Res.53:83-88,(1993))。 用于转染的合适手段包括病毒载体、化学转染子或物理-机械方法例如电穿 孔和DNA的直接扩散,这些手段描述于例如,Wolff,J.A.,et al.,Science, 247,1465-1468,(1990);和Wolff,J.A.Nature,352,815-818,(1991)。
1.病毒载体
优选的病毒载体为腺病毒、腺伴随病毒、疱疹病毒、牛痘病毒、脊髓 灰质炎病毒、AIDS病毒、神经营养病毒、辛德毕斯病毒和其他RNA病毒, 包括具有HIV骨架的那些病毒。还优选的是与上述病毒具有共同性质从而 适于用作载体的任意病毒家族。优选的逆转录病毒包括鼠类马罗尼白血病 病毒MMLV和表现MMLV作为载体所需性质的逆转录病毒。逆转录病毒载体 可以比其他载体病毒携带更大的基因载量,即携带更大的转基因或标记物 基因,因此是常用的载体。但是它们不能用于非增殖细胞。腺病毒载体相 对稳定并易于操作、具有高滴度、可在气溶胶制剂中送递并可以转染非分 裂细胞。Pox病毒载体较大并具有多个可插入基因的位点,它们对热稳定, 可在室温下储存。优选的实施方案为经过基因工程改造的病毒载体,这样 可以抑制宿主生物由病毒抗原引起的免疫反应。优选的这种类型的载体应 携带白细胞介素8或10的编码区域。
病毒载体与大多数将基因导入细胞的化学或物理方法相比,具有更高 的处理能力(导入基因的能力)。通常,病毒载体包括非结构性早期基因、 结构性晚期基因、RNA聚合酶III转录物、复制和壳体化必需的反向末端重 复序列以及控制病毒基因组的转录和复制的启动子。当被基因工程改造用 作载体时,通常要移除病毒的一个或多个早期基因,并将一种基因或基因/ 启动子盒插入到病毒基因组中代替被移除的病毒DNA。这种类型的构建体 可以携带最多达约8 kb的外部遗传物质。被移除的早期基因的必需功能通 常由经过基因工程改造而反式表达早期基因的基因产物的细胞系提供。
i.逆转录病毒载体
逆转录病毒为属于逆转录病毒科的动物病毒,包括任何类型、亚科、 属或向性。在Verma,I.M.,Retroviral vectors for gene transfer.In Microbiology-1985,American Society for Microbiology,pp.229-232, Washington,(1985)中总体描述了逆转录病毒载体,上述文献以援引的方 式纳入本文。将逆转录病毒载体用于基因疗法的方法的实例描述于美国专 利No.4,868,116和4,980,286;PCT申请WO 90/02806和WO 89/07136; 以及Mulligan,(Science 260:926-932(1993))等文献中,以上文献中的 教导以援引的方式纳入本文。
逆转录病毒本质上是一个包装,它将核酸负载包裹在内。核酸负载携 带有包装信号,这使得复制出的子代分子可以被有效地包装在包衣中。除 了包装信号以外,还有许多复制和复制病毒的包装所需要的顺式分子。通 常逆转录病毒基因组包括参与蛋白质外壳形成的gag、pol和env基因。通 常使用待转入靶细胞的外部DNA来替代gag、pol和env基因。逆转录病毒 载体通常包括:掺入至包衣所需的包装信号,起动gag转录单位的信号序 列,逆转录必需的元件(包括引物结合位点以结合逆转录的tRNA引物), 在DNA合成过程中引导RNA链转换的末端重复序列,作为DNA合成中第二 链合成起始位点的富含嘌呤的序列5’至3’LTR,以及可使DNA状态的逆转录 病毒插入到宿主基因组中的LTR末端附近的特异性序列。gag、pol和env 基因的移除可以使得约8kb的外部序列被插入到病毒基因组中、被反转录 以及在复制后被包装到新的逆转录病毒颗粒中。根据每种转录物的大小, 上述核酸量足够送递一个或多个基因。优选地,在插入物中于其他基因一 起含有阳性或阴性的可选择的标记物。
由于在大多数逆转录病毒载体中,复制机制和包装蛋白(gag、pol和 env)已经被移除,通常通过将载体置于包装细胞系中来生产载体。包装细 胞系为已被含有复制和包装机制但不含任何包装信号的逆转录病毒转染或 转化的细胞系。当携带所选DNA的载体被转染到这些细胞系中时,包括目 的基因的载体通过助体细胞提供的顺式机制而被复制和包装到新的逆转录 病毒颗粒中。而具有机制的基因组因为没有必需的信号而不被包装。
ii.腺病毒载体
复制缺陷型腺病毒的构建前人已有所描述(Berkner et al.,J. Virology 61:1213-1220(1987);Massie et al.,MoI.Cell.Biol. 6:2872-2883(1986);Haj-Ahmad et al.,J.Virology 51:261-21 A(1986); Davidson et al.,J.Virology 61:1226-1239(1987);Zhang″Generation 和identification of recombinant adenovirus by liposome-mediated transfection and PCR analysis″BioTechniques 15:868-872(1993))。 使用这些病毒作为载体的优点是它们散播至其他细胞类型的程度是有限 的,虽然它们可以在初始感染的细胞中复制,但是它们不能形成新的感染 性病毒颗粒。重组腺病毒在直接体内送递至下列组织时已表现出可获得很 高的基因转移效率:气道上皮、肝细胞、血管内皮、CNS实质以及多种其 他组织位点(Morsy,J.Clin.Invest.92:1580-1586(1993);Kirshenbaum, J.Clin.Inves t.92:381-387(1993);Roessler,J.Clin.Invest. 92:1085-1092(1993);Moullier,Nature Genetics 4:154-159(1993);La Salle,Science 259:988-990(1993);Gomez-Foix,J.Biol.Chem. 267:25129-25134(1992);Rich,Human Gene Therapy 4:461-476(1993); Zabner,Nature Genetics 6:75-83(1994);Guzman,Circulation Research 73:1201-1207(1993);Bout,Human Gene Therapy 5:3-10(1994); Zabner,Cell 75:207-216(1993);Caillaud,Eur.J.Neuroscience 5:1287-1291(1993);以及Ragot,J.Gen.Virology 74:501-507 (1993))。重组腺病毒与野生型或复制缺陷型腺病毒一样,通过结合特异性 细胞表面受体而完成基因转导,然后病毒通过受体介导的胞吞作用而内生 化(Chardonnet和Dales,Virology 40:462-477(1970);Brown和 Burlingham,J.Virology 12:386-396(1973);Svensson和Persson,J. Virology 55:442-449(1985);Seth,et al.,J.Virol.51:650-655 (1984);Seth,et al.,MoI.Cell.Biol.4:1528-1533(1984);Varga et al.,J.Virology 65:6061-6070(1991);Wickham et al.,Cell 73:309-319(1993))。
一种优选的病毒载体为基于移除了E1基因的腺病毒的载体,这些病毒 在例如人类293细胞的细胞系中产生。在另一个优选的实施方案中,E1和 E3基因都被从腺病毒基因组中移除。
另一类病毒载体是基于腺相关病毒(AAV)。这种缺陷型细小病毒是一种 优选的载体,因为它可以感染许多种细胞类型,并且对人类没有致病性。 AAV型载体可以转运4至5kb的基因,并且已知野生型AAV可以稳定地插 入到第19染色体上。具有这种特异性位点整合性质的载体为优选的。这种 载体的一种特别优选的实施方案是由Avigen,San Francisco,CA生产的 P4.1 C载体,它可包括单纯疱疹病毒胸苷激酶基因、HSV-tk和/或标记物 基因,例如编码绿色荧光蛋白GFP的基因。
在病毒和逆转录病毒中插入的基因经常含有包括启动子和/或增强子 以辅助对所需基因产物的表达的控制。启动子通常为位于与转录起始位点 相对固定的位置时可以发挥功能的一个或多个DNA序列。“启动子”包括与 RNA聚合酶发生基本相互作用所需的核心元件和转录因子,还可包括上游 元件和应答元件。
2.病毒启动子和增强子
控制哺乳动物细胞中的载体转录的优选启动子可由各种来源获得,例 如下列病毒的基因组:多瘤病毒、猿猴病毒40(SV40)、腺病毒、逆转录 病毒、乙型肝炎病毒,最优选巨细胞病毒;或者来源于异源哺乳动物启动 子例如β肌动蛋白启动子。SV40病毒的早期和晚期启动子可以方便地以包 括SV40病毒复制起始位点的限制性片段的形式获得(Fiers et al.,Nature, 273:113(1978))。人类巨细胞病毒的即时早期启动子可以方便地以Hind III E限制性片段的形式获得(Greenway,PJ.et al.,Gene 18:355-360 (1982))。当然,来自宿主细胞或相关物种的启动子也在此使用。
“增强子”通常指的是为位于与转录起始位点相对不固定的位置时就 可以发挥功能的DNA序列,它可以在转录单位的5’(Laimins,L.et al., Proc.Natl.Acad.Sci.78:993(1981))或3’(Lusky,M.L.,et al.,Mol. 细胞Bio.3:1108(1983))。此外,增强子可以在内含子中(Banerji,J.L. et a.,细胞33:729(1983)),也可以在编码序列本身之中(Osborne,T.F., et al.,MoI.细胞Bio.4:1293(1984))。它们的长度通常为10bp至300bp 之间,并且以顺式方式发挥作用。增强子的功能是增加邻近的启动子的转 录。增强子还经常含有介导转录的调节的应答元件。增强子还经常含有介 导转录的调节的应答元件。增强子经常对表达的调节有决定性作用。虽然 许多来自哺乳动物基因的增强子的序列是已知的(珠蛋白、弹性蛋白酶、 清蛋白、甲胎蛋白和胰岛素),但是通常还是使用来自真核细胞病毒的增强 子。优选的实例为:在复制起点下游的SV40增强子(bp 100-270)、巨细 胞病毒早期启动子增强子、在复制起点下游的多瘤病毒增强子和腺病毒增 强子。
启动子和/或增强子可以被能触发它们功能的光或特异性化学事件特 异性地激活。可以用例如四环素和地塞米松等试剂来调节系统。也有一些 方法通过暴露于例如γ辐照的辐照方法或烷化化疗药物来增强病毒载体的 基因表达。
优选地,启动子和/或增强子区域在所有真核细胞类型中都是有活性 的。这种类型的一种优选的启动子为CMV启动子(650个碱基)。其他优选 的启动子为SV40启动子、巨细胞病毒(全长启动子)和逆转录病毒载体 LTF。
已显示所有的特异性调节元件都可被克隆和用于构建在特异细胞类型 例如黑素瘤细胞中选择性表达的表达载体。胶质细胞原纤维酸性蛋白(GFAP) 启动子已被用于在胶质来源的细胞中选择性表达基因。
用于真核宿主细胞(酵母、真菌、昆虫、植物、动物、人类或有核细 胞)中的表达载体还可包括可以影响mRNA表达的转录终止所必需的序列。 这些区域在编码组织因子蛋白的mRNA的非翻译部分中以多腺苷酸化区段 的形式被转录。3’非翻译区还包括转录终止位点。优选地,转录单位还包 括多腺苷酸化区域。这一区域的一个优点是它增加了被转录的单位像mRNA 一样被加工和转运的可能性。多腺苷酸化信号在表达构建体中的鉴定和用 途已经广为人知。优选地,在转基因构建体中使用同源的多腺苷酸化。在 转录单位的一个优选实施方案中,多腺苷酸化区域来自SV40早期多腺苷酸 化信号,由大约400个碱基组成。还优选地,转录单位单独包括其他标准 序列或包括其他标准序列和上述序列,改进构建体的表达或稳定性。
3.标记物
载体可包括编码标记物产物的核酸序列。使用这种标记物产物来确定 基因是否被送递至细胞以及在送递后是否被表达。优选的标记物基因为编 码β-半乳糖苷酶的大肠杆菌lacZ基因和绿色荧光蛋白。
在一些实施方案中,标记物可为可选择的标记物。用于哺乳动物细胞 的可选择标记物的实例为二氢叶酸还原酶(DHFR)、胸苷激酶、新霉素、新 霉素类似物G418、潮霉素和嘌呤霉素。当这类可选择的标记物被成功地转 移至哺乳动物宿主细胞中时,如果将宿主细胞置于筛选压力下,则被转化 的哺乳动物宿主细胞可以存活。目前广泛使用的有两类不同的筛选策略。 第一类是基于细胞代谢的,使用离开添加培养基就不能生长的突变细胞系。 两个实例为:CHO DHFR-细胞和小鼠LTK-细胞。这些细胞在不添加营养物胸 苷或次黄嘌呤的情况下就不能生长。由于这些细胞缺乏完整的核苷酸合成 途径中必需的某个基因,因此除非在添加培养基中提供那种没有的核苷酸, 否则细胞就不能存活。另一种补充培养基的方式是将完整的DHFR或TK基 因导入缺乏相应基因的细胞中,由此改变它们的生长需求。未被DHFR或 TK基因转化的细胞将不能在非添加培养基上生长。
第二类为显性选择,它指的是在任何细胞类型中都可使用而不必使用 突变细胞系的筛选方案。这些方案通常使用抑制宿主细胞生长的药物。含 有新基因的那些细胞可以表达使细胞具有药物抗性的蛋白质,从而可以在 筛选中存活。这类显性筛选的实例中使用的药物有新霉素(Southern P.和 Berg,P.,J.Molec.Appl.Genet.1:327(1982))、霉酚酸(Mulligan, R.C.和Berg,P.Science 209:1422(1980))或潮霉素(Sugden,B.et al., MoI.细胞.Biol.5:410-413(1985))。这三个实例使用了真核控制下的 细菌基因来分别赋予细胞对于合适的药物G418或新霉素(遗传霉素)、xgpt (霉酚酸)或潮霉素的抗性。其他的还有新霉素类似物G418和嘌呤霉素。
E.生物传感器核糖开关
还公开了生物传感器核糖开关。生物传感器核糖开关是经过基因工程 改造的核糖开关,它们在存在它们的同种触发分子时产生可检出的信号。 可用的生物传感器核糖开关可以在触发分子达到或超过阈值水平时被触 发。生物传感器核糖开关可被设计为体内应用或体外应用。例如,报告RNA 编码作为信号的蛋白质或参与产生信号的蛋白质,与该报告RNA可操作地 连接的生物传感器核糖开关可在体内被用于通过基因工程改造细胞或生 物,使其含有编码核糖开关/报告RNA的核酸构建体。用于体外的生物传感 器核糖开关的一个实例是包括构象依赖性标签的核糖开关,由该标签产生 的信号随核糖开关的激活状态而变化。优选地,这种生物传感器核糖开关 使用天然存在的核糖开关的适体结构域或由天然存在的核糖开关衍生的适 体结构域。
F.报告蛋白和报告肽
为评估核糖开关或生物传感器核糖开关的激活,可以使用报告蛋白或 报告肽。报告蛋白或报告肽可以由核糖开关调节其表达的RNA编码。实施 例中描述了一些特异性报告蛋白的使用。报告蛋白和报告肽的使用已为人 所熟知,并可以方便地与核糖开关一起使用。报告蛋白可为任意可检出的 或产生可检出信号的蛋白质或肽。优选地,该蛋白质或肽的存在可以用常 规技术(例如放射免疫测定放射性标记、免疫测定、酶活性测定、吸附、 荧光、发光和蛋白质印迹)检出。更优选地,即使在报告蛋白的水平比较 低的情况下,仍然可以使用常规技术对其水平定量。可用的报告蛋白包括 荧光素酶、绿色荧光蛋白以及它们的衍生物,例如北美萤火虫(Photinus pyralis)的萤火虫荧光素酶(FL)和海参(Renilla reniformis)的海参 荧光素酶(RL)。
G.构象依赖性标签
构象依赖性标签指的是具有下述性质的所有标签:在标签所连接的分 子或化合物(例如核糖开关)的形式或构象发生改变的基础上标签可以产 生荧光强度或波长的变化。以探针和引物为背景使用的构象依赖性标签的 实例包括:分子信标、Amplifluors、FRET探针、可切割的FRET探针、TaqMan 探针、蝎形引物(scorpion primer)、荧光三聚体寡核苷酸(fluorescent triplexoligos)包括但不限于三聚体分子信标或三聚体FRET探针、荧光 水溶性偶联聚合物、PNA探针和QPNA探针。这种标签具体而言它们的功能 原理可适于与核糖开关一起使用。一些类型的构象依赖性标签综述于 Schweitzer and Kingsmore,Curr.Opin.Biotech.12:21-27(2001)。
茎淬灭标签是构象依赖性标签的一种形式,它是位于核酸上的荧光标 签,这样当茎结构形成时淬灭部分会接近荧光标签以使得标签发出的荧光 被淬灭。当茎结构被破坏时(例如当含有标签的核糖开关被激活时),淬灭 部分就不再接近荧光标签,荧光就会增强。这种效应的实例可见于分子信 标、荧光三聚体寡核苷酸、三聚体分子信标、三聚体FRET探针和QPNA探 针中,它们的操作原理也可适于与核糖开关一起使用。
茎激活标签是构象依赖性标签的一种形式,它是通过茎结构的形成可 以增强或改变荧光的标签或标签对。茎激活标签可包括受体荧光标签和供 体部分,当受体和供体相互接近时(当包括标签的核酸链形成茎结构时), 荧光共振能量由供体相受体的转移会使受体发荧光。茎激活标签通常为位 于核酸分子(例如核糖开关)上的标签对,这样当核酸分子中形成茎结构 时受体和供体就会相互接近。如果茎激活标签的供体部分本身就是荧光标 签,那么当它不与受体接近时(也就是未形成茎结构时)它就会以荧光的 形式释放能量(通常这种荧光的波长与受体荧光的波长不同)。当茎结构形 成时,总体的效果是供体荧光减少和受体荧光增加。FRET探针为使用茎激 活标签的一个实例,它的操作原理也可适于与核糖开关一起使用。
H.检测标签
为了对核糖开关的激活、失活或阻断进行检测和量化,或对核糖开关 的激活、失活或阻断后产生的核酸或蛋白质的表达进行检测和量化,可以 在检测探针或者检测分子中引入检测标签,或者在表达的核酸或蛋白质中 引入检测标签。本文中所述的检测标签为可以与核酸或蛋白质直接或间接 地相连接、并由此产生可以直接或间接地测量或检测的信号的任何分子。 许多这种标签均为本领域技术人员所已知。可用于所公开方法的合适的检 测标签的实例为放射性同位素、荧光分子、磷光分子、酶、抗体和配体。
合适的荧光标签的实例包括异硫氰酸荧光素(FITC)、5,6-羧甲基荧光 素、德克萨斯红(Texas red)、硝基苯-2-氧杂-1,3-二唑-4-基(NBD)、香 豆素、丹酰氯、罗丹明、氨基甲基香豆素(AMCA)、曙红、藻红、BODIPY_、 Cascade Blue_、Oregon Green_、芘、丽丝胺(lissamine)、加氧杂蒽 (xanthenes)、吖啶、藻红蛋白、镧系金属离子的大环螯合物例如量子染 料TM、荧光能量染料例如噻唑橙乙啡啶异源二聚体、以及花青染料Cy3、 Cy3.5、Cy5、Cy5.5和Cy7。其他特异性荧光标签的实例包括3-羟基芘 5,8,10-三磺酸、5-羟色胺(5-HT)、酸性品红、茜素络合酮、茜素红、别藻 蓝蛋白、氨基香豆素、蒽基硬脂酸、Astrazon亮红4G、Astrazon橙R、 Astrazon红6B、Astrazon黄7 GLL、阿的平(Auramine)、Aurophosphine、 Aurophosphine G、BAO 9(Bisaminophenyloxadiazole,双氨基苯基噁二唑)、 BCECF、硫酸小檗碱、双苯酰胺、Blancophor FFG溶液、Blancophor SV、 Bodipy Fl、亮磺基黄素FF(Brilliant Sulphoflavin FF)、Calcien Blue、 Calcium Green、Calcofluor RW溶液、Calcofluor White、Calcophor White ABT溶液、Calcophor White标准溶液、Carbostyryl、Cascade Yellow、 儿茶酚胺、奎纳克林(Chinacrine)、科里膦O、香豆素-鬼笔环肽、CY3.1 8、CY5.18、CY7、Dans(1-二甲基氨基-萘-5-磺酸)、Dansa(二氨基萘基 磺酸)、丹酰NH-CH3,二氨基苯基噁二唑(DAO)、二甲基氨基-5-磺酸、二 吡咯亚甲基二氟化、联苯亮吖啶黄7GFF、多巴胺、藻红ITC、吖啶橙 (Euchrysin)、FIF(甲醛诱导荧光)、Flazo Orange、Fluo 3、荧光胺、 Fura-2、Genacryl亮红B、Genacryl亮黄10GF、Genacryl粉红3G、Genacryl 黄5GF、Gloxalic Acid、粒状蓝(Granular Blue)、血卟啉 (Haematoporphyrin)、Indo-1、Intrawhite Cf液体、Leucophor PAF、 Leucophor SF、Leucophor WS、丽丝胺罗丹明B200(RD200)、Lucifer黄 CH、Lucifer黄VS、苏丹红(Magdala Red)、Marina Blue、Maxilon亮黄 素10 GFF、Maxilon亮黄素8 GFF、MPS(Methyl Green Pyronine Stilbene, 甲基绿焦宁均二苯乙烯)、光神霉素、NBD胺、硝基苯并噁二唑 (Nitrobenzoxadidole)、去甲肾上腺素、核坚牢红(Nuclear Fast Red)、 核黄(Nuclear Yellow)、Nylosan亮黄素E8G、噁二唑、Pacific蓝、碱 性副品红(Feulgen)Phorwite AR溶液、Phorwite BKL、Phorwite Rev、 Phorwite RPA、膦3R、酞菁(Phthalocyanine)、藻红蛋白R、Polyazaindacene Pontochrome Blue Black、卟啉、Primuline、普施安黄(Procion Yellow)、 焦宁(Pyronine)、焦宁B、Pyrozal亮黄素7GF、芥奎吖因(Quinacrine Mustard)、罗丹明123、罗丹明5 GLD、罗丹明6G、罗丹明B、罗丹明B 200、 罗丹明B Extra、罗丹明BB、罗丹明BG、罗丹明WT、5-羟色胺、Sevron 亮红2B、Sevron亮红4G、Sevron亮红B、Sevron橙、Sevron黄L、SITS (Primuline)、SITS(均二苯乙烯异硫磺酸,Stilbene Isothiosulphonic acid)、均二苯乙烯、Snarf 1、磺基罗丹明B Can C、磺基罗丹明G Extra、 四环素、噻嗪红R、硫黄素S、硫黄素TCN、硫黄素5、Thiolyte、Thiozol Orange、Tinopol CBS、True Blue、Ultralite、Uranine B、Uvitex SFC、 Xylene Orange和XRITC。
可用的荧光标签为荧光素(5-羧基荧光素-N-羟基琥珀酰亚胺酯)、罗 丹明(5,6-四甲基罗丹明)和花青染料Cy3、Cy3.5、Cy5、Cy5.5和Cy7。 这些荧光染料的最大吸收和发射波长分别为:FITC(490nm;520nm)、Cy3 (554nm;568nm)、Cy3.5(581nm;588nm)、Cy5(652nm;672nm)、 Cy5.5(682nm;703nm)、Cy7(755nm;778nm),这使得它们可以同时 被检测。荧光素染料的其他实例包括:6-羧基荧光素(6-FAM)、2’,4’,1,4,- 四氯荧光素(TET)、2’,4’,5’,7’,1,4-六氯荧光素(HEX)、2’,7’-二甲氧基 -4’,5’-二氯-6-羧基罗丹明(JOE)、2’-氯-5’-氟-7’,8’-稠苯-1,4-二氯-6- 羧基荧光素(NED)和2’-氯-7’-苯基-1,4-二氯-6-羧基荧光素(VIC)。荧 光标签可由各种来源商购获得,包括Amersham Pharmacia Biotech, Piscataway,NJ;Molecular Probes,Eugene,OR;和Research Organics, Cleveland,Ohio。
所关注的其他标签包括那些仅当它们所连接的探针与靶分子特异性结 合时产生信号的标签,其中这类标签包括Tyagi&Kramer,Nature Biotechnology(1996)14:303和EP 0 070 685 B1中所述的“分子信标”。 所关注的其他标签包括美国专利No.5,563037、国际申请WO 97/17471和 WO 97/17076中所述的那些标签。
带标签的核苷酸是检测标签的一种可用形式,可以在合成过程中直接 引入被表达的核酸中。可以直接引入核酸中的检测标签的实例包括核苷酸 类似物例如BrdUrd(5-溴脱氧尿苷,Hoy and Schinike,Mutation Research 290:217-230(1993))、氨基烯丙基脱氧鸟苷(Henegariu et al:,Nature Biotechnology 18:345-348(2000))、5-甲基胞嘧啶(Sano et al.,Biochim. Biophys.Acta 951:157-165(1988))、溴尿核苷(Wansick et al,J.Cell Biology 122:283-293(1993))和经生物素修饰的核苷酸(Langer et al, Proc.Natl. Acad.Sd.USA 78:6633(1981))或经过例如地高辛抗原 (digoxygenin)的半抗原修饰的核苷酸(Kerkhof,Anal.Biochem. 205:359-364(1992))。合适的带荧光标签核苷酸有:异硫氰酸荧光素 -dUTP、花青-3-dUTP和花青-5-dUTP(Yu et al,Nucleic Acids Res., 22:3226-3232(1994))。对于DNA而言优选的核苷酸类似物检测标签为 BrdUrd(溴脱氧尿苷、BrdUrd、BrdU、BUdR,Sigma-Aldrich Co)。其他用 于将检测标签引入DNA的可用的核苷酸类似物为AA-dUTP(氨基烯丙基脱 氧尿苷三磷酸,Sigma-Aldrich Co.)和5-甲基-dCTP(Roche Molecular Biochemicals)。一种用于将检测标签引入RNA的可用的核苷酸类似物为生 物素-16-UTP(生物素-16-尿苷-5’-三磷酸,Roche Molecular Biochemicals)。可将荧光素、Cy3和Cy5连接至dUTP上用于直接标记。 Cy3.5和Cy7可以以抗生物素蛋白或抗地高辛抗原缀合物的形式用于带有 生物素或地高辛抗原标签的探针的次级检测。
被引入核酸的例如生物素的检测标签,随后可以使用本领域公知的敏 感方法进行检测。例如,使用抗生物素蛋白-碱性磷酸酶缀合物(Tropix, Inc.)可以检测生物素,这种缀合物可以与生物素结合并随后通过适当底物 的化学发光进行检测(例如,化学发光底物CSPD:二钠,3-(4-甲氧基螺 -[1,2,-二环氧丙烷-3-2’-(5’-氯)三环[3.3.1.13,7]癸烷]-4-基)苯基磷酸 (disodium,3-(4-methoxyspiro-[1,2,-dioxetane-3-2’-(5’-chloro)tri cyclo[3.3.1.13,7]decane]-4-yl)phenyl phosphate);Tropix,Inc.)。 标签也可以是可检测的酶,例如碱性磷酸酶、大豆过氧化物酶、辣根过氧 化物酶和聚合酶,检测例如使用化学信号放大法或使用能发光的酶的底物 (例如化学发光的1,2-二环氧丙烷底物)或能产生荧光信号的酶的底物。
结合了两个或多个上述检测标签的分子也可被认为是检测标签。任何 已知的检测标签都可与本发明公开的探针、标签、分子和方法一起使用, 以便标记和检测本发明公开方法所产生的激活的或失活的核糖开关或核酸 或蛋白质。用于检测和测量检测标签产生的信号的方法也是本领域技术人 员已知的。例如,可以通过闪烁计数或直接显示法来检测放射性同位素; 可用荧光分光光度计来检测荧光分子;可用分光光度计或直接照相的方法 检测磷光分子;可通过直接检测或可视化酶促反应的产物来检测酶。可通 过检测与抗体偶联的次级检测标签来检测抗体。本文所述的检测分子为与 偶联了一个或多个检测标签的待测化合物或组合物相互作用的分子。
I.序列相似性
应当理解的是,本文所使用的术语同源性和同一性的含义是相同的, 都是指相似性。因此,例如,如果在两个序列(例如非天然序列)之间使 用同源性这一词语,应当理解这并不一定是指着两个序列之间在进化上相 关,而是着眼于它们的核酸序列之间的相似性或关联。为了测量序列的相 似性,确定两个进化上相关的分子之间相似性的很多方法都可以常规地应 用于两个或多个核酸或蛋白质,而无需考虑它们在进化上是否相关。
总体而言,应当理解的是,为了定义本文所公开的核糖开关、适体、 表达平台、基因和蛋白质的已知变异体和衍生物或可能出现的种类,一种 方法是通过变异体和衍生物与特定已知序列的同源性方面来定义。本文公 开的具体序列的这种同源性在本文其他部分也有所讨论。总体而言,本文 所公开的核糖开关、适体、表达平台、基因和蛋白质的变异体与指定序列 或天然序列有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%的同源性。本领域技术人员很容易 明白如何测定两种蛋白质或例如基因的核酸之间的同源性。例如,可以在 序列比对并使同源性达到最高水平后计算同源性。
计算同源性的另一种方法可以通过公开的算法进行。可使用下列算法 进行用于比较的序列优化比对:Another way of calculating homology can be performed by published algorithms.Optimal alignment of序列for comparison can be conducted by the local homology algorithm of Smith and Waterman Adv.Appl.Math.2:482(1981)中所述的局部同源性算法; Needleman and Wunsch,J.MoL Biol.48:443(1970)中所述的同源性比 对算法;Pearson and Lipman,Proc.Natl.Acad.Sci.U.S.A.85:2444 (1988)中所述的相似性检索方法;或者这些算法的计算机实现形式 (Wisconsin Genetics软件包中的GAP、BESTFIT、FASTA和TFASTA, Genetics Computer Group,575 Science Dr.,Madison,WI);或者通 过审查的方式进行。
通过例如Zuker,M.Science 244:48-52,1989;Jaeger et al.Proc. Natl.Acad.Sci.USA 86:7706-7710,1989;Jaeger et al.Methods Enzymol.183:281-306,1989中公开的算法,可以获得核酸的相同类型的 同源性,上述文献中至少与核酸比对有关的资料以援引的方式纳入本文。 应当理解的是,通常可以使用任何方法,而在某种情况下这些不同的方法 所得到的不同结果可能不同,但是本领域技术人员能够理解,如果使用上 述方法中的至少一种发现了同一性,则该序列可被称为具有指定的同一性。
例如,如本文所使用的,所述的具有与另一序列相比的特定百分比同 源性的序列,是指具有由上述任意一种或多种计算方法所计算出的所述同 源性的序列。例如,如果使用Zuker计算方法,第一序列被计算为具有与 第二序列相比的80%的同源性,即使按照其他任何计算方法计算出该第一 序列与第二序列相比都不具有80%的同源性,那么,如本文所定义的,第 一序列也仍具有与第二序列相比的80%的同源性。另一个实例,如果使用 Zuker计算方法和Pearson和Lipman计算方法,第一序列被计算为具有与 第二序列相比的80%的同源性,即使通过Smith和Waterman计算方法、 Needleman和Wunsch计算方法、Jaeger计算方法或任意其他计算方法计算, 第一序列不具有与第二序列相比的80%的同源性,那么,如本文所定义的, 第一序列也仍具有与第二序列相比的80%的同源性。再一个实例,如果使 用每一种计算方法,第一序列都被计算为具有与第二序列相比的80%的同 源性(尽管实际上不同的计算方法常得到不同的计算的同源性百分比),那 么如本文所定义的,第一序列具有与第二序列相比的80%的同源性。
J.杂交和选择性杂交
术语杂交通常意为至少两种核酸分子例如引物或探针与核糖开关或基 因间的序列驱动的相互作用。序列驱动的相互作用意为:以核苷酸特异性 的方式发生于两种核苷酸或核苷酸类似物或核苷酸衍生物间的相互作用。 例如G与C相互作用或者A与T相互作用即为序列驱动的相互作用。通常 序列驱动的相互作用发生于核苷酸的沃森-克里克面或Hoogsteen面。两种 核酸的杂交受到本领域技术人员所知的许多条件和参数的影响。例如盐浓 度、pH和反应温度均会影响两种核酸分子是否会杂交。
两种核酸分子间的选择性杂交的参数为本领域技术人员所熟知。例如, 在一些实施方案中选择性杂交条件可被定义为严格杂交的条件。例如,杂 交的严格性是通过杂交和/或洗涤步骤的温度和盐浓度共同控制的。例如实 现选择性杂交的杂交条件可包括在比Tm(解链温度,在该温度下一半的分 子与其杂交配对的另一部分解离)低大约12-25℃的温度下,在高离子强 度溶液(6×SSC或6×SSPE)中杂交,然后在所选的温度和盐浓度的组合 的条件下洗涤,此时洗涤温度为比Tm低大约5℃至20℃。在预实验中,可 根据经验容易地确定温度和盐浓度条件,在该实验中使固定在滤膜上的参 照DNA的样品与带标记的目的核酸杂交,然后在不同严格度的条件下洗涤。 对于DNA-RNA杂交和RNA-RNA杂交而言杂交温度通常较高一些。可使用如 上所述的或本领域已知的(Sambrook et al.,Molecular Cloning:A Laboratory Manual,2nd Ed.,Cold Spting Harbor Laboratory,Cold Spring Harbor,New York,1989;Kunkel et al.Methods Enzymol. 1987:154:367,1987,上述文献中至少与核酸杂交相关的资料通过援引的 方式纳入本文)条件以达到严格度。优选的DNA:DNA杂交的严格条件可以 是在约68℃(水溶液中),在6×SSC或6×SSPE中杂交,之后在68℃洗涤。 如果需要,当所需的互补程度降低时,杂交和洗涤的严格性可作相应减小, 并且还根据寻找可变性的任何区域中的G-C或A-T的丰富程度而定。同样, 如果需要,当所需的同源性增大时,杂交和洗涤的严格性可作相应增加, 并且还根据需要高同源性的任何区域中的G-C或A-T的丰富程度而定,所 有这些均为本领域已知。
另一种定义选择性杂交的方法是通过着眼于一种核酸与其他核酸结合 的量(百分比)。例如,在一些实施方案中选择性杂交的条件可以为至少约 60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、 81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、100%的限量核酸与非限量核酸结合时的 条件。通常非限量核酸要过量例如10或100或1000倍。这类测定可在限 量核酸和非限量核酸均比它们的kd低例如10倍或100倍或1000倍时进行, 或者只是一种核酸分子为比它的kd低例如10倍或100倍或1000倍时进行, 或两种核酸分子之一或两者均在kd之上时的条件下进行。
另一种定义选择性杂交的方法是通过着眼于核酸的百分比,所述核酸 是在需要杂交以促进所需的酶操作的条件下得到酶操作的核酸。例如,在 一些实施方案中选择性杂交条件可以是至少约60%、65%、70%、71%、72%、 73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%、100%的核酸在促进酶操作的条件下进行酶操作时的条件,例如,如果 酶操作是DNA延伸,那么选择性杂交条件可以是至少约60%、65%、70%、 71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、 84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%、100%的核酸分子被延伸时的条件。优选的条件还包括厂商 所建议的或本领域所指出的适于酶进行操作的条件。
正如同源性一样,应当理解本文公开的用于确定两种核酸分子间的杂 交水平的方法有许多种。应当理解这些方法和条件可提供不同百分比的两 种核酸分子间的杂交,但是除非另外指明,否则满足任何方法的参数都是 足够的。例如,如果需要80%杂交并且只要在这些方法的任意一种中所要 求的参数内发生杂交,就认为它在本文得到了公开。
应当理解,本领域技术人员知道,如果组合物或方法满足用于单独或 联合确定杂交的这些标准的任意一条,那么它就是本文所公开的组合物或 方法。
K.核酸
本文公开了基于核酸的多种分子,包括例如核糖开关、适体以及编码 核糖开关和适体的核酸。所公开的核酸由例如核苷酸、核苷酸类似物或核 苷酸替代物构成。本文讨论了这些分子及其他分子的非穷尽性实例。应当 理解,例如当载体在细胞中表达时,表达的mRNA通常由A、C、G和U组成。 同样,应当理解,如果核酸分子通过例如外源性送递被导入细胞或细胞环 境中,那么核酸分子由核苷酸类似物构成是有利的,这样可减少核酸分子 在细胞环境中的降解。
只要保留了它们相关的功能,核糖开关、适体、表达平台以及任何 其他寡核苷酸和核酸都可以由经修饰的核苷酸(核苷酸类似物)构成或 含有经修饰的核苷酸(核苷酸类似物)。很多经修饰的核苷酸是已知的, 并可被用于寡核苷酸和核酸之中。核苷酸类似物是含有对碱基、糖或磷 酸部分的一些类型的修饰的核苷酸。对碱基部分的修饰可以包括对A、C、 G和T/U的天然性或合成性修饰,以及使用不同的嘌呤或嘧啶碱,例如尿 嘧啶-5-基、次黄嘌呤-9-基(I)和2-氨基腺嘌呤-9-基。经修饰的碱基 包括但不限于:5-甲基胞嘧啶(5-me-C);5-羟甲基胞嘧啶;黄嘌呤;次 黄嘌呤;2-氨基腺嘌呤;腺嘌呤和鸟嘌呤的6-甲基或其他烷基衍生物; 腺嘌呤和鸟嘌呤的2-丙基或其他烷基衍生物;2-硫尿嘧啶;2-硫胸腺嘧 啶和2-硫胞嘧啶;5-卤素尿嘧啶和5-卤素胞嘧啶;5-丙炔基尿嘧啶和5- 丙炔基胞嘧啶;6-偶氮基尿嘧啶、6-偶氮基胞嘧啶和6-偶氮基胸腺嘧啶; 5-尿嘧啶(假尿嘧啶);4-硫尿嘧啶;腺嘌呤和鸟嘌呤的8-卤素、8-氨基、 8-硫代、8-硫代烷基、8-羟基以及其他8-取代物;尿嘧啶和胞嘧啶的5- 卤素特别是5-溴、5-三氟甲基和其他的5-取代物;7-甲基鸟嘌呤和7-甲 基腺嘌呤;8-氮杂鸟嘌呤和8-氮杂腺嘌呤;7-脱氮鸟嘌呤(7- deazaguanine)和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。其他 的碱基修饰物可见于例如美国专利No.3,687,808、Englisch et al., Angewandte Chemie,International Edition,1991,30,613、Sanghvi, Y.S.,Chapter 15,Antisense Research and Applications,pages 289-302、Crooke,S.T.and Lebleu,B.ed.,CRC Press,1993。某些 核苷酸类似物例如:5-取代的嘧啶、6-氮杂嘧啶;和N-2、N-6和O-6取代 的嘌呤包括2-氨基丙基腺嘌呤;5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5- 甲基胞嘧啶可以增加双链体形成的稳定性。其他经修饰的碱基是那些有通 用碱基功能的碱基。通用碱基包括3-硝基吡咯和5-硝基吲哚。通用碱基可 取代正常的碱基,但在碱基配对上没有偏好性。也就是说通用碱基可以与 其他任何碱基进行碱基配对。碱基修饰经常可与例如糖修饰结合使用,例 如2’-O-甲氧基乙基,以获得独特的属性例如提高的双链体稳定性。有多个 美国专利具体描述了很多碱基修饰,例如4,845,205、5,130,302、 5,134,066、5,175,273、5,367,066、5,432,272、5,457,187、5,459,255、 5,484,908、5,502,177、5,525,711、5,552,540、5,587,469、5,594,121、 5,596,091、5,614,617和5,681,941。以上各专利文献的每一篇的全部内 容都以援引的方式纳入本文,并且特别是这些文献中关于碱基修饰及其合 成、用途和将其导入寡核苷酸和核酸的描述也以援引的方式纳入本文。
核苷酸类似物还可包括糖部分的修饰。对糖部分的修饰可包括核糖和 脱氧核糖的天然性修饰及合成性修饰。糖修饰包括但不限于在2’位置的下 列修饰:OH;F;O-烷基、S-烷基或N-烷基;O-烯基、S-烯基或N-烯基; O-炔基、S-炔基或N-炔基;或O-烷基-O-烷基,其中所述烷基、烯基和炔 基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。2’糖修 饰还包括但不限于-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、 -O(CH2)n-ONH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m在1至大约10之间。
在2’位置的其他修饰包括但不限于:C1至C10低级烷基、取代的低级 烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、 CN、CF3、OCF3、SOCH3、SO2 CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳 基、氨基烷基氨基、聚烷基氨基、取代的甲烷基、RNA切割基团、报告 基团、插入剂、可提高寡核苷酸药物动力学性质的基团或可提高寡核苷酸 药物动力学性质的基团和其他具有类似性质的基团。还可以在糖的其他位 置进行类似的修饰,特别是在3’端核苷酸上的糖3的3’位置,或者在5’核 苷酸的2’-5’连接的寡核苷酸和5’位置。经修饰的糖可含有那些在环氧桥位 置用例如CH2和S进行的修饰。核苷酸糖类似物还可具有糖模拟物,例如用 环丁基部分代替五碳呋喃糖。有许多美国专利都教导了这类经修饰的糖结 构的制备,例如4,981,957、5,118,800、5,319,080、5,359,044、5,393,878、 5,446,137、5,466,786、5,514,785、5,519,134、5,567,811、5,576,427、 5,591,722、5,597,909、5,610,300、5,627,053、5,639,873、5,646,265、 5,658,873、5,670,633和5,700,920,以上各专利文献的每一篇的全部内 容都以援引的方式纳入本文,并且特别是这些文献中关于经修饰的糖结构 及其合成、用途和将其导入核苷酸、寡核苷酸和核酸的描述也以援引的方 式纳入本文。
核苷酸类似物可以在磷酸部分加以修饰。经修饰的磷酸部分包括但不 限于经过修饰而使得在两个核苷酸之间的连接部分含有下列结构的磷酸部 分,所述结构包括:磷硫酰;手性磷硫酰;二硫代磷酸酯;磷酸三酯;氨 烷基磷酸三酯;磷酸甲酯和磷酸与其他烷基醇形成的酯,包括磷酸3’-乙烯 酯和手性磷酸酯;磷化氢;磷酸酯,包括3’-氨基氨基磷酸酯(3’-amino phosphoramidate)和氨烷基氨基磷酸酯(aminoalkylphosphoramidate)、 硫代氨基磷酸酯(thionophosphoramidates)、硫代烷基磷酸酯 (thionoalkylphosphonates)、硫代烷基磷酸三酯 (thionoalkylphosphotriesters)和硼烷磷酸酯(boranophosphates)。 应当理解的是,在两个核苷酸之间的这些磷酸连接或经修饰的磷酸连接可 以通过3’-5’连接或2’-5’连接,连接可以包括极性的倒转,例如3’-5’至5’-3’ 或者2’-5’至5’-2’。还包括各种盐形式、混合盐形式和游离酸形式。许多 美国专利教导了如何制备和使用含有经修饰磷酸的核苷酸,包括但不限于: 3,687,808、4,469,863、4,476,301、5,023,243、5,177,196、5,188,897、 5,264,423、5,276,019、5,278,302、5,286,717、5,321,131、5,399,676、 5,405,939、5,453,496、5,455,233、5,466,677、5,476,925、5,519,126、 5,536,821、5,541,306、5,550,111、5,563,253、5,571,799、5,587,361 和5,625,050,以上各专利文献的每一篇的全部内容都以援引的方式纳入 本文,并且特别是这些文献中关于经修饰的磷酸及其合成、用途和将其导 入核苷酸、寡核苷酸和核酸的描述也以援引的方式纳入本文。
应当理解的是,核苷酸类似物仅需要包括一种修饰,但是也可以在一 个部分或几个不同部分中包括多种修饰。
核苷酸替代物为与核苷酸具有类似功能特性但不含有磷酸部分的分 子,例如肽核酸(PNA)。核苷酸替代物分子可以以Watson-Crick方式或 Hoogsteen方式识别互补性核酸并与互补性核酸杂交(碱基配对),但是它 们通过不是核酸的部分连接起来。核苷酸替代物在与合适的靶核酸相互作 用时能够形成双螺旋形结构。
核苷酸替代物为磷酸部分和/或糖部分被替换的核苷酸或核苷酸类似 物。核苷酸替代物不包括标准的磷原子。磷酸的替代物可为例如:短链烷 基或环烷基核苷间连接物、混合杂原子和烷基或环烷基核苷间连接物、或 一个或多个短链杂原子或杂环核苷间连接物。这些连接物可包括具有下列 结构的连接物:吗啉代连接物(形成核苷的糖部分的一部分);硅氧烷骨架; 硫化物、亚砜和砜骨架;甲酰基(formacetyl)和硫甲酰基 (thioformacetyl)骨架;亚甲基甲酰基和硫甲酰基骨架;含烯烃骨架; 氨基磺酸盐骨架;亚甲基亚胺基和亚甲基肼基骨架;磺酸和磺胺骨架;酰 胺骨架;以及其他带有混合的N、O、S和CH2组成部分的连接物。许多美 国专利公开了如何制备和使用这些种类的磷酸替换物,包括但不限于: 5,034,506、5,166,315、5,185,444、5,214,134、5,216,141、5,235,033、 5,264,562、5,264,564、5,405,938、5,434,257、5,466,677、5,470,967、 5,489,677、5,541,307、5,561,225、5,596,086、5,602,240、5,610,289、 5,602,240、5,608,046、5,610,289、5,618,704、5,623,070、5,663,312、 5,633,360、5,677,437和5,677,439,以上各专利文献的每一篇的全部内 容都以援引的方式纳入本文,并且特别是这些文献中关于磷酸替换物及其 合成、用途和将其导入核苷酸、寡核苷酸和核酸的描述也以援引的方式纳 入本文。
应当理解的是,在核苷酸替代物中糖部分和磷酸部分都可以被例如酰 胺型连接物(氨基乙基甘氨酸)(PNA)所替换。美国专利5,539,082、 5,714,331和5,719,262教导了如何制备和使用PNA分子,上述文献的每 一篇都以援引的方式纳入本文。(还可参见Nielsen et al.,Science 254:1497-1500(1991))。
寡核苷酸和核酸可以包括核苷酸,并可以由不同类型或相同类型的核 苷酸构成。例如,在寡核苷酸中,一个或多个核苷酸可以是核糖核苷酸、 2’-O-甲基核糖核苷酸或核糖核苷酸和2’-O-甲基核糖核苷酸的混合物;大 约10%至约50%的核苷酸可以是核糖核苷酸、2’-O-甲基核糖核苷酸或核糖 核苷酸和2’-O-甲基核糖核苷酸的混合物;大约50%或50%以上的核苷酸可 以是核糖核苷酸、2’-O-甲基核糖核苷酸或核糖核苷酸和2’-O-甲基核糖核 苷酸的混合物;或者全部核苷酸可以是核糖核苷酸、2’-O-甲基核糖核苷酸 或核糖核苷酸和2’-O-甲基核糖核苷酸的混合物。这类寡核苷酸和核酸可被 称为嵌合核苷酸和嵌合核酸。
L.固体支持物
固体支持物为固态基质或支持物,分子(例如触发分子)和核糖开关 (或其他由所公开的方法产生的或在所公开的方法中使用的组件)可以与 支持物相连接。核糖开关和其他分子可以直接或间接地与支持物相连接。 例如,分析物(例如触发分子,待测化合物)可以结合到固体支持物表面 或与固定在固体支持物上的捕获试剂(例如结合分析物的化合物或分子) 相连接。作为另一个实例,核糖开关可以结合到固体支持物表面或与固定 在固体支持物上的探针相连接。多个核糖开关、探针或其他分子以阵列、 网格或其他组织形式连接到固体支持物上就构成了阵列。
可用于固体支持物的固态基质可以包括可以与组件直接或间接连接的 任何固体材料。这包括下述材料,例如丙烯酰胺、琼脂糖、纤维素硝酸 纤维素、玻璃、金、聚苯乙烯、聚乙烯乙酸乙烯、聚丙烯、聚甲基丙烯酸 酯、聚乙烯、聚氧化乙烯、聚硅酸盐、聚碳酸酯、特氟隆(聚四氟乙烯树 脂),碳氟化合物、尼龙、硅橡胶、聚酐、聚乙醇酸、聚乳酸、聚原酸酯、 官能化硅烷、聚丙基延胡索酸盐(polypropylfumerate)、胶原、糖胺聚糖 和聚氨基酸。固态基质可为任何可用的形式,包括薄膜、膜、瓶、盘、纤 维、编织纤维、成型聚合物、颗粒、微球、微颗粒或它们的组合。固态基 质和固体支持物可为有孔的和无孔的。芯片是一小片长方形或正方形的材 料。优选的固态基质的形式为薄膜、微球或芯片。一种可用于固态基质的 形式是微量滴定板。在一些实施方案中,可以使用多孔玻璃板。
阵列可包括多个固定于固体支持物的确定位置或预定位置的核糖开 关、触发分子、其他分子、化合物或探针。固体支持物上的每个预定位置 通常具有一种类型的组件(即在该位置的所有组件都是相同的)。或者,在 固体支持物上的同一预定位置可以固定化多种类型的组件。每一位置可以 具有给定组件的多个拷贝。在固体支持物上的不同组件的空间隔离使得可 以进行分别的检测和识别。
固体支持物为一个单独的单位或结构虽然是有用的,但不是必需的。 一系列的核糖开关、触发分子、其他分子、化合物和/或探针可以分布于任 意数目的固体支持物上。例如,一种极端的情况是每一个组件可被固定于 分离的反应管或容器中,或在分离的微球或微颗粒上。
将寡核苷酸固定化于固态基质的方法已广为人知。可使用已知的偶联 方法将包括定位探针(address probe)和检测探针的寡核苷酸偶联至基质 上。例如,合适的固定方法描述于Pease et al,Proc.Natl.Acad.Sci. USA 91(11):5022-5026(1994)和Khrapko et al.,MoI Biol(Mosk)(USSR) 25:718-730(1991)。一种将3’-胺寡核苷酸固定于酪蛋白包被的玻片上的 方法描述于Stimpson et al,Proc.Natl.Acad.Sci.USA 92:6379-6383 (1995)。一种将寡核苷酸附着于固态基质上的可用的方法描述于Guoet al, Nucleic Acids Res.22:5456-5465(1994)。
固定于固体支持物上的每一组件(例如,核糖开关、触发分子或其他 分子)可以位于固体支持物的不同预定区域。不同的位置可以是不同的反 应室。每一不同的预定区域可以与其他不同的预定区域在物理上彼此分离。 固体支持物上的不同预定区域之间的距离可以是固定的,也可以是可变的。 例如,在阵列中每一组件可以彼此之间以固定距离排列,而与微球相连接 的组件就不会有固定的空间关系。特别地,多个固体支持物单位(例如多 个微球)的使用方式会导致不同的距离。
组件可以以任何密度连接于或固定于固体支持物上。组件固定于固体 支持物上的密度可以超过每立方厘米400个不同组件。组件的阵列可以有 任何数目的组件。例如,阵列可以具有至少1,000个固定于固体支持物的 不同组件、至少10,000个固定于固体支持物的不同组件、至少100,000个 固定于固体支持物的不同组件或至少1,000,000个固定于固体支持物的不 同组件.
M.试剂盒
上文所述的材料和其他材料可以以任意合适的组合被包装在一起,作 为用于进行或辅助进行所公开方法的试剂盒。如果给定试剂盒被设计和调 整为在所公开的方法中一起使用将是有用的。例如公开了用于检测化合物 的试剂盒,该试剂盒包括一种或多种生物传感器核糖开关。该试剂盒还可 包括检测核糖开关的激活的试剂和标签。
N.混合物
公开了通过实行或准备实行所公开方法而形成的混合物。例如,公开 了包括核糖开关和触发分子的混合物。
不论何时,只要方法包括使组合物或组件或试剂混合或相接触,实行 该方法就会产生多种不同的混合物。例如,如果方法包括3个混合步骤, 如果各步骤分别进行,则在上述步骤的每一步之后都会形成一种特有的混 合物。此外,不论各步骤如何进行,在所有步骤完成之后也会形成一种混 合物。本发明的公开内容考虑了由实行所公开方法所获得的这些混合物, 以及含有例如本文所公开的试剂、组合物或组件的混合物。
O.系统
公开了用于实行或辅助实行所公开方法的系统。系统通常包括制造的 物体的组合例如结构、机械、装置等,以及组合物、化合物、材料等。这 些组合为已公开的或从公开考虑的内容可以显而易见的。例如,公开了和 考虑了包括生物传感器核糖开关、固体支持物和信号读取装置的系统。
P.数据结构和计算机控制
公开了所公开方法中使用的、由所公开方法产生的或从所公开方法中 产生的数据结构。数据结构通常可为在组合物或介质中采集、编组、储存 和/或体现的任何形式的数据、信息和/或对象。以例如RAM或存储磁盘的 电子形式储存的核糖开关的结构和激活测量结果就是一种类型的数据结 构。
所公开的方法或其任意部分或由该方法制备的制品,都可以通过计算 机控制来进行控制、管理或辅助。这类计算机控制可以通过计算机控制过 程或方法来实现,可以使用和/或产生数据结构,并可以使用计算机程序。 这类计算机控制、计算机控制的过程、数据结构和计算机程序都被考虑到 并应理解为在本文中被公开。
方法
公开了用于激活、失活或阻断核糖开关的方法。这类方法可包括例如 使核糖开关和可激活、失活或阻断该核糖开关的化合物或触发分子相接触。 核糖开关通过触发分子的结合或移除来发挥控制基因表达的功能。化合物 可用于激活、失活或阻断核糖开关。核糖开关的触发分子(以及其他的激 活化合物)可被用于激活核糖开关。通常可使用触发分子以外的化合物来 失活或阻断核糖开关。还可以通过例如从核糖开关所在处移除触发分子 来失活核糖开关。因此,所公开的失活核糖开关的方法可以包括例如从核 糖开关所在的位置或与核糖开关接触的位置移除触发分子(或其他激活 化合物)。可以通过不激活核糖开关的触发分子类似物的结合来阻断核糖开 关。
还公开了通过使化合物与RNA分子相接触,从而改变RNA分子表达 或改变编码RNA分子的基因表达的方法,其中所述RNA分子包括核糖开 关。核糖开关通过结合或移除触发分子而实现控制基因表达的功能。因 此,将包括核糖开关的目的RNA分子置于可激活、失活或阻断核糖开关 的条件下就可用来改变RNA的表达。例如转录终止或核糖体与RNA的结 合被阻断可以导致表达被改变。根据核糖开关的性质,与触发分子的结 合可以减少或阻止RNA分子的表达或者促进或增加RNA分子的表达。
还公开了通过将核糖开关与RNA分子可操作地连接,来调节RNA分子 或编码NRA分子的基因的表达的方法。核糖开关可与RNA分子以任何合适 的方式可操作地连接,所述方式包括例如通过将核糖开关与RNA分子物理 连接,或者通过将编码RNA分子的基因用基因工程改造使其包括和编码核 糖开关,这样由基因工程改造的核酸产生的RNA就具有了与RNA分子可操 作连接的核糖开关。将与目的RNA分子可操作连接的核糖开关置于可激 活、失活或阻断核糖开关的条件下就可用来改变RNA的表达。
还公开了通过激活、失活或阻断核糖开关,来调节含有核糖开关的天 然存在的基因或RNA的表达的方法。如果该基因对含有该基因的细胞或生 物的存活而言十分重要,那么激活、失活或阻断该核糖开关可导致细胞或 生物的死亡、停滞或虚弱。例如(如果该核糖开关的激活关闭或抑制表达), 激活某个对微生物的存活而言十分重要的天然存在的基因中的天然存在的 核糖开关,可能导致该微生物的死亡。这是所公开的化合物和方法用于抗 微生物和抗生素效果的一个理论基础。
还公开了通过激活、失活或阻断核糖开关,来调节含有核糖开关的分 离的、基因工程改造的或重组的基因或RNA的表达的方法。基因或RNA可 通过任何方式进行基因工程改造或重组。例如,核糖开关和RNA的编码区 域可以是异源的,核糖开关可被重组或嵌合或二者均有。如果基因编码一 种所需的表达产物,则激活或失活该核糖开关可被用于诱导该基因的表达, 并由此导致表达产物的产生。如果该基因编码对于基因表达或另一细胞过 程的一种诱导物或抑制物,则激活、失活或阻断该核糖开关可导致其他被 调节基因或细胞过程的诱导、抑制或脱抑制。已知多种这样的次级调节效 应,它们也可适用于核糖开关。核糖开关作为这类调节的初级控制的一个 优势是核糖开关的触发分子可为小的非抗原性分子。
还公开了通过将适体结构域与核糖开关的表达平台结构域可操作地连 接(为嵌合核糖开关),来改变核糖开关的调节的方法。这样该适体结构域 可以通过例如适体结构域的触发分子的作用介导核糖开关的调节。适体结 构域可以以任何合适的方式与核糖开关的表达平台结构域可操作地连接, 所述方式包括例如用新的适体结构域替换核糖开关的正常的或天然的适体 结构域。通常,可以激活、失活或阻断该适体结构域所来源的核糖开关的 任何化合物或条件都可被用于激活、失活或阻断该嵌合核糖开关。
还公开了通过共价改变核糖开关(通过例如交联核糖开关的部分或将 一种化合物偶联至核糖开关)来灭活核糖开关的方法和组合物。这种方式的 核糖开关的灭活可由例如一些改变来获得,所述改变阻止了核糖开关的触 发分子的结合,阻止了核糖开关与触发分子结合后的状态改变,或阻止了在 与触发分子结合后核糖开关的表达平台结构域对表达的影响。
还公开了筛选、设计或产生可以识别新的触发分子的新核糖开关和/ 或新适体的方法。这类方法可包括:在核糖开关中产生一系列适体变异体、 在目的化合物存在的条件下评估变异体核糖开关的激活、筛选被激活的变 异体核糖开关(或者例如筛选激活度最高或激活选择性最强的核糖开关) 和重复上述步骤,直至得到具有所需活性、特异性、活性和特异性的结合 或其他性质的结合的变异体核糖开关。还公开了由上述方法生产的核糖开 关和适体结构域。
功能性核酸分子的体外筛选和体外进化技术是已知的,并且可以适于 与核糖开关及其组件一起使用。可用的技术描述于例如下列文献中:A. Roth and R.R.Breaker(2003)Selection in vitro of allosteric ribozymes.In:Methods in Molecular Biology Series-Catalytic Nucleic acid Protocols(Sioud,M.,ed.),Humana,Totowa,NJ;R.R. Breaker(2002)Engineered Allosteric Ribozymes as Biosensor Components.Curr.Opin.Biotechnol.13:31-39;G.M.Emilsson and R. R.Breaker(2002)Deoxyribozymes:New Activities and New Applications.Cell.Mol.Life Sci.59:596-607;Y.Li,R.R.Breaker (2001)In vitro Selection of Kinase and Ligase Deoxyribozymes. Methods 23:179-190;G.A.Soukup,R.R.Breaker(2000)Allosteric Ribozymes.In:Ribozymes:Biology and Biotechnology.R.K.Gaur and G.Krupp eds.Eaton Publishing;G.A.Soukup,R.R.Breaker(2000) Allosteric Nucleic Acid Catalysts.Curr.Opin.Struct.Biol. 10:318-325;G.A.Soukup,R.R.Breaker(1999)Nucleic Acid Molecular Switches.Trends Biotechnol.17:469-476;R.R.Breaker(1999)In vitro Selection of Self-cleaving Ribozymes and Deoxyribozymes.In: Intracellular Ribozyme Applications:Principles and Protocols.L. Couture,J.Rossi eds.Horizon Scientific Press,Norfolk,England; R.R.Breaker(1997)In vitro Selection of Catalytic Polynucleotides. Chem.Rev.97:371-390;以及它们的参考文献,上述出版物的每一篇基于 它们对于体外筛选和进化技术的描述而被特别地以援引的方式纳入本文。
还公开了用于筛选和识别可以激活、失活或阻断核糖开关的化合物 的方法。核糖开关的激活指的是结合触发分子后核糖开关状态的改变。 核糖开关可被触发分子以外的其他化合物激活和以结合触发分子以外的 其它方式激活。本文使用的术语触发分子指的是可以激活核糖开关的分 子和化合物。这包括核糖开关的天然或正常的触发分子和其它可激活核 糖开关的化合物。天然或正常的触发分子是指给定的天然核糖开关的触 发分子,或者对于一些非天然核糖开关而言,是指设计该核糖开关时所 针对的触发分子或筛选该核糖开关时使用的触发分子(筛选通过例如体 外筛选或体外进化技术)。非天然触发分子可被称为非天然触发分子。
还公开了识别与核糖开关相互作用的化合物的方法,包括利用待测 化合物和核糖开关的原子结构进行建模并确定待测化合物与核糖开关是 否相互作用。确定待测化合物与核糖开关是否相互作用可通过例如本文 其他部分所述的确定核糖开关模型中待测化合物的预计最小相互作用 能、预计结合常数、预计解离常数或它们的组合来实现。确定待测化合 物与核糖开关是否相互作用还可通过例如测定待测化合物和核糖开关模 型中的一个或多个预计的键、一种或多种预计的相互作用或它们的组合 来实现。预计的相互作用可以选自例如前文所述的范德华相互作用、氢 键、静电相互作用、疏水相互作用或它们的组合。在一个实例中,核糖 开关是鸟嘌呤核糖开关。
在测定与核糖开关的相互作用时可以测定原子接触,由此测定待测化 合物与核糖开关的相互作用。可以识别待测化合物的类似物,并可以确定 待测化合物的类似物是否与核糖开关相互作用。
还公开了杀死或抑制细菌的方法,包括将细菌与本文公开的化合物或 由本文公开方法识别的化合物相接触。
还公开了识别与核糖开关相互作用的化合物的方法,包括:识别核糖 开关的晶体结构、用核糖开关与待测化合物建模和确定待测化合物是否与 核糖开关相互作用。核糖开关的失活指的是触发分子不再结合时核糖开关 的状态的改变。核糖开关可通过与触发分子以外的其他化合物结合失活 和以移除触发分子以外的其它方式失活。核糖开关的阻断指的是核糖开 关的一种状态或情况,此时存在触发分子却不激活核糖开关。
还公开了识别可激活、失活或阻断核糖开关的化合物的方法。例如,可 以通过使待测化合物和核糖开关相接触并评估核糖开关的激活来识别可激 活核糖开关的化合物。如果核糖开关被激活,则待测化合物被识别为可激活 核糖开关的化合物。可以以任意合适的方式评估核糖开关的激活。例如,核 糖开关可以与报告RNA相连接,并可在存在和不存在待测化合物的条件下 测量报告RNA的表达、表达水平或表达水平的改变。作为另一个实例,核 糖开关可包括构象依赖性标签,由该标签产生的信号依赖于核糖开关的激 活状态。优选地,这种核糖开关使用天然存在的核糖开关的适体结构域或 由天然存在的核糖开关衍生的适体结构域。由此可见,可以使用对照测定 或测量或者不使用对照测定或测量来进行核糖开关激活的评估。识别可以 失活核糖的开关化合物的方法可以以类似的方式进行。
除了本文其他部分公开的方法之外,对阻断核糖开关的化合物的识别 可以以任何合适的方式完成。例如,可以在存在已知可激活或失活核糖开 关的化合物以及存在待测化合物的条件下来进行用于评估核糖开关的激活 或失活的分析。如果没有观察到如同在不存在待测化合物的情况下应当观 察到的激活或失活情况,则该待测化合物被识别为可阻断核糖开关的激活 或失活的化合物。
还公开了使用生物传感器核糖开关检测化合物的方法。该方法可包括 使待测样本和生物传感器核糖开关相接触,并评估生物传感器核糖开关的 激活。生物传感器核糖开关的激活表明在待测样本中存在该生物传感器核 糖开关的触发分子。生物传感器核糖开关是经过基因工程改造的核糖开关, 它们在存在它们的同种触发分子时产生可检出的信号。可用的生物传感器 核糖开关可以在触发分子达到或超过阈值水平时被触发。生物传感器核糖 开关可被设计为体内应用或体外应用。例如,报告RNA编码作为信号的蛋 白质或参与产生信号的蛋白质,与该报告RNA可操作地连接的生物传感器 核糖开关可在体内被用于通过基因工程改造细胞或生物,使其含有编码核 糖开关/报告RNA的核酸构建体。用于体外的生物传感器核糖开关的一个实 例是包括构象依赖性标签的核糖开关,由该标签产生的信号依赖于核糖开 关的激活状态。优选地,这种生物传感器核糖开关使用天然存在的核糖开 关的适体结构域或由天然存在的核糖开关衍生的适体结构域。
生物传感器核糖开关可被用于监测变化的条件,因为当触发分子的浓 度降低时核糖开关的激活是可逆的,所以信号会随着触发分子浓度的变化 而变化。可以通过基因工程改造出对触发分子有不同解离常数的核糖开关, 从而得到不同的可检测的触发分子浓度范围。这可以容易地通过例如“降 解”对触发分子具有高亲和力的核糖开关的敏感度来实现。通过在同一感 受器或测定中使用不同敏感度的多个生物传感器核糖开关可以监测浓度的 范围。
还公开了由识别激活、失活或阻断核糖开关的化合物和对识别出的化 合物进行加工而制备的复合物。这可以通过例如将本文其他部分公开的化 合物识别方法与对识别出的化合物进行加工的方法结合使用而实现。例如, 可通过下述方法制备复合物:使待测化合物和核糖开关相接触,评估核糖 开关的激活,以及如果核糖开关被待测化合物激活,则制备该激活核糖开 关待测化合物作为复合物。
还公开了由核实某种化合物对核糖开关的激活、失活或阻断作用和对 经核实的化合物进行加工而制备的复合物。这可以通过例如将本文其他部 分公开的化合物激活、失活或阻断评估方法与对经核实化合物的加工方法 结合使用而实现。例如,可通过下述方法制备复合物:使待测化合物和核 糖开关相接触,评估核糖开关的激活,以及如果核糖开关被待测化合物激 活,则制备该激活核糖开关待测化合物作为复合物。核实化合物激活、失 活或阻断核糖开关的能力指的是对以前并不知道可否激活、失活或阻断核 糖开关的化合物的鉴定,以及对已知可激活、失活或阻断核糖开关的化合 物激活、失活或阻断核糖开关的能力的评估。
公开了一种检测目的化合物的方法,所述方法包括将样本与核糖开关 相接触,其中核糖开关被目的化合物激活,其中核糖开关在被目的化合物 激活时产生信号,其中当样本中含有目的化合物时核糖开关产生信号。核 糖开关可在被目的化合物激活时改变构象,其中构象的改变会通过构象依 赖性标签产生信号。核糖开关可在被目的化合物激活时改变构象,其中构 象的改变导致与核糖开关相连的RNA的表达的改变,其中表达的改变产生 信号。信号可以由与核糖开关相连的RNA表达的报告蛋白产生。
公开了一种方法,包括(a)检测可以抑制编码包括核糖开关的RNA的基 因的基因表达的化合物,其中所述的抑制是通过核糖开关实现,以及(b) 通过使细胞与步骤(a)中可以抑制基因表达的化合物相接触来抑制基因表 达,其中所述细胞包括编码包括核糖开关的RNA的基因,其中所述化合物 通过与核糖开关结合而抑制基因的表达。
还公开了一种识别核糖开关的方法,所述方法包括在存在和不存在化 合物的条件下评估RNA分子的内嵌(in-line)自主切割,其中RNA分子由 被化合物调节的基因所编码,其中RNA分子的内嵌自主切割模式的改变表 明存在核糖开关。
A.抗微生物化合物的识别
核糖开关是为了结合小有机分子而进化出的新一类结构性RNA。核糖 开关的天然结合袋可被代谢物类似物或被模拟天然代谢物形状-空间的化 合物所靶向。核糖开关(1)存在于许多革兰氏阳性细菌和包括炭疽芽孢杆菌 (Bacillus anthracis)的革兰氏阴性细菌中,(2)是这些细菌中基因表达 的基本调节物,(3)存在多个拷贝,不太可能同时出现抗性,以及(4)还未 证实存在于人体中。这种特征的组合使得核糖开关很有希望成为新型抗微 生物化合物的靶标。而且,核糖开关的小分子配体提供了用于衍生生产药 物候选物的有用位点。一些核糖开关的分布示于美国专利申请公布No. 2005-0053951的表1中。
当识别了一类核糖开关而且(通过例如测定在靶标生物中有多少基因 被这一类核糖开关所调节)评估了它作为药物靶标的潜力之后,就可以识 别候选物分子。
有两种化合物在多年以前就已知它们可以杀死细菌,现已确定它们是 通过结合核糖开关而起作用。具体而言,化合物氨乙基半胱氨酸(赖氨酸 的类似物)结合细菌的赖氨酸核糖开关,并阻止赖氨酸生物合成中所需的 基因的表达。类似地,化合物吡啶硫胺素(硫胺素的类似物)被细菌细胞 二磷酸化而生成吡啶硫胺素焦磷酸。吡啶硫胺素焦磷酸是硫胺素焦磷酸 (TPP)的模拟物,它由于结合TPP核糖开关而对细菌有毒性。因此,通过 应用现代药物开发策略靶向核糖开关可以使得发现一类新的抗生素化合 物。可以入本文公开的那样使用基于结构的药物设计方法以产生可以结合 核糖开关并触发其变构作用的代谢物。
细菌的药物抗性株的出现加强了对识别新型抗生素的需要。抗核糖开 关药物代表了抗菌作用的一种模式,它由于下述理由而引起了人们的极大 兴趣。核糖开关控制了基础代谢过程的关键基因的表达。因此用药物对这 些基因控制元件进行处理可得到新的抗生素。核糖开关还带有进化为选择 性结合代谢物的RNA结构,因此这些RNA受体像蛋白质酶类和受体一样成 为了良好的药物靶标。此外,已显示上述的两种抗微生物化合物通过失活 抗生素抗性而杀死细菌,该抗生素抗性是通过RNA靶标的突变而出现的。 至少有11类高度保守的核糖开关存在于多种细菌中,提供了许多药物靶 标。
许多来源于革兰氏阳性和革兰氏阴性谱系的生物具有多种类型的核糖 开关(参见美国专利申请公布No.2005-0053951)。大部分致病性生物例 如葡萄球菌以及大部分与生物恐怖主义相关的生物例如炭疽芽孢杆菌都富 含核糖开关。如本文所公开的那样,已经详尽解析了鸟嘌呤核糖开关的原 子分辨结构模型,这使得可以使用基于结构的设计方法来产生结合核糖开 关的化合物。具体而言,鸟嘌呤核糖开关结合位点的模型显示存在着两条 能够进行配体修饰的通道(图12A)。通过对鸟嘌呤的N2位置或O6位置 进行化学修饰,产生了26种鸟嘌呤类似物,几乎所有测试过的类似物都能 以低纳摩尔级的解离常数结合该核糖开关。图12B显示了在N2位置和O6 位置进行修饰而合成的鸟嘌呤类似物的结构。这些化合物中的大多数都利 用了枯草芽孢杆菌鸟嘌呤核糖开关适体结构域或结合位点模型中的分子识 别“盲点”。成功的化合物可用作骨架,在该骨架上可以进一步引入化学变 异体以产生无毒性、可生物利用的、高亲和性抗核糖开关化合物。
下面利用SAM核糖开关(参见美国专利申请公布No.2005-0053951 的实施例7)对上述内容进行一些说明。SAM类似物是用稳定的基于硫的连 接(YBD-2和YBD-3)替换了反应活性的甲基和锍离子中心,它可被核糖开 关以足够的亲和力(低至中纳摩尔级)识别,从而作为其他SAM类似物合 成的平台。另外,可以合成和测试各种的连接类似物(基于N和C的连接), 以提供制备氨基酸和核苷衍生物的最佳平台。
SAM的亚砜和砜衍生物可用于产生类似物。例如可使用Ronald T. Borchardt and Yih Shiong Wu,Potential inhibitor of S-adenosylmethionine-dependent methyltransferase.1.Modification of the amino acid portion of S-adenosylhomocysteine.J.Med.Chem. 17,862-868,1974中所述的已验证的合成方法。这些和其它类似物的合 成和结合测试可以连续地进行或按小组进行。可以在化合物识别过程中, 基于每一轮验证的识别决定簇来设计其他的SAM类似物。可以如本文其他 部分所述的那样对枯草芽孢杆菌和炭疽芽孢杆菌的核糖开关RNA进行简单 的结合测试。也可以进行更高级的测试。
最有希望的SAM类似物前药化合物必须在保持代谢惰性的前提下能进 入细菌细胞并结合核糖开关。此外,可用的SAM类似物必须紧密地结合核 糖开关,但在对蛋白质酶类的活性位点的结合上又必须不如SAM,否则就 会有在患者细胞中产生不期望的毒性作用的危险。作为对这一方面的预先 评估,可以测试具有阻碍枯草芽孢杆菌生长的能力但又不影响大肠杆菌培 养物(大肠杆菌利用SAM但不具有SAM核糖开关)的化合物。为了筛选前 药化合物候选物,可以按下列方式平行培养细菌培养物:
1.可在最低葡萄糖培养基上培养枯草芽孢杆菌,并且不添加外源的 SAM类似物。
2.可在最低葡萄糖培养基上培养枯草芽孢杆菌,并且添加外源的SAM 类似物(可选择高剂量,然后设计重复试验来测试推断的药物化合物的浓 度范围)。
3.可在最低葡萄糖培养基上培养大肠杆菌,并且添加外源的SAM类似 物(可选择高剂量,然后设计重复试验来测试推断的药物化合物的浓度范 围)。
可以通过测量细胞倍增时间来比较各种培养物的适应程度。可以使用 在微量滴定板生长的培养物来测试药物化合物的浓度范围,并使用来自另 一实验室的微量滴定板读数仪来进行分析。预计培养物1生长较好。抑制 培养物2的药物可能抑制或不抑制培养物3。可以以较宽浓度范围类似地 抑制培养物2和培养物3的药物可以反映出外源化合物诱导的普遍毒性(即 与核糖开关抑制一起或者代替核糖开关抑制而对多种不同的细胞过程进行 抑制)。这种筛选中识别的成功的药物候选物应不抑制大肠杆菌或仅在很高 剂量时抑制大肠杆菌,而能在低得多的浓度(相差超过10倍)时抑制枯草 芽孢杆菌。
由于识别了SAM上的衍生位点,要有效地识别前药化合物就需要对合 适的SAM类似物或者类属化学文库进行大规模筛选。可以使用核酸基因工 程的原理通过一种或两种不同的方法进行高通量筛选。将下列的两种应光 感受器设计调整为便于进行高通量筛选的模式可以适于使用固定化方法或 基于溶液的方法。
一种产生报告物的方式是通过附加一个在SAM结合核糖开关后能催化 荧光标签释放的结构域,从而赋予核糖开关第三种功能。在最后的报告物 构建体中,上述的催化结构域可以通过一个通信区(communication module)连接到yitJSAM核糖开关上,所述通信区通过使催化结构域正确 折叠而产生荧光新号,从而传播配体结合事件。这可通过下述方式实现。
SAM核糖报告物混合设计:使用合适的DNA模板和引物序列,通过PCR 扩增构建用于体外转录为RNA的DNA模板。在该构建体中,随机化构建锤 头结构(SAM适体的P1茎)的茎II以代表2.5亿种以上的可能的序列组合。 其中有一些将不可避免地仅在适体结合SAM或相关高亲和力类似物时具有 核酶的功能。这该构建体群中的每种分子在除随机结构域之外的序列上都 是相同的,而在随机结构域中,构建体群的每种可能的序列组合都有多个 拷贝作为代表。
SAM核糖报告物筛选:体外筛选步骤可为下列步骤的重复过程:
1.用标准方法体外转录RNA。加入[α-32P]UTP以使得整个RNA分子 都具有放射性。
2.用标准方法在变性PAGE上纯化全长RNA。
3.在含有催化活性所需的足量的镁(20mM)、但不含有SAM的阴性筛 选缓冲液中孵育全长RNA(约100pmol)。在室温下(约23℃)孵育4小时, 需要时使用热循环或碱性变性剂以防止自在分子(selfish molecule)的 出现。
4.在变性PAGE上纯化全长RNA,并弃去不存在SAM的条件下发生反 应的RNA。
5.在含有20mM Mg2+和SAM(在23℃时pH 7.5)的阳性筛选缓冲液中 孵育。室温下孵育20分钟。
6.在变性PAGE上纯化被切割的RNA,以回收结合了SAM并允许RNA 自切割的核糖开关。
7.将RNA反转录为DNA。
8.使用可将RNA的被切割部分重新引入的引物,对DNA进行PCR扩增。
步骤4中的SAM的浓度在最开始可为100μM,并随着筛选过程逐渐降 低。回收成功的通信区的步骤可以通过在步骤6的纯化胶上观察到的切割 物的数量来评估。当构建体群在10nM的SAM条件(亲本核酶和核糖开关活 性最大的条件)下达到100%切割时,或者当构建体群的活性达到平台期即 在多轮筛选后都不再增加时,就可以结束筛选。然后可对最后的群测序。 可以测定个别的通信区克隆,以便在存在SAM的条件下筛选构建体的过程 中产生荧光信号。
还可以通过核糖开关介导的分子信标的触发来产生荧光信号。在这种 设计中,核糖开关的构象改变导致了原先折叠状态的带有荧光剂和淬灭剂 的分子信标打开折叠,并通过与核糖开关形成螺旋而使荧光剂远离淬灭剂。 由于这一方法可以利用配体介导的参与转录控制的终止子和抗终止子茎的 形成,因此这一机制可以容易的应用于现有的核糖开关。
为了使用核糖开关通过结合分子信标来报告配体的结合,必须经验性 地确定合适的构建体。可以系统性地测试分子信标的最佳长度和核苷酸组 成以及它在核糖开关上的结合位点,以便获得最高的信噪比。可以通过将 不同SAM类似物与分子信标偶联核糖开关的表观结合亲和力(通过荧光信 号产生的水平测定)与由标准串联标记测定的结合常数进行比较,从而确 定该测定的有效性。
具体实施方案
公开了天然鸟嘌呤应答性核糖开关的原子结构,包括图6所示的原子 结构。原子结构的原子坐标可包括图6中所示的原子的表6中所列的原子 坐标。原子结构的原子坐标可包括表6中所列的原子坐标。
还公开了识别与核糖开关相互作用的化合物的方法,包括:(a)利用 权利要求1的原子结构和待测化合物进行建模;(b)确定待测化合物与核 糖开关是否相互作用。
还公开了识别与核糖开关相互作用的化合物的方法,包括将核糖开 关与待测化合物相接触,其中当核糖开关与待测化合物相互作用时会产生 荧光信号。
还公开了杀死细菌的方法,包括将细菌和与核糖开关相互作用的化合 物的类似物相接触。
还公开了杀死细菌的方法,包括将细菌和与核糖开关相互作用的化合 物相接触。
还公开了识别与核糖开关相互作用的化合物的方法,包括:(a)识别 核糖开关的晶体结构;(b)利用核糖开关和待测化合物进行建模;和(c) 确定待测化合物与核糖开关是否相互作用。
还公开了可调节的基因表达构建体,包括编码一种RNA的核酸分子, 所述RNA含有与编码区可操作地连接的核糖开关,其中所述核糖开关为表 5中所列的核糖开关,其中所述核糖开关调节RNA的表达,其中所述核糖 开关和编码区为异源的。
还公开了检测目的化合物的方法,所述方法包括使样本与核糖开关相 接触,其中所述核糖开关为表5中所列的核糖开关,其中所述核糖开关被 目的化合物激活,其中所述核糖开关在被目的化合物激活时产生荧光信号, 其中所述核糖开关在样本中含有目的化合物时产生信号。
还公开了一种方法,包括:(a)检测可以抑制编码包括核糖开关的RNA 的基因的基因表达的化合物,其中所述核糖开关为表5中所列的核糖开关, 其中所述的抑制是通过核糖开关实现,以及(b)通过使细胞与步骤(a)中可 以抑制基因表达的化合物相接触来抑制基因表达,其中所述细胞包括编码 包括核糖开关的RNA的基因,其中所述化合物通过与核糖开关结合而抑制 基因的表达。
确定待测化合物是否与核糖开关相互作用,可以包括确定核糖开关模 型中待测化合物的预计最小相互作用能、预计结合常数、预计解离常数 或它们的组合。确定待测化合物与核糖开关是否相互作用可以包括测定 待测化合物和核糖开关模型中的一个或多个预计的键、一种或多种预计 的相互作用或它们的组合。核糖开关可为鸟嘌呤核糖开关。鸟嘌呤核糖开 关可为表5中的核糖开关。可以通过对核糖开关和待测化合物建模来确定 原子接触,并由此确定待测化合物与核糖开关的相互作用
上述方法还可包括下述步骤:(c)识别待测化合物的类似物;(d)确定 待测化合物的类似物是否与核糖开关相互作用。所述化合物可为次黄嘌呤。 可以使用基于凝胶的分析来确定待测化合物是否与核糖开关相互作用。可 以使用基于芯片的分析来确定待测化合物是否与核糖开关相互作用。
待测化合物的相互作用可以为范德华相互作用、氢键、静电相互作用、 疏水相互作用或者它们的组合。核糖开关可以包括RNA切割性核酶。当含 有淬灭部分的核酸被切割时可以产生荧光信号。可以使用分子信标技术来 产生荧光信号。可以使用高通量筛选来实行该方法。
核糖开关可为鸟嘌呤核糖开关。鸟嘌呤核糖开关可为表5中的核糖开 关。核糖开关可被触发分子激活,其中所述核糖开关在被触发分子激活时 产生信号。核糖开关在被目的化合物激活时可改变构象,其中构象的改变 通过构象依赖性标签产生信号。核糖开关在被目的化合物激活时可改变构 象,其中构象的改变导致与核糖开关相连的RNA的表达改变,其中所述表 达改变产生信号。信号可由与核糖开关相连的RNA表达的报告蛋白产生。 实施例
A.实施例1:天然鸟嘌呤应答性核糖开关与代谢物次黄嘌呤形成的复合 物的结构
为了理解天然生物传感器如何发挥功能,通过X射线晶体学解析了与 鸟嘌呤应答性核糖开关的生物学相关配体--次黄嘌呤结合的鸟嘌呤结合 结构域的结构(表2和图12A)。在结合次黄嘌呤的状态下,该RNA采用了 下述三维折叠形式:其中末端环(L2和L3)形成一系列互相连接的氢键(见 图5中的对比图),以使得P2和P3螺旋彼此平行(图5C)。由于核糖-磷 酸骨架区域的并列排布导致的不希望的静电相互作用通过两个骨架间一些 正离子的结合而被中和(图10)。RNA的球面螺旋排布的定位通过三向接合 (three-way junction)周围的许多三级接触完成,所述三级接触主要有: J2/3环(图5C)与结合的次黄嘌呤相互作用、P1螺旋、以及J1/2环与J3/1 环。
通过三向接合元件中的和元件周围的保守核苷酸形成嘌呤结合袋。这 些核苷酸通过形成上述和下述的两个系列的碱基三聚体辅助限制了嘌呤结 合袋(图5A)。该袋的3’侧侧翼带有水介导的U22-A52A73碱基三聚体和 A23G46-C53三聚体;这两种情况下腺苷的Watson-Crick面都与 Watson-Crick对的小沟相互作用(图6A)。通过螺旋P1(U20-A76和A21-U75) 顶部的保守Watson-Crick对分别和U49和C50的Watson-Crick面之间的 连续碱基三聚体形成另一侧,这使得J2/3环紧贴P1螺旋。这种碱基三聚 体形成配体结合位点的推广应用非常类似于体外筛选的识别平面环系统的 RNA适体,示例性的结构例如茶碱结合物(Zimmermann,G.R.,Jenison,R. D.,Wick,C.L.,Sirnmorre,J.-P.&Pardi,A.Interlocking structural motifs mediate molecular discrimination by a theophylline-binding RNA.Nature Struct.Biol.4,644-649(1997))、FMN结合物(Fan,P., Suri,A.K.,Fiala,R.,Live,D.&Patel,D.J.Molecular recognition in the FMN-RNA aptamer complex.J.MoI.Biol.258,480-500(1996)) 和孔雀绿结合物(Baugh,C,Grate,D.&Wilson,C.2.8 A crystal structure of the malachite green aptamer.J.MoI.Biol.301,117-128 (2000))。因此,人工筛选的RNA应用的形成小分子配体结合位点的原理与 它们天然存在的对应物相同。
核苷酸U22、U47、U51和C74形成直接堆积在P1螺旋上的碱基四聚体, 次黄嘌呤通过与上述四个核苷酸形成广泛的氢键系列而结合(图6B)。该 结构清楚地显示mRNA接触到了配体的所有官能团,这样就能解释在生物化 学研究中观察到的次黄嘌呤的特异性(Mandal,M.&Breaker,R.R.Gene regulation by riboswithces.Nature Rev.Mol.Cell.Biol.5,451-463 (2004))。此外,由于在该结构中有一个空间可以容纳结合的嘌呤2-位上 的环外氨基,因此也很容易解释鸟嘌呤的结合。这一附加的官能团可以与 C74和U51的2-位上的羧基的氧原子形成氢键,这一点与这种核糖开关对 鸟嘌呤的亲和力比对次黄嘌呤的亲和力高10倍的事实相一致。
最显著的特征之一是配体几乎完全被RNA所包裹(图6C):在复合物 中次黄嘌呤的97.8%的表面都不能被大量溶剂所接近。虽然在结构已被表 征的适体中还从未有过被识别的配体被RNA如此几乎完全利用的情况,但 是不包括将配体固定于固体支持物上的筛选策略(Koizumi,M.,Soukup,G. A.,Kerr,J.N.&Breaker,R.R.Allosteric selection of ribozymes that respond to the second mes sengers cGMP and cAMP.Nature Struct. Biol.6,1062-1071(1999))使得还有希望开发出能具有相似配体包埋度 的RNA。这一发现还表明,由于次黄嘌呤不可能像许多RNA-配体相互作用 中的那样接近已形成的结合位点(Leulliot,N.&Varani,G.Current topics in RNA-protein recognition:control of specificity and biological function through induced fit and conformational capture. Biochemistry 40,7947-7956(2001);Williamson,J.R.Induced fit in RNA-protein recognition.Nature Struct.Biol.7,834-837(2000)), 因此,局部结合位点在与配体结合后一定经过了相当大的构象改变。最后, 这种嘌呤识别的模式也可以容易地解释下述事实:通过将74位核苷酸的胞 嘧啶突变为尿嘧啶,这个单点突变就可以将它的鸟嘌呤特异性变为腺嘌呤 特异性(Mandal,M.&Breaker,R.R.Adenine riboswitches and gene activation by disruption of a trancription terminator.Nature Struct. Mol.Biol.11,29-35(2004))。虽然Watson-Crick的配对优先性由鸟嘌 呤变为了腺嘌呤,但是嘌呤和RNA之间的其他的相互作用并没有变化。
通过独特的环-环相互作用而稳定了三级结构,所述环-环相互作用盖 住了P2和P3螺旋,该P2和P3螺旋被以前没有见到过的两类碱基四聚体 所限制。每一四聚体包括一个Watson-Crick配对和一个位于其小沟中的非 典型配对(G38-C60和G37-C61与A33A66和U34A65对分别相互作用;图 7A)。这种排布与腺苷在常见的I/II型A-minor三聚体基序中的A型螺旋 中的堆积方式有很大的相似性(Doherty,E.A.,Batey,R.T.,Masquida, B.&Doudna,J.A.A universal mode of helix packing in RNA.Nature Struct.Biol.8,339-343(2001);Nissen,P.,Ippolito,J.A.,Ban, N.,Moore,P.B.&Steitz,T.A.RNA tertiary interactions in the large ribosomal subunit:the A-minor motif.Proc.Natl Acad.Sci USA 98,4899-4903(2001))。这八个核苷酸中任何一个的突变都会使固定环- 环相互作用的核心的复杂氢键网络被破坏,这就解释了它们严格的系统发 生学保守性。在这些四聚体上堆积了两个非典型配对,包括G62和U63之 间的并列相互作用,这类似于A-平台基序(Gate,J.H.et al.RNA tertiary structure mediation by adenosine platforms.Science 273, 1696-1699(1996))和突起-G基序(Correll,C.C,Beneken,J., Plantinga,M.J.,Lubbers,M.&Chan,Y.L.The common and the distinctive features of the bulged-G motif based on a 1.04 A resolution RNA structure.Nucleic Acids Res.31,6806-6818(2003)) (图7B)。G62U63对通过和与其相对的环骨架之间形成氢键而更加稳定。
两个末端环之间的相互作用对于鸟嘌呤核糖开关的配体结合至关重 要。使用串联标记试验测定出的存在和不存在鸟嘌呤的情况下RNA的稳定 性的差异表明RNA三级结构的这一元件的形成并不依赖于鸟嘌呤或次黄嘌 呤。将野生型的环替换为稳定的UUCG四元环(Molinaro,M.&Tinoco,I. Jr Use of ultra stable UNCG tetraloop hairpins to fold RNA structures: thermodynamic and spectroscopic applications.Nucleic Acids Res.23, 3056-3063(1995);图11),这一替换消除了三级相互作用,使得核糖开 关失去了识别次黄嘌呤的能力;这表明它对于促进高亲和力相互作用至关 重要(图8)。因此,虽然这种三级相互作用并不直接接触配体,但是它对 于识别嘌呤的核糖开关的整体组织还是有意义的。类似地,具有环-环相互 作用的锤头核酶的天然序列显著地提高了它们在生理条件下的切割速度 (De Ia Pena,M.,Gago,S.&Flores,R.Peripheral regions of natrual hammerhead ribozymes greatly increase their self-cleavage activity. EMBO J.22,5561-5570(2003);Khvorova,A.,Lescoute,A.,Westhof, E.&Jayasena,S.D.Sequence elements outside the hammerhead ribozyme catalytic core enable intracellular activity.Nature Struct.Biol.10,708-712(2003))。每种情况下,三级结构都使RNA局 限于某一种方式,该方式使得含有功能性位点的三向接合能够对生理浓度 的配体或Mg2+离子产生应答。
在Mg2+离子浓度很高(20mM MgCl2)的情况下,鸟嘌呤核糖开关对鸟嘌 呤和次黄嘌呤有相当高的亲和力(表观解离常数(Kd)分别为5nM和50nM)。 然而在大肠杆菌中,在嘌呤浓度为1-10μM时出现purR抑制子对xpt-pbuX 操纵子的转录的抑制应答。为确定核糖开关是否对可能反映生理水平的相 似浓度的嘌呤有应答,通过等温滴定量热法在不同离子条件下(表1)测 定了对于次黄嘌呤的亲和力。在更接近生理条件的离子强度条件下(0.25-1 mM Mg2+),RNA表现出的对次黄嘌呤的亲和力(表观Kd=3-4μM)与purR 抑制子蛋白(对于大肠杆菌变异体,表观Kd=9μM)的相近(Choi,K.Y. &Zalkin,H.Structural characterization and corepressor binding of the Escherichia coli purine repressor.J.Bacteriol.174,6207-6214 (1992))。因此,基于RNA和基于蛋白质的调节机制看起来都被调节为对相 近的细胞内代谢物浓度有应答。
表1在30℃测定次黄嘌呤结合的热力学参数
MgCl2(mM)     Kd(μM)* ΔHobs(kcal mol-1)   ΔSobs(cal mol-1K-1)     20     5.0     1.0     0.25     0_   0.732±0.034   1.84±0.094   2.99±0.19   4.00±0.19   ND     -33.5±0.43     -28.4±0.48     -35.4±0.93     -41.9±0.39     ND     -82     -67     -91     -113     ND
*报告误差表示与数据整合的非线性最小平方值的s.e.m,ND表示没有 可检出的结合。
*该反应中含有2mM Na2-EDTA。
该结构进一步表明了RNA是如何通过一种推断不依赖于Rho的转录 调节机制而将细胞内代谢物浓度转换为基因表达的变化的(Mandal,M., Boese,B.,Barrick,J.E.,Winkler,W.C.&Breaker,R.R. riboswitches control fundamental biochemical pathways in Bacillus subtilis and other bacteria.Cell 113,577-586(2003);Johansen, L.E.,Nygaard,P.,Lassen,C,Agerso,Y.&Saxild,H.H.Definition of a second Bacillus subtilis pur regulon comprising the pur and xpt-pbuX operons plus pbuG,nupG(yxj A),and pbuE(ydhL).J. Bacteriol.185,5200-5209(2003))。起始的90个核苷酸的转录导致 了鸟嘌呤结合结构域的形成,与L2和L3环的相互作用使得开始形成RNA 的三级结构(图5B)。这使得三向接合基序部分形成以便有效地结合配体, 但是结合部分也必须在一定程度上解构以使得嘌呤可以进入结合袋。在 鸟嘌呤或次黄嘌呤的浓度足够高时,核碱基(nucleobase)与袋相结合, 通过堆积相互作用和与J2/3形成碱基三聚体使P1螺旋稳定化,并防止 P1核苷酸被引入抗终止子元件中。然后mRNA可形成一种典型的不依赖于 Rho的终止子茎-环和转录终点。与之相反,在细胞内鸟嘌呤或次黄嘌呤 的浓度较低时,分离的P1螺旋的3’侧会很容易地被转录而形成稳定的抗 终止子元件,促进继续转录。因此,次黄嘌呤对核糖开关十分重要,它 通过它稳定一种或另一种构象的能力使得核糖开关能指导mRNA按着两条 不同的途径折叠,生成细胞内鸟嘌呤、次黄嘌呤和黄嘌呤浓度的有效的 生物传感器。
1.方法
结晶:合成RNA并通过天然亲和标签纯化方法纯化RNA(Kieft,J.S. &Batey,R.T.A general method for rapid and nondenaturing purification of RNAs.RNA 10,988-995(2004)),并在含有10mM K+-HEPES(pH 7.5)和1mM次黄嘌呤的缓冲液进行交换。将上述溶液按1∶1 的比例与母液(含25%PEG3000(w/v)、200mM乙酸铵和10mM六氨合钴) 混合,并在室温下培养2-3周以生长晶体。
数据采集和处理:在母液中加入25%的2-甲基-2,4-戊二醇,在冷冻 保护的条件下对晶体以CuKα的波长进行单波长异常衍射;在至少1.8_ 的分辨率下可观察到清楚的衍射。使用D*TREK对数据进行索引、整合和 比例化(Pflugrath,J.W.The finer things in X-ray diffraction data collection.Acta Crystallogr.D 55,1718-1725(1999)),用SOLVE 识别重原子位点(Terwilliger,T.SOLVE and RESOLVE:automated structure solution,density modification and model building.J. Synchrotron Radiat.11,49-52(2004)),并用CNS进行细化(Brunger, A.T.et al.Crystallography&NMR system:a new software suite for macromolecular structure determination.Acta Crystallogr.D 54,905-921(1998)),以获得最终的Rxtal值为17.8%和Rfree值为22.8% 的模型。该模型包括除A82以外的所有RNA原子和次黄嘌呤配体,对于 A82未观察到电子密度。
RNA合成和纯化:使用重叠DNA寡核苷酸(Integrated DNA Technologies)和标准方法构建了一个68个核苷酸的构建体,该构建体 包括枯草芽孢杆菌的pbuX-xpt操纵子的鸟嘌呤核糖开关序列。所得的 DNA片段在5’端和3’端分别含有EcoRI和NgoMDS限制性酶切位点,将该 片段连接到pRAV12质粒载体上(Kieft,J.S.&Batey,R.T.A general method for rapid and nondenaturing purification of RNAs.RNA 10, 988-995(2004)),该质粒载体是为了RNA的天然纯化而设计的;对所得 的载体进行测序验证。用PCR从该所得载体产生用于体外转录的DNA模 板,所述PCR使用的5’引物是针对T7 RNA聚合酶启动子的引物,3’引物 是带有纯化亲和标签的引物(5’:GCGCGCGAATTCTAATACGACTCACTATAG(SEQ ID NO:10);3’:GGATCCTGCCCAGGGCTG(SEQ ID NO:11))。RNA转录的条 件如下:反应体系为12.5mL,包括30mM Tris-HCl(pH 8.0)、10mM DTT、 0.1%Triton X-100、0.1mM亚精胺-HCl、8mM的每种NTP、40mM MgCl2、 50μg/mL T7 RNA聚合酶和1mL的~0.5μM模板(Doudna,J.A. Preparation of homogeneous ribozyme RNA for crystallization. Methods Mol Biol 74,365-70(1997)),还添加了1单位/mL的无机焦 磷酸酶以抑制不可溶的焦磷酸镁的形成。反应体系在37℃培养1.5小时。 如前所述地进行RNA的天然纯化。在从亲和柱上洗脱下RNA之后,立即 用10,000MWCO离心过滤装置(Amicon,Ultra-15)进行浓缩。在所有的 RNA被浓缩至~500μL后,使用离心浓缩机将RNA对含有10mM K+-HEPES 和1mM次黄嘌呤,pH 7.5的15mL溶液交换三次,每次更换新液体。将 最后的RNA浓缩至450μM,用根据它的碱基组成计算出的消光系数和 260nm处的光吸收来判定其浓度。
RNA结晶:使用悬滴法获得鸟嘌呤核糖开关的结晶,其中RNA溶液按 1∶1的比例与储液混合,所述储液中含有10mM六氨合钴、200mM乙酸 铵和25%的PEG 2K。将结晶盘在室温下(23℃)培养,在7-14天后晶 体可达到它们的最大体积(0.05×0.05×0.2mm)。加入30μL含有25% (v/v)2-甲基-2,4戊二醇(MPD)的母液5分钟并在液氮中快速冷冻以进行 晶体的冷冻保护。使用CuKα射线在内部X射线源(Rigaku MSC)上采集衍 射数据;用逆射线(inverse-beam)实验采集异常数据。使用 CrystalClear(Rigaku MSC)和D*TREK对数据进行索引、整合和比例化 (Pflugrath,J.W.The finer things in X-ray diffraction data collect ion. Acta Crystallogr D Biol Crystallogr 55,1718-1725 (1999))。该晶体属于C2空间群(spacegroup)(a=132.30_,b=35.25_, c=42.23_,d=90.95°),每个不对称单位含有一个分子(所有的结晶学 统计值参见表2)。在后续的定相和细化中使用的所有数据都采集于一个 个体晶体。
定相和结构测定。使用单波长异常衍射(SAD)实验来确定相位 (Dauter,Z.,Dauter,M.&Dodson,E.Jolly SAD.Acta Crystallogr D Biol Crystallogr 58,494-506(2002);Rice,L.M.,Earnest,T. N.&Brunger,A.T.Single-wavelength anomalous diffraction phasing revisited.Acta Crystallogr D Biol Crystallogr 56(Pt 11), 1413-20(2000)),衍射数据延长至1.95_分辨率。在该实验中,钴被当 作重原子衍生物处理,它在CuKα波长时产生微弱的异常信号(f’=- 2.464,f”=3.608)。使用SOLVE(Terwilliger,T.SOLVE and RESOLVE: automated structure solution,density modification and model building.J Synchrotron Radiat 11,49-52(2004)),发现了一个含 10个重原子的解析图,优值(figure of merit)为0.38,评分为40.9。 使用这种重原子模型和其镜像并使用CNS来确定相位(Brunger,A.T.et al.Crystallography&NMR system:A new software suite for macromolecular structure determination.Acta Crystallogr D Biol Crystallogr 54(Pt 5),905-21(1998)),并用密度修饰进行改进。 仅有一种重原子模型产生了电子密度图谱,图谱中显示了清晰的骨架连 接和碱基堆积;这一图谱可以足够清晰地辨析RNA的主要部分。进行在O 中的重复建模轮次(Jones,T.A.,Zou,J.Y.,Cowan,S.W.& Kjeldgaard.Improved methods for building protein models in electron density maps and the location of errors in the semodels. Acta Crystallogr A 47(Pt2),110-9(1991))和CNS中的细化,同时监 测Rfree值以保证该值在每一轮之后都有所改进。在RNA除了3’端的A82 以外的所有核苷酸都被建立起来之后,进行两轮水分选(water picking) 以将总共332个水分子置于模型中,使用的限制因素是每个溶剂与另一 原子的距离必须在氢键距离之内,而且B因子要小于80。这建模的这一 过程中,基于它们具有清晰的八面体配位构型的内层原子以及由异常差 异图谱验证的它们的位置,识别了12个六氨合钴离子;基于这一点还在 模型中定位了一个亚精胺和乙酸根离子。糖折叠被限制为C3’内式,但是 残基22、34、35、47、49和62上的糖折叠被限制为C2’内式。
等温滴定量热法。用于等温滴定量热法(ITC)(Leavitt,S.&Freire, E.Direct measurement of protein binding energetics by isothermal titration calorimetry.Curr Opin Struct Biol 11,560-6(2001); Pierce,M.,Raman,C.S.&Nail,B.T.Isothermal titration calorimetry of protein-protein interactiohs.Methods 19,213-21 (1999))的RNA按上文所述地转录和纯化,并使用含有10mM K+-HEPES、 pH 7.5、100mM KCl和不同浓度的MgCl2的缓冲液在4℃完全透析24-48 小时。在透析后,将缓冲液用于制备次黄嘌呤溶液,次黄嘌呤浓度应近 似为RNA浓度的10倍(通常分别为约120μM和12μM)。所有实验均使 用Microcal MCS ITC装置在30℃下进行。在对RNA和次黄嘌呤溶液除气 之后,将29次注射、每次10μL的次黄嘌呤滴定到RNA样品中,以使得 最终得到的次黄嘌呤与RNA的摩尔比为2∶1至3∶1之间(Recht,M.I.& Williamson,J.R.Central domain assembly:thermodynamics and kinetics of S6 and S18 binding to an S15-RNA complex.J Mol Biol 313,35-48(2001))。使用Origin ITC软件(Microcal Software Inc.) 分析滴定数据,数据符合单位点结合模型。
表2:晶体学统计值
数据采集
空间群:            C2
a,b,c             132.30,35.25,42.23_
β                  90.95°
分辨率a             20-1.95_(2.02-1.95_)
波长                1.5418
完整百分率          92.9%(85.3%)
测量的反射          76,950
独特反射            25,789
平均冗余度          2.9(2.45)
I/σ                21.5(6.3)
Rsym b               3.7%(13.5%)
定相
定相力c             1.62(0.95)
Rcullis d            0.67
优值
SOLVE               0.38
密度修饰之后的CNS   0.86
细化
分辨率              20-1.95_(2.02-1.95_)
反射数目
工作系列            23,356(84.1%)
测试系列                    2,430(8.8%)
Rxtal e                      17.8(24.8)
Rfree                       22.8(31.8)
r.m.s.d.键                  0.0095_
r.m.s.d.角                  1.70°
交叉验证Luzzati协同误差     0.25_
(coordinate error)
交叉验证Sigma-a协同误差     0.23_
平均B因子值                 22.4_2
a.括号内的数字对应最高分辨率的骨架。
b.Rmerge=∑|I-|/∑I,其中I为观察到的强度,为对称相关 反射的多个测量值的平均强度。
c.定相力=所有反射中报告的<|FH|>/<‖FP+FH|-|FPH‖>。
d.Rcullis=所有反射中报告的∑‖FPH±FP|-|FH(calc)|/∑|FPH|。
e.Rxtal=∑|Fo-|Fc‖/∑|Fo|,Rxtal来自工作系列,Rfree来自测试 系列。
B.实施例2:核糖开关类似物作为抗微生物剂的用途
对鸟嘌呤核糖开关适体和腺嘌呤的相应适体均建立了原子分辨模型 (Serganov A,Yuan YR,Pikovskaya O,Polonskaia A,Malinina L,Phan AT,Hobartner C,Micura R,Breaker RR,Patel DJ.(2004)Structural basis for discriminative regulation of gene expression by adenine- and guanine-sensing mRNAs.Chem.Biol.11:1729-1741)。这些模型实 质上都与Batey等人推断的相同(Batey,R.T.,Gilbert,S.D.,Montange, R.K.(2004)Structure of a natrual guanine-responsive riboswitch complexed with the metabolite hypoxanthine.18:432:411-415.),由 此证明用于设计图12B中所示的化合物的结构模型是正确的。此外,鸟嘌 呤和腺嘌呤核糖开关适体之间的相似性使我们清楚地认识到,与设计鸟嘌 呤类似物相同的手段可以用于类似地设计腺嘌呤类似物以抑制腺嘌呤核糖 开关。
测试了图12B中所示的鸟嘌呤类似物体外结合鸟嘌呤核糖开关的能 力,还测试了它们对枯草芽孢杆菌的抗菌活性。在这些类似物中,有六种 类似物可以抑制枯草芽孢杆菌在缺乏鸟嘌呤的培养基上的生长(表3)。测 试了其中一种化合物G-014在丰富培养基上对于枯草芽孢杆菌和一些临床 上相关的病原体的抑制作用(表4)。重要的是,G-014抑制大多数上述病 原体,包括炭疽芽孢杆菌和和抗甲氧西林金黄色葡萄球菌,其抗菌效力与 万古霉素相当。为进一步探明这些鸟嘌呤类似物的抗菌机制,开发了两种 基因报告系统。在一个系统中,鸟嘌呤核糖开关与绿色荧光蛋白(GFP)相融 合,以使得高浓度的鸟嘌呤或结合核糖开关的鸟嘌呤类似物可以抑制GFP 的表达(图14)。因此,GFP荧光水平的降低就表明了鸟嘌呤核糖开关在细 菌中被结合和调节。还用β-半乳糖苷酶的鸟嘌呤核糖开关上游序列构建了 另一个类似的系统。这样,β-半乳糖苷酶水平的降低就表明了化合物在体 内抑制鸟嘌呤核糖开关。表3概括了对每种鸟嘌呤类似物的这些分析的结 果。还证实了化合物杀死细胞和它们控制基因表达之间的相关关系。可使 用含有任何合适的报告基因的类似系统,所述基因例如编码合适的报告蛋 白或合适的报告RNA(例如核酶)的基因。
还测定了G-014是针对枯草芽孢杆菌的杀菌剂。在直接的比较中, G-014减少存活的集落形成单位(“CFU”)的数目的速度与羧苄西林相等(图 15)。
表3.每种鸟嘌呤类似物的活性1。

1ND表示该值尚未测定。用粗体表示的化合物抑制细菌生长。
2相对的β-gal报告物活性表示用有化合物时的Miller单位值除以无化 合物时的Miller单位值。1.0为无抑制作用,0为完全抑制。
表4.G-014对临床上相关病原体的抗菌活性。
    最小抑制浓度(μg/mL) 化合物   SA1 MRSA     EF     BA     SP     HI2     MS2 G-014     8     4     32   4   2     64     256 万古霉素     1     1     2   1.5   0.25     64     24
1SA,金黄色葡萄球菌(Staphylococcus aureus);MRSA,抗甲氧西林 金黄色葡萄球菌(methicillin resistant Staphylococcus aureus); EF,粪肠球菌(Enterococcus faecalis);SP,炎链球菌(Streptococcus pneumoniae);HI,流感嗜血菌(Haemophilus influenza);MS,耻垢分 枝杆菌(Mycobacterium smegmatis)。
2这些病原体没有鸟嘌呤核糖开关。
表5.嘌呤核糖开关
#STOCKHOLM 1.0
#=GS NC_003869.1/586365-586467          organism  Thermoanaerobacter tengcongensis MB4
#=GS NC_002570.2/1593074-1592972        organism  Bacillus halodurans C-125
#=GS NC_002570.2/676475-676577          organism  Bacillus halodurans C-125
#=GS NC_000964.2/4004541-4004643        organism  Bacillus subtilis subsp.subtilis str.168
#=GS NC_003366.1/513088-512986          organism  Clostridium perfringens str.13
#=GS NC_000964.2/693775-693877          organism  Bacillus subtilis subsp.subtilis str.168
#=GS NC_002570.2/650309-650411          organism  Bacillus halodurans C-125
#=GS NC_006270.2/2294931-2294831        organism  Bacillus licheniformis ATCC 14580
#=GS NC_006322.1/2295788-2295688        organism  Bacillus licheniformis ATCC 14580
#=GS NC_004193.1/1103943-1104045        organism  Occanobacillus iheyensis HTE831
#=GS NC_003909.8/1650407-1650509        organism  Bacillus cereus ATCC 10987
#=GS NC_003997.3/1497571-1497673        organism  Bacillus anthracis str.Ames
#=GS NC_005945.1/1497645-1497747        organism  Bacillus anthracis str.Sterne
#=GS NC_005957.1/1521880-1521982        organism  Bacillus thuringiensis serovar konkukian str.97-27
#=GS NC_006274.1/1532482-1532584        organism  Bacillus cereus ZK
#=GS NC_007530.2/1497694-1497796        organism  Bacillus anthracis str.′Ames Ancestor′
#=GS NZ_AAAC02000001.1/1985987-1986089  organism  Bacillus anthracis str.A2012
#=GS NZ_AAEK01000008.1/96466-96364      organism  Bacillus cereus G9241
#=GS NZ_AAEN01000011.1/67143-67245      organism  Bacillus anthracis str.CNEVA-9066
#=GS NZ_AAEO01000025.1/66855-66957      organism  Bacillus anthracis str.A1055
#=GS NZ_AAEP01000035.1/69365-69467      organism  Bacillus anthracis str.Vollum
#=GS NZ_AAEQ01000029.1/70848-70950      organism  Bacillus anthracis str.Kruger B
#=GS NZ_AAER01000023.1/58182-58284      organism  Bacillus anthracis str.Western North America USA6153
#=GS NZ_AAES01000034.1/69121-69223      organism  Bacillus anthracis str.Australia 94
#=GS NC_004722.1/1515239-1515341        organism  Bacillus cereus ATCC 14579
#=GS NC_000964.2/697711-697813          organism  Bacillus subtilis subsp.subtilis str.168
#=GS NC_002976.3/54816-54919            organism  Staphylococcus epidermidis Rp62A
#=GS NC_004461.1/2433047-2432944        organism  Staphylococcus epidermidis ATCC 12228
#=GS NC_003030.1/2824953-2824855        organism  Clostridi-acetobutylicum ATCC 824
#=GS NC_003909.8/296465-296567          organism  Bacillus cereus ATCC 10987
#=GS NC_003997.3/262601-262703          organism  Bacillus anthracis str.Ames
#=GS NC_004722.1/261558-261660          organism  Bacillus cereus ATCC 14579
#=GS NC_005945.1/262614-262716          organism  Bacillus anthracis str.Sterne
#=GS NC_005957.1/268537-268639          organism  Bacillus thuringiensis serovar konkukian str.97-27
#=GS NC_006274.1/267835-267937        organism  Bacillus cereus ZK
#=GS NC_007530.2/262601-262703        organism  Bacillus anthracis str.  ′Ames Ancestor′
#=GS NZ_AAAC02000001.1/796036-796138  organism  Bacillus anthracis str.A2012
#=GS NZ_AAEK01000017.1/88397-88499    organism  Bacillus cereus G9241
#=GS NZ_AAEN01000023.1/16980-17082    organism  Bacillus anthracis str.CNEVA-9066
#=GS NZ_AAEO01000030.1/17090-17192    organism  Bacillus anthracis str.A1055
#=GS NZ_AAEP01000043.1/12962-13064    organism  Bacillus anthracisstr.Vollum
#=GS NZ_AAEQ01000040.1/4962-4860      organism  Bacillus anthracis str.Kruger B
#=GS NZ_AAER01000030.1/4374-4272      organism  Bacillus anthracis str.Western North America USA6153
#=GS NZ_AAES01000040.1/14760-14862    organism  Bacillus anthracis str.Australia 94
#=GS NC_006270.2/693198-693300        organism  Bacillus licheniformis ATCC 14580
#=GS NC_006322.1/692981-693 083       organism  Bacillus licheniformis ATCC 14580
#=GS NC_004722.1/259601-259703        organism  Bacillus cereus ATCC 14579
#=GS NC_000964.2/2319410-2319310      organism  Bacillus subtilis subsp.subtilis str.168
#=GS NC_003030.1/2905050-2904948      organism  Clostridium acetobutylicum ATCC 824
#=GS NC_003210.1/611119-611017        organism  Listeria monocytogenes EGD-e
#=GS NZ_AADQ01000001.1/2431-2533      organism  Listeria monocytogenes str.1/2a F6854
#=GS NC_003212.1/610156-610054        organism  Listeria innocua Clip11262
#=GS NC_003366.1/422820-422922        organism  Clostridium perfringens str.13
#=GS NC_002973.5/617846-617744        organism  Listeria monocytogenes str.4b F2365
#=GS NZ_AADR01000111.1/1598-1496      organism  Listeria monocytogenes str.4b H7858
#=GS NC_003909.8/294509-294611        organism  Bacillus cereus ATCC 10987
#=GS NC_005957.1/266577-266679        organism  Bacillus thuringiensis serovar konkukian str.97-27
#=GS NC_006274.1/265875-265977        organism  Bacillus cereus ZK
#=GS NC_003366.1/2618421-2618323      organism  Clostridium perfringens str.13
#=GS NC_002973.5/1940027-1939926      organism  Listeria monocytogenes str.4b F2365
#=GS NC_003212.1/2013345-2013244      organism  Listeria innocua Clip11262
#=GS NZ-AADQ01000095.1/1690-1791      organism  Listeria monocytogenes str.1/2a F6854
#=GS NZ_AADR01000082.1/3415-3516      organism  Listeria monocytogenes str.4b H7858
#=GS NC_003366.1/2871201-2871101      organism  Clostridium perfringens str.13
#=GS NC_002745.2/430797-430900        organism  Staphylococcus aureus subsp.aureus N315
#=GS NC_002758.2/430754-430857        organism  Staphylococcus aureus subsp.aureus Mu50
#=GS NC_002951.2/460059-460162        organism  Staphylococcus aureus subsp.aureus COL
#=GS NC_002952.2/441050-441153        organism  Staphylococcus aureus subsp.aureus MRSA252
#=GS NC_002953.3/409191-409294        organism  Staphylococcus aureus subsp.aureus MSSA476
#=GS NC_003923.1/410546-410649        organism  Staphylococcus aureus subsp.aureus MW2
#=GS NC_006582.1/1115665-1115767      organism  Bacillus clausii KSM-K16
#=GS NC_006510.1/274257-274359        organism  Geobacillus kaustophilus HTA426
#=GS NC_003210.1/1958922-1958821        organism  Listeria monocytogenes EGD-e
#=GS NC_006270.2/697054-697156          organism  Bacillus licheniformis ATCC 14580
#=GS NC_006322.1/696838-696940          organism  Bacillus licheniformis ATCC 14580
#=GS NC_006510.1/282580-282682          organism  Geobacillus kaustophilus HTA426
#=GS NC_003997.3/260641-260743          organism  Bacillus anthracis str.Ames
#=GS NC_005945.1/260654-260756          organism  Bacillus anthracis str.Sterne
#=GS NC_007530.2/260641-260743          organism  Bacillus anthracis str.′Ames Ancestor′
#=GS NZ AAEK01000017.1/86437-86539      organism  Bacillus cereus G9241
#=GS NZ_AAEN01000023.1/15020-15122      organism  Bacillus anthracis str.CNEVA-9066
#=GS N2_AAEO01000030.1/15130-15232      organism  Bacillus anthracis str.A1055
#=GS NZ_AAEp01000043.1/11002-11104      organism  Bacillus anthracis str.Vollum
#=GS NZ_AAEQ01000040.1/6922-6820        organism  Bacillus anthracis str.Kruger B
#=GS NZ_AAER01000030.1/6334-6232        organism  Bacillus anthracis str.Western North America USA6153
#=GS NZ_AAES01000040.1/12800-12902      organism  Bacillus anthracis str.Australia 94
#=GS NC_004193.1/760473-760575          organism  Oceanobacillus iheyensis HTE831
#=GS NC_006270.2/4024210-4024312        organism  Bacillus licheniformis ATCC 14580
#=GS NC_006322.1/4024324-4024426        organism  Bacillus licheniformis ATCC 14580
#=GS NC_004193.1/786767-786868          organism  Oceanobacillus iheyensis HTE831
#=GS NC_002662.1/1159509-1159607        organism  Lactococcus lactis subsp.lactis I11403
#=GS NC_000964.2/625993-625893          organism  Bacillus subtilis subsp.subtilis str.168
#=GS NC_003909.8/382630-382528          organism  Bacillus cereus ATCC 10987
#=GS NC_003997.3/342356-342254          organism  Bacillus anthracis str.Ames
#=GS NC_005945.1/342369-342267          organism  Bacillus anthracis str.Sterne
#=GS NC_005957.1/356354-356252          organism  Bacillus thuringiensis serovar konkukian str.97-27
#=GS NC_006274.1/357462-357360          organism  Bacillus cereus ZK
#=GS NC_007530.2/342356-342254          organism  Bacillus anthracis str.′Ames Ancestor′
#=GS NZ_AAAC02000001.1/859268-859166    organism  Bacillus anthracis str.A2012
#=GS NZ_AAEK01000051.1/8150-8252        organism  Bacillus cereus G9241
#=GS NZ_AAEN01000023.1/83441-83339      organism  Bacillus anthracis str.CNEVA-9066
#=GS NZ_AAEO01000030.1/96886-96784      organism  Bacillus anthracis str.A1055
#=GS NZ_AAEP01000046.1/48810-48708      organism  Bacillus anthracis str.Vollum
#=GS NZ_AAAEQ01000034.1/49483-49381     organism  Bacillus anthracis str.Kruger B
#=GS NZ_AAER01000042.1/191339-191441    organism  Bacillus anthracis str.Western North America USA6153
#=GS NZ_AAES01000043.1/48479-48377      organism  Bacillus anthracis str.Australia 94
#=GS NZ_AAAC02000001.1/794076-794178    organism  Bacillus anthracis str.A2012
#=GS NC_003030.1/1002176-1002275        organism  Clostridium acetobutylicum ATCC 824
#=GS NC_006582.1/1554717-1554819        organism  Bacillus clausii KSM-K16
#=GS NC_003909.8/336194-336296          organism  Bacillus cereus ATCC 10987
#=GS NC_003997.3/295331-295433            organism  Bacillus anthracis str.Ames
#=GS NC_005945.1/295344-295446            organism  Bacillus anthracis str.Sterne
#=GS NC_005957.1/309524-309626            organism  Bacillus thuringiensis serovar konkukian str.97-27
#=GS NC_006274.1/309094-309196            organism  Bacillus cereus ZK
#=GS NC_007530.2/295331-295433            organism  Bacillus anthracis str.′Ames Ancestor′
#=GS NZ_AAAC02000001.1/812243-812345      organism  Bacillus anthracis str.A2012
#=GS NZ_AAEK01000064.1/23 153-23051       organism  Bacillus cereus G9241
#=GS NZ_AAEN01000023.1/36414-36516        organism  Bacillus anthracis str.CNEVA-9066
#=GS NZ_AAEO01000030.1/49824-49926        organism  Bacillus anthracis str.A1055
#=GS NZ_AAEP01000046.1/1785-1887          organism  Bacillus anthracis str.Vollum
#=GS NZ_AAEQ01000034.1/2457-2559          organism  Bacillus anthracis str.Kruger B
#=GS NZ_AAER01000042.1/238364-238262      organism  Bacillus anthracis str.Western North America USA6153
#=GS NZ_AAES01000043.1/1489-1591          organism  Bacillus anthracis str.Australia 94
#=GS NC_004193.1/769686-769787            organism  Oceanobacillus iheyensis HTE831
#=GS NC_004722.1/343847-343745            organism  Bacillus cereus ATCC 14579
#=GS NZ_AAAW03000042.1/15038-14936        organism  Desulfitobacterium hafniense DCB-2
#=GS NZ_AADT03000005.1/34629-34731        organism  Moorella thermoacetica ATCC 39073
#=GS NC_002570.2/648442-648544            organism  Bacillus halodurans C-125
#=GS NC_004722.1/298774-298876            organism  Bacillus cereus ATCC 14579
#=GS NC_006510.1/272473-272575            organism  Geobacillus kaustophilus HTA426
#=GS NZ_AADW02000004.1/225764-225662      organism  Exiguobacterium sp.255-15
#=GS NC_006274.1/3685852-3685750          organism  Bacillus cereus ZK
#=GS NZ_AAGO01000011.1/2345-2247          organism  Lactococcus lactis subsp.cremoris SK11
#=GS NZ_AAAK03000113.1/5724-5822          organism  Enterococcus faecium DO
#=GS NZ_AADW02000005.1/186378-186480      organism  Exiguobacterium sp.255-15
#=GS NC_003909.8/3578068-3577966          organism  Bacillus cereus ATCC 10987
#=GS NC_003997.3/3605298-3605196          organism  Bacillus anthracis str.Ames
#=GS NC_004722.1/3766254-3766152          organism  Bacillus cereus ATCC 14579
#=GS NC_005945.1/3605993-3605891          organism  Bacillus anthracis str.Sterne
#=GS NC_005957.1/3626969-3626867          organism  Bacillus thuringiensis serovar konkukian str.97-27
#=GS NC_007530.2/3605425-3605323          organism  Bacillus anthracis str.′Ames Ancestor ′
#=GS NZ_AAAC02000001.1/4059572-4059470    organism  Bacillus anthracis str.A2012
#=GS NZ_AAEN01000012.1/139994-140096      organism  Bacillus anthracis str.CNEVA-9066
#=GS NZ_AAEO01000020.1/51249-51351        organism  Bacillus anthracis str.A1055
#=GS NZ_AAEP01000042.1/12489-12387        organism  Bacillus anthracis str.Vollum
#=GS NZ_AAEQ01000019.1/51159-51261        organism  Bacillus anthracis str.Kruger B
#=GS NZ_AAER01000035.1/118314-118212      organism  Bacillus anthracis str.Western North America USA6153
#=GS NZ_AAES01000032.1/51320-51422        organism  Bacillus anthracis str.Australia 94
#=GS NC_006371.1/1538896-1538796        organism  photobacterium profundum SS9
#=GS NC_004460.1/504371-504471          organism  Vibrio vulnificus CMCP6
#=GS NC_005140.1/1130553-1130653        organism  Vibrio vulnificus YJ016
#=GS NC_004116.1/1094305-1094209        organism  Streptococcus agalactiae 2603V/R
#=GS NC_004368.1/1163490-1163394        organism  Streptococcus agalactiae NEM316
#=GS NZ_AADT03000005.1/42245-42347      organism  Moorella thermoacetica ATCC 39073
#=GS NC_004557.1/2551392-2551293        organism  Clostridium tetani E88
#=GS NC_003028.1/1754786-1754882        organism  Streptococcus pneumoniae TIGR4
#=GS NC_003098.1/1634825-1634921        organism  Streptococcus pneumoniae R6
#=GS NZ_AAGY01000085.1/5640-5736        organism  Streptococcus pneumoniae TIGR4
#=GS NZ_AAEK01000001.1/183902-184006    organism  Bacillus cereus G9241
#=GS NC_003454.1/1645820-1645721        organism  Fusobacterium nucleatum subsp.nucleatum ATCC 25586
#=GS NZ_AADW02000027.1/2980-2880        organism  Exiguobacterium sp.255-15
#=GS NZ_AADW02000005.1/179959-180061    organism  Exiguobacterium sp.  255-15
#=GS NC_006582.1/1039390-1039492        organism  Bacillus clausii KSM-K16
#=GS NC_002737.1/930749-930845          organism  Streptococcus pyogenes M1 GAS
#=GS NC_003485.1/910599-910695          organism  Streptococcus pyogenes MGAS8232
#=GS NC_004070.1/846557-846653          organism  Streptococcus pyogenes MGAS315
#=GS NC_004606.1/977077-977173          organism  Streptococcus pyogenes SSI-1
#=GS NC_006086.1/857664-857760          organism  Streptococcus pyogenes MGAS10394
#=GS NZ_AAFV01000199.1/507-411          organism  Streptococcus pyogenes M49 591
#=GS NC_004605.1/1369721-1369821        organism  Vibrio parahaemolyticus RIMD 2210633
#=GS NZ_AAAW03000004.1/66862-66959      organism  Desulfitobacterium hafniense DCB-2
#=GS NC_004567.1/2968830-2968731        organism  Lactobacillus plantarum WCFS1
#=GS NZ_AAEV01000003.1/13765-13667      organism  Pediococcus pentosaceus ATCC 25745
#=GS NC_002570.2/806873-806971          organism  Bacillus halodurans C-125
#=GS NZ_AAEK01000052.1/27552-27452      organism  Bacillus cereus G9241
#=GS NC_006814.1/237722-237626          organism  Lactobacillus acidophilus NCFM
#=GS NC_005363.1/3414604-3414703        organism  Bdellovibrio bacteriovorus HD100
#=GS NZ_AADT03000021.1/9410-9513        organism  Moorella thermoacetica ATCC 39073
#=GS NC_004668.1/2288426-2288328        organism  Enterococcus faecalis V583
#=GS NC_006449.1/1182949-1183044        organism  Streptococcus thermophilus CNRZ1066
#=GS NZ_AAGS01000026.1/9921-10016       organism  Streptococcus thermophilus LMD-9
#=GS NZ_AAGQ01000089.1/170-269          organism  Lactobacillus delbrueckii subsp.bulgaricus ATCC BAA-365
#=GS NZ_AABF02000293.1/1-98             organism  Fusobacterium nucleatum subsp.vincentii ATCC 49256
#=GS NC_006448.1/1185082-1185177        organism  Streptococcus thermophilus LMG 18311
#=GS NC_004567.1/2410478-2410577        organism  Lactobacillus plantarum WCFS1
#=GS NZ_AABJ03000010.1/47704-47802      organism  Oenococcus oeni PSU-1
#=GS NZ_AADT03000002.1/89184-89083    organism  Moorella thermoacetica ATCC 39073
#=GS NC_006814.1/1971978-1972076      organism  Lactobacillus acidophilus NCFM
#=GS NZ_AAAO02000016.1/1579-1480      organism  Lactobacillus gasseri
#=GS NC_005362.1/1949387-1949485      organism  Lactobacillus johnsonii NCC 533
#=GS NZ_AAAO02000035.1/3299-3201      organism  Lactobacillus gasseri
#=GS NC_005362.1/263146-263049        organism  Lactobacillus johnsonii NCC 533
#=GS NC_005363.1/2004933-2004835      organism  Bdellovibrio bacteriovorus HD100
#=GS NZ_AADT03000002.1/98293-98192    organism  Moorella thermoacetica ATCC 39073
#=GS NZ_AABH02000036.1/17403-17500    organism  Leuconostoc mesenteroides subsp.mesenteroides ATCC 8293
#=GS NC_006055.1/484139-484044        organism  Mesoplasma florum L1
#=GS NZ_AABH02000272.1/211-308        organism  Leuconostoc mesenteroides subsp.mesenteroides ATCC 8293
#=GS NZ_AABJ03000003.1/47905-47810    organism  Oenococcus oeni PSU-1
#=GS NZ_AABH02000038.1/17559-17463    organism  Leuconostoc mesenteroides subsp.mesenteroides ATCC 8293
#=GS NC_006055.1/397027-397123        organism  Mesoplasma florum L1
#=GS NC_003869.1/586365-586467        taxonomy  Bacteria;Firmicutes;Clostridia;Thermoanaerobacteriales;
                                       Thermoanaerobacteriaceae;Thermoanaerobacter;tengcongensis
#=GS NC_002570.2/1593074-1592972      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       halodurans
#=GS NC_002570.2/676475-676577        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       halodurans
#=GS NC_000964.2/4004541-4004643      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       subtilis
#=GS NC_003366.1/513088-512986        taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                       Clostridiaceae;Clostridium;perfringens
#=GS NC_000964.2/693775-693877        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       subtilis
#=GS NC_002570.2/650309-650411        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       halodurans
#=GS NC_006270.2/2294931-2294831      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       licheniformis
#=GS NC_006322.1/2295788-2295688      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       licheniformis
#=GS NC_004193.1/1103943-1104045      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Oceanobacillus;
                                       iheyensis
#=GS NC_003909.8/1650407-1650509      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereusgroup;Bacillus;cereus
#=GS NC_003997.3/1497571-1497673      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NC_005945.1/1497645-1497747        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NC_005957.1/1521880-1521982        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;thuringiensis
#=GS NC_006274.1/1532482-1532584        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;cereus
#=GS NC_007530.2/1497694-1497796        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAAC02000001.1/1985987-1986089  taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEK01000008.1/96466-96364      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;cereus
#=GS NZ_AAEN01000011.1/67143-67245      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEO01000025.1/66855-66957      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEP01000035.1/69365-69467      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEQ01000029.1/70848-70950      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAER01000023.1/58182-58284      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAES01000034.1/69121-69223      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;anthracis
#=GS NC_004722.1/1515239-1515341        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereusgroup;Bacillus;cereus
#=GS NC_000964.2/697711-697813          taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         subtilis
#=GS NC_002976.3/54816-54919            taxonomy Bacteria;Firmicutes;Bacillales;Staphylococcus;epidermidis
#=GS NC_004461.1/2433047-2432944        taxonomy Bacteria;Firmicutes;Bacillales;Staphylococcus;epidermidis
#=GS NC_003030.1/2824953-2824855        taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                         Clostridiaceae;Clostridium;acetobutylicum
#=GS NC_003909.8/296465-296567          taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereusgroup;Bacillus;cereus
#=GS NC_003997.3/262601-262703          taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereusgroup;Bacillus;anthracis
#=GS NC_004722.1/261558-261660          taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NC_005945.1/262614-262716        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NC_005957.1/268537-268639        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;thuringiensis
#=GS NC_006274.1/267835-267937        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NC_007530.2/262601-262703        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAAC02000001.1/796036-796138  taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEK01000017.1/88397-88499    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NZ-AAEN01000023.1/16980-17082    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEO01000030.l/17090-17192    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEP01000043.1/12962-13064    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereusgroup;Bacillus;anthracis
#=GS NZ_AAEQ01000040.1/4962-4860      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereusgroup;Bacillus;anthracis
#=GS NZ_AAER01000030.1/4374-4272      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAES01000040.1/14760-14862    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NC_006270.2/693198-693300        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       licheniformis
#=GS NC_006322.1/692981-693083        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       licheniformis
#=GS NC_004722.1/259601-259703        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NC_000964.2/2319410-2319310      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       subtilis
#=GS NC_003030.1/2905050-2904948      taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                       Clostridiaceae;Clostridium;acetobutylicum
#=GS NC_003210.1/611119-611017        taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                       monocytogenes
#=GS NZ_AADQ01000001.1/2431-2533      taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                   monocytogenes
#=GS NC_003212.1/610156-610054    taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                   innocua
#=GS NC_003366.1/422820-422922    taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                   Clostridiaceae;Clostridium;perfringens
#=GS NC_002973.5/617846-617744    taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                   monocytogenes
#=GS NZ_AADR01000111.1/1598-1496  taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                   monocytogenes
#=GS NC 003909.8/294509-294611    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                   Bacillus;cereus group;Bacillus;cereus
#=GS NC_005957.1/266577-266679    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                   Bacillus;cereus group;Bacillus;thuringiensis
#=GS NC_006274.1/265875-265977    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                   Bacillus;cereusgroup;Bacillus;cereus
#=GS NC_003366.1/2618421-2618323  taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                   Clostridiaceae;Clostridium;perfringens
#=GS NC_002973.5/1940027-1939926  taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                   monocytogenes
#=GS NC_003212.1/2013345-2013244  taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                   innocua
#=GS NZ_AADQ01000095.1/1690-1791  taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                   monocytogenes
#=GS NZ_AADR01000082.1/3415-3516  taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
                                   monocytogenes
#=GS NC_003366.1/2871201-2871101  taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                   Clostridiaceae;Clostridium;perfringens
#=GS NC_002745.2/430797-430900    taxonomy Bacteria;Firmicutes;Bacillales;Staphylococcus;aureus
#=GS NC_002758.2/430754-430857    taxonomy Bacteria;Firmicutes;Bacillales;Staphylococcus;aureus
#=GS NC_002951.2/460059-460162    taxonomy Bacteria;Firmicutes;Bacillales;Staphylococcus;aureus
#=GS NC_002952.2/441050-441153    taxonomy Bacteria;Firmicutes;Bacillales;Staphylococcus;aureus
#=GS NC_002953.3/409191-409294    taxonomy Bacteria;Firmicutes;Bacillales;Staphylococcus;aureus
#=GS NC_003923.1/410546-410649    taxonomy Bacteria;Firmicutes;Bacillales;Staphylococcus;aureus
#=GS NC_006582.1/1115665-1115767  taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                   clausii
#=GS NC_006510.1/274257-274359    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Geobacillus;
                                   kaustophilus
#=GS NC_003210.1/1958922-1958821  taxonomy Bacteria;Firmicutes;Bacillales;Listeriaceae;Listeria;
#=GS NC_006270.2/697054-697156        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       licheniformis
#=GS NC_006322.1/696838-696940        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       licheniformis
#=GS NC_006510.1/282580-282682        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Geobacillus;
                                       kaustophilus
#=GS NC_003997.3/260641-260743        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacinus;
                                       Bacillus;cereusgroup;Bacillus;anthracis
#=GS NC_005945.1/260654-260756        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NC_007530.2/260641-260743        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEK01000017.1/86437-86539    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NZ_AAEN01000023.1/15020-15122    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEO01000030.1/15130-15232    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereusgroup;Bacillus;anthracis
#=GS NZ_AAEP01000043.1/11002-11104    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEQ01000040.1/6922-6820      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAER01000030.1/6334-6232      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAES01000040.1/12800-12902    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NC_004193.1/760473-760575        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Oceanobacillus;
                                       iheyensis
#=GS NC-006270.2/4024210-4024312      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       licheniformis
#=GS NC_006322.1/4024324-4024426      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       licheniformis
#=GS NC_004193.1/786767-786868        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Oceanobacillus;
                                       iheyensis
#=GS NC_002662.1/1159509-1159607      taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
#=GS NC_000964.2/625993-625893        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       subtilis
#=GS NC_003909.8/382630-382528        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NC_003997.3/342356-342254        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NC_005945.1/342369-342267        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NC_005957.1/356354-356252        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;thuringiensis
#=GS NC_006274.1/357462-357360        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NC_007530.2/342356-342254        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ__AAAC02000001.1/859268-859166 taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEK01000051.1/8150-8252      taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NZ_AAEN01000023.1/83441-83339    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereusgroup;Bacillus;anthracis
#=GS NZ_AAEO01000030.1/96886-96784    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEP01000046.1/48810-48708    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEQ01000034.1/49483-49381    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAER01000042.1/191339-191441  taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAES01000043.1/48479-48377    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAAC02000001.1/794076-794178  taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;anthracis
#=GS NC_003030.1/1002176-1002275      taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                       Clostridiaceae;Clostridium;acetobutylicum
#=GS NC_006582.1/1554717-1554819      taxonomy Bacteria;Firmicutes;Baciliales;Bacillaceae;Bacillus;
                                       clausii
#=GS NC_003909.8/336194-336296        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NC_003997.3/295331-295433        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NC_005945.1/295344-295446           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NC_005957.1/309524-309626           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;thuringiensis
#=GS NC_006274.1/309094-309196           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;cereus
#=GS NC_007530.2/295331-295433           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAAC02000001.1/812243-812345     taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEK01000064.1/23153-23051       taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;cereus
#=GS NZ_AAEN01000023.1/36414-36516       taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEO01000030.1/49824-49926       taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEP01000046.1/1785-1887         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEQ01000034.1/2457-2559         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAER01000042.1/238364-238262     taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAES01000043.1/1489-1591         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NC_004193.1/769686-769787           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Oceanobacillus;
                                          iheyensis
#=GS NC_004722.1/343847-343745           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;cereus
#=GS NZ_AAAW03000042.1/15038-14936       taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                          Peptococcaceae;Desulfitobacterium;hafniense
#=GS NZ_AADT03000005.1/34629-34731       taxonomy Bacteria;Firmicutes;Clostridia;Thermoanaerobacteriales;
                                          Thermoanaerobacteriaceae;Moorella group;Moorella;thermoacetica
#=GS NC_002570.2/648442-648544           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          halodurans
#=GS NC_004722.1/298774-298876           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus; cereus group; Bacillus;cereus
#=GS NC_006510.1/272473-272575           taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Geobacillus;
                                          kaustophilus
#=GS NZ_AADW02000004.1/225764-225662     taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Exiguobacterium;
                                          sp.
#=GS NC_006274.1/3685852-3685750         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;cereus
#=GS NZ_AAGO01000011.1/2345-2247         taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                          Lactococcus;lactis
#=GS NZ_AAAK03000113.1/5724-5822         taxonomy Bacteria;Firmicutes;Lactobacillales;Enterococcaceae;
                                          Enterococcus;faecium
#=GS NZ_AADW02000005.1/186378-186480     taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Exiguobacterium;
                                          sp.
#=GS NC_003909.8/3578068-3577966         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;cereus
#=GS NC_003997.3/3605298-3605196         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NC_004722.1/3766254-3766152         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereusgroup;Bacillus;cereus
#=GS NC_005945.1/3605993-3605891         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereusgroup;Bacillus;anthracis
#=GS NC_005957.1/3626969-3626867         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;thuringiensis
#=GS NC_007530.2/3605425-3605323         taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereusgroup;Bacillus;anthracis
#=GS NZ_AAAC02000001.1/4059572-4059470   taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereusgroup;Bacillus;anthracis
#=GS NZ_AAEN01000012.1/139994-140096     taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereusgroup;Bacillus;anthracis
#=GS NZ_AAEO01000020.1/51249-51351       taxonomy Bacteria;Firmicutes;Bacillales; Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAEP01000042.1/12489-12387       taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereusgroup;Bacillus;anthracis
#=GS NZ_AAEQ01000019.1/51159-51261       taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus;anthracis
#=GS NZ_AAER01000035.1/118314-118212     taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereus group;Bacillus anthracis
#=GS NZ_AAES01000032.1/51320-51422       taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                          Bacillus;cereusgroup;Bacillus anthracis
#=GS NC_006371.1/1538896-1538796        taxonomy Bacteria;proteobacteria;Gammaproteobacteria;Vibrionales;
                                         Vibrionaceae;photobacterium;profundum
#=GS NC_004460.1/504371-504471          taxonomy Bacteria;proteobacteria;Gammaproteobacteria;Vibrionales;
                                         Vibrionaceae;Vibrio;vulnificus
#=GS NC_005140.1/1130553-1130653        taxonomy Bacteria;proteobacteria;Gammaproteobacteria;Vibrionales;
                                         Vibrionaceae;Vibrio;vulnificus
#=GS NC_004116.1/1094305-1094209        taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                         Streptococcus;agalactiae
#=GS NC_004368.1/1163490-1163394        taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                         Streptococcus;agalactiae
#=GS NZ_AADT03000005.1/42245-42347      taxonomy Bacteria;Firmicutes;Clostridia;Thermoanaerobacteriales;
                                         Thermoanaerobacteriaceae;Moorella group;Moorella;thermoacetica
#=GS NC_004557.1/2551392-2551293        taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                         Clostridiaceae;Clostridium;tetani
#=GS NC_003028.1/1754786-1754882        taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                         Streptococcus;pneumoniae
#=GS NC_003098.1/1634825-1634921        taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                         Streptococcus;pneumoniae
#=GS NZ_AAGY01000085.1/5640-5736        taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                         Streptococcus;pneumoniae
#=GS NZ_AAEK01000001.1/183902-184006    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         Bacillus;cereus group;Bacillus;cereus
#=GS NC_003454.1/1645820-1645721        taxonomy Bacteria;Fusobacteria;Fusobacterales;Fusobacteriaceae;
                                         Fusobacterium;nucleatum
#=GS NZ_AADW02000027.1/2980-2880        taxonomy Bacteria;Firmicutes;Bacillales; Bacillaceae;Exiguobacterium;
                                         sp.
#=GS NZ_AADW02000005.1/179959-180061    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Exiguobacterium;
                                         sp.
#=GS NC_006582.1/1039390-1039492        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                         clausii
#=GS NC_002737.1/930749-930845          taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                         Streptococcus;pyogenes
#=GS NC_003485.1/910599-910695          taxonomy  Bacteria;Firmicutes;Lactobacillales; Streptococcaceae;
                                         Streptococcus;pyogenes
#=GS NC_004070.1/846557-846653          taxonomy  Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                         Streptococcus;pyogenes
#=GS NC_004606.1/977077-977173          taxonomy  Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                         Streptococcus;pyogenes
#=GS NC_006086.1/857664-857760        taxonomy  Bacteria; Firmicutes;Lactobacillales;Streptococcaceae;
                                       Streptococcus;pyogenes
#=GS NZ_AAFV01000199.1/507-411        taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                       Streptococcus;pyogenes
#=GS NC_004605.1/1369721-1369821      taxonomy Bacteria;Proteobacteria;Gammaproteobacteria;Vibrionales;
                                       Vibrionaceae;Vibrio;parahaemolyticus
#=GS NZ_AAAW03000004.1/66862-66959    taxonomy Bacteria;Firmicutes;Clostridia;Clostridiales;
                                       Peptococcaceae;Desulfitobacterium;hafniense
#=GS NC_004567.1/2968830-2968731      taxonomy Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                       Lactobacillus;plantarum
#=GS NZ_AAEV01000003.1/13765-13667    taxonomy Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                       Pediococcus;pentosaceus
#=GS NC_002570.2/806873-806971        taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       halodurans
#=GS NZ_AAEK01000052.1/27552-27452    taxonomy Bacteria;Firmicutes;Bacillales;Bacillaceae;Bacillus;
                                       Bacillus;cereus group;Bacillus;cereus
#=GS NC_006814.1/237722-237626        taxonomy  Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                       Lactobacillus;acidophilus
#=GSNC_005363.1/3414604-3414703       taxonomy Bacteria;proteobacteria;Deltaproteobacteria;
                                       Bdellovibrionales;Bdellovibrionaceae;Bdellovibrio;bacteriovorus
#=GS N2_AADT03000021.1/9410-9513      taxonomy Bacteria;Firmicutes;Clostridia;Thermoanaerobacteriales;
                                       Thermoanaerobacteriaceae;Moorella group;Moorella;thermoacetica
#=GS NC_004668.1/2288426-2288328      taxonomy Bacteria;Firmicutes;Lactobacillales;Enterococcaceae;
                                       Enterococcus;faecalis
#=GS NC_006449.1/1182949-1183044      taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                       Streptococcus;thermophilus
#=GS NZ_AAS01000026.1/9921-10016      taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                       Streptococcus;thermophilus
#=GS NZ_AAGQ01000089.1/170-269        taxonomy Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                       Lactobacillus;delbrueckii
#=GS NZ_AABF02000293.1/1-98           taxonomy Bacteria;Fusobacteria;Fusobacteria(class);Fusobacterales;
                                       Fusobacteriaceae;Fusobacterium;nucleatum
#=GS NC_006448.1/1185082-1185177      taxonomy Bacteria;Firmicutes;Lactobacillales;Streptococcaceae;
                                       Streptococcus;thermophilus
#=GS NC_004567.1/2410478-2410577      taxonomy Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                       Lactobacillus;plantarum
#=GS NZ_AABJ03000010.1/47704-47802    taxonomy Bacteria;Firmicutes;Lactobacillales;Oenococcus;oeni
#=GS NZ_AADT03000002.1/89184-89083    taxonomy Bacteria;Firmicutes;Clostridia;Thermoanaerobacteriales;
                                    Thermoanaerobacteriaceae;Moorella group;Moorella;thermoacetica
#=GS NC_006814.1/1971978-1972076   taxonomy  Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                    Lactobacillus;acidophilus
#=GS NZ_AAAO02000016.1/1579-1480   taxonomy Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                    Lactobacillus;gasseri
#=GS NC_005362.1/1949387-1949485   taxonomy Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                    Lactobacillus;johnsonii
#=GS NZAAAO02000035.1/3299-3201    taxonomy Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                    Lactobacillus;gasseri
#=GS NC_005362.1/263146-263049     taxonomy Bacteria;Firmicutes;Lactobacillales;Lactobacillaceae;
                                    Lactobacillus;johnsonii
#=GS NC_005363.1/2004933-2004835   taxonomy Bacteria;proteobacteria;Deltaproteobacteria;
                                    Bdellovibrionales;Bdellovibrionaceae;Bdellovibrio;bacteriovorus
#=GS NZ_AADT03000002.1/98293-98192 taxonomy Bacteria;Firmicutes;Clostridia;Thermoanaerobacteriales;
                                    Thermoanaerobacteriaceae;Moorella group;Moorella;thermoacetica
#=GS NZ_AABH02000036.1/17403-17500 taxonomy Bacteria;Firmicutes;Lactobacillales;Leuconostoc;
                                    mesenteroides
#=GS NC_006055.1/484139-484044     taxonomy Bacteria;Firmicutes;Mollicutes;Entomoplasmatales;
                                    Entomoplasmataceae;Mesoplasma;florum
#=GS NZ_AABH02000272.1/211-308     taxonomy Bacteria;Firmicutes;Lactobacillales;Leuconostoc;
                                    mesenteroides
#=GS NZ_AABJ03000003.1/47905-47810 taxonomy Bacteria;Firmicutes;Lactobacillales;Oenococcus;oeni
#=GS NZ_AABH02000038.1/17559-17463 taxonomy Bacteria;Firmicutes;Lactobacillales;Leuconostoc;
                                    mesenteroides
#=GS NC_006055.1/397027-397123     taxonomy Bacteria;Firmicutes;Mollicutes;Entomoplasmatales;
                                    Entomoplasmataceae;Mesoplasma;florum
NC_003869.1/586365-586467           SEQ ID NO:12
AAAAAUUUAAUAAGA.AG.CACUCAUUAAUCCCGAGA.AU.AUGGCUCGGGA.GUCUCUACCGAACAACC..GUAAAUUGUUC.G.ACUAUGAGUGAAAAGU.GUACCUAGGG
NC_002570.2/1593074-1592972  SEQ ID NO:13
AUUUACAUUAAAAAA.AG.CACUCGUAUAAUCGCGGGA.AU.AGGGCCCGCAA.GUUUCUACCAGGCUGCC..GUAAACAGCCU.G.ACUACGAGUGAUACU.UUGACAUAGA
NC_002570.2/676475-676577    SEQ ID NO:14
CGUUCUUUAUAUAAA.GU.ACCUCAUAUAAUCUUGGGA.AU.AUGGCCCAAAA.GUUUCUACCUGCUGACC..GUAAAUCGGCG.G.ACUAUGGGGAAAGAU.UUUGGAUCUU
NC_000964.2/4004541-4004643  SEQ ID NO:15
CAUCUUAGAAAAAGA.CA.UUCUUGUAUAUGAUCAGUA.AU.AUGGUCUGAUU.GUUUCUACCUAGUAACC..GUAAAAAACUA.G.ACUACAAGAAAGUUU.GAAUAAAUUU
NC_003366.1/513088-512986    SEQ ID NO:16
UAAGUGUAUUAAAUU.UU.AACUCGUAUAUAAUCGGUA.AU.AUGGUCCGAAA.GUUUCUACCUGCUAACC..GUAAAAUAGCA.G.ACUACGAGGAGUUGU.ACUAUAAAUU
NC_000964.2/693775-693877    SEQ ID NO:17
AGAAAUCAAAUAAGA.UG.AAUUCGUAUAAUCGCGGGA.AU.AUGGCUCGCAA.GUCUCUACCAAGCUACC..GUAAAUGGCUU.G.ACUACGUAAACAUUU.CUUUCGUUUG
NC_002570.2/650309-650411          SEQ ID NO:18
AAUAAAUCGAAAACA.UC.AUUUCGUAUAAUGGCAGGA.AU.AGGGCCUGCGA.GUUUCUACCAAGCUACC..GUAAAUAGCUU.G.ACUACGAAAAUAAUG.GGUUUUUUAC
NC_006270.2/2294931-2294831        SEQ ID NO:19
AAUUUGAUACAUUAU.AU.CACUCAUAUAAUCGCGUGG.AU.AUGGCACGCAA.GUUUCUACCGGGCA-CC..GUAAA-UGUCC.G.ACUAUGAGUGGGCGA.UAAGAAAACG
NC_006322.1/2295788-2295688        SEQ ID NO:20
AAUUUGAUACAUUAU.AU.CACUCAUAUAAUCGCGUGG.AU.AUGGCACGCAA.GUUUCUACCGGGCA-CC..GUAAA-UGUCC.G.ACUAUGAGUGGGCGA.UAAGAAAACG
NC_004193.1/1103943-1104045        SEQ ID NO:21
AAACCUUAUAUAUAG.UU.UUUUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGGUUUACC..GUAAAUGAACC.G.ACUAUGGAAAAGCGG.AAAAUUCGAU
NC_003909.8/1650407-1650509        SEQ ID NO:22
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NC_003997.3/1497571-1497673        SEQ ID NO:23
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NC_005945.1/1497645-1497747        SEQ ID NO:24
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NC_005957.1/1521880-1521982        SEQ ID NO:25
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAUACUUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NC_006274.1/1532482-1532584        SEQ ID NO:26
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NC_007530.2/1497694-1497796        SEQ ID NO:27
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NZ_AAAC02000001.1/1985987-1986089  SEQ ID NO:28
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NZ_AAEK01000008.1/96466-96364      SEQ ID NO:29
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NZ_AAEN01000011.1/67143-67245      SEQ ID NO:30
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NZ_AAEO01000025.1/66855-66957      SEQ ID NO:31
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NZ_AAEP01000035.1/69365-69467      SEQ ID NO:32
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NZ_AAEQ01000029.1/70848-70950      SEQ ID NO:33
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NZ_AAER01000023.1/58182-58284      SEQ ID NO:34
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NZ_AAES01000034.1/69121-69223      SEQ ID NO:35
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAUUU
NC_004722.1/1515239-1515341        SEQ ID NO:36
AAAUAAAUAGUUAGC.UA.CACUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUUUCUACCGAAGUACC..GUAAAUACUUU.G.ACUAUGAGUGAGGAC.GAAUAUAAUU
Nc_000964.2/697711-697813         SEQ ID NO:37
CAUGAAAUCAAAACA.CG.ACCUCAUAUAAUCUUGGGA.AU.AUGGCCCAUAA.GUUUCUACCCGGCAACC..GUAAAUUGCCG.G.ACUAUGCAGGAAAGU.GAUCGAUAAA
NC_002976.3/54816-54919           SEQ ID NO:38
CAUAAAAUAAUUUAU.AU.GACUCAUAUAAUCUAGAGA.AU.AUGGCUUUAGAaGUUUCUACCGUGUCGCC..AUAAACGACAC.G.ACUAUGAGUAACAAU.CCAAUACAUU
NC_004461.1/2433047-2432944       SEQ ID NO:39
CAUAAAAUAAUUUAU.AU.GACUCAUAUAAUCUAGAGA.AU.AUGGCUUUAGAaGUUUCUACCGUGUCGCC..AUAAACGACAC.G.ACUAUGAGUAACAAU.CCAAUACAUU
Nc_003030.1/2824953-2824855       SEQ ID NO:40
AAUCGUUAAUAUAGU.UU.AACUCAUAUAU-UUCCUGA.AU.AUGGCAGGAU-.GUUUCUACAAGGAA-CC..UUAAA-UUUCU.U.ACUAUGAGUGAUUUG.UUUGUAUGCA
Nc-003909.8/296465-296567        SEQ ID NO:41
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NC_003997.3/262601-262703        SEQ ID NO:42
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NC_004722.1/261558-261660        SEQ ID NO:43
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NC_005945.1/262614-262716        SEQ ID NO:44
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
Nc_005957.1/268537-268639        SEQ ID NO:45
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NC_006274.1/267835-267937        SEQ ID NO:46
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NC_007530.2/262601-262703        SEQ ID NO:47
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NZ_AAAC02000001.1/796036-796138  SEQ ID NO:48
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NZ_AAEK01000017.1/88397-88499    SEQ ID NO:49
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NZ_AAEN01000023.1/16980-17082    SEQ ID NO:50
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NZ_AAEO01000030.1/17090-17192    SEQ ID NO:51
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NZ_AAEP01000043.1/12962-13064    SEQ ID NO:52
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NZ_AAEQ01000040.1/4962-4860      SEQ ID NO:53
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NZ_AAER0100003 0.1/4374-4272     SEQ ID NO:54
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
NZ_AAES01000040.1/14760-14862    SEQ ID NO:55
GAAAAGUGAAUAUUA.UG.CCGUCGUAUAAUAUCGGGG.AU.AUGGCCCGAAA.GUUUCUACCUAGCUACC..GUAAAUGGCUU.G.ACUACGAGGCGUUUU.UAUAAAGGUG
Nc_006270.2/693198-693300       SEQ ID NO:56
AGUAAUUUAAAAAAG.AC.UUGUCGUAUAAUCAUGGGG.AU.AUGGCCCAUAA.GUUUCUACCAAGCUACC..GUAAAUAGCUU.G.ACUACGCUUGUAUAC.AAUAUUUUAU
NC_006322.1/692981-693083       SEQ ID NO:57
AGUAAUUUAAAAAAG.AC.UUGUCGUAUAAUCAUGGGG.AU.AUGGCCCAUAA.GUUUCUACCAAGCUACC..GUAAAUAGCUU.G.ACUACGCUUGUAUAC.AAUAUUUUAU
NC_004722.1/259601-259703       SEQ ID NO:58
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAUG.AU.AUGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NC_000964.2/2319410-2319310     SEQ ID NO:59
UUACAAUAUAAUAGG.AA.CACUCAUAUAAUCGCGUGG.AU.AUGGCACGCAA.GUUUCUACCGGGCA-CC..GUAAA-UGUCC.G.ACUAUGGGUGAGCAA.UGGAACCGCA
NC_003030.1/2905050-2904948     SEQ ID NO:60
GAAAAGUAAUAACAU.AU.UACCCGUAUAUGCUUAGAA.AU.AUGGUCUAAGC.GUCUCUACCGGACUGCC..GUAAAUUGUCU.G.ACUAUGGGUGUUUAU.AAGUAUUUUA
NC_003210.1/611119-611017       SEQ ID NO:61
AAUCCGCUACAAUAA.UA.UAGUCGUAUUAAGUCGGUA.AU.AUGGACCGUUC.GUUUCUACCAGGCAACC..GUAAAAUGCCA.G.GCUACGAGCUAUUGU.AAAAUUUAAU
NZ_AADQ01000001.1/2431-2533     SEQ ID NO:62
AAUCCGCUACAAUAA.UA.UAGUCGUAUAAGUUCGGUA.AU.AUGGACCGUUC.GUUUCUACCAGGCAACC..GUAAAAUGCCA.G.GCUACGAGCUAUUGU.AAAAUUUAAU
NC_003212.1/610156-610054       SEQ ID NO:63
AAUCGUCUACAAUAA.UA.AAGUCGUAUAAGUUCGGUA.AU.AUGGACCGUUC.GUUUCUACCAGGCAACC..GUAAAAUGCCA.G.GCUACGAGCUAUUGU.AAAAUUUAAU
NC_003366.1/422820-422922       SEQ ID NO:64
UAUGUACUUAUAUAA.GU.AUAUCGUAUAUGCUCGACG.AU.AUGGGUUGAGU.GUUUCUACUAGGAGGCC..GUAAACAUCCU.A.ACUACGAAUAUAUAG.GUGAUUUCUA
NC_002973.5/617846-617744       SEQ ID NO:65
AAUCCGCUACAAUAA.UA.AAGUCGUAUAAGUUCGGUA.AU.AUGGACCGUUC.GUUUCUACCAGGCAACC..GUAAAAUGCCA.G.GCUACGAGCUAUUGU.AAAAUUUAAU
NZ_AADR01000111.1/1598-1496     SEQ ID NO:66
AAUCCGCUACAAUAA.UA.AAGUCGUAUAAGUUCGGUA.AU.AUGGACCGUUC.GUUUCUACCAGGCAACC..GUAAAAUGCCA.G.GCUACGAGCUAUUGU.AAAAUUUAAU
NC_003909.8/294509-294611       SEQ ID NO:67
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AUGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NC_005957.1/266577-266679       SEQ ID NO:68
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AUGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NC_006274.1/265875-265977       SEQ ID NO:69
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AUGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NC_003366.1/2618421-2618323     SEQ ID NO:70
AAAACGGAAUAUAAA.CA.AACUCGUAUAA-GCUUUGA.AU.AAGGCAAGGC-.GUUUCUACCGGAAA-CC..UUAAA-UUUCC.G.UCUAUGAGUGAAUUU.GAUAUACUAU
NC_002973.5/1940027-1939926      SEQ ID NO:71
AUAACUUAAAACCGA.AA.UACUUAUAUAAUAGUUGCG.AU.-UGGGCGACGA.GUUUCUACCUGGUUACC..GUAAAUAACCG.G.ACUAUGAGUAGUUUG.UAUAAAGAAG
NC_003212.1/2013345-2013244      SEQ ID NO:72
AUAACUUAAAACCGA.AA.UACUUAUAUAAUAGUUGCG.AU.-UGGGCGACGA.GUUUCUACCUGGUUACC..GUAAAUAACCG.G.ACUAUGAGUAGUUUG.UAUAAAGAAG
NZ_AADQ01000095.1/1690-1791      SEQ ID NO:73
AUAACUUAAAACCGA.AA.UACUUAUAUAAUAGUUGCG.AU.-UGGGCGACGA.GUUUCUACCUGGUUACC..GUAAAUAACCG.G.ACUAUGAGUGAUUUG.UAUAAAGAAG
NZ_AADR01000082.1/3415-3516      SEQ ID NO:74
AUAACUUAAAACCGA.AA.UACUUAUAUAAUAGUUGCG.AU.-UGGGCGACGA.GUUUCUACCUGGUUACC..GUAAAUAACCG.G.ACUAUGAGUAGUUUG.UAUAAAGAAG
NC_003366.1/2871201-2871101    SEQ ID NO:75
AUAAAAAAAUAAAUU.UU.GCUUCGUAUAACUCUAAUG.AU.AUGGAUUAGAG.GUCUCUACCAAGAA-CC..GAGAA-UUCUU.G.AUUACGAAGAAAGCU.UAUUUGCUUU
NC_002745.2/430797-430900      SEQ ID NO:76
GUUAAAUAAUUUACA.UA.AACUCAUAUAAUCUAAAGA.AU.AUGGCUUUAGAaGUUUCUACCAUGUUGCC..UUGAACGACAU.G.ACUAUGAGUAACAAC.ACAAUACUAG
NC_002758.2/430754-430857      SEQ ID NO:77
GUUAAAUAAUUUACA.UA.AACUCAUAUAAUCUAAAGA.AU.AUGGCUUUAGAaGUUUCUACCAUGUUGCC..UUGAACGACAU.G.ACUAUGAGUAACAAC.ACAAUACUAG
NC_002951.2/460059-460162      SEQ ID NO:78
GUUAAAUAAUUUACA.UA.AACUCAUAUAAUCUAAAGA.AU.AUGGCUUUAGAaGUUUCUACCAUGUUGCC..UUGAACGACAU.G.ACUAUGAGUAACAAC.ACAAUACUAG
NC_002952.2/441050-441153      SEQ ID NO:79
GUUAAAUAAUUUACA.UA.AACUCAUAUAAUCUAAAGA.AU.AUGGCUUUAGAaGUUUCUACCAUGUUGCC..UUGAACGACAU.G.ACUAUGAGUAACAAC.ACAAUACUAG
NC_002953.3/409191-409294      SEQ ID NO:80
GUUAAAUAAUUUACA.UA.AACUCAUAUAAUCUAAAGA.AU.AUGGCUUUAGAaGUUUCUACCAUGUUGCC..UUGAACGACAU.G.ACUAUGAGUAACAAC.ACAAUACUAG
NC_003923.1/410546-410649      SEQ ID NO:81
GUUAAAUAAUUUACA.UA.AACUCAUAUAAUCUAAAGA.AU.AUGGCUUUAGAaGUUUCUACCAUGUUGCC..UUGAACGACAU.G.ACUAUGAGUAACAAC.ACAAUACUAG
NC_006582.1/1115665-1115767    SEQ ID NO:82
AAGUUAAAAACGAAA.AC.ACCUCAUAUAUACUCGGGA.AU.AUGGCUCGAAC.GUUUCUACCCGGCAACC..GUAAAUUGCCG.G.ACUAUGAGGGGAAGU.CAUUACGCGC
NC_006510.1/274257-274359      SEQ ID NO:83
AUGAAUAUUGUUGAA.UU.CCGUCGUAUAAUCCCGGGA.AU.AUGGCUCGGGA.GUUUCUACCAAGCUACC..GUAAAUAGCUU.G.ACUACGAGGGAUGCG.GGAUCGGAGA
NC_003210.1/1958922-1958821    SEQ ID NO:84
AUAACUUAAAACCGA.AA.UACUUGUAUAAUAGUUGCG.AU.-UGGGCGACGA.GUUUCUACCUGGUUACC..GUAAAUAACCG.G.ACUAUGAGUAGUUUG.UAUAAAGAAG
NC_006270.2/697054-697156      SEQ ID NO:85
CAUGACAUGAAAACA.CA.UCCUCAUAUAAUCUUGGGA.AU.AUGGCCCAUAA.GUCUCUACCCGAUGACC..GUAAAUCAUCG.G.ACUAUGCAGGAAAGU.GGACAAUAAA
NC_006322.1/696838-696940      SEQ ID NO:86
CAUGACAUGAAAACA.CA.UCCUCAUAUAAUCUUGGGA.AU.AUGGCCCAUAA.GUCUCUACCCGAUGACC..GUAAAUCAUCG.G.ACUAUGCAGGAAAGU.GGACAAUAAA
NC_006510.1/282580-282682      SEQ ID NO:87
AUAGUGUAUGAGAAG.AU.CCCUCAUAUAAUUUUGGGA.AU.AUGGCCCAAAA.GUUUCUACCCAAUCACC..GUAAAUGAUUG.G.ACUAUGAGGGAAAGG.AUCGGUUUUG
NC_003997.3/260641-260743      SEQ ID NO:88
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NC_005945.1/260654-260756      SEQ ID NO:89
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NC_007530.2/260641-260743      SEQ ID NO:90
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NZ_AAEK01000017.1/86437-86539  SEQ ID NO:91
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NZ_AAEN01000023.1/15020-15122  SEQ ID NO:92
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NZ_AAEO01000030.1/15130-15232       SEQ ID NO:93
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NZ_AAEP01000043.1/11002-11104       SEQ ID NO:94
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NZ_AAEQ01000040.1/6922-6820         SEQ ID NO:95
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NZ_AAER01000030.1/6334-6232         SEQ ID NO:96
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NZ_AAES01000040.1/12800-12902       SEQ ID NO:97
AGAUAAUAUAAAACG.AU.CCUUCAUAUAUCCUCAAAG.AU.AAGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAAGGCAGUG.UGUCUUAUAU
NC_004193.1/760473-760575           SEQ ID NO:98
CAAUUUUUAUCCAAU.GC.CUUUCGUAUAUCCUCGAUA.AU.AUGGUUCGAAA.GUAUCUACCGGGUCACC..GUAAAUGAUCU.G.ACUAUGAAGGCAGAA.GCAGGUUCGG
NC_006270.2/4024210-4024312         SEQ ID NO:99
AAAUAAUAGAAGCCC.AC.UUCUUGUAUAUAAUCAGUA.AU.AGGGUCUGAUU.GUUUCUACCUGGCAACC..GUAAAUCGCCA.G.ACUACAAGGAAGUUU.GAAUAGAUUU
NC_006322.1/4024324-4024426         SEQ ID NO:100
AAAUAAUAGAAGCCC.AC.UUCUUGUAUAUAAUCAGUA.AU.AGGGUCUGAUU.GUUUCUACCUGGCAACC..GUAAAUCGCCA.G.ACUACAAGGAAGUUU.GAAUAGAUUU
NC_004193.1/786767-786868           SEQ ID NO:101
CCGACAAUUGAAAAU.GA.ACCUCAUAUAAAUUUGAGA.AU.AUGGCUCAGAA.GUUUCUACCCAGC-ACC..GUAAAUGGCUG.G.ACUAUGAGGGAAGAU.GGAUCAUUUC
NC_002662.1/1159509-1159607         SEQ ID NO:102
UAGUCUAUAAUAGAA.CA.AUCUUAUUUAU-ACCUAGG.AU.AUGGCUGGGC-.GUUUCUACCUCGUA-CC..GUAAA-UGCGA.G.ACAAUAAGGAAAUUC.GAUUUUUUAG
NC_000964.2/625993-625893           SEQ ID NO:103
AAUUAAAUAGCUAUU.AU.CACUUGUAUAACCUCAAUA.AU.AUGGUUUGAGG.GUGUCUACCAGGAA-CC..GUAAA-AUCCU.G.AUUACAAAAUUUGUU.UAUGACAUUU
NC_003909.8/382630-382528           SEQ ID NO:104
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NC_003997.3/342356-342254           SEQ ID NO:105
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NC_005945.1/342369-342267           SEQ ID NO:106
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NC_005957.1/356354-356252           SEQ ID NO:107
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NC_006274.1/357462-357360           SEQ ID NO:108
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NC_007530.2/342356-342254           SEQ ID NO:109
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAAC02000001.1/859268-859166     SEQ ID NO:110
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAEK01000051.1/8150-8252         SEQ ID NO:111
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAEN01000023.1/83441-83339       SEQ ID NO:112
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAEO01000030.1/96886-96784       SEQ ID NO:113
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAEP01000046.1/48810-48708       SEQ ID NO:114
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAEQ01000034.1/49483-49381       SEQ ID NO:115
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAER01000042.1/191339-191441     SEQ ID NO:116
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAES01000043.1/48479-48377       SEQ ID NO:117
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUCGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAAC02000001.1/794076-794178     SEQ ID NO:118
AGAUAAUAUAAAACG.AU.CCUUCAUAIAICCUCAAAG.AU.ARGGUUUGAGA.GUCUCUACCGGGUUACC..GUAAACAACCU.G.ACUAUGAWGGCAGUG.UGUCUUAUAU
NC_003030.1/1002176-1002275         SEQ ID NO:119
UAUAUAAAAAACUAA.AU.UUCUCGUAUAC-ACCGGUA.AU.AUGGUCCGGAA.GUUUCUACCUGCUG-CC..AUAAA-UAGCA.G.ACUACGGGGUGUUAU.UGAUAAUAUA
NC_006582.1/1554717-1554819         SEQ ID NO:120
UAAACGAACAAAGCA.UC.AGCUCGUAUAAUAGCGGUA.AU.AUGGUCCGCGA.GUCUCUACCAGGCUGCC..GAUAACGGCCU.G.ACUACGAGUGGUCUU.UUUCAGUUGU
NC_003909.8/336194-336296           SEQ ID NO:121
AAAGAAUAAUAUAUA.AG.ACGUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NC_003997.3/295331-295433           SEQ ID NO:122
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NC_005945.1/295344-295446           SEQ ID NO:123
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NC_005957.1/309524-309626           SEQ ID NO:124
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NC_006274.1/309094-309196           SEQ ID NO:125
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NC_007530.2/295331-295433           SEQ ID NO:126
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NZ_AAAC02000001.1/812243-812345     SEQ ID NO:127
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NZ_AAEK01000064.1/23153-23051       SEQ ID NO:128
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NZ_AAEN01000023.1/36414-36516       SEQ ID NO:129
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NZ_AAEO01000030.1/49824-49926       SEQ ID NO:130
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NZ_AAEP01000046.1/1785-1887        SEQ ID NO:131
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NZ_AAEQ01000034.1/2457-2559        SEQ ID NO:132
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NZ_AAER01000042.1/238364-238262    SEQ ID NO:133
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NZ_AAES01000043.1/1489-1591        SEQ ID NO:134
AAAGAAUAAUAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NC_004193.1/769686-769787          SEQ ID NO:135
UGAUGUAAUUGAAUA.GA.AAUGCGUAUAAUUAAGGGG.AU.AUGGCCC-ACA.GUUUCUACCAGACCACC..GUAAAUGGUUU.G.ACUACGCAGUAAUUA.UAUUUGUAUC
NC_004722.1/343847-343745          SEQ ID NO:136
UUAAUACGGACGAUG.UU.ACCUCAUAUAUACUUGAUA.AU.AUGGAUCGAGA.GUUUCUACCCGGCAACC..UUAAAUUGCUG.G.ACUAUGGGGAAAACU.AAUGAAUAUU
NZ_AAAW03000042.1/15038-14936      SEQ ID NO:137
AAAAAAUUUAAAUAG.GG.CGUUCAUAUAAUCGCGGAG.AU.AGGGUCCGCAA.GUUUCUACCGGGCUGCC..GUAAAUGGCCU.G.ACUAUGAGCGAAACU.GUGCCCAGGG
NZ_AADT03000005.1/34629-34731      SEQ ID NO:138
AAAAAUAAUUUAACC.CU.GCUUCGUAUAUUCCCGGAA.AU.GCGGUCCGGGA.GUUUCUACCAGGCAACC..GUAAAUUGCCC.G.GCUACGAAGGUUAUU.CUUCGUCGUC
NC_002570.2/648442-648544          SEQ ID NO:139
ACAUGUAGAUAUCAU.CC.CUUUCGUAUAUACUUGGAG.AU.AAGGUCCAGGA.GUUUCUACCAGAUCACC..GUAAAUGAUCU.G.ACUAUGAAGGUGGAA.UGGCUCGAUA
NC_004722.1/298774-298876          SEQ ID NO:140
AGAAACAAUAAUAUA.AG.ACCUCAUAUAAUCGCGGGG.AU.AUGGCCUGCAA.GUCUCUACCUAACGACC..GUUAUUCGUUA.G.ACUAUGAGGGAAAGU.CACUCGGUAU
NC_006510.1/272473-272575          SEQ ID NO:141
UACGGAUAGACGAAA.GC.CCUUCAUAUAAGCGCAAGA.AU.AUGGCUUGCGC.GUCUCUACCGGGCCGCC..GUAAACGGCCC.G.ACUAUGAAGGCAGAA.GACGCUGCUA
NZ_AADW02000004.1/225764-225662    SEQ ID NO:142
GGAAGAUUGAAUAUA.AC.ACCUCGUAUAAUAGCAGGG.AU.AUGGCUUGCAA.GUUUCUACCCGACGACC..CUAAAUCGUUG.G.ACUAUGGGGUAUAUG.GAUGUUCGUC
NC_006274.1/3685852-3685750        SEQ ID NO:143
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGAAAAA.GUGUGUAACA
NZ_AAGO01000011.1/2345-2247        SEQ ID NO:144
UUGAGCUGCUAUAAA.CA.AUCUUAUUUAU-ACCUAGA.AU.AUGGCUGGGC-.GUUUCUACCUCGUA-CC..GUAAA-UGCGA.G.ACAAUAAGGAAAUUC.GAUUUUUCAA
NZ_AAAK03000113.1/5724-5822        SEQ ID NO:145
UAUUAGUUUUACAUA.CC.UACUUAUAUAU-CGUCAUA.AU.AUGGAUGACA-.GUUUCUAGCCAGUA-CC..GUAAA-UGCUG.G.ACUAUAAGUAAAAGA.UUGGCUAUUU
NZ_AADW02000005.1/186378-186480    SEQ ID NO:146
CUAAAAAACAAAAAA.UA.AUGCCGUAUAAUUCUGGGG.AU.AUGGCCCGGAA.GUCUCUACAGGAACACC..UUAAAGGUUCC.U.ACUACGGCGUGCACU.GAUUUCCGGU
NC_003909.8/3578068-3577966        SEQ ID NO:147
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NC_003997.3/3605298-3605196        SEQ ID NO:148
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NC_004722.1/3766254-3766152        SEQID NO:149
CUUCGAAAAGAAUCA.CU.GCCUCAUAYAAYCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NC_005945.1/3605993-3605891        SEQ ID NO:150
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NC_005957.1/3626969-3626867        SEQ ID NO:151
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NC_007530.2/3605425-3605323        SEQ ID NO:152
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NZ_AAAC02000001.1/4059572-4059470  SEQ ID NO:153
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NZ_AAEN01000012.1/139994-140096    SEQ ID NO:154
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NZ_AAEO01000020.1/51249-51351      SEQ ID NO:155
CUUCGAAAAGAAUCA.CU.GCCUCAAUUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NZ_AAEP01000042.1/12489-12387      SEQ ID NO:156
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NZ_AAEQ01000019.1/51159-51261      SEQ ID NO:157
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NZ_AAER01000035.1/118314-118212    SEQ ID NO:158
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NZ_AAES01000032.1/51320-51422      SEQ ID NO:159
CUUCGAAAAGAAUCA.CU.GCCUCAUAUAAUCUUGGAG.AU.AAGGUCCAUAA.GUUUCUACCUGGCAACC..AUGAAUUGCUA.G.ACUAUGAGGGGAAAA.GUGUGUAACA
NC_006371.1/1538896-1538796        SEQ ID NO:160
UAAUAAUGGGUAAAG.UU.ACUUCGUAUAACCCCACUU.AU.AGGGUGUGGGG.GUCUCUACCAGAAU-CC..GUAAA-AUUCU.G.AUUACGAAGAGUUGA.GUGAUUGAUC
NC_004460.1/504371-504471          SEQ ID NO:161
GACUUUCGGCGAUCA.AC.GCUUCAUAUAAUCCUAAUG.AU.AUGGUUUGGGA.GUUUCUACCAAGAG-CC..UUAAA-CUCUU.G.AUUAUGAAGUCUGUC.GCUUUAUCCG
NC_005140.1/1130553-1130653        SEQ ID NO:162
GACUUUCGGCGAUCA.AC.GCUUCAUAUAAUCCUAAUG.AU.AUGGUUUGGGA.GUUUCUACCAAGAG-CC..UUAAA-CUCUU.G.AUUAUGAAGUCUGUC.GCUUUAUCCG
NC_004116.1/1094305-1094209        SEQ ID NO:163
CAAUUAAAUAUAUGA.UU.UACUUAUUUAU-GCUGAGG.AU.-UGGCUUAGC-.GUCUCUACAAGACA-CC..GU-AA-UGUCU.A.ACAAUAAGUAAGCUA.AUAAAUAGCU
NC_004368.1/1163490-1163394        SEQ ID NO:164
CAAUUAAAUAUAUGA.UU.UACUUAUUUAU-GCUGAGG.AU.-UGGCUUAGC-.GUCUCUACAAGACA-CC..GU-AA-UGUCU.A.ACAAUAAGUAAGCUA.AUAAAUAGCU
NZ_AADT03000005.1/42245-42347      SEQ ID NO:165
CAAUAAAGCCAGUCU.UA.ACUUCGUAUAUCCCCGGCA.AU.AGGGACCGGGG.GUUUCUACCAGGCAACC..GCAAAUUGCCC.G.GCUACGAAGGUAUAU.CUUCGUUGCU
NC_004557.1/2551392-2551293        SEQ ID NO:166
CUCUAUAAUAAAUUA.UU.GACUCAUAUAU-CCCCUUA.AU.AAGGUAGGGA-.GUAUCUACCAGAAG-CC..UUAAA-CUUCU.G.ACUAUGAGUGAAUAAaGCAUUGUCAU
NC_003028.1/1754786-1754882        SEQ ID NO:167
AAAAUUGAAUAUCGU.UU.UACUUGUUUAU-GUCGUGA.AU.-UGGCACGAC-.GUUUCUACAAGGUG-CC..GG-AA-CACCU.A.ACAAUAAGUAAGUCA.GCAGUGAGAU
NC_003098.1/1634825-1634921        SEQID NO:168
AAAAUUGAAUAUCGU.UU.UACUUGUUUAU-GUCGUGA.AU.-UGGCACGAC-.GUUUCUACAAGGUG-CC..GG-AA-CACCU.A.ACAAUAAGUAAGUCA.GCAGUGAGAU
NZ_AAGY01000085.1/5640-5736        SEQ ID NO:169
AAAAUUGAAUAUCGU.UU.UACUUGUUUAU-GUCGUGA.AU.-UGGCACGAC-.GUUUCUACAAGGUG-CC..GG-AA-CACCU.A.ACAAUAAGUAAGUCA.GCAGUGAGAU
NZ_AAEK01000001.1/183902-184006    SEQ ID NO:170
AUAAUUUUACACAUU.AU.CACUCGUAUAUACUCGGUA.AU.AUGGUCCGAGC.GUUUCUACCUAGUUCCCaaUGAAAGAACUG.G.ACUACGGGUUAAAGU.AUUCGGUCGC
NC_003454.1/1645820-1645721        SEQ ID NO:171
UAAAUAAUUUUAAUA.AA.AAUUCGUAUAA-GCCUAAU.AU.AUGGAAGGGU-.GUCCCUAC-GGUUAACC..AUAAAUUAACC.A.GCUACGAAAAAUGUU.UUACUGUGUU
NZ_AADW02000027.1/2980-2880        SEQ ID NO:172
GAAUAAACGUAUAGC.AA.CGCUCGUAUAAUAGUGGGG.AU.-UGGCCCACGA.GUCUCUACCGGAUCGCC..GU-AACGAUCC.G.ACUACGGGUGGUGAG.UUACUGCUCU
NZ_AADW02000005.1/179959-180061    SEQ ID NO:173
AAAUCAUACAUGCAU.CU.CCUUUGUAUAUACUCGCGA.AU.AUGGCGUGAGA.GUCUCUACCGGGUCACC..UUAAACGACCU.G.ACUAUGAAGGAGCAG.ACCCUUCGUA
NC_006582.1/1039390-1039492        SEQ ID NO:174
AAUGUCCAAUAGGAA.AA.UACCCGUAUAAUUGCAGGA.AU.AAGGCCUGCAC.GUUUCUACCGAGCCACC..GUAAAUGGCUU.G.ACUACGGCAUGAUAA.AUGGAGCGCA
NC_002737.1/930749-930845          SEQ ID NO:175
UGAAUUCAAUAAUGA.CA.UACUUAUUUAU-GCUGUGA.AU.-UGGCGCAGC-.GUCUCUACAAGACA-CC..UU-AA-UGUCU.A.ACAAUAAGUAAGCUU.UUAGGCUUGC
NC_003485.1/910599-910695          SEQ ID NO:176
UGAAUUCAAUAAUGA.CA.UACUUAUUUAU-GCUGUGA.AU.-UGGCGCAGC-.GUCUCUACAAGACA-CC..UU-AA-UGUCU.A.ACAAUAAGUAAGCUU.UUAGGCUUGC
NC_004070.1/846557-846653          SEQ ID NO:177
UGAAUUCAAUAAUGA.CA.UACUUAUUUAU-GCUGUGA.AU.-UGGCGCAGC-.GUCUCUACAAGACA-CC..UU-AA-UGUCU.A.ACAAUAAGUAAGCUU.UUAGGCUUGC
NC_004606.1/977077-977173          SEQ ID NO:178
UGAAUUCAAUAAUGA.CA.UACUUAUUUAU-GCUGUGA.AU.-UGGCGCAGC-.GUCUCUACAAGACA-CC..UU-AA-UGUCU.A.ACAAUAAGUAAGCUU.UUAGGCUUGC
NC_006086.1/857664-857760          SEQ ID NO:179
UGAAUUCAAUAAUGA.CA.UACUUAUUUAU-GCUGUGA.AU.-UGGCGCAGC-.GUCUCUACAAGACA-CC..UU-AA-UGUCU.A.ACAAUAAGUAAGCUU.UUAGGCUUGC
NZ_AAFV01000199.1/507-411          SEQ ID NO:180
UGAAUUCAAUAAUGA.CA.UACUUAUUUAU-GCUGUGA.AU.-UGGCGCAGC-.GUCUCUACAAGACA-CC..UU-AA-UGUCU.A.ACAAUAAUGAAGCUU.UUAGGCUUGC
NC_004605.1/1369721-1369821        SEQ ID NO:181
UAUAAUCGCAAGCGU.UU.GCUUCGUAUAACCCCAAUG.AU.AUGGUUUGGGG.GUCUCUACCAGUUC-CC..GCAAA-GUGCU.G.AUUACGAAGAGUUGA.GAUCACUGUG
NZ_AAAW03000004.1/66862-66959      SEQ ID NO:182
UGAACUGAAUAAUAA.AA.UUUUUAUAUAA-GUUCAUA.AU.-GGGUUGAAC-.GUCUCUACCAACUA-CC..GUAAA-UAGUU.G.AUUAUAAAAAUUUCG.AACGGAAUGA
NC_004567.1/2968830-2968731        SEQ ID NO:183
UUAUCAAUACAACUA.AU.UGCCUAUAUAAU-GCCAUG.AU.AUGGAUGGCGA.GUUUCUACCCAGUG-CC..GUAAA-CACUG.G.ACUAUAAGCGAAUUG.AGUCGACGGG
NZ_AAEV01000003.1/13765-13667      SEQ ID NO:184
ACAAUCAAAUAAAAC.UU.AGCCUAUAUAAUGUC-UUA.AU.CUGGU-UGACA.GUUUCUACCCAACG-CC..GUAAA-UGUUG.G.ACUAUAGGAAAACUA.ACUCUUAUGU
NC_002570.2/806873-806971          SEQ ID NO:185
UUAAUCGAGCUCAAC.AC.UCUUCGUAUAUCCUC-UCA.AU.AUGGGAUGAGG.GUCUCUAC-AGGUA-CC..GUAAA-UACCU.A.GCUACGAAAAGAAUG.CAGUUAAUGU
NZ_AAEK01000052.1/27552-27452      SEQID NO:186
AUUAAUUACAUAUGA.GA.AUCAUGUAUAACUCCAAGA.AU.AUGGCUUGGGG.GUCUCUACCAGGAA-CC..AAUAA-CUCCU.G.ACUACAAAAUGCGUA.UUAUAGCGUU
NC_006814.1/237722-237626          SEQ ID NO:187
AUUAAGCCAAUACAA.AU.AUCU-AUAUAU-CGUCGAA.AU.AAGGUCGACA-.GUUUCUACCCACUA-CC..GUAAA-UGGUG.G.ACUAU-AGGUAAACG.AAAUUAAGAA
NC_005363.1/3414604-3414703        SEQ ID NO:188
AAAUAACUUCAUAGUgUU.UCCCCGUAUAU-GUUGCGA.AU.AGGGCGCAGC-.GUUUCUACCAGGCA-CC..UCAAA-UGCCU.G.ACUAUGGAGGUUCUU.UGUGAAGUUG
NZ_AADT03000021.1/9410-9513        SEQ ID NO:189
AAAAUAAAUAUGGCA.AU.GGCCUGUAUAAUUGGGGGA.AU.AGGGCUCCCAA.GUUUCUACCGGGCAACC..GUAAAUUGCCCuG.GCUACAGCCUGAAAG.UGUACCUCAG
NC_004668.1/2288426-2288328        SEQ ID NO:190
UCCUAGAGAAACAUA.GA.AGCUUGUAUAA-GGUCAAA.AU.ACGGUUGACC-.GUCUCUACCCAGCA-CC..GUAAA-UGCUG.G.UCUAUAAGUGAAGAA.GAGCGGAUAG
NC_006449.1/1182949-1183044        SEQ ID NO:191
CAAACAAUGAGAACA.-U.UACUUAUUUAU-GUCACGA.AU.-GGGCGUGAC-.GUUUCUACAAGGUG-CC..GU-AA-CACCU.A.ACAAUAAGUAAGCUA.AUUUAGUCAU
NZ_AAGS01000026.1/9921-10016       SEQ ID NO:192
CAAACAAUGAGAACA.-U.UACUUAUUUAU-GUCACGA.AU.-GGGCGUGAC-.GUUUCUACAAGGUG-CC..GU-AA-CACCU.A.ACAAUAAGUAAGCUA.AUUUAGUCAU
NZ_AAGQ01000089.1/170-269          SEQ ID NO:193
UAACUUAACAAAUGU.UUcUGCUUAUAUAU-CGCUGCG.AU.ACGGGUAGCA-.GUCUCUACCCGGAG-CC..GUAAA-CUCCG.G.ACUAUAGGUAAAGAA.GGGCCGGUAU
NZ_AABF02000293.1/1-98             SEQ ID NO:194
UAGAUAUUAAAUAAA.--.AAUUCGUAUAA-GCCUAAU.AU.AUGGAAAGGU-.GUCCCUAC-GGUUAACC..GUAAAUUAACC.A.GCUACG-AAAAUGUU.UUUGCUGUAU
NC_006448.1/1185082-1185177        SEQ ID NO:195
CAAACAAUGAGAACA.-U.UACUUAUUUAU-GUCACGA.AU.-GGGCGUGAC-.GUUUCUACAAGGUG-CC..GU-AA-CUCCU.A.ACAAUAAGUAAGCUA.AUUUAGUCAU
NC_004567.1/2410478-2410577        SEQ ID NO:196
UUCAAAUAAGUGGUA.AU.UGCCUAUAUAAU-GUCAUG.AU.AUGGUUGACGA.GUUUCUACCCAACC-CC..GUAAA-GGUUG.G.ACUAUAAGCAAACGA.GGUCAUCCCG
NZ_AABJ03000010.1/47704-47802      SEQ ID NO:197
AUUCAGAAUGUUGAA.AA.AGCUUAUAUAUGGUCGU-A.AU.AAGG-AUGACC.GUUUCUACCCGGAG-CC..ACAAA-CUCAG.G.ACUAUAAGCAAUUAA.GUACUUGUGC
NZ_AADT03000002.1/89184-89083      SEQ ID NO:198
GAGUCUUCUUUUAGG.UU.UCUUCGUAUAGUCCCGGAG.AU.-UGGUCCGGGG.GUUUCUACCAGGUGACC..GG-AAUCACCUuG.GCUACGAAGGGUUAU.UUCCUUUGUG
NC_006814.1/1971978-1972076        SEQ ID NO:199
AUACUUAACAAUCAA.GU.UAUCUAUAUAU-CGUCGAA.AU.AAGGUCGACA-.GUAUCUACCCUGAG-CC..AUAAA-UUCAG.G.ACUAUAGGUAUCAGA.CGUCAUAAUU
NZ_AAA02000016.1/1579-1480         SEQ ID NO:200
CACUCUAGAUAUCAA.AA.UAUCUAUAUAU-CGUCGUA.AU.AAGGUCGACA-.GUUUCUACCCGGAA-CCa.AUUAA-UUCUG.G.ACUAUAGGUAAUCGA.UGUCAUAAGU
NC_005362.1/1949387-1949485        SEQ ID NO:201
AUACUUAACAAUCAA.GU.UAUCUAUAUAU-CGUCGAA.AU.AAGGUCGACA-.GUAUCUACCCUGAG-CC..AUAAA-UUCAG.G.ACUAUAGGUAUCAGA.CGUCAUAAAU
NZ_AAAO02000035.1/3299-3201        SEQ ID NO:202
AUACUUAACAAUCAA.GU.UAUCUAUAUAU-CGUCGAA.AU.AAGGUCGACA-.GUAUCUACCCUGAG-CC..AUAAA-UUCAG.G.ACUAUAGGUAUCAGA.CGUCAUAAAU
NC_005362.1/263146-263049          SEQ ID NO:203
CACUCUAGAUAUCAA.AU.AUCU-AUAUAU-CGUCGUA.AU.AAGGUCGACA-.GUUUCUACCCGGAA-CCa.AUUAA-UUCUG.G.ACUAU-AGGUAAUCG.AUGUCAUAAG
NC_005363.1/2004933-2004835        SEQ ID NO:204
ACUACUAACCGCGGU.UA.CACAAAUAUAA-GUCGGAG.AU.AGGGUCUGAC-.GUUUCUACCUGCCA-CC..GUAAA-GGGCA.G.UCUAUUUGGAGCGAA.UAUAUGUUGA
NZ_AADT03000002.1/98293-98192      SEQ ID NO:205
GACGAAUAUUACUAU.UA.GACUCGUAAAACCCCGGCG.AU.-GGGGCCGGGG.GUCUCUACCAGGUGACC..GG-AAUCACCUcG.GCUACGAGGGUGAGC.GGCAGCUGGU
NZ_AABE02000036.1/17403-17500      SEQ ID NO:206
CAACUAAAGAAGUUA.UU.UGCAGAUAUAU-CGUUGGA.AA.ACGGCCAACA-.GUUUCUACCACGCC-CC..-AAAA-GUCGU.G.ACUAUCCGCAAAUGU.UUUUGACGAU
NC_006055.1/484139-484044        SEQ ID NO:207
UAUAAAAUUAAUAUG.AA.AACUUGUAUAAUCCUUC--.AU.AUCGGGAAGGA.GUCUCUACCUAACA-CC..---AA-UGUUA.G.AUUAUGAGUUUUAUG.GUUUUCGCUA
NZ_AABH02000272.1/211-308        SEQ ID NO:208
CAACUAAAGAAGUUA.UU.UGCAGAUAUAU-CGUUGGA.AA.ACGGCCAACA-.GUUUCUACCACGCC-CC..-AAAA-GUCGU.G.ACUAUCCGCAAAUGU.UUCUGACGAU
NZ_AABJ03000003.1/47905-47810    SEQ ID NO:209
AAGAUAAAUAGCAAC.CA.AGCAGGUAUAU-CGUCGGA.UA.AUGGCUGACA-.GUUUCUACCCAACA-CC..---AA-UGUUG.G.ACUAUCUGUGGAUGU.CUUUUUGGCG
NZ_AABH02000038.1/17559-17463    SEQ ID NO:210
UAUUCUAUGUGAAAU.UU.AGCUGAUAUAGUAUCGA--.AUaAUGG-UCGAUU.GUUUCUAGCCAGCA-CC..---CA-UGCUG.GaACUAUCAUAAACAUG.UUAUUUAAUU
NC_006055.1/397027-397123        SEQ ID NO:211
AAUAAUUAAAUAUAA.AA.AACUUAUACAU-GACAACAuAU.-UGGGUUGUC-.GAC-CUGCCUCUGGACC..-U--AUCCUUA.G.ACUAUAAGCGUGAGG.UUUUUUUACA
#=GC RF                         SEQ ID NO:212
aAAauuaaAaAAAaA.au.aacUCgUAUAAucucgggA.AU.AUGGcccgaga.GUUUCUACCaggcaaCC..GUAAAuugccu.G.ACUAcGAguaAauuu.uauuUaUuuu
#=GC SS_cons
:::::::::::::::.::.((((((((,,,<<<<<<<_._.__>>>>>>>.,,,,,,,,<<<<<<<_..__>>>>>>.>.,,)))))))):::::.::::::::::
//
表6.鸟嘌呤核糖开关的原子坐标
EEADER      RIBONUCLEIC ACID 05-AUG-04 1U8D
TITLE       GUANINE RIBOSWITCH BOUND TO HYPOXANTHINE
COMPND      MOL_ID:1;
COMPND    2 MOLECULE:XPT-PBUX MRNA;
COMPND    3 CHAIN:A;
COMPND    4 ENGINEERED:YES;
COMPND    5 OTHER_DETAILS:G-BOX MRNA
SOURCE      MOL_ID:1;
SOURCE    2 SYNTHETIC:YES;
SOURCE    3 OTHER_DETAILS:RNA WAS PREPARED BYIN VITRO TRANSCRIPTION.
SOURCE    4 THE SEQUENCE OF THIS RNA CAN BE FOUND NATURALLY IN
SOURCE    5 BACILLUS SUBTILIS(BACTERIA)
KEYWDS      RNA-LIGAND COMPLEX,DOUBLE EELIX,BASETRIPLES,BASE
KEYWDS    2 QUADRUPLES,MRNA
EXPDTA      X-RAY DIFFRACTION
AUTHOR      R.T.BATEY,S.D.GILBERT,R.K.MONTANGE
REVDAT    1 23-NOV-04 1U8D 0
JRNLAUTH    R.T.BATEY,S.D.GILBERT,R.K.MONTANGE
JRNL        TITL STRUCTURE OF ANATURAL GUANINE-RESPONSIVE
JRNL        TITL 2 RIBOSWITCH COMPLEXED WITH THE METABOLITE
JRNL        TITL 3 HYPOXANTHINE
JRNL        REF NATURE V.432 411 2004
JRNL        REFN ASTM NATUAS UKISSN 0028-0836
REMARK    1
REMARK    2
REMARK    2 RESOLUTION.1.95 ANGSTROMS.
REMARK    3
REMARK    3 REFINEMENT.
REMARK    3 PROGRAM:CNS 1.1
REMARK    3 AUTHORS:BRUNGER,ADAMS,CLORE,DELANO,GROS,GROSSE-
REMARK    3        :KUNSTLEVE,JIANG,KUSZEWSKI,NILGES,PANNU,
REMARK    3        :READ,RICE,SIMONSON,WARREN
REMARK    3
REMARK    3    REFINEMENT TARGET:ENGH&HUBER
REMARK    3
REMARK    3    DATA USED IN REFINEMENT.
REMARK    3    RESOLUTION RANGE HIGH(ANGSTROMS):1.95
REMARK    3    RESOLUTION RANGE LOW (ANGSTROMS):19.41
REMARK    3    DATA CUTOFF           (SIGMA(F)):0.000
REMARK    3    DATA CUTOFF HIGH        (ABS(F)):1344227.320
REMARK    3    DATA CUTOFF LOW         (ABS(F)):0.0000
REMARK    3    COMPLETENESS  (WORKING+TEST)(%):92.8
REMARK    3    NUMBER OF REFLECTIONS           :25786
REMARK    3
REMARK    3    FIT TO DATA USEDIN REFINEMENT.
REMARK    3    CROSS-VALIDATION METHOD         :THROUGHOUT
REMARK    3    FREE R VALUE TEST SET SELECTION :RANDOM
REMARK    3    R VALUE            (WORKING SET):0.178
REMARK    3    FREE R VALUE                    :0.228
REMARK    3    FREE R VALUE TEST SET SIZE  (%):9.400
REMARK    3    FREE R VALUE TEST SET COUNT     :2430
REMARK    3    ESTIMATED ERROR OF FREE R VALUE :0.005
REMARK    3
REMARK    3    FITIN THE HIGHEST RESOLUTION BIN.
REMARK    3    TOTAL NUMBER OF BINS USED       :10
REMARK    3    BIN RESOLUTION RANGE HIGH    (A):1.95
REMARK    3    BIN RESOLUTION RANGE LOW     (A):2.02
REMARK    3    BIN COMPLETENESS  (WORKING+TEST)  (%) :85.20
REMARK    3    REFLECTIONSIN BIN          (WORKINGSET):2105
REMARK    3    BIN R VALUE               (WORKING SET):0.2480
REMARK    3    BIN FREE R VALUE                       :0.3180
REMARK    3    BIN FREE R VALUE TEST SET SIZE     (%):10.40
REMARK    3    BIN FREE R VALUE TEST SET COUNT        :245
REMARK    3    ESTIMATEDERROR OF BIN FREE R VALUE     :0.020
REMARK    3
REMARK    3    NUMBER OF NON-HYDROGENATOMS USEDIN REFINEMENT.
REMARK    3    PROTEIN ATOMS                          :0
REMARK    3    NUCLEIC ACID ATOMS                     :1426
REMARK    3    HETEROGEN ATOMS                        :108
REMARK    3    SOLVENT ATOMS                          :333
REMARK    3
REMARK    3    B VALUES.
REMARK    3    FROM WILSON PLOT                 (A**2):14.90
REMARK    3    MEAN B VALUE           (OVERALL,A**2) :22.60
REMARK    3    OVERALL ANISOTROPIC B VALUE.
REMARK    3    B11  (A**2)  :0.26000
REMARK    3    B22  (A**2)  :-0.88000
REMARK    3    B33  (A**2)  :0.62000
REMARK    3    B12  (A**2)  :0.00000
REMARK    3    B13  (A**2)  :-0.48000
REMARK    3    B23  (A**2)  :0.00000
REMARK    3
REMARK    3    ESTIMATED COORDINATE ERROR.
REMARK    3    ESD FROM LUZZATIPLOT       (A) :0.19
REMARK    3    ESD FROM SIGMAA            (A) :0.14
REMARK    3    LOW RESOLUTION CUTOFF      (A):5.00
REMARK    3
REMARK    3    CROSS-VALIDATED ESTIMATED COORDINATE ERROR.
REMARK    3    ESD FROM C-V LUZZATIPLOT   (A):0.25  
REMARK    3    ESD FROM C-V SIGMAA        (A):0.23
REMARK    3
REMARK    3    RMS DEVIATIONS FROMIDEAL VALUES.
REMARK    3    BOND LENGTHS               (A):0.009
REMARK    3    BOND ANGLES          (DEGREES):1.60
REMARK    3    DIHEDRAL ANGLES      (DEGREES):19.10
REMARK    3    IMPROPER ANGLES      (DEGREES):1.83
REMARK    3
REMARK    3    ISOTROPIC THERMAL MODEL:RESTRAINED
REMARK    3
REMARK    3    ISOTROPIC THERMAL FACTOR RESTRAINTS.RMS SIGMA
REMARK    3    MAIN-CHAIN BOND      (A**2):0.810;1.500
REMARK    3    MAIN-CHAIN ANGLE     (A**2):0.000;2.000
REMARK    3    SIDE-CHAINBOND       (A**2):1.520;2.000
REMARK    3    SIDE-CEAIN ANGLE     (A**2):1.970;2.500
REMARK    3
REMARK    3    BULK SOLVENT MODELING.
REMARK    3    METHOD USED:FLAT MODEL
REMARK    3    KSOL       :0.36
REMARK    3    BSOL       :48.44
REMARK    3
REMARK    3    NCS MODEL  :NULL
REMARK    3
REMARK    3    NCS RESTRAINTS.RMS SIGMA/WEIGHT
REMARK    3    GROUP  1  POSITIONAL     (A):NULL;NULL
REMARK    3    GROUP  1  B-FACTOR    (A**2):NULL;NULL
REMARK    3
REMARK    3   PARAMETER FILE    1    :DNA-RNA_REP.PARAM
REMARK    3   PARAMETER FILE    2    :ION.PARAM
REMARK    3   PARAMETER FILE    3    :HPA4.PARAM
REMARK    3   PARAMETER FILE    4    :COHEX_REP.PARAM
REMARK    3   PARAMETER FILE    5    :WATER.PARAM
REMARK    3   PARAMETER FILE    6    :NULL
REMARK    3   TOPOLOGY FILE     1    :DNA-RNA.TOP
REMARK    3   TOPOLOGY FILE     2    :ION.TOP
REMARK    3   TOPOLOGY FILE     3    :HPA4.TOP
REMARK    3   TOPOLOGY FILE     4    :COHEX_REP.TOP
REMARK    3   TOPOLOGY FILE     5    :WATER.TOP
REMARK    3   TOPOLOGY FILE     6    :NULL
REMARK    3
REMARK    3   OTHER REFINEMENT REMARKS:NULL
REMARK    4
REMARK    4  1U8D COMPLIES WITH FORMAT V.2.3,09-JULY-1998
REMARK    100
REMARK    100 THIS ENTRY HAS BEEN PROCESSED BYTHENUCLEIC ACID DATABASE
REMARK    100 ON 13-AUG-2004.
REMARK    100 THE NDBID CODEIS UR0039.
REMARK    105
REMARK    105 THE PROTEIN DATA BANK HAS ADOPTED THE SACCHARIDE CHRMISTS
REMARK    105 NOMENCLATURE FOR ATOMS OF THE DEOXYRIBOSE/RIBOSE MOIETY
REMARK    105 RATHER THAN THAT OF THE NUCLEOSIDE CHEMISTS.TEE RING
REMARK    105 OXYGEN ATOM IS LABELLED O4*INSTEAD OF O1*.
REMARK    200
REMARK    200 EXPERIMENTAL DETAILS
REMARK    200 EXPERIMENT TYPE               :X-RAY DIFFRACTION
REMARK    200 DATE OF DATA COLLECTION       :NULL
REMARK    200 TEMPERATURE           (KELVIN):100.0
REMARK    200 PH                            :7.50
REMARK    200 NUMBER OF CRYSTALS USED       :1
REMARK    200
REMARK    200 SYNCHROTRON              (Y/N):N
REMARK    200 RADIATION SOURCE              :ROTATING ANODE
REMARK    200 BEAMLINE                      :NULL
REMARK    200 X-RAY GENERATOR MODEL         :RIGAKU
REMARK    200 MONOCHROMATIC OR LAUE(M/L)    :M
REMARK    200 WAVELENGTH OR RANGE        (A):1.5418
REMARK    200 MONOCHROMATOR                 :NI FILTER
REMARK    200 OPTICS                        :NULL
REMARK    200
REMARK    200 DETECTOR TYPE                 :NULL
REMARK    200 DETECTOR MANUFACTURER         :NULL
REMARK    200 INTENSITY-INTEGRATION SOFTWARE:R-AXIS
REMARK    200 DATASCALING SOFTWARE          :R-AXIS
REMARK    200
REMARK    200 NUMBER OF UNIQUE REFLECTIONS  :28013
REMARK    200 RESOLUTION RANGE HIGH      (A):1.800
REMARK    200 RESOLUTION RANGE LOW       (A):20.000
REMARK    200 REJECTION CRITERIA  (SIGMA(I)):3.000
REMARK    200
REMARK    200 OVERALL.
REMARK    200 COMPLETENESS FOR RANGE    (%):NULL
REMARK    200 DATAREDUNDANCY                :2.900
REMARK    200 R MERGE                    (I):0.05500
REMARK    200 R SYM                      (I):0.03700
REMARK    200 FOR THE DATA SET  :21.5000
REMARK    200
REMARK 200  IN THE HIGHEST RESOLUTION SHELL.
REMARK 200  HIGHEST RESOLUTIONSHELL,RANGE HIGH  (A):1.80
REMARK 200  HIGHEST RESOLUTION SHELL,RANGE LOW  (A):1.86
REMARK 200  COMPLETENESS FOR SHELL              (%):100.0
REMARK 200  DATA REDUNDANCY IN SHELL                :NULL
REMARK 200  R MERGE FOR SHELL                    (I):NULL
REMARK 200  R SYM FOR SHELL                      (I):NULL
REMARK 200  FOR SHELL                  :NULL
REMARK 200
REMARK 200 DIFFRACTION PROTOCOL:SINGLE WAVELENGTH
REMARK 200 METHOD USED TO DETERMINE THE STRUCTURE:SAD
REMARK 200 SOFTWARE USED:SOLVE
REMARK 200 STARTING MODEL:NULL
REMARK 200
REMARK 200 REMARK:NULL
REMARK 280
REMARK 280 CRYSTAL
REMARK 280 SOLVENT CONTENT,VS(%):46.00
REMARK 280 MATTHEWS COEFFICIENT,VM(ANGSTROMS**3/DA):2.29
REMARK 280
REMARK 280 CRYSTALLIZATION CONDITIONS:10 MM COBALT HEXAMMINE,200 MM
REMARK 280 AMMONIUM ACETATE,25%PEG 2K,PH 7.5,VAPOR DIFFUSION,HANGING
REMARK 280 DROP,TEMPERATURE 23K
REMARK 290
REMARK 290 CRYSTALLOGRAPHIC SYMMETRY
REMARK 290 SYMMETRY OPERATORS FOR SPACE GROUP:C121
REMARK 290
REMARK 290    SYMOP   SYMMETRY
REMARK 290    NNNMMM  OPERATOR
REMARK 290    1555    X,Y,Z
REMARK 290    2555    -X,Y,-Z
REMARK 290    3555    1/2+X,1/2+Y,Z
REMARK 290    4555    1/2-X,1/2+Y,-Z
REMARK 290
REMARK 290    WHERE NNN->OPERATOR NUMBER
REMARK 290    MMM->TRANSLATION VECTOR
REMARK 290
REMARK 290 CRYSTALLOGRAPHIC SYMMETRY TRANSFORMATIONS
REMARK 290 THE FOLLOWING TRANSFORMATIONS OPERATE ON THE ATOM/HETATM
REMARK 290 RECORDSIN THIS ENTRY TO PRODUCE CRYSTALLOGRAPHICALLY
REMARK 290 RELATED MOLECULES.
REMARK 290    SMTRY1    1  1.000000  0.000000  0.000000    0.00000
REMARK 290    SMTRY2    1  0.000000  1.000000  0.000000    0.00000
REMARK 290    SMTRY3    1  0.000000  0.000000  1.000000    0.00000
REMARK 290    SMTRY1    2  -1.000000 0.000000  0.000000    0.00000
REMARK 290    SMTRY2    2  0.000000  1.000000  0.000000    0.00000
REMARK 290    SMTRY3    2  0.000000  0.000000  -1.000000   0.00000
REMARK 290    SMTRY1    3  1.000000  0.000000  0.000000    66.14900
REMARK 290    SMTRY2    3  0.000000  1.000000  0.000000    17.62500
REMARK 290    SMTRY3    3  0.000000  0.000000  1.000000    0.00000
REMARK 290    SMTRY1    4  -1.000000 0.000000  0.000000    66.14900
REMARK 290    SMTRY2    4  0.000000  1.000000  0.000000    17.62500
REMARK 290    SMTRY3    4  0.000000  0.000000  -1.000000   0.00000
REMARK 290
REMARK 290 REMARK:NULL
REMARK 300
REMARK 300 BIOMOLECULE:1
REMARK 300 THIS ENTRY CONTAINS THE CRYSTALLOGRAPHIC ASYMMETRIC UNIT
REMARK 300 WHICH CONSISTS OF 1 CHAIN(S).SEE REMARK 350 FOR
REMARK 300  INFORMATION ON GENERATING THE BIOLOGICAL MOLECULE(S).
REMARK 350
REMARK 350 GENERATING THE BIOMOLECULE
REMARK 350 COORDINATES FOR A COMPLETE MULTIMER REPRESENTING THE KNOWN
REMARK 350 BIOLOGICALLY SIGNIFICANT OLIGOMERIZATION STATE OF THE
REMARK 350 MOLECULE CAN BE GENERATED BY APPLYING BIOMT TRANSFORMATIONS
REMARK 350 GIVEN BELOW.BOTH NON-CRYSTALLOGRAPHIC AND
REMARK 350 CRYSTALLOGRAPHIC OPERATIONS ARE GIVEN.
REMARK 350
REMARK 350 BIOMOLECULE:1
REMARK 350 APPLY TEE FOLLOWING TO CHAINS:A
REMARK 350    BIOMT1    1  1.000000  0.000000  0.000000    0.00000
REMARK 350    BIOMT2    1  0.000000  1.000000  0.000000    0.00000
REMARK 350    BIOMT3    1  0.000000  0.000000  1.000000    0.00000
REMARK 465
REMARK 465 MISSING RESIDUES
REMARK 465 THE FOLLOWING RESIDUES WERENOT LOCATEDIN THE
REMARK 465 ExPERIMENT.(M=MODELNUMBER; RES=RESIDUE NAME;C=CHAIN
REMARK 465 IDENTIFIER;SSSEQ=SEQUENCE NUMBER;I=INSERTION CODE.)
REMARK 465
REMARK 465    M RES C SSSEQI
REMARK 465    A A   82
REMARK 500
REMARK 500 GEOMETRY AND STEREOCHEMISTRY
REMARK 500 SUBTOPIC:CLOSE CONTACTS
REMARK 500
REMARK 500 THEFOLLOWING ATOMS THAT ARE RELATED BY CRYSTALLOGRAPHIC
REMARK 500 SYMMETRY ARE IN CLOSE CONTACT.AN ATOM LOCATED WITHIN 0.15
REMARK 500 ANGSTROMS OF A SYMMETRY RELATED ATOMIS ASSUMED TO BE ON A
REMARK 500 SPECIAL POSITION ANDIS,THEREFORE,LISTEDIN REMARK 375
REMARK 500 INSTEAD OF REMARK 500.ATOMS WITH NON-BLANK ALTERNATE
REMARK 500 LOCATIONINDICATORS ARE NOTINCLUDED IN THE CALCULATIONS.
REMARK 500
REMARK 500 DISTANCE CUTOFF:
REMARK 500 2.2 ANGSTROMS FOR CONTACTS NOT INVOLVING HYDROGEN ATOMS
REMARK 500 1.6 ANGSTROMS FOR CONTACTSINVOLVING HYDROGEN ATOMS
REMARK 500
REMARK 500 ATM1 RES  C  SSEQI ATM2 RES C  SSEQI SSYMOP  DISTANCE
REMARK 500 O1P  G    A  15    O1P  G   A  15    2556    1.81
SEQRES    1 A    68    G    G    A    C    A    U    A    U    A    A    U    C    G
SEQRES    2 A    68    C    G    U    G    G    A    U    A    U    G    G    C    A
SEQRES    3 A    68    C    G    C    A    A    G    U    U    U    C    U    A    C
SEQRES    4 A    68    C    G    G    G    C    A    C    C    G    U    A    A    A
SEQRES    5 A    68    U    G    U    C    C    G    A    C    U    A    U    G    U
SEQRES    6 A    68    C    C    A
HET    SPD    95     10
HET    ACT    96     4
HET    NCO    101    7
HET    NCO    102    7
HET    NCO    103    7
HET    NCO    104    7
HET    NCO    105    7
HET    NCO    106    7
HET    NCO    107    7
HET    NCO    108    7
HET    NCO    109    7
HET    NCO    110    7
HET    NCO    111    7
HET    NCO    112    7
HET    HPA    90    10
HETNAM    SPD SPERMIDINE
HETNAM    ACT ACETATE ION
HETNAM    NCO COBALT HEXAMMINE ION
HETNAM    HPA HYPOXANTHINE
HETSYN    SPD N-(2-AMINO-PROPYL)-1,4-DIAMINOBUTANE;PA(34)
FORMUL    2  SPD    C7 H19 N3
FORMUL    3  ACT    C2 H3  O2 1-
FORMUL    4  NCO    12(H18 N6 CO1 3+)
FORMUL   16  HPA    C5 H4  N4 O1
FORMUL   17  HOH    *333(H2 O1)
CRYST1    132.298  35.250  42.225  90.00  90.95  90.00 C121    4
ORIGX1    1.000000  0.000000  0.000000    0.00000
ORIGX2    0.000000  1.000000  0.000000    0.00000
ORIGX3    0.000000  0.000000  1.000000    0.00000
SCALE1    0.007559  0.000000  0.000125    0.00000
SCALE2    0.000000  0.028369  0.000000    0.00000
SCALE3    0.000000  0.000000  0.023686    0.00000
ATOM    1  O3P    G A  15    2.257    5.451  23.138  1.00 79.41    O
ATOM    2  P      G A  15    2.002    5.937  21.715  1.00 79.84    P
ATOM    3  O1P    G A  15    0.530    5.848  21.317  1.00 79.33    O
ATOM    4  O2P    G A  15    2.597    7.317  21.458  1.00 79.53    O
ATOM    5  O5*    G A  15    2.809    4.906  20.739  1.00 77.83    O
ATOM    6  C5*    G A  15    4.171    4.541  21.029  1.00 75.69    C
ATOM    7  C4*    G A  15    4.238    3.119  21.543  1.00 73.85    C
ATOM    8  O4*    G A  15    2.948    2.746  22.099  1.00 73.98    O
ATOM    9  C3*    G A  15    4.556    2.024  20.538  1.00 72.87    C
ATOM    10 O3*    G A  15    5.945    2.038  20.158  1.00 70.52    O
ATOM    11 C2*    G A  15    3.933    0.791  21.200  1.00 73.00    C
ATOM    12 O2*    G A  15    4.650    0.231  22.285  1.00 73.25    O
ATOM    13 C1*    G A  15    2.648    1.397  21.766  1.00 72.98    C
ATOM    14 N9     G A  15    1.581    1.433  20.767  1.00 72.54    N
ATOM    15 C8     G A  15    0.950    2.560  20.284  1.00 72.23    C
ATOM    16 N7     G A  15    0.045    2.296  19.382  1.00 71.52    N
ATOM    17 C5     G A  15    0.072    0.912  19.261  1.00 71.53    C
ATOM    18 C6     G A  15    -0.692   0.051  18.433  1.00 71.10    C
ATOM    19 O6     G A  15    -1.579   0.355  17.620  1.00 71.14    O
ATOM    20 N1     G A  15    -0.339   -1.284 18.619  1.00 70.53    N
ATOM    21 C2     G A  15    0.626    -1.734 19.493  1.00 70.46    C
ATOM    22 N2     G A  15    0.829    -3.059 19.517  1.00 69.85    N
ATOM    23 N3     G A  15    1.341    -0.941 20.279  1.00 70.84    N
ATOM    24 C4     G A  15    1.015    0.361  20.111  1.00 71.66    C
ATOM    25 P      G A  16    6.984    0.956  20.748  1.00 68.91    P
ATOM    26 O1P    G A  16    6.845    0.908  22.231  1.00 68.62    O
ATOM    27 O2P    G A  16    8.306    1.282  20.155  1.00 68.38    O
ATOM    28 O5*    G A  16    6.531    -0.448 20.141  1.00 66.18    O
ATOM    29 C5*    G A  16    7.070    -1.646 20.684  1.00 62.29    C
ATOM    30 C4*    G A  16    6.512    -2.866 19.993  1.00 59.49    C
ATOM    31 O4*    G A  16    5.058    -2.824 20.037  1.00 58.98    O
ATOM    32 C3*    G A  16    6.820    -2.981 18.513  1.00 57.81    C
ATOM    33 O3*    G A  16    8.106    -3.541 18.297  1.00 56.43    O
ATOM    34 C2*    G A  16    5.709    -3.902 18.025  1.00 57.51    C
ATOM    35 O2*    G A  16    5.944    -5.257 18.332  1.00 56.72    O
ATOM    36 C1*    G A  16    4.530    -3.420 18.863  1.00 57.12    C
ATOM    37 N9     G A  16    3.712    -2.448 18.155  1.00 55.86    N
ATOM    38 C8     G A  16    3.719    -1.080 18.289  1.00 55.10    C
ATOM    39 N7     G A  16    2.851    -0.488 17.514  1.00 55.02    N
ATOM    40 C5     G A  16    2.239    -1.529 16.825  1.00 54.19    C
ATOM    41 C6     G A  16    1.206    -1.512 15.851  1.00 53.76    C
ATOM    42  O6     G A  16    0.597  -0.540  15.389  1.00 52.60    O
ATOM    43  N1     G A  16    0.894  -2.796  15.416  1.00 53.12    N
ATOM    44  C2     G A  16    1.494  -3.945  15.859  1.00 53.54    C
ATOM    45  N2     G A  16    1.070  -5.089  15.307  1.00 53.43    N
ATOM    46  N3     G A  16    2.446  -3.975  16.775  1.00 53.95    N
ATOM    47  C4     G A  16    2.767  -2.742  17.208  1.00 54.84    C
ATOM    48  P      A A  17    8.823  -3.354  16.870  1.00 55.82    P
ATOM    49  O1P    A A  17    10.149 -4.017  16.909  1.00 55.72    O
ATOM    50  O2P    A A  17    8.728  -1.914  16.506  1.00 55.26    O
ATOM    51  O5*    A A  17    7.903  -4.185  15.880  1.00 53.03    O
ATOM    52  C5*    A A  17    7.817  -5.594  15.991  1.00 51.32    C
ATOM    53  C4*    A A  17    7.075  -6.140  14.809  1.00 49.43    C
ATOM    54  O4*    A A  17    5.666  -5.818  14.928  1.00 48.16    O
ATOM    55  C3*    A A  17    7.494  -5.502  13.505  1.00 48.31    C
ATOM    56  O3*    A A  17    8.659  -6.134  13.012  1.00 48.66    O
ATOM    57  C2*    A A  17    6.266  -5.722  12.634  1.00 47.38    C
ATOM    58  O2*    A A  17    6.231  -7.032  12.106  1.00 45.76    O
ATOM    59  C1*    A A  17    5.138  -5.512  13.653  1.00 46.63    C
ATOM    60  N9     A A  17    4.655  -4.134  13.716  1.00 45.43    N
ATOM    61  C8     A A  17    5.126  -3.118  14.513  1.00 45.03    C
ATOM    62  N7     A A  17    4.471  -1.988  14.375  1.00 45.06    N
ATOM    63  C5     A A  17    3.505  -2.278  13.419  1.00 44.35    C
ATOM    64  C6     A A  17    2.480  -1.507  12.837  1.00 43.36    C
ATOM    65  N6     A A  17    2.232  -0.230  13.146  1.00 43.22    N
ATOM    66  N1     A A  17    1.698  -2.105  11.915  1.00 43.31    N
ATOM    67  C2     A A  17    1.930  -3.390  11.607  1.00 43.50    C
ATOM    68  N3     A A  17    2.852  -4.218  12.085  1.00 44.12    N
ATOM    69  C4     A A  17    3.616  -3.596  12.998  1.00 44.78    C
ATOM    70  P      C A  18    9.428  -5.494  11.763  1.00 48.10    P
ATOM    71  O1P    C A  18    10.761 -6.124  11.593  1.00 48.55    O
ATOM    72  O2P    C A  18    9.319  -4.016  11.886  1.00 47.97    O
ATOM    73  O5*    C A  18    8.513  -5.918  10.541  1.00 47.08    O
ATOM    74  C5*    C A  18    8.419  -5.064  9.438   1.00 44.02    C
ATOM    75  C4*    C A  18    7.134  -5.285  8.695   1.00 42.22    C
ATOM    76  O4*    C A  18    5.989  -5.055  9.551   1.00 41.33    O
ATOM    77  C3*    C A  18    6.973  -4.294  7.574   1.00 40.44    C
ATOM    78  O3*    C A  18    7.752  -4.737  6.489   1.00 38.62    O
ATOM    79  C2*    C A  18    5.468  -4.277  7.368   1.00 40.56    C
ATOM    80  O2*    C A  18    5.017  -5.381  6.605   1.00 39.99    O
ATOM    81  C1*    C A  18    4.986  -4.366  8.819   1.00 40.15    C
ATOM    82  N1     C A  18    4.886  -3.032  9.427   1.00 39.26    N
ATOM    83  C2     C A  18    3.854  -2.179  9.053   1.00 39.01    C
ATOM    84  O2     C A  18    3.040  -2.556  8.196   1.00 39.82    O
ATOM    85  N3     C A  18    3.765  -0.960  9.635   1.00 38.83    N
ATOM    86  C4     C A  18    4.660  -0.585  10.547  1.00 37.75    C
ATOM    87  N4     C A  18    4.524  0.621   11.092  1.00 36.78    N
ATOM    88  C5     C A  18    5.730  -1.431  10.939  1.00 37.85    C
ATOM    89  C6     C A  18    5.804  -2.636  10.360  1.00 39.12    C
ATOM    90  P      A A  19    8.667  -3.688  5.725   1.00 36.72    P
ATOM    91  O1P    A A  19    9.480  -4.427  4.735   1.00 37.50    O
ATOM    92  O2P    A A  19    9.331  -2.852  6.746   1.00 36.38    O
ATOM    93  O5*    A A  19    7.574  -2.817  4.973   1.00 35.32    O
ATOM    94  C5*    A A  19    6.619  -3.455  4.146   1.00 32.02    C
ATOM    95  C4*    A A  19    5.610  -2.459  3.661   1.00 30.54    C
ATOM    96  O4*    A A  19    4.737  -2.066  4.755   1.00 30.35    O
ATOM    97  C3*    A A  19    6.211  -1.148  3.184   1.00 30.44    C
ATOM    98  O3*    A A  19    6.700  -1.256  1.853   1.00 28.92    O
ATOM    99  C2*    A A  19    5.026  -0.208  3.307   1.00 29.76    C
ATOM    100 O2*    A A  19    4.113  -0.427  2.254   1.00 30.88    O
ATOM    101  C1*    A A  19    4.384    -0.698   4.606    1.00 29.58    C
ATOM    102  N9     A A  19    4.840    0.046    5.783    1.00 27.74    N
ATOM    103  C8     A A  19    5.802    -0.299   6.700    1.00 26.96    C
ATOM    104  N7     A A  19    5.955    0.583    7.666    1.00 26.99    N
ATOM    105  C5     A A  19    5.036    1.577    7.358    1.00 26.41    C
ATOM    106  C6     A A  19    4.684    2.780    8.000    1.00 25.24    C
ATOM    107  N6     A A  19    5.209    3.195    9.153    1.00 25.00    N
ATOM    108  N1     A A  19    3.739    3.547    7.415    1.00 25.67    N
ATOM    109  C2     A A  19    3.176    3.116    6.284    1.00 24.91    C
ATOM    110  N3     A A  19    3.401    1.998    5.602    1.00 25.13    N
ATOM    111  C4     A A  19    4.353    1.265    6.194    1.00 26.86    C
ATOM    112  P      U A  20    7.901    -0.307   1.370    1.00 27.68    P
ATOM    113  O1P    U A  20    8.299    -0.722   0.006    1.00 29.66    O
ATOM    114  O2P    U A  20    8.908    -0.246   2.444    1.00 27.22    O
ATOM    115  O5*    U A  20    7.230    1.122    1.256    1.00 25.69    O
ATOM    116  C5*    U A  20    6.245    1.373    0.283    1.00 22.92    C
ATOM    117  C4*    U A  20    5.719    2.780    0.423    1.00 21.41    C
ATOM    118  O4*    U A  20    5.042    2.907    1.710    1.00 20.04    O
ATOM    119  C3*    U A  20    6.777    3.874    0.487    1.00 19.50    C
ATOM    120  O3*    U A  20    7.259    4.265    -0.783   1.00 20.05    O
ATOM    121  C2*    U A  20    6.027    5.000    1.173    1.00 18.58    C
ATOM    122  O2*    U A  20    5.109    5.617    0.301    1.00 17.80    O
ATOM    123  C1*    U A  20    5.220    4.231    2.212    1.00 19.20    C
ATOM    124  N1     U A  20    5.900    4.191    3.517    1.00 18.08    N
ATOM    125  C2     U A  20    5.668    5.253    4.365    1.00 18.46    C
ATOM    126  O2     U A  20    4.951    6.205    4.059    1.00 15.17    O
ATOM    127  N3     U A  20    6.303    5.174    5.580    1.00 16.68    N
ATOM    128  C4     U A  20    7.127    4.167    6.028    1.00 18.60    C
ATOM    129  O4     U A  20    7.615    4.248    7.167    1.00 15.59    O
ATOM    130  C5     U A  20    7.333    3.101    5.087    1.00 17.76    C
ATOM    131  C6     U A  20    6.725    3.154    3.888    1.00 17.60    C
ATOM    132  P      A A  21    8.804    4.707    -0.950   1.00 21.07    P
ATOM    133  O1P    A A  21    8.958    5.041    -2.388   1.00 19.56    O
ATOM    134  O2P    A A  21    9.726    3.742    -0.339   1.00 17.87    O
ATOM    135  O5*    A A  21    8.914    6.057    -0.104   1.00 18.44    O
ATOM    136  C5*    A A  21    8.311    7.240    -0.587   1.00 16.49    C
ATOM    137  C4*    A A  21    8.458    8.398    0.384    1.00 15.52    C
ATOM    138  O4*    A A  21    7.781    8.097    1.635    1.00 16.13    O
ATOM    139  C3*    A A  21    9.885    8.660    0.849    1.00 16.12    C
ATOM    140  O3*    A A  21    10.578   9.415    -0.119   1.00 15.84    O
ATOM    141  C2*    A A  21    9.670    9.462    2.123    1.00 14.81    C
ATOM    142  O2*    A A  21    9.390    10.824   1.853    1.00 16.92    O
ATOM    143  C1*    A A  21    8.420    8.794    2.696    1.00 16.03    C
ATOM    144  N9     A A  21    8.745    7.898    3.805    1.00 14.49    N
ATOM    145  C8     A A  21    9.200    6.611    3.807    1.00 14.35    C
ATOM    146  N7     A A  21    9.500    6.161    5.002    1.00 14.14    N
ATOM    147  C5     A A  21    9.192    7.227    5.846    1.00 13.55    C
ATOM    148  C6     A A  21    9.288    7.400    7.255    1.00 13.46    C
ATOM    149  N6     A A  21    9.760    6.467    8.083    1.00 13.17    N
ATOM    150  N1     A A  21    8.881    8.588    7.778    1.00 14.41    N
ATOM    151  C2     A A  21    8.419    9.532    6.935    1.00 14.69    C
ATOM    152  N3     A A  21    8.294    9.483    5.600    1.00 16.23    N
ATOM    153  C4     A A  21    8.702    8.288    5.122    1.00 13.95    C
ATOM    154  P      U A  22    11.833   8.778    -0.860   1.00 17.19    P
ATOM    155  O1P    U A  22    12.143   9.766    -1.930   1.00 14.62    O
ATOM    156  O2P    U A  22    11.572   7.360    -1.223   1.00 16.11    O
ATOM    157  O5*    U A  22    12.955   8.795    0.274    1.00 17.34    O
ATOM    158  C5*    U A  22    14.086   7.879    0.260    1.00 15.80    C
ATOM    159  C4*    U A  22    14.668   7.761    1.654    1.00 13.76    C
ATOM    160  O4*    U A  22    14.980    9.104    2.130  1.00 13.53    O
ATOM    161  C3*    U A  22    13.575    7.229    2.579  1.00 14.34    C
ATOM    162  O3*    U A  22    14.069    6.400    3.635  1.00 16.58    O
ATOM    163  C2*    U A  22    12.950    8.479    3.204  1.00 14.31    C
ATOM    164  O2*    U A  22    12.419    8.301    4.510  1.00 12.30    O
ATOM    165  C1*    U A  22    14.140    9.444    3.207  1.00 13.55    C
ATOM    166  N1     U A  22    13.832    10.876   3.147  1.00 14.29    N
ATOM    167  C2     U A  22    14.055    11.619   4.286  1.00 13.16    C
ATOM    168  O2     U A  22    14.534    11.153   5.327  1.00 15.12    O
ATOM    169  N3     U A  22    13.706    12.925   4.186  1.00 13.49    N
ATOM    170  C4     U A  22    13.172    13.569   3.099  1.00 13.63    C
ATOM    171  O4     U A  22    12.789    14.728   3.228  1.00 12.03    O
ATOM    172  C5     U A  22    12.990    12.747   1.948  1.00 12.63    C
ATOM    173  C6     U A  22    13.320    11.453   2.009  1.00 13.42    C
ATOM    174  P      A A  23    14.502    4.869    3.397  1.00 16.90    P
ATOM    175  O1P    A A  23    13.773    4.291    2.214  1.00 17.04    O
ATOM    176  O2P    A A  23    14.351    4.224    4.726  1.00 16.03    O
ATOM    177  O5*    A A  23    16.057    4.949    3.092  1.00 16.99    O
ATOM    178  C5*    A A  23    16.937    5.684    3.940  1.00 16.50    C
ATOM    179  C4*    A A  23    18.220    5.970    3.200  1.00 16.03    C
ATOM    180  O4*    A A  23    17.896    6.559    1.914  1.00 15.15    O
ATOM    181  C3*    A A  23    19.123    7.000    3.865  1.00 15.88    C
ATOM    182  O3*    A A  23    20.007    6.350    4.779  1.00 16.04    O
ATOM    183  C2*    A A  23    19.932    7.535    2.689  1.00 14.37    C
ATOM    184  O2*    A A  23    21.038    6.689    2.437  1.00 14.07    O
ATOM    185  C1*    A A  23    18.924    7.447    1.539  1.00 15.13    C
ATOM    186  N9     A A  23    18.313    8.717    1.157  1.00 14.71    N
ATOM    187  C8     A A  23    18.027    9.134    -0.113 1.00 14.98    C
ATOM    188  N7     A A  23    17.513    10.334   -0.171 1.00 15.52    N
ATOM    189  C5     A A  23    17.440    10.727   1.159  1.00 14.12    C
ATOM    190  C6     A A  23    16.984    11.892   1.762  1.00 13.27    C
ATOM    191  N6     A A  23    16.517    12.944   1.074  1.00 13.02    N
ATOM    192  N1     A A  23    17.029    11.962   3.109  1.00 13.36    N
ATOM    193  C2     A A  23    17.522    10.921   3.791  1.00 12.32    C
ATOM    194  N3     A A  23    17.996    9.768    3.328  1.00 12.80    N
ATOM    195  C4     A A  23    17.924    9.737    1.988  1.00 13.37    C
ATOM    196  P      A A  24    19.792    6.521    6.367  1.00 16.08    P
ATOM    197  O1P    A A  24    20.740    5.538    7.026  1.00 18.75    O
ATOM    198  O2P    A A  24    18.370    6.463    6.689  1.00 17.24    O
ATOM    199  O5*    A A  24    20.280    8.006    6.656  1.00 14.02    O
ATOM    200  C5*    A A  24    19.497    9.123    6.288  1.00 12.57    C
ATOM    201  C4*    A A  24    19.315    10.041   7.475  1.00 13.24    C
ATOM    202  O4*    A A  24    18.369    9.426    8.402  1.00 14.03    O
ATOM    203  C3*    A A  24    20.554    10.296   8.339  1.00 12.98    C
ATOM    204  O3*    A A  24    21.369    11.351   7.801  1.00 13.11    O
ATOM    205  C2*    A A  24    19.907    10.750   9.647  1.00 13.47    C
ATOM    206  O2*    A A  24    19.453    12.099   9.622  1.00 11.96    O
ATOM    207  C1*    A A  24    18.667    9.851    9.720  1.00 13.92    C
ATOM    208  N9     A A  24    18.806    8.671    10.584 1.00 14.61    N
ATOM    209  C8     A A  24    18.841    7.342    10.230 1.00 14.46    C
ATOM    210  N7     A A  24    18.885    6.526    11.250 1.00 15.41    N
ATOM    211  C5     A A  24    18.905    7.372    12.348 1.00 13.99    C
ATOM    212  C6     A A  24    18.939    7.129    13.722 1.00 13.84    C
ATOM    213  N6     A A  24    18.928    5.899    14.267 1.00 13.39    N
ATOM    214  N1     A A  24    18.969    8.201    14.543 1.00 11.61    N
ATOM    215  C2     A A  24    18.945    9.429    14.008 1.00 11.99    C
ATOM    216  N3     A A  24    18.904    9.784    12.740 1.00 14.75    N
ATOM    217  C4     A A  24    18.885    8.694    11.949 1.00 12.94    C
ATOM    218  P      U A  25    22.931    11.117   7.493  1.00 14.31    P
ATOM    219  O1P    U A  25    23.384  9.774     7.967   1.00 13.12    O
ATOM    220  O2P    U A  25    23.680  12.330    7.933   1.00 15.11    O
ATOM    221  O5*    U A  25    22.966  11.182    5.904   1.00 12.37    O
ATOM    222  C5*    U A  25    22.889  9.987     5.117   1.00 15.75    C
ATOM    223  C4*    U A  25    22.394  10.314    3.715   1.00 14.54    C
ATOM    224  O4*    U A  25    21.019  10.786    3.786   1.00 14.76    O
ATOM    225  C3*    U A  25    23.144  11.444    3.031   1.00 15.39    C
ATOM    226  O3*    U A  25    24.331  10.949    2.403   1.00 15.75    O
ATOM    227  C2*    U A  25    22.114  11.959    2.027   1.00 15.07    C
ATOM    228  O2*    U A  25    22.016  11.123    0.889   1.00 14.04    O
ATOM    229  C1*    U A  25    20.817  11.819    2.831   1.00 14.18    C
ATOM    230  N1     U A  25    20.412  13.042    3.549   1.00 10.89    N
ATOM    231  C2     U A  25    19.972  14.094    2.797   1.00 12.58    C
ATOM    232  O2     U A  25    19.917  14.051    1.569   1.00 14.81    O
ATOM    233  N3     U A  25    19.592  15.206    3.514   1.00 12.69    N
ATOM    234  C4     U A  25    19.611  15.359    4.880   1.00 14.17    C
ATOM    235  O4     U A  25    19.271  16.439    5.374   1.00 13.94    O
ATOM    236  C5     U A  25    20.084  14.211    5.598   1.00 13.87    C
ATOM    237  C6     U A  25    20.460  13.117    4.917   1.00 13.05    C
ATOM    238  P      C A  26    25.693  11.790    2.524   1.00 17.71    P
ATOM    239  O1P    C A  26    26.754  11.081    1.752   1.00 17.41    O
ATOM    240  O2P    C A  26    25.922  12.133    3.943   1.00 15.48    O
ATOM    241  O5*    C A  26    25.352  13.145    1.775   1.00 15.22    O
ATOM    242  C5*    C A  26    25.046  13.137    0.391   1.00 14.95    C
ATOM    243  C4*    C A  26    24.479  14.477    -0.021  1.00 17.14    C
ATOM    244  O4*    C A  26    23.155  14.681    0.542   1.00 15.78    O
ATOM    245  C3*    C A  26    25.258  15.671    0.494   1.00 18.08    C
ATOM    246  O3*    C A  26    26.425  15.908    -0.282  1.00 19.26    O
ATOM    247  C2*    C A  26    24.233  16.785    0.350   1.00 17.99    C
ATOM    248  O2*    C A  26    24.097  17.196    -0.990  1.00 17.37    O
ATOM    249  C1*    C A  26    22.960  16.069    0.819   1.00 17.28    C
ATOM    250  N1     C A  26    22.770  16.251    2.269   1.00 17.50    N
ATOM    251  C2     C A  26    22.207  17.449    2.714   1.00 16.12    C
ATOM    252  O2     C A  26    21.837  18.289    1.868   1.00 17.31    O
ATOM    253  N3     C A  26    22.088  17.671    4.038   1.00 17.53    N
ATOM    254  C4     C A  26    22.516  16.762    4.915   1.00 18.28    C
ATOM    255  N4     C A  26    22.401  17.049    6.222   1.00 17.84    N
ATOM    256  C5     C A  26    23.082  15.519    4.494   1.00 18.25    C
ATOM    257  C6     C A  26    23.174  15.301    3.169   1.00 17.66    C
ATOM    258  P      G A  27    27.781  16.387    0.456   1.00 19.54    P
ATOM    259  O1P    G A  27    28.835  15.402    0.093   1.00 19.84    O
ATOM    260  O2P    G A  27    27.508  16.662    1.882   1.00 21.05    O
ATOM    261  O5*    G A  27    28.072  17.770    -0.238  1.00 16.72    O
ATOM    262  C5*    G A  27    28.214  17.833    -1.641  1.00 18.44    C
ATOM    263  C4*    G A  27    27.858  19.222    -2.122  1.00 17.66    C
ATOM    264  O4*    G A  27    26.419  19.395    -1.976  1.00 18.44    O
ATOM    265  C3*    G A  27    28.429  20.382    -1.312  1.00 16.35    C
ATOM    266  O3*    G A  27    29.799  20.676    -1.631  1.00 12.94    O
ATOM    267  C2*    G A  27    27.483  21.494    -1.746  1.00 16.92    C
ATOM    268  O2*    G A  27    27.805  21.847    -3.096  1.00 18.43    O
ATOM    269  C1*    G A  27    26.130  20.767    -1.672  1.00 19.53    C
ATOM    270  N9     G A  27    25.521  20.820    -0.331  1.00 17.32    N
ATOM    271  C8     G A  27    25.623  19.857    0.640   1.00 18.25    C
ATOM    272  N7     G A  27    25.058  20.199    1.770   1.00 16.05    N
ATOM    273  C5     G A  27    24.519  21.457    1.529   1.00 15.29    C
ATOM    274  C6     G A  27    23.826  22.345    2.410   1.00 15.83    C
ATOM    275  O6     G A  27    23.506  22.160    3.589   1.00 13.24    O
ATOM    276  N1     G A  27    23.515  23.548    1.791   1.00 13.74    N
ATOM    277  C2     G A  27    23.815  23.862    0.493   1.00 15.62    C
ATOM    278  N2     G A  27    23.476  25.116    0.104   1.00 13.99    N
ATOM    279  N3     G A  27    24.422  23.032    -0.352  1.00 15.80    N
ATOM    280  C4     G A  27    24.768  21.859    0.238   1.00 17.14    C
ATOM    281  P      C A  28    30.774  21.297    -0.490  1.00 15.32    P
ATOM    282  O1P    C A  28    32.151  21.289    -1.085  1.00 13.28    O
ATOM    283  O2P    C A  28    30.549  20.564    0.797   1.00 16.81    O
ATOM    284  O5*    C A  28    30.216  22.799    -0.308  1.00 14.13    O
ATOM    285  C5*    C A  28    29.979  23.621    -1.457  1.00 12.20    C
ATOM    286  C4*    C A  28    29.208  24.893    -1.109  1.00 11.20    C
ATOM    287  O4*    C A  28    27.842  24.579    -0.760  1.00 13.22    O
ATOM    288  C3*    C A  28    29.693  25.749    0.056   1.00 11.65    C
ATOM    289  O3*    C A  28    30.795  26.536    -0.369  1.00 12.61    O
ATOM    290  C2*    C A  28    28.443  26.579    0.321   1.00 12.57    C
ATOM    291  O2*    C A  28    28.217  27.545    -0.701  1.00 11.37    O
ATOM    292  C1*    C A  28    27.367  25.500    0.202   1.00 11.49    C
ATOM    293  N1     C A  28    27.155  24.774    1.465   1.00 11.12    N
ATOM    294  C2     C A  28    26.362  25.365    2.449   1.00 10.90    C
ATOM    295  O2     C A  28    25.841  26.462    2.217   1.00 12.61    O
ATOM    296  N3     C A  28    26.165  24.721    3.633   1.00 9.42     N
ATOM    297  C4     C A  28    26.703  23.521    3.841   1.00 9.67     C
ATOM    298  N4     C A  28    26.467  22.940    5.029   1.00 11.69    N
ATOM    299  C5     C A  28    27.503  22.869    2.845   1.00 10.98    C
ATOM    300  C6     C A  28    27.715  23.537    1.681   1.00 9.28     C
ATOM    301  P      G A  29    31.848  27.078    0.701   1.00 12.54    P
ATOM    302  O1P    G A  29    33.001  27.676    -0.012  1.00 10.32    O
ATOM    303  O2P    G A  29    32.074  26.030    1.739   1.00 13.92    O
ATOM    304  O5*    G A  29    31.048  28.236    1.453   1.00 10.81    O
ATOM    305  C5*    G A  29    30.651  29.422    0.784   1.00 9.98     C
ATOM    306  C4*    G A  29    29.953  30.336    1.761   1.00 8.40     C
ATOM    307  O4*    G A  29    28.693  29.737    2.169   1.00 11.49    O
ATOM    308  C3*    G A  29    30.712  30.532    3.055   1.00 8.64     C
ATOM    309  O3*    G A  29    31.663  31.571    2.913   1.00 7.56     O
ATOM    310  C2*    G A  29    29.598  30.920    4.004   1.00 10.60    C
ATOM    311  O2*    G A  29    29.216  32.260    3.812   1.00 11.11    O
ATOM    312  C1*    G A  29    28.480  29.976    3.555   1.00 11.07    C
ATOM    313  N9     G A  29    28.524  28.699    4.271   1.00 11.15    N
ATOM    314  C8     G A  29    29.049  27.500    3.837   1.00 12.35    C
ATOM    315  N7     G A  29    28.902  26.525    4.710   1.00 10.34    N
ATOM    316  C5     G A  29    28.251  27.122    5.781   1.00 8.19     C
ATOM    317  C6     G A  29    27.837  26.583    7.032   1.00 7.73     C
ATOM    318  O6     G A  29    27.914  25.425    7.442   1.00 6.94     O
ATOM    319  N1     G A  29    27.287  27.558    7.854   1.00 7.67     N
ATOM    320  C2     G A  29    27.125  28.881    7.518   1.00 8.16     C
ATOM    321  N2     G A  29    26.558  29.664    8.459   1.00 7.86     N
ATOM    322  N3     G A  29    27.484  29.396    6.356   1.00 8.66     N
ATOM    323  C4     G A  29    28.038  28.469    5.540   1.00 10.04    C
ATOM    324  P      U A  30    33.134  31.407    3.520   1.00 8.25     P
ATOM    325  O1P    U A  30    33.970  32.458    2.893   1.00 11.63    O
ATOM    326  O2P    U A  30    33.566  29.974    3.446   1.00 11.64    O
ATOM    327  O5*    U A  30    32.909  31.761    5.054   1.00 8.57     O
ATOM    328  C5*    U A  30    32.803  33.103    5.491   1.00 7.65     C
ATOM    329  C4*    U A  30    32.354  33.142    6.956   1.00 7.93     C
ATOM    330  O4*    U A  30    31.051  32.507    7.112   1.00 7.66     O
ATOM    331  C3*    U A  30    33.220  32.376    7.932   1.00 7.36     C
ATOM    332  O3*    U A  30    34.411  33.098    8.229   1.00 8.48     O
ATOM    333  C2*    U A  30    32.276  32.271    9.116   1.00 8.63     C
ATOM    334  O2*    U A  30    32.159  33.539    9.769   1.00 8.93     O
ATOM    335  C1*    U A  30    30.972  31.878    8.399   1.00 9.06     C
ATOM    336  N1     U A  30    30.909  30.406    8.210   1.00 8.03     N
ATOM    337  C2     U A  30    30.479  29.640  9.285   1.00  9.41     C
ATOM    338  O2     U A  30    30.140  30.142  10.342  1.00  9.53     O
ATOM    339  N3     U A  30    30.484  28.277  9.076   1.00  8.15     N
ATOM    340  C4     U A  30    30.879  27.615  7.918   1.00  7.87     C
ATOM    341  O4     U A  30    30.916  26.387  7.900   1.00  8.06     O
ATOM    342  C5     U A  30    31.293  28.471  6.852   1.00  6.19     C
ATOM    343  C6     U A  30    31.293  29.810  7.035   1.00  9.31     C
ATOM    344  P      G A  31    35.776  32.309  8.547   1.00  11.17    P
ATOM    345  O1P    G A  31    36.843  33.324  8.585   1.00  11.89    O
ATOM    346  O2P    G A  31    35.907  31.144  7.632   1.00  14.22    O
ATOM    347  O5*    G A  31    35.546  31.762  10.018  1.00  12.60    O
ATOM    348  C5*    G A  31    35.387  32.670  11.107  1.00  11.40    C
ATOM    349  C4*    G A  31    34.796  31.951  12.296  1.00  11.05    C
ATOM    350  O4*    G A  31    33.529  31.364  11.898  1.00  11.06    O
ATOM    351  C3*    G A  31    35.585  30.763  12.826  1.00  11.89    C
ATOM    352  O3*    G A  31    36.673  31.190  13.649  1.00  11.52    O
ATOM    353  C2*    G A  31    34.499  30.057  13.613  1.00  12.14    C
ATOM    354  O2*    G A  31    34.173  30.764  14.789  1.00  14.85    O
ATOM    355  C1*    G A  31    33.321  30.161  12.626  1.00  12.01    C
ATOM    356  N9     G A  31    33.369  29.020  11.714  1.00  9.31     N
ATOM    357  C8     G A  31    33.747  28.982  10.391  1.00  8.70     C
ATOM    358  N7     G A  31    33.733  27.763  9.889   1.00  9.68     N
ATOM    359  C5     G A  31    33.312  26.959  10.944  1.00  7.23     C
ATOM    360  C6     G A  31    33.144  25.544  11.029  1.00  7.98     C
ATOM    361  O6     G A  31    33.310  24.683  10.140  1.00  5.42     O
ATOM    362  N1     G A  31    32.739  25.152  12.313  1.00  6.14     N
ATOM    363  C2     G A  31    32.548  25.997  13.371  1.00  10.35    C
ATOM    364  N2     G A  31    32.176  25.420  14.577  1.00  7.45     N
ATOM    365  N3     G A  31    32.699  27.315  13.297  1.00  9.43     N
ATOM    366  C4     G A  31    33.073  27.720  12.071  1.00  9.46     C
ATOM    367  P      G A  32    37.923  30.221  13.919  1.00  12.74    P
ATOM    368  O1P    G A  32    38.781  31.042  14.790  1.00  14.11    O
ATOM    369  O2P    G A  32    38.517  29.617  12.692  1.00  12.26    O
ATOM    370  O5*    G A  32    37.356  28.990  14.770  1.00  12.62    O
ATOM    371  C5*    G A  32    36.720  29.166  16.023  1.00  10.29    C
ATOM    372  C4*    G A  32    36.261  27.823  16.550  1.00  10.54    C
ATOM    373  O4*    G A  32    35.214  27.266  15.693  1.00  12.36    O
ATOM    374  C3*    G A  32    37.339  26.771  16.499  1.00  12.35    C
ATOM    375  O3*    G A  32    38.203  26.883  17.614  1.00  14.68    O
ATOM    376  C2*    G A  32    36.538  25.487  16.525  1.00  11.24    C
ATOM    377  O2*    G A  32    35.994  25.214  17.807  1.00  13.27    O
ATOM    378  C1*    G A  32    35.393  25.857  15.578  1.00  10.96    C
ATOM    379  N9     G A  32    35.730  25.540  14.191  1.00  9.74     N
ATOM    380  C8     G A  32    36.070  26.428  13.200  1.00  9.21     C
ATOM    381  N7     G A  32    36.330  25.848  12.058  1.00  9.05     N
ATOM    382  C5     G A  32    36.132  24.497  12.304  1.00  10.24    C
ATOM    383  C6     G A  32    36.241  23.372  11.427  1.00  10.39    C
ATOM    384  O6     G A  32    36.572  23.356  10.238  1.00  11.57    O
ATOM    385  N1     G A  32    35.943  22.178  12.079  1.00  8.19     N
ATOM    386  C2     G A  32    35.627  22.076  13.413  1.00  9.95     C
ATOM    387  N2     G A  32    35.463  20.831  13.865  1.00  8.24     N
ATOM    388  N3     G A  32    35.508  23.119  14.242  1.00  9.53     N
ATOM    389  C4     G A  32    35.776  24.287  13.623  1.00  10.32    C
ATOM    390  P      AA  33     39.686  26.342  17.495  1.00  15.61    P
ATOM    391  O1P    A A  33    40.371  26.864  18.691  1.00  19.56    O
ATOM    392  O2P    A A  33    40.255  26.557  16.151  1.00  17.09    O
ATOM    393  O5*    A A  33    39.561  24.752  17.619  1.00  14.10    O
ATOM    394  C5*    A A  33    39.033  24.156  18.788  1.00  14.10    C
ATOM    395  C4*    A A  33    38.951  22.650  18.615  1.00  13.63    C
ATOM    396  O4*    A A  33    37.996  22.286  17.569  1.00 13.30    O
ATOM    397  C3*    A A  33    40.222  21.955  18.171  1.00 13.78    C
ATOM    398  O3*    A A  33    41.120  21.848  19.264  1.00 13.31    O
ATOM    399  C2*    A A  33    39.672  20.607  17.712  1.00 12.75    C
ATOM    400  O2*    A A  33    39.299  19.776  18.802  1.00 12.98    O
ATOM    401  C1*    A A  33    38.400  21.050  16.987  1.00 12.61    C
ATOM    402  N9     A A  33    38.609  21.236  15.550  1.00 12.88    N
ATOM    403  C8     A A  33    38.628  22.381  14.794  1.00 11.71    C
ATOM    404  N7     A A  33    38.816  22.157  13.502  1.00 10.33    N
ATOM    405  C5     A A  33    38.927  20.782  13.415  1.00 9.80     C
ATOM    406  C6     A A  33    39.116  19.908  12.324  1.00 10.29    C
ATOM    407  N6     A A  33    39.234  20.309  11.050  1.00 9.60     N
ATOM    408  N1     A A  33    39.178  18.588  12.588  1.00 9.49     N
ATOM    409  C2     A A  33    39.048  18.179  13.852  1.00 9.84     C
ATOM    410  N3     A A  33    38.857  18.900  14.964  1.00 11.60    N
ATOM    411  C4     A A  33    38.811  20.204  14.669  1.00 11.27    C
ATOM    412  P      U A  34    42.687  21.969  19.023  1.00 15.81    P
ATOM    413  O1P    U A  34    43.252  22.026  20.387  1.00 17.18    O
ATOM    414  O2P    U A  34    42.941  23.110  18.071  1.00 16.71    O
ATOM    415  O5*    U A  34    43.104  20.594  18.319  1.00 15.71    O
ATOM    416  C5*    U A  34    42.712  19.342  18.883  1.00 13.18    C
ATOM    417  C4*    U A  34    42.857  18.181  17.894  1.00 13.06    C
ATOM    418  O4*    U A  34    42.094  18.430  16.686  1.00 12.24    O
ATOM    419  C3*    U A  34    44.300  18.001  17.421  1.00 13.49    C
ATOM    420  O3*    U A  34    44.642  16.633  17.345  1.00 14.82    O
ATOM    421  C2*    U A  34    44.381  18.646  16.051  1.00 13.02    C
ATOM    422  O2*    U A  34    45.215  17.992  15.121  1.00 13.60    O
ATOM    423  C1*    U A  34    42.953  18.456  15.570  1.00 12.35    C
ATOM    424  N1     U A  34    42.536  19.469  14.602  1.00 12.11    N
ATOM    425  C2     U A  34    42.498  19.079  13.286  1.00 11.31    C
ATOM    426  O2     U A  34    42.658  17.918  12.930  1.00 12.26    O
ATOM    427  N3     U A  34    42.267  20.088  12.393  1.00 12.69    N
ATOM    428  C4     U A  34    42.050  21.410  12.687  1.00 11.38    C
ATOM    429  O4     U A  34    41.968  22.223  11.766  1.00 12.81    O
ATOM    430  C5     U A  34    42.032  21.717  14.082  1.00 11.68    C
ATOM    431  C6     U A  34    42.270  20.742  14.979  1.00 11.42    C
ATOM    432  P      A A  35    45.682  15.997  18.379  1.00 15.65    P
ATOM    433  O1P    A A  35    45.216  16.428  19.709  1.00 14.33    O
ATOM    434  O2P    A A  35    47.048  16.295  17.943  1.00 15.44    O
ATOM    435  O5*    A A  35    45.445  14.439  18.178  1.00 15.24    O
ATOM    436  C5*    A A  35    44.211  13.803  18.550  1.00 13.53    C
ATOM    437  C4*    A A  35    44.300  12.292  18.297  1.00 12.70    C
ATOM    438  O4*    A A  35    44.299  12.032  16.878  1.00 13.93    O
ATOM    439  C3*    A A  35    45.610  11.724  18.820  1.00 13.12    C
ATOM    440  O3*    A A  35    45.420  10.462  19.457  1.00 14.06    O
ATOM    441  C2*    A A  35    46.543  11.684  17.607  1.00 13.02    C
ATOM    442  O2*    A A  35    47.425  10.590  17.583  1.00 12.53    O
ATOM    443  C1*    A A  35    45.544  11.534  16.454  1.00 12.55    C
ATOM    444  N9     A A  35    45.906  12.201  15.209  1.00 12.31    N
ATOM    445  C8     A A  35    45.633  13.489  14.841  1.00 13.01    C
ATOM    446  N7     A A  35    46.117  13.819  13.666  1.00 16.12    N
ATOM    447  C5     A A  35    46.737  12.661  13.222  1.00 15.27    C
ATOM    448  C6     A A  35    47.416  12.343  12.024  1.00 15.95    C
ATOM    449  N6     A A  35    47.607  13.213  11.010  1.00 14.94    N
ATOM    450  N1     A A  35    47.895  11.084  11.900  1.00 16.37    N
ATOM    451  C2     A A  35    47.706  10.216  12.909  1.00 17.57    C
ATOM    452  N3     A A  35    47.086  10.398  14.078  1.00 16.34    N
ATOM    453  C4     A A  35    46.615  11.653  14.167  1.00 15.44    C
ATOM    454  P      U A  36    45.278  10.371  21.058  1.00 17.57    P
ATOM    455  O1P    U A  36    46.459  11.056  21.623  1.00 15.59    O
ATOM    456  O2P    U A  36    45.073  8.928   21.307  1.00 18.33    O
ATOM    457  O5*    U A  36    43.954  11.187  21.425  1.00 15.41    O
ATOM    458  C5*    U A  36    42.696  10.541  21.773  1.00 14.72    C
ATOM    459  C4*    U A  36    41.978  11.395  22.807  1.00 14.61    C
ATOM    460  O4*    U A  36    42.775  11.453  23.991  1.00 14.11    O
ATOM    461  C3*    U A  36    41.774  12.824  22.315  1.00 13.18    C
ATOM    462  O3*    U A  36    40.517  13.272  22.831  1.00 10.05    O
ATOM    463  C2*    U A  36    42.798  13.639  23.103  1.00 13.16    C
ATOM    464  O2*    U A  36    42.458  14.971  23.369  1.00 11.86    O
ATOM    465  C1*    U A  36    42.962  12.785  24.367  1.00 12.76    C
ATOM    466  N1     U A  36    44.246  12.864  25.044  1.00 12.63    N
ATOM    467  C2     U A  36    44.272  13.420  26.310  1.00 12.49    C
ATOM    468  O2     U A  36    43.273  13.855  26.869  1.00 11.09    O
ATOM    469  N3     U A  36    45.512  13.445  26.897  1.00 12.26    N
ATOM    470  C4     U A  36    46.708  12.972  26.346  1.00 12.77    C
ATOM    471  O4     U A  36    47.745  13.082  26.975  1.00 13.05    O
ATOM    472  C5     U A  36    46.588  12.412  25.033  1.00 12.67    C
ATOM    473  C6     U A  36    45.390  12.385  24.437  1.00 12.34    C
ATOM    474  P      G A  37    39.141  13.060  22.048  1.00 13.09    P
ATOM    475  O1P    G A  37    38.083  13.377  23.042  1.00 10.03    O
ATOM    476  O2P    G A  37    39.096  11.783  21.316  1.00 10.97    O
ATOM    477  O5*    G A  37    39.187  14.193  20.930  1.00 11.94    O
ATOM    478  C5*    G A  37    38.955  15.558  21.225  1.00 10.67    C
ATOM    479  C4*    G A  37    38.971  16.337  19.929  1.00 10.54    C
ATOM    480  O4*    G A  37    40.254  16.171  19.252  1.00 10.54    O
ATOM    481  C3*    G A  37    37.973  15.801  18.925  1.00 8.49     C
ATOM    482  O3*    G A  37    36.724  16.406  19.212  1.00 9.71     O
ATOM    483  C2*    G A  37    38.576  16.253  17.605  1.00 9.01     C
ATOM    484  O2*    G A  37    38.393  17.651  17.433  1.00 8.99     O
ATOM    485  C1*    G A  37    40.060  15.983  17.850  1.00 10.41    C
ATOM    486  N9     G A  37    40.497  14.629  17.473  1.00 9.32     N
ATOM    487  C8     G A  37    40.487  13.516  18.280  1.00 9.31     C
ATOM    488  N7     G A  37    40.939  12.442  17.686  1.00 10.48    N
ATOM    489  C5     G A  37    41.259  12.859  16.408  1.00 10.37    C
ATOM    490  C6     G A  37    41.782  12.126  15.316  1.00 12.23    C
ATOM    491  O6     G A  37    42.036  10.920  15.257  1.00 11.04    O
ATOM    492  N1     G A  37    42.008  12.948  14.197  1.00 9.95     N
ATOM    493  C2     G A  37    41.748  14.286  14.145  1.00 9.72     C
ATOM    494  N2     G A  37    42.121  14.931  12.993  1.00 8.78     N
ATOM    495  N3     G A  37    41.191  14.972  15.147  1.00 9.91     N
ATOM    496  C4     G A  37    40.995  14.206  16.248  1.00 10.87    C
ATOM    497  P      G A  38    35.372  15.646  18.858  1.00 12.29    P
ATOM    498  O1P    G A  38    34.265  16.448  19.436  1.00 9.96     O
ATOM    499  O2P    G A  38    35.501  14.191  19.191  1.00 11.57    O
ATOM    500  O5*    G A  38    35.356  15.699  17.258  1.00 12.26    O
ATOM    501  C5*    G A  38    35.114  16.920  16.540  1.00 10.01    C
ATOM    502  C4*    G A  38    35.319  16.694  15.053  1.00 8.68     C
ATOM    503  O4*    G A  38    36.699  16.352  14.806  1.00 7.01     O
ATOM    504  C3*    G A  38    34.534  15.539  14.472  1.00 9.46     C
ATOM    505  O3*    G A  38    33.210  15.990  14.155  1.00 12.58    O
ATOM    506  C2*    G A  38    35.376  15.169  13.243  1.00 10.28    C
ATOM    507  O2*    G A  38    35.157  15.985  12.097  1.00 9.67     O
ATOM    508  C1*    G A  38    36.804  15.398  13.759  1.00 9.91     C
ATOM    509  N9     G A  38    37.412  14.173  14.300  1.00 9.70     N
ATOM    510  C8     G A  38    37.174  13.612  15.533  1.00 11.32    C
ATOM    511  N7     G A  38    37.702  12.417  15.664  1.00 11.54    N
ATOM    512  C5     G A  38    38.362  12.199  14.469  1.00 10.27    C
ATOM    513  C6     G A  38    39.035  11.045  13.994  1.00 11.93    C
ATOM    514  O6     G A  38    39.201  9.950   14.575  1.00 8.78     O
ATOM    515  N1     G A  38    39.522  11.236  12.701  1.00 9.87     N
ATOM    516  C2     G A  38    39.369  12.387  11.958  1.00 11.31    C
ATOM    517  N2     G A  38    39.901  12.384  10.710  1.00 10.24    N
ATOM    518  N3     G A  38    38.739  13.460  12.390  1.00 9.09     N
ATOM    519  C4     G A  38    38.251  13.297  13.636  1.00 11.34    C
ATOM    520  P      C A  39    31.929  15.084  14.534  1.00 12.06    P
ATOM    521  O1P    C A  39    32.388  13.880  15.288  1.00 14.53    O
ATOM    522  O2P    C A  39    31.165  14.878  13.278  1.00 12.02    O
ATOM    523  O5*    C A  39    30.903  16.101  15.235  1.00 17.76    O
ATOM    524  C5*    C A  39    31.093  16.713  16.478  1.00 18.70    C
ATOM    525  C4*    C A  39    30.971  18.261  16.413  1.00 13.42    C
ATOM    526  O4*    C A  39    32.106  18.778  15.688  1.00 12.71    O
ATOM    527  C3*    C A  39    29.833  19.187  15.926  1.00 14.10    C
ATOM    528  O3*    C A  39    28.693  19.255  16.804  1.00 10.19    O
ATOM    529  C2*    C A  39    30.564  20.538  16.055  1.00 11.50    C
ATOM    530  O2*    C A  39    30.790  20.868  17.412  1.00 10.17    O
ATOM    531  C1*    C A  39    31.968  20.185  15.563  1.00 12.13    C
ATOM    532  N1     C A  39    32.175  20.579  14.172  1.00 12.50    N
ATOM    533  C2     C A  39    32.272  21.952  13.896  1.00 12.48    C
ATOM    534  O2     C A  39    32.208  22.763  14.848  1.00 8.22     O
ATOM    535  N3     C A  39    32.436  22.355  12.625  1.00 9.69     N
ATOM    536  C4     C A  39    32.522  21.454  11.639  1.00 11.76    C
ATOM    537  N4     C A  39    32.692  21.917  10.379  1.00 8.85     N
ATOM    538  C5     C A  39    32.443  20.047  11.889  1.00 9.77     C
ATOM    539  C6     C A  39    32.267  19.658  13.164  1.00 11.59    C
ATOM    540  P      A A  40    27.311  20.017  16.359  1.00 12.95    P
ATOM    541  O1P    A A  40    26.296  19.624  17.367  1.00 14.20    O
ATOM    542  O2P    A A  40    26.956  19.926  14.935  1.00 12.21    O
ATOM    543  O5*    A A  40    27.609  21.582  16.535  1.00 13.28    O
ATOM    544  C5*    A A  40    27.658  22.200  17.801  1.00 12.99    C
ATOM    545  C4*    A A  40    27.672  23.716  17.632  1.00 12.56    C
ATOM    546  O4*    A A  40    28.892  24.107  16.964  1.00 12.75    O
ATOM    547  C3*    A A  40    26.579  24.281  16.733  1.00 12.50    C
ATOM    548  O3*    A A  40    25.367  24.448  17.450  1.00 12.35    O
ATOM    549  C2*    A A  40    27.182  25.611  16.312  1.00 13.51    C
ATOM    550  O2*    A A  40    27.126  26.577  17.360  1.00 9.74     O
ATOM    551  C1*    A A  40    28.629  25.197  16.084  1.00 11.10    C
ATOM    552  N9     A A  40    28.846  24.755  14.708  1.00 11.69    N
ATOM    553  C8     A A  40    28.858  23.479  14.199  1.00 11.33    C
ATOM    554  N7     A A  40    29.111  23.431  12.916  1.00 9.06     N
ATOM    555  C5     A A  40    29.278  24.761  12.557  1.00 8.72     C
ATOM    556  C6     A A  40    29.583  25.382  11.335  1.00 10.32    C
ATOM    557  N6     A A  40    29.762  24.716  10.185  1.00 9.54     N
ATOM    558  N1     A A  40    29.688  26.735  11.325  1.00 9.70     N
ATOM    559  C2     A A  40    29.463  27.395  12.451  1.00 9.00     C
ATOM    560  N3     A A  40    29.160  26.925  13.661  1.00 7.01     N
ATOM    561  C4     A A  40    29.092  25.584  13.644  1.00 9.47     C
ATOM    562  P      C A  41    23.973  24.307  16.696  1.00 15.74    P
ATOM    563  O1P    C A  41    22.929  24.350  17.731  1.00 16.51    O
ATOM    564  O2P    C A  41    23.995  23.181  15.724  1.00 13.62    O
ATOM    565  O5*    C A  41    23.875  25.634  15.801  1.00 13.56    O
ATOM    566  C5*    C A  41    23.881  26.916  16.422  1.00 12.13    C
ATOM    567  C4*    C A  41    24.095  28.017  15.398  1.00 11.36    C
ATOM    568  O4*    C A  41    25.434  27.933  14.850  1.00 9.89     O
ATOM    569  C3*    C A  41    23.230  28.007  14.151  1.00 10.98    C
ATOM    570  O3*    C A  41    21.887  28.429  14.399  1.00 12.66    O
ATOM    571  C2*    C A  41    24.025  28.958  13.272  1.00 9.59     C
ATOM    572  O2*    C A  41    23.974  30.285  13.781  1.00 10.24    O
ATOM    573  C1*    C A  41    25.435  28.418  13.518 1.00  9.79     C
ATOM    574  N1     C A  41    25.772  27.308  12.587 1.00  7.61     N
ATOM    575  C2     C A  41    26.181  27.650  11.338 1.00  8.93     C
ATOM    576  O2     C A  41    26.289  28.873  11.070 1.00  7.63     O
ATOM    577  N3     C A  41    26.456  26.679  10.436 1.00  8.78     N
ATOM    578  C4     C A  41    26.342  25.386  10.777 1.00  9.30     C
ATOM    579  N4     C A  41    26.656  24.451  9.845  1.00  7.23     N
ATOM    580  C5     C A  41    25.917  24.995  12.077 1.00  7.65     C
ATOM    581  C6     C A  41    25.654  25.986  12.948 1.00  9.18     C
ATOM    582  P      G A  42    20.679  27.762  13.566 1.00  13.08    P
ATOM    583  O1P    G A  42    19.441  28.269  14.161 1.00  16.14    O
ATOM    584  O2P    G A  42    20.913  26.306  13.504 1.00  15.00    O
ATOM    585  O5*    G A  42    20.851  28.371  12.110 1.00  13.10    O
ATOM    586  C5*    G A  42    20.747  29.779  11.925 1.00  11.92    C
ATOM    587  C4*    G A  42    21.247  30.185  10.564 1.00  10.63    C
ATOM    588  O4*    G A  42    22.635  29.810  10.398 1.00  11.41    O
ATOM    589  C3*    G A  42    20.564  29.562  9.364  1.00  12.03    C
ATOM    590  O3*    G A  42    19.320  30.211  9.085  1.00  13.22    O
ATOM    591  C2*    G A  42    21.592  29.850  8.281  1.00  11.77    C
ATOM    592  O2*    G A  42    21.543  31.210  7.918  1.00  12.69    O
ATOM    593  C1*    G A  42    22.898  29.564  9.023  1.00  11.16    C
ATOM    594  N9     G A  42    23.287  28.165  8.856  1.00  10.90    N
ATOM    595  C8     G A  42    23.171  27.140  9.773  1.00  11.82    C
ATOM    596  N7     G A  42    23.564  25.981  9.301  1.00  11.44    N
ATOM    597  C5     G A  42    23.980  26.263  8.002  1.00  10.91    C
ATOM    598  C6     G A  42    24.522  25.409  7.014  1.00  10.75    C
ATOM    599  O6     G A  42    24.774  24.198  7.101  1.00  11.56    O
ATOM    600  N1     G A  42    24.797  26.094  5.830  1.00  10.06    N
ATOM    601  C2     G A  42    24.571  27.437  5.625  1.00  11.20    C
ATOM    602  N2     G A  42    24.867  27.908  4.395  1.00  10.66    N
ATOM    603  N3     G A  42    24.079  28.254  6.555  1.00  10.51    N
ATOM    604  C4     G A  42    23.812  27.602  7.710  1.00  11.10    C
ATOM    605  P      C A  43    18.199  29.425  8.233  1.00  16.98    P
ATOM    606  O1P    C A  43    16.981  30.235  8.305  1.00  18.69    O
ATOM    607  O2P    C A  43    18.159  28.002  8.664  1.00  16.43    O
ATOM    608  O5*    C A  43    18.772  29.450  6.752  1.00  18.08    O
ATOM    609  C5*    C A  43    19.022  30.687  6.085  1.00  19.11    C
ATOM    610  C4*    C A  43    19.566  30.428  4.708  1.00  19.02    C
ATOM    611  O4*    C A  43    20.885  29.830  4.791  1.00  19.55    O
ATOM    612  C3*    C A  43    18.780  29.428  3.877  1.00  21.07    C
ATOM    613  O3*    C A  43    17.631  30.042  3.313  1.00  24.02    O
ATOM    614  C2*    C A  43    19.809  29.042  2.827  1.00  20.29    C
ATOM    615  O2*    C A  43    20.015  30.061  1.875  1.00  21.85    O
ATOM    616  C1*    C A  43    21.077  28.962  3.680  1.00  19.45    C
ATOM    617  N1     C A  43    21.322  27.589  4.156  1.00  18.04    N
ATOM    618  C2     C A  43    21.977  26.691  3.289  1.00  16.83    C
ATOM    619  O2     C A  43    22.310  27.073  2.145  1.00  15.78    O
ATOM    620  N3     C A  43    22.223  25.438  3.712  1.00  15.70    N
ATOM    621  C4     C A  43    21.839  25.054  4.931  1.00  15.08    C
ATOM    622  N4     C A  43    22.109  23.808  5.295  1.00  14.50    N
ATOM    623  C5     C A  43    21.157  25.932  5.821  1.00  14.50    C
ATOM    624  C6     C A  43    20.923  27.181  5.397  1.00  16.57    C
ATOM    625  P      A A  44    16.292  29.177  3.069  1.00  26.38    P
ATOM    626  O1P    A A  44    15.341  30.100  2.418  1.00  26.88    O
ATOM    627  O2P    A A  44    15.887  28.460  4.292  1.00  26.22    O
ATOM    628  O5*    A A  44    16.749  28.038  2.049  1.00  26.94    O
ATOM    629  C5*    A A  44    16.902  28.330  0.686  1.00  26.45    C
ATOM    630  C4*    A A  44    17.567  27.192  -0.053 1.00  25.81    C
ATOM    631  O4*    A A  44    18.835  26.841  0.575  1.00  24.67    O
ATOM    632  C3*    A A  44    16.920  25.825    -0.196 1.00 25.05    C
ATOM    633  O3*    A A  44    15.807  25.831    -1.095 1.00 24.16    O
ATOM    634  C2*    A A  44    18.110  25.083    -0.805 1.00 24.43    C
ATOM    635  O2*    A A  44    18.398  25.556    -2.099 1.00 26.31    O
ATOM    636  C1*    A A  44    19.261  25.596    0.065  1.00 23.69    C
ATOM    637  N9     A A  44    19.494  24.674    1.169  1.00 22.64    N
ATOM    638  C8     A A  44    19.153  24.773    2.489  1.00 22.43    C
ATOM    639  N7     A A  44    19.450  23.707    3.189  1.00 22.73    N
ATOM    640  C5     A A  44    20.033  22.855    2.261  1.00 23.13    C
ATOM    641  C6     A A  44    20.536  21.549    2.358  1.00 22.92    C
ATOM    642  N6     A A  44    20.506  20.829    3.484  1.00 25.71    N
ATOM    643  N1     A A  44    21.061  20.993    1.248  1.00 23.09    N
ATOM    644  C2     A A  44    21.058  21.702    0.115  1.00 22.58    C
ATOM    645  N3     A A  44    20.591  22.928    -0.108 1.00 23.04    N
ATOM    646  C4     A A  44    20.089  23.452    1.022  1.00 22.28    C
ATOM    647  P      A A  45    14.684  24.664    -1.004 1.00 27.94    P
ATOM    648  O1P    A A  45    13.634  25.021    -1.982 1.00 27.49    O
ATOM    649  O2P    A A  45    14.311  24.380    0.411  1.00 26.25    O
ATOM    650  O5*    A A  45    15.413  23.346    -1.552 1.00 23.99    O
ATOM    651  C5*    A A  45    15.896  23.306    -2.888 1.00 22.10    C
ATOM    652  C4*    A A  45    16.650  22.030    -3.146 1.00 20.80    C
ATOM    653  O4*    A A  45    17.782  21.931    -2.238 1.00 18.05    O
ATOM    654  C3*    A A  45    15.868  20.747    -2.898 1.00 19.29    C
ATOM    655  O3*    A A  45    15.065  20.459    -4.029 1.00 19.25    O
ATOM    656  C2*    A A  45    16.997  19.740    -2.727 1.00 18.96    C
ATOM    657  O2*    A A  45    17.625  19.395    -3.953 1.00 20.46    O
ATOM    658  C1*    A A  45    17.993  20.564    -1.910 1.00 18.32    C
ATOM    659  N9     A A  45    17.789  20.387    -0.475 1.00 17.77    N
ATOM    660  C8     A A  45    17.252  21.249    0.459  1.00 16.87    C
ATOM    661  N7     A A  45    17.270  20.777    1.682  1.00 15.45    N
ATOM    662  C5     A A  45    17.848  19.517    1.545  1.00 15.55    C
ATOM    663  C6     A A  45    18.183  18.528    2.467  1.00 14.82    C
ATOM    664  N6     A A  45    18.021  18.657    3.781  1.00 14.77    N
ATOM    665  N1     A A  45    18.728  17.384    1.995  1.00 14.86    N
ATOM    666  C2     A A  45    18.938  17.265    0.678  1.00 15.61    C
ATOM    667  N3     A A  45    18.684  18.132    -0.288 1.00 15.02    N
ATOM    668  C4     A A  45    18.143  19.255    0.218  1.00 16.02    C
ATOM    669  P      G A  46    13.590  19.837    -3.836 1.00 21.76    P
ATOM    670  O1P    G A  46    13.111  19.621    -5.232 1.00 20.58    O
ATOM    671  O2P    G A  46    12.796  20.615    -2.886 1.00 20.12    O
ATOM    672  O5*    G A  46    13.859  18.416    -3.180 1.00 17.63    O
ATOM    673  C5*    G A  46    14.553  17.429    -3.908 1.00 16.53    C
ATOM    674  C4*    G A  46    14.840  16.245    -3.025 1.00 16.28    C
ATOM    675  O4*    G A  46    15.704  16.691    -1.942 1.00 15.33    O
ATOM    676  C3*    G A  46    13.638  15.650    -2.304 1.00 14.19    C
ATOM    677  O3*    G A  46    12.948  14.718    -3.148 1.00 15.95    O
ATOM    678  C2*    G A  46    14.333  14.927    -1.152 1.00 15.24    C
ATOM    679  O2*    G A  46    14.970  13.723    -1.593 1.00 11.22    O
ATOM    680  C1*    G A  46    15.417  15.944    -0.780 1.00 14.15    C
ATOM    681  N9     G A  46    15.039  16.881    0.277  1.00 15.14    N
ATOM    682  C8     G A  46    14.429  18.103    0.129  1.00 13.16    C
ATOM    683  N7     G A  46    14.249  18.721    1.264  1.00 14.91    N
ATOM    684  C5     G A  46    14.764  17.852    2.223  1.00 13.65    C
ATOM    685  C6     G A  46    14.850  17.980    3.646  1.00 14.21    C
ATOM    686  O6     G A  46    14.457  18.922    4.373  1.00 13.60    O
ATOM    687  N1     G A  46    15.451  16.861    4.225  1.00 14.00    N
ATOM    688  C2     G A  46    15.898  15.760    3.534  1.00 13.23    C
ATOM    689  N2     G A  46    16.436  14.773    4.271  1.00 13.07    N
ATOM    690  N3     G A  46    15.821  15.634    2.214  1.00 12.14    N
ATOM    691  C4     G A  46    15.250 16.709    1.631   1.00 13.14    C
ATOM    692  P      U A  47    11.385 14.951    -3.517  1.00 19.08    P
ATOM    693  O1P    U A  47    11.197 14.163    -4.756  1.00 17.31    O
ATOM    694  O2P    U A  47    11.026 16.379    -3.510  1.00 17.84    O
ATOM    695  O5*    U A  47    10.608 14.251    -2.313  1.00 18.59    O
ATOM    696  C5*    U A  47    10.648 12.828    -2.158  1.00 16.76    C
ATOM    697  C4*    U A  47    9.701  12.351    -1.061  1.00 16.21    C
ATOM    698  O4*    U A  47    10.107 12.861    0.238   1.00 17.46    O
ATOM    699  C3*    U A  47    8.276  12.864    -1.282  1.00 17.26    C
ATOM    700  O3*    U A  47    7.372  11.850    -0.863  1.00 19.08    O
ATOM    701  C2*    U A  47    8.151  14.098    -0.386  1.00 16.32    C
ATOM    702  O2*    U A  47    6.881  14.327    0.178   1.00 17.79    O
ATOM    703  C1*    U A  47    9.107  13.723    0.745   1.00 15.55    C
ATOM    704  N1     U A  47    9.692  14.810    1.530   1.00 16.06    N
ATOM    705  C2     U A  47    9.596  14.735    2.916   1.00 14.37    C
ATOM    706  O2     U A  47    9.141  13.791    3.505   1.00 16.51    O
ATOM    707  N3     U A  47    10.080 15.822    3.587   1.00 14.95    N
ATOM    708  C4     U A  47    10.653 16.933    3.042   1.00 13.66    C
ATOM    709  O4     U A  47    10.944 17.868    3.777   1.00 15.44    O
ATOM    710  C5     U A  47    10.761 16.919    1.612   1.00 15.07    C
ATOM    711  C6     U A  47    10.287 15.883    0.923   1.00 14.65    C
ATOM    712  P      U A  48    6.564  10.960    -1.926  1.00 19.85    P
ATOM    713  O1P    U A  48    5.831  10.040    -1.031  1.00 17.53    O
ATOM    714  O2P    U A  48    7.437  10.406    -2.967  1.00 19.96    O
ATOM    715  O5*    U A  48    5.542  12.008    -2.571  1.00 18.50    O
ATOM    716  C5*    U A  48    4.823  12.913    -1.720  1.00 20.70    C
ATOM    717  C4*    U A  48    3.830  13.767    -2.497  1.00 19.87    C
ATOM    718  O4*    U A  48    2.984  12.978    -3.363  1.00 21.40    O
ATOM    719  C3*    U A  48    2.919  14.504    -1.528  1.00 22.14    C
ATOM    720  O3*    U A  48    3.091  15.908    -1.719  1.00 21.98    O
ATOM    721  C2*    U A  48    1.483  14.183    -1.964  1.00 21.79    C
ATOM    722  O2*    U A  48    0.647  15.315    -2.023  1.00 26.06    O
ATOM    723  C1*    U A  48    1.688  13.540    -3.338  1.00 21.49    C
ATOM    724  N1     U A  48    0.705  12.541    -3.764  1.00 19.91    N
ATOM    725  C2     U A  48    -0.172 12.916    -4.772  1.00 21.91    C
ATOM    726  O2     U A  48    -0.152 14.035    -5.305  1.00 19.91    O
ATOM    727  N3     U A  48    -1.064 11.951    -5.142  1.00 19.50    N
ATOM    728  C4     U A  48    -1.172 10.684    -4.623  1.00 21.21    C
ATOM    729  O4     U A  48    -2.052 9.936     -5.040  1.00 20.77    O
ATOM    730  C5     U A  48    -0.228 10.375    -3.587  1.00 20.54    C
ATOM    731  C6     U A  48    0.653  11.297    -3.207  1.00 21.02    C
ATOM    732  P      U A  49    4.393  16.672    -1.154  1.00 24.27    P
ATOM    733  O1P    U A  49    4.112  18.081    -1.444  1.00 21.67    O
ATOM    734  O2P    U A  49    5.651  16.051    -1.658  1.00 22.02    O
ATOM    735  O5*    U A  49    4.355  16.404    0.420   1.00 21.65    O
ATOM    736  C5*    U A  49    3.224  16.736    1.195   1.00 22.80    C
ATOM    737  C4*    U A  49    3.533  16.647    2.677   1.00 22.95    C
ATOM    738  O4*    U A  49    3.474  15.273    3.129   1.00 24.98    O
ATOM    739  C3*    U A  49    4.962  17.109    2.990   1.00 23.23    C
ATOM    740  O3*    U A  49    4.958  17.936    4.127   1.00 22.14    O
ATOM    741  C2*    U A  49    5.807  15.844    3.138   1.00 22.97    C
ATOM    742  O2*    U A  49    6.804  15.917    4.151   1.00 21.66    O
ATOM    743  C1*    U A  49    4.739  14.866    3.606   1.00 21.87    C
ATOM    744  N1     U A  49    4.895  13.418    3.466   1.00 20.97    N
ATOM    745  C2     U A  49    4.504  12.676    4.556   1.00 18.94    C
ATOM    746  O2     U A  49    4.042  13.182    5.570   1.00 19.40    O
ATOM    747  N3     U A  49    4.657  11.327    4.423   1.00 19.76    N
ATOM    748  C4     U A  49    5.143  10.659    3.335   1.00 19.27    C
ATOM    749  O4     U A  49    5.181  9.441     3.367   1.00 19.94    O
ATOM    750  C5    U A  49    5.533  11.493  2.231  1.00 19.78    C
ATOM    751  C6    U A  49    5.398  12.822  2.336  1.00 21.36    C
ATOM    752  P     C A  50    6.149  18.965  4.371  1.00 25.95    P
ATOM    753  O1P   C A  50    5.898  20.166  3.536  1.00 23.44    O
ATOM    754  O2P   C A  50    7.459  18.286  4.288  1.00 25.26    O
ATOM    755  O5*   C A  50    5.932  19.376  5.884  1.00 22.51    O
ATOM    756  C5*   C A  50    4.862  20.228  6.238  1.00 24.64    C
ATOM    757  C4*   C A  50    4.500  19.987  7.664  1.00 23.18    C
ATOM    758  O4*   C A  50    3.946  18.653  7.796  1.00 22.19    O
ATOM    759  C3*   C A  50    5.714  19.971  8.569  1.00 23.50    C
ATOM    760  O3*   C A  50    6.031  21.297  8.951  1.00 23.96    O
ATOM    761  C2*   C A  50    5.211  19.146  9.739  1.00 22.22    C
ATOM    762  O2*   C A  50    4.390  19.925  10.581 1.00 23.29    O
ATOM    763  C1*   C A  50    4.379  18.081  9.020  1.00 20.79    C
ATOM    764  N1    C A  50    5.148  16.857  8.718  1.00 18.62    N
ATOM    765  C2    C A  50    5.579  16.061  9.782  1.00 18.06    C
ATOM    766  O2    C A  50    5.294  16.403  10.944 1.00 18.10    O
ATOM    767  N3    C A  50    6.286  14.924  9.529  1.00 18.43    N
ATOM    768  C4    C A  50    6.541  14.559  8.278  1.00 16.95    C
ATOM    769  N4    C A  50    7.187  13.390  8.096  1.00 16.78    N
ATOM    770  C5    C A  50    6.127  15.362  7.156  1.00 18.20    C
ATOM    771  C6    C A  50    5.435  16.496  7.425  1.00 18.70    C
ATOM    772  P     U A  51    7.545  21.802  8.901  1.00 26.70    P
ATOM    773  O1P   U A  51    7.531  23.156  9.484  1.00 26.93    O
ATOM    774  O2P   U A  51    8.082  21.612  7.532  1.00 25.00    O
ATOM    775  O5*   U A  51    8.299  20.823  9.912  1.00 25.55    O
ATOM    776  C5*   U A  51    8.050  20.887  11.311 1.00 24.16    C
ATOM    777  C4*   U A  51    8.585  19.653  12.005 1.00 21.45    C
ATOM    778  O4*   U A  51    7.971  18.463  11.431 1.00 22.38    O
ATOM    779  C3*   U A  51    10.072 19.376  11.858 1.00 22.73    C
ATOM    780  O3*   U A  51    10.845 20.123  12.799 1.00 23.34    O
ATOM    781  C2*   U A  51    10.136 17.895  12.196 1.00 19.59    C
ATOM    782  O2*   U A  51    9.952  17.713  13.569 1.00 19.61    O
ATOM    783  C1*   U A  51    8.878  17.367  11.512 1.00 19.68    C
ATOM    784  N1    U A  51    9.123  16.859  10.157 1.00 18.48    N
ATOM    785  C2    U A  51    9.636  15.574  10.020 1.00 17.36    C
ATOM    786  O2    U A  51    9.930  14.862  10.967 1.00 16.91    O
ATOM    787  N3    U A  51    9.794  15.153  8.726  1.00 16.05    N
ATOM    788  C4    U A  51    9.507  15.862  7.571  1.00 16.11    C
ATOM    789  O4    U A  51    9.679  15.322  6.462  1.00 15.90    O
ATOM    790  C5    U A  51    8.995  17.179  7.796  1.00 16.34    C
ATOM    791  C6    U A  51    8.832  17.627  9.048  1.00 16.75    C
ATOM    792  P     A A  52    12.365 20.517  12.450 1.00 25.19    P
ATOM    793  O1P   A A  52    12.846 21.398  13.550 1.00 27.50    O
ATOM    794  O2P   A A  52    12.491 20.983  11.045 1.00 24.46    O
ATOM    795  O5*   A A  52    13.148 19.125  12.569 1.00 22.18    O
ATOM    796  C5*   A A  52    13.100 18.336  13.756 1.00 18.74    C
ATOM    797  C4*   A A  52    13.709 16.971  13.493 1.00 17.82    C
ATOM    798  O4*   A A  52    12.882 16.221  12.560 1.00 17.99    O
ATOM    799  C3*   A A  52    15.082 17.021  12.845 1.00 17.21    C
ATOM    800  O3*   A A  52    16.060 17.141  13.881 1.00 17.77    O
ATOM    801  C2*   A A  52    15.156 15.672  12.120 1.00 16.59    C
ATOM    802  O2*   A A  52    15.493 14.600  12.980 1.00 13.63    O
ATOM    803  C1*   A A  52    13.704 15.476  11.671 1.00 16.93    C
ATOM    804  N9    A A  52    13.417 15.925  10.298 1.00 18.02    N
ATOM    805  C8    A A  52    12.870 17.137  9.918  1.00 16.91    C
ATOM    806  N7    A A  52    12.661 17.242  8.623  1.00 15.76    N
ATOM    807  C5    A A  52    13.113 16.029  8.111  1.00 14.73    C
ATOM    808  C6    A A  52    13.146 15.509  6.798  1.00 13.71    C
ATOM    809  N6    A A  52    12.694  16.170  5.730   1.00 10.55    N
ATOM    810  N1    A A  52    13.660  14.265  6.626   1.00 13.71    N
ATOM    811  C2    A A  52    14.109  13.603  7.708   1.00 14.81    C
ATOM    812  N3    A A  52    14.126  13.984  8.990   1.00 14.94    N
ATOM    813  C4    A A  52    13.603  15.217  9.127   1.00 15.57    C
ATOM    814  P     C A  53    17.368  18.050  13.670  1.00 17.51    P
ATOM    815  O1P   C A  53    18.117  18.008  14.931  1.00 19.79    O
ATOM    816  O2P   C A  53    17.010  19.365  13.065  1.00 18.18    O
ATOM    817  O5*   C A  53    18.238  17.298  12.563  1.00 17.18    O
ATOM    818  C5*   C A  53    18.901  16.077  12.842  1.00 15.96    C
ATOM    819  C4*   C A  53    19.332  15.446  11.543  1.00 15.86    C
ATOM    820  O4*   C A  53    18.121  15.192  10.776  1.00 13.93    O
ATOM    821  C3*   C A  53    20.160  16.337  10.613  1.00 15.87    C
ATOM    822  O3*   C A  53    21.559  16.258  10.903  1.00 17.45    O
ATOM    823  C2*   C A  53    19.874  15.668  9.269   1.00 14.61    C
ATOM    824  O2*   C A  53    20.537  14.416  9.169   1.00 13.51    O
ATOM    825  C1*   C A  53    18.388  15.358  9.402   1.00 14.62    C
ATOM    826  N1    C A  53    17.495  16.398  8.857   1.00 15.30    N
ATOM    827  C2    C A  53    16.863  16.150  7.629   1.00 16.59    C
ATOM    828  O2    C A  53    17.047  15.036  7.072   1.00 15.08    O
ATOM    829  N3    C A  53    16.064  17.117  7.081   1.00 15.46    N
ATOM    830  C4    C A  53    15.882  18.269  7.728   1.00 15.94    C
ATOM    831  N4    C A  53    15.106  19.193  7.161   1.00 17.55    N
ATOM    832  C5    C A  53    16.499  18.534  8.995   1.00 18.55    C
ATOM    833  C6    C A  53    17.293  17.579  9.514   1.00 17.04    C
ATOM    834  P     C A  54    22.305  17.435  11.741  1.00 20.49    P
ATOM    835  O1P   C A  54    21.325  18.517  12.085  1.00 24.43    O
ATOM    836  O2P   C A  54    23.512  17.794  10.991  1.00 22.51    O
ATOM    837  O5*   C A  54    22.926  16.655  12.998  1.00 23.22    O
ATOM    838  C5*   C A  54    22.304  16.618  14.248  1.00 20.44    C
ATOM    839  C4*   C A  54    22.299  15.199  14.853  1.00 16.62    C
ATOM    840  O4*   C A  54    21.619  14.289  13.954  1.00 13.18    O
ATOM    841  C3*   C A  54    23.510  14.352  15.283  1.00 15.61    C
ATOM    842  O3*   C A  54    24.117  14.814  16.513  1.00 15.53    O
ATOM    843  C2*   C A  54    22.766  13.054  15.620  1.00 13.43    C
ATOM    844  O2*   C A  54    22.037  13.231  16.823  1.00 10.21    O
ATOM    845  C1*   C A  54    21.731  12.976  14.489  1.00 12.97    C
ATOM    846  N1    C A  54    22.153  12.031  13.438  1.00 11.15    N
ATOM    847  C2    C A  54    22.102  10.675  13.741  1.00 11.28    C
ATOM    848  O2    C A  54    21.721  10.338  14.877  1.00 10.76    O
ATOM    849  N3    C A  54    22.477  9.762   12.803  1.00 11.24    N
ATOM    850  C4    C A  54    22.895  10.172  11.606  1.00 11.60    C
ATOM    851  N4    C A  54    23.244  9.240   10.718  1.00 10.41    N
ATOM    852  C5    C A  54    22.965  11.562  11.266  1.00 11.08    C
ATOM    853  C6    C A  54    22.582  12.450  12.207  1.00 9.08     C
ATOM    854  P     G A  55    25.594  14.295  16.976  1.00 13.05    P
ATOM    855  O1P   G A  55    25.962  15.246  18.039  1.00 12.26    O
ATOM    856  O2P   G A  55    26.496  14.069  15.850  1.00 11.41    O
ATOM    857  O5*   G A  55    25.399  12.866  17.663  1.00 10.95    O
ATOM    858  C5*   G A  55    24.831  12.746  18.965  1.00 14.14    C
ATOM    859  C4*   G A  55    24.802  11.304  19.405  1.00 11.91    C
ATOM    860  O4*   G A  55    23.968  10.508  18.509  1.00 13.05    O
ATOM    861  C3*   G A  55    26.149  10.594  19.367  1.00 11.99    C
ATOM    862  O3*   G A  55    26.929  10.898  20.521  1.00 13.10    O
ATOM    863  C2*   G A  55    25.728  9.140   19.334  1.00 11.08    C
ATOM    864  O2*   G A  55    25.292  8.701   20.587  1.00 10.72    O
ATOM    865  C1*   G A  55    24.527  9.203   18.390  1.00 11.23    C
ATOM    866  N9    G A  55    24.931  8.998   17.004  1.00 10.75    N
ATOM    867  C8    G A  55    25.171  9.961   16.045  1.00 7.33     C
ATOM    868  N7    G A  55    25.353    9.455  14.847  1.00 9.34    N
ATOM    869  C5    G A  55    25.283    8.079  15.039  1.00 7.65    C
ATOM    870  C6    G A  55    25.397    7.019  14.114  1.00 8.58    C
ATOM    871  O6    G A  55    25.565    7.082  12.885  1.00 7.74    O
ATOM    872  N1    G A  55    25.286    5.775  14.741  1.00 7.05    N
ATOM    873  C2    G A  55    25.090    5.584  16.085  1.00 9.83    C
ATOM    874  N2    G A  55    25.007    4.306  16.495  1.00 12.00   N
ATOM    875  N3    G A  55    24.974    6.572  16.964  1.00 9.85    N
ATOM    876  C4    G A  55    25.068    7.781  16.375  1.00 9.88    C
ATOM    877  P     G A  56    28.506    11.118 20.370  1.00 13.76   P
ATOM    878  O1P   G A  56    28.941    11.806 21.603  1.00 13.53   O
ATOM    879  O2P   G A  56    28.773    11.722 19.054  1.00 14.23   O
ATOM    880  O5*   G A  56    29.116    9.645  20.366  1.00 13.32   O
ATOM    881  C5*   G A  56    29.082    8.849  21.551  1.00 13.87   C
ATOM    882  C4*   G A  56    29.183    7.374  21.197  1.00 10.21   C
ATOM    883  O4*   G A  56    28.057    7.023  20.333  1.00 11.28   O
ATOM    884  C3*   G A  56    30.397    6.922  20.404  1.00 11.41   C
ATOM    885  O3*   G A  56    31.527    6.711  21.273  1.00 9.71    O
ATOM    886  C2*   G A  56    29.878    5.605  19.841  1.00 8.73    C
ATOM    887  O2*   G A  56    29.794    4.659  20.902  1.00 8.39    O
ATOM    888  C1*   G A  56    28.462    6.009  19.418  1.00 10.13   C
ATOM    889  N9    G A  56    28.486    6.581  18.071  1.00 10.46   N
ATOM    890  C8    G A  56    28.551    7.917  17.730  1.00 8.60    C
ATOM    891  N7    G A  56    28.622    8.113  16.441  1.00 9.93    N
ATOM    892  C5    G A  56    28.582    6.835  15.897  1.00 8.16    C
ATOM    893  C6    G A  56    28.626    6.411  14.551  1.00 7.93    C
ATOM    894  O6    G A  56    28.702    7.101  13.539  1.00 9.17    O
ATOM    895  N1    G A  56    28.583    5.011  14.447  1.00 7.02    N
ATOM    896  C2    G A  56    28.536    4.139  15.508  1.00 9.44    C
ATOM    897  N2    G A  56    28.557    2.786  15.209  1.00 7.72    N
ATOM    898  N3    G A  56    28.484    4.537  16.776  1.00 8.70    N
ATOM    899  C4    G A  56    28.504    5.880  16.892  1.00 8.72    C
ATOM    900  P     G A  57    32.995    6.619  20.673  1.00 13.57   P
ATOM    901  O1P   G A  57    33.919    6.615  21.837  1.00 11.27   O
ATOM    902  O2P   G A  57    33.141    7.686  19.611  1.00 15.12   O
ATOM    903  O5*   G A  57    33.076    5.220  19.904  1.00 11.64   O
ATOM    904  C5*   G A  57    32.985    3.994  20.606  1.00 10.61   C
ATOM    905  C4*   G A  57    32.946    2.834  19.636  1.00 10.65   C
ATOM    906  O4*   G A  57    31.764    2.920  18.802  1.00 10.66   O
ATOM    907  C3*   G A  57    34.095    2.749  18.637  1.00 11.12   C
ATOM    908  O3*   G A  57    35.211    2.092  19.227  1.00 12.09   O
ATOM    909  C2*   G A  57    33.485    1.856  17.579  1.00 10.15   C
ATOM    910  O2*   G A  57    33.432    0.527  18.073  1.00 11.67   O
ATOM    911  C1*   G A  57    32.080    2.447  17.495  1.00 10.13   C
ATOM    912  N9    G A  57    32.032    3.577  16.566  1.00 9.94    N
ATOM    913  C8    G A  57    31.948    4.915  16.870  1.00 8.87    C
ATOM    914  N7    G A  57    31.840    5.680  15.806  1.00 9.77    N
ATOM    915  C5    G A  57    31.896    4.788  14.736  1.00 9.04    C
ATOM    916  C6    G A  57    31.841    5.018  13.333  1.00 7.94    C
ATOM    917  O6    G A  57    31.697    6.098  12.719  1.00 7.09    O
ATOM    918  N1    G A  57    31.968    3.833  12.617  1.00 7.83    N
ATOM    919  C2    G A  57    32.123    2.586  13.170  1.00 9.14    C
ATOM    920 N2     G A  57    32.295    1.559  12.302  1.00 10.54   N
ATOM    921  N3    G A  57    32.131    2.356  14.477  1.00 8.97    N
ATOM    922  C4    G A  57    32.030    3.490  15.192  1.00 8.38    C
ATOM    923  P     C A  58    36.691    2.608  18.919  1.00 16.58   P
ATOM    924  O1P   C A  58    37.600    1.734  19.679  1.00 19.45   O
ATOM    925  O2P   C A  58    36.781    4.087  19.087  1.00 16.41   O
ATOM    926  O5*   C A  58    36.862    2.269  17.367  1.00 16.52   O
ATOM    927  C5*   C A  58    36.965    0.921  16.950  1.00 15.10    C
ATOM    928  C4*   C A  58    36.833    0.823  15.451  1.00 15.33    C
ATOM    929  O4*   C A  58    35.542    1.354  15.026  1.00 13.38    O
ATOM    930  C3*   C A  58    37.823    1.632  14.626  1.00 15.47    C
ATOM    931  O3*   C A  58    39.082    0.999  14.519  1.00 18.74    O
ATOM    932  C2*   C A  58    37.111    1.673  13.286  1.00 11.17    C
ATOM    933  O2*   C A  58    37.125    0.418  12.637  1.00 13.01    O
ATOM    934  C1*   C A  58    35.686    1.967  13.742  1.00 11.98    C
ATOM    935  N1    C A  58    35.440    3.426  13.858  1.00 10.35    N
ATOM    936  C2    C A  58    35.230    4.131  12.682  1.00 10.97    C
ATOM    937  O2    C A  58    35.275    3.491  11.594  1.00 7.46     O
ATOM    938  N3    C A  58    34.999    5.473  12.736  1.00 8.91     N
ATOM    939  C4    C A  58    34.990    6.105  13.916  1.00 10.48    C
ATOM    940  N4    C A  58    34.733    7.422  13.921  1.00 7.52     N
ATOM    941  C5    C A  58    35.227    5.405  15.148  1.00 10.36    C
ATOM    942  C6    C A  58    35.431    4.071  15.068  1.00 9.90     C
ATOM    943  P     A A  59    40.407    1.880  14.428  1.00 19.54    P
ATOM    944  O1P   A A  59    41.476    0.909  14.728  1.00 23.14    O
ATOM    945  O2P   A A  59    40.304    3.121  15.233  1.00 20.05    O
ATOM    946  O5*   A A  59    40.518    2.324  12.905  1.00 18.97    O
ATOM    947  C5*   A A  59    40.522    1.349  11.874  1.00 17.12    C
ATOM    948  C4*   A A  59    40.269    1.997  10.535  1.00 14.95    C
ATOM    949  O4*   A A  59    38.970    2.626  10.543  1.00 12.74    O
ATOM    950  C3*   A A  59    41.236    3.099  10.117  1.00 15.97    C
ATOM    951  O3*   A A  59    42.370    2.521  9.460   1.00 17.11    O
ATOM    952  C2*   A A  59    40.403    3.881  9.110   1.00 13.15    C
ATOM    953  O2*   A A  59    40.358    3.242  7.841   1.00 15.00    O
ATOM    954  C1*   A A  59    39.025    3.807  9.760   1.00 12.41    C
ATOM    955  N9    A A  59    38.757    4.934  10.638  1.00 9.57     N
ATOM    956  C8    A A  59    38.679    4.950  12.014  1.00 9.34     C
ATOM    957  N7    A A  59    38.272    6.102  12.500  1.00 10.38    N
ATOM    958  C5    A A  59    38.113    6.898  11.371  1.00 9.84     C
ATOM    959  C6    A A  59    37.677    8.220  11.208  1.00 10.49    C
ATOM    960  N6    A A  59    37.293    8.991  12.234  1.00 9.11     N
ATOM    961  N1    A A  59    37.636    8.724  9.946   1.00 8.89     N
ATOM    962  C2    A A  59    37.996    7.927  8.925   1.00 9.88     C
ATOM    963  N3    A A  59    38.421    6.652  8958    1.00 9.56     N
ATOM    964  C4    A A  59    38.454    6.200  10.225  1.00 11.25    C
ATOM    965  P     C A  60    43.798    3.248  9.508   1.00 19.04    P
ATOM    966  O1P   C A  60    44.656    2.375  8.681   1.00 20.33    O
ATOM    967  O2P   C A  60    44.215    3.641  10.866  1.00 19.75    O
ATOM    968  O5*   C A  60    43.620    4.636  8.731   1.00 18.48    O
ATOM    969  C5*   C A  60    43.338    4.688  7.333   1.00 18.85    C
ATOM    970  C4*   C A  60    42.905    6.090  6.953   1.00 17.29    C
ATOM    971  O4*   C A  60    41.667    6.421  7.652   1.00 16.10    O
ATOM    972  C3*   C A  60    43.873    7.165  7.423   1.00 17.86    C
ATOM    973  O3*   C A  60    44.971    7.328  6.520   1.00 15.95    O
ATOM    974  C2*   C A  60    42.968    8.392  7.489   1.00 15.75    C
ATOM    975  O2*   C A  60    42.660    8.899  6.212   1.00 13.38    O
ATOM    976  C1*   C A  60    41.697    7.779  8.067   1.00 14.86    C
ATOM    977  N1    C A  60    41.611    7.830  9.544   1.00 13.02    N
ATOM    978  C2    C A  60    41.114    8.986  10.149  1.00 11.98    C
ATOM    979  O2    C A  60    40.879    9.970  9.439   1.00 9.87     O
ATOM    980  N3    C A  60    40.914    8.997  11.493  1.00 10.09    N
ATOM    981  C4    C A  60    41.219    7.909  12.218  1.00 11.18    C
ATOM    982  N4    C A  60    40.938    7.915  13.561  1.00 10.47    N
ATOM    983  C5    C A  60    41.802    6.761  11.628  1.00 12.15    C
ATOM    984  C6    C A  60    41.979    6.759  10.306  1.00 12.05    C
ATOM    985  P     C A  61    46.349    7.925  7.060   1.00 17.42    P
ATOM    986  O1P    C A  61    47.356  7.713    5.977  1.00 20.07    O
ATOM    987  O2P    C A  61    46.636  7.464    8.434  1.00 19.05    O
ATOM    988  O5*    C A  61    46.133  9.494    7.201  1.00 17.65    O
ATOM    989  C5*    C A  61    45.764  10.291   6.081  1.00 17.42    C
ATOM    990  C4*    C A  61    45.277  11.640   6.565  1.00 16.64    C
ATOM    991  O4*    C A  61    44.139  11.438   7.426  1.00 14.79    O
ATOM    992  C3*    C A  61    46.263  12.391   7.446  1.00 17.63    C
ATOM    993  O3*    C A  61    47.139  13.091   6.584  1.00 20.87    O
ATOM    994  C2*    C A  61    45.331  13.335   8.203  1.00 16.43    C
ATOM    995  O2*    C A  61    44.852  14.369   7.365  1.00 14.86    O
ATOM    996  C1*    C A  61    44.138  12.417   8.454  1.00 13.94    C
ATOM    997  N1     C A  61    44.153  11.729   9.750  1.00 13.10    N
ATOM    998  C2     C A  61    43.580  12.368   10.847 1.00 12.09    C
ATOM    999  O2     C A  61    43.175  13.525   10.710 1.00 13.24    O
ATOM    1000 N3     C A  61    43.489  11.711   12.021 1.00 11.67    N
ATOM    1001 C4     C A  61    43.975  10.468   12.138 1.00 12.40    C
ATOM    1002 N4     C A  61    43.831  9.835    13.322 1.00 12.14    N
ATOM    1003 C5     C A  61    44.626  9.812    11.054 1.00 12.01    C
ATOM    1004 C6     C A  61    44.688  10.474   9.885  1.00 12.81    C
ATOM    1005 P      G A  62    48.728  12.846   6.660  1.00 24.16    P
ATOM    1006 O1P    G A  62    49.270  13.445   5.410  1.00 23.67    O
ATOM    1007 O2P    G A  62    48.943  11.426   6.942  1.00 23.26    O
ATOM    1008 O5*    G A  62    49.205  13.690   7.911  1.00 26.62    O
ATOM    1009 C5*    G A  62    50.589  13.855   8.182  1.00 30.96    C
ATOM    1010 C4*    G A  62    50.774  14.353   9.582  1.00 33.50    C
ATOM    1011 O4*    G A  62    50.528  13.270   10.506 1.00 33.47    O
ATOM    1012 C3*    G A  62    52.218  14.771   9.809  1.00 34.85    C
ATOM    1013 O3*    G A  62    52.203  15.955   10.570 1.00 37.99    O
ATOM    1014 C2*    G A  62    52.906  13.588   10.482 1.00 34.23    C
ATOM    1015 O2*    G A  62    53.808  13.966   11.496 1.00 36.44    O
ATOM    1016 C1*    G A  62    51.721  12.929   11.174 1.00 33.41    C
ATOM    1017 N9     G A  62    51.722  11.510   11.492 1.00 31.26    N
ATOM    1018 C8     G A  62    52.117  10.448   10.718 1.00 31.91    C
ATOM    1019 N7     G A  62    51.933  9.296    11.308 1.00 31.27    N
ATOM    1020 C5     G A  62    51.407  9.628    12.552 1.00 30.56    C
ATOM    1021 C6     G A  62    50.995  8.807    13.633 1.00 31.34    C
ATOM    1022 O6     G A  62    51.018  7.569    13.717 1.00 32.16    O
ATOM    1023 N1     G A  62    50.498  9.572    14.697 1.00 30.15    N
ATOM    1024 C2     G A  62    50.401  10.940   14.706 1.00 26.83    C
ATOM    1025 N2     G A  62    49.859  11.501   15.789 1.00 25.94    N
ATOM    1026 N3     G A  62    50.792  11.704   13.717 1.00 28.92    N
ATOM    1027 C4     G A  62    51.277  10.988   12.677 1.00 30.49    C
ATOM    1028 P      U A  63    52.954  17.235   10.045 1.00 41.73    P
ATOM    1029 O1P    U A  63    53.058  17.081   8.559  1.00 41.63    O
ATOM    1030 O2P    U A  63    54.175  17.334   10.869 1.00 43.38    O
ATOM    1031 O5*    U A  63    51.997  18.439   10.460 1.00 39.87    O
ATOM    1032 C5*    U A  63    50.763  18.720   9.780  1.00 36.71    C
ATOM    1033 C4*    U A  63    49.836  19.408   10.747 1.00 35.04    C
ATOM    1034 O4*    U A  63    49.068  18.411   11.462 1.00 32.03    O
ATOM    1035 C3*    U A  63    50.675  20.143   11.781 1.00 35.26    C
ATOM    1036 O3*    U A  63    50.995  21.511   11.420 1.00 38.70    O
ATOM    1037 C2*    U A  63    50.130  19.755   13.165 1.00 33.49    C
ATOM    1038 O2*    U A  63    49.712  20.770   14.049 1.00 37.02    O
ATOM    1039 C1*    U A  63    49.029  18.735   12.834 1.00 30.93    C
ATOM    1040 N1     U A  63    48.986  17.488   13.615 1.00 27.66    N
ATOM    1041 C2     U A  63    48.353  17.544   14.818 1.00 24.66    C
ATOM    1042 O2     U A  63    47.901  18.573   15.248 1.00 22.79    O
ATOM    1043 N3     U A  63    48.278  16.352   15.499 1.00 23.74    N
ATOM    1044 C4     U A  63    48.798  15.145   15.102 1.00 23.73    C
ATOM    1045  O4    U A  63    48.743  14.175    15.859  1.00 24.68    O
ATOM    1046  C5    U A  63    49.463  15.178    13.841  1.00 24.93    C
ATOM    1047  C6    U A  63    49.531  16.320    13.160  1.00 25.63    C
ATOM    1048  P     A A  64    49.882  22.684    11.491  1.00 37.56    P
ATOM    1049  O1P   A A  64    50.561  23.954    11.785  1.00 39.16    O
ATOM    1050  O2P   A A  64    48.748  22.257    12.335  1.00 40.01    O
ATOM    1051  O5*   A A  64    49.353  22.820    9.997   1.00 34.07    O
ATOM    1052  C5*   A A  64    48.031  23.290    9.741   1.00 28.17    C
ATOM    1053  C4*   A A  64    47.481  22.620    8.508   1.00 24.51    C
ATOM    1054  O4*   A A  64    47.732  21.200    8.571   1.00 23.04    O
ATOM    1055  C3*   A A  64    45.992  22.796    8.296   1.00 22.46    C
ATOM    1056  O3*   A A  64    45.849  23.906    7.425   1.00 20.90    O
ATOM    1057  C2*   A A  64    45.604  21.505    7.587   1.00 20.89    C
ATOM    1058  O2*   A A  64    45.901  21.599    6.225   1.00 22.90    O
ATOM    1059  C1*   A A  64    46.571  20.494    8.203   1.00 20.25    C
ATOM    1060  N9    A A  64    46.130  19.781    9.396   1.00 17.85    N
ATOM    1061  C8    A A  64    45.524  20.267    10.530  1.00 16.44    C
ATOM    1062  N7    A A  64    45.377  19.367    11.477  1.00 16.36    N
ATOM    1063  C5    A A  64    45.897  18.211    10.916  1.00 16.10    C
ATOM    1064  C6    A A  64    46.056  16.912    11.416  1.00 17.55    C
ATOM    1065  N6    A A  64    45.703  16.547    12.661  1.00 17.95    N
ATOM    1066  N1    A A  64    46.602  15.982    10.594  1.00 16.51    N
ATOM    1067  C2    A A  64    46.978  16.359    9.358   1.00 17.36    C
ATOM    1068  N3    A A  64    46.889  17.563    8.781   1.00 17.52    N
ATOM    1069  C4    A A  64    46.333  18.447    9.623   1.00 16.65    C
ATOM    1070  P     A A  65    44.523  24.788    7.455   1.00 26.00    P
ATOM    1071  O1P   A A  65    44.761  25.977    6.601   1.00 22.85    O
ATOM    1072  O2P   A A  65    44.095  24.965    8.870   1.00 23.33    O
ATOM    1073  O5*   A A  65    43.412  23.897    6.726   1.00 21.03    O
ATOM    1074  C5*   A A  65    43.457  23.677    5.321   1.00 18.24    C
ATOM    1075  C4*   A A  65    42.507  22.569    4.928   1.00 13.85    C
ATOM    1076  O4*   A A  65    42.806  21.347    5.676   1.00  12.93   O
ATOM    1077  C3*   A A  65    41.079  22.964    5.312   1.00 13.37    C
ATOM    1078  O3*   A A  65    40.259  22.339    4.329   1.00 13.50    O
ATOM    1079  C2*   A A  65    40.840  22.298    6.671   1.00 12.65    C
ATOM    1080  O2*   A A  65    39.528  21.867    6.921   1.00 13.66    O
ATOM    1081  C1*   A A  65    41.701  21.055    6.509   1.00 12.78    C
ATOM    1082  N9    A A  65    42.072  20.249    7.661   1.00 12.77    N
ATOM    1083  C8    A A  65    42.096  20.565    8.995   1.00 12.34    C
ATOM    1084  N7    A A  65    42.398  19.546    9.767   1.00 12.41    N
ATOM    1085  C5    A A  65    42.597  18.501    8.875   1.00 12.05    C
ATOM    1086  C6    A A  65    42.910  17.149    9.070   1.00 10.90    C
ATOM    1087  N6    A A  65    43.092  16.609    10.272  1.00 10.50    N
ATOM    1088  N1    A A  65    43.027  16.366    7.977   1.00 11.90    N
ATOM    1089  C2    A A  65    42.832  16.924    6.765   1.00 12.11    C
ATOM    1090  N3    A A  65    42.525  18.188    6.460   1.00 11.24    N
ATOM    1091  C4    A A  65    42.420  18.925    7.577   1.00 11.53    C
ATOM    1092  P     A A  66    39.022  23.077    3.643   1.00 14.28    P
ATOM    1093  O1P   A A  66    39.543  23.558    2.325   1.00 15.32    O
ATOM    1094  O2P   A A  66    38.338  24.024    4.542   1.00 14.63    O
ATOM    1095  O5*   A A  66    38.069  21.846    3.338   1.00 13.61    O
ATOM    1096  C5*   A A  66    37.465  21.085    4.393   1.00 11.48    C
ATOM    1097  C4*   A A  66    37.723  19.608    4.177   1.00 10.84    C
ATOM    1098  O4*   A A  66    39.051  19.241    4.669   1.00 10.26    O
ATOM    1099  C3*   A A  66    36.836  18.669    4.967   1.00 10.58    C
ATOM    1100  O3*   A A  66    35.542  18.590    4.389   1.00  8.43    O
ATOM    1101  C2*   A A  66    37.616  17.369    4.831   1.00 10.04    C
ATOM    1102  O2*   A A  66    37.536  16.826    3.529   1.00 11.06    O
ATOM    1103  C1*   A A  66    39.042  17.870    5.094   1.00 10.87    C
ATOM    1104  N9     A A  66    39.240   17.798    6.548  1.00  10.17   N
ATOM    1105  C8     A A  66    39.155   18.790    7.496  1.00  10.03   C
ATOM    1106  N7     A A  66    39.261   18.348    8.733  1.00  8.56    N
ATOM    1107  C5     A A  66    39.441   16.982    8.588  1.00  6.54    C
ATOM    1108  C6     A A  66    39.556   15.933    9.533  1.00  10.49   C
ATOM    1109  N6     A A  66    39.492   16.109    10.872 1.00  8.52    N
ATOM    1110  N1     A A  66    39.716   14.683    9.059  1.00  10.25   N
ATOM    1111  C2     A A  66    39.726   14.497    7.720  1.00  9.28    C
ATOM    1112  N3     A A  66    39.599   15.400    6.739  1.00  6.99    N
ATOM    1113  C4     A A  66    39.470   16.634    7.247  1.00  7.89    C
ATOM    1114  P      U A  67    34.254   18.628    5.328  1.00  7.15    P
ATOM    1115  O1P    U A  67    33.113   18.369    4.451  1.00  8.19    O
ATOM    1116  O2P    U A  67    34.265   19.889    6.140  1.00  10.54   O
ATOM    1117  O5*    U A  67    34.515   17.404    6.352  1.00  9.66    O
ATOM    1118  C5*    U A  67    33.879   16.134    6.178  1.00  9.63    C
ATOM    1119  C4*    U A  67    34.826   15.139    5.537  1.00  8.56    C
ATOM    1120  O4*    U A  67    36.010   14.944    6.353  1.00  11.36   O
ATOM    1121  C3*    U A  67    34.231   13.746    5.426  1.00  10.38   C
ATOM    1122  O3*    U A  67    33.422   13.688    4.257  1.00  9.95    O
ATOM    1123  C2*    U A  67    35.473   12.885    5.331  1.00  9.97    C
ATOM    1124  O2*    U A  67    36.048   13.024    4.062  1.00  9.19    O
ATOM    1125  C1*    U A  67    36.395   13.578    6.337  1.00  11.42   C
ATOM    1126  N1     U A  67    36.318   13.066    7.718  1.00  10.80   N
ATOM    1127  C2     U A  67    36.833   11.817    7.968  1.00  10.50   C
ATOM    1128  O2     U A  67    37.312   11.117    7.101  1.00  10.56   O
ATOM    1129  N3     U A  67    36.765   11.408    9.272  1.00  9.20    N
ATOM    1130  C4     U A  67    36.239   12.104    10.335 1.00  13.14   C
ATOM    1131  O4     U A  67    36.155   11.549    11.435 1.00  12.19   O
ATOM    1132  C5     U A  67    35.717   13.400    10.002 1.00  12.31   C
ATOM    1133  C6     U A  67    35.767   13.822    8.734  1.00  11.37   C
ATOM    1134  P      G A  68    32.112   12.788    4.239  1.00  10.90   P
ATOM    1135  O1P    G A  68    31.468   12.906    2.896  1.00  11.43   O
ATOM    1136  O2P    G A  68    31.302   13.053    5.442  1.00  13.26   O
ATOM    1137  O5*    G A  68    32.721   11.308    4.326  1.00  11.48   O
ATOM    1138  C5*    G A  68    33.371   10.739    3.203  1.00  11.16   C
ATOM    1139  C4*    G A  68    33.998    9.411    3.573  1.00  9.62    C
ATOM    1140  O4*    G A  68    34.942    9.616    4.645  1.00  11.01   O
ATOM    1141  C3*    G A  68    33.037    8.390    4.142  1.00  11.11   C
ATOM    1142  O3*    G A  68    32.398    7.725    3.054  1.00  10.48   O
ATOM    1143  C2*    G A  68    33.998    7.461    4.874  1.00  9.29    C
ATOM    1144  O2*    G A  68    34.735    6.677    3.982  1.00  10.62   O
ATOM    1145  C1*    G A  68    34.963    8.466    5.487  1.00  8.97    C
ATOM    1146  N9     G A  68    34.546    8.820    6.844  1.00  8.81    N
ATOM    1147  C8     G A  68    33.966    9.976    7.304  1.00  8.53    C
ATOM    1148  N7     G A  68    33.723    9.947    8.594  1.00  8.57    N
ATOM    1149  C5     G A  68    34.195    8.708    9.005  1.00  7.34    C
ATOM    1150  C6     G A  68    34.222    8.109    10.303 1.00  6.86    C
ATOM    1151  O6     G A  68    33.892    8.610    11.385 1.00  8.26    O
ATOM    1152  N1     G A  68    34.707    6.806    10.256 1.00  5.47    N
ATOM    1153  C2     G A  68    35.136    6.164    9.113  1.00  7.70    C
ATOM    1154  N2     G A  68    35.520    4.887    9.242  1.00  7.97    N
ATOM    1155  N3     G A  68    35.166    6.729    7.911  1.00  8.25    N
ATOM    1156  C4     G A  68    34.676    7.991    7.934  1.00  8.75    C
ATOM    1157  P      U A  69    30.971    7.049    3.252  1.00  13.77   P
ATOM    1158  O1P    U A  69    30.555    6.595    1.924  1.00  11.85   O
ATOM    1159  O2P    U A  69    30.093    7.968    3.998  1.00  12.81   O
ATOM    1160  O5*    U A  69    31.231    5.779    4.195  1.00  11.34   O
ATOM    1161  C5*    U A  69    32.060    4.700    3.787  1.00  11.10   C
ATOM    1162  C4*    U A  69    32.278    3.754    4.958  1.00  9.72    C
ATOM    1163  O4*   U A  69    33.037    4.436    6.006  1.00 8.84    O
ATOM    1164  C3*   U A  69    31.010    3.319    5.663  1.00 8.43    C
ATOM    1165  O3*   U A  69    30.409    2.218    4.976  1.00 10.14   O
ATOM    1166  C2*   U A  69    31.556    2.908    7.017  1.00 8.62    C
ATOM    1167  O2*   U A  69    32.248    1.685    6.931  1.00 7.78    O
ATOM    1168  C1*   U A  69    32.576    4.009    7.273  1.00 8.22    C
ATOM    1169  N1    U A  69    32.004    5.162    7.979  1.00 10.18   N
ATOM    1170  C2    U A  69    31.922    5.065    9.360  1.00 10.69   C
ATOM    1171  O2    U A  69    32.209    4.017    9.964  1.00 11.15   O
ATOM    1172  N3    U A  69    31.478    6.210    10.003 1.00 9.29    N
ATOM    1173  C4    U A  69    31.088    7.405    9.411  1.00 9.74    C
ATOM    1174  O4    U A  69    30.787    8.391    10.131 1.00 10.59   O
ATOM    1175  C5    U A  69    31.145    7.399    7.972  1.00 8.22    C
ATOM    1176  C6    U A  69    31.587    6.303    7.317  1.00 8.57    C
ATOM    1177  P     C A  70    28.841    1.987    5.039  1.00 11.98   P
ATOM    1178  O1P   C A  70    28.566    1.076    3.893  1.00 13.06   O
ATOM    1179  O2P   C A  70    28.126    3.300    5.133  1.00 13.69   O
ATOM    1180  O5*   C A  70    28.566    1.234    6.428  1.00 12.93   O
ATOM    1181  C5*   C A  70    29.111    -0.064   6.679  1.00 12.54   C
ATOM    1182  C4*   C A  70    29.095    -0.367   8.163  1.00 10.94   C
ATOM    1183  O4*   C A  70    29.877    0.624    8.879  1.00 12.72   O
ATOM    1184  C3*   C A  70    27.735    -0.325   8.854  1.00 11.39   C
ATOM    1185  O3*   C A  70    27.050    -1.575   8.672  1.00 10.71   O
ATOM    1186  C2*   C A  70    28.156    -0.164   10.305 1.00 10.22   C
ATOM    1187  O2*   C A  70    28.682    -1.378   10.815 1.00 10.73   O
ATOM    1188  C1*   C A  70    29.319    0.816    10.169 1.00 10.56   C
ATOM    1189  N1    C A  70    28.918    2.231    10.310 1.00 10.87   N
ATOM    1190  C2    C A  70    28.815    2.754    11.585 1.00 10.52   C
ATOM    1191  O2    C A  70    28.888    1.981    12.549 1.00 13.89   O
ATOM    1192  N3    C A  70    28.618    4.069    11.750 1.00 9.90    N
ATOM    1193  C4    C A  70    28.472    4.864    10.678 1.00 11.60   C
ATOM    1194  N4    C A  70    28.339    6.173    10.891 1.00 9.69    N
ATOM    1195  C5    C A  70    28.469    4.342    9.351  1.00 9.75    C
ATOM    1196  C6    C A  70    28.697    3.027    9.213  1.00 10.87   C
ATOM    1197  P     C A  71    25.506    -1.596   8.258  1.00 11.56   P
ATOM    1198  O1P   C A  71    25.252    -2.969   7.708  1.00 11.38   O
ATOM    1199  O2P   C A  71    25.231    -0.392   7.422  1.00 13.37   O
ATOM    1200  O5*   C A  71    24.680    -1.449   9.614  1.00 10.61   O
ATOM    1201  C5*   C A  71    24.617    -2.546   10.513 1.00 10.38   C
ATOM    1202  C4*   C A  71    24.552    -2.068   11.939 1.00 10.89   C
ATOM    1203  O4*   C A  71    25.639    -1.140   12.164 1.00 10.86   O
ATOM    1204  C3*   C A  71    23.336    -1.255   12.362 1.00 11.86   C
ATOM    1205  O3*   C A  71    22.249    -2.098   12.693 1.00 11.40   O
ATOM    1206  C2*   C A  71    23.864    -0.579   13.618 1.00 11.64   C
ATOM    1207  O2*   C A  71    23.975    -1.513   14.691 1.00 9.30    O
ATOM    1208  C1*   C A  71    25.263    -0.193   13.149 1.00 10.57   C
ATOM    1209  N1    C A  71    25.248    1.161    12.548 1.00 9.67    N
ATOM    1210  C2    C A  71    25.243    2.271    13.429 1.00 10.84   C
ATOM    1211  O2    C A  71    25.179    2.052    14.671 1.00 11.11   O
ATOM    1212  N3    C A  71    25.283    3.534    12.917 1.00 8.57    N
ATOM    1213  C4    C A  71    25.271    3.710    11.589 1.00 9.43    C
ATOM    1214  N4    C A  71    25.262    4.948    11.132 1.00 6.44    N
ATOM    1215  C5    C A  71    25.247    2.602    10.671 1.00 6.94    C
ATOM    1216  C6    C A  71    25.240    1.353    11.196 1.00 9.46    C
ATOM    1217  P     G A  72    20.758    -1.542   12.563 1.00 13.41   P
ATOM    1218  O1P   G A  72    19.842    -2.631   12.899 1.00 12.96   O
ATOM    1219  O2P   G A  72    20.611    -0.780   11.263 1.00 11.63   O
ATOM    1220  O5*   G A  72    20.616    -0.447   13.712 1.00 11.41   O
ATOM    1221  C5*   G A  72    20.561    -0.840   15.068 1.00 11.53   C
ATOM    1222  C4*   G A  72    20.555    0.380  15.949  1.00 11.87    C
ATOM    1223  O4*   G A  72    21.770    1.139  15.712  1.00 14.46    O
ATOM    1224  C3*   G A  72    19.437    1.364  15.661  1.00 14.43    C
ATOM    1225  O3*   G A  72    18.278    0.935  16.376  1.00 16.44    O
ATOM    1226  C2*   G A  72    20.016    2.654  16.228  1.00 13.97    C
ATOM    1227  O2*   G A  72    19.907    2.695  17.643  1.00 15.21    O
ATOM    1228  C1*   G A  72    21.489    2.520  15.826  1.00 12.65    C
ATOM    1229  N9    G A  72    21.759    3.170  14.550  1.00 12.14    N
ATOM    1230  C8    G A  72    21.856    2.616  13.294  1.00 9.16     C
ATOM    1231  N7    G A  72    22.026    3.517  12.353  1.00 11.34    N
ATOM    1232  C5    G A  72    22.061    4.729  13.040  1.00 10.76    C
ATOM    1233  C6    G A  72    22.202    6.078  12.562  1.00 11.86    C
ATOM    1234  O6    G A  72    22.341    6.488  11.391  1.00 8.38     O
ATOM    1235  N1    G A  72    22.159    6.993  13.612  1.00 11.84    N
ATOM    1236  C2    G A  72    21.999    6.663  14.947  1.00 13.77    C
ATOM    1237  N2    G A  72    21.950    7.693  15.815  1.00 9.84     N
ATOM    1238  N3    G A  72    21.887    5.422  15.393  1.00 11.48    N
ATOM    1239  C4    G A  72    21.919    4.522  14.396  1.00 11.62    C
ATOM    1240  P     A A  73    16.809    1.286  15.834  1.00 19.26    P
ATOM    1241  O1P   A A  73    15.885    0.363  16.510  1.00 22.32    O
ATOM    1242  O2P   A A  73    16.775    1.381  14.361  1.00 19.69    O
ATOM    1243  O5*   A A  73    16.569    2.740  16.433  1.00 17.72    O
ATOM    1244  C5*   A A  73    15.307    3.388  16.323  1.00 17.97    C
ATOM    1245  C4*   A A  73    15.431    4.809  16.822  1.00 17.32    C
ATOM    1246  O4*   A A  73    16.427    5.494  16.024  1.00 16.54    O
ATOM    1247  C3*   A A  73    14.189    5.661  16.679  1.00 17.30    C
ATOM    1248  O3*   A A  73    13.363    5.484  17.811  1.00 18.59    O
ATOM    1249  C2*   A A  73    14.773    7.060  16.630  1.00 17.35    C
ATOM    125O  O2*   A A  73    15.216    7.464  17.913  1.00 16.54    O
ATOM    1251  C1*   A A  73    16.012    6.819  15.770  1.00 15.89    C
ATOM    1252  N9    A A  73    15.791    6.944  14.334  1.00 13.91    N
ATOM    1253  C8    A A  73    15.673    5.940  13.408  1.00 13.93    C
ATOM    1254  N7    A A  73    15.535    6.370  12.180  1.00 14.00    N
ATOM    1255  C5    A A  73    15.532    7.754  12.312  1.00 13.79    C
ATOM    1256  C6    A A  73    15.406    8.788  11.378  1.00 15.44    C
ATOM    1257  N6    A A  73    15.244    8.581  10.068  1.00 13.32    N
ATOM    1258  N1    A A  73    15.451    10.062 11.840  1.00 14.22    N
ATOM    1259  C2    A A  73    15.592    10.262 13.158  1.00 14.69    C
ATOM    1260  N3    A A  73    15.706    9.369  14.134  1.00 14.25    N
ATOM    1261  C4    A A  73    15.679    8.119  13.634  1.00 14.11    C
ATOM    1262  P     C A  74    11.774    5.640  17.658  1.00 19.05    P
ATOM    1263  O1P   C A  74    11.240    5.400  19.022  1.00 21.21    O
ATOM    1264  O2P   C A  74    11.309    4.816  16.524  1.00 18.62    O
ATOM    1265  O5*   C A  74    11.567    7.165  17.261  1.00 17.10    O
ATOM    1266  C5*   C A  74    11.953    8.213  18.140  1.00 16.41    C
ATOM    1267  C4*   C A  74    11.888    9.522  17.409  1.00 18.55    C
ATOM    1268  O4*   C A  74    12.836    9.487  16.307  1.00 18.29    O
ATOM    1269  C3*   C A  74    10.569    9.816  16.709  1.00 19.36    C
ATOM    1270  O3*   C A  74    9.611     10.304 17.650  1.00 19.83    O
ATOM    1271  C2*   C A  74    11.008    10.851 15.678  1.00 18.77    C
ATOM    1272  O2*   C A  74    11.287    12.128 16.243  1.00 19.03    O
ATOM    1273  C1*   C A  74    12.342    10.257 15.224  1.00 15.75    C
ATOM    1274  N1    C A  74    12.235    9.391  14.042  1.00 14.65    N
ATOM    1275  C2    C A  74    12.221    9.987  12.789  1.00 15.39    C
ATOM    1276  O2    C A  74    12.225    11.231 12.722  1.00 14.36    O
ATOM    1277  N3    C A  74    12.192    9.204  11.677  1.00 14.56    N
ATOM    1278  C4    C A  74    12.165    7.877  11.801  1.00 13.56    C
ATOM    1279  N4    C A  74    12.187    7.143  10.683  1.00 13.38    N
ATOM    1280  C5    C A  74    12.130    7.241  13.078  1.00 15.04    C
ATOM    1281  C6     C A  74    12.167 8.030   14.162  1.00 12.74    C
ATOM    1282  P      U A  75    8.046  10.090  17.379  1.00 20.97    P
ATOM    1283  O1P    U A  75    7.326  10.728  18.515  1.00 20.97    O
ATOM    1284  O2P    U A  75    7.770  8.678   17.051  1.00 19.40    O
ATOM    1285  O5*    U A  75    7.759  10.948  16.067  1.00 19.78    O
ATOM    1286  C5*    U A  75    7.940  12.353  16.067  1.00 19.76    C
ATOM    1287  C4*    U A  75    7.692  12.920  14.689  1.00 19.28    C
ATOM    1288  O4*    U A  75    8.781  12.515  13.804  1.00 19.26    O
ATOM    1289  C3*    U A  75    6.437  12.422  13.980  1.00 19.85    C
ATOM    1290  O3*    U A  75    5.251  13.115  14.372  1.00 21.73    O
ATOM    1291  C2*    U A  75    6.784  12.675  12.521  1.00 18.07    C
ATOM    1292  O2*    U A  75    6.648  14.044  12.198  1.00 18.55    O
ATOM    1293  C1*    U A  75    8.269  12.294  12.503  1.00 18.72    C
ATOM    1294  N1     U A  75    8.444  10.876  12.155  1.00 16.03    N
ATOM    1295  C2     U A  75    8.528  10.591  10.821  1.00 14.55    C
ATOM    1296  O2     U A  75    8.474  11.463  9.960   1.00 16.34    O
ATOM    1297  N3     U A  75    8.689  9.269   10.515  1.00 14.24    N
ATOM    1298  C4     U A  75    8.798  8.233   11.389  1.00 14.08    C
ATOM    1299  O4     U A  75    9.094  7.130   10.954  1.00 15.54    O
ATOM    1300  C5     U A  75    8.693  8.599   12.769  1.00 14.83    C
ATOM    1301  C6     U A  75    8.516  9.890   13.096  1.00 15.06    C
ATOM    1302  P      A A  76    3.836  12.353  14.321  1.00 22.14    P
ATOM    1303  O1P    A A  76    2.880  13.223  15.033  1.00 23.41    O
ATOM    1304  O2P    A A  76    4.009  10.938  14.753  1.00 21.70    O
ATOM    1305  O5*    A A  76    3.415  12.341  12.788  1.00 21.20    O
ATOM    1306  C5*    A A  76    3.300  13.552  12.057  1.00 20.43    C
ATOM    1307  C4*    A A  76    2.982  13.261  10.610  1.00 21.53    C
ATOM    1308  O4*    A A  76    4.176  12.824  9.881   1.00 20.76    O
ATOM    1309  C3*    A A  76    1.979  12.147  10.385  1.00 21.60    C
ATOM    1310  O3*    A A  76    0.644  12.615  10.600  1.00 24.70    O
ATOM    1311  C2*    A A  76    2.288  11.751  8.942   1.00 20.85    C
ATOM    1312  O2*    A A  76    1.813  12.741  8.049   1.00 18.38    O
ATOM    1313  C1*    A A  76    3.818  11.834  8.924   1.00 18.33    C
ATOM    1314  N9     A A  76    4.448  10.557  9.291   1.00 18.89    N
ATOM    1315  C8     A A  76    4.743  10.092  10.543  1.00 18.84    C
ATOM    1316  N7     A A  76    5.292  8.890   10.552  1.00 19.05    N
ATOM    1317  C5     A A  76    5.370  8.549   9.213   1.00 17.84    C
ATOM    1318  C6     A A  76    5.873  7.410   8.545   1.00 18.46    C
ATOM    1319  N6     A A  76    6.430  6.353   9.151   1.00 16.69    N
ATOM    1320  N1     A A  76    5.789  7.395   7.198   1.00 18.58    N
ATOM    1321  C2     A A  76    5.262  8.451   6.577   1.00 18.00    C
ATOM    1322  N3     A A  76    4.779  9.581   7.089   1.00 17.69    N
ATOM    1323  C4     A A  76    4.855  9.566   8.424   1.00 18.36    C
ATOM    1324  P      U A  77    -0.490 11.589  11.092  1.00 27.25    P
ATOM    1325  O1P    U A  77    -1.718 12.394  11.304  1.00 28.56    O
ATOM    1326  O2P    U A  77    0.014  10.721  12.181  1.00 27.58    O
ATOM    1327  O5*    U A  77    -0.735 10.633  9.847   1.00 26.15    O
ATOM    1328  C5*    U A  77    -1.346 11.123  8.674   1.00 27.17    C
ATOM    1329  C4*    U A  77    -1.337 10.063  7.612   1.00 28.07    C
ATOM    1330  O4*    U A  77    0.040  9.755   7.267   1.00 27.42    O
ATOM    1331  C3*    U A  77    -1.901 8.720   8.045   1.00 28.00    C
ATOM    1332  O3*    U A  77    -3.318 8.669   7.947   1.00 29.45    O
ATOM    1333  C2*    U A  77    -1.240 7.775   7.055   1.00 28.20    C
ATOM    1334  O2*    U A  77    -1.847 7.832   5.782   1.00 26.90    O
ATOM    1335  C1*    U A  77    0.157  8.381   6.958   1.00 27.65    C
ATOM    1336  N1     U A  77    1.088  7.745   7.899   1.00 27.42    N
ATOM    1337  C2     U A  77    1.698  6.593   7.466   1.00 27.52    C
ATOM    1338  O2     U A  77    1.493  6.121   6.373   1.00 28.51    O
ATOM    1339  N3     U A  77    2.553  6.005   8.360   1.00 28.43    N
ATOM    1340  C4     U A  77    2.855   6.437    9.623  1.00 27.99    C
ATOM    1341  O4     U A  77    3.638   5.774    10.307 1.00 28.56    O
ATOM    1342  C5     U A  77    2.183   7.651    10.018 1.00 29.06    C
ATOM    1343  C6     U A  77    1.340   8.252    9.153  1.00 27.47    C
ATOM    1344  P      G A  78    -4.128  7.571    8.789  1.00 29.69    P
ATOM    1345  O1P    G A  78    -5.574  7.922    8.682  1.00 29.99    O
ATOM    1346  O2P    G A  78    -3.493  7.464    10.125 1.00 29.83    O
ATOM    1347  O5*    G A  78    -3.864  6.206    8.025  1.00 28.85    O
ATOM    1348  C5*    G A  78    -4.288  6.057    6.687  1.00 31.49    C
ATOM    1349  C4*    G A  78    -3.746  4.786    6.103  1.00 33.11    C
ATOM    1350  O4*    G A  78    -2.290  4.821    6.141  1.00 32.92    O
ATOM    1351  C3*    G A  78    -4.069  3.537    6.904  1.00 34.56    C
ATOM    1352  O3*    G A  78    -5.382  3.042    6.685  1.00 36.42    O
ATOM    1353  C2*    G A  78    -2.993  2.572    6.437  1.00 33.46    C
ATOM    1354  O2*    G A  78    -3.300  2.058    5.155  1.00 33.17    O
ATOM    1355  C1*    G A  78    -1.788  3.506    6.335  1.00 32.77    C
ATOM    1356  N9     G A  78    -0.943  3.484    7.528  1.00 31.48    N
ATOM    1357  C8     G A  78    -0.885  4.406    8.552  1.00 30.74    C
ATOM    1358  N7     G A  78    0.017   4.111    9.453  1.00 30.41    N
ATOM    1359  C5     G A  78    0.574   2.921    9.000  1.00 30.92    C
ATOM    1360  C6     G A  78    1.605   2.117    9.547  1.00 30.88    C
ATOM    1361  O6     G A  78    2.260   2.301    10.569 1.00 31.93    O
ATOM    1362  N1     G A  78    1.852   0.992    8.763  1.00 31.31    N
ATOM    1363  C2     G A  78    1.200   0.683    7.596  1.00 31.42    C
ATOM    1364  N2     G A  78    1.576   -0.452   6.973  1.00 31.76    N
ATOM    1365  N3     G A  78    0.244   1.429    7.073  1.00 31.87    N
ATOM    1366  C4     G A  78    -0.017  2.521    7.822  1.00 30.78    C
ATOM    1367  P      U A  79    -6.043  2.064    7.771  1.00 35.59    P
ATOM    1368  O1P    U A  79    -7.437  1.843    7.318  1.00 38.84    O
ATOM    1369  O2P    U A  79    -5.793  2.598    9.125  1.00 34.83    O
ATOM    1370  O5*    U A  79    -5.233  0.710    7.607  1.00 37.13    O
ATOM    1371  C5*    U A  79    -5.230  0.014    6.370  1.00 40.35    C
ATOM    1372  C4*    U A  79    -4.500  -1.284   6.529  1.00 42.63    C
ATOM    1373  O4*    U A  79    -3.087  -1.022   6.688  1.00 41.91    O
ATOM    1374  C3*    U A  79    -4.878  -2.028   7.794  1.00 45.01    C
ATOM    1375  O3*    U A  79    -6.059  -2.771   7.564  1.00 49.49    O
ATOM    1376  C2*    U A  79    -3.652  -2.897   8.039  1.00 42.79    C
ATOM    1377  O2*    U A  79    -3.632  -4.039   7.212  1.00 43.51    O
ATOM    1378  C1*    U A  79    -2.530  -1.946   7.614  1.00 41.31    C
ATOM    1379  N1     U A  79    -1.962  -1.177   8.732  1.00 38.39    N
ATOM    1380  C2     U A  79    -0.932  -1.753   9.457  1.00 38.66    C
ATOM    1381  O2     U A  79    -0.492  -2.866   9.215  1.00 38.18    O
ATOM    1382  N3     U A  79    -0.438  -0.978   10.475 1.00 36.92    N
ATOM    1383  C4     U A  79    -0.855  0.280    10.830 1.00 36.93    C
ATOM    1384  O4     U A  79    -0.255  0.884    11.715 1.00 36.60    O
ATOM    1385  C5     U A  79    -1.931  0.800    10.037 1.00 36.98    C
ATOM    1386  C6     U A  79    -2.432  0.070    9.043  1.00 37.15    C
ATOM    1387  P      C A  80    -6.888  -3.348   8.809  1.00 52.93    P
ATOM    1388  O1P    C A  80    -8.178  -3.837   8.240  1.00 53.20    O
ATOM    1389  O2P    C A  80    -6.901  -2.351   9.924  1.00 51.64    O
ATOM    1390  O5*    C A  80    -6.006  -4.597   9.252  1.00 53.85    O
ATOM    1391  C5*    C A  80    -6.151  -5.164   10.536 1.00 56.78    C
ATOM    1392  C4*    C A  80    -4.996  -6.079   10.826 1.00 58.70    C
ATOM    1393  O4*    C A  80    -3.764  -5.451   10.400 1.00 58.63    O
ATOM    1394  C3*    C A  80    -4.785  -6.404   12.289 1.00 60.66    C
ATOM    1395  O3*    C A  80    -5.653  -7.443   12.718 1.00 64.54    O
ATOM    1396  C2*    C A  80    -3.302  -6.748   12.328 1.00 59.49    C
ATOM    1397  O2*    C A  80    -3.012  -8.056   11.868 1.00 59.82    O
ATOM    1398  C1*    C A  80    -2.746  -5.710   11.351 1.00 57.90    C
ATOM    1399  N1  C A    80    -2.483  -4.432  12.019  1.00 56.16    N
ATOM    1400  C2  C A    80    -1.428  -4.330  12.923  1.00 55.40    C
ATOM    1401  O2  C A    80    -0.739  -5.332  13.160  1.00 55.60    O
ATOM    1402  N3  C A    80    -1.184  -3.140  13.516  1.00 54.79    N
ATOM    1403  C4  C A    80    -1.948  -2.085  13.236  1.00 54.67    C
ATOM    1404  N4  C A    80    -1.659  -0.931  13.830  1.00 54.49    N
ATOM    1405  C5  C A    80    -3.038  -2.167  12.329  1.00 55.04    C
ATOM    1406  C6  C A    80    -3.268  -3.348  11.748  1.00 55.31    C
ATOM    1407  P   C A    81    -6.452  -7.275  14.101  1.00 67.04    P
ATOM    1408  O1P C A    81    -7.534  -8.288  14.135  1.00 67.56    O
ATOM    1409  O2P C A    81    -6.793  -5.832  14.228  1.00 66.62    O
ATOM    1410  O5* C A    81    -5.356  -7.637  15.200  1.00 67.52    O
ATOM    1411  C5* C A    81    -4.468  -8.729  14.996  1.00 68.78    C
ATOM    1412  C4* C A    81    -3.176  -8.504  15.741  1.00 70.00    C
ATOM    1413  O4* C A    81    -2.545  -7.295  15.239  1.00 70.26    O
ATOM    1414  C3* C A    81    -3.315  -8.246  17.236  1.00 70.40    C
ATOM    1415  O3* C A    81    -3.607  -9.405  18.044  1.00 71.08    O
ATOM    1416  C2* C A    81    -2.027  -7.493  17.557  1.00 70.66    C
ATOM    1417  O2* C A    81    -0.891  -8.331  17.691  1.00 70.46    O
ATOM    1418  C1* C A    81    -1.866  -6.637  16.299  1.00 70.42    C
ATOM    1419  N1  C A    81    -2.395  -5.267  16.429  1.00 70.24    N
ATOM    1420  C2  C A    81    -1.749  -4.383  17.301  1.00 69.97    C
ATOM    1421  O2  C A    81    -0.778  -4.792  17.959  1.00 69.96    O
ATOM    1422  N3  C A    81    -2.199  -3.115  17.406  1.00 69.86    N
ATOM    1423  C4  C A    81    -3.253  -2.719  16.687  1.00 69.98    C
ATOM    1424  N4  C A    81    -3.655  -1.451  16.812  1.00 70.37    N
ATOM    1425  C5  C A    81    -3.940  -3.603  15.805  1.00 69.65    C
ATOM    1426  C6  C A    81    -3.483  -4.857  15.708  1.00 70.02    C
TER     1427      C A    81
HETATM  1428  N1  SPD    95    30.635  15.348  6.786   1.00 32.95    N
HETATM  1429  C2  SPD    95    29.601  15.137  7.638   1.00 34.77    C
HETATM  1430  C3  SPD    95    28.160  14.794  7.150   1.00 32.97    C
HETATM  1431  C4  SPD    95    27.154  15.912  6.737   1.00 35.47    C
HETATM  1432  C5  SPD    95    27.896  17.206  6.216   1.00 34.05    C
HETATM  1433  N6  SPD    95    28.356  18.280  7.154   1.00 35.93    N
HETATM  1434  C7  SPD    95    28.129  18.216  8.696   1.00 37.54    C
HETATM  1435  C8  SPD    95    26.699  18.358  9.285   1.00 36.82    C
HETATM  1436  C9  SPD    95    25.563  18.963  8.358   1.00 39.41    C
HETATM  1437  N10 SPD    95    24.963  18.146  7.432   1.00 38.63    N
HETATM  1438  C   ACT    96    35.752  18.872  10.859  1.00 11.75    C
HETATM  1439  O   ACT    96    35.666  18.447  12.039  1.00 12.77    O
HETATM  1440  OXT ACT    96    35.855  20.114  10.438  1.00 13.73    O
HETATM  1441  CH3 ACT    96    35.725  17.822  9.762   1.00 10.36    C
HETATM  1442  CO  NCO    101   33.779  17.811  0.520   1.00 12.16
CO
HETATM  1443  N1  NCO    101   35.628  18.020  1.035   1.00 11.26    N
HETATM  1444  N2  NCO    101   31.912  17.605  0.016   1.00 11.81    N
HETATM  1445  N3  NCO    101   34.248  16.189  -0.528  1.00 12.00    N
HETATM  1446  N4  NCO    101   33.306  19.417  1.565   1.00 12.05    N
HETATM  1447  N5  NCO    101   33.488  16.682  2.134   1.00 11.77    N
HETATM  1448  N6  NCO    101   34.079  18.927  -1.063  1.00 10.05    N
HETATM  1449  CO  NCO    102   30.972  15.538  21.040  1.00 18.89
CO
HETATM  1450  N1  NCO    102   32.077  13.978  20.540  1.00 18.01    N
HETATM  1451  N2  NCO    102   29.861  17.079  21.546  1.00 20.34    N
HETATM  1452  N3  NCO    102   29.408  14.674  20.281  1.00 18.96    N
HETATM  1453  N4  NCO    102   32.540  16.407  21.793  1.00 19.16    N
HETATM  1454  N5  NCO    102   30.622  14.700  22.802  1.00 21.31    N
HETATM  1455  N6  NCO    102   31.348  16.357  19.288  1.00 18.20    N
HETATM 1456  CO  NCO    103    30.079  10.969  13.083  1.00  9.34
CO
HETATM 1457  N1  NCO    103    31.143  9.318   12.937  1.00  10.62   N
HETATM 1458  N2  NCO    103    29.016  12.607  13.231  1.00  1047    N
HETATM 1459  N3  NCO    103    28.629  9.958   13.953  1.00  9.90    N
HETATM 1460  N4  NCO    103    31.530  11.994  12.228  1.00  11.47   N
HETATM 1461  N5  NCO    103    30.887  11.312  14.848  1.00  10.93   N
HETATM 1462  N6  NCO    103    29.293  10.591  11.335  1.00  8.96    N
HETATM 1463  CO  NCO    104    35.738  25.339  6.924   1.00  10.52
CO
HETATM 1464  N1  NCO    104    37.192  23.991  6.966   1.00  9.12    N
HETATM 1465  N2  NCO    104    34.292  26.667  6.917   1.00  9.97    N
HETATM 1466  N3  NCO    104    35.290  24.803  5.079   1.00  10.32   N
HETATM 1467  N4  NCO    104    36.200  25.850  8.782   1.00  10.04   N
HETATM 1468  N5  NCO    104    34.462  23.982  7.610   1.00  10.02   N
HETATM 1469  N6  NCO    104    36.989  26.673  6.255   1.00  9.93    N
HETATM 1470  CO  NCO    105    38.319  9.181   18.354  1.00  17.15
CO
HETATM 1471  N1  NCO    105    38.565  7.212   18.263  1.00  16.21   N
HETATM 1472  N2  NCO    105    38.063  11.131  18.455  1.00  16.52   N
HETATM 1473  N3  NCO    105    37.166  9.118   16.756  1.00  15.37   N
HETATM 1474  N4  NCO    105    39.472  9.231   19.943  1.00  15.14   N
HETATM 1475  N5  NCO    105    36.747  8.927   19.488  1.00  13.92   N
HETATM 1476  N6  NCO    105    39.894  9.428   17.221  1.00  16.03   N
HETATM 1477  CO  NCO    106    29.797  11.611  -0.683  1.00  29.10
CO
HETATM 1478  N1  NCO    106    30.133  9.996   0.412   1.00  26.22   N
HETATM 1479  N2  NCO    106    29.459  13.224  -1.786  1.00  27.55   N
HETATM 1480  N3  NCO    106    27.947  10.996  -0.979  1.00  27.31   N
HETATM 1481  N4  NCO    106    31.647  12.200  -0.388  1.00  26.94   N
HETATM 1482  N5  NCO    106    29.213  12.598  0.926   1.00  26.78   N
HETATM 1483  N6  NCO    106    30.382  10.638  -2.307  1.00  27.86   N
HETATM 1484  CO  NCO    107    21.064  21.824  13.859  1.00  66.74
CO
HETATM 1485  N1  NCO    107    19.817  20.309  13.966  1.00  65.15    N
HETATM 1486  N2  NCO    107    22.316  23.350  13.744  1.00  64.75    N
HETATM 1487  N3  NCO    107    20.426  22.219  12.039  1.00  64.82    N
HETATM 1488  N4  NCO    107    21.696  21.423  15.684  1.00  65.00    N
HETATM 1489  N5  NCO    107    19.682  23.014  14.604  1.00  65.37    N
HETATM 1490  N6  NCO    107    22.448  20.636  13.116  1.00  64.84    N
HETATM 1491  CO  NCO    108    11.892  21.884  3.085   1.00  43.83
CO
HETATM 1492  N1  NCO    108    12.540  20.757  4.557   1.00  41.58    N
HETATM 1493  N2  NCO    108    11.237  23.007  1.611   1.00  41.85    N
HETATM 1494  N3  NCO    108    10.087  21.837  3.873   1.00  39.63    N
HETATM 1495  N4  NCO    108    13.697  21.930  2.306   1.00  42.07    N
HETATM 1496  N5  NCO    108    12.302  23.497  4.132   1.00  42.42    N
HETATM 1497  N6  NCO    108    11.489  20.271  2.035   1.00  42.59    N
HETATM 1498  CO  NCO    109    22.085  1.990   6.248   1.00  22.54
CO
HETATM 1499  N1  NCO    109    23.660  1.327   5.263   1.00  21.69    N
HETATM 1500  N2  NCO    109    20.512  2.641   7.231   1.00  23.54    N
HETATM 1501  N3  NCO    109    21.995  0.289   7.247   1.00  23.66    N
HETATM 1502  N4  NCO    109    22.190  3.682   5.266   1.00  24.99    N
HETATM 1503  N5  NCO    109    23.250  2.740   7.635   1.00  24.19    N
HETATM 1504  N6  NCO    109    20.916  1.236   4.862   1.00  24.71    N
HETATM 1505  CO  NCO    110    11.907  4.743   -4.202  1.00  79.10
CO
HETATM 1506  N1  NCO    110    13.089  3.173   -4.157  1.00  78.25    N
HETATM 1507  N2  NCO    110    10.722    6.317   -4.246    1.00 77.68    N
HETATM 1508  N3  NCO    110    10.338    3.559   -4.135    1.00 78.03    N
HETATM 1509  N4  NCO    110    13.479    5.919   -4.271    1.00 78.27    N
HETATM 1510  N5  NCO    110    11.939    4.818   -2.231    1.00 77.98    N
HETATM 1511  N6  NCO    110    11.872    4.671   -6.166    1.00 77.97    N
HETATM 1512  CO  NCO    111    41.881    27.688  12.825    1.00 41.44
CO
HETATM 1513  N1  NCO    111    42.431    25.789  12.719    1.00 39.32    N
HETATM 1514  N2  NCO    111    41.334    29.578  12.935    1.00 39.83    N
HETATM 1515  N3  NCO    111    40.110    27.135  13.502    1.00 38.72    N
HETATM 1516  N4  NCO    111    43.650    28.247  12.141    1.00 39.72    N
HETATM 1517  N5  NCO    111    42.556    27.780  14.672    1.00 39.67    N
HETATM 1518  N6  NCO    111    41.206    27.586  10.976    1.00 39.64    N
HETATM 1519  CO  NCO    112    15.544    -2.470  12.503    0.64 33.78
CO
HETATM 1520  N1  NCO    112    15.053    -4.150  13.387    0.64 33.08    N
HETATM 1521  N2  NCO    112    16.035    -0.799  11.617    0.64 32.88    N
HETATM 1522  N3  NCO    112    13.989    -1.592  13.306    0.64 33.14    N
HETATM 1523  N4  NCO    112    17.106    -3.351  11.708    0.64 31.89    N
HETATM 1524  N5  NCO    112    16.630    -1.966  14.059    0.64 31.87    N
HETATM 1525  N6  NCO    112    14.456    -2.963  10.949    0.64 33.59    N
HETATM 1526  N1  HPA    90     11.850    10.680  9.276     1.00 14.10    N
HETATM 1527  C2  HPA    90     11.445    12.017  9.429     1.00 15.38    C
HETATM 1528  N3  HPA    90     11.023    12.794  8.399     1.00 15.35    N
HETATM 1529  C4  HPA    90     11.032    12.144  7.215     1.00 13.23    C
HETATM 1530  C5  HPA    90     11.464    10.697  6.984     1.00 14.15    C
HETATM 1531  C6  HPA    90     11.894    9.936   8.082     1.00 14.68    C
HETATM 1532  O6  HPA    90     12.274    8.774   8.128     1.00 17.66    O
HETATM 1533  N7  HPA    90     11.319    10.452  5.646     1.00 14.57    N
HETATM 1534  C8  HPA    90     10.837    11.601  5.068     1.00 10.65    C
HETATM 1535  N9  HPA    90     10.654    12.637  5.980     1.00 13.29    N
HETATM 1536  O   HOH    301    27.846    -2.938  13.825    1.00 9.01     O
HETATM 1537  O   HOH    302    25.859    31.056  15.513    1.00 15.15    O
HETATM 1538  O   HOH    304    31.973    24.578  6.159     1.00 8.16     O
HETATM 1539  O   HOH    305    26.612    9.170   11.460    1.00 9.38     O
HETATM 1540  O   HOH    306    27.263    29.190  17.094    1.00 12.73    O
HETATM 1541  O   HOH    307    27.839    31.120  11.251    1.00 8.67     O
HETATM 1542  O   HOH    308    15.358    10.206  7.797     1.00 12.64    O
HETATM 1543  O   HOH    309    36.106    21.180  7.822     1.00 7.98     O
HETATM 1544  O   HOH    310    38.999    22.794  9.431     1.00 11.94    O
HETATM 1545  O   HOH    311    27.651    7.462   8.332     1.00 11.92    O
HETATM 1546  O   HOH    312    32.982    0.834   9.462     1.00 8.08     O
HETATM 1547  O   HOH    313    32.773    15.822  11.031    1.00 11.55    O
HETATM 1548  O   HOH    314    28.650    -0.366  14.062    1.00 14.04    O
HETATM 1549  O   HOH    315    28.295    12.130  16.348    1.00 14.09    O
HETATM 1550  O   HOH    316    35.130    20.473  16.933    1.00 11.57    O
HETATM 1551  O   HOH    317    31.081    33.340  12.189    1.00 12.95    O
HETATM 1552  O   HOH    318    34.682    19.005  19.405    1.00 15.48    O
HETATM 1553  O   HOH    319    33.063    10.330  19.697    1.00 15.28    O
HETATM 1554  O   HOH    320    33.163    29.459  16.840    1.00 13.11    O
HETATM 1555  O   HOH    321    25.367    21.927  13.760    1.00 16.06    O
HETATM 1556  O   HOH    322    37.325    28.769  8.362     1.00 10.37    O
HETATM 1557  O   HOH    323    23.452    -4.001  6.017     1.00 18.50    O
HETATM 1558  O   HOH    324    9.471     20.115  5.676     1.00 20.63    O
HETATM 1559  O   HOH    325    31.413    13.389  17.912    1.00 14.48    O
HETATM 1560  O   HOH    326    30.447    21.096  -4.264    1.00 19.06    O
HETATM 1561  O   HOH    327    29.636    28.818  15.501    1.00 7.36     O
HETATM 1562  O   HOH    328    39.664    24.428  12.189    1.00 15.97    O
HETATM 1563  O   HOH    329    31.754    11.671  9.425     1.00 10.07    O
HETATM 1564  O   HOH   330   31.792   8.455   15.807 1.00 6.64    O
HETATM 1565  O   HOH   331   31.505   23.268  17.911 1.00 11.89   O
HETATM 1566  O   HOH   332   18.453   12.462  12.598 1.00 17.54   O
HETATM 1567  O   HOH   333   18.443   26.704  16.319 1.00 25.32   O
HETATM 1568  O   HOH   334   32.785   19.986  8.347  1.00 15.97   O
HETATM 1569  O   HOH   335   41.786   5.546   14.867 1.00 15.87   O
HETATM 1570  O   HOH   336   7.409    12.505  5.270  1.00 17.89   O
HETATM 1571  O   HOH   337   21.882   4.512   9.287  1.00 19.12   O
HETATM 1572  O   HOH   338   31.187   10.298  17.815 1.00 16.86   O
HETATM 1573  O   HOH   339   26.840   32.305  5.286  1.00 19.04   O
HETATM 1574  O   HOH   340   15.679   12.782  11.026 1.00 14.61   O
HETATM 1575  O   HOH   341   25.408   5.517   8.271  1.00 14.76   O
HETATM 1576  O   HOH   342   30.043   11.328  7.160  1.00 8.77    O
HETATM 1577  O   HOH   343   23.127   14.905  8.144  1.00 14.88   O
HETATM 1578  O   HOH   344   38.365   6.804   15.177 1.00 18.36   O
HETATM 1579  O   HOH   345   35.022   29.298  5.821  1.00 14.35   O
HETATM 1580  O   HOH   346   30.511   24.456  3.612  1.00 14.15   O
HETATM 1581  O   HOH   347   30.481   34.557  3.130  1.00 11.78   O
HETATM 1582  O   HOH   348   26.554   9.913   5.375  1.00 18.81   O
HETATM 1583  O   HOH   349   31.209   21.766  3.243  1.00 18.82   O
HETATM 1584  O   HOH   350   1.741    13.549  1.745  1.00 20.27   O
HETATM 1585  O   HOH   351   29.321   2.066   1.345  1.00 21.19   O
HETATM 1586  O   HOH   352   4.877    8.231   0.914  1.00 21.48   O
HETATM 1587  O   HOH   353   21.713   1.577   10.203 1.00 20.65   O
HETATM 1588  O   HOH   354   16.006   7.690   6.859  1.00 14.39   O
HETATM 1589  O   HOH   355   32.374   14.264  8.770  1.00 13.50   O
HETATM 1590  O   HOH   356   44.956   7.126   13.453 1.00 18.02   O
HETATM 1591  O   HOH   357   34.420   0.993   5.499  1.00 15.80   O
HETATM 1592  O   HOH   358   34.107   10.687  13.188 1.00 21.21   O
HETATM 1593  O   HOH   359   43.241   16.647  21.460 1.00 20.68   O
HETATM 1594  O   HOH   360   29.177   23.123  7.231  1.00 19.78   O
HETATM 1595  O   HOH   361   20.913   10.719  -2.240 1.00 38.20   O
HETATM 1596  O   HOH   362   17.211   12.442  7.676  1.00 12.64   O
HETATM 1597  O   HOH   363   23.238   7.190   7.238  1.00 6.38    O
HETATM 1598  O   HOH   364   23.098   23.481  10.458 1.00 16.85   O
HETATM 1599  O   HOH   365   19.273   4.003   10.474 1.00 14.55   O
HETATM 1600  O   HOH   366   29.119   2.067   20.617 1.00 16.11   O
HETATM 1601  O   HOH   367   13.755   11.592  -2.619 1.00 19.43   O
HETATM 1602  O   HOH   368   27.008   15.371  13.742 1.00 16.03   O
HETATM 1603  O   HOH   370   40.117   15.541  24.855 1.00 17.75   O
HETATM 1604  O   HOH   371   42.204   24.722  15.562 1.00 20.80   O
HETATM 1605  O   HOH   372   33.334   27.064  4.009  1.00 14.27   O
HETATM 1606  O   HOH   373   34.369   22.764  -0.160 1.00 16.16   O
HETATM 1607  O   HOH   374   26.150   9.913   8.539  1.00 17.96   O
HETATM 1608  O   HOH   375   40.783   11.103  6.916  1.00 14.78   O
HETATM 1609  O   HOH   376   35.928   21.012  1.466  1.00 26.24   O
HETATM 1610  O   HOH   377   16.646   10.599  -2.661 1.00 19.58   O
HETATM 1611  O   HOH   378   25.562   13.304  6.313  1.00 18.69   O
HETATM 1612  O   HOH   379   20.343   -1.589  8.728  1.00 18.93   O
HETATM 1613  O   HOH   380   17.478   4.521   8.063  1.00 17.20   O
HETATM 1614  O   HOH   381   37.683   27.819  10.864 1.00 19.86   O
HETATM 1615  O   HOH   382   50.069   8.354   17.181 1.00 25.65   O
HETATM 1616  O   HOH   383   22.215   19.277  -1.414 1.00 21.60   O
HETATM 1617  O   HOH   384   26.899   12.793  23.127 1.00 21.66   O
HETATM 1618  O   HOH   385   27.310   20.284  5.282  1.00 23.43   O
HETATM 1619  O   HOH   386   35.477   14.521  1.832  1.00 16.09   O
HETATM 1620  O   HOH   387   36.421   5.374   5.731  1.00 18.50   O
HETATM 1621  O   HOH   388   35.657   13.089  21.646 1.00 27.43   O
HETATM 1622  O   HOH   389   31.262   -0.028  15.535 1.00 26.71   O
HETATM 1623   O    HOH    390  12.258   13.376   14.333   1.00 23.39     O
HETATM 1624   O    HOH    391  41.547   24.260   9.781    1.00 18.53     O
HETATM 1625   O    HOH    392  45.074   23.301   12.058   1.00 34.28     O
HETATM 1626   O    HOH    393  26.074   11.518   13.046   1.00 13.39     O
HETATM 1627   O    HOH    395  5.587    8.611    15.039   1.00 30.05     O
HETATM 1628   O    HOH    396  16.781   -2.191   17.148   1.00 29.65     O
HETATM 1629   O    HOH    398  39.000   -1.725   12.841   1.00 27.22     O
HETATM 1630   O    HOH    399  45.596   20.807   13.713   1.00 22.64     O
HETATM 1631   O    HOH    400  39.024   5.351    6.718    1.00 27.45     O
HETATM 1632   O    HOH    401  19.128   6.103    17.172   1.00 23.23     O
HETATM 1633   O    HOH    402  -2.414   15.769   -5.977   1.00 28.56     O
HETATM 1634   O    HOH    404  35.863   1.066    10.034   1.00 21.22     O
HETATM 1635   O    HOH    405  45.781   6.088    10.831   1.00 32.51     O
HETATM 1636   O    HOH    406  20.680   25.716   18.205   1.00 23.14     O
HETATM 1637   O    HOH    407  26.449   23.755   -4.077   1.00 9.44      O
HETATM 1638   O    HOH    408  13.404   6.712    6.444    1.00 20.71     O
HETATM 1639   O    HOH    409  33.912   22.171   4.658    1.00 18.92     O
HETATM 1640   O    HOH    410  39.629   15.715   13.211   1.00 93.76     O
HETATM 1641   O    HOH    411  35.297   11.656   18.352   1.00 21.88     O
HETATM 1642   O    HOH    412  10.954   4.182    2.008    1.00 23.12     O
HETATM 1643   O    HOH    413  28.947   21.113   11.642   1.00 22.81     O
HETATM 1644   O    HOH    414  5.170    7.273    12.633   1.00 27.36     O
HETATM 1645   O    HOH    415  28.471   16.583   18.095   1.00 22.56     O
HETATM 1646   O    HOH    416  4.654    4.945    23.880   1.00 52.57     O
HETATM 1647   O    HOH    419  38.860   4.458    16.740   1.00 33.74     O
HETATM 1648   O    HOH    420  -2.549   7.590    -3.638   1.00 24.47     O
HETATM 1649   O    HOH    421  45.977   14.324   21.673   1.00 21.22     O
HETATM 1650   O    HOH    422  21.196   23.126   8.094    1.00 24.30     O
HETATM 1651   O    HOH    423  24.720   30.789   3.238    1.00 17.59     O
HETATM 1652   O    HOH    424  25.564   3.138    6.622    1.00 21.50     O
HETATM 1653   O    HOH    425  34.235   23.186   16.786   1.00 20.56     O
HETATM 1654   O    HOH    426  26.555   15.848   20.797   1.00 34.81     O
HETATM 1655   O    HOH    427  16.137   10.314   16.975   1.00 35.39     O
HETATM 1656   O    HOH    428  15.237   5.341    9.720    1.00 26.74     O
HETATM 1657   O    HOH    429  5.843    16.504   13.479   1.00 20.66     O
HETATM 1658   O    HOH    430  34.267   35.258   2.809    1.00 18.39     O
HETATM 1659   O    HOH    431  34.478   8.946    16.706   1.00 37.42     O
HETATM 1660   O    HOH    432  23.052   6.563    4.267    1.00 23.73     O
HETATM 1661   O    HOH    433  24.461   21.831   8.001    1.00 19.72     O
HETATM 1662   O    HOH    434  16.811   5.911    -0.991   1.00 39.78     O
HETATM 1663   O    HOH    435  18.936   8.7756   17.266   1.00 16.77     O
HETATM 1664   O    HOH    436  17.061   32.451   9.214    1.00 32.73     O
HETATM 1665   O    HOH    437  25.185   15.727   10.155   1.00 23.94     O
HETATM 1666   O    HOH    438  36.819   34.970   6.044    1.00 23.13     O
HETATM 1667   O    HOH    439  36.371   2.956    7.585    1.00 22.07     O
HETATM 1668   O    HOH    440  7.686    18.108   -0.709   1.00 31.93     O
HETATM 1669   O    HOH    442  28.154   5.986    5.626    1.00 34.66     O
HETATM 1670   O    HOH    443  43.765   7.991    3.710    1.00 29.75     O
HETATM 1671   O    HOH    444  34.138   11.979   15.697   1.00 19.26     O
HETATM 1672   O    HOH    445  16.154   2.876    6.317    1.00 24.75     O
HETATM 1673   O    HOH    446  3.198    15.740   15.476   1.00 47.56     O
HETATM 1674   O    HOH    447  16.359   21.320   4.320    1.00 27.58     O
HETATM 1675   O    HOH    448  43.253   8.885    16.567   1.00 16.92     O
HETATM 1676   O    HOH    449  35.697   6.317    18.291   1.00 34.21     O
HETATM 1677   O    HOH    450  26.118   7.952    1.424    1.00 47.42     O
HETATM 1678   O    HOH    451  11.782   19.566   7.278    1.00 31.23     O
HETATM 1679   O    HOH    452  13.180   12.084   -5.228   1.00 27.14     O
HETATM 1680   O    HOH    454  37.285   10.836   3.417    1.00 29.24     O
HETATM 1681   O    HOH    456  49.054   14.720   18.870   1.00 34.45     O
HETATM 1682  O    HOH    457    29.111  15.812  11.618  1.00 40.55    O
HETATM 1683  O    HOH    458    31.663  19.001  19.522  1.00 17.15    O
HETATM 1684  O    HOH    459    39.304  19.991  21.460  1.00 29.51    O
HETATM 1685  O    HOH    460    6.990   6.202   -4.001  1.00 40.02    O
HETATM 1686  O    HOH    461    8.794   6.163   15.456  1.00 31.20    O
HETATM 1687  O    HOH    462    31.882  26.863  16.881  1.00 25.16    O
HETATM 1688  O    HOH    463    26.477  -0.242  3.289   1.00 24.32    O
HETATM 1689  O    HOH    464    -3.607  9.559   4.991   1.00 25.17    O
HETATM 1690  O    HOH    465    3.250   20.726  2.705   1.00 41.31    O
HETATM 1691  O    HOH    466    22.033  33.298  4.411   1.00 41.90    O
HETATM 1692  O    HOH    467    46.878  8.195   18.105  1.00 39.35    O
HETATM 1693  O    HOH    468    39.497  14.637  4.088   1.00 29.50    O
HETATM 1694  O    HOH    469    9.001   4.669   12.208  1.00 33.99    O
HETATM 1695  O    HOH    470    -0.445  6.689   3.926   1.00 27.30    O
HETATM 1696  O    HOH    471    17.189  28.967  12.756  1.00 24.27    O
HETATM 1697  O    HOH    472    -5.836  -10.333 16.980  1.00 45.19    O
HETATM 1698  O    HOH    473    45.688  15.274  4.933   1.00 26.44    O
HETATM 1699  O    HOH    474    24.616  0.817   16.978  1.00 26.14    O
HETATM 1700  O    HOH    475    25.860  28.821  0.421   1.00 30.41    O
HETATM 1701  O    HOH    476    18.624  3.432   13.266  1.00 19.31    O
HETATM 1702  O    HOH    478    17.089  26.985  10.853  1.00 34.08    O
HETATM 1703  O    HOH    479    15.210  30.506  6.340   1.00 38.53    O
HETATM 1704  O    HOH    480    36.478  33.125  3.386   1.00 43.68    O
HETATM 1705  O    HOH    481    9.899   3.051   8.224   1.00 36.06    O
HETATM 1706  O    HOH    482    18.088  0.524   11.711  1.00 38.00    O
HETATM 1707  O    HOH    483    4.856   11.207  18.945  1.00 35.35    O
HETATM 1708  O    HOH    484    31.875  14.345  0.745   1.00 27.67    O
HETATM 1709  O    HOH    485    42.954  25.586  19.172  1.00 34.55    O
HETATM 1710  O    HOH    486    19.707  24.093  -3.819  1.00 36.45    O
HETATM 1711  O    HOH    487    21.776  5.844   18.169  1.00 31.67    O
HETATM 1712  O    HOH    488    26.072  21.572  10.831  1.00 26.77    O
HETATM 1713  O    HOH    489    0.375   5.438   11.888  1.00 36.91    O
HETATM 1714  O    HOH    490    28.879  15.319  3.965   1.00 63.69    O
HETATM 1715  O    HOH    491    39.794  17.388  1.508   1.00 40.63    O
HETATM 1716  O    HOH    492    40.065  0.717   19.459  1.00 39.86    O
HETATM 1717  O    HOH    493    49.237  16.037  4.776   1.00 50.04    O
HETATM 1718  O    HOH    494    6.602   16.058  -4.236  1.00 32.86    O
HETATM 1719  O    HOH    495    14.502  4.269   -0.179  1.00 37.62    O
HETATM 1720  O    HOH    496    15.468  20.981  14.363  1.00 39.44    O
HETATM 1721  O    HOH    497    24.964  16.434  -3.116  1.00 23.19    O
HETATM 1722  O    HOH    498    40.994  29.185  18.880  1.00 37.92    O
HETATM 1723  O    HOH    499    26.306  17.999  12.975  1.00 43.45    O
HETATM 1724  O    HOH    500    -1.452  -5.851  6.853   1.00 35.82    O
HETATM 1725  O    HOH    501    10.897  22.806  6.598   1.00 56.17    O
HETATM 1726  O    HOH    502    35.628  12.681  13.339  1.00 92.79    O
HETATM 1727  O    HOH    503    56.988  18.311  10.058  1.00 60.09    O
HETATM 1728  O    HOH    504    42.131  21.097  23.339  1.00 45.34    O
HETATM 1729  O    HOH    505    47.093  7.981   15.216  1.00 42.30    O
HETATM 1730  O    HOH    506    10.635  18.180  -1.367  1.00 28.88    O
HETATM 1731  O    HOH    507    25.312  18.277  3.464   1.00 36.67    O
HETATM 1732  O    HOH    508    53.997  11.193  14.846  1.00 48.50    O
HETATM 1733  O    HOH    509    17.232  19.642  -6.737  1.00 39.43    O
HETATM 1734  O    HOH    511    48.389  18.219  19.003  1.00 37.53    O
HETATM 1735  O    HOH    512    36.441  5.846   21.503  1.00 17.36    O
HETATM 1736  O    HOH    513    27.771  19.877  -5.622  1.00 28.79    O
HETATM 1737  O    HOH    514    49.143  9.733   9.698   1.00 44.63    O
HETATM 1738  O    HOH    515    22.020  29.095  0.023   1.00 38.04    O
HETATM 1739  O    HOH    516    10.150  18.223  -5.419  1.00 45.55    O
HETATM 1740  O    HOH    518    42.433  18.492  3.496   1.00 20.34    O
HETATM 1741  O    HOH    519    12.974  -6.995  9.968  1.00 55.96    O
HETATM 1742  O    HOH    520    41.002  30.190  16.057 1.00 46.34    O
HETATM 1743  O    HOH    521    28.471  5.080   1.598  1.00 38.47    O
HETATM 1744  O    HOH    522    1.319   16.118  8.887  1.00 40.75    O
HETATM 1745  O    HOH    524    47.980  24.698  12.703 1.00 59.46    O
HETATM 1746  O    HOH    525    2.015   17.058  12.074 1.00 47.46    O
HETATM 1747  O    HOH    526    34.792  8.932   23.014 1.00 17.72    O
HETATM 1748  O    HOH    527    -4.125  3.139   11.120 1.00 35.85    O
HETATM 1749  O    HOH    528    14.446  21.653  8.904  1.00 29.07    O
HETATM 1750  O    HOH    529    19.539  24.993  11.728 1.00 32.07    O
HETATM 1751  O    HOH    530    15.285  2.359   12.400 1.00 45.20    O
HETATM 1752  O    HOH    531    35.293  32.877  16.427 1.00 41.71    O
HETATM 1753  O    HOH    532    31.338  11.703  22.624 1.00 30.38    O
HETATM 1754  O    HOH    533    10.807  3.899   5.533  1.00 31.89    O
HETATM 1755  O    HOH    534    23.897  23.200  -2.832 1.00 31.97    O
HETATM 1756  O    HOH    535    4.746   5.239   -2.472 1.00 30.20    O
HETATM 1757  O    HOH    536    24.434  26.832  -2.017 1.00 31.20    O
HETATM 1758  O    HOH    537    43.950  0.544   13.447 1.00 41.33    O
HETATM 1759  O    HOH    538    23.116  8.555   0.668  1.00 35.22    O
HETATM 1760  O    HOH    539    9.978   15.068  14.401 1.00 30.79    O
HETATM 1761  O    HOH    540    2.001   9.284   12.960 1.00 43.03    O
HETATM 1762  O    HOH    541    3.144   3.592   12.702 1.00 57.96    O
HETATM 1763  O    HOH    542    9.889   9.611   -3.909 1.00 31.84    O
HETATM 1764  O    HOH    543    47.304  17.648  6.312  1.00 33.07    O
HETATM 1765  O    HOH    544    4.895   -8.536  10.635 1.00 53.30    O
HETATM 1766  O    HOH    546    39.433  25.709  8.086  1.00 18.28    O
HETATM 1767  O    HOH    547    30.374  -4.058  14.167 1.00 15.55    O
HETATM 1768  O    HOH    548    46.029  15.729  24.092 1.00 25.93    O
HETATM 1769  O    HOH    549    40.466  -1.095  17.221 1.00 30.08    O
HETATM 1770  O    HOH    550    24.133  0.727   19.719 1.00 26.39    O
HETATM 1771  O    HOH    551    3.446   9.427   -2.135 1.00 31.76    O
HETATM 1772  O    HOH    552    19.319  13.000  -2.575 1.00 41.76    O
HETATM 1773  O    HOH    553    31.891  31.580  18.610 1.00 24.77    O
HETATM 1774  O    HOH    554    18.491  2.334   4.660  1.00 22.10    O
HETATM 1775  O    HOH    555    1.314   11.279  0.038  1.00 26.52    O
HETATM 1776  O    HOH    556    28.146  13.256  10.339 1.00 21.95    O
HETATM 1777  O    HOH    557    30.223  20.804  5.827  1.00 36.82    O
HETATM 1778  O    HOH    558    17.905  13.328  15.220 1.00 20.71    O
HETATM 1779  O    HOH    559    29.909  -0.095  18.799 1.00 21.94    O
HETATM 1780  O    HOH    560    31.631  17.664  9.008  1.00 19.67    O
HETATM 1781  O    HOH    562    24.042  20.954  19.484 1.00 31.11    O
HETATM 1782  O    HOH    563    37.392  16.228  -0.497 1.00 26.68    O
HETATM 1783  O    HOH    564    -1.946  8.648   -0.841 1.00 39.16    O
HETATM 1784  O    HOH    565    47.915  9.279   22.936 1.00 35.60    O
HETATM 1785  O    HOH    566    25.748  7.266   4.529  1.00 28.82    O
HETATM 1786  O    HOH    567    21.116  14.888  -2.109 1.00 36.75    O
HETATM 1787  O    HOH    568    23.715  20.126  5.645  1.00 40.35    O
HETATM 1788  O    HOH    569    33.531  -0.771  13.511 1.00 45.31    O
HETATM 1789  O    HOH    570    20.908  18.749  15.697 1.00 34.23    O
HETATM 1790  O    HOH    571    39.015  32.529  4.501  1.00 54.73    O
HETATM 1791  O    HOH    572    41.051  0.455   7.130  1.00 54.62    O
HETATM 1792  O    HOH    573    30.698  17.740  5.106  1.00 35.84    O
HETATM 1793  O    HOH    574    6.859   5.063   17.712 1.00 37.55    O
HETATM 1794  O    HOH    575    39.059  8.657   3.005  1.00 59.67    O
HETATM 1795  O    HOH    576    38.160  32.276  16.708 1.00 37.88    O
HETATM 1796  O    HOH    577    20.383  21.318  -4.691 1.00 39.17    O
HETATM 1797  O    HOH    578    41.157  6.777   17.217 1.00 35.75    O
HETATM 1798  O    HOH    579    27.327  21.257  8.150  1.00 42.39    O
HETATM 1799  O    HOH    580    34.592  24.586  1.886  1.00 30.17    O
HETATM 1800   O    HOH   581   28.618  8.077    -0.712  1.00 54.91    O
HETATM 1801   O    HOH   582   30.108  20.873   8.937   1.00 56.50    O
HETATM 1802   O    HOH   583   29.146  8.970    6.121   1.00 38.73    O
HETATM 1803   O    HOH   584   51.666  17.680   15.607  1.00 47.50    O
HETATM 1804   O    HOH   585   14.071  22.825   6.240   1.00 47.08    O
HETATM 1805   O    HOH   586   43.840  6.576    20.454  1.00 36.44    O
HETATM 1806   O    HOH   587   42.165  8.711    19.272  1.00 37.83    O
HETATM 1807   O    HOH   588   38.236  13.980   1.049   1.00 39.71    O
HETATM 1808   O    HOH   589   45.548  22.632   16.215  1.00 37.00    O
HETATM 1809   O    HOH   590   30.906  16.821   2.292   1.00 76.55    O
HETATM 1810   O    HOH   591   11.602  22.880   -3.030  1.00 36.77    O
HETATM 1811   O    HOH   592   12.805  8.355    -4.098  1.00 49.06    O
HETATM 1812   O    HOH   593   -2.315  6.894    1.774   1.00 37.69    O
HETATM 1813   O    HOH   594   23.656  18.274   20.007  1.00 26.98    O
HETATM 1814   O    HOH   595   10.845  12.955   18.898  1.00 29.83    O
HETATM 1815   O    HOH   596   18.262  4.377    19.245  1.00 39.17    O
HETATM 1816   O    HOH   597   49.235  6.180    11.692  1.00 70.41    O
HETATM 1817   O    HOH   598   14.400  -3.218   15.489  1.00 41.28    O
HETATM 1818   O    HOH   599   24.049  25.032   20.146  1.00 33.82    O
HETATM 1819   O    HOH   600   23.974  20.498   -3.811  1.00 44.21    O
HETATM 1820   O    HOH   601   39.360  6.106    20.658  1.00 34.40    O
HETATM 1821   O    HOH   602   31.294  32.672   16.263  1.00 25.66    O
HETATM 1822   O    HOH   603   44.234  4.286    13.888  1.00 41.49    O
HETATM 1823   O    HOH   604   21.106  8.490    19.650  1.00 66.45    O
HETATM 1824   O    HOH   605   28.263  15.750   23.071  1.00 67.72    O
HETATM 1825   O    HOH   606   17.345  24.004   15.476  1.00 73.54    O
HETATM 1826   O    HOH   607   28.369  11.841   -4.260  1.00 38.80    O
HETATM 1827   O    HOH   608   18.542  3.496    0.954   1.00 48.61    O
HETATM 1828   O    HOH   609   -6.831  -8.495   19.160  1.00 46.57    O
HETATM 1829   O    HOH   610   22.075  20.486   9.491   1.00 58.37    O
HETATM 1830   O    HOH   611   19.748  7.055    -2.211  1.00 48.25    O
HETATM 1831   O    HOH   612   44.625  20.192   21.807  1.00 80.14    O
HETATM 1832   O    HOH   613   38.559  9.253    5.778   1.00 32.81    O
HETATM 1833   O    HOH   614   18.465  0.369    7.409   1.00 51.65    O
HETATM 1834   O    HOH   615   37.639  9.337    22.161  1.00 48.87    O
HETATM 1835   O    HOH   616   16.809  1.980    9.496   1.00 72.40    O
HETATM 1836   O    HOH   617   38.304  20.108   24.081  1.00 25.44    O
HETATM 1837   O    HOH   618   19.482  11.517   17.092  1.00 70.05    O
HETATM 1838   O    HOH   619   15.255  -5.143   10.342  1.00 36.51    O
HETATM 1839   O    HOH   620   29.264  10.712   2.893   1.00 32.87    O
HETATM 1840   O    HOH   621   15.822  7.785    -3.226  1.00 43.27    O
HETATM 1841   O    HOH   622   23.813  11.730   -2.619  1.00 36.87    O
HETATM 1842   O    HOH   623   -3.594  5.850    12.136  1.00 66.99    O
HETATM 1843   O    HOH   624   18.735  22.790   5.719   1.00 40.97    O
HETATM 1844   O    HOH   625   55.575  16.141   8.287   1.00 49.74    O
HETATM 1845   O    HOH   626   53.255  10.141   17.681  1.00 68.52    O
HETATM 1846   O    HOH   627   -1.530  -0.489   4.060   1.00 49.32    O
HETATM 1847   O    HOH   628   47.166  12.933   3.227   1.00 42.68    O
HETATM 1848   O    HOH   629   51.745  12.846   4.265   1.00 32.94    O
HETATM 1849   O    HOH   630   8.335   13.886   -5.452  1.00 42.98    O
HETATM 1850   O    HOH   631   1.415   18.892   4.450   1.00 52.27    O
HETATM 1851   O    HOH   632   8.813   4.607    -6.147  1.00 61.80    O
HETATM 1852   O    HOH   633   14.358  18.909   -7.627  1.00 59.54    O
HETATM 1853   O    HOH   634   42.560  12.882   4.673   1.00 46.06    O
HETATM 1854   O    HOH   635   13.134  -0.048   6.444   1.00 49.92    O
HETATM 1855   O    HOH   636   8.623   23.116   -0.236  1.00 51.89    O
HETATM 1856   O    HOH   637   19.455  18.632   6.820   1.00 29.08    O
HETATM 1857   O    HOH   638   0.328   4.658    14.591  1.00 62.40    O
HETATM 1858   O    HOH   639   49.562  9.193    6.008   1.00 39.48    O
HETATM 1859  O    HOH   640   4.000   -2.106 -0.040  1.00 57.30   O
HETATM 1860  O    HOH   641   16.678  23.799 11.363  1.00 65.19   O
HETATM 1861  O    HOH   642   8.358   0.710  9.304   1.00 43.70   O
HETATM 1862  O    HOH   643   41.615  2.908  17.876  1.00 52.92   O
HETATM 1863  O    HOH   644   29.021  19.152 2.611   1.00 26.91   O
HETATM 1864  O    HOH   645   44.197  15.580 2.167   1.00 76.22   O
HETATM 1865  O    HOH   646   22.571  6.260  -1.309  1.00 50.65   O
HETATM 1866  O    HOH   647   1.473   1.753  3.469   1.00 40.93   O
HETATM 1867  O    HOH   648   46.959  7.034  20.908  1.00 37.66   O
HETATM 1868  O    HOH   649   24.330  17.915 17.109  1.00 53.90   O
CONECT 1428  1429
CONECT 1429  1428 1430
CONECT 1430  1429 1431
CONECT 1431  1430 1432
CONECT 1432  1431 1433
CONECT 1433  1432 1434
CONECT 1434  1433 1435
CONECT 1435  1434 1436
CONECT 1436  1435 1437
CONECT 1437  1436
CONECT 1438  1439 1440   1441
CONECT 1439  1438
CONECT 1440  1438
CONECT 1441  1438
CONECT 1442  1443 1444   1445   1446
CONECT 1442  1447 1448
CONECT 1443  1442
CONECT 1444  1442
CONECT 1445  1442
CONECT 1446  1442
CONECT 1447  1442
CONECT 1448  1442
CONECT 1449  1450 1451   1452   1453
CONECT 1449  1454 1455
CONECT 1450  1449
CONECT 1451  1449
CONECT 1452  1449
CONECT 1453  1449
CONECT 1454  1449
CONECT 1455  1449
CONECT 1456  1457 1458   1459   1460
CONECT 1456  1461 1462
CONECT 1457  1456
CONECT 1458  1456
CONECT 1459  1456
CONECT 1460  1456
CONECT 1461  1456
CONECT 1462  1456
CONECT 1463  1464 1465   1466   1467
CONECT 1463  1468 1469
CONECT 1464  1463
CONECT 1465  1463
CONECT 1466  1463
CONECT 1467  1463
CONECT 1468  1463
CONECT 1469  1463
CONECT 1470  1471 1472   1473   1474
CONECT 1470  1475 1476
CONECT 1471  1470
CONECT 1472 1470
CONECT 1473 1470
CONECT 1474 1470
CONECT 1475 1470
CONECT 1476 1470
CONECT 1477 1478 1479 1480 1481
CONECT 1477 1482 1483
CONECT 1478 1477
CONECT 1479 1477
CONECT 1480 1477
CONECT 1481 1477
CONECT 1482 1477
CONECT 1483 1477
CONECT 1484 1485 1486 1487 1488
CONECT 1484 1489 1490
CONECT 1485 1484
CONECT 1486 1484
CONECT 1487 1484
CONECT 1488 1484
CONECT 1489 1484
CONECT 1490 1484
CONECT 1491 1492 1493 1494 1495
CONECT 1491 1496 1497
CONECT 1492 1491
CONECT 1493 1491
CONECT 1494 1491
CONECT 1495 1491
CONECT 1496 1491
CONECT 1497 1491
CONECT 1498 1499 1500 1501 1502
CONECT 1498 1503 1504
CONECT 1499 1498
CONECT 1500 1498
CONECT 1501 1498
CONECT 1502 1498
CONECT 1503 1498
CONECT 1504 1498
CONECT 1505 1506 1507 1508 1509
CONECT 1505 1510 1511
CONECT 1506 1505
CONECT 1507 1505
CONECT 1508 1505
CONECT 1509 1505
CONECT 1510 1505
CONECT 1511 1505
CONECT 1512 1513 1514 1515 1516
CONECT 1512 1517 1518
CONECT 1513 1512
CONECT 1514 1512
CONECT 1515 1512
CONECT 1516 1512
CONECT 1517 1512
CONECT 1518 1512
CONECT 1519 1520 1521 1522 1523
CONECT 1519 1524 1525
CONECT 1520 1519
CONECT 1521 1519
CONECT 1522 1519
CONECT 1523 1519
CONECT 1524 1519
CONECT 1525 1519
CONECT 1526 1527 1531
CONECT 1527 1526 1528
CONECT 1528 1527 1529
CONECT 1529 1528 1530 1535
CONECT 1530 1529 1531 1533
CONECT 1531 1526 1530 1532
CONECT 1532 1531
CONECT 1533 1530 1534
CONECT 1534 1533 1535
CONECT 1535 1529 1534
MASTER 249  0    15    0    0    0    0    6    1867   1   120   6
END
表7.与各种核碱基结合的腺嘌呤核糖开关RNA(AR)相关的热力学参数
#of exp.     类似物     Kd     (μM)    ΔH    (kcal/mol)   ΔS   (Cal/mol·deg)  5     2,6-二氨基嘌呤*     0.017±0.006   -40.3±2.91     -97.6±4.00  2     2-氨基嘌呤     0.251±0.026   -31.8±2.64     -73.9±9.26  2     腺嘌呤     0.469±0.041   -34.5±0.05     -84.8±0.30  2     嘌呤     110±3   -25.4±0.99     -65.4±3.00  2     2-氟腺嘌呤     4.02±1.07   -37.4±3.41     -98.7±11.8  2     2,4,5,6-四氨基嘧啶     24.9±4.25   -43.2±3.50     -122±.12.0  2     2,4,6-三氨基嘧啶     18.3±1.67   -37.7±0.23     -102±0.70  1     2,4-二氨基嘧啶     n.d.  1     组胺     n.d.  1     L-组胺醇     n.d.  2     6-溴鸟嘌呤     2.7±1.16   -50.4±0.16     -141±1.90  2     6-氯鸟嘌呤     0.721±0.044   -44.3±7.2     -98.6±4.39  1     2,6-二氯嘌呤     n.d.  4     0-甲基鸟嘌呤     n.d.  1     激动素     n.d.  1     6-正己基氨基嘌呤     n.d.  2     6-苯甲基氨基嘌呤     n.d.  2     6-甲基嘌呤     25.2±1.63   -31.5±0.42     -82.9±1.25  2     O-苯甲基鸟嘌呤     n.d.
所有试验均在50mM K+HEPES,pH7.5,100mM KCl,10mM MgCl2溶液 中,在30℃条件下进行。
n.d.表示在反应中没有显示出可检测的结合。
*在298K和323K之间测量的这一反应的热容量(ΔCp)为-1.10kcal mol-1K-1。
表8.与各种核碱基结合的鸟嘌呤核糖开关RNA(GR)相关的热力学参数
 #of  exp     类似物   Kd   (μM)  ΔH  (kcal/mol)   ΔS   (cal/mol·deg)  2     鸟嘌呤  0.004±0.003   -53.5±6.98   -137±24.8  2     次黄嘌呤  0.759±0.066   -31.3±0.01   -753±0.145  2     黄嘌呤  50.5±5.8*   -34.6±10.4*   -94.4±34.5*  2     7-脱氮鸟嘌呤  0.049±0.013   -42.0±3.72   -105±11.7  2     8-氮杂鸟嘌呤  0.0487±0.1   -46.9±9.87   -121±32.6  1     4,6-二羟基嘧啶  n.d  1     5,6-二氨基-2,4-二羟基嘧啶  n.d.  2     6-溴鸟嘌呤  2.12±0.56   -39.0±7.79   -103±26.2  2     6-氯鸟嘌呤  0.856±0.014   -43.6±13.1   -116±43.2  1     2,6-二氯嘌呤  n.d.  1     0-甲基鸟嘌呤  0.003   -18.7   -23.3  2     2-氨基嘌呤  4.36±1.2   -46.4±2.66   -129±8.20  1     O-苯甲基鸟嘌呤  n.d.  2     6-硫鸟嘌呤  0.0737±0.01   -40.6±14.5   -101±47.5  2     6-甲基硫鸟嘌呤  0.0418±0.003   -24.5±0.20   -46.9±0.24
所有试验均在50mM K+HEPES,100mM KCl,10mM MgCl2溶液中,在30 ℃条件下进行。
n.d.表示在反应中没有显示出可检测的结合。
*除非n保持为1,否则软件不能调整数据并报告参数。
应当理解的是,所公开的方法和组合物并不限于本文所述的具体方 法学、实验方法和试剂,也可以有所变化。还应理解的是,本文所用术 语只是出于描述特定实施方案的目的,而非意在限制本发明的范围,本 发明的范围仅仅由后附的权利要求书限定。
必须注意的是,除非上下文中另外明确指出,在本说明书和所附权 利要求书中使用的单数形式的“一”、“一种”和“该”包括复数指代对 象。因此,例如,提及“一种核糖开关”包括多个这样的核糖开关,提 及“该核糖开关”是指本领域技术人员已知的一个或多个核糖开关及其 等价物,等等。
“任选的”或“任选地”意为后面描述的事件、情况或物质可能出 现或存在,也可能不出现或不存在,这样的描述包括所述事件、情况或 物质出现或存在的情况和所述事件、情况或物质不出现或不存在的情况。 本文中范围可以表示为从“大约”一个具体的数值,和/或至“大约”另 一个具体的数值。当表示为这种范围时,除非上下文中特别指明,还特 别考虑和认为公开了从一个具体数值和/或至另一个具体数值的范围。类 似地,当通过在前面使用“大约”将数值表示为近似值时,除非上下文 中特别指明,应当理解的是,该具体的数值构成另一个被特别考虑和认 为被公开的实施方案。应当进一步理解的是,除非上下文中特别指明, 每个范围的端点在与另一个端点相关和独立于另一个端点时都是有意义 的。最后,应当理解的是,除非上下文中特别指明,在明确公开的范围 中所包括的所有个别的数值和子范围也被特别考虑和认为被公开。不论 在具体的情况下这些实施方案的全部或部分是否被明确地公开,上述的 原则都适用。
除非另有定义,否则本文中使用的技术术语和科学术语的含义都与 所公开的方法和组合物所属技术领域的技术人员通常理解的含义相同。 虽然在实施或检测本发明方法和组合物时可以使用与本文所述相似或等 同的任何方法和材料,但是具体可用的方法、装置和材料仍然如本文所 述。本文引用的出版物和所引用的资料在此特别地以援引的方式纳入本 文。但是本文不应被理解为承认本发明不能在先前的发明之前做出。并 未承认任何参考文献构成了现有技术。参考文献的讨论说明了它们的作 者的论断,但是本申请人保留怀疑所引用文献的正确性和相关性的权利。 可以清楚地理解,虽然本文中提及了许多出版物,但是并未承认这些参 考文献构成本领域的公知常识的任意部分。
在本申请的说明书部分和权利要求部分的通篇中,词语“包括”及 其同义词“包含”和“含有”的含义为“包括但不限于”,并不意在排除 其它的添加物、组分、整数或步骤。
本领域技术人员利用常规试验范围内的手段就可以认知或确认本文 所述方法和组合物的具体实施方案的许多等价物。下述的权利要求书意 在涵盖这些等价物。
相关申请的交叉引用
本申请要求以2004年11月8日提交的美国临时申请No.60/625,864 作为优先权基础。2004年11月8日提交的美国临时申请No.60/625,864 的全部内容以援引的方式纳入本文。
关于联邦政府赞助的研究的声明
本发明是在国家健康中心的NIH GM068819-2号基金和美国国防部高 级研究计划局的DARPA W911NF-04-1-0416号基金的政府支持下做出的, 美国政府在本发明中享有一定的权利。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈