所属技术领域
本发明涉及痢疾志贺氏菌12型(Shigella dysenteriae 12)中控制O-抗原合成的基因 簇的核苷酸全序列,特别是涉及痢疾志贺氏菌12型中控制O-抗原合成的基因簇中的寡 核苷酸,可利用这些对O-抗原特异的寡核苷酸快速、准确地检测人体及环境中的痢疾志 贺氏菌12型和大肠杆菌O152(Escherichia coli O152)并鉴定这些致病菌中的O-抗原。
背景技术
志贺氏菌是随着人类进化而发展起来的致病菌,能侵袭结肠膜上皮细胞,导致自限 性化脓性感染病灶,引起人类的细菌性痢疾。人类对志贺氏菌有较高的敏感性,只需要少 于十个菌就可以引起人的感染,儿童和成人易感染,特别是儿童,易引起急性中毒性痢 疾,而志贺氏菌的O-抗原是志贺氏菌引起
疾病的主要原因之一。
O-抗原是革兰氏阴性细菌脂多糖中的O特异性多糖成分,它由许多重复的寡糖单位 组成。O-抗原的合成过程研究得较清楚:先由糖基转移酶将核苷二
磷酸单糖转移到一个 固定在细胞内膜的脂分子上,然后在内膜的内侧合成寡糖单位,O-抗原的寡糖单位再通 过转运酶被转移到内膜外侧,而后通过聚合酶聚合成多糖,再被连接到一个糖脂分子上 形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide O antigens”.Trends in Microbiology.3:178-185;Schnaitman,C.A.and J.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis in entericbacteria”.Microbiological Reviews,57(3):655-682]。编码负责O-抗原 合成的所有酶分子的基因一般在
染色体上相邻排列,形成一个基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and gene nomenclature”Trends in Microbiology,4:495-503]。 在志贺氏菌、大肠杆菌和沙
门氏菌中,O-抗原基因簇位于galF和gnd基因之间[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen loci:implication for Escherichia coli and Shigella relationships”.Infection and Immunity,11:6923-6930;Lei Wang and Peter Reeves(2000)“The Escherichia coli O111 and Salmonella enterica O35 gene clusters:gene clusters encoding the same colitose-containing O antigen are highly conserved”.Journal of Bacteriology.182:5256-5261]。O-抗原基因簇含有三类基因:糖合成路径基因,糖基转移 酶基因,寡糖单位处理基因,其中糖合成路径基因编码的酶合成O-抗原所需的核苷二磷 酸单糖;糖基转移酶基因编码的酶将核苷二磷酸单糖及其它分子转到单糖上从而使单糖 聚合成寡糖单位;寡糖单位处理基因包括转运酶基因和聚合酶基因,它们将寡糖单位转 移到细菌内膜外侧,再聚合成多糖。糖基转移酶基因和寡糖单位处理基因只存在于携带 这些基因的基因簇里。O-抗原中单糖的不同,单糖间联结键的不同和寡糖单位之间联结 键的不同构成了O-抗原的多样性,而单糖的组成、单糖间的联结键及寡糖单位之间的联 结键是由O-抗原基因簇中的基因控制着,所以O-抗原基因簇决定了O-抗原的合成,也 决定了O-抗原的多样性。
因为O-抗原是极强的抗原,是志贺氏菌重要的致病因素之一,同时它又具有极强的 多样性,这启示我们能研究一种快速、准确地检测志贺氏菌及其O-抗原的特异性好、灵 敏度高的方法。以表面多糖为目标的血清学免疫反应自上世纪30年代以来一直被用于对 细菌的分型和鉴定,是鉴定致病菌的唯一的手段。这种诊断方法需要大量的抗血清,而 抗血清一般种类不全,数量不足,大量的抗血清在制备和储存中也存在一些困难。另一 方面此法耗时长、灵敏度低、漏检率高、准确性差,所以,现在普遍认为这种传统的血 清学检测方法将为现代分子
生物学方法取代。1993年,Luk,J.M.C et.al用沙门氏菌 (S.enterica)O-抗原基因簇的特异核苷酸序列通过PCR方法鉴定了沙门氏菌的O-抗原 [Luk,J.M.C.et.al.(1993)“Selective amplification of abequose and paratose synthase genes(rfb) by polymerase chain reaction for identification of S.enterica major serogroups(A,B,C2,andD)”, J.Clin.Microbiol.31:2118-2123]。Luk,et.al的方法是将相应于沙门氏菌血清型E1,D1,A,B和 C2的O-抗原内的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到对 不同血清型的沙门氏菌特异的寡核苷酸。1996年,Paton,A.W et.al用对E.coli O111的O- 抗原特异的源于wbdI基因的寡核苷酸鉴定了一株产毒素的E.coli O111的血清型 [“Molecular microbiological investigation of an outbreak of Hemolytic-Uremic Syndrome caused by dry fermented sausage contaminated with Shiga-like toxin producing Escherichia coli”.J.Clin.Microbiol.34:1622-1627],但是后来的研究表明Paton,A.W et.al的用源于wbdI 基因的寡核苷酸鉴定E.coli O111的血清型的方法有
假阳性结果出现。Bastin D.A.and Reeves,P.R.认为,这是由于wbdI基因是一个推测的糖合成路径基因[Bastin D.A.and Reeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111.Gene 164:17-23],而在其它细菌的O-抗原的结构中也可能有这个糖,所以糖合成路 径基因对于O-抗原并不是高度特异的。
志贺氏菌有46种血清型,但只有33种不同的O-抗原,大肠杆菌有166种不同的O- 抗原[Reeves,P.R(1992)“Variation in O antigens,niche specific selection and bacterial populations”.FEMS Microbiol.Lett,100:509-516],二者亲缘关系非常近,并且有12种O-抗 原是大肠杆菌和志贺氏菌共有的,其中痢疾志贺氏菌12型和大肠杆菌O152就拥有相同 的O-抗原[Ewing,W.H.(1986)“Edwards and Ewing’s identification of the Enterobacteriaceae”.Elsevier Science Publishers,Amsterdam,The Netherlands;T.cheasty,et al.(1983)“Antigenic relationships between the enteroinvasive Escherichia coli antigens O28ac,O112ac,O124,O136,O143,O144,O152 and O164 and Shigella O antigens”J.clin Microbiol,17(4):681-684],传统的血清型方法不能将它们区分。
发明内容
本发明的目的是提供了一种对痢疾志贺氏菌12型和大肠杆菌O152的O-抗原特异的 核苷酸。它是痢疾志贺氏菌12型的O-抗原基因簇中的核苷酸,是源于糖基转移酶基因 和转运酶基因及聚合酶基因的特异的核苷酸。
本发明的一个目的是提供了痢疾志贺氏菌12型的O-抗原基因簇的全长核苷酸序列。
本发明的另一个目的是提供了构成痢疾志贺氏菌12型的O-抗原基因簇的基因:转 运酶的基因即wzx基因或与wzx有相似功能的基因;聚合酶基因即wzy基因或与wzy有 相似功能的基因;糖基转移酶基因,包括orf5、orf7、orf9、orf10基因;糖合成路径基因, 包括rmlB、rmlD、rmlA、rmlC。
本发明的另一个目的是提供了寡核苷酸,它们分别源于痢疾志贺氏菌12型的O-抗 原基因簇中编码糖基转移酶的基因包括orf5、orf7、orf9、orf10基因;源于编码转运酶的 基因即wzx基因或与wzx有相似功能的基因、源于编码聚合酶的基因即wzy基因或与wzy 有相似功能的基因;它们是上述基因内的寡核苷酸,长度在10-20nt;它们对痢疾志贺氏 菌12型和大肠杆菌O152的O-抗原是特异的;尤其是表1中列出的寡核苷酸,它们对痢 疾志贺氏菌12型和大肠杆菌O152的O-抗原是高度特异的,而且这些寡核苷酸还可重新 组合,组合后的寡核苷酸对痢疾志贺氏菌12型和大肠杆菌O152的O-抗原也是高度特异 的。
本发明的另一个目的是提供的上述寡核苷酸可作为引物用于核酸扩增反应,或者作 为探针用于杂交反应,或者用于制造
基因芯片或微阵列,从而通过这些方法来检测和鉴 定痢疾志贺氏菌12型和大肠杆菌O152的O-抗原及检测和鉴定痢疾志贺氏菌12型和大 肠杆菌O152。
本发明的另一个目的是提供了分离痢疾志贺氏菌12型的O-抗原基因簇的全序列的 方法。按照本方法操作可以获得其他细菌的O-抗原基因簇的全序列,也可以获得编码其 他多糖抗原的细菌的基因簇的全序列。
在本发明的第一个方面,提供了痢疾志贺氏菌12型的O-抗原基因簇的全长核苷酸 序列,它的全序列如SEQ ID NO:1所示,全长12235个
碱基;或者具有一个或多个插入、 缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ ID NO:1的核苷酸。通过本 发明的方法得到了痢疾志贺氏菌12型的O-抗原基因簇的结构(在图1中列出),它总共 由10个基因组成,都位于galF基因和gnd基因之间。
在本发明的第二个方面,提供了痢疾志贺氏菌12型的O-抗原基因簇中的基因,即 转运酶基因(wzx基因或与wzx有相似功能的基因);聚合酶基因(wzy基因或与wzy有 相似功能的基因);糖基转移酶基因,包括orf5、orf7、orf9、orf10基因;细菌多糖抗原 中特殊的糖合成路径基因,包括rmlB、rmlD、rmlA、rmlC基因,它们在O-抗原基因簇中 的起始
位置和终止位置及核苷酸序列都列在图2中。本发明尤其涉及到糖基转移酶基因、 转运酶基因和聚合酶基因,因为糖合成路径基因即合成核苷二磷酸单糖的基因现在被预 示对较多胞外多糖是常见的、共同的,对细菌的O-抗原并不是很特异的,而本发明涉及 到的糖基转移酶基因、转运酶基因和聚合酶基因对痢疾志贺氏菌12型和大肠杆菌O152 的O-抗原是高度特异的。
在本发明的第三个方面,提供了源于痢疾志贺氏菌12型的O-抗原基因簇中的wzx 基因或与wzx有相似功能的基因、wzy基因或与wzy有相似功能的基因和糖基转移酶基因, 包括orf5、orf7、orf9、orf10基因的寡核苷酸,它们是这些基因中的任何一段寡核苷酸。 但是,优先被用的是列于表1中的寡核苷酸对,在表1中也列出了这些寡核苷酸对在 O-抗原基因簇中的位置及以这些寡核苷酸对为引物所做的PCR反应的产物的大小,这些 PCR反应可用表中的
退火温度进行。这些引物只在以痢疾志贺氏菌12型和大肠杆菌O152 为模板进行的PCR扩增中得到预期大小的产物,而在以表2所列的166株大肠杆菌和 43株志贺氏菌为模板进行的PCR扩增中都未得到预期大小的产物。更详细地说,以这些 寡核苷酸对为引物所做的PCR反应在大多数细菌中均未得到任何产物,虽然在有些菌中 得到了PCR产物带,但其大小不符合预期大小,这是由于引物结合到基因组的别的位置 造成,这种问题可通过用基因内的其它引物做PCR来避免。所以,可以确定这些引物即 表1所列的寡核苷酸对痢疾志贺氏菌12型和大肠杆菌O152及它们的O-抗原是高度特 异的。
本发明的其他方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
如本发明所用,“寡核苷酸”主要是指来源于O-抗原基因簇中的编码糖基转移酶的 基因、编码转运酶的基因和编码聚合酶的基因内的一段核苷酸分子,它们在长度上可改 变,一般在10到20个核苷酸范围内改变。更确切的说这些寡核苷酸是源于orf5基因(核 苷酸位置是从SEQ ID NO:1的4626至5663碱基),wzx基因(核苷酸位置是从SEQ ID NO:1 的5663至6874碱基),orf7基因(核苷酸位置是从SEQ ID NO:1的6877至7869碱基), wzy基因(核苷酸位置是从SEQ ID NO:1的7882至8955碱基),orf9基因(核苷酸位置是 从SEQ ID NO:1的8960至9721碱基),orf10基因(核苷酸位置是从SEQ ID NO:1的9718 至10788碱基)。源于以上基因内的寡核苷酸对痢疾志贺氏菌12型(SEQ ID NO:1)和大肠 杆菌O152都是高度特异的。
此外,有时两个遗传相似的编码不同O-抗原的基因簇通过基因重组或突变产生新的 O-抗原,从而产生新的细菌类型,新的突变株。在这种环境中,需要筛选出多对寡核苷 酸同重组基因杂交以提高检测的特异性。因此,本发明提供了一整套多对寡核苷酸的混 合物,它们源于糖基转移酶基因;源于转运酶和聚合酶基因,包括wzx基因或与wzx有 相似功能的基因、wzy基因或与wzy有相似功能的基因;也源于糖合成路径基因。这些基 因的混合物对一个特殊的细菌多糖抗原来说是特异的,从而使这套寡核苷酸对这个细菌 的多糖抗原是特异的。更具体地说,这些寡核苷酸的混合物是源于糖基转移酶基因、wzx 基因或与wzx有相似功能的基因、wzy基因或与wzy有相似功能的基因中的寡核苷酸与源 于糖合成路径基因中的寡核苷酸的组合。
在另一方面,本发明涉及寡核苷酸的鉴定,它们可以用于检测表达O-抗原的细菌和 在诊断中鉴定细菌的O-抗原。
本发明涉及到一种检测食品中的一个或多个细菌多糖抗原的方法,这些抗原可以 使样品能与以下至少一个基因的寡核苷酸特异性杂交,这些基因是:(i)编码糖基转移酶 的基因(ii)编码转运酶和聚合酶的基因,包括wzx基因或与wzx有相似功能的基因、wzy 基因或与wzy有相似功能的基因。在条件
许可的情况下至少一个寡核苷酸能与至少一个 表达特殊的O-抗原的细菌的一个以上的那样的基因特异性杂交,这些细菌是痢疾志贺氏 菌12型或大肠杆菌O152。可用PCR方法检测,更可以将本发明方法中的核苷酸标记后 作为探针通过杂交反应如southern-blot或
荧光检测,或者通过基因芯片或微阵列检测样 品中的抗原及细菌。
本发明者考虑到以下情况:当单个的特异的寡核苷酸检测无效时,寡核苷酸的混 合物能与靶区域特异性杂交以检测样品。因此本发明提供了一套寡核苷酸用于本发明所 述的检测方法。这里所说的寡核苷酸是指源于编码糖基转移酶的基因、编码转运酶的基 因和聚合酶的基因,包括wzx基因或与wzx有相似功能的基因、wzy基因或与wzy有相似 功能的基因的寡核苷酸。这套寡核苷酸对一个特殊的细菌的O-抗原来说是特异的,这一 特殊的细菌O-抗原是由痢疾志贺氏菌12型或大肠杆菌O152表达的。
另一方面,本发明涉及到一种检测
排泄物中的一个或多个细菌多糖抗原的方法, 这些抗原可以使样品能与以下至少一个基因的寡核苷酸特异性杂交,这些基因是:(i)编 码糖基转移酶的基因(ii)编码转运酶和聚合酶的基因,包括wzx基因或与wzx有相似功 能的基因、wzy基因或与wzy有相似功能的基因。在条件许可的情况下至少一个寡核苷酸 能与至少一个表达特殊的O-抗原的细菌的一个以上的那样的基因特异性杂交。这些细菌 是痢疾志贺氏菌12型或大肠杆菌O152。可用本发明中的寡核苷酸作引物通过PCR的方 法检测样品,也可将本发明中的寡核苷酸分子标记后作为探针通过杂交反应如 southern-blot或荧光检测,或者通过基因芯片或微阵列检测样品中的抗原及细菌。
一般,一对寡核苷酸可能与同样的基因杂交也可与不同的基因杂交,但它们中必 须有一个寡核苷酸能特异性杂交到特殊抗
原型的特异序列上,另一个寡核苷酸可杂交于 非特异性区域。因此,当特殊的多糖抗原基因簇中的寡核苷酸被重新组合时,至少能选 出一对寡核苷酸与多糖抗原基因簇中特异基因混合物杂交,或者选出多对寡核苷酸与特 异基因的混合物杂交。甚至即使当一个特殊的基因簇中所有基因都独一无二时,此方法 也能应用于识别此基因簇内的基因混合物的核苷酸分子。因此本发明提供了一整套用于 检测本发明方法的多对寡核苷酸,在这里多对寡核苷酸是源于编码糖基转移酶的基因、 编码转运酶和聚合酶的基因包括wzx基因或与wzx有相似功能的基因、wzy基因或与wzy 有相似功能的基因,这套寡核苷酸对一个特殊的细菌多糖来说是特异的,这套寡核苷酸 可能是糖合成中必须基因的核苷酸。
另一方面,本发明也涉及到一种检测源于病人的样品中的一个或多个细菌多糖抗 原的方法。样品中的一个或多个细菌多糖抗原可以使样品能与以下至少一个基因中的一 对寡核苷酸中的一个特异性杂交,这些基因是:(i)编码糖基转移酶的基因(ii)编码转运 酶和聚合酶的基因,包括wzx基因或与wzx有相似功能的基因、wzy基因或与wzy有相似 功能的基因。在条件许可的情况下至少一个寡核苷酸能与样品中的至少一个表达特殊的 O-抗原的细菌的一个以上的那样的基因特异性杂交,这些细菌是痢疾志贺氏菌12型或大 肠杆菌O152。可用本发明中的寡核苷酸作引物通过PCR的方法检测样品,也可将本发 明中的寡核苷酸标记后作为探针通过杂交反应,或者通过基因芯片或微阵列检测样品中 的抗原及细菌。
更详细地说,以上描述的方法可以理解为当寡核苷酸对被使用时,其中的一个寡 核苷酸分子能杂交到一个并不是来源于糖基转移酶基因、wzx基因或与wzx有相似功能的 基因、wzy基因或与wzy有相似功能的基因的序列上。此外,当两个寡核苷酸都能杂交上 时,它们可能杂交于同一基因也可能杂交到不同基因上。也即,当交叉反应出现问题时, 可选择寡核苷酸的混合物来检测混合的基因以提供检测的特异性。
本发明者相信本发明不必限于以上所提的核苷酸序列编码的特定的O-抗原,而且广 泛应用于检测所有表达O-抗原和鉴定O-抗原的细菌。而且,由于O-抗原合成和其他多 糖抗原(如细菌胞外抗原)合成之间的相似性,发明者相信本发明的方法和分子也应用 于这些其他的多糖抗原。
本发明首次公开了痢疾志贺氏菌12型的O-抗原基因簇的全长序列,而且可从这个 未被克隆的全长基因簇的序列中产生重组分子,通过插入表达可产生表达痢疾志贺氏菌 12型的O-抗原,并成为有用的
疫苗。
附图说明
图1是痢疾志贺氏菌12型的O-抗原基因簇的结构图,在图中列出了痢疾志贺氏菌 12型的O-抗原基因簇的结构,共由10个基因组成,每个基因用方框表示,并在方框内 写入基因的名称,数字表示的是O-抗原基因簇中的开放阅读框(orf)的顺序。在O-抗 原基因簇的两端是galF基因和gnd基因,这两个基因不负责O-抗原的合成,我们只是用 它们的一段序列设计引物来扩增O-抗原基因簇的全长序列。
图2是痢疾志贺氏菌12型的O-抗原基因簇中的基因的位置图,在图中列出了痢疾 志贺氏菌12型的O-抗原基因簇中的所有开放阅读框在全序列中的准确位置,在每个开 放阅读框的起始密码子和终止密码子的下面划线。
具体实施方式
下面结合具体
实施例,进一步阐述本发明。应理解这些实施例仅用于说明本发明而 不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条 件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件。 实施例1:基因组的提取
在5mL的LB培养基中37℃过夜培养志贺氏菌,离心收集细胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml 的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温 育2小时,再加入3ul 10mg/ml的RNase,65℃30分钟。加等体积酚抽提混合物,取上 清再用等体积的酚∶氯仿∶异戊醇抽提两次,取上清再用等体积的乙醚抽提以除去残余 的酚。上清用2倍体积
乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,最后 将DNA重悬于30ul TE中。基因组DNA通过0.4%的琼脂糖凝胶
电泳检测。 实施例2:通过PCR扩增痢疾志贺氏菌12型中的O-抗原基因簇
痢疾志贺氏菌12型的O-抗原基因簇通过Long PCR扩增。首先根据经常发现于O- 抗原基因簇启动子区的JumpStart序列设计上游引物(#1523-ATT GTG GCT GCA GGG ATC AAA GAA AT),再根据O-抗原基因簇下游的gnd基因设计下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C)。用Boehringer Mannheim公司的Expand Long Template PCR方法扩增O-抗原基因簇,PCR反应程序如下:在94℃预变性2分钟; 然后94℃变性10秒,60℃退火30秒,68℃延伸15分钟,这样进行30个循环。最后, 在68℃继续延伸7分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小 及其特异性。合并6管long PCR产物,并用Promega公司的Wizard PCR Preps纯化试 剂盒纯化PCR产物。 实施例3:O-抗原基因簇文库的构建
用被
修改的Novagen DNaseI shot gun法构建O-抗原基因簇文库。反应体系是300ng PCR纯化产物,0.9ul 0.1M MnCl2,1ul 1∶2000稀释的1mg/ml的DNaseI,反应在室温 中进行。酶切10分钟使DNA
片段大小集中在1kb-3kb之间,而后加入2ul 0.1M EDTA 终止反应。合并4管同样的反应体系,用等体积的酚抽提一次,用等体积的酚∶氯仿∶ 异戊醇(25∶24∶1)抽提一次,再用等体积的乙醚抽提一次后,用2.5倍体积的无
水乙 醇沉淀DNA,并用70%乙醇洗沉淀,最后重悬于18ul水中。随后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5单位 的T4DNA聚合酶,11℃ 30分钟,将酶切产物补成平端,75℃终止反应后,加入5单位 的Tth DNA聚合酶及其相应的缓冲液并将体系扩大为80ul,70℃反应20分钟,使DNA的 3’端加dA尾。此混合物经等体积氯仿∶异戊醇(24∶1)抽提和等体积乙醚抽提后与Promega 公司的3×10-3的pGEM-T-Easy载体于16℃连接24小时,总体积为90ul。其中有9ul的 10×buffer和25单位的T4DNA连接酶。最后用1/10体积的3MNaAc(pH5.2)和2倍 体积的无水乙醇沉淀连接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到连接 产物。 实施例4:感受态细胞的制备
参照Bio-Rad公司提供的方法制备感受态细胞大肠杆菌DH5α。取一环大肠杆菌DH5α 单菌落于5ml的LB培养基中,180rpm培养10小时后,取2ml培养物转接到200ml的 LB培养基中,37℃ 250rpm剧烈振荡培养到OD600 0.5左右,然后
冰浴冷却20分钟, 于4℃ 4000rpm离心15分钟。倾尽上清,用冷的冰预冷的去离子灭菌水200ml吹散菌 体,于4℃ 4000rpm离心15分钟。再用冷的冰预冷的去离子灭菌水100ml吹散菌体, 于4℃ 4000rpm离心15分钟。用冷的冰预冷的10%的甘油悬浮细胞,4℃ 6000rpm离心 10分钟,弃上清,最后沉淀用1ml冰预冷的10%的甘油悬浮细胞,即为感受态细胞。将 制得的感受态细胞分装为50ul一管,-70℃保存。 实施例5:电转化感受态细胞
取2-3ul连接产物与50ul感受态大肠杆菌DH5α混合后,转到Bio-Rad公司的0.2cm 的电击杯中电击,
电压为2.5千伏,时间为5.0毫秒-6.0毫秒。电击后立即在杯中加入 1ml的SOC培养基使菌复苏。然后立即将菌涂在含有
氨苄青霉素、X-Gal和IPTG的LB固 体培养基上37℃倒置过夜培养,次日得到蓝白菌落。将得到的白色菌落即白色克隆转到 含有氨苄青霉素的LB固体培养基上培养,同时从每个克隆中提取质粒并用EcoRI酶切鉴 定其中的插入片段的大小,得到的白色克隆群构成了痢疾志贺氏菌12型的O-抗原基因 簇文库。 实施例6:对文库中的克隆测序
从文库中挑选插入片段在700bp以上的120个克隆由上海
生物工程有限公司用 ABI377型DNA自动测序仪对克隆中的插入片段单向进行测序,使序列达到80%的
覆盖率。 剩余20%的序列再根据已得到的序列设计引物,再从痢疾志贺氏菌12型的基因组DNA 中直接PCR并对PCR产物测序,从而获得O-抗原基因簇的所有序列。在痢疾志贺氏菌 12型中我们根据已得到的序列设计了两对引物,如下所示: 5’-GCATGGGTTACTGTACTAGC-3’和3’-AATGGCATCAATACCCGC-5’ 5’-TGGCGGTATTGAGAGAGT-3’和3’-TTACAGGCTACTTCTCTTC-5’ 实施例7:核苷酸序列的拼接及分析
用英国剑桥MRC(Medical Research Council)分子生物学实验室出版的Staden package
软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到痢疾志贺氏菌12型的 O-抗原基因簇的核苷酸全长序列(见序列列表)。序列的
质量主要由两个方面来保证:1) 对痢疾志贺氏菌12型的基因组作6个Long PCR反应,然后混合这些产物以产生文库。 2)对每个碱基,保证3个以上高质量的覆盖率。在得到痢疾志贺氏菌12型O-抗原基因 簇的核苷酸序列后,用美国国家生物技术信息学中心(The National Center for Biotechnology Information,NCBI)的orffinder发现基因,找到10个开放的阅读框,用blast 系列软件与GenBank中的基因比较以发现这些开放的阅读框的功能并确定它们是什么基 因,再用英国sanger中心的Artemis软件完成基因注释,用Clustral W软件做DNA和蛋 白质序列间的精确比对,最后得到痢疾志贺氏菌12型的O-抗原基因簇的结构(见图1)。
通过检索和比较,发现orf1与Shigella boydii和Escherichia coli K12的rmlB基因在 297个氨基酸的序列中都有97%的相同性,表明它们之间有高度的同源性。所以可以确 定orf1是rmlB基因。orf2与Shigella boydii的rmlD基因在299个氨基酸的序列中有98% 的相同性,此外与Escherichia coli K12的rmlD基因的氨基酸序列也有95%的相同性, 表明它们之间有高度的同源性。所以,可以确定orf2是rmlD基因。orf3与Shigella boydii 和Escherichia coli K12的rmlA基因在292个氨基酸的序列中有97%的相同性,表明它们 之间有高度的同源性。所以,可以确定orf3是rmlA基因。orf4与Shigella boydii和 Escherichia coli K12的rmlC基因在179个氨基酸的序列中都有86%的相同性,表明它们 之间也有高度的同源性。所以,可以确定orf4是rmlC基因。此外,在志贺氏菌和大肠 杆菌中,rmlB、rmlD、rmlA、rmlC是专门合成鼠李糖的四个基因,所以可以推知在痢疾 志贺氏菌12型的O-抗原的结构中也有鼠李糖。orf5与Streptococcus thernophilus的 eps4k基因在384个氨基酸的序列中有33%的相同性,51%的相似性,而eps4k基因是一 个糖基转移酶基因,所以orf5也是一个糖基转移酶基因,命名为orf5。orf6与Pseudomonas aeruginosa的wzx基因在410个氨基酸中有30%的相同性,与Shigella bodyii的wzx基因 在410个氨基酸中有35%的相同性,与Edwardsiella ictaluri的wzx基因在402个氨基酸中 有30%的相同性。并且通过Eisenberg等人的
算法[Eisenberg,D,Schwarz,E.etal(1984).Analysis of membrane and surface protein sequences with the hydrophobic moment plot.J.Mol.Biol.179: 125-142]发现orf6有12个潜在的穿膜区,它与许多wzx蛋白相似,而且在wzx蛋白的氨 基端有一个大约50个氨基酸的保守基序,所以可以确定orf6是wzx基因,命名为wzx。 orf7与Thermophilus的Eps10H基因在347个氨基酸序列中有31%的相同性,另外还与 Streptococcus salivariusyou中的cpsJ基因在190个氨基酸序列中有41%的相同性,而 Eps10H基因是一个半乳糖基转移酶基因,cpsJ基因也是一个糖基转移酶基因,所以确定 orf7是一个编码糖基转移酶的基因,命名为orf7。orf8与大肠杆菌O104的wzy基因在 340个氨基酸序列中有27%的相同性,与Shigella boydii的O-抗原聚合酶在320个氨基 酸序列中有23%的相同性,另外通过Eisenberg算法得知orf8有10个潜在的穿膜区,与 其他的O-抗原聚合酶有相似的二级结构,所以确定orf8就是wzy基因,命名为wzy。orf9 与大肠杆菌的O157:H7的wbdN基因在256个氨基酸序列中有33%的相同性,52%的相 似性;另外与Oceanobacillus iheyensis的OB2925基因在240个氨基酸序列中有41%的相 同性,60%的相似性,而这两个基因都是糖基转移酶基因,具有糖基转移酶的特征,所 以确定orf9是一个糖基转移酶基因,命名为orf9。orf10与Campylobacter jejuni的capM 基因在365个氨基酸序列中有27%的相同性,48%的相似性,此外与Erwinia amylovom 的amsD基因在379个氨基酸序列中有30%的相同性,48%的相似性,而这两个基因都 是糖基转移酶基因,所以确定orf10也是一个糖基转移酶基因,命名为orf10。 实施例8:特异基因的筛选
针对痢疾志贺氏菌12型的O-抗原基因簇中的wzx、wzy、orf5、orf7、orf9、orf10基 因设计引物,这些基因在核苷酸序列中的位置见表1。
表1列出了痢疾志贺氏菌12型的O抗原基因簇中糖基转移酶基因和寡糖单位处理 基因及基因内的引物及PCR数据。在表中列出了痢疾志贺氏菌12型的O抗原基因簇的 糖基转移酶基因、转运酶基因和聚合酶基因及它们的相应的功能和大小。在每个基因内, 我们各设计了三对引物,每对引物分布在相应基因内的不同地方以确保其特异性。在表 中还列出了每个引物在SEQ ID NO:1中的位置和大小。以每对引物用表中所列的相应的 退火温度以表2中的所有菌的基因组为模板进行PCR,得到了相应的PCR产物,其大 小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大肠杆菌的基因组中且高度保守的 一个基因,所以我们根据mdh基因设计了引物#101(-TTC ATC CTA AAC TCC TTA TT) 和#102(-TAA TCG CAG GGG AAA GCA GG),然后从166株大肠杆菌中提取基因组, 方法如前所述。用这对引物从166株大肠杆菌的基因组中PCR以鉴定大肠杆菌并检测其 基因组的质量。
表2是用于筛选特异基因的166株大肠杆菌和43株志贺氏菌及它们的来源,为了检 测的方便,我们将它们每8-10个菌分为一组,总共27组,它们的来源都列于表中。
在第25组中含有痢疾志贺氏菌12型的基因组DNA作为阳性对照。以每组菌做模板, 用表1中的每对引物按如下条件做PCR:在94℃预变性2分钟后,94℃变性15秒,退 火温度因引物的不同而不同(参照表1),退火时间是50秒,72℃延伸2分钟,这样进 行30个循环。最后在72℃继续延伸10分钟,反应体系是25ul。反应完毕后,取10ulPCR 产物通过0.8%琼脂糖凝胶电泳检测扩增出的片段。
对于wzx、wzy、orf5、orf7、orf9、orf10基因,每个基因都有三对引物被检测,每对 引物除了在第25组中做PCR后得到了预期大小的正确的一条带外,在第18组中也都得 到同样大小的特异性带。以第18组中的每个菌的基因组DNA做模板PCR后,发现只在 大肠杆菌O152中得到了阳性结果。更详细地说,以上每个基因的每一对引物都在大肠杆 菌O152中得到预期大小的正确的PCR产物带。据报道,痢疾志贺氏菌12型和大肠杆菌 O152的O-抗原结构是一样的,我们的结果从另一个侧面证实了这一点。此外,所有的 引物在其他组中都没有扩增到任何大小正确的带,也就是说,在大多数组中没有得到任 何PCR产物带,虽然在少数组中得到PCR产物带,但其大小不符合预期大小,所以wzx、 wzy、orf5、orf7、orf9、orf10基因对痢疾志贺氏菌12型和大肠杆菌O152及其O-抗原都 是高度特异的。
最后,通过PCR从痢疾志贺氏菌12型中筛选到对痢疾志贺氏菌12型和大肠杆菌 O152的O-抗原高度特异的基因:wzx、wzy和四个糖基转移酶基因。而这些基因内的任 何一段10-20nt的寡核苷酸对痢疾志贺氏菌12型和大肠杆菌O152的O-抗原是特异的, 尤其是上述每个基因中的引物即寡核苷酸对经PCR检测后证实对痢疾志贺氏菌12型和 大肠杆菌O152是高度特异的。所有的这些寡核苷酸都可用于快速准确地检测人体和环境 中的痢疾志贺氏菌12型和大肠杆菌O152,并能鉴定它们的O-抗原。
序列列表
SEQUENCE LISTING
<110>南开大学
<120>对痢疾志贺氏菌12型和大肠杆菌O152的O-抗原特异的核苷酸
<130>对痢疾志贺氏菌12型和大肠杆菌O152的O-抗原特异的核苷酸
<160>1
<170>PatentIn version 3.1
<210>1
<211>12235
<212>DNA
<213>Shigella dysenteriae
<400>1
attgtggctg cagggatcaa agaaatcctc ctggtaactc acgcgtccaa gaacgcggtc 60
gaaaaccact tcgacacctc ttatgaatta gaatctctcc ttgagcagcg cgtgaagcgt 120
caactgttag cggaagttca gtccatctgc ccgccgggcg tgactattat gaacgtgcgt 180
cagggcgaac ctttaggttt gggccactcc attttatgtg cacgacctgc cattggtgac 240
aacccatttg tcgtggtact gccagacgtt gtgatcgatg acgccagcgc cgacccgctg 300
cgctacaacc ttgcagccat gattgcacga ttcaacgaaa cgggtcgtag ccaggtgctg 360
gcaaaacgca tgccggggga cctctctgaa tactctgtca tccagaccaa agagccgctg 420
gatcgtgaag gcaaagtcag ccgcattgtt gaatttatcg aaaaaccgga tcagccgcag 480 acgttggagt cagacatcat ggccgttggt cgctatgtgc tttctgccga tatttggccg 540 gaacttgaac gcacgcagcc aggtgcatgg gggcgtattc agctgactga tgccattgcc 600 gaactggcga aaaaacagtc cgttgatgcc atgctgatga caggtgacag ctacgactgc 660 ggtaaaaaaa tgggttatat gcaggcattt gtgaagtatg gactacgcaa cctgaaagaa 720 ggggcgaagt tccgtaaagg cattgagaag ctgttaagcg aataatgaaa atctgaccgg 780 atgtaacggt tgataagaaa attataacgg cagtgaagat tcgtggcgaa agtaatttgt 840 tacgaatttt cctgccgttg ttttatataa acaatcagaa taacaacgag ttagcaatag 900 gattttagtc aaagttttcc aggattttcc ttgtttccag agcggattgg taagacaatt 960 agcgtttgaa tttttcgggt ttagcgcgag tgggtaacgc tcgtcacatc gtagacatga 1020 atgcagtgct ctggtagctg taaagccagg ggcggtagcg tgcattaata cctctattaa 1080 tcaaactaag agccgcttat ttcacagcat gctctgaagt aatatggaat aaaagagtga 1140 agatacttgt tactggtggc gcaggattta ttggttctgc tgtagttcgt cacattataa 1200 ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga aacctggaat 1260 cacttgctga tgtttctgat cctgaacgct atatttttga acatgcggat atttgcgatg 1320 ctgctgcaat ggcacggatt tttgctcagc atcagccgca tgcagtgatg cacttggctg 1380 ctgaaagcca tgttgaccgt tcaattacag gtcctgcggc atttattgaa accaatattg 1440 ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt gatagcgaca 1500 agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt gatttgcctc 1560 atcctgacga ggtaaataat aaagaacaat tacccctctt tactgagacg acagcttacg 1620 cgccaagtag cccatattct gcttcgaaag catcaagcga tcatttagtc cgcgcttgga 1680 aacgtaccta tggtttaccg accattgtga ctaattgttc gaataactac ggtccttatc 1740 actttccgga aaaattgatt ccactagtaa ttcttaatgc tctggaaggt aaggcattac 1800 ctatttatgg caaaggggat caaattcgtg actggctgta tgttgaagat catgcgcgtg 1860 cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt ggtggacaca 1920 acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgttggat gagattgtac 1980 cgaaagagaa atcttatcgt gagcaaatta cttatgttgc cgaccgcccg ggacatgatc 2040 gccgttatgc gattgatgct gagaagatta gccgcgaatt gggttggaaa ccacaggaaa 2100 cgtttgagag cgggattcgt aaaacggtgg aatggtacct ggctaatgca aaatgggtcg 2160 agaatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag ggccgccagt 2220 aatgaatatt ctccttttcg gcaaaacagg gcaggtaggt tgggaactac agcgtgctct 2280 ggcacctttg ggtaatttga ttgctcttga tgttcactcc actgattatt gtggtgattt 2340 tagtaatcct gaaggtgtgg ctgaaaccgt caaaaaaatt cgccctgatg taattgttaa 2400 tgctgcggct cataccgcag tagataaggc tgagtcagaa cccgaatttg cacaattact 2460 caatgcgacc agcgttgaat caattgccaa agcggctaat gaagttgggg cctgggtaat 2520 tcattactca actgactacg tatttccggg aaccggtgaa ataccatggc tggagacgga 2580 tgcaaccgca ccgctaaatg tttacggtga aaccaagtta gccggagaaa aagcgttaca 2640 ggaacattgc gcgaagcatc ttattttccg taccagctgg gtatacgcag gtaaaggaaa 2700 taacttcgcc aaaacgatgt tgcgtctggc aaaagagcgc gaagaactgg ctgtgattaa 2760 tgatcaattt ggtgcgccaa caggtgctga gctgctggca gattgtacgg cacatgctat 2820 tcgtgtggca ctgaataaac cagaagtcgc aggcatgtac catctggtag ccagtggtac 2880 cacaacctgg cacgattatg ctgcgctggt ttttgaagag gcgcgcaaag caggtattcc 2940 ccttgcactc aacaagctca acgcagtacc agcaacagcc tatcctacac cagctcgtcg 3000 tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc ttgtcttgcc 3060 tgactggcag gttggcgtga aacgaatgct taacgaatta tttacgacta cagcaattta 3120 atagtttttg catcttgttc gtgatggtgg aacaagatga attaaaagga atgatgaaat 3180 gaaaacgcgt aaaggtatta ttttagcggg gggggctggt actcgtcttt atcctgtgac 3240 tatggctgta agcaaacagc tgttaccgat ttatgataaa ccgatgatct attacccgct 3300 ttctacactg atgttagcgg gtattcgcga tattctgatt atcagtacgt cacaggatac 3360 tcctcgtttt caacaactgc tgggtgatgg gagccagtgg gggctaaatc ttcagtacaa 3420 agtgcaaccg agtccagatg gtcttgcgca ggcatttatc atcggtgaag agtttatcgg 3480 tggtgatgat tgtgctctgg ttctcggtga taatatcttt tacggtcacg atctgccgaa 3540 gttaatggat gtcgctgtca acaaagaaag tggtgcaacg gtatttgcct atcacgttaa 3600 tgatcctgaa cgctacggtg ttgttgagtt tgataaaaac ggtacggcaa tcagcctgga 3660 agaaaaaccg ctacaaccaa aaagtaatta tgcggtaacc gggctttatt tctatgataa 3720 cgacgttgtc gaaatggcga aaaaccttaa gccttctgcc cgtggtgaac tagaaattac 3780 cgatattaac cgtatttata tggaacaggg gcgtttatcc gttgccatga tggggcgtgg 3840 ttatgcatgg ctggatacgg ggacacatca gagtcttatt gaagcaagca acttcattgc 3900 caccattgaa gagcgccagg gactaaaggt ttcctgccca gaagaaattg cttaccgtaa 3960 agggtttatt gatgctgagc aggtgaaagc attagctgaa cctctgaaaa aaaatgctta 4020 tggtcagtac ctgataaaaa tgattaaagg ttattaataa aatgaatgtt attaaaacag 4080 aaatcccaga tgtattgatt tttgaaccga aagtttttgg tgatgagcgt ggtttctttt 4140 ttgagagctt taaccagaag gtttttgagg aagctgtagg ccgcaaagtt gaatttgttc 4200 aggataacca ttcgaagtct agtaaaggcg ttttacgcgg actgcattat cagttagaac 4260 cttatgcgca aggaaaattg gtacgctgtg ttgttggtga ggtttttgat gttgcggttg 4320 atattcgtaa atcgtcccct acttttggca aatgggttgg ggtgaatttg tctgctgaga 4380 ataagcgcca gttgtggata cctgaaggat ttgcgcatgg atttttggtg ctgagtgaga 4440 ctgcggagtt tgtttataag acaactaatt attatcatcc ggaaagtgac agaggtatta 4500 gatgggatga cccctatata ggaattaaat gggagaatga gtacaatgta agattgtcag 4560 ataaagataa aaaaaatcca acaatgaaag acgttttttt gtttatgtaa gtaataggct 4620 tttatatgaa aaaaaatatt atcgcatatt atcttcctca atatcatgag gttaaagaaa 4680 ataatgagtg gtgggggaaa ggatttactg aatggacagc tttaaaaaaa gcaaagaaat 4740 atttcccttc tcaaaaaata agattgccta ctgattttct tggatattat gatttgacag 4800 aatcacgtat tatcgagaag cagtttgaac tagctgaaga aaatggtgta agtgggtttt 4860 gtctatggac atattggttc ggtaatggag aaaaaatttt agaaaaacct cttactctta 4920 ttcttgaaaa caaacttaat gttcgatact gtgtggcatg ggcaaaccac tcttggtaca 4980 ataaatcaaa agggctactt ttaaaagagc aaaaatacct tggagaaaaa gattatactg 5040 atttcttcta ttacttactt cctcatttta agtcagataa ttatctaaaa aaagataata 5100 agccaattgt aacaatcttt gatcctaatt ccataccaga tttgtttttg tttatatccc 5160 tttggaataa tcttgcaaaa gagaacggat acgagggtat ctattttatc ggggatttca 5220 catcgtataa ttcaaattat gtaggagtat ttgatggtta tttggattct agagtaatgt 5280 acaggaagag aacctttatt caaaaggtga gggagaaatt agttcgaaag catagagtga 5340 aatttttggg gcctataagg tataattatg aaaaaatgat aagctcatta tggcacaatc 5400 agacaaagga tataaaagag attccaatta tattttctgg atgggataca acgatacgac 5460 atggaaaaca gggggttttt tatagtgatt tctctgagca ttcgtttgag gttaatgtta 5520 aaaatgctat aaattataac ccacaacaag atattgtttt cttaaaatca tggaatgaat 5580 gggctgaggg aaatacagtt gaaccagaca ctatattctc agataaatta cttagaataa 5640 tttcaaaata caataaatac tgatgagaaa aaatatattt tatttactgt tggtgcagtt 5700 atctaactat attttcccac tgattacatt accatatctt gtcagaactt taggagtaga 5760 taaatttgga tatcttatgc ttggtcaagc attgattcaa tactttattt tgatgactga 5820 ttacggtttt aatttcagtg caacaaaaaa aatagctaca tcaacaagta ttgatgaaag 5880 aaatgaagtc tacacagaga cattaaatgc caaaatgata ttggtgacat tatgtttatt 5940 cttgatgtta atcattatta atatcatacc aatgtttcac tctatatcta tagtttgcat 6000 aatacttttt attggggttc taggtaatat tttttttcca gtctatctgt ttcaaggtat 6060 ggagaaaatg aaaagtattg catgggttac tgtactagca aggaccttga tgttgttatc 6120 tgtctttctg tttgtaaaag ataataatga tatcaatgct gctgcactag ctttttctat 6180 tgcgcttatc gttccaggga tgatgtcaat ttatctaata cgaaaaaacc acattgttgc 6240 ttataaaggg ttttcttttt caaaagcctt tatcgctatt aaagcaagta cacctttgtt 6300 tatttctcaa atcgctataa cattttatac tacttttaat tcgatactta tagggcatgt 6360 atttaatgca aggcaagtag gtatttattc tgcagcagac aagttaagag gcgcggttca 6420 atctttattt attcctatac aacaggttgt gtttccgaga ataaatgttg agcgtggaaa 6480 tataaaggaa aaactaaagt tttacggtag tctttttatt ttattttcat taattatatg 6540 tgtgtcgata tttttaattg gagataagat tgttatttta tacttcggaa ctcagtatgc 6600 tgagtcagct aatttattta aatggatgtc agtccttatt tttattgtct ctgtcgctat 6660 tgtcttttca caatggggaa tgataacttt aggtagagaa aaaatgttaa caaaaattta 6720 tattgtcggt gccttattgc attgcacgta tgctcctttc ttcactaaaa atttcgggct 6780 ttttggtacg ttaacggcag taatattgac agagttaaca attaccgtag ttatgggcgt 6840 gtttttgtac aagataatta aaaggcataa ataaaaatga aaagcaacac aattgacatt 6900 gtaattccat gggtagatag ttctgatcct aaatggcaag aggattatat gaagtttgca 6960 tgtgaacaaa gaaatgttga tgcaaatatt catcgttata gagataatgg gttattaaaa 7020 ttctggtttc gtggcattga aaaaaatgcc ccttggatta ggaaagttca ttttattaca 7080 tatggacatg ttccggcgtg gcttaagcaa gatcacccta aattacatat tgtaaagcgc 7140 tccgactata taccccaaaa atacctacca acatttaata gccatgttat tgaattaaat 7200 ttgcataaaa tagatggatt gagtgataag ttcatctatt ataatgacga tacatttttg 7260 attaatccag tagatgaaag tttttacttc aaaaatggaa agcctcgaga ttgtgcaatc 7320 ctgaacgcag ttcaacctga tgggctttca catgttattt taaataatct ttcaattatc 7380 aataagcatt tttgtaaaaa acaggtgatc agaaaaaata ttttaaaatg gataaatgtt 7440 aaatatggtg cggcgttaag tagaacgata tgtctaatgc cttggccgaa gtttgtaggt 7500 atcaaagata ctcatcttcc aattccttat cttaagtcaa catttgataa attatgggag 7560 ctcgagccag aaatattaaa tgctacaaat cggtcaaaat ttagacagaa ttcagatatt 7620 aatcaatatc tctttagata ttggcagtta gtttcagggg agtttgaatg ctctaataca 7680 atggcatctt cagcctattt agatataggt aaggatagta ttataaaaat tcgaaaggaa 7740 ctattttgtt caagaaataa acttgttgtt ataaatgatg ctgatacttt ggaattcgat 7800 tccaaaacaa aaaaaataca agaagaattt gcaaagatat ttccttttaa atcaacgttt 7860 gaaatataat acggtagaaa aatgttattt acctacgcct catatttatg tatattggtg 7920 ttttctacat cggttgcatt ttgttacgaa cattcaaaaa gtaattttaa agtattgcta 7980 tggtcagtat tgtttttgtc tctttggata cctgcagcaa ttcgttttgg agtaggcgct 8040 gattacttcc gatatttaag tatggttgaa tcagttaggt tgggatatat ttctactgaa 8100 gttggatttt attttataaa ttattttgtt gtttggtttg atttaaatcc acaatggtct 8160 attgcaatat caagtttcat tgtaatcttt ttaagtttga aggcgattcc acgaaactat 8220 ttttctgttt cagtttttgt tttagtatgt accttttatc tgccttcgtt ttctcttgtt 8280 agacaagcta ttgctatagc tttcatagcg tatgcagtga aaaattatat cgatggtaat 8340 aaaaaaaact atattatttt tattttgata ggctctctat ttcatctctc ggcattatta 8400 cttgtaccca tttattttat tgcgcgattt agagtccgta gttcaattct ctttttgggt 8460 attttaataa taagtttatt gctattcctg ggtagtggat taaatgcact tttgaatagt 8520 gagttttttt tacaaagcaa atacggttat tacgcaacaa gtgatttcat acaggatgct 8580 aaaatcggaa gtggggtagg tgtatttatc aaaatgctat tacctttaat ttttataaca 8640 aacgcaaaaa aaatactaaa aacaaatcag aatcttaata ttctattgtg gatgtctgtt 8700 ggatgtgtgc ttgctaatgt atgttcaatg aagattcata tttttaatcg tctagcagat 8760 atattccttt ttgttaattt catggtaacc tcatatatta tcaattcatt agaaaaaaat 8820 gttataaaac aattatcttc aatggcaatt attattgttt ttattgtgtt ttattgcaga 8880 acaattcagg ccaattataa tgatgattta ggtggcattg gtatttctcc ctacaaaaca 8940 atactttcta agtgatatta tggatgatta tttagtatca attattatgc cttcatataa 9000 cgcagagcat acgatttctg catcaattag ttccgtgtta aagcaaacat atgctaactg 9060 ggaattgctc gtttgcgatg atgattcaag tgataataca agatttaaag ttttggagtt 9120 ttctgattca agaattaaac ttttaacaaa tgaatacgca aaaggtgcag caggtgctag 9180 aaataccgct ctaaaatatg caagcggccg atttatagct ttcttagata gtgatgatat 9240 atggatcgct aacaaattag agatgcaaat atctatgatg ctaaagaata atatttcttt 9300 tatgtatggt aattatgaaa ttataaataa taattcaata gttggtaagt ttgtagctcc 9360 ccaaaaaatc acgtacaaca aattgctaaa aaattgtggt attggttgtt tgactgtcgt 9420 tttagacagg actttactaa atcctttcag ctttcctttc gtgcataaag aagattatta 9480 tctatggctg agtattctaa aagataacaa tattagtgca attaattgcg gctttatttg 9540 ttctaaatat agactttcac aaagttcaat ttcatctaat aaatttaaag agttgaaaag 9600 gcaatgggat gttttggggg attttgttga aaacccattg gctcggatat attatttgct 9660 aaattatatt gttatcggta taaagaaaca tgcttttgac tataaaaacg gtaaaaaatg 9720 aaaaaaatag cttttgtaat tgctgatatt acatttgttg gcggtattga gagagtaaat 9780 acaatacttg ccaataaatt tatcagcgaa ggatactctg tagaaataat atctctctat 9840 aaaactaatc taaaaattaa ttacgagctt gacaatcaca ttaaaattag ttttgttaat 9900 gatggctctt atttaggtga gcctggaagt tttggacggc tgaagaaaca catagggtca 9960 cagtttaaat tatttaaagc cattaaaaag tcaaatgctg atttttatat cattaataca 10020 ttccctatgg cttttttgtc atttttcagt ctcttttcaa aaaaaaagta tgttgttatt 10080 gaacatgtac attatgacta ttatagtgca attgttagag cattaagaaa tttattgtat 10140 agattctttt ataaagtaat ctgtattaat aaaaatgact tgtataagtt ttctaaacat 10200 ttagataatg ttgttaaaat tagtaacccg ctgagttttt cttgttcaaa agtagctgat 10260 ttaagcgcaa aaaaaattat ggcggttggc aggctagagc atcaaaaggg ttttgattta 10320 ttaatagata tttttgcgaa agttaacaaa tcaaatcctg gttgggaact ccatatttat 10380 ggtgtcggaa cgtgcgaaaa atttctcaca gataaaataa ataagcatgg attaaataat 10440 gtaaaactga tgggaagtgt cgatcatata caacaatatt atcctaaata ttccattttt 10500 gcattctcat caaggtttga agggttcggg atggtgttat tggaagcaat ggaatgtggt 10560 ttgccatgta tttcatttga ttgccctacc ggcccatctg aaatattagg ggatggggag 10620 tatggaatct tagttgagaa tgggaatctt attaaattta gcgcggaatt agcgaattta 10680 atgtccgatg aagagaagaa aattaaattt tcaattttat caaagagtcg tgcacaagag 10740 tttaatatag acaagatttt tgacgaatgg agaaagttaa taagttagta cttatagtaa 10800 atgactgaaa acgttgtaca aataatttat atcaaaaggt tgcttattcg attaatataa 10860 ttaaataagt tacctagccc tgacaggagt aaacaatgtc aaagcaacag atcggcgtcg 10920 tcggtatggc agtgatgggg cgcaaccttg cgctcaacat cgaaagccgt ggttataccg 10980 tctctatttt caaccgttcc cgtgaaaaga cggaagaagt gattgccgaa aatctaggca 11040 agaaactggt tccttactat acggtgaaag agtttgttga atctctggaa acgcctcgtc 11100 gcatcctgtt aatggtgaaa gcaggtgcag gcacggatgc tgctattgat tccctcaagc 11160 catacctcga taaaggtgac atcatcattg atggtggtaa caccttcttc caggacacca 11220 ttcgtcgtaa ccgtgagctt tctgcagaag gctttaactt tatcggtacc ggtgtttccg 11280 gtggtgaaga aggcgcgctg aaaggtcctt ccattatgcc tggtgggcag aaagaagcct 11340 atgaactggt tgcgccgatc ctgaccaaaa tcgccgcagt ggctgaagac ggtgagccat 11400 gcgttaccta tattggtgcc gatggtgcag gtcactatgt gaagatggtt cacaacggta 11460 ttgaatacgg tgatatgcaa ctgattgctg aagcctattc tctgcttaaa ggtggtctga 11520 acctctccaa cgaagaactg gcgcagacct ttaccgagtg gaataacggt gaactgagca 11580 gctacctgat tgacatcact aaagacatct tcactaaaaa agatgaagac ggtaactacc 11640 tggttgatgt gattctggat gaagcagcta acaaaggtac cggtaaatgg accagccaga 11700 gcgcgctgga tctcggtgaa ccgctgtcgc tgattaccga gtctgtgttt gcacgttata 11760 tctcttctct gaaagatcag cgtgttgccg catctaaagt tctctctggc ccgcaagcac 11820 agccagcagg cgacaaggct gagttcatcg aaaaagttcg ccgtgcgctg tatctgggca 11880 aaatcgtttc ttacgctcag ggcttctctc agctacgcgc cgcgtctgaa gagtacaact 11940 gggatctgaa ctacggtgaa atcgcgaaga ttttccgtgc tggctgcatc atccgtgcgc 12000 agttcctgca gaaaatcacc gatgcatatg ccgaaaatcc gcagatcgct aacctgatgc 12060
tggctccgta cttcaagcaa atcgccgatg actaccagca ggcgctgcgc gatgtcgtcg 12120
cttacgcggt acagaacggt atcccggttc cgaccttcgc cgctgcggtt gcctattatg 12180
acagctaccg cgccgctgtt ctgcctgcga acctaatcca ggcacagcgc gacta 12235 表1 痢疾志贺氏菌12型O抗原基因簇中的糖基转移酶基因和寡糖单位处理基因及其中的
引物及PCR数据 基因 功能 基因的碱基位置 正向引物 反向引物 PCR产物 长度 产生正确 大小电泳 带的组数 PCR的退火 温度(℃) Orf5 糖基转 移酶 4626-5663 #221(4866-4886) #222(5573-5591) 762bp 0 52 #223(5156-5176) #224(5587-5595) 440bp 0 52 #241(4641-4660) #242(5302-5320) 680bp 0 50 wzx 转运酶 5663-6874 #225(6189-6207) #226(6731-6750) 562bp 0* 54 #227(5713-5733) #228(6724-6741) 1029bp 0 57 #237(6463-6481) #238(6821-6839) 377bp 0 57 orf7 糖基转 移酶 6877-7869 #229(7024-7041) #230(7779-7800) 777bp 0 57 #243(6972-6992) #244(7578-7596) 625bp 0 50 #245(7131-7148) #246(7693-7674) 513bp 0 55 wzy 聚合酶 7882-8955 #235(7883-7903) #236(8903-8921) 1039bp 0 52 #253(8049-8069) #254(8876-8894) 846bp 0 59 #255(8197-8214) #256(8689-8709) 513bp 0 59 orf9 糖基转 移酶 8960-9721 #231(9020-9040) #232(9630-9647) 628bp 0** 52 #233(8982-9000) #234(9443-9462) 463bp 0 57 #247(9165-9183) #248(9525-9543) 378bp 0 58 orf10 糖基转 移酶 9718-10788 #239(9752-9770) #240(10567-10586) 863bp 0*** 55 #247(9165-9183) #248(9525-9543) 378bp 0 59 #249(9934-9952) #250(10513-10530) 597bp 0 55 * 在一组中得到一条错误大小的带 ** 在三组中都得到一条错误大小的带 ***在一组中得到三条错误大小的带 表2 166株大肠杆菌和43株志贺氏菌及它们的来源 组号 该组中含有的菌株 来源 1 野生型大肠杆菌O1,O2,O3,O4,O10,O16,O18,O39 IMVSa 2 野生型大肠杆菌O40,O41,O48,O49,O71,O73,O88,O100 IMVS 3 野生型大肠杆菌O102,O109,O119,O120,O121,O125,O126,O137 IMVS 4 野生型大肠杆菌O138,O139,O149,O7,O5,O6,O11,O12 IMVS 5 野生型大肠杆菌O13,O14,O15,O17,O19ab,O20,O21,O22 IMVS 6 野生型大肠杆菌O23,O24,O25,O26,O27,O28,O29,O30 IMVS 7 野生型大肠杆菌O32,O33,O34,O35,O36,O37,O38,O42 IMVS 8 野生型大肠杆菌O43,O44,O45,O46,O50,O51,O52,O53 IMVS 9 野生型大肠杆菌O54,O55,O56,O57,O58,O59,O60,O61 IMVS 10 野生型大肠杆菌O62,O63,O64,O65,O66,O68,O69,O70 IMVS 11 野生型大肠杆菌O74,O75,O76,O77,O78,O79,O80,O81 IMVS 12 野生型大肠杆菌O82,O83,O84,O85,O86,O87,O89,O90 IMVS 13 野生型大肠杆菌O91,O92,O95,O96,O97,O98,O99,O101 IMVS 14 野生型大肠杆菌O112,O162,O113,O114,O115,O116,O117,O118 IMVS 15 野生型大肠杆菌O123,O165,O166,O167,O168,O169,O170,O171 See b 16 野生型大肠杆菌O172,O173,O127,O128,O129,O130,O131,O132, See c 17 野生型大肠杆菌O133,O134,O135,O136,O140,O141,O142,O143 IMVS 18 野生型大肠杆菌O144,O145,O146,O147,O148,O150,O151,O152 IMVS 19 野生型大肠杆菌O153,0154,O155,O156,O157,O158,O159,O164 IMVS 20 野生型大肠杆菌O160,O161,O163,O8,O9,O124,O111 IMVS 21 野生型大肠杆菌O103,O104,O105,O106,O107,O108,O110 IMVS 22 鲍氏志贺氏菌血清型B4,B5,B6,B8,B9,B11,B12,B14 See d 23 鲍氏志贺氏菌血清型B1,B3,B7,B8,B10,B13,B15,B16,B17,B18 See d 24 痢疾志贺氏菌血清型D1,D2,D3,D4,D5,D6,D7,D8 See d 25 痢疾志贺氏菌血清D9,D10,D11,D12,D13 See d 26 弗氏志贺氏菌F6a,F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v:7)F5(v:4) See d 27 宋内氏志贺氏菌D5,DR See d a. Institude of Medical and Veterinary Science,Anelaide,Australia b. O123 from IMVS;the rest from Statens Serum Institut,Copenhagen,Denmark c. 172 and 173 from Statens Serum Institut,Copenhagen,Denmark,the rest from IMVS d. 中国
预防医学科学院流行病学研究所