首页 / 专利库 / 纳米技术 / 芯片实验室 / 对大肠杆菌O164的O-抗原特异的核苷酸

对大肠杆菌O164的O-抗原特异的核苷酸

阅读:434发布:2021-02-20

专利汇可以提供对大肠杆菌O164的O-抗原特异的核苷酸专利检索,专利查询,专利分析的服务。并且本 发明 提供一种对大肠杆菌O164(Escherichiacoli O164)的O- 抗原 特异的核苷酸,它是大肠杆菌O164中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO:1所示的分离的核苷酸,全长14006个 碱 基;或者具有一个或多个插入、缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ ID NO:1的核苷酸;还包括源于大肠杆菌O164的O-抗原基因簇中IS和wzx基因的寡核苷酸;本发明通过PCR证实寡核苷酸对大肠杆菌O164的O-抗原都有高度的特异性;本发明还公开了用本发明的寡核苷酸检测和鉴定人体及环境中的大肠杆菌O164的方法。,下面是对大肠杆菌O164的O-抗原特异的核苷酸专利的具体信息内容。

1.一种对大肠杆菌O164的O-抗原特异的核苷酸,其特征在于,其是如SEQID NO:1所示的分离的核苷酸,全长14006个基;或者具有一个或多个插入、缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ ID NO:1的核苷酸。
2.按照权利要求1所述的对大肠杆菌O164的O-抗原特异的核苷酸,其特征在于,其包括命名为IS序列和wzx,orf2,orf3,orf4,orf5,wzy,orf7,glf,orf9的9个基因组成,都位于galF基因和gnd基因之间。
3.按照权利要求2所述的对大肠杆菌O164的O-抗原特异的核苷酸,其特征在于,所述的基因包括:转运酶基因,包括wzx基因或与wzx有相似功能的基因;聚合酶基因,包括wzy基因或与wzy有相似功能的基因;糖基转移酶基因,包括orf4、orf5、orf7、orf9基因,其中所述的转运酶基因是SEQID NO:1中的2518至4011碱基的核苷酸;所述的聚合酶基因是SEQ ID NO:1中的8424至9527碱基的核苷酸;orf4基因是SEQ ID NO:1中的6561至7565碱基的核苷酸;orf5基因是SEQ ID NO:1中的7562至8350碱基的核苷酸;orf7基因是SEQ ID NO:1中的9556至10605碱基的核苷酸;orf9基因是SEQID NO:1中的11845至12618碱基的核苷酸。
4.按照权利要求1或2所述的对大肠杆菌O164的O-抗原特异的寡核苷酸,其特征在于,其分别源于所述的IS序列和相邻的wzx基因;以及它们的混合或它们的重组。
5.按照权利要求4所述的对大肠杆菌O164的O-抗原高度特异的核苷酸,其特征在于,所述的源于IS序列的寡核苷酸作为上游引物,它们是:SEQ ID NO:1中的1868至1885碱基的核苷酸SEQ ID NO:1中的2265至2284碱基的核苷酸所述的源于wzx基因的寡核苷酸作为下游引物,它们是:SEQ ID NO:1中的3020至3050碱基的核苷酸SEQ ID NO:1中的2809至2827碱基的核苷酸
6.权利要求1所述的对大肠杆菌O164型的O-抗原特异的核苷酸在检测表达O-抗原的细菌、鉴定细菌的O-抗原和细菌的其它多糖抗原中的应用。
7.权利要求1所述的对大肠杆菌O164型的O-抗原特异的核苷酸的重组分子,在通过插入表达而提供表达大肠杆菌O164型的O-抗原,以及制备细菌疫苗中的应用。
8.按照权利要求1所述的对大肠杆菌O164型的O-抗原特异的核苷酸的应用,其特征在于,它作为引物用于PCR、作为探针用于杂交反应与荧光检测、或者用于制造基因芯片或微阵列,供检测细菌的应用。
9.权利要求1所述的对大肠杆菌O164型的O-抗原特异的核苷酸的分离方法,这些方法是基于我们已经得到了痢疾志贺氏菌3型的O-抗原基因簇的全序列,并申请专利。在此基础上,我们又按如下方法破译了大肠杆菌O164型的O-抗原基因簇的全序列。其特征在于,其包括下述步骤:(1)基因组的提取:提取大肠杆菌O164的基因组(2)引物的设计:在痢疾志贺氏菌3型的O-抗原基因簇中的相邻的或相隔的两个基因内设计上下游引物;要求上下游引物分别位于相邻的两个基因或相隔的基因内。每一对引物按如下步骤进行试验。(3)通过PCR扩增大肠杆菌O164中的O-抗原基因簇的相应序列:用每对分布在相邻基因内的上下游引物,以大肠杆菌O164型的基因组为模板进行PCR。每对引物将得到不同大小的PCR产物。将得到的PCR产物,通过琼脂糖凝胶电泳检测PCR产物的大小及其特异性。合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定,并再设计引物和测序直到从两端将每个PCR产物的序列测通。(4)核苷酸序列的拼接及分析:应用生物信息学软件拼接和编辑上述得到的所有的核苷酸序列。(5)对不准确的序列再次测序:以不准确的序列的两侧的序列为模板设计引物,并以大肠杆菌O164型的基因组为模板进行PCR。通过琼脂糖凝胶电泳检测PCR产物的大小及其特异性,合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定。(6)再次进行核苷酸序列的拼接及分析:将新得到的序列加入到原有的序列中再次拼接并编辑所有的核苷酸序列。最终得到大肠杆菌O164型的O-抗原基因簇的准确的全序列。用生物信息学软件对得到的序列进行序列的比对和分析,并用Artemis软件做基因的注释。(7)特异基因的筛选:在比较了大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇后,针对大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇的不同序列即IS序列及相邻的wzx基因设计引物;上游引物分布在IS序列内,下游引物分布在IS序列和wzx基因内,以确保其对大肠杆菌O164型的特异性;用这些引物以166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,确定它们对大肠杆菌O164型的O-抗原的高度特异性;(8)引物灵敏度的检测:培养大肠杆菌O164,细菌计数后分别将5×103,5×102,5×101,5个和0个活菌加入到一定量的某种待检测物中,混入细菌的待检测物作为检测用样品,将样品加入LB培养基,取一些与样品混合过的LB培养基过滤,将过滤液进行培养,从培养好的菌液中取数毫升处理后作为PCR模板用寡核苷酸进行PCR反应,检测其对大肠杆菌O164的灵敏度
10.权利要求9所述的对大肠杆菌O164的O-抗原特异的核苷酸的分离和鉴定方法,其特征在于,包括下述步骤:(1)基因组的提取:在5mL的LB培养基中37℃过夜培养大肠杆菌O164,离心收集细胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温育2小时,再加入3ul 10mg/ml的RNase,65℃温育30分钟。加等体积酚抽提混合物,取上清液,再用等体积的酚∶氯仿∶异戊醇(25∶24∶1)的溶液抽提两次,取上清液再用等体积的乙醚抽提以除去残余的酚,上清液用2倍体积乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,最后将DNA重悬于30ul TE中,基因组DNA通过0.4%的琼脂糖凝胶电泳检测;(2)引物的设计:在痢疾志贺氏菌3型的O-抗原基因簇中的相邻的或相隔的两个基因内设计上下游引物;要求上下游引物分别位于相邻的两个基因或相隔的基因内。设计的引物如下:galF基因的引物为5’-ATT GTG GCT GCA GGG ATC AAA GAA ATC-3’,编号为#1523;wzx基因的引物为3’-GGCACTTACGTCGTATA-5′,引物编号为#82;wzx基因的引物为5’-TGTGCAGAGTTCAGGGAG-3’,引物编号为#100;Orf2基因的引物为3′-GCAAAGTCCTCACCGTA-5′,引物编号为#hp-2;Orf2基因的引物为5′-AGCGTGTTTGTCCCTTTA-3′,引物编号为#hp-1;Orf3基因的引物为3′-ATTAGAAGTATTCCCTTTCC-5′,引物编号为#hp-4;Orf3#基因的引物为5′-AGGACGCATCATCAATCT-3′,引物编号为#hp-3;Orf4基因的引物为3′-ACACCTATCCGAAAGACTT-5′,引物编号为#72;Orf4基因的引物为5′-AAGGAGTTGCCTATACACG-3′,引物编号为#204;Orf5基因的引物为3′-CTAACCACGTCCGAAATA-5′,引物编号为#209;Orf5基因的引物为5′-TGGAGTATGAGCCAAAGAA-3′,引物编号为#208;wzy基因的引物为3′-GCTTATTTCACGCTGGATCT-5′,引物编号为#58;wzy基因的引物为5′-TTTGTTTCTGATATATGCGGT-3′,引物编号为#57;Orf7基因的引物为5′-CGAAATTCAATGGTGGTC-3′,引物编号为#214;Orf7基因的引物为5′-TTCAATGGTGGTCTCTCA-3′,引物编号为#75;Orf9基因的引物为3′-TGAAGGGCAATATACCGC-5′,引物编号为#78;Orf9基因的引物为5′-TGGACGATGATTGTATGC-3′,引物编号为#213;gnd基因的引物为5’-TAG TCG CGC TGN GCC TGG ATT AAG TTC GC-3’,引物编号为#1524.(3)通过PCR扩增大肠杆菌O164中的O-抗原基因簇的相应序列:用每对分布在相邻基因内的上下游引物,以大肠杆菌O164型的基因组为模板进行PCR。PCR反应程序如下:在95℃预变性3分钟,然后95℃变性15秒,退火温度因引物的不同而不同(见表中),退火时间是50秒,72℃延伸时间因引物的不同而不同(见表中),这样进行30个循环;最后,在72℃继续延伸10分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小及其特异性;合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定,并再设计引物和测序直到从两端将每个PCR产物的序列测通。(4)核苷酸序列的拼接及编辑:用英国剑桥MRC(Medical ResearchCouncil)分子生物学实验室出版的Staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O164的O-抗原基因簇的核苷酸的全长序列。(5)对不准确的序列再次测序:以不准确的序列的两侧的序列为模板设计引物,并以大肠杆菌O164型的基因组为模板进行PCR。通过琼脂糖凝胶电泳检测PCR产物的大小及其特异性,合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定。(6)再次进行核苷酸序列的拼接及分析:用Staden package软件包的Pregap4将新得到的序列加入到原有的序列中再次拼接,并用Gap4软件编辑所有的核苷酸序列。最终得到大肠杆菌O164型的O-抗原基因簇的准确的全序列。在得到大肠杆菌O164的O-抗原基因簇的核苷酸序列后,用美国国家生物技术信息学中心(The National Center for BiotechnologyInformation,NCBI)的orffinder发现基因,找到9个开放的阅读框,用blast系列软件与GenBank中的基因比较以发现这些开放阅读框的功能并确定它们是什么基因,再用英国sanger中心的Artemis软件完成基因注释,用ClustralW软件做DNA和蛋白质序列间的精确比对,最后得到大肠杆菌O164的O-抗原基因簇的结构;并与痢疾志贺氏菌3型的结构比较,发现他们有相同的基因。这些基因具有相同的排列顺序。唯一的不同是大肠杆菌O164的O-抗原基因簇的第一个开放阅读框之前(5′端)有一个插入序列(IS)。(7)特异基因的筛选:在比较了大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇后,针对大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇的不同序列即IS序列与相邻的wzx基因设计引物;上游引物分布在IS序列内,下游引物分布在相邻的wzx基因内,以确保其对大肠杆菌O164型的特异性;用这些引物以166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,确定IS序列对大肠杆菌O164型的O-抗原是高度特异;可以用上述引物进行PCR,来区分和鉴别环境中的大肠杆菌O164型和痢疾志贺氏菌3型。(8)引物灵敏度的检测:将大肠杆菌O164的冻存菌液接种到有LB培养基的三瓶中,30℃-40℃培养,180至250转/分,培养数小时至饱和,取培养好的菌液稀释,取稀释菌液涂布LB琼脂平板,30℃至40℃,培养数小时计数,计算原液中活菌浓度;在5份重量均为20g的生猪肉馅中分别掺入5×103,5×102,5×101,5个和0个活菌,搅拌均匀,加入LB培养基,过滤,过滤液于30℃-40℃培养,180至250转/分,培养数小时;从培养好的菌液中取数ml于6,000g离心数分钟,去上清,加MQ超纯吹开沉淀并混匀,放入100℃沸水中煮数分钟,裂解液于12,000g离心数分钟,取上清做为PCR模板;用所述的源于IS序列的寡核苷酸作为上游引物,它们是:SEQID NO:1中的1868至1885碱基的核苷酸;SEQ ID NO:1中的2265至2284碱基的核苷酸。所述的源于wzx基因的寡核苷酸作为下游引物,它们是:SEQID NO:1中的3020至3050碱基的核苷酸;SEQ ID NO:1中的2809至2827碱基的核苷酸进行PCR反应,PCR反应体系如下:MQ:15.7μl,Mg2+:2.5μl,Buffer:2.5μl,dNTP:1μl,Taq酶:0.3μl,P1:1μl,P2:1μl,模板DNA:1μl。PCR反应条件为:95℃:5′,95℃:30″,56℃:45″,72℃:1′,72℃:5′,共30个循环;反应结束后,取10μl反应产物电泳,若有与预期大小相符的扩增带,则结果为阳性,若没有,则结果为阴性;参入了5×103,5×102,5×101,和5个活菌的每份猪肉馅均在2对引物的PCR反应中得到阳性结果;参入0个活菌的猪肉馅在2对引物的PCR反应中得到阴性结果;说明使用上述方法时,这2对引物对猪肉馅中的大肠杆菌O164的检测灵敏度均为0.25个菌/g。

说明书全文

对大肠杆菌O164的O-抗原特异的核苷酸

技术领域

发明涉及大肠杆菌O164(Escherichia coli O164)中控制O-抗原合成的基因簇的核苷酸全序列,特别是涉及大肠杆菌O164中控制O-抗原合成的基因簇中的寡核苷酸,可利用这些对O-抗原特异的寡核苷酸快速、准确地检测人体及环境中的大肠杆菌O164并鉴定这些致病菌中的O-抗原。

背景技术

大肠杆菌O164是一种较强烈的致病菌,属于肠侵袭性的大肠杆菌(EIEC),引起腹泻。因此对大肠杆菌O164的检测是重要的,需要一个可以快速、准确地检测大肠杆菌O164的方法。
位于大肠杆菌表面的脂多糖是大肠杆菌致病的诱因,而O-抗原是脂多糖最外层结构,是免疫系统识别的目标和噬菌体吸附的位点。O-抗原的缺失会造成许多病原体的血清敏感,或者严重削弱病原体的毒[Frank etal(1987)“The function of antibody and complement in the lysis ofbacteria”.Rev Infect Dis 177:1750-1753.Pluschke G et al“Role of thecapsule and the O-antigen in resistance of O18:K1 Escherichia coli tocomplement-mediated king”.J Bacteriol 42:907-913]。大肠杆菌是一个种,种内的菌株一般通过O-抗原和H-抗原(有时通过K-抗原)来鉴定。其中O-抗原具有高度多样性,大肠杆菌有166种不同的O-抗原,O-抗原的变化可能是大肠杆菌的起源和维持其多样性的主要原因[Reeves,P.R(1992)“Variation in antigens,niche specific selection and bacterialpopulations”.FEMS Microbiol.Lett,100:509-516]。
O-抗原是革兰氏阴性细菌脂多糖中的O特异性多糖成分,它由许多重复的寡糖单位组成。O-抗原的合成过程研究得较清楚:先由糖基转移酶将核苷二磷酸单糖转移到一个固定在细胞内膜的脂分子上,然后在内膜的内侧合成寡糖单位,O-抗原的寡糖单位再通过o-抗原转运酶被转移到内膜外侧,而后通过聚合酶聚合成多糖,再被连接到一个糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3:178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3):655-682]。编码负责O-抗原合成的所有酶分子的基因一般在染色体上相邻排列,形成一个基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and genenomenclature”Trends in Microbiology,4:495-503]。在大肠杆菌、志贺氏菌和沙氏菌中,O-抗原基因簇位于galF和gnd基因之间[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen loci:implicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,11:6923-6930;Lei Wang and Peter Reeves(2000)“The Escherichiacoli O111 and Salmonella enterica O35 gene clusters:gene clusters encodingthe same colitose-containing O antigen are highly conserved”.Journal ofBacteriology.182:5256-5261]。O-抗原基因簇含有三类基因:糖合成路径基因,糖基转移酶基因,寡糖单位处理基因,其中糖合成路径基因编码的酶合成O-抗原所需的核苷二磷酸单糖;糖基转移酶基因编码的酶将核苷二磷酸单糖及其它分子转到单糖上从而使单糖聚合成寡糖单位;寡糖单位处理基因包括o-抗原转运酶基因和聚合酶基因,它们将寡糖单位转移到细菌内膜外侧,再聚合成多糖。糖基转移酶基因和寡糖单位处理基因只存在于携带这些基因的基因簇里。O-抗原中单糖的不同,单糖间联结键的不同和寡糖单位之间联结键的不同构成了O-抗原的多样性,而单糖的组成、单糖间的联结键及寡糖单位之间的联结键是由O-抗原基因簇中的基因控制着,所以O-抗原基因簇决定了O-抗原的合成,也决定了O-抗原的多样性。
因为O-抗原是极强的抗原,是大肠杆菌重要的致病因素之一,同时它又具有极强的多样性,这启示我们能研究一种快速、准确地检测大肠杆菌及其O-抗原的特异性好、灵敏度高的方法。以表面多糖为目标的血清学免疫反应自上世纪30年代以来一直被用于对细菌的分型和鉴定,是鉴定致病菌的唯一的手段。这种诊断方法需要大量的抗血清,而抗血清一般种类不全,数量不足,大量的抗血清在制备和储存中也存在一些困难。另一方面此法耗时长、灵敏度低、漏检率高、准确性差,所以,现在普遍认为这种传统的血清学检测方法将为现代分子生物学方法取代。1993年,Luk,J.M.C et.al用沙门氏菌(S.enterica)O-抗原基因簇的特异核苷酸序列通过PCR方法鉴定了沙门氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.31:2118-2123]。Luk,et.al的方法是将相应于沙门氏菌血清型E1,D1,A,B和C2的O-抗原内的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到对不同血清型的沙门氏菌特异的寡核苷酸。1996年,Paton,A.W et.al用对E.coli O111的O-抗原特异的源于wbdI基因的寡核苷酸鉴定了一株产毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”.J.Clin.Microbiol.34:1622-1627],但是后来的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鉴定E.coli O111的血清型的方法有假阳性结果出现。Bastin D.A.and Reeves,P.R.认为,这是由于wbdI基因是一个推测的糖合成路径基因[Bastin D.A.andReeves,P.R.(1995)“Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111”.Gene 164:17-23],而在其它细菌的O-抗原的结构中也可能有这个糖,所以糖合成路径基因对于O-抗原并不是高度特异的。
痢疾志贺氏菌3型和大肠杆菌O124的O-抗原的结构是一样的,大肠杆菌O124和他们的O-抗原的结构很相似。如下所示:GlcLA(1->6)aDGlc(1->4)|->3)bDGalNAc(1->3)aDGal(1->6)bDGalf(1->
GlcLA=4-O-[(R)-1-carboxyethyl]-b-D-glucopyranose痢疾志贺氏菌3型和大肠杆菌O124的O-抗原的结构bDGlc(1->6)aDGlc(1->4)|->6)bDGalf(1->3)bDGalNAc(1->3)bDGal(1->
大肠杆菌O164的O-抗原的结构他们的血清学具有交叉反应。因此通过血清学方法鉴定区分他们是困难的,也有上述所说的缺点。本研究通过现代分子生物学方法对大肠杆菌O164和痢疾志贺氏菌3型进行快速准确的鉴定和区分。

发明内容

本发明的目的是提供了对大肠杆菌O164的O-抗原特异的核苷酸。它是大肠杆菌O164的O-抗原基因簇中的核苷酸,是源于IS序列和相邻的wzx基因的特异的核苷酸。
本发明的一个目的是提供了大肠杆菌O164的O-抗原基因簇的全长核苷酸序列。
本发明的次一目的是提供了构成大肠杆菌O164的O-抗原基因簇的基因:IS序列(能编码一个转座酶),转运酶基因即wzx基因或与wzx有相似功能的基因;聚合酶基因即wzy基因或与wzy有相似功能的基因;糖基转移酶基因,包括orf4、orf5、orf7、orf9基因;糖合成路径基因orf2、orf3、glf。它们在O-抗原基因簇中的起始位置和终止位置及核苷酸序列都列在表4中。此外,在大肠杆菌O164的O-抗原基因簇里还有一个完整的插入序列(IS)和orf3内部有一个终止子的突变。
本发明的又一目的是提供了寡核苷酸,它们分别源于所述的IS序列和相邻的wzx基因;长度在18-30nt;它们对大肠杆菌O164的O-抗原是特异的;尤其是表1中列出的寡核苷酸对,它们对大肠杆菌O164的O-抗原是高度特异的,而且这些寡核苷酸还可重新组合,组合后的寡核苷酸对大肠杆菌O164的O-抗原也是高度特异的。
本发明的另一目的是提供的上述寡核苷酸可作为引物用于核酸扩增反应,或者作为探针用于杂交反应,或者用于制造基因芯片或微阵列,从而通过这些方法来检测和鉴定大肠杆菌O164的O-抗原及检测和鉴定大肠杆菌O164。
本发明的再一目的是提供了分离大肠杆菌O164的O-抗原基因簇的全序列的方法。按照本方法操作可以获得其他细菌的O-抗原基因簇的全序列,也可以获得编码其他多糖抗原的细菌的基因簇的全序列。
本发明的目的是由以下技术方案实现的。
本发明对大肠杆菌O164的O-抗原特异的核苷酸,其特征在于,其是如SEQ ID NO:1所示的分离的核苷酸,全长14006个基;或者具有一个或多个插入、缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ ID NO:1的核苷酸。
前述的对大肠杆菌O164型的O-抗原特异的核苷酸,其中包括命名为IS序列和wzx,orf2,orf3,orf4,orf5,wzy,orf7,glf,orf9的9个基因组成,都位于galF基因和gnd基因之间。
前述的大肠杆菌O164的O-抗原的核苷酸序列,其特征在于,基因包括如下基因:转运酶基因,包括wzx基因或与wzx有相似功能的基因;聚合酶基因,包括wzy基因或与wzy有相似功能的基因;糖基转移酶基因,包括orf4、orf5、orf7、orf9基因。其中所述的转运酶基因是SEQ ID NO:1中的2518至4011碱基的核苷酸;所述的聚合酶基因是SEQ ID NO:1中的8424至9527碱基的核苷酸;其中所述的转运酶基因是SEQ ID NO:1中的2518至4011碱基的核苷酸;所述的聚合酶基因是SEQ ID NO:1中的8424至9527碱基的核苷酸;orf4基因是SEQ ID NO:1中的6561至7565碱基的核苷酸;orf5基因是SEQ ID NO:1中的7562至8350碱基的核苷酸;orf7基因是SEQ ID NO:1中的9556至10605碱基的核苷酸;orf9基因是SEQ ID NO:1中的11845至12618碱基的核苷酸。
前述的对大肠杆菌O164的O-抗原特异的核苷酸,其特征在于,其分别源于所述的IS序列和相邻的wzx基因;以及它们的混合或它们的重组。
前述的对大肠杆菌O164的O-抗原高度特异的核苷酸,其特征在于,所述的源于IS序列的寡核苷酸作为上游引物,它们是:SEQ ID NO:1中的1868至1885碱基的核苷酸,SEQ ID NO:1中的2265至2284碱基的核苷酸;所述的源于wzx基因的寡核苷酸作为下游引物,它们是:SEQ ID NO:1中的3020至3050碱基的核苷酸,SEQ ID NO:1中的2809至2827碱基的核苷酸。
前述的对大肠杆菌O164型的O-抗原特异的核苷酸在检测表达O-抗原的细菌、鉴定细菌的O-抗原和细菌的其它多糖抗原中的应用。
前述的对大肠杆菌O164型的O-抗原特异的核苷酸的重组分子,在通过插入表达而提供表达大肠杆菌O164型的O-抗原,及制备细菌疫苗中的应用。
前述的对大肠杆菌O164型的O-抗原特异的核苷酸的应用,其特征在于,它作为引物用于PCR、作为探针用于杂交反应与荧光检测、或者用于制造基因芯片或微阵列,供检测细菌的应用。
前述的对大肠杆菌O164的O-抗原特异的核苷酸的分离方法,其特征在于,它是用步移法得到的。包括下述步骤:(1)基因组的提取:提取大肠杆菌O164的基因组;(2)引物的设计:在痢疾志贺氏菌3型的O-抗原基因簇中的相邻的或相隔的两个基因内设计上下游引物;要求上下游引物分别位于相邻的两个基因或相隔的基因内。每一对引物按如下步骤进行试验。
(3)通过PCR扩增大肠杆菌O164中的O-抗原基因簇的相应序列:用每对分布在相邻基因内的上下游引物,以大肠杆菌O164型的基因组为模板进行PCR。每对引物将得到不同大小的PCR产物。将得到的PCR产物,通过琼脂糖凝胶电泳检测PCR产物的大小及其特异性。合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定,并再设计引物和测序直到从两端将每个PCR产物的序列测通。
(4)核苷酸序列的拼接及分析:应用生物信息学软件拼接和编辑上述得到的所有的核苷酸序列。
(5)对不准确的序列再次测序:以不准确的序列的两侧的序列为模板设计引物,并以大肠杆菌O164型的基因组为模板进行PCR。通过琼脂糖凝胶电泳检测PCR产物的大小及其特异性,合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定。
(6)再次进行核苷酸序列的拼接及分析:将新得到的序列加入到原有的序列中再次拼接并编辑所有的核苷酸序列。最终得到大肠杆菌O164型的O-抗原基因簇的准确的全序列。用生物信息学软件对得到的序列进行序列的比对和分析,并用Artemis软件做基因的注释。
(7)特异基因的筛选:在比较了大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇后,针对大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇的不同序列即IS序列及相邻的wzx基因设计引物;上游引物分布在IS序列内,下游引物分布在IS序列和相邻的wzx基因内,以确保其对大肠杆菌O164型的特异性;用这些引物以166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,确定它们对大肠杆菌O164型的O-抗原的高度特异性;(8)引物灵敏度的检测:培养大肠杆菌O164,细菌计数后分别将5×103,5×102,5×101,5个和0个活菌加入到一定量的某种待检测物中,混入细菌的待检测物作为检测用样品,将样品加入LB培养基,取一些与样品混合过的LB培养基过滤,将过滤液进行培养,从培养好的菌液中取数毫升处理后作为PCR模板用寡核苷酸进行PCR反应,检测其对大肠杆菌O164的灵敏度前述的对大肠杆菌O164的O-抗原特异的核苷酸的分离方法,其特征在于,包括下述步骤:(1)基因组的提取:在5mL的LB培养基中37℃过夜培养大肠杆菌O164,离心收集细胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温育2小时,再加入3ul 10mg/ml的RNase,65℃温育30分钟。加等体积酚抽提混合物,取上清液,再用等体积的酚∶氯仿∶异戊醇(25∶24∶1)的溶液抽提两次,取上清液再用等体积的乙醚抽提以除去残余的酚,上清液用2倍体积乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,最后将DNA重悬于30ul TE中,基因组DNA通过0.4%的琼脂糖凝胶电泳检测;(2)引物的设计:在痢疾志贺氏菌3型的O-抗原基因簇中的相邻的或相隔的两个基因内设计上下游引物;要求上下游引物分别位于相邻的两个基因或相隔的基因内。设计的引物如下:
(3)通过PCR扩增大肠杆菌O164中的O-抗原基因簇的相应序列:用每对分布在相邻基因内的上下游引物,以大肠杆菌O164型的基因组为模板进行PCR。PCR反应程序如下:在95℃预变性3分钟,然后95℃变性15秒,退火温度因引物的不同而不同(见表中),退火时间是50秒,72℃延伸时间因引物的不同而不同(见表中),这样进行30个循环;最后,在72℃继续延伸10分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小及其特异性;合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定,并再设计引物和测序直到从两端将每个PCR产物的序列测通。
(4)核苷酸序列的拼接及编辑:用英国剑桥MRC(Medical ResearchCouncil)分子生物学实验室出版的Staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O164的O-抗原基因簇的核苷酸的全长序列。
(5)对不准确的序列再次测序:以不准确的序列的两侧的序列为模板设计引物,并以大肠杆菌O164型的基因组为模板进行PCR。通过琼脂糖凝胶电泳检测PCR产物的大小及其特异性,合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定。
(6)再次进行核苷酸序列的拼接及分析:用Staden package软件包的Pregap4将新得到的序列加入到原有的序列中再次拼接,并用Gap4软件编辑所有的核苷酸序列。最终得到大肠杆菌O164型的O-抗原基因簇的准确的全序列。在得到大肠杆菌O164的O-抗原基因簇的核苷酸序列后,用美国国家生物技术信息学中心(The National Center for BiotechnologyInformation,NCBI)的orffinder发现基因,找到9个开放的阅读框,用blast系列软件与GenBank中的基因比较以发现这些开放阅读框的功能并确定它们是什么基因,再用英国sanger中心的Artemis软件完成基因注释,用ClustralW软件做DNA和蛋白质序列间的精确比对,最后得到大肠杆菌O164的O-抗原基因簇的结构;并与痢疾志贺氏菌3型的结构比较,发现他们有相同的基因。这些基因具有相同的排列顺序。唯一的不同是大肠杆菌O164的O-抗原基因簇的第一个开放阅读框之前(5′端)有一个插入序列(IS)。
(7)特异基因的筛选:在比较了大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇后,针对大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇的不同序列即IS序列与相邻的wzx基因设计引物;上游引物分布在IS序列内,下游引物分布在IS序列和相邻的wzx基因内,以确保其对大肠杆菌O164型的特异性;用这些引物以166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,确定IS序列对大肠杆菌O164型的O-抗原是高度特异的;可以用上述引物进行PCR,来区分和鉴别环境中的大肠杆菌O164型和痢疾志贺氏菌3型。
(8)引物灵敏度的检测:将大肠杆菌O164的冻存菌液接种到有LB培养基的三瓶中,30℃-40℃培养,180至250转/分,培养数小时至饱和,取培养好的菌液稀释,取稀释菌液涂布LB琼脂平板,30℃至40℃,培养数小时计数,计算原液中活菌浓度;在5份重量均为20g的生猪肉馅中分别掺入5×103,5×102,5×101,5个和0个活菌,搅拌均匀,加入LB培养基,过滤,过滤液于30℃-40℃培养,180至250转/分,培养数小时;从培养好的菌液中取数ml于6,000g离心数分钟,去上清,加MQ超纯吹开沉淀并混匀,放入100℃沸水中煮数分钟,裂解液于12,000g离心数分钟,取上清做为PCR模板;用所述的源于IS序列的寡核苷酸作为上游引物,它们是:SEQ IDNO:1中的1868至1885碱基的核苷酸;SEQ ID NO:1中的2265至2284碱基的核苷酸。所述的源于wzx基因的寡核苷酸作为下游引物,它们是:SEQ ID NO:1中的3020至3050碱基的核苷酸;SEQ ID NO:1中的2809至2827碱基的核苷酸进行PCR反应,PCR反应体系如下:MQ:15.7μl,Mg2+:2.5μl,Buffer:2.5μl,dNTP:1μl,Taq酶:0.3μl,P1:1μl,P2:1μl,模板DNA:1μl。PCR反应条件为:95℃:5′,95℃:30″,56℃:45″,72℃:1′,72℃:5′,共30个循环;反应结束后,取10μl反应产物电泳,若有与预期大小相符的扩增带,则结果为阳性,若没有,则结果为阴性;参入了5×103,5×102,5×101,和5个活菌的每份猪肉馅均在2对引物的PCR反应中得到阳性结果;参入0个活菌的猪肉馅在2对引物的PCR反应中得到阴性结果;说明使用上述方法时,这2对引物对猪肉馅中的大肠杆菌O164的检测灵敏度均为0.25个菌/g。
也就是,本发明的第一个方面,提供了大肠杆菌O164的O-抗原基因簇的全长核苷酸序列,它的全序列如SEQ ID NO:1所示,全长14006个碱基;或者具有一个或多个插入、缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ ID NO:1的核苷酸。通过本发明的方法得到了大肠杆菌O164的O-抗原基因簇的结构,如表3所述,它包括命名为IS序列和wzx,orf2,orf3,orf4,orf5,wzy,orf7,glf,orf9的9个基因组成,都位于galF基因和gnd基因之间。
本发明的第二个方面,提供了大肠杆菌O164的O-抗原基因簇中的基因,即转运酶基因(wzx基因或与wzx有相似功能的基因);聚合酶基因(wzy基因或与wzy有相似功能的基因);糖基转移酶基因,包括orf4、orf5、orf7、orf9基因;细菌多糖抗原中特殊的糖合成路径基因,包括orf2、orf3、glf。它们在O-抗原基因簇中的起始位置和终止位置及核苷酸序列都列在表4中。
本发明的第三个方面,提供了源于大肠杆菌O164的O-抗原基因簇中的IS序列和相邻的wzx基因的寡核苷酸,它们是IS序列和相邻的wzx基因中的任何一段寡核苷酸。但是,优先被用的是列于表1中的寡核苷酸对。在表1中也列出了这些寡核苷酸对在O-抗原基因簇中的位置及以这些寡核苷酸对为引物所做的PCR反应的产物的大小,这些PCR反应可用表中的退火温度进行。这些引物只在以大肠杆菌O164为模板进行的PCR扩增中得到预期大小的产物,而在以表2所列的其它菌为模板进行的PCR扩增中都未得到预期大小的产物。更详细地说,以这些寡核苷酸对为引物所做的PCR反应在大多数细菌中均未得到任何产物,所以,可以确定这些引物即表1所列的寡核苷酸对大肠杆菌O164及它们的O-抗原是高度特异的。
所述的对大肠杆菌O164的O-抗原特异的核苷酸的分离方法包括下述步骤:1)基因组的提取;2)引物的设计;3)通过PCR扩增大肠杆菌O164中的O-抗原基因簇的相应序列;4)核苷酸序列的拼接及编辑;5)对不准确的序列再次测序;6)再次进行核苷酸序列的拼接及分析,最终获得O-抗原基因簇的结构;7)特异基因的筛选;8)引物灵敏度的检测。
本发明的其他方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
如本发明所述,“寡核苷酸”主要是指来源于O-抗原基因簇中的IS序列和相邻的wzx基因中的任何一段寡核苷酸,它们在长度上可改变,一般在10到20个核苷酸范围内改变。尤其是源于IS序列(核苷酸位置是从SFQ ID NO:1的1258至2277碱基),wzx基因(核苷酸位置是从SEQ ID NO:1的2518至4011碱基)内的寡核苷酸对大肠杆菌O164都是高度特异的。
此外,有时两个遗传相似的编码不同O-抗原的基因簇通过基因重组或突变产生新的O-抗原,从而产生新的细菌类型,新的突变株。在这种环境中,需要筛选出多对寡核苷酸同重组基因杂交以提高检测的特异性。因此,本发明提供了一整套多对寡核苷酸的混合物,它们源于IS序列和相邻的wzx基因。这些基因的混合物对一个特殊的细菌多糖抗原来说是特异的,从而使这套寡核苷酸对这个细菌的多糖抗原是特异的。更具体地说,这些寡核苷酸的混合物是分别源于IS序列和相邻的wzx基因中的寡核苷酸的组合。
在另一方面,本发明涉及寡核苷酸的鉴定,它们可以用于检测表达O-抗原的细菌和在诊断中鉴定细菌的O-抗原。
本发明涉及到一种检测食品中的一个或多个细菌多糖抗原的方法,这些抗原可以使样品能与以下至少一个基因的寡核苷酸特异性杂交,这些基因是:(i)编码转座酶的IS序列(ii)编码转位酶的基因,包括wzx基因或与wzx有相似功能的基因。在条件许可的情况下至少一个寡核苷酸能与至少一个表达特殊的O-抗原的细菌的一个以上的那样的基因特异性杂交,这些细菌是大肠杆菌O164。可用PCR方法检测,更可以将本发明方法中的核苷酸标记后作为探针通过杂交反应如southern-blot或荧光检测,或者通过基因芯片或微阵列检测样品中的抗原及细菌。
本发明者考虑到以下情况:当单个的特异的寡核苷酸检测无效时,寡核苷酸的混合物能与靶区域特异性杂交以检测样品。因此本发明提供了一套寡核苷酸用于本发明所述的检测方法。这里所说的寡核苷酸是指源于编码转座酶的IS序列和编码转位酶的基因,包括wzx基因或与wzx有相似功能的基因的寡核苷酸。这套寡核苷酸对一个特殊的细菌的O-抗原来说是特异的,这一特殊的细菌O-抗原是由大肠杆菌O164表达的。
另一方面,本发明涉及到一种检测排泄物中的一个或多个细菌多糖抗原的方法,这些抗原可以使样品能与以下至少一个基因的寡核苷酸特异性杂交,这些基因是:(i)编码转座酶的IS序列(ii)编码转位酶的基因,包括wzx基因或与wzx有相似功能的基因。在条件许可的情况下至少一个寡核苷酸能与至少一个表达特殊的O-抗原的细菌的一个以上的那样的基因特异性杂交。这些细菌是大肠杆菌O164。可用本发明中的寡核苷酸作引物通过PCR的方法检测样品,也可将本发明中的寡核苷酸分子标记后作为探针通过杂交反应如southern-blot或荧光检测,或者通过基因芯片或微阵列检测样品中的抗原及细菌。
一般一对寡核苷酸可能与同样的基因杂交也可与不同的基因杂交,但它们中必须有一个寡核苷酸能特异性杂交到特殊抗原型的特异序列上,另一个寡核苷酸可杂交于非特异性区域。因此,当特殊的多糖抗原基因簇中的寡核苷酸被重新组合时,至少能选出一对寡核苷酸与多糖抗原基因簇中特异基因混合物杂交,或者选出多对寡核苷酸与特异基因的混合物杂交。甚至即使当一个特殊的基因簇中所有基因都独一无二时,此方法也能应用于识别此基因簇内的基因混合物的核苷酸分子。因此本发明提供了一整套用于检测本发明方法的多对寡核苷酸,在这里多对寡核苷酸是源于(i)编码转座酶的IS序列(ii)编码转位酶的基因,包括wzx基因或与wzx有相似功能的基因。这套寡核苷酸对一个特殊的细菌多糖来说是特异的。
另一方面,本发明也涉及到一种检测源于病人的样品中的一个或多个细菌多糖抗原的方法。样品中的一个或多个细菌多糖抗原可以使样品能与以下至少一个基因中的一对寡核苷酸中的一个特异性杂交,这些基因是:(i)编码转座酶的IS序列(ii)编码转位酶的基因,包括wzx基因或与wzx有相似功能的基因。在条件许可的情况下至少一个寡核苷酸能与样品中的至少一个表达特殊的O-抗原的细菌的一个以上的那样的基因特异性杂交,这些细菌是大肠杆菌O164。可用本发明中的寡核苷酸作引物通过PCR的方法检测样品,也可将本发明中的寡核苷酸标记后作为探针通过杂交反应,或者通过基因芯片或微阵列检测样品中的抗原及细菌。
本发明者相信本发明不必限于以上所提的核苷酸序列编码的特定的O-抗原,而且广泛应用于检测所有表达O-抗原和鉴定O-抗原的细菌。由于O-抗原合成和其他多糖抗原(如细菌胞外抗原)合成之间的相似性,本发明的方法和分子也应用于这些其他的多糖抗原。
本发明首次公开了大肠杆菌O164的O-抗原基因簇的全长序列,而且可从这个未被克隆的全长基因簇的序列中产生重组分子,通过插入表达可产生表达大肠杆菌O164的O-抗原,并成为有用的疫苗。

具体实施方式


下面结合具体实施例,进一步阐述本发明。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(NewYork:Cold Spring Harbor Laboratory Press,1989)中所述的条件。
实施例1:基因组的提取。
在5mL的LB培养基中37℃过夜培养大肠杆菌O164,离心收集细胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温育2小时,再加入3ul 10mg/ml的RNase,65℃温育30分钟。加等体积酚抽提混合物,取上清液,再用等体积的酚∶氯仿∶异戊醇(25∶24∶1)溶液抽提两次,取上清液,再用等体积的乙醚抽提以除去残余的酚。上清液用2倍体积乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,最后将DNA重悬于30ul TE中。基因组DNA通过0.4%的琼脂糖凝胶电泳检测。
实施例2:引物的设计:在痢疾志贺氏菌3型的O-抗原基因簇中的相邻的或相隔的两个基因内设计上下游引物;要求上下游引物分别位于相邻的两个基因或相隔的基因内。设计的引物如下:
实施例3:通过PCR扩增大肠杆菌O164中的O-抗原基因簇的相应序列:用每对分布在相邻基因内的上下游引物,以大肠杆菌O164型的基因组为模板进行PCR。PCR反应程序如下:在95℃预变性3分钟,然后95℃变性15秒,退火温度因引物的不同而不同(见表中),退火时间是50秒,72℃延伸时间因引物的不同而不同(见表中),这样进行30个循环;最后,在72℃继续延伸10分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小及其特异性;合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定,并再设计引物和测序直到从两端将每个PCR产物的序列测通。
实施例4:核苷酸序列的拼接及编辑:用英国剑桥MRC(Medical ResearchCouncil)分子生物学实验室出版的Staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O164的O-抗原基因簇的核苷酸的全长序列。
实施例5:对不准确的序列再次测序:以不准确的序列的两侧的序列为模板设计引物,并以大肠杆菌O164型的基因组为模板进行PCR。通过琼脂糖凝胶电泳检测PCR产物的大小及其特异性,合并4管PCR产物送到测序公司,用他们的相应的上下游引物从两个方向对纯化后的相应的PCR产物进行核苷酸的序列测定。
实施例6:再次进行核苷酸序列的拼接及分析用英国剑桥MRC(Medical Research Council)分子生物学实验室出版的Staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O164的O-抗原基因簇的核苷酸全长序列(见序列列表)。序列的质量主要由两个方面来保证:1)对大肠杆菌O164的基因组作6个LongPCR反应,然后混合这些产物以产生文库。2)对每个碱基,保证3个以上高质量的覆盖率。在得到大肠杆菌O164的O-抗原基因簇的核苷酸序列后,用美国国家生物技术信息学中心(The National Center for BiotechnologyInformation,NCBI)的orffinder发现基因,找到9个开放的阅读框,用blast系列软件与GenBank中的基因比较以发现这些开放的阅读框的功能并确定它们是什么基因,再用英国sanger中心的Artemis软件完成基因注释,用C1ustral W软件做DNA和蛋白质序列间的精确比对,最后得到大肠杆菌O164的O-抗原基因簇的结构,如表3所示。
通过检索和比较发现,在大肠杆菌O164的O-抗原基因簇的galF和wzx之间有一段序列(1258bp-2277bp),比较表明它与Pseudomonas putida的tnpA基因编码的蛋白在341个基酸里有68%的相似性。与Caulobacter crescentusIS1111A/IS1328/IS1533家族的转座酶也有60%的相似性,在它的两端也有反向重复序列。因此这段序列是一个插入序列。发现orf1与E.coli O157:H7的wzx基因在440个氨基酸中有17%的氨基酸序列是一样的,即有17%的相同性,42%的相似性;而且和Bacteroidesfragilis的wzx基因在506个氨基酸中有20%的相同性,42%的相似性,此wzx基因有13个潜在的穿膜区,而通过Eisenberg等的算法[Eisenberg,D,Schwarz,E.etal(1984)“Analysis of membrane and surfaceprotein sequences with the hydrophobic moment plot.J.Mol.Biol.179:125-142]发现orf1也有13个潜在的穿膜区,而且与许多wzx蛋白相似,orf2在wzx蛋白的氨基端有一个大约50个氨基酸的保守基序,所以可以确定orf1是wzx基因,命名为wzx。Orf2与Sinorhizobium meliloti的一个假设的蛋白在363个氨基酸中有34%的相同性,有52%的相似性,暂时将orf2命名为orf2基因。Orf3也与Sinorhizobium meliloti的一个假设的蛋白在226个氨基酸中有23%的相同性,42%的相似性,暂时将orf4命名为orf4基因。Orf2和Orf3参与合成与转移丙酸的,在orf3内有一个终止密码子,使其失去了功能,因此大肠杆菌O164的O-抗原中没有丙酮酸侧链,与痢疾志贺氏菌3型。orf4与Streptococcus thernophilus的eps9I基因在239个氨基酸中有30%的相同性,54%的相似性,而eps9I基因是糖基转移酶基因;另外orf4与Streptococcus agalactiae的CpsIaI基因在390个氨基酸中有29%的相同性,47%的相似性,CpsIaI基因是一个N-乙酰糖基转移酶基因,所以认为orf4是一个糖基转移酶基因,命名为orf4。orf5与大肠杆菌的cap8J基因表现出较高的同源性,此基因编码半乳糖基转移酶,所以orf5是半乳糖基转移酶基因,命名为orf5。orf6是一个预测带有10个跨膜片段的蛋白,它的内膜的拓扑结构具有众所周知的O-抗原聚合酶的典型特征,此外,它与E.coli的编码O-抗原聚合酶的wzy基因在355个氨基酸中有23%的相同性,44%的相似性;与Streptococcus thermophilus的wzy基因在353个氨基酸中有22%的相同性,44%的相似性,所以命名orf6为wzy基因。orf7与Streptococcus pneumoniae中编码半乳糖基转移酶的cpsI基因和Streptococcus pneumoniae中编码半乳糖基转移酶的cps23FU基因在氨基酸水平上分别有34.5%和33%的相同性,而在痢疾志贺氏菌3型的O-抗原结构中有半乳糖,所以确定orf7也是一个半乳糖基转移酶基因,命名为orf7。orf8有63%的氨基酸序列与E.coli K12的O-抗原基因簇的glf基因的氨基酸序列相同,表明它们之间有高度的同源性。此外,glf基因编码的酶催化合成糖Galf,这正是痢疾志贺氏菌3型O-抗原结构中的成分,所以推测orf8是glf基因,命名为glf。orf9与Bifidobacterium longum的基因BL0045和Bacteoides fragilis的wcfN基因在氨基酸水平上拥有33%的相同性,而这两个基因是胞外多糖基因簇中的糖基转移酶基因。因此orf9也是一个糖基转移酶基因,命名为orf9基因。
根据大肠杆菌O164的结构推测它应有四个糖基转移酶基因,分别转移五个糖以合成O-抗原的寡糖单位。需要wzx基因将寡糖单位转移到膜外,wzy基因将寡糖单位聚合成多糖,寡糖单位中的特殊单糖也由O-抗原基因簇合成,如Galf由glf基因合成,这些基因在大肠杆菌O164的O-抗原基因簇里都被发现。但在大肠杆菌O164 O-抗原的结构里还有GalNAc。在Yersinaenterocolitica O8中,UDP-GalNAc是由gne基因编码的半乳糖变位酶催化UDP-GlcNAc生成的,在大肠杆菌O164的O-抗原基因簇里还没有发现gne基因,但是Peter Reeves等通过PCR发现在某些菌如E.coli O124中的其他基因簇里有gne基因,也即是O-抗原基因簇外的gne基因转化UDP-GlcNAc生成UDP-GalNAc提供O-抗原合成必需的糖,所以我们认为gne基因可能在大肠杆菌O164的其他基因簇里。
上述分析表明,大肠杆菌O164型的O-抗原基因簇与痢疾志贺氏菌3型的O-抗原基因簇具有相同的基因。这些基因具有相同的排列顺序。唯一不同的是大肠杆菌O164的O-抗原基因簇的第一个开放阅读框之前(5′端)有一个插入序列(IS)。这是痢疾志贺氏菌3型的O-抗原基因簇不具有的。
(7)特异基因的筛选:在比较了大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇后,针对大肠杆菌O164型的O-抗原基因簇和痢疾志贺氏菌3型的O-抗原基因簇的不同序列即IS序列与相邻的wzx基因设计引物;上游引物分布在IS序列内,下游引物分布在IS序列和相邻的wzx基因的交界处或wzx基因内,以确保其对大肠杆菌O164型的特异性,这些基因在核苷酸序列中的位置见表1。在表中还列出了每个引物的大小。以每对引物用表中所列的相应的退火温度以表2中的所有菌的基因组为模板进行PCR,得到了相应的PCR产物,其大小也列于表中。用这些引物以166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,确定IS序列对大肠杆菌O164型的O-抗原是高度特异;可以用上述引物进行PCR,鉴定大肠杆菌O164型并区分环境中的大肠杆菌O164型和痢疾志贺氏菌3型。
mdh(malate dehydrogenase)基因是存在于所有的大肠杆菌的基因组中且高度保守的一个基因,所以我们根据mdh基因设计了引物(5′-TTC ATC CTA AACTCC TTA TT-3′)和(5′-TAA TCG CAG GGG AAA GCA GG-3′),然后从166种血清型的大肠杆菌中提取基因组,方法如前所述。用这对引物从166种血清型的大肠杆菌的基因组中PCR以鉴定大肠杆菌并检测其基因组的质量。
表2是用于筛选特异基因的166种血清型的大肠杆菌和43株志贺氏菌及它们的来源,为了检测的方便,我们将它们每12-19个菌分为一组,总共13组。它们的来源都列于表中。
在第8组中含有大肠杆菌O164的基因组DNA作为阳性对照。第13组中是不含有大肠杆菌O164的基因组DNA,作为阴性对照。以每组菌做模板,用表1中的每对引物按如下条件做PCR:在95℃预变性2分钟后,95℃变性15秒,退火温度因引物的不同而不同(参照表1),退火时间是50秒,72℃延伸2分钟,这样进行30个循环。最后在72℃继续延伸10分钟,反应体系是25ul。反应完毕后,取10ulPCR产物通过0.8%琼脂糖凝胶电泳检测扩增出的片段。
对于IS序列与相邻的wzx基因,有4对引物被检测,每对引物分别分布在IS序列与相邻的wzx基因中。除了在第8组中做PCR后得到了预期大小的正确的一条带外,在其他组中都没有扩增到任何大小正确的带。所以IS序列对大肠杆菌O164及其O-抗原都是高度特异的。
(8)引物灵敏度的检测:将大肠杆菌O164的冻存菌液接种到有LB培养基的三角瓶中,30℃-40℃培养,180至250转/分,培养数小时至饱和,取培养好的菌液稀释,取稀释菌液涂布LB琼脂平板,30℃至40℃,培养数小时计数,计算原液中活菌浓度;在5份重量均为20g的生猪肉馅中分别掺入5×103,5×102,5×101,5个和0个活菌,搅拌均匀,加入LB培养基,过滤,过滤液于30℃-40℃培养,180至250转/分,培养数小时;从培养好的菌液中取数ml于6,000g离心数分钟,去上清,加MQ超纯水吹开沉淀并混匀,放入100℃沸水中煮数分钟,裂解液于12,000g离心数分钟,取上清做为PCR模板;用所述的源于IS序列的寡核苷酸作为上游引物,它们是:SEQ ID NO:1中的1868至1885碱基的核苷酸;SEQ ID NO:1中的2265至2284碱基的核苷酸。所述的源于wzx基因的寡核苷酸作为下游引物,它们是:SEQ ID NO:1中的3020至3050碱基的核苷酸;SEQ ID NO:1中的2809至2827碱基的核苷酸进行PCR反应,PCR反应体系如下:MQ:15.7μl,Mg2+:2.5μl,Buffer:2.5μl,dNTP:1μl,Taq酶:0.3μl,P1:1μl,P2:1μl,模板DNA:1μl。PCR反应的条件为:95℃:5′,95℃:30″,56℃:45″,72℃:1′,72℃:5′,共30个循环;反应结束后,取10μl反应产物电泳,若有与预期大小相符的扩增带,则结果为阳性,若没有,则结果为阴性;参入了5×103,5×102,5×101,和5个活菌的每份猪肉馅均在4对引物的PCR反应中得到阳性结果;参入0个活菌的猪肉馅在4对引物的PCR反应中得到阴性结果;说明使用上述方法时,这4对引物对猪肉馅中的大肠杆菌O164的检测灵敏度均为0.25个菌/g。
通过对O抗原基因簇的克隆和在减毒的疫苗菌株中的表达,可以组建重组疫苗。O抗原为最主要的革兰氏阴性菌的表面抗原,可以引起强烈的免疫反应,是制造重组疫苗的最好的靶分子之一。在1993年Viret实验室成功的将志贺氏菌Sonnei的O抗原基因簇在一株沙门氏菌Tyziai疫苗菌中表达,动物实验证明可以引起兔子的免疫反应(Molecular Microbiology1993,7:239-252)。中国军事医学科学院的小组也在从事与Viret实验室类似的工作。王磊实验室在1999年成功的将大肠杆菌O111的O抗原基因簇在沙门氏菌疫苗STM-1中表达,并证明组建成的菌株可以引起小鼠的血液和体液反应(Microbial Pathogenesis 1999,27:55-59)。所以本发明O164的O抗原特异基因序列可以应用于组建重组疫苗。
根据本发明的对大肠杆菌O164型的O-抗原特异的核苷酸序列(SEQ IDNO:1所示),构造特异核酸探针,将其固定到芯片的载体上制成生物芯片,将要检测的样品适当处理后,与生物芯片进行杂交反应,然后利用生物芯片信号分析设备就可以得到样品中相应的细菌情况。这种大肠杆菌O抗原鉴定的DNA芯片将可以直接用于临床和其它检验场所(如食品加工和生产行业,畜牧兽医行业海关检疫等的微生物检验)。这种芯片只需要扩大产量,在完全相同的条件下就可以产业化。
表3是大肠杆菌O164的O-抗原基因簇的结构表,在表中列出了大肠杆菌O164的O-抗原基因簇的结构,共IS序列和9个基因组成,每个基因用方框表示,并在方框内写入基因的名称。在O-抗原基因簇的两端是galF基因和gnd基因,它们不属于O-抗原基因簇,我们只是用它们的一段序列设计引物来扩增O-抗原基因簇的全长序列。
表4是大肠杆菌O164的O-抗原基因簇中的基因的位置表,在表中列出了大肠杆菌O164的O-抗原基因簇中的所有开放阅读框在全序列中的准确位置,在每个开放阅读框的起始密码子和终止密码子的下面划线。在细菌中开放阅读框的起始密码子有两个:ATG和GTG。
SEQ ID NO:1序列(SEQUENCE LISTING)<110>天津生物芯片技术有限责任公司
<120>对大肠杆菌O164的O-抗原特异的核苷酸<130>对大肠杆菌O164的O-抗原特异的核苷酸<160>1<170>PatentIn version 3.2<210>1<211>14006<212>DNA<213>Escherichia coli<400>1ctcctggtaa ctcacgcgtc caagaacgcg gtcgaaaacc acttcgacac ctcttatgaa    60ttagaatctc tccttgagca gcgcgtgaag cgtcaactgt tggcggaagt acaatctatc    120tgtccgccgg gcgtgaccat tatgaacgtg cgtcagggtg aacctttagg tttaggccac    180tccatcttat gtgcgcgacc tgccattggt gacaacccat ttatcgtggt actgccagac    240gtagtgatcg acgacgccag cgccgacccg ctgcgctaca accttgctgc catgattgcg    300cgcttcaacg aaacgggccg tagccaggtg ctggcaaaac gtatgccggg tgacctctct    360gaatactccg tcatccagac caaagaaccg ctggaccgtg aaggtaaagt cagccgcatt    420gttgaattta tcgaaaaacc ggatcagccg cagacgctgg actcagacat catggccgta    480ggtcgctatg tgctttctgc cgatatttgg ccggaactag aacgcactca gcctggtgca    540tgggggcgta ttcagctgac tgatgctatt gccgaactgg cgaaaaaaca gtccgttgat    600gccatgctga tgactggaga cagctacgac tgcggtaaaa aaatgggcta tatgcaggcg    660tttgtgaagt acggactgcg taacctgaaa gaaggggcga agttccgcaa aggtattgag    720aggttgttga atgattaaaa acatgaacaa atataacggt aaataagaga aattgtaacg    780gcagtgagga tttgcggcga agctcaaacg tggcgaatat ccctgtcgtt atttattaat    840aaatcatcgt actaacaatg gaataaaaaa gtgccttgtt ttaagtttta caggatattc    900cttgtttctg gaggagattg ataagacaat cagcatctga atttatcaga acttgtgtgt    960cttgctgatt acattgttat attcatgcag tgtactggta gctgtggagc caggggcggt    1020agcgtgcatt aatattcaca atatattctt ttaaatgtaa gcagaattaa tcgaacctaa    1080ataatgtcac gtaacaaaat aatcataaaa atgtaatgaa cgcatcccac acaattaaac    1140acggagcagt atgatggtta aaagggtgaa actggcaggt gtggagcctc gcagattccg    1200gcatcatagt gcccaatacg ggatgcataa agctccctca gactggagac tccacaaatg    1260aaatatacac cggttggcgt tgatatcgca aaacatgtca ttcagattca cttcatcaat    1320gagcacacag gtgaagtggt tgataaacag ttgcgtagac aggattttct gacgttcttc    1380ggcaaccgtg agccatgcct gattggtatg gaggcctgtg gaggttctca gcactgggca    1440cgggaactga caaaacttgg tcataaagtc cggttgttgc aggcccgctt cgttaaggca    1500ttcgtcatgg gcaataagaa tgatgtgatg gatgcccggg ctatctggat ggcggttcag    1560cagccgggta aagaaatcgc cgtaaaaaca gaagaacagc agtcggtact ggttctgcac    1620cgtacccgca tgcaactggt gaagttccgg accgcacaaa ttaatgccct gcacgggacg    1680ttactggagt ttggtgaaac catccacaaa ggccgggcag cgatggagcg ggagttcccc    1740gaagcactgg aacggatgaa agagagactg ccaccgtatc tcattatggt tctggaaaac    1800cagtacaacc gactgaatga gctggactca ctgatagagg atattgaaaa acagcttacc    1860agcgtggcga ggcagaatga aacctgtaag cggttgctgg atattcctgg cgttggacca    1920cttattgcga cggcagcggt ggccaccatg ggggaagcat cagcgtttaa atcggggcga    1980gagttcgccg catatgttgg tctggttcca aaacaaactg gctccggagg gaaagtacgt    2040ctgctgggga taagcaaacg tggtgacact tatctcagga cattatttat ccacggtgca    2100agagcggtgg cattagtagc taaagagcct ggcccgtgga taaccgaact gaaaaaacgt    2160cgtccagcca gtgtggcaat cgtcgccatg gcaaacaagc tggcacgaac agtatgggcg    2220ataaccgccc atgaccgtaa gtatgacagg aaccacgtca gtatcagacc atattaatcg    2280
ctgataccat taaacaatga actcttaaca aaagggtgaa tgctgaaagg ttgctatggc   2340ggccagagtg atgacaaaga caggtaagac cgtgactcac taaacctgaa cagtattttg   2400ggcttgaagt ccgccgtgaa aataaggggt gagtcggcga attacatagg ggctcgcagc   2460gttacggctg caataaagcc ggatataaag ctgcaaccta cccgtcatgt caaaacaatg   2520gatgccttgc aaacgggatg cgttcatata aatactatgt ttttggcaac aagaacctta   2580gtttctttaa gtgtttcatt ttacacaaca agaatagtta tacaacagtt gggggcggca   2640gactatggct tatttaatat catttatgga gttgtaacat tttttacatt cgtagtcacc   2700gcgatgaatg attctgtaca gcgttatatt gcaataggtg ttggttcaca aaaaatatcg   2760gttattagag atgctgtaaa aaatagtatg tttatatttg ttatatctgc tttcatattg   2820gcagtatgtc ttcttttggc aaggggggtg atcatacata atattttaaa tatacctaaa   2880gattctattg aaaatgcaag tgtgttatat ttggttgcag tattttcaat aaccatactt   2940ataattcaga cgccacttaa tgcgatggtg ttagcatacg agaaaatgtc attttacgca   3000tacatgatga tatttgaaat ggtagctaaa atgagtatgg ctttgttact aactttactg   3060gaaaaagata aggtcattgt atattcaata cttttaggtt ctatttcttt ttttaacttg   3120ttggtttatt tatgctactg cttgatatgt tttaaaaaat caatgtttgg tgggagaata   3180aaatttagag tgctgaaaga aatttcaact ttttcatttt ggaatatatt tggtaatttc   3240tcttacatgt gcagagttca gggagtgaac attgtaatta atatgtttta cgctatagcc   3300gtgaatgcag catatgcgat ttcgattact gttttaaatg caattaatac acttacgcaa   3360tcattaatta cagcattaag gcctcaaata tttaaatcat atggcgaatg tgatttaaaa   3420agatataatc atctagttct ctttggttca aaatatacat tttcaatatt gtttctgtta   3480agtagccctg taattctatg tgcggatgag ttgttaaaga tatggcttga tattgtacca   3540gattatacag ttgaatttgt gaggttggtc attgttgtgg cttttattga tagtttttca   3600tatagcatga ttgctggtat tcaggctacg ggtaggatta aaacatatca actagttgtt   3660agtttaattg tcctaattaa tttgccgtta acctttattt tgtttaaggc aggaaataat   3720gttttaagta tgttttatcc atttattgtt actgccatta tcaatcaagg tttaaggttg   3780tattttatct atatcaatgc aggttttgat tataagaagt atttcactgt tgtgatctat   3840ccttgcttgt tagctgtatg cttatcgtta gtgacagata tttcaattaa aaaaatgctt   3900ccatttaaca gtgttattga tgttttaatt gtgtgtattt ttattttttc attcaataca   3960ataatttttt attgggttgt agtttctaaa aaggaaaaaa atggttatta gaaaccctga   4020aaagaaaagt gaaataacaa taaaagatgt tatagacaat gaactctgta ctggttgtgg   4080agtttgtatt tcggaagata gtagcaaaac ctcctttatg aaatggaatt ctgaaggttt   4140ttatgagcca tgtttctctc ctgtatcaac attattcaat atgcagcgtg tttgtccctt   4200taacttaagt agggatacat tagtgaatga ggatgaactt gcgcatgagt tttttgatgg   4260taagggatat ttagattctg aggttgggtt ttataaaaaa atatatgtgg gttattctaa   4320acattttaga gagacttcat cctccggtgg tatagctaca tatgtatttg aacaacttct   4380tagacgtaag tatgttgatg ctctatttat agttagggag cttggtggtt catatggata   4440tcaagtcttc gataatccag aacatattaa ggatatgtct aaaacaagat attatcctgt   4500aacgctagaa aagttatttg ataatattta taagcttaat ggtagagtgg ccgtttcagg   4560agtggcatgt tttattaaag ccattaggct caaacaacat taccatccag aactgaaaga   4620gaaaatacca ttccttgttg gtataatttg tggaggactc aaaagtcgat attacactga   4680ttatttatca cagtctgctg gttgtgtcag tgagtaccaa aatgctgagt atcgagtgaa   4740aaagaaagat agtcatgctc ttgactatcg tttcacatgt gttgagaaat caaataatat   4800aattcattct gttgatatgc aaagaatggg ggatatgtgg ggttcagggc tatttaaggc   4860aaacgcatgt gactattgtg atgatgttac aaccgaactc gcagacatat cattgggtga   4920
tgcctggatt tcgccataca atatggatgg agctggtaat aatgtagttg tatgtcgctc   4980caccacagct catgaaatta ttttatctgg gattgagaaa aaagacttag aattaacgga   5040actcgaatta gagcagttga aattgtcaca acaaggaagt tttaaccaca ggcataaagg   5100attattatat agaataaaaa atgcagagaa aaataatcgc ttagtgcctg ttaagaggaa   5160aagattctta cgctctatat cttttttatt aaagttaatt caaaaacaac gatcagttac   5220aaggagaaaa agcatagaga tatggatgga aactcaaaat tcagcaactt tcgataagaa   5280aatgaaggga tatttattca cgttgcgttg gttaacagtg gtcaatagga aattaagtcg   5340gatgttcaag attgtttctc taaatagaat gggtaaaaaa tgaaagttgc aatattaact   5400caaccattac atacgaatta tggtggcaca ttacaagcct atgcattaca aaaagtcttg   5460attaatttgg gacatgaacc agagactatt aattataggt cgaaaattaa gaggccacta   5520tttatccgtg ttgtgttgtc aaaaattaaa aggatagtat tatgccgaaa aatcacattt   5580gattttacaa cacaagatag aattaatatt aggaagcatc atcaatcttt cattgataca   5640agattaaact attcagagga gattaacggt actgaggggt tgagagatta tattttaaaa   5700aataattacg gtgctgtaat aataggtagt gatcagacat ggagaccaat atattcgcct   5760agaatagatt cattttttct cgatttttta agtgatgtaa acgatataaa aaatggcata   5820tgcagcatct tttggtactg ataaatggga gttcacggag tcacaaacta atttatttaa   5880attgttactt tcaaaatttg actatgtttc agttagagag tcctcaggag tcaaattatg   5940tagtgaaaaa tttggtttga aagcagagtt ggttttagat ccgacattgc tattgacatt   6000cgaagattat actcatttat tagacaatga ctatattaat cttcataagg gaaaggtgtt   6060tagttatgta cttgatgaga attacgacaa aaaaaacttt atagacacag tagcaagtac   6120tctccgcaca acgtcatttt atacttaccc taaaaaaatc actaaagatg aatatgtgat   6180tagaaattat tccgagtatg aatatccgcc aatagaatat tggatttctt cgtttaaggc   6240cgctgaattt attgtaacag attcatttca tggaacagta ttttctatta tttttaacaa   6300acccttcatc gccattgcaa atgaagagag aggaaaggct agatttacgt cactattgga   6360aatgtttggt cttgaaagac gacttgtgag taatttagat gatgttgatt taaagcttgt   6420aaatgaaaaa attaactatg gccccataaa tgaaaaaatt gcttatttta gagaagagtg   6480ccttaaaaag ttgcagttaa tgctaataaa ataatcagat tatgtatgtc tctctacaat   6540taaaatatga atgttgatcg atgaagaatt gtaaagtatc tgtaattatt ccggtctata   6600atgcggaaaa atatatacaa cgttgtattt taagcttatt aaagcagaca ttagatgatg   6660ttgaaattat catcattgat gatggttcta ctgataattc actttctata ataaaagaaa   6720ctgttgcatt gcatactgct agtagagctc gccaaaagag aatcaatata atctctcgag   6780aaaacaaagg agttgcctat acacgaagtc agggattgag actttcgcag ggggaattta   6840tcattcattt tgatagtgat gattgggcaa aatccaatat gctggaggaa atgtataaga   6900caattgtttc caataatgca gacatggtta tatgcgatta ttttttagtg aagaataata   6960aagaaatact tataaaacag agagtggagt atgagccaaa gaaatgtatt agatatctac   7020tgactggtga gctagaaggg tttacatgga acaaactaat tagaaaaaaa tatatcgata   7080aaaataaaat tgattttgtt aataaaatta cttatatgga ggattttttg ttcatattaa   7140gtgtgttact acacaatcct aaaattattt ttcaggattg tgcatattat tattatcaaa   7200aaagcaatcc taaatctcta actagccatg ctagtgtgga taggctttct gaaatgatta   7260aagccgtaag tgaaatagaa aagaagataa ataaatataa tttacaaaag tatctgaata   7320acgagtttca attgtttaag ttaaaacaaa aaatttggtt tatatctata agtaagttaa   7380atgttaatga taatgtatgg aatctctttc ctgaaacaaa tccatttata tcaaaggtaa   7440atgtgctttt ttattataaa atagtgcttt ttcttgatag tattaaactg cgtttttttt   7500caaataagat catttatctc attggattgg tgcaggcttt attacaagaa aggaaagaga   7560agtgatacca aaaataattc attactgctg gttcggtcgc tctccattgt cggaattaac   7620
aaagcagtgc attgcaagct gggagaaata ttgtcctgaa tataaaatca taagatggga   7680tgaaaataat gtcgatttga attcttgttc ttttgttaga caagcttata aagaaaaaaa   7740atgggcgttc gtttctgatt atgtaaggct taaagtggtt aatgaatatg gcggtatcta   7800tcttgataca gatgttgaat taataaagcc attagatgat ttgttaatat atcctgcata   7860tataggcttt gaaattaaca aggaatggta tgtaaattct ggtttggggt tcggttctgt   7920taataataat ccggttttag aatcattaat tatggagtat gaaaatatta attttgtaaa   7980tgaggatggg actctaaata taacgccgtg ccccataaga gaaacaaaag cattaacaaa   8040aataggttta attcctgatg gtcaatgtca atcttttgat aatatagtga ttttttctgc   8100agattatttt tgtcctgtat ctataacagg tgagagaaat ttttctgata aaacatattc   8160aatacatcat tacgatgcta gttggttttc tgagcaaaag agaaaaggcc tgcaacgtaa   8220aaagagattt ataaaactat tcggcaacct aataggcaca tatattaata aaccttttat   8280ttttgtagat gaatgtcgcg agttcggatt agttaaagca atcaagaata tgcgttccaa   8340ttttccttaa tttttagtgt taaggaataa gtttcgttaa aatactttat tcatttaatt   8400aataaaggtt taatggtgat tagatgtact ttcttttgtt cttctcaata ttttattttg   8460tatacgtaat cttaatagga acattatgtc ataactataa agcccttttg attttttcac   8520taatccctct gacaatagtg tcaggtataa gatataatgt cggctttgat tttatgtcat   8580atgttgatta tttcaatcaa ctcaaatatt caaatgatat atatctagat tctaccttta   8640agtatataag ctactttacc tattatatag gaggtaacga acagattttg tttctgatat   8700atgcggtttt ttattcggtt gcactttatt ttttaataaa actggtattg gaaaattata   8760taacggaaat aaataatttt tatactattg gacttgtgtt atcattttat tcgttttatt   8820ttttattatc atttaatcaa attagggctg tattatcagc tctaatacta tgttatgggc   8880tattaaaaaa taaaatagat ttttctttta taataacaat tacattaagt attctttttc   8940actctgcagc aatgttcatt ttacctcttt attttgtcct aagaaaaata aatgtaacag   9000ttctgttggt gatattccct tttttggttg ttgcttcatt ctttaatatt ttttcagata   9060ttgtgagatt cattctgaca ttgctaaata gtcgtttttt aacatatttt aactctgaat   9120attttgttcc aaggacggga atggaaaaaa tgtatagtat gatctcaatg attattgttt   9180tgggaatggt tgtttgtttg tctaaattat tacctaaaaa gtttgattta atgataaagt   9240ttgttattct ttttgttcta cttagagcga tgtcaattga tatattgatt tttgctaggt   9300ttagtgattt tcttaaacca atggctataa ttcttatatt taccgctgtt tatttttctt   9360cgaataaagt gcgacctaga attatccttc ctttttattt aattatgaca ttgtttctct   9420gtatttttaa tataataatc ggatcgaata taactaaggg gaactattat acttatggtt   9480ataacatttg cttttttggc aataaatgta tagataaatt ttattagtaa ttgtcatttg   9540atacttctgg tatttatgga aaaatatatg aataactttt cttgtaaaga acccccttca   9600tttattgaaa ataaaattat attatcaatt attcttcctg tatataacgt atcagagtat   9660ttaattgagt gcctaaacag tttgctgtta gacgttcatg aacgttatct taatagatgt   9720gaagtaattg tggttgatga tggttcaact gataattcat ttgaattaat gagagagtat   9780tctttgaaat atcctgaatc tattaagatt tattcgaaat tcaatggtgg tctctcagat   9840gcaagaaact atggattatt aaaatcttca ggtaaatata tttcttttgt tgattcagat   9900gatgttgtta atagaggttt tataaaggaa atcatcaatt tcattgatgc ctatgatttt   9960gatatattgt catttgactt catgaagttt tttaataata atgatgctct tattctttca   10020caaatagatg aattctccaa aatggcagaa agagtagatt cggagttcta caagtccaag   10080cctgtttttg cttggaataa agtttatcga cgttctcttt tcgacaatga agtatttcct   10140aaggggtggt attatgaaga tgttgcatta attccgttat tattagatag agcaaaagtt   10200ttataccata ttaatagcgt ttgttatttt tatagacaga gacaaggagc aatcactttt   10260
ttttatgaca ataaatatct tgatatttta aaaggagtgt cttttttata tgacaggtca  10320caatcttcat tcattaaaac gataattata aatcagtttt ttactttaac cttactatct  10380ttaagattgc cgactgataa ttatttcatg aatatgaggg ggattattga tacctattgt  10440gaaaaatttg acttggattc ctttgagcct aaactaatat taaaacacat tcctttttta  10500ttgcttaaaa aattgaagtc gctgtgtgtt tatccactgt atttatttaa acctgcagtt  10560tttttacata aacaaattaa acattttaga ggaaaactaa agtgaaatat gattatataa  10620ttataggtag tggtcttttt gggagtgtgt ttgcacatga attagggaaa atgaaaaaaa  10680aggtcaaggt tattgagcgt cgtgatcatg ttggtggtaa tgtatattgt gagaatattg  10740aaggaattaa tgttcataaa tatggcgcac atatatttca tactaacgat aaagaaatat  10800gggattatgt aaatcaattt gtagagttta atagatatac aaattcacca ttagcttttt  10860caaaaggtaa aatttataat ttacctttta acatgaatac ctttaatcaa ctctgggggg  10920ctattactcc tcaacatgcg aaagaaatta ttaaaaagca aagcggtgaa ataagtggaa  10980ataaaccaag gaatcttgaa gagcaagcta tttctttggt gggacgagat atttataatt  11040gtttgattaa ggagtacact gagaaacaat ggggacgacc ttgcactgaa ttgccatcat  11100ttattataaa acgactccct gttaggttta catacgataa taactatttt aatgaccagt  11160atcaaggaat accagtcggt ggttacaata aattaatcga tgcattatta aatggtattg  11220aagttcaaac atgcactgac tattttgaag agaagaaata ttgggattct attgcaaaga  11280aaattattta tacagggcct attgataagt tttattgcta taaatttgga gctttggatt  11340atcgatcatt aaaatttgag catgaattac tgaatgtcga taattttcaa gggaatgctg  11400ttgtaaatta tatagacaaa aaattcccat tcactcgtat aatagaacat aaattttttg  11460aatttggtga acagcataat actctcatta ctcgagagta cccaaaagaa ttcgaagaag  11520gcgatgagta ttactatcct gtcaatgatg aaaaaaatat gcaaatctat aaaatgtatt  11580ataatctttc taaacaggaa agtaatgtga tttttggtgg acgtcttgcg gaatataaat  11640attatgacat gcatcaagtt atcaaatcag ctttaaatgc attccgaaaa gaggtacgtt  11700taggtgaata aagaagtaat cgcagttatt gtaacctata atagaaaagc attattgctg  11760aaagttatag atgctgttat taaccaaagt tatccactaa aaaaaatatt gataatagat  11820aataatagta ctgatggtac ggagatgttt atttcaaata ggctctctga cgtggtgaag  11880tataaaaata cgggggataa tttagggggg gctggcgggt tttatagagg attcatagag  11940gcggaaaaat atggctatga ttatctttgg ttaatggacg atgattttat gcctacagtg  12000aattgtcttg aaatattaat atcaaatagc cctgatggta ttgtccaacc tgttagatat  12060aacttggatg aaacttgtgc agagctttct ccattaactt atgatttatc taacccattt  12120aagttaaacc ctaaaggtac accattaaaa aattacttaa atacaattgg taataaatct  12180gcgaaggtag atattgaagc tattccattt gaaggtccat tgatttcacg aaaggttgtt  12240gaaaaaatag gctatccaga gcctaagttt tttatttttt gtgatgacat tgaatacgct  12300attaaagcta aaagaaaggg gattcccatc cagtgcaatc ttaaagccaa ggcataccgc  12360cttttggtca acaatcaagg taatgatctt ctttcctgga aaggatattt tatgcttcga  12420aatcttttct acctgcataa aacgtatggg accaatttcc ttgttagaca aaaacctatc  12480gtattgggat taggatatgc attgtcgtgt gtattgaaat gcaatttttc tcaacttccc  12540gttatatggc gtgctttttg ggattcatct acgttaagaa ataccgaaaa attcaggccc  12600gaaatgagaa gtaaataatt tattattatg tttttattaa ttaatgtcga tttttactaa  12660aattcttaac acgatattta tccctgacag gagtaaacaa tgtcaaagca acagatcggc  12720gtcgtcggta tggcagtgat ggggcgcaac cttgcgctca acatcgaaag ccgtggttat  12780accgtctcta ttttcaaccg ttcccgtgaa aaaacggaag aagtgattgc cgaaaatcca  12840ggcaaaaaac tggttcctta ctatacggtg aaagagtttg ttgaatctct ggaaacgcct  12900cgtcgcatcc tgttaatggt gaaagcaggt gcaggcacgg atgctgctat tgattctctc  12960
aagccatacc tcgataaagg tgacatcatc attgatggtg gtaacacctt cttccaggac  13020accattcgtc gtaaccgtga gctttctgca gaaggcttta acttcattgg taccggtgtt  13080tccggcggtg aagagggggc gctgaaaggg ccgtccatca tgcctggtgg ccagaaagaa  13140gcctatgaac tggttgcacc gatcctgacc aaaatcgccg cagtagctga agacggggag  13200ccatgcgtta cctatattgg tgccgatggt gcaggtcact atgtgaagat ggttcacaac  13260ggtattgaat acggtgatat gcaactgatt gctgaagcct attctctgct taaaggtggc  13320ctgaacctca ccaacgaaga actggcgcag acctttaccg agtggaataa cggtgaactg  13380agcagctacc tgatcgacat cactaaagac atcttcacta aaaaagatga agacggtaac  13440tacctggttg atgtgattct ggatgaagca gcaaacaaag gtaccggtaa atggactagc  13500cagagcgcgc tggatctcgg cgaaccgctg tcgctgatta ccgagtctgt gtttgcacgt  13560tatatctctt ctctgaaaga tcagcgcgtt gccgcgtcta aagttctcac tggcccgaaa  13620gcacagccag ctggcgaaaa ggctgagttc atcgaaaaag ttcgtcgtgc gctgtatctg  13680ggcaaaatcg tttcttacgc tcagggcttc tctcagctac gcgccgcgtc tgaagagtac  13740aactgggatc tgaactacgg cgaaatcgcg aagattttcc gtgctggttg catcatccgt  13800gcgcagttcc tgcagaaaat caccgatgcc tatgccgaaa atccgcagat cgctaacctg  13860ctgctggctc cgtacttcaa gcaaattgcc gatgactacc agcaggcgct gcgcgatgtc  13920gtcgcttacg cagtacagaa cggtatcccg gttccgacct tcgccgctgc ggttgcctat  13980tatgacagct accgttctgc tgttct                                       14006表1源于大肠杆菌O164的O抗原基因簇中IS序列和wzx基因的引物及PCR数据引物             引物位置            引物所处        PCR产物    产生正确   PCR的退火的基因的        长度       大小电泳   温度(℃)带的组数第一条正向引物   1868至1885碱基      IS序列          1182bp     0          58第一条反向引物   3020至3050碱基      O-抗原转运酶第四条正向引物   2265至2284碱基      IS序列          562        0          55第四条反向引物   2809至2827          O-抗原转运酶表2 166种血清型的大肠杆菌和43株志贺氏菌及它们的来源组号                  该组中含有的菌株                                                 来源1、野生型大肠杆菌     O1,O2,O5,O7,O8,O9,O12,O13,O14,O15,O16,O17,O18,      IMVSaO19ab,O20,O21,O22,O23,O242、野生型大肠杆菌     O4,O10,O25,O26,O27,O28,O29,O30,O32,O33,O34,O35,      IMVSaO36,O37,O38,O40,O41,O42,O433、野生型大肠杆菌     O6,O44,O45,O46,O48,O49,O50,O164,O52,O54,O55,O56,     IMVSaO57,O58,O60,O61,O62,O534、野生型大肠杆菌     O63,O65,O66,O69,O70,O71,O74,O75,O76,O77,O78,          IMVSaO79,O80,O81,O82,O83,O685、野生型大肠杆菌     O84,O85,O86,O87,O88,O89,O90,O91,O92,O98,O99,          IMVSa
O101,O102,O103,O104,O105,0106,O97,6、野生型大肠杆菌    O107,O108,O109,O110,O111,O112ab,O112ac,O113,              IMVSaO115,O116,O118,O120,O123,O125,O126,O128,O1177、野生型大肠杆菌    O129,O130,O131,O132,O133,O134,O135,O164,O137,            IMVSaO138,O139,O141,O142,O143,O144,O145,O1408、野生型大肠杆菌    O146,O147,O148,O150,O152,O154,O156,O157,O158,            IMVSaO159,O160,O161,O163,O164,O165,O166,O153                     b9、野生型大肠杆菌    O168,O169,O170,O171,O172,O173,                               c痢疾志贺氏菌      D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12,D13             d10、鲍氏志贺氏菌     B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15,     dB16,B17,B1811、福氏志贺氏菌     F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v:4),F5(v:7),F6,         dDS,DR12、野生型大肠杆菌   O3,O11,O39,O59,O64,O73,O96,O95,O100,O114,O151,O155,   IMVSaO124,O167,O162,O121,O127,O149,O11913、野生型大肠杆菌   去除大肠杆菌O164的第8组菌为了检测的方便,每12-19个菌分为一组,总共12组,第13组作为阴性对照a.Institude of Medical and Veterinary Science(IMVS),Anelaide,Australiab.Statens Serum Institut,Copenhagen,Denmarkc.O172和O173来自于Statens Serum Institut,Copenhagen,Denmark,其余来自于IMVSd.中国预防医学科学院流行病学研究所表3是大肠杆菌O164的O-抗原基因簇的结构表表4是大肠杆菌O164的O-抗原基因簇中的基因的位置表CTCCTGGTAA CTCACGCGTC CAAGAACGCG GTCGAAAACC ACTTCGACAC CTCTTATGAA       60TTAGAATCTC TCCTTGAGCA GCGCGTGAAG CGTCAACTGT TGGCGGAAGT ACAATCTATC       120TGTCCGCCGG GCGTGACCAT TATGAACGTG CGTCAGGGTG AACCTTTAGG TTTAGGCCAC       180TCCATCTTAT GTGCGCGACC TGCCATTGGT GACAACCCAT TTATCGTGGT ACTGCCAGAC       240GTAGTGATCG ACGACGCCAG CGCCGACCCG CTGCGCTACA ACCTTGCTGC CATGATTGCG       300CGCTTCAACG AAACGGGCCG TAGCCAGGTG CTGGCAAAAC GTATGCCGGG TGACCTCTCT       360GAATACTCCG TCATCCAGAC CAAAGAACCG CTGGACCGTG AAGGTAAAGT CAGCCGCATT       420GTTGAATTTA TCGAAAAACC GGATCAGCCG CAGACGCTGG ACTCAGACAT CATGGCCGTA       480GGTCGCTATG TGCTTTCTGC CGATATTTGG CCGGAACTAG AACGCACTCA GCCTGGTGCA       540TGGGGGCGTA TTCAGCTGAC TGATGCTATT GCCGAACTGG CGAAAAAACA GTCCGTTGAT       600GCCATGCTGA TGACTGGAGA CAGCTACGAC TGCGGTAAAA AAATGGGCTA TATGCAGGCG       660TTTGTGAAGT ACGGACTGCG TAACCTGAAA GAAGGGGCGA AGTTCCGCAA AGGTATTGAG       720AGGTTGTTGA ATGATTAAAA ACATGAACAA ATATAACGGT AAATAAGAGA AATTGTAACG       780GCAGTGAGGA TTTGCGGCGA AGCTCAAACG TGGCGAATAT CCCTGTCGTT ATTTATTAAT       840AAATCATCGT ACTAACAATG GAATAAAAAA GTGCCTTGTT TTAAGTTTTA CAGGATATTC       900CTTGTTTCTG GAGGAGATTG ATAAGACAAT CAGCATCTGA ATTTATCAGA ACTTGTGTGT       960CTTGCTGATT ACATTGTTAT ATTCATGCAG TGTACTGGTA GCTGTGGAGC CAGGGGCGGT       1020AGCGTGCATT AATATTCACA ATATATTCTT TTAAATGTAA GCAGAATTAA TCGAACCTAA       1080
ATAATGTCAC GTAACAAAAT AATCATAAAA ATGTAATGAA CGCATCCCAC ACAATTAAAC     1140ACGGAGCAGT ATGATGGTTA AAAGGGTGAA ACTGGCAGGT GTGGAGCCTC GCAGATTCCG     1200IS起始位点GCATCATAGT GCCCAATACG GGATGCATAA AGCTCCCTCA GACTGGAGAC TCCACAAATG1260AAATATACAC CGGTTGGCGT TGATATCGCA AAACATGTCA TTCAGATTCA CTTCATCAAT     1320GAGCACACAG GTGAAGTGGT TGATAAACAG TTGCGTAGAC AGGATTTTCT GACGTTCTTC     1380GGCAACCGTG AGCCATGCCT GATTGGTATG GAGGCCTGTG GAGGTTCTCA GCACTGGGCA     1440CGGGAACTGA CAAAACTTGG TCATAAAGTC CGGTTGTTGC AGGCCCGCTT CGTTAAGGCA     1500TTCGTCATGG GCAATAAGAA TGATGTGATG GATGCCCGGG CTATCTGGAT GGCGGTTCAG     1560CAGCCGGGTA AAGAAATCGC CGTAAAAACA GAAGAACAGC AGTCGGTACT GGTTCTGCAC     1620CGTACCCGCA TGCAACTGGT GAAGTTCCGG ACCGCACAAA TTAATGCCCT GCACGGGACG     1680TTACTGGAGT TTGGTGAAAC CATCCACAAA GGCCGGGCAG CGATGGAGCG GGAGTTCCCC     1740GAAGCACTGG AACGGATGAA AGAGAGACTG CCACCGTATC TCATTATGGT TCTGGAAAAC     1800CAGTACAACC GACTGAATGA GCTGGACTCA CTGATAGAGG ATATTGAAAA ACAGCTTACC     1860AGCGTGGCGA GGCAGAATGA AACCTGTAAG CGGTTGCTGG ATATTCCTGG CGTTGGACCA     1920CTTATTGCGA CGGCAGCGGT GGCCACCATG GGGGAAGCAT CAGCGTTTAA ATCGGGGCGA     1980GAGTTCGCCG CATATGTTGG TCTGGTTCCA AAACAAACTG GCTCCGGAGG GAAAGTACGT     2040CTGCTGGGGA TAAGCAAACG TGGTGACACT TATCTCAGGA CATTATTTAT CCACGGTGCA     2100AGAGCGGTGG CATTAGTAGC TAAAGAGCCT GGCCCGTGGA TAACCGAACT GAAAAAACGT     2160CGTCCAGCCA GTGTGGCAAT CGTCGCCATG GCAAACAAGC TGGCACGAAC AGTATGGGCG     2220IS终止位点ATAACCGCCC ATGACCGTAA GTATGACAGG AACCACGTCA GTATCAGACC ATATTAATCG   2280CTGATACCAT TAAACAATGA ACTCTTAACA AAAGGGTGAA TGCTGAAAGG TTGCTATGGC     2340GGCCAGAGTG ATGACAAAGA CAGGTAAGAC CGTGACTCAC TAAACCTGAA CAGTATTTTG     2400GGCTTGAAGT CCGCCGTGAA AATAAGGGGT GAGTCGGCGA ATTACATAGG GGCTCGCAGC     2460Wzx起始位点GTTACGGCTG CAATAAAGCC GGATATAAAG CTGCAACCTA CCCGTCATGT CAAAACAATG2520GATGCCTTGC AAACGGGATG CGTTCATATA AATACTATGT TTTTGGCAAC AAGAACCTTA     2580GTTTCTTTAA GTGTTTCATT TTACACAACA AGAATAGTTA TACAACAGTT GGGGGCGGCA     2640GACTATGGCT TATTTAATAT CATTTATGGA GTTGTAACAT TTTTTACATT CGTAGTCACC     2700GCGATGAATG ATTCTGTACA GCGTTATATT GCAATAGGTG TTGGTTCACA AAAAATATCG     2760GTTATTAGAG ATGCTGTAAA AAATAGTATG TTTATATTTG TTATATCTGC TTTCATATTG     2820GCAGTATGTC TTCTTTTGGC AAGGGGGGTG ATCATACATA ATATTTTAAA TATACCTAAA     2880GATTCTATTG AAAATGCAAG TGTGTTATAT TTGGTTGCAG TATTTTCAAT AACCATACTT     2940ATAATTCAGA CGCCACTTAA TGCGATGGTG TTAGCATACG AGAAAATGTC ATTTTACGCA     3000TACATGATGA TATTTGAAAT GGTAGCTAAA ATGAGTATGG CTTTGTTACT AACTTTACTG     3060GAAAAAGATA AGGTCATTGT ATATTCAATA CTTTTAGGTT CTATTTCTTT TTTTAACTTG     3120TTGGTTTATT TATGCTACTG CTTGATATGT TTTAAAAAAT CAATGTTTGG TGGGAGAATA     3180AAATTTAGAG TGCTGAAAGA AATTTCAACT TTTTCATTTT GGAATATATT TGGTAATTTC     3240TCTTACATGT GCAGAGTTCA GGGAGTGAAC ATTGTAATTA ATATGTTTTA CGCTATAGCC     3300GTGAATGCAG CATATGCGAT TTCGATTACT GTTTTAAATG CAATTAATAC ACTTACGCAA     3360TCATTAATTA CAGCATTAAG GCCTCAAATA TTTAAATCAT ATGGCGAATG TGATTTAAAA     3420AGATATAATC ATCTAGTTCT CTTTGGTTCA AAATATACAT TTTCAATATT GTTTCTGTTA     3480AGTAGCCCTG TAATTCTATG TGCGGATGAG TTGTTAAAGA TATGGCTTGA TATTGTACCA     3540GATTATACAG TTGAATTTGT GAGGTTGGTC ATTGTTGTGG CTTTTATTGA TAGTTTTTCA     3600TATAGCATGA TTGCTGGTAT TCAGGCTACG GGTAGGATTA AAACATATCA ACTAGTTGTT     3660
AGTTTAATTG TCCTAATTAA TTTGCCGTTA ACCTTTATTT TGTTTAAGGC AGGAAATAAT     3720GTTTTAAGTA TGTTTTATCC ATTTATTGTT ACTGCCATTA TCAATCAAGG TTTAAGGTTG     3780TATTTTATCT ATATCAATGC AGGTTTTGAT TATAAGAAGT ATTTCACTGT TGTGATCTAT     3840CCTTGCTTGT TAGCTGTATG CTTATCGTTA GTGACAGATA TTTCAATTAA AAAAATGCTT     3900CCATTTAACA GTGTTATTGA TGTTTTAATT GTGTGTATTT TTATTTTTTC ATTCAATACA     3960Orf2起始位点ATAATTTTTT ATTGGGTTGT AGTTTCTAAA AAGGAAAAAAATGGTTATTA GAAACCCTGA 4020wzx终止位点AAAGAAAAGT GAAATAACAA TAAAAGATGT TATAGACAAT GAACTCTGTA CTGGTTGTGG     4080AGTTTGTATT TCGGAAGATA GTAGCAAAAC CTCCTTTATG AAATGGAATT CTGAAGGTTT     4140TTATGAGCCA TGTTTCTCTC CTGTATCAAC ATTATTCAAT ATGCAGCGTG TTTGTCCCTT     4200TAACTTAAGT AGGGATACAT TAGTGAATGA GGATGAACTT GCGCATGAGT TTTTTGATGG     4260TAAGGGATAT TTAGATTCTG AGGTTGGGTT TTATAAAAAA ATATATGTGG GTTATTCTAA     4320ACATTTTAGA GAGACTTCAT CCTCCGGTGG TATAGCTACA TATGTATTTG AACAACTTCT     4380TAGACGTAAG TATGTTGATG CTCTATTTAT AGTTAGGGAG CTTGGTGGTT CATATGGATA     4440TCAAGTCTTC GATAATCCAG AACATATTAA GGATATGTCT AAAACAAGAT ATTATCCTGT     4500AACGCTAGAA AAGTTATTTG ATAATATTTA TAAGCTTAAT GGTAGAGTGG CCGTTTCAGG     4560AGTGGCATGT TTTATTAAAG CCATTAGGCT CAAACAACAT TACCATCCAG AACTGAAAGA     4620GAAAATACCA TTCCTTGTTG GTATAATTTG TGGAGGACTC AAAAGTCGAT ATTACACTGA     4680TTATTTATCA CAGTCTGCTG GTTGTGTCAG TGAGTACCAA AATGCTGAGT ATCGAGTGAA     4740AAAGAAAGAT AGTCATGCTC TTGACTATCG TTTCACATGT GTTGAGAAAT CAAATAATAT     4800AATTCATTCT GTTGATATGC AAAGAATGGG GGATATGTGG GGTTCAGGGC TATTTAAGGC     4860AAACGCATGT GACTATTGTG ATGATGTTAC AACCGAACTC GCAGACATAT CATTGGGTGA     4920TGCCTGGATT TCGCCATACA ATATGGATGG AGCTGGTAAT AATGTAGTTG TATGTCGCTC     4980CACCACAGCT CATGAAATTA TTTTATCTGG GATTGAGAAA AAAGACTTAG AATTAACGGA     5040ACTCGAATTA GAGCAGTTGA AATTGTCACA ACAAGGAAGT TTTAACCACA GGCATAAAGG     5100ATTATTATAT AGAATAAAAA ATGCAGAGAA AAATAATCGC TTAGTGCCTG TTAAGAGGAA     5160AAGATTCTTA CGCTCTATAT CTTTTTTATT AAAGTTAATT CAAAAACAAC GATCAGTTAC     5220AAGGAGAAAA AGCATAGAGA TATGGATGGA AACTCAAAAT TCAGCAACTT TCGATAAGAA     5280AATGAAGGGA TATTTATTCA CGTTGCGTTG GTTAACAGTG GTCAATAGGA AATTAAGTCG     5340Orf2终止位点GATGTTCAAG ATTGTTTCTC TAAATAGAAT GGGTAAAAAA TGAAAGTTGC AATATTAACT   5400Orf3起始位点CAACCATTAC ATACGAATTA TGGTGGCACA TTACAAGCCT ATGCATTACA AAAAGTCTTG     5460ATTAATTTGG GACATGAACC AGAGACTATT AATTATAGGT CGAAAATTAA GAGGCCACTA     5520TTTATCCGTG TTGTGTTGTC AAAAATTAAA AGGATAGTAT TATGCCGAAA AATCACATTT     5580GATTTTACAA CACAAGATAG AATTAATATT AGGAAGCATC ATCAATCTTT CATTGATACA     5640AGATTAAACT ATTCAGAGGA GATTAACGGT ACTGAGGGGT TGAGAGATTA TATTTTAAAA     5700AATAATTACG GTGCTGTAAT AATAGGTAGT GATCAGACAT GGAGACCAAT ATATTCGCCT     5760AGAATAGATT CATTTTTTCT CGATTTTTTA AGTGATGTAA ACGATATAAA AAATGGCATA     5820TGCAGCATCT TTTGGTACTG ATAAATGGGA GTTCACGGAG TCACAAACTA ATTTATTTAA     5880ATTGTTACTT TCAAAATTTG ACTATGTTTC AGTTAGAGAG TCCTCAGGAG TCAAATTATG     5940TAGTGAAAAA TTTGGTTTGA AAGCAGAGTT GGTTTTAGAT CCGACATTGC TATTGACATT     6000CGAAGATTAT ACTCATTTAT TAGACAATGA CTATATTAAT CTTCATAAGG GAAAGGTGTT     6060TAGTTATGTA CTTGATGAGA ATTACGACAA AAAAAACTTT ATAGACACAG TAGCAAGTAC     6120TCTCCGCACA ACGTCATTTT ATACTTACCC TAAAAAAATC ACTAAAGATG AATATGTGAT     6180
TAGAAATTAT TCCGAGTATG AATATCCGCC AATAGAATAT TGGATTTCTT CGTTTAAGGC      6240CGCTGAATTT ATTGTAACAG ATTCATTTCA TGGAACAGTA TTTTCTATTA TTTTTAACAA      6300ACCCTTCATC GCCATTGCAA ATGAAGAGAG AGGAAAGGCT AGATTTACGT CACTATTGGA      6360AATGTTTGGT CTTGAAAGAC GACTTGTGAG TAATTTAGAT GATGTTGATT TAAAGCTTGT      6420AAATGAAAAA ATTAACTATG GCCCCATAAA TGAAAAAATT GCTTATTTTA GAGAAGAGTG      6480orf3终止位点CCTTAAAAAG TTGCAGTTAA TGCTAATAAA ATAATCAGAT TATGTATGTC TCTCTACAAT    6540Orf4起始位点TAAAATATGA ATGTTGATCGATGAAGAATT GTAAAGTATC TGTAATTATT CCGGTCTATA    6600ATGCGGAAAA ATATATACAA CGTTGTATTT TAAGCTTATT AAAGCAGACA TTAGATGATG      6660TTGAAATTAT CATCATTGAT GATGGTTCTA CTGATAATTC ACTTTCTATA ATAAAAGAAA      6720CTGTTGCATT GCATACTGCT AGTAGAGCTC GCCAAAAGAG AATCAATATA ATCTCTCGAG      6780AAAACAAAGG AGTTGCCTAT ACACGAAGTC AGGGATTGAG ACTTTCGCAG GGGGAATTTA      6840TCATTCATTT TGATAGTGAT GATTGGGCAA AATCCAATAT GCTGGAGGAA ATGTATAAGA      6900CAATTGTTTC CAATAATGCA GACATGGTTA TATGCGATTA TTTTTTAGTG AAGAATAATA      6960AAGAAATACT TATAAAACAG AGAGTGGAGT ATGAGCCAAA GAAATGTATT AGATATCTAC      7020TGACTGGTGA GCTAGAAGGG TTTACATGGA ACAAACTAAT TAGAAAAAAA TATATCGATA      7080AAAATAAAAT TGATTTTGTT AATAAAATTA CTTATATGGA GGATTTTTTG TTCATATTAA      7140GTGTGTTACT ACACAATCCT AAAATTATTT TTCAGGATTG TGCATATTAT TATTATCAAA      7200AAAGCAATCC TAAATCTCTA ACTAGCCATG CTAGTGTGGA TAGGCTTTCT GAAATGATTA      7260AAGCCGTAAG TGAAATAGAA AAGAAGATAA ATAAATATAA TTTACAAAAG TATCTGAATA      7320ACGAGTTTCA ATTGTTTAAG TTAAAACAAA AAATTTGGTT TATATCTATA AGTAAGTTAA      7380ATGTTAATGA TAATGTATGG AATCTCTTTC CTGAAACAAA TCCATTTATA TCAAAGGTAA      7440ATGTGCTTTT TTATTATAAA ATAGTGCTTT TTCTTGATAG TATTAAACTG CGTTTTTTTT      7500CAAATAAGAT CATTTATCTC ATTGGATTGG TGCAGGCTTT ATTACAAGAA AGGAAAGAGA      7560orf5起始位点 orf4终止位点AGTGATACCA AAAATAATTC ATTACTGCTG GTTCGGTCGC TCTCCATTGT CGGAATTAAC    7620AAAGCAGTGC ATTGCAAGCT GGGAGAAATA TTGTCCTGAA TATAAAATCA TAAGATGGGA      7680TGAAAATAAT GTCGATTTGA ATTCTTGTTC TTTTGTTAGA CAAGCTTATA AAGAAAAAAA      7740ATGGGCGTTC GTTTCTGATT ATGTAAGGCT TAAAGTGGTT AATGAATATG GCGGTATCTA      7800TCTTGATACA GATGTTGAAT TAATAAAGCC ATTAGATGAT TTGTTAATAT ATCCTGCATA      7860TATAGGCTTT GAAATTAACA AGGAATGGTA TGTAAATTCT GGTTTGGGGT TCGGTTCTGT      7920TAATAATAAT CCGGTTTTAG AATCATTAAT TATGGAGTAT GAAAATATTA ATTTTGTAAA      7980TGAGGATGGG ACTCTAAATA TAACGCCGTG CCCCATAAGA GAAACAAAAG CATTAACAAA      8040AATAGGTTTA ATTCCTGATG GTCAATGTCA ATCTTTTGAT AATATAGTGA TTTTTTCTGC      8100AGATTATTTT TGTCCTGTAT CTATAACAGG TGAGAGAAAT TTTTCTGATA AAACATATTC      8160AATACATCAT TACGATGCTA GTTGGTTTTC TGAGCAAAAG AGAAAAGGCC TGCAACGTAA      8220AAAGAGATTT ATAAAACTAT TCGGCAACCT AATAGGCACA TATATTAATA AACCTTTTAT      8280TTTTGTAGAT GAATGTCGCG AGTTCGGATT AGTTAAAGCA ATCAAGAATA TGCGTTCCAA      8340orf5终止位点TTTTCCTTAATTTTTAGTGT TAAGGAATAA GTTTCGTTAA AATACTTTAT TCATTTAATT    8400Orf6起始位点AATAAAGGTT TAATGGTGAT TAGATGTACT TTCTTTTGTT CTTCTCAATA TTTTATTTTG    8460TATACGTAAT CTTAATAGGA ACATTATGTC ATAACTATAA AGCCCTTTTG ATTTTTTCAC      8520TAATCCCTCT GACAATAGTG TCAGGTATAA GATATAATGT CGGCTTTGAT TTTATGTCAT      8580ATGTTGATTA TTTCAATCAA CTCAAATATT CAAATGATAT ATATCTAGAT TCTACCTTTA      8640
AGTATATAAG CTACTTTACC TATTATATAG GAGGTAACGA ACAGATTTTG TTTCTGATAT      8700ATGCGGTTTT TTATTCGGTT GCACTTTATT TTTTAATAAA ACTGGTATTG GAAAATTATA      8760TAACGGAAAT AAATAATTTT TATACTATTG GACTTGTGTT ATCATTTTAT TCGTTTTATT      8820TTTTATTATC ATTTAATCAA ATTAGGGCTG TATTATCAGC TCTAATACTA TGTTATGGGC      8880TATTAAAAAA TAAAATAGAT TTTTCTTTTA TAATAACAAT TACATTAAGT ATTCTTTTTC      8940ACTCTGCAGC AATGTTCATT TTACCTCTTT ATTTTGTCCT AAGAAAAATA AATGTAACAG      9000TTCTGTTGGT GATATTCCCT TTTTTGGTTG TTGCTTCATT CTTTAATATT TTTTCAGATA      9060TTGTGAGATT CATTCTGACA TTGCTAAATA GTCGTTTTTT AACATATTTT AACTCTGAAT      9120ATTTTGTTCC AAGGACGGGA ATGGAAAAAA TGTATAGTAT GATCTCAATG ATTATTGTTT      9180TGGGAATGGT TGTTTGTTTG TCTAAATTAT TACCTAAAAA GTTTGATTTA ATGATAAAGT      9240TTGTTATTCT TTTTGTTCTA CTTAGAGCGA TGTCAATTGA TATATTGATT TTTGCTAGGT      9300TTAGTGATTT TCTTAAACCA ATGGCTATAA TTCTTATATT TACCGCTGTT TATTTTTCTT      9360CGAATAAAGT GCGACCTAGA ATTATCCTTC CTTTTTATTT AATTATGACA TTGTTTCTCT      9420GTATTTTTAA TATAATAATC GGATCGAATA TAACTAAGGG GAACTATTAT ACTTATGGTT      9480orf6终止位点ATAACATTTG CTTTTTTGGC AATAAATGTA TAGATAAATT TTATTAGTAATTGTCATTTG    9540orf7起始位点ATACTTCTGG TATTTATGGA AAAATATATG AATAACTTTT CTTGTAAAGA ACCCCCTTCA    9600TTTATTGAAA ATAAAATTAT ATTATCAATT ATTCTTCCTG TATATAACGT ATCAGAGTAT      9660TTAATTGAGT GCCTAAACAG TTTGCTGTTA GACGTTCATG AACGTTATCT TAATAGATGT      9720GAAGTAATTG TGGTTGATGA TGGTTCAACT GATAATTCAT TTGAATTAAT GAGAGAGTAT      9780TCTTTGAAAT ATCCTGAATC TATTAAGATT TATTCGAAAT TCAATGGTGG TCTCTCAGAT      9840GCAAGAAACT ATGGATTATT AAAATCTTCA GGTAAATATA TTTCTTTTGT TGATTCAGAT      9900GATGTTGTTA ATAGAGGTTT TATAAAGGAA ATCATCAATT TCATTGATGC CTATGATTTT      9960GATATATTGT CATTTGACTT CATGAAGTTT TTTAATAATA ATGATGCTCT TATTCTTTCA      10020CAAATAGATG AATTCTCCAA AATGGCAGAA AGAGTAGATT CGGAGTTCTA CAAGTCCAAG      10080CCTGTTTTTG CTTGGAATAA AGTTTATCGA CGTTCTCTTT TCGACAATGA AGTATTTCCT      10140AAGGGGTGGT ATTATGAAGA TGTTGCATTA ATTCCGTTAT TATTAGATAG AGCAAAAGTT      10200TTATACCATA TTAATAGCGT TTGTTATTTT TATAGACAGA GACAAGGAGC AATCACTTTT      10260TTTTATGACA ATAAATATCT TGATATTTTA AAAGGAGTGT CTTTTTTATA TGACAGGTCA      10320CAATCTTCAT TCATTAAAAC GATAATTATA AATCAGTTTT TTACTTTAAC CTTACTATCT      10380TTAAGATTGC CGACTGATAA TTATTTCATG AATATGAGGG GGATTATTGA TACCTATTGT      10440GAAAAATTTG ACTTGGATTC CTTTGAGCCT AAACTAATAT TAAAACACAT TCCTTTTTTA      10500TTGCTTAAAA AATTGAAGTC GCTGTGTGTT TATCCACTGT ATTTATTTAA ACCTGCAGTT      10560orf7终止位点TTTTTACATA AACAAATTAA ACATTTTAGA GGAAAACTAA AGTGAAATAT GATTATATAA    10620orf8起始位点TTATAGGTAG TGGTCTTTTT GGGAGTGTGT TTGCACATGA ATTAGGGAAAATGAAAAAAA    10680AGGTCAAGGT TATTGAGCGT CGTGATCATG TTGGTGGTAA TGTATATTGT GAGAATATTG      10740AAGGAATTAA TGTTCATAAA TATGGCGCAC ATATATTTCA TACTAACGAT AAAGAAATAT      10800GGGATTATGT AAATCAATTT GTAGAGTTTA ATAGATATAC AAATTCACCA TTAGCTTTTT      10860CAAAAGGTAAAATTTATAAT  TTACCTTTTA ACATGAATAC CTTTAATCAA CTCTGGGGGG      10920CTATTACTCC TCAACATGCG AAAGAAATTA TTAAAAAGCA AAGCGGTGAA ATAAGTGGAA      10980ATAAACCAAG GAATCTTGAA GAGCAAGCTA TTTCTTTGGT GGGACGAGAT ATTTATAATT      11040GTTTGATTAA GGAGTACACT GAGAAACAAT GGGGACGACC TTGCACTGAA TTGCCATCAT      11100TTATTATAAA ACGACTCCCT GTTAGGTTTA CATACGATAA TAACTATTTT AATGACCAGT      11160
ATCAAGGAAT ACCAGTCGGT GGTTACAATA AATTAATCGA TGCATTATTA AATGGTATTG     11220AAGTTCAAAC ATGCACTGAC TATTTTGAAG AGAAGAAATA TTGGGATTCT ATTGCAAAGA     11280AAATTATTTA TACAGGGCCT ATTGATAAGT TTTATTGCTA TAAATTTGGA GCTTTGGATT     11340ATCGATCATT AAAATTTGAG CATGAATTAC TGAATGTCGA TAATTTTCAA GGGAATGCTG     11400TTGTAAATTA TATAGACAAA AAATTCCCAT TCACTCGTAT AATAGAACAT AAATTTTTTG     11460AATTTGGTGA ACAGCATAAT ACTCTCATTA CTCGAGAGTA CCCAAAAGAA TTCGAAGAAG     11520GCGATGAGTA TTACTATCCT GTCAATGATG AAAAAAATAT GCAAATCTAT AAAATGTATT     11580ATAATCTTTC TAAACAGGAA AGTAATGTGA TTTTTGGTGG ACGTCTTGCG GAATATAAAT     11640ATTATGACAT GCATCAAGTT ATCAAATCAG CTTTAAATGC ATTCCGAAAA GAGGTACGTT     11700orf8终止位点TAGGTGAATA AAGAAGTAAT CGCAGTTATT GTAACCTATA ATAGAAAAGC ATTATTGCTG   11760AAAGTTATAG ATGCTGTTAT TAACCAAAGT TATCCACTAA AAAAAATATT GATAATAGAT     11820orf9起始位点AATAATAGTA CTGATGGTAC GGAGATGTTT ATTTCAAATA GGCTCTCTGA CGTGGTGAAG   11880TATAAAAATA CGGGGGATAA TTTAGGGGGG GCTGGCGGGT TTTATAGAGG ATTCATAGAG     11940GCGGAAAAAT ATGGCTATGA TTATCTTTGG TTAATGGACG ATGATTTTAT GCCTACAGTG     12000AATTGTCTTG AAATATTAAT ATCAAATAGC CCTGATGGTA TTGTCCAACC TGTTAGATAT     12060AACTTGGATG AAACTTGTGC AGAGCTTTCT CCATTAACTT ATGATTTATC TAACCCATTT     12120AAGTTAAACC CTAAAGGTAC ACCATTAAAA AATTACTTAA ATACAATTGG TAATAAATCT     12180GCGAAGGTAG ATATTGAAGC TATTCCATTT GAAGGTCCAT TGATTTCACG AAAGGTTGTT     12240GAAAAAATAG GCTATCCAGA GCCTAAGTTT TTTATTTTTT GTGATGACAT TGAATACGCT     12300ATTAAAGCTA AAAGAAAGGG GATTCCCATC CAGTGCAATC TTAAAGCCAA GGCATACCGC     12360CTTTTGGTCA ACAATCAAGG TAATGATCTT CTTTCCTGGA AAGGATATTT TATGCTTCGA     12420AATCTTTTCT ACCTGCATAA AACGTATGGG ACCAATTTCC TTGTTAGACA AAAACCTATC     12480GTATTGGGAT TAGGATATGC ATTGTCGTGT GTATTGAAAT GCAATTTTTC TCAACTTCCC     12540GTTATATGGC GTGCTTTTTG GGATTCATCT ACGTTAAGAA ATACCGAAAA ATTCAGGCCC     12600orf9终止位点GAAATGAGAA GTAAATAATT TATTATTATG TTTTTATTAA TTAATGTCGA TTTTTACTAA   12660AATTCTTAAC ACGATATTTA TCCCTGACAG GAGTAAACAA TGTCAAAGCA ACAGATCGGC     12720GTCGTCGGTA TGGCAGTGAT GGGGCGCAAC CTTGCGCTCA ACATCGAAAG CCGTGGTTAT     12780ACCGTCTCTA TTTTCAACCG TTCCCGTGAA AAAACGGAAG AAGTGATTGC CGAAAATCCA     12840GGCAAAAAAC TGGTTCCTTA CTATACGGTG AAAGAGTTTG TTGAATCTCT GGAAACGCCT     12900CGTCGCATCC TGTTAATGGT GAAAGCAGGT GCAGGCACGG ATGCTGCTAT TGATTCTCTC     12960AAGCCATACC TCGATAAAGG TGACATCATC ATTGATGGTG GTAACACCTT CTTCCAGGAC     13020ACCATTCGTC GTAACCGTGA GCTTTCTGCA GAAGGCTTTA ACTTCATTGG TACCGGTGTT     13080TCCGGCGGTG AAGAGGGGGC GCTGAAAGGG CCGTCCATCA TGCCTGGTGG CCAGAAAGAA     13140GCCTATGAAC TGGTTGCACC GATCCTGACC AAAATCGCCG CAGTAGCTGA AGACGGGGAG     13200CCATGCGTTA CCTATATTGG TGCCGATGGT GCAGGTCACT ATGTGAAGAT GGTTCACAAC     13260GGTATTGAAT ACGGTGATAT GCAACTGATT GCTGAAGCCT ATTCTCTGCT TAAAGGTGGC     13320CTGAACCTCA CCAACGAAGA ACTGGCGCAG ACCTTTACCG AGTGGAATAA CGGTGAACTG     13380AGCAGCTACC TGATCGACAT CACTAAAGAC ATCTTCACTA AAAAAGATGA AGACGGTAAC     13440TACCTGGTTG ATGTGATTCT GGATGAAGCA GCAAACAAAG GTACCGGTAA ATGGACTAGC     13500CAGAGCGCGC TGGATCTCGG CGAACCGCTG TCGCTGATTA CCGAGTCTGT GTTTGCACGT     13560TATATCTCTT CTCTGAAAGA TCAGCGCGTT GCCGCGTCTA AAGTTCTCAC TGGCCCGAAA     13620GCACAGCCAG CTGGCGAAAA GGCTGAGTTC ATCGAAAAAG TTCGTCGTGC GCTGTATCTG     13680GGCAAAATCG TTTCTTACGC TCAGGGCTTC TCTCAGCTAC GCGCCGCGTC TGAAGAGTAC     13740
AACTGGGATC TGAACTACGG CGAAATCGCG AAGATTTTCC GTGCTGGTTG CATCATCCGT      13800GCGCAGTTCC TGCAGAAAAT CACCGATGCC TATGCCGAAA ATCCGCAGAT CGCTAACCTG      13860CTGCTGGCTC CGTACTTCAA GCAAATTGCC GATGACTACC AGCAGGCGCT GCGCGATGTC      13920GTCGCTTACG CAGTACAGAA CGGTATCCCG GTTCCGACCT TCGCCGCTGC GGTTGCCTAT      13980TATGACAGCT ACCGTTCTGC TGTTCT                                           14006以上仅是本发明较佳实施例,并非对本发明作任何限制,凡依本发明技术实质对以上实施例作修改、等同变化与修饰,均属本发明技术方案的范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈