本发明基于Solexa测序法以及PCR标签(PCR index),开发了新型的HPV检测方法以及用于此的
试剂盒。根据本发明的方法和试剂盒不仅可以实现HPV的高通量、低成本检测,而且可以实现HPV的精确分型。
定义
为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文中所使用的,术语“PCR”是指聚合酶链式反应。
如本文中所使用的,术语“Solexa测序法”是指近几年开发的新一代DNA测序法,也称为第二代测序法。Solexa测序法与传统测序法(例如,Sanger测序法)的不同之处在于,其采用边合成边测序的原理进行DNA序列分析。Solexa测序法具有下述优点:1)成本低,仅为传统测序成本的1%;2)通量高,可以同时对多个样品进行测序,并且进行一次的Solexa测序法可以产生大约500亿(50G)个
碱基的数据;3)精确性高(高于98.4%),有效的解决了多聚重复序列的读取问题。另一方面,高测序通量在进行测序的序列的数目确定的情况下,又反过来提高了序列的测序深度(例如,针对每个序列,可以进行多次测序),从而确保了测序结果的可靠性。如本文所使用的,术语“测序深度”是指一段DNA序列在测序数据中集中出现的次数。测序深度可以通过将测序量除以基因组长度来计算,例如测序深度为10,表示测了10次的整个基因组。
Solexa测序法的应用十分广泛。其可以用于基因组测序,基因分型,基因多态性研究等等。本发明的方法将Solexa测序法用于检测HPV:通过对待分析的样品进行针对HPV的测序,然后使用本领域已知的比对程序,例如BLAST和SOAP,将所得的测序结果与HPV
数据库中的参考序列进行比对,从而实现对样品所感染的HPV的精确分型。本文中使用的HPV数据库包含本领域已知的HPV类型的序列,所述序列可见于例如公共数据库,例如NCBI数据库(http://www.ncbi.nlm.nih.gov/)。
如本文中可互换使用的,术语“PCR标签(PCR index)”、“标签(index)”或“引物标签(primer index)”是指添加在PCR引物5′末端的一小段碱基序列,其通过PCR扩增可以用于标记PCR产物,从而辨别不同模板来源的PCR产物的混合物中各个PCR产物的模板来源。通过在引物的5′末端添加标签,可以对PCR产物进行标记,从而可以将多个不同的PCR产物混合成一个文库,用于进一步的分析和处理。文库中各个不同的PCR产物各自具有独特的标签,从而根据各个PCR产物中独特的标签,可以将各个不同的PCR产物互相区分开来,并将其与PCR模板一一对应。
例如,当需要对多个样品进行测序时,可以在用于各个样品的引物的5′末端添加不同的标签,然后用添加了标签的引物分别对各个样品进行PCR反应,从而对各个样品(即,PCR产物)进行标记。PCR反应后,可以将来自各个样品的带有不同标签的PCR产物混合在一起组成一个文库,然后应用高通量的Solexa测序法同时对文库中的各个PCR产物进行测序。最终,在所得的测序数据中,通过独特的标签,可以将测序结果与各个PCR产物(从而样品模板)一一对应。
可以仅在用于PCR扩增的引物对的一条引物中引入标签,也可以在引物对的两条引物中都引入标签。当在引物对的两条引物中都引入标签时,每个PCR引物对与一对标签组合成一对标签引物,其中正向和反向PCR引物的5′端分别具有正向标签和反向标签,并且正反标签和正反引物序列是对应的,且正向标签和反向标签可以是相同的,或不同的。
设计标签时需要考虑多种因素,包括:1)标签序列中应当避免3个或3个以上的单碱基重复序列;2)所有标签的同一位点中碱基A和碱基C的总含量应在所有碱基含量的30%-70%之间,例如,当设计100条不同的标签序列时,每一条标签序列的第二个碱基(即,所谓的同一位点)中A和C占该100条序列第二个碱基总量的30%-70%;3)标签序列本身的GC含量应在40-60%之间;4)标签之间的序列差异应大于4个碱基;5)标签序列中应避免出现与用于测序的引物相似度高的序列;6)当标签序列添加到PCR扩增引物上后,应避免PCR扩增引物形成发卡结构和二聚体等二级结构。
如本文中所使用的,术语“标签引物(index primer)”是指带有标签的引物,其包含2个部分,标签部分和引物部分,其中标签部分用于在PCR扩增反应中标记PCR产物,而引物部分与模板碱基互补
配对,用于扩增模板,并且其中标签部分,任选地通过连接序列,连接至引物部分的5′端。
如本文中所使用的,术语“接头(adapter)”或“文库接头(libraryadapter)”是指经设计的一段碱基序列,其可以连接至文库中的扩增后的PCR产物上,从而文库中的所有扩增后的PCR产物都可以借助该接头进行测序,例如,使用针对该接头设计的测序引物(而无需使用针对各PCR产物设计的特异性测序引物)进行测序。优选地,本发明的接头可以通过“PCR-FREE”方法连接至PCR产物上。
如本文中所使用的,术语“PCR-FREE”是指不进行PCR反应而直接将接头连接至PCR产物上,例如通过使用DNA连接酶将接头连接至PCR产物上。利用PCR-Free方法来构建测序文库是本领域技术人员已知的,参见例如,Nature Methods 6,291-295(2009)。“PCR-FREE”方法由于整个过程无需进行PCR而具有以下有利方面:1)减少了纯化步骤,降低了花费的时间和成本;2)减少了非特异性扩增;3)在含有许多序列高度相似的PCR产物的文库的构建过程中,避免由PCR引入错误,从而提高最后的测序结果的准确性。
如本文中所使用的,本发明的方法和试剂盒可以使用至少1种接头。不同的接头可以共有相同的一段序列(在本文中称为“测序序列”),并且可进一步包含不同的特征序列,从而,不同的接头可以共用相同的引物(其针对相同的测序序列进行设计)进行测序,并且利用独特的特征序列可以辨别多个文库的混合物中各个PCR产物的文库来源,即,对不同文库来源的PCR产物进行进一步的标记。
将标签与具有不同特征序列的接头组合,可以大大提高标记的效率(参见图1)。例如,使用100种标签可以标记100个样品,而使用100种标签和200种具有不同特征序列的接头,可以标记100*200=20000个样品。
因此,本发明的一个方面提供了一组标签,其包含至少10种,优选至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或95种标签,并且所述标签具有选自SEQ ID NO:1-95的序列。在一个优选实施方案中,该组标签至少包括SEQ ID NO:1-10,或SEQ ID NO:11-20,或SEQ ID NO:21-20,或SEQ ID NO:31-40,或SEQ ID NO:41-50,或SEQ ID NO:51-60,或SEQ ID NO:61-70,或SEQ ID NO:71-80,或SEQ ID NO:81-90,或SEQ ID NO:91-95所示的标签,或者其任何两个或者多个的组合,例如SEQ ID NO:1-95所示的标签。
在本发明的一个优选实施方案中,本发明的标签用于标记SEQ IDNO:96-106所示的PCR引物,从而用于进行高通量HPV测序、检测或分型。
本发明的一个方面提供了一种标签引物组,其包含11种标签引物,所述标签引物的序列包含标签序列和PCR引物序列,并且所述标签序列,任选地通过连接序列,连接至所述PCR引物序列的5′端,其中
1)所述标签序列选自SEQ ID NO:1-95,且标签引物组中的11种标签引物的每一种的标签序列都相同,和
2)所述11种标签引物的PCR引物序列分别如SEQ ID NO:96-106所示。
本发明的标签引物组可扩增出至少16种大约170bp的产物,其对应于HPV基因组中最为保守的基因区(L1区)中的一段高度保守的DNA序列。因此,本发明的标签引物组可用于HPV的精确分型。
在一个优选实施方案中,本发明的标签引物组可用于HPV测序、检测或分型,从而其可用于医疗用途,例如诊断HPV的存在和确定HPV的类型等,以及非医疗用途,例如构建HPV数据库,鉴定HPV的新的类型和亚型,研究HPV类型分布的地域性特点,流行病学研究和
疫苗研制等。在另一个优选实施方案中,本发明的标签引物组可用于制备试剂盒,所述试剂盒可用于HPV测序、检测或分型。
本发明的另一个方面提供了一种标签引物套组,其包含至少10个,优选至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或95个上文描述的标签引物组。优选地,标签引物套组中,各个标签引物组所使用的标签序列互不相同。更优选,标签引物套组中所使用的标签序列至少包括SEQ IDNO:1-10,或SEQ ID NO:11-20,或SEQ ID NO:21-20,或SEQ ID NO:31-40,或SEQ ID NO:41-50,或SEQ ID NO:51-60,或SEQ ID NO:61-70,或SEQ ID NO:71-80,或SEQ ID NO:81-90,或SEQ ID NO:91-95所示的标签序列,或者它们任何两个或者多个的组合,例如SEQID NO:1-95所示的标签序列。
在一个优选实施方案中,本发明的标签引物套组可用于高通量HPV测序、检测或分型,从而其可用于医疗用途,例如大规模的HPV相关
疾病的诊断和HPV的精确分型(为临床诊断和
治疗方案选择提供依据)等,以及非医疗用途,例如构建HPV数据库,鉴定HPV的新的类型和亚型,研究HPV类型分布的地域性特点,流行病学研究和疫苗研制等。在另一个优选实施方案中,本发明的标签引物套组可用于制备试剂盒,所述试剂盒可用于高通量HPV测序、检测或分型。
本发明的另一个方面提供了一种试剂盒,其包含上文描述的标签引物组或标签引物套组。优选,本发明的试剂盒还包含至少1种,优选至少2种、至少10种、至少20种、至少30种、至少40种、至少50种、至少100种或至少200种接头。在一个优选实施方案中,所述接头适用于Solexa测序法,例如其可用于构建测序文库,例如所述接头可具有选自SEQ ID NO:121-132的序列。在一个优选实施方案中,通过PCR-FREE方法,例如DNA连接酶法,使用接头来构建测序文库。
在一个优选实施方案中,本发明的试剂盒可用于高通量HPV测序、检测或分型,并且如上所述,其可用于医疗用途和非医疗用途。
本发明的另一个方面提供了用于对一个或多个样品进行HPV测序、检测或分型的方法。所述方法包括使用上文描述的标签引物组或标签引物套组或试剂盒对各个样品的DNA进行扩增,然后进行测序以获得样品的序列的步骤。
本发明的另一个方面提供了用于对一个或多个样品进行HPV测序、检测或分型的方法,其包括下列步骤:
提供n个样品,n为大于等于1的整数,所述样品优选地来自
哺乳动物,更优选是人,且优选是脱落细胞;可选地,将待分析的n个样品分成m个小组,m为整数且n≥m≥1;
1)对于每一个样品,使用一个标签引物组对样品的DNA进行扩增,其中
所述标签引物组包含11种标签引物,所述标签引物的序列包含标签序列和PCR引物序列,并且所述标签序列,任选地通过连接序列,连接至所述PCR引物序列的5′端,其中
i)所述标签序列选自SEQ ID NO:1-95,并且所述11种标签引物的每一种的标签序列都相同,和
ii)所述11种标签引物的PCR引物序列分别如SEQ ID NO:96-106所示,
其中,不同的样品使用的标签引物组可以相同或者不同,并且不同的标签引物组使用不同的标签序列;
2)将步骤1)中的使用不同标签引物组进行扩增所获得的扩增产物混合在一起,得到一个或多个PCR产物文库;
3)通过PCR-FREE方法,例如DNA连接酶法给步骤2)中获得的一个或多个PCR产物文库分别添加接头,从而构建一个或多个测序文库,其中不同的测序文库所使用的接头可以相同或者不同,且不同的接头共有相同的测序序列,但具有不同的特征序列;
4)任选地,将步骤3)中获得的使用不同接头的测序文库混合在一起,得到一个或多个文库混合物;
5)对步骤3)中获得的一个或多个测序文库或步骤4)中获得的一个或多个文库混合物分别进行测序,其中利用二代测序技术,优选Pair-End技术(例如Solexa、Illumina Hiseq 2000)进行测序;
6)根据标签引物组的标签引物序列,或者根据标签引物组的标签引物序列以及接头的特征序列,将测序结果与样品一一对应;
其中所述样品优选是脱落细胞,且优选来源于动物,例如人。
在优选的实施方案中,本发明的方法使用至少10个,优选至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或95个上文描述的标签引物组。进一步优选地,所使用的标签序列至少包括SEQ ID NO:1-10,或SEQ ID NO:11-20,或SEQ ID NO:21-20,或SEQ ID NO:31-40,或SEQ ID NO:41-50,或SEQ ID NO:51-60,或SEQ ID NO:61-70,或SEQ ID NO:71-80,或SEQ ID NO:81-90,或SEQ ID NO:91-95所示的标签序列,或者它们任何两个或者多个的组合,例如SEQ ID NO:1-95所示的标签序列。
在本发明的方法的一个优选实施方案中,本发明的方法使用至少1种,优选至少2种、至少10种、至少20种、至少30种、至少40种、至少50种、至少100种或至少200种接头,例如所述接头可具有选自SEQ ID NO:121-132的序列。
在本发明的方法的一个优选实施方案中,在测序后,将获得的样品序列与上文描述的HPV数据库中的序列进行对比,从而对样品进行HPV精确分型。
在本发明的另一个方面,本发明基于Solexa测序法提供了用于对多个样品进行高通量HPV测序、检测或分型的方法,所述样品优选是脱落细胞,且优选来源于动物,例如人,所述方法包括下列步骤:
1)将待分析的样品分成m个小组,m为≥1的整数;
2)对每个样品小组进行如下步骤:
2a)从待分析的样品中提取DNA;
2b)根据用于扩增HPV DNA的引物组中的所有引物的序列,设计一套标签,标签的个数n等于该样品小组的样品数目;
2c)将2b)中设计的每一个标签分别添加至引物组的所有正向引物或所有反向引物或所有引物的序列的5′末端,从而提供n个标签引物组;
2d)使用2c)中提供的标签引物组对2a)中获得的样品DNA进行PCR扩增,从而提供PCR产物,其中针对每个样品DNA,使用不同的标签引物组;和
2e)将2d)中的所有PCR产物混合在一起,获得PCR产物文库;
3)给2)中得到的PCR产物文库加上接头,其中各个PCR产物文库使用不同的接头,从而构建m个测序文库,其中各个接头共有相同的测序序列,而具有互不相同的特征序列;
4)将m个测序文库混合在一起,利用二代测序技术,优选Pair-End技术(例如Solexa、Illumina Hiseq 2000)进行测序;得到所有样品的测序结果;
5)根据测序结果中的接头的特征序列、标签的序列以及引物的序列,将获得的测序结果与样品一一对应;和任选地,将每个样品的测序结果与HPV数据库进行比对,从而实现HPV测序、检测或分型。
在一个优选实施方案中,使用本领域技术人员熟知的方法进行DNA提取。例如,可以使用自动化的DNA提取仪和DNA提取试剂盒进行DNA提取,例如可商购获得的KingFisher自动提取仪,例如美国Thermo Scientific Kingfisher Flex全自动
磁珠提取纯化系统。
在一个优选的实施方案中,2b)中的引物组包含11条引物,其序列分别如SEQ ID NO:96-106所示。这11条引物组成的引物组可扩增出至少16种大约170bp的产物,其对应于HPV基因组中最为保守的基因区(L1区)中的一段高度保守的DNA序列。因此,通过对该扩增产物进行精确测序,可以实现HPV的精确分型。
在又一个优选的实施方案中,2b)中设计的标签的个数为至少10个,优选至少20个,至少30个,至少40个,至少50个,至少60个,至少70个,至少80个,至少90个,或至少100个。优选,标签可具有选自SEQ ID NO:1-95的序列。在优选的实施方案中,不同样品小组之间的所使用的标签可以相同或者不同。在优选的实施方案中,引入正向引物的标签与引入反向引物的标签可以相同或者不同。在特别优选的实施方案中,2b)中设计的标签至少包括SEQ ID NO:1-10,或SEQ ID NO:11-20,或SEQ ID NO:21-20,或SEQ ID NO:31-40,或SEQ ID NO:41-50,或SEQ ID NO:51-60,或SEQ ID NO:61-70,或SEQ ID NO:71-80,或SEQ ID NO:81-90,或SEQ ID NO:91-95所示的标签,或者它们任何两个或者多个的组合。在特别优选的实施方案中,2b)中设计的标签如SEQ ID NO:1-95所示。
在一个优选的实施方案中,使用PCR-FREE方法,给PCR产物文库加上接头,例如使用DNA连接酶。特别地,在本发明的方法中,由于不同HPV类型之间的DNA序列高度相似,因此,本发明的测序文库的构建必须通过PCR-FREE方法来完成。相反,如果通过采用常规的pooling PCR将接头连接至PCR产物上来构建测序文库,那么所得到的文库中将含有大量的与原模板不一致的产物,导致不能对原模板进行准确测序。在一个优选的实施方案中,使用的接头的数目为至少1种,优选至少2种、至少10种、至少20种、至少30种、至少40种、至少50种、至少100种或至少200种,例如所述接头可具有选自SEQID NO:121-132的序列。
在本发明的方法的优选实施方案中,接头是可商购获得的接头,例如可购自Illumina公司的PCR-free Index Adapter Oligo Mix。在另外的实施方案中,本发明也可使用下列PCR-free接头(下划线部分为接头的特征序列)。
PCR-free接头1(SEQ ID NO:121):ATCACG
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACATCACGATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头2(SEQ ID NO:122):CGATGT
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACCGATGTATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头3(SEQ ID NO:123):TTAGGC
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACTTAGGCATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头4(SEQ ID NO:124):TGACCA
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACTGACCAATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头5(SEQ ID NO:125):ACAGTG
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACACAGTGATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头6(SEQ ID NO:126):GCCAAT
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACGCCAATATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头7(SEQ ID NO:127):CAGATC
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACCAGATCATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头8(SEQ ID NO:128):ACTTGA
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACACTTGAATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头9(SEQ ID NO:129):GATCAG
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACGATCAGATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头10(SEQ ID NO:130):TAGCTT
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACTAGCTTATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头11(SEQ ID NO:131):GGCTAC
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACGGCTACATCTCGTATGCCGTCTTCTGCTTG
PCR-free接头12(SEQ ID NO:132):CTTGTA
5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCACCTTGTAATCTCGTATGCCGTCTTCTGCTTG
在一个优选的实施方案中,本发明的方法使用Solexa测序仪(例如,Illumina Genome Analyzer IIx测序仪)进行Solexa测序法。在另外的优选的实施方案中,HPV数据库包含本领域已知的HPV类型的序列,所述序列例如可见于例如公共数据库,例如NCBI数据库(http://www.ncbi.nlm.nih.gov/)。
在本发明的方法的一个优选实施方案中,样品可以是脱落细胞。在另一个优选实施方案中,样品可以来源于动物,优选哺乳动物,更优选人。
发明的有益效果
本发明的新型的HPV检测方法和用于此的试剂盒相对于
现有技术具有以下有利方面。
1)高通量。通过使用标签与具有不同特征序列的接头,进行一次本发明的方法,可检测甚至10000份样品,从而本发明的方法可以广泛用于疾病普查工作,成为早期诊断疾病的有效手段。
2)低成本。本发明采用Solexa测序法进行测序,测序成本大大降低(仅为常规测序法的1%),从而HPV检测成本大大降低。
3)可对HPV进行精确分型。通过使用多条引物(例如本发明的6条正向引物和5条反向引物)进行扩增,并将扩增产物的序列信息与HPV数据库进行比对,可以精确地确定HPV的类型,从而为临床诊断和治疗方案选择提供依据。
另外,使用本发明的方法还有利于发现新的HPV类型,包括已有的类型中的新的亚型和变异体,为科学研究提供更有效和方便的工具。
下面将结合
附图和
实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
采用本发明的方法,对190份已知HC-II结果的样品进行HPV基因分型,结果发现:采用本发明的方法所得的结果不仅与已知的HC-II结果一致,而且实现了对HPV的精确分型。
实施例1:样品提取
根据厂商的
说明书,使用KingFisher自动提取仪(美国ThermoScientific Kingfisher Flex全自动磁珠提取纯化系统)从190份已知HC-II结果的脱落细胞中提取DNA。使用程序“Bioeasy-200μl BloodDNA-KF.msz”,进行核酸提取。程序结束后,获得100μl左右的洗脱产物(提取的DNA),用作下一步PCR扩增中的模板。
实施例2:PCR扩增
把实施例1中获得的190份DNA依次编号为1-190,并平均分为2组(HPV-1组:编号1-95;HPV-2组:编号96-190)。根据用于扩增HPV DNA的引物组(包括6条正向引物和5条反向引物)的各条引物的序列(表2,SEQ ID NO:96-107),设计一套标签,共95个(表1,SEQ ID NO:1-95)。将设计的每一个标签分别添加至引物组的各条引物的序列的5′末端,从而获得95个标签引物组,其中每个标签引物组包括相应的6条正向标签引物和5条反向标签引物,并且不同的标签引物组使用不同的标签(即,95个标签引物组与95个标签一一对应)。
在96孔板中对所有样品进行PCR反应,共使用2
块板(HPV-1组和HPV-2组各1块板)。使用实施例1中获得的DNA作为模板,并且在HPV-1组和HPV-2组(各95个样品)中,针对每个样品,使用不同的标签引物组进行PCR扩增(即,95个样品与95个标签引物组一一对应)。记录下每一个标签引物组(每一个标签)对应的样品的编号信息。每块板中还设置一个不添加模板的阴性对照。2块板中的阴性对照所用的引物分别与样品1和样品96所用的引物相同。
表1:标签与样品的相关信息。
标签编号 标签序列 对应96孔板
位置 对应样品(组1) 对应样品(组2) SEQ ID NO: PI-1 GCTGCGACTC A1 1 96 1 PI-2 GTGTAGATAC A2 2 97 2 PI-3 CTGATATCTA A3 3 98 3 PI-4 ACGATGCTAT A4 4 99 4 PI-5 TAGACTAGAC A5 5 100 5 PI-6 CTGTCTGTGT A6 6 101 6 PI-7 GCATACTGAC A7 7 102 7 PI-8 CTGCTCGCAT A8 8 103 8 PI-9 CATGAGTAGA A9 9 104 9 PI-10 TCTCACTATG A10 10 105 10 PI-11 TGTACTACTA A11 11 106 11 PI-12 GTAGACTAGT A12 12 107 12 PI-13 ATATGCTACT B1 13 108 13 PI-14 CACTCGCTGT B2 14 109 14
PI-15 CATCACGCAC B3 15 110 15 PI-16 AGCATGTGAT B4 16 111 16 PI-17 AGCTAGTAGA B5 17 112 17 PI-18 GCTATGTAGT B6 18 113 18 PI-19 TACGATGATG B7 19 114 19 PI-20 TACGCTGTAC B8 20 115 20 PI-21 TATGTGTACT B9 21 116 21 PI-22 TGACTCAGAC B10 22 117 22 PI-23 TCGTAGCTCA B11 23 118 23 PI-24 GAGACTCGTA B12 24 119 24 PI-25 CTAGATGTCA C1 25 120 25 PI-26 GATGACTCTC C2 26 121 26 PI-27 TCAGTCGCAC C3 27 122 27 PI-28 TGTAGTGAGT C4 28 123 28 PI-29 TCATCGTAGA C5 29 124 29 PI-30 TAGCATCTGT C6 30 125 30 PI-31 TAGTAGTCGT C7 31 126 31 PI-32 CTATACGTGC C8 32 127 32 PI-33 CGACTGTAGA C9 33 128 33 PI-34 GATGTCATGT C10 34 129 34 PI-35 GTCTCGACTG C11 35 130 35 PI-36 AGCTGACGAT C12 36 131 36 PI-37 ATGATATAGT D1 37 132 37 PI-38 ATGTGCTCTA D2 38 133 38 PI-39 CTCACTCGAT D3 39 134 39
PI-40 GCTGCGACTC D4 40 135 40 PI-41 GAGTCATGTC D5 41 136 41 PI-42 CATACGCTCA D6 42 137 42 PI-43 CACTCTCGTC D7 43 138 43 PI-44 GCACTAGATG D8 44 139 44 PI-45 AGTACGCATG D9 45 140 45 PI-46 TCTGTGACGT D10 46 141 46 PI-47 TAGCTCATCT D11 47 142 47 PI-48 AGCATACACT D12 48 143 48 PI-49 GCTATAGTCA E1 49 144 49 PI-50 CGTCTCATGC E2 50 145 50 PI-51 GCTACTACGT E3 51 146 51 PI-52 GAGTGTACTA E4 52 147 52 PI-53 GTCATACGTG E5 53 148 53 PI-54 TATGAGAGAT E6 54 149 54 PI-55 ATCTGAGTAC E7 55 150 55 PI-56 CGATAGCATC E8 56 151 56 PI-57 ACTGATCTCA E9 57 152 57 PI-58 CTCGATACTA E10 58 153 58 PI-59 CATGTGACTG E11 59 154 59 PI-60 CGCATCACTA E12 60 155 60 PI-61 GCATATATCT F1 61 156 61 PI-62 CTGATGCGAC F2 62 157 62 PI-63 TCTCAGAGTC F3 63 158 63 PI-64 CAGTGCGAGT F4 64 159 64
PI-65 ATCTCTGATG F5 65 160 65 PI-66 GCTAGTAGTC F6 66 161 66 PI-67 ATGAGTCGTC F7 67 162 67 PI-68 ATCACTCAGA F8 68 163 68 PI-69 TCTCTCTGAT F9 69 164 69 PI-70 CTCTAGTGCT F10 70 165 70 PI-71 CGTCGTGCTA F11 71 166 71 PI-72 CGACTACTAT F12 72 167 72 PI-73 GCACGTCGAT G1 73 168 73 PI-74 GTAGTGCTCT G2 74 169 74 PI-75 CTGACGAGCT G3 75 170 75 PI-76 CTATAGTCTA G4 76 171 76 PI-77 ACACGCACTA G5 77 172 77 PI-78 CTCGCACTAC G6 78 173 78 PI-79 AGATCTCACT G7 79 174 79 PI-80 ATACTAGTGT G8 80 175 80 PI-81 ATATCTCGTA G9 81 176 81 PI-82 TGACTGCGTA G10 82 177 82 PI-83 TGTAGACGTA G11 83 178 83 PI-84 AGAGACTATG G12 84 179 84 PI-85 GTCGAGTCAC H1 85 180 85 PI-86 TGACAGCTAC H2 86 181 86 PI-87 CGCTAGACAT H3 87 182 87 PI-88 CGTAGATATG H4 88 183 88 PI-89 TGAGTCTGCT H5 89 184 89
PI-90 TAGTCGTATG H6 90 185 90 PI-91 CATACACGAC H7 91 186 91 PI-92 CGCTCAGAGA H8 92 187 92 PI-93 GTGAGTCTCA H9 93 188 93 PI-94 GACAGATGAT H10 94 189 94 PI-95 GCTGTGCGAC H11 95 190 95
表2:未添加标签的用于扩增HPV DNA的引物组的各条引物的序列信息。
引物编号 引物序列 SEQ ID NO: F1 TTTGTTACTGTGGTAGATACTAC 96 F2 TTTGTTACTGTGGTGGATACTAC 97 F3 TTTGTTACCGTTGTTGATACTAC 98 F4 TTTGTTACTAAGGTAGATACCACTC 99 F5 TTTGTTACTGTTGTGGATACAAC 100 F6 TTTGTTACTATGGTAGATACCACAC 101 R1 GAAAAATAAACTGTAAATCATATTCCT 102 R2 GAAAAATAAATTGTAAATCATACTC 103 R3 GAAATATAAATTGTAAATCAAATTC 104 R4 GAAAAATAAACTGTAAATCATATTC 105 R5 GAAAAATAAACTGCAAATCATATTC 106
注:F表示正向引物,R表示反向引物。
使用下列PCR参数进行扩增:
95℃30秒→48℃30秒→72℃30秒(40个循环)
72℃10分钟→12℃∞
PCR反应体系为25μl,其组成是(所有试剂均购自Enzymatics公司):
试剂 体积/反应
水(HPLC级) 14.375μl 10x Ex Taq缓冲液(Mg2+ plus) 2.5μl dNTP混合物(各2.5mM) 2μl 带有标签的F1/F2/F3/F4/F5/F6的混合物(各7.5pmol) 0.5μl 带有标签的R1/R2/R3/R4/R5的混合物(各7.5pmol) 0.5μl Ex Taq HS(5U/μl) 0.125μl 模板DNA 5μl 总体积 25μl
PCR反应在Bio-Rad公司的PTC-200PCR仪上运行。PCR完成后,取3μl PCR产物在2.5%的琼脂糖凝胶上进行电泳检测(图2)。
实施例3:PCR产物的混合和纯化
把HPV-1组与HPV-2组中剩余的PCR产物各混合在一个3ml的EP管中(同样标记为HPV-1组和HPV-2组),并震荡混匀。从2管混合物中各取出500μl DNA,并根据厂商的说明书,使用Qiagen DNAPurification试剂盒进行过柱纯化,得到200μl DNA。使用Nanodrop8000(Thermo Fisher Scientific公司),测定纯化后的混合物的DNA浓度分别为98ng/μl(HPV-1组)和102ng/μl(HPV-2组)。
实施例4:Solexa测序文库的构建
4.1:末端修复反应
使用Thermomixer(Eppendorf公司),对实施例3中获得的经纯化的两管DNA混合物分别进行DNA末端修复反应。修复反应的反应体系为100μl,其组成是(所有试剂均购自Enzymatics公司):
试剂 体积/反应 上一步所得的DNA 75μl 20x多核苷酸激酶缓冲液(B904) 10μL dNTP混合物(各20mM) 4μL T4 DNA聚合酶 5μL Klenow
片段 1μL T4多核苷酸激酶 5μL 总体积 100μL
反应条件为:20℃,30分钟。
根据厂商的说明书,使用QIAquick PCR Purification试剂盒纯化并回收DNA末端修复反应的产物。回收的产物溶于34μl EB(QIAGENElution Buffer)中。
4.2:3′末端加A反应
使用Thermomixer(Eppendorf公司),对回收的DNA进行3′末端加A反应。反应体系为50ul,其组成是(所有试剂均购自Enzymatics公司):
试剂 体积/反应 上一步所得的DNA 32μl dATP(1mM,GE公司) 10μl 10x Blue缓冲液 5μl Klenow (3′-5′exo-) 3μl 总体积 50μl
反应条件为:37℃,30分钟。
根据厂商的说明书,使用MiniElute PCR Purification Kit(QIAGEN公司)纯化并回收3′末端加A反应的产物。回收的产物溶于20μl的EB中。
4.3:添加Solexa接头
使用Thermomixer(Eppendorf公司),对上一步获得的2种产物分别添加不同的接头以构建2个测序文库。记录下接头和文库的对应关系。
添加Solexa接头的反应体系为50ul,其组成是(所有试剂均购自Illumina公司):
试剂 体积/反应 上一步所得的DNA 11μL 2x快速连接缓冲液 15μL PCR-free Index Adapter Oligo Mix(25mM) 1μL T4DNA连接酶(快速,L603-HC-L) 3μL 总体积 30μL
反应条件为:20℃,15分钟。
根据厂商的说明书,使用Ampure Beads(Beckman CoulterGenomics)纯化反应产物并将产物溶于17μl去离子水。使用AgilentBioanalyzer 2100(Agilent公司)和荧光定量PCR(QPCR)测定产物的DNA浓度,结果如下:
2100(nM) qPCR(nM) HPV-1组 20.4 24.2 HPV-2组 21.6 25.8
实施例5:Solexa测序
以Agilent Bioanalyzer 2100所测浓度为准,将上一步所得的2种产物等摩尔混合在一起(各取10pmol DNA)。根据厂商的说明书,使用Solexa测序仪(Illumina Genome Analyzer IIx测序仪),用Solexa PE-75程序进行测序。
实施例6:结果分析
根据测序结果中的接头的特征序列以及标签引物(标签部分和引物部分)的序列的信息,将测序结果与每个样品一一对应。然后,使用本领域已知的比对程序,例如BLAST和SOAP,将每个样品的测序结果与HPV数据库进行比对,从而实现HPV检测,并对HPV进行精确分型。
所得到的检测结果与已知的结果完全一致(参见表3),表明本发明方法可以用于精确检测样品中的HPV。
表3:190个样品的检测结果。
样品 编号 原HC-II结果 (RLU/CO值) 本次检测的 HPV结果 样品 编号 原HC-II结果 (RLU/CO值) 本次检测的 HPV结果 1 14.2 HPV56 96 0.28 阴性 2 0.31 阴性 97 0.33 阴性 3 196.41 HPV16 98 181.29 HPV35,HPV6 4 5.76 HPV18 99 77.32 HPV16 5 0.35 阴性 100 91.22 HPV39 6 99.86 HPV18,HPV11,HPV16 1011 188.92 HPV52 7 128.86 HPV39 102 1352.83 HPV35,HPV11,HPV39 8 35.12 HPV18,HPV6 103 1.39 HPV43 9 498.69 HPV16,HPV56 104 119.5 HPV45,HPV11 10 603.57 HPV18,HPV31,HPV39 105 292.43 HPV56,HPV31 11 0.27 阴性 106 2.91 HPV68 12 3420.57 HPV18 107 193.13 HPV45 13 0.38 阴性 108 2.62 HPV6 14 0.41 阴性 109 94.12 HPV16 15 455.06 HPV16 110 792.72 HPV18,HPV31 16 8.93 HPV18 111 31.76 HPV11 17 0.6 阴性 112 0.25 阴性 18 0.41 阴性 113 0.23 阴性 19 0.29 阴性 114 750.82 HPV56,HPV16 20 27.64 HPV31 115 0.4 阴性 21 1985.41 HPV56,HPV68 116 2.75 HPV31 22 20.71 HPV42 117 396.04 HPV45
23 1795.83 HPV11,HPV16,HPV52 118 354.76 HPV18,HPV16 24 9.55 HPV43 119 6.26 HPV11 25 237.62 HPV39 120 1719.67 HPV16,HPV45 26 1.5 HPV6 121 76.92 HPV51 27 1478.98 HPV68,HPV16 122 1318.02 HPV56,HPV16,HPV42 28 115.31 HPV44 123 0.28 阴性 29 419.31 HPV16 124 0.33 阴性 30 1.81 candHPV89 125 181.29 HPV59 31 2013.61 HPV52,HPV39 126 77.32 HPV68 32 1379.09 HPV54,HPV33 127 110.8 HPV52 33 12.74 HPV42 128 147.25 HPV16 34 1695.31 HPV16,candHPV89 129 0.24 HPV26 35 1410.85 HPV35 130 1.55 HPV11,HPV53 36 1149.25 HPV18 131 2.03 HPV6,HPV66 37 0.24 阴性 132 8.45 HPV43 38 1.55 HPV11 133 0.2 阴性 39 2.03 HPV11,HPV6 134 0.24 阴性 40 8.45 HPV42 135 10.53 HPV11 41 0.2 阴性 136 1410.85 HPV16,HPV53,HPV70 42 0.22 阴性 137 1149.25 HPV56,HPV81,HPV73 43 0.53 阴性 138 0.24 阴性 44 10.38 HPV6 139 413.9 HPV45 45 78.21 HPV16 140 17.05 HPV11
46 0.23 阴性 141 23.6 HPV52 47 45.42 HPV16,HPV18 142 3379.09 HPV16,HPV35,HPV56 48 0.35 阴性 143 0.18 阴性 49 148.66 HPV18,candHPV89 144 1.46 HPV18 50 60.27 HPV56 145 1.25 HPV11,HPV26 51 0.28 阴性 146 2.13 HPV6,HPV81 52 360.26 HPV56,HPV68 147 872.52 HPV16,HPV45,HPV52 53 50.31 HPV18 148 1.5 HPV18 54 0.18 阴性 149 4.33 HPV16 55 0.31 阴性 150 0.82 阴性 56 196.41 HPV16 151 60.35 HPV59 57 5.76 HPV51 152 0.24 阴性 58 0.23 阴性 153 0.23 阴性 59 0.88 阴性 154 0.18 阴性 60 0.16 阴性 155 1.46 HPV51 61 870.63 HPV52,HPV16 156 11.25 HPV16 62 10.18 HPV42 157 2.13 HPV11 63 0.15 阴性 158 0.13 阴性 64 1.36 HPV11 159 90.18 HPV58 65 68.2 HPV59 160 0.15 阴性 66 0.68 阴性 161 602.79 HPV68,HPV16 67 130.41 HPV45 162 132.68 HPV56,HPV11 68 0.26 阴性 163 127.08 HPV39,HPV54
69 5.25 HPV6 164 602.79 HPV33 70 0.46 阴性 165 276 HPV18 71 8.23 HPV40 166 243.6 HPV45 72 0.28 阴性 167 229.44 HPV51 73 100.16 HPV43,HPV44 168 1384.92 HPV16,HPV58,HPV72 74 450.13 HPV41 169 172.64 HPV58 75 127.08 HPV39,HPV6 170 855.24 HPV16,candHPV89 76 602.79 HPV45 171 126.47 HPV51 77 276 HPV16 172 86.62 HPV44,HPV11 78 243.6 HPV6,HPV70,HPV39 173 879.37 HPV18,HPV58 79 229.44 HPV35 174 119.39 HPV56 80 1384.92 HPV52,HPV56,HPV11 175 0.61 阴性 81 172.64 HPV26,HPV42 176 18.02 HPV16 82 855.24 HPV35,HPV6 177 16.06 HPV18 83 620.69 HPV52 178 60.69 HPV56,HPV11 84 128.02 HPV11 179 2.45 HPV11 85 514.84 HPV33 180 94.93 HPV39 86 68.3 HPV58 181 1635.3 HPV16,HPV35,HPV51 87 402.15 HPV59,HPV16 182 754.64 HPV33,candHPV89 88 51.72 HPV33 183 0.23 HPV11 89 1.78 HPV6 184 20.28 HPV18 90 56.7 HPV11,HPV31 185 0.16 阴性 91 186.06 HPV16 186 0.13 阴性
92 0.02 阴性 187 60.18 HPV59 93 386.06 HPV18,HPV16 188 0.15 阴性 94 28.09 HPV6,HPV44 189 1.36 HPV43 95 186.06 HPV68, 190 0.28 阴性
此外,本发明的方法还可以对样品中的HPV进行精确分型。表4中提供了图2所示的泳道1-14所对应的样品的测序序列和分型结果。
参考文献
本文中用于举例说明本发明或提供关于本发明的实施的另外的详细内容的专利、出版物和其他材料通过引用合并入本文,并且为方便起见按下列文献目录提供。
[1].Pectasides D,Kanposioras K,Papaxoinis G et al.Chemotherapy for recurrent cervical cancer.Cancer TreatmentReviews,2008,34(7):603-613.
[2].Brink,A.A.,P.J.Snijders,and C.J.Meijer.HPVdetection methods.Dis.Markers 2007,23:273-281.
[3].IARC.Handbooks of cancer prevention.Cervix cancerscreening[R].Lyon:IARC Press,2005.
[4].Doorbar,J.Molecular biology of human papillomavirusinfection and cervical cancer.Clin.Sci.2006,110:525-541.
[5].Cox T,Cuzick J.HPV DNA testing in cervical cancerscreening:From evidence to policies.Gyneeol Oncol,2006,103:8-11.
[6].Kulmala S,syIjhen.Human papillomavirus testing withthe hybrid capture assay and PCR as screening tools.ClinMicrobiol,2004,42(6):2470-2475.
[7].Quail,M.et al.,A large genome center’s improvementsto the Illumina sequencing system.Nat.Methods,2008,5,1005-1010.
[8].Brown,C.G.et al.,Solexa/Illumina GAPipeline productand product documentation,Illumina Inc,2006.
[9].Lozano,R.Successfully integrating humanpapillomavirus testing into your practice.Arch.Pathol.LabMed,2003,127:991-994.