首页 / 专利库 / 解剖与生理 / 成纤维细胞 / RFHV/KSHV亚族疱疹病毒的糖蛋白B

RFHV/KSHV亚族疱疹病毒的糖蛋白B

阅读:891发布:2023-01-23

专利汇可以提供RFHV/KSHV亚族疱疹病毒的糖蛋白B专利检索,专利查询,专利分析的服务。并且本 发明 涉及编码γ疱疹病毒RFHV/KSHV亚族糖蛋白B的多核苷酸,此亚族的3个成员的特征已被详细描述。DNA提取物得自被腹膜后 纤维 瘤病(RF)感染的豚尾猴和食蟹猴,以及被卡波济氏肉瘤(KS)感染的AIDS人患者。使用由γ疱疹病毒已知的 蛋白质 和DNA序列设计的共有-简并寡核苷酸探针扩增提取物。RFHV1和KSHV之间的319个 碱 基对的核苷酸序列 片段 约有76%相同,此片段与RFHV/KSHV亚族以外的最相关的γ疱疹病毒的相应片段约有60-63%相同。RFHV1和KSHV之间由此片段编码的蛋白质序列约91%相同,与其它γ疱疹病毒的相应序列 抗原 性位点。本发明还提供了鉴定RFHV/KSHV亚族成员的糖蛋白B编码区的材料和方法,所述成员包括但不局限于RFHV1,RFHV2和KSHV。本发明的肽,多核苷酸和 抗体 可用于诊断感染,并引发针对糖蛋白B的免疫应答。,下面是RFHV/KSHV亚族疱疹病毒的糖蛋白B专利的具体信息内容。

1.含有编码疱疹病毒糖蛋白B之区域的分离的多核苷酸,所述多 核苷酸含有与SEQ.ID NO:1或SEQ.ID NO:3的核苷酸36-354至少 65%相同的序列。
2.含有权利要求1之多核苷酸的糖蛋白B编码区域中至少50个 连串核苷酸的片段的分离的多核苷酸。
3.含有编码疱疹病毒糖蛋白B之区域的分离的多核苷酸,所述多 核苷酸含有选自以下的序列:与寡核苷酸SHMDA至少74%相同的35个 核苷酸的序列(SEQ.ID NO:41);与寡核苷酸CFSSB至少73%相同 的30个核苷酸的序列(SEQ.ID NO:43);与寡核苷酸ENTFA至少72 %相同的29个核苷酸的序列(SEQ.ID NO:45);和与寡核苷酸DNIQB 至少80%相同的35个核苷酸的序列(SEQ.ID NO:46)。
4.含有权利要求3之多核苷酸的糖蛋白B编码区域中至少50个 连串核苷酸的片段的分离的多核苷酸。
5.权利要求1或权利要求2的多核苷酸,其中所述的疱疹病毒能 感染灵长类动物。
6.权利要求1或权利要求2的多核苷酸,其中所述的疱疹病毒是 RFHV1,RFHV2或KSHV。
7.含有与SEQ.ID NOS:1,3,或92所含的核苷酸36-354之 间或SEQ.ID NO:96中任何位置处的线性序列,而非SEQ.ID NO:96 中的线性序列至少有21个核苷酸相同的线性序列的分离的多核苷酸。
8.权利要求7的分离的多核苷酸,含有与SEQ.ID NO:1,SEQ.ID NO:3,或SEQ.ID NO:96的核苷酸36-354,或者SEQ.ID NO:92 中的至少200个连串核苷酸基本上相同的线性序列。
9.由权利要求2的多核苷酸编码的分离的多肽。
10.含有与SEQ.ID NOS:2,4,或97所含的基酸13-118,或 SEQ.ID NO:94中任何位置处的序列,而非SEQ.ID NO:99中的序列 至少有17个氨基酸基本上相同的线性序列的分离的多肽。
11.权利要求10的分离的多肽,基本上由具有SEQ.ID NO:2,SEQ. ID NO:4,SEQ.ID NO:94或SEQ.ID NO:97所示序列的多肽组成。
12.含有与根据权利要求10的多肽所含的序列至少有17个氨基酸 相同的线性序列的融合多肽。
13.权利要求10的分离的多肽,涉及疱疹病毒与哺乳动物细胞的 结合或融合。
14.权利要求10的分离的多肽,它是糖基化的。
15.权利要求10的分离的多肽,它是非糖基化的。
16.权利要求10的分离的多肽,它是免疫原性的。
17.权利要求10的分离的多肽,含有选自SEQ.ID NOS:67-76 的序列。
18.编码权利要求10的多肽的分离的多核苷酸。
19.编码权利要求10的多肽的非自然产生的多核苷酸。
20.编码融合多肽的多核苷酸,它含有与编码多肽的第二多核苷酸 直接相连的权利要求2的多核苷酸。
21.含有编码与根据权利要求10的多肽所含的序列至少有17个氨 基酸相同的线性序列的多核苷酸序列的重组克隆载体。
22.含有与调控多核苷酸序列有效地连接,并编码与根据权利要求 10的多肽所含的序列至少有17个氨基酸相同的线性序列的多核苷酸序 列的重组表达载体。
23.含有与权利要求7的多核苷酸所含的线性序列至少有21个核 苷酸相同的线性序列的重组克隆载体。
24.被权利要求18或19的多核苷酸,或被权利要求21,22或23 的载体转化的宿主细胞。
25.特异针对权利要求1多核苷酸的所述编码区所编码的糖蛋白B 多肽的单克隆或分离的多克隆抗体
26.特异针对权利要求11之多肽,但不针对具有SEQ ID NOS:30 -41中任何一个的氨基酸序列的多肽的单克隆或分离的多克隆抗体。
27.权利要求26的抗体,它是单克隆抗体。
28.权利要求26的抗体,它是分离的多克隆抗体。
29.含有权利要求9或10中的多肽和药物可相容的赋形剂的疫苗
30.权利要求29的疫苗,它也含有佐剂。
31.治疗疱疹病毒感染的方法,包括施用权利要求29的疫苗。
32.含有权利要求2或7中的多核苷酸和药物可相容的赋形剂的疫 苗。
33.权利要求32的疫苗,它是活病毒或病毒表达载体。
34.治疗疱疹病毒感染的方法,包括施用权利要求32的疫苗。
35.含有权利要求25或26中的抗体和药物可相容的赋形剂的疫 苗。
36.治疗疱疹病毒感染的方法,包括施用权利要求35的疫苗。
37.与选自SEQ ID NOS:24-63,SEQ ID NOS:77-78和SEQ ID NOS: 80-90的寡核苷酸基本上相同的寡核苷酸。
38.得到编码糖蛋白B的多核苷酸的扩增拷贝的方法,包括步骤:
a)用权利要求37的寡核苷酸接触多核苷酸;并
b)延伸已与多核苷酸形成双螺旋的寡核苷酸。
39.权利要求38的方法,其中所述扩增反应是聚合酶链反应(PCR)。
40.权利要求39的方法,其中所述PCR包括退火和延伸的重复循 环,其中退火在至少50℃的温度下进行。
41.权利要求38的方法,其中被扩增的多核苷酸首先得自生物样 品,所述生物样品取自患有以成纤维细胞增殖和胶原沉积为特征的疾病 的个体。
42.检测样品中病毒DNA或RNA的方法,包括步骤:
a)将样品中的DNA或RNA与含有权利要求2或7的多核苷酸的 探针接触,所处的条件应能允许探针与具有SEQ.ID NO:1,3,92或 94所示序列的至少一个多核苷酸,而不与具有SEQ.ID NOS:5-13中 任一个的序列的多核苷酸形成稳定的双螺旋;和
b)如果有的话,检测步骤a)中形成的所述稳定双螺旋的存在。
43.检测样品中病毒DNA或RNA的方法,包括步骤:
a)将样品中的DNA或RNA与含有权利要求2或7的多核苷酸的 探针接触,所处的条件应能允许探针与具有SEQ.ID NO:1所示序列的 多核苷酸,和具有SEQ.ID NO:34所示序列的多核苷酸,而不与具有 SEQ.ID NOS:5-13中任一个的序列的多核苷酸形成稳定的双螺旋; 和
b)如果有的话,检测步骤a)中形成的所述稳定双螺旋的存在。
44.检测来源于灵长类动物的样品中病毒DNA或RNA的方法,包括 步骤:
a)将样品中的DNA或RNA与含有权利要求2或7的多核苷酸的 探针接触,所处的条件应能允许探针与具有SEQ.ID NO:1,3,92或 94所示序列的至少一个多核苷酸,而不与具有SEQ.ID NOS:5,或9 -13所示的任一个序列的多核苷酸形成稳定的双螺旋;和
b)如果有的话,检测步骤a)中形成的所述稳定双螺旋的存在。
45.权利要求42的方法进一步包括在与探针接触之前对样品中的 DNA或RNA进行扩增反应。
46.检测样品中病毒DNA或RNA的方法,包括步骤:
a)在反应中使用权利要求37的寡核苷酸作为引物对样品中的多 核苷酸进行扩增反应;和
b)如果有的话,检测多核苷酸扩增拷贝的存在。
47.能与含有选自SEQ.ID NO:1,3,92和94和它们各自的互补 序列的序列的第二多核苷酸形成稳定双螺旋的分离的多核苷酸,所处的 条件中第二多核苷酸能与具有SEQ.ID NO:1,3,92或94所示序列的 至少一个多核苷酸,而不与具有SEQ.ID NOS:5-13中任一个的序列 的多核苷酸形成稳定的双螺旋。
48.权利要求47的分离的多核苷酸,其核苷酸序列包含于自然产 生的病毒的基因组中。
49.含有由权利要求47的多核苷酸编码的至少25个氨基酸的线性 序列的分离的多肽。
50.检测疱疹病毒对个体的感染的方法,包括检测得自个体的生物 样品中的病毒DNA或RNA,其中通过权利要求42,44,或46的方法检 测病毒DNA或RNA。
51.检测生物样品中疱疹病毒多核苷酸的诊断试剂盒,它含有适当 包装的试剂,其中试剂包括权利要求2或7的多核苷酸。
52.检测生物样品中疱疹病毒多核苷酸的诊断试剂盒,它含有适当 包装的试剂,其中试剂包括权利要求37的寡核苷酸。
53.检测疱疹病毒对个体的感染的方法,包括下列步骤:
a)将得自个体的样品中的抗体与权利要求25或26的多肽接触, 所处的条件能允许稳定的抗原-抗体复合物的形成;和
b)如果有的话,检测步骤a)中所形成的所述稳定复合物。
54.检测生物样品中存在的抗-疱疹病毒抗体的诊断试剂盒,它含 有适当包装的试剂,其中试剂包括权利要求25或26的多肽。
55.检测疱疹病毒对个体的感染的方法,包括下列步骤:
a)将得自个体的样品中的多肽与权利要求9或10的抗体接触, 所处的条件能允许稳定的抗原-抗体复合物的形成;和
b)如果有的话,检测步骤a)中形成的所述稳定复合物。
56.检测生物样品中存在的疱疹病毒多肽的诊断试剂盒,它含有适 当包装的试剂,其中试剂包括权利要求9或10的抗体。
57.确定候选药物是否能用于治疗γ疱疹病毒感染的方法,包括下 列步骤:
a)将权利要求9或10的多肽与候选药物接触;和
b)确定候选药物是否能改变多肽的生化功能。
58.权利要求57的方法,其中步骤b)中确定的多肽生化功能是 多肽与哺乳动物细胞表面的结合。
59.产生糖蛋白B多肽的方法,包括在真核细胞中表达权利要求2 或7的多核苷酸。
60.产生含有疱疹病毒糖蛋白B编码区的多核苷酸的方法,包括复 制权利要求21或23的重组克隆载体。

说明书全文

技术领域

发明一般涉及病毒学领域,尤其是疱疹病毒家族的病毒。本发明 更具体地涉及疱疹病毒糖蛋白B分子的鉴定和特征描述,所述分子与包 括人的灵长类动物的纤维增殖性和肿瘤疾病相关。

                         背景技术

卡波济氏肉瘤是一种损坏外形并潜在致命的出血性肉瘤形式,其特 征在于在皮肤上以深色斑或小结出现的多发性脉管肿瘤。在组织学平 上,其特征在于相对一致的纺锤形细胞的增殖,形成束和脉管裂缝。在 炎症浸润中经常会出现浆细胞,T细胞和单核细胞,胃肠损害处或相关 的淋巴瘤处出血的最终结果可能是死亡(一般参见Martin等人, Finesmith等人)。

一旦遇到相对而言起因不明的疾病,公众的注意立刻会转向该疾 病与AIDS的相关性。多达20%的某些感染了AIDS的群体在疾病过程中 会患卡波济氏肉瘤,卡波济氏肉瘤也出现在与免疫缺损相关的其它疾病 中,包括肾透析治疗级免疫抑制,然而此疾病的流行病学暗示免疫缺 损不是唯一的引发因素。具体地说,卡波济氏肉瘤与某些性服务高水平 的相关性暗示非人类免疫缺损病毒这一病原因子的介入(Berel等人)。

已鉴定出得自AIDS病人卡波济氏损害的组织样品中疱疹病毒样DNA 序列(Chang等人,由Ambroziuk等人进一步证实),通过表现度差异 分析得到序列(Lisitsyn等人),其中使用不相关的引物寡核苷酸扩增 了已感染和未感染组织中的DNA,然后使所述DNA杂交以凸现细胞间的 差异。此序列与Epstein Barr病毒和松鼠猴疱疹病毒的已知序列部分 相同,它编码两个被隔绝在病毒内部的结构组分-衣壳和外被蛋白。在 概括研究多种来源的组织时发现不论病人的HIV状况如何,95%的卡波 济氏肉瘤损害中都有此序列(Moore等人,1995a)。相同病人的21%未 介入组织呈阳性,而对照群体样品中5%呈阳性,样品之间大约有0.5% 的序列差异。

在体腔淋巴瘤中也检测到相同的序列,体腔淋巴瘤为具有B细胞特 征的淋巴瘤渗出物,只在AIDS病人中出现(Cesarman等人)。与卡波 济氏肉瘤相比,体腔淋巴瘤中拷贝数更高。其它与AIDS相关的淋巴瘤为 阴性。在患有Castleman氏疾病的患者的外周血单核细胞中也发现了此 序列(Dupin等人),此病的特征在于血管滤泡增生的形态学特征,并 且与发烧,腺病,和脾大相关。已知推断的从中得到序列的病毒是与卡 波济氏肉瘤相关的疱疹病毒(KSHV)。

Boshoff等人使用PCR原位杂交已检测出据认为代表卡波济氏肉瘤 中致瘤性细胞的细胞类型的KSHV多核苷酸序列,血清学证据支持KSHV 在卡波济氏肉瘤病原学中的重要作用(O’Leary)。Kedes等人研究出 一种免疫荧光血清学测定法,该方法可检测出被KSHV潜伏感染的B细 胞中与潜伏状态相关的核抗原抗体,他们还发现在卡波济氏肉瘤的患 者中KSHV血清正性高。Gao等人通过免疫印迹测定法发现:在卡波济氏 肉瘤的40个患者中,32个患者的抗KSHV抗原的抗体为阳性,与之相比, 在AIDS突然爆发前一刻未患有卡波济氏肉瘤的40个男同性恋者只有7 个呈现出抗KSHV抗原的抗体为阳性。Miller等人从含有KSHV和 Epstein-Barr病毒基因组的体腔淋巴瘤细胞系中制备出KSHV抗原。已 在48个被HIV-1感染的卡波济氏肉瘤患者中的32个中鉴定出针对一个 抗原的抗体,该抗原被称为p40,与之相比,在54个被HIV-1感染但未 患有卡波济氏肉瘤的患者中,只在7个患者中鉴定出上述抗体。

Zhong等人在mRNA水平上分析了KSHV序列在被感染组织中的表达, 发现两个小的转录本表现出大部分由KSHV基因组转录的病毒特异性 RNA。他们推测一个转录本编码小的膜蛋白;另一个是在细胞核中积累 的异常的poly-A RNA,可能没有蛋白质编码序列。通过从基因组DNA 的λ文库中克隆大量重叠的KSHV基因组片断可以分析mRNA,所述片断 跨越了~120kb的KSHV基因组,将克隆用作探针以进行Northern分析, 但未得到或公开它们的序列。

Moore等人已部分鉴定出得自体腔淋巴瘤的KSHV基因组片断,尽 管未公开基因组中20.7kb区域的序列,但据报道已测定出此区域的序 列。此片断中存在17个部分的或完整的开放阅读框,除1个以外,都 与其它已知的γ疱疹病毒基因具有序列和位置的同源性,所述基因包括 衣壳成熟基因和胸苷激酶基因。系统发育分析表明相对于KSHV与 Epstein Barr病毒的相关性而言,KSHV与疱疹病毒2型和松鼠猴病 毒更加密切相关。20.7kb的区域不含有编码糖蛋白B或DNA聚合酶的序 列。

疱疹病毒家族作为一个整体含有很多大小约为100nm的多包膜病 毒,所述病毒能够感染脊椎动物(一般性评论例见Emery等人,Field 等人)。双链DNA基因组异乎寻常得大-长度约为88-229个千基, 它在病毒生命周期的不同时期可产生50个以上不同的转录本。大量糖 蛋白表达于病毒表面,它们对于病毒识别靶细胞,病毒侵入细胞内起作 用。与内部病毒成分相比,在种之间这些表面蛋白有相对更多的变体 (Karlin等人)。在由携有病毒的细胞产生的缺损病毒颗粒上也出现了 相同的表面蛋白,一个这种非感染性的形式是L-颗粒,它含有外壳和病 毒包膜,但缺乏核衣壳。

疱疹病毒家族已被分成几个亚族,对每一类目的划分起先是基于生 物学特性,当基因组序列数据出现时才得以精简。α亚族含有的病毒具 有宽宿主范围,短的复制周期,和对感觉神经节的亲和性,它们包括人 单纯疱疹病毒和水痘-带状疱疹病毒。β亚族含有的病毒的宿主范围受 到限制,它们包括巨细胞病毒和人疱疹病毒6型。γ亚族含有的病毒通 常嗜淋巴细胞,其DNA的特征在于约110千碱基的低GC含量的片段旁 侧有多个高GC含量的串联重复,γ亚族包括Epstein Barr病毒(EBV), 松鼠猴疱疹病毒,马疱疹病毒2和5型,和疱疹病毒4型。

疱疹病毒与具有复杂临床进程的疾病有关,很多疱疹病毒的特征是 能够在宿主体内进入潜伏期达相当长的时间。α亚族的病毒在感觉和植 物性神经节中保持潜伏状态,而γ亚族的病毒在例如淋巴细胞谱系的细 胞中保持潜伏状态。潜伏期与某些病毒基因的转录有关,并可以持续几 十年直至身体状况最适于病毒恢复活性复制,这种身体状况可包括免疫 缺损。另外,一些γ亚族的疱疹病毒能够遗传转化它们感染的细胞,例 如,EBV与B细胞淋巴瘤,口毛白斑病,淋巴组织间质炎和鼻咽癌有 关。

在人和其它脊椎动物中出现的许多其它疾病涉及纤维增殖和前-肿 瘤细胞的产生,出现在人中的疾病的例子是腹膜后纤维变性,小结状纤 维瘤病,假肉瘤纤维瘤病,和硬化肠系膜炎。在华盛顿大学的地区性灵 长类动物研究中心的猕猴群体中已观察到已知为地方性腹膜后纤维瘤病 (RF)的另一种疾病(Giddens等人)。此疾病晚期的特征在于纤维组 织围绕肠系膜和腹膜腔的背面部分增殖,延伸至腹股沟内,穿过隔膜, 并进入腹壁。一旦在临床上出现此病的明显症状,病人一律在1-2个 月内死亡。此病与由D型猿猴逆转录病毒SRV-2造成的猿猴免疫缺损 (SAIDS)相关(Tsai等人),但是在感染了SAIDS的其它猴群体中未 显示出相同的RF频率,近年来华盛顿的RF频率已有所降低。

在非人灵长类动物中研究这种疾病是重要的,这不仅是由于它可作 为人疾病的模型,也是因为一种灵长类动物可作为感染另一种灵长类动 物的病毒的来源库,例如,松鼠猴疱疹病毒在其天然宿主松鼠猴(Saimiri sciureus)中似乎不会引起疾病,但它在其它灵长类动物,尤其是猫头 鹰(owl)猴中会引起多克隆的T-细胞淋巴瘤和急性白血病。

有必要开发试剂和方法以用于检测和治疗疱疹病毒感染。由血清学 证据进一步证实的KSHV与卡波济氏肉瘤之间的病原学联系显示出这种 需要的重要性。

例如,有必要开发能够用于诊断和评价卡波济氏肉瘤和类似疾病的 试剂和方法。能够检测新病人的病原因子在鉴别诊断中会起作用;能够 评价正在发生的疾病病原因子的水平在临床处理时会起作用。合乎需要 的标记物包括那些与乙肝病毒的HBsAg相似,对于活跃的和潜伏形式的 病毒感染都可提供很敏感的指示的标记物。合乎需要的标记物也包括那 些免疫原性的,可用于评估对在抗体应答中出现的病毒因子的免疫学暴 露的标记物。得自病毒包膜的糖蛋白抗原特别适于作为具有这些特征的 标记物,它们可以不仅在病毒复制形式的表面附近,还在由病毒感染的 细胞产生的L-颗粒上以高丰度表达。

第二,有必要开发能够用于治疗病毒感染的试剂和方法-既是预防 性的,也在被病毒攻击后起作用。这种试剂包括可赋予抗病毒的免疫力 水平的疫苗。被动疫苗,如那些含有抗-病毒抗体的疫苗可用于为新近 被暴露于病毒的个体提供即时保护或防止病毒侵入细胞和复制。主动疫 苗,如那些含有免疫原性的病毒成分的疫苗可用于在个体中产生主动的 和不断发展的免疫应答。由主动疫苗产生的抗体有助于保护个体抗活病 毒的后续攻击。由主动疫苗产生的细胞毒T细胞通过消除病毒复制所涉 及的宿主细胞可有助于消灭同时发生的感染。保护性免疫应答,尤其是 抗体的适当的靶是暴露于病毒颗粒表面的蛋白质抗原,和那些牵涉到病 毒与靶细胞融合的蛋白质抗原。

第三,有必要开发能够用于开发治疗卡波济氏肉瘤和类似疾病的新 药物的试剂和方法。对卡波济氏肉瘤的最新治疗方法是放射性疗法与传 统的化学疗法,如长春新碱(Northfelt,Mitsuyasu)的联合,尽管损 害会对这些物理疗法作出反应,但反应是暂时的,减弱的临床进程一般 会恢复,甚至实验性的疗法,如用细胞因子治疗也是针对疾病综合征而 不是病因。基于病原因子的药物筛选和合理的药物设计可直接针对对于 具有长期效力的临床方案的长期需要。这种药物的适当的靶是涉及识别 和侵入宿主细胞的病毒成分,这些靶包括病毒包膜的糖蛋白成分。

第四,有必要开发能够用于鉴定可能与其它纤维增殖性疾病相关的 新的病毒因子的试剂和方法。Chang等人使用的表现度差异分析技术非 常复杂,可能不适于作为一般的筛选试验。在研究多种怀疑含有相关病 原因子的组织样品的更常规的试验中能用作试剂的一套寡核苷酸探针, 肽和抗体更加合乎需要。此试剂要有足够的特异性以避免鉴定出不相关 的病毒和宿主的内源成分,并且此试剂可以充分地交叉反应以鉴定相关 的但以前未描述过的病毒病原体。

                        发明内容

本发明的目的是提供分离的多核苷酸、多肽、和抗体,它们或得自 新的编码疱疹病毒RFHV/KSHV亚族的糖蛋白B分子的基因,或能与所述 基因的产物反应。此家族的两个成员是与腹膜后纤维瘤病相关的疱疹病 毒(RFHV)和与卡波济氏肉瘤相关的疱疹病毒(KSHV)。这些材料和相 关的方法可用于诊断和治疗灵长类,包括人类的疱疹病毒感染。分离的 或重组的糖蛋白B片断或编码它们的多核苷酸可用作疱疹病毒主动疫苗 的成分,而特异于糖蛋白B的抗体可用作被动疫苗的成分。

因此,本发明的一个实施方案是具有疱疹病毒RFHV/KSHV亚族的糖 蛋白B编码区域的分离的多核苷酸,所述多核苷酸含有与SEQ.ID NO: 1或SEQ.ID NO:3的核苷酸36-354至少有65%相同的319个核苷酸 长的序列,它们分别是编码RFHV和KSHV的糖蛋白B的319个核苷酸长 的片断。本发明还包括具有糖蛋白B编码区的分离的多核苷酸,此多核 苷酸含有选自以下的序列:与寡核苷酸SHMDA至少有74%相同的35个 核苷酸长的序列(SEQ.ID NO:41);与寡核苷酸CFSSB至少有73% 相同的30个核苷酸长的序列(SEQ.ID NO:43);与寡核苷酸ENTFA 至少有72%相同的29个核苷酸长的序列(SEQ.ID NO:45);和与寡 核苷酸DNIQB至少有80%相同的35个核苷酸长的序列(SEQ.ID NO: 46)。

本发明的另一个实施方案是含有上述实施方案中的糖蛋白B多核苷 酸编码区的至少21个,优选35个,更优选50个,再更优选75个,甚 至更优选100个连串核苷酸的片断的分离的多核苷酸。此多核苷酸优选 来自能感染灵长类动物的病毒,包括来自RFHV和KSHV的编码糖蛋白B 的多核苷酸片断。本发明的另一个实施方案是含有与SEQ.ID NO:1, SEQ.ID NO:3,或SEQ.ID NO:92所含的核苷酸36-354之间的糖蛋 白B编码序列,或者SEQ.ID NO:96中的任何位置处的序列,而非SEQ. ID NO:98所含序列至少约有21个核苷酸相同的分离的多核苷酸。

本发明的另一个实施方案是由任一个前述实施方案编码的分离的多 肽。本发明还包括一种分离的多肽,它含有与SEQ.ID NO:2,SEQ.ID NO:4,或SEQ.ID NO:97所示的糖蛋白B的蛋白质序列,或者SEQ.ID NO:94(KSHV)中的任何位置处的序列,而非SEQ.ID NO:99所含序 列至少有17个基酸基本上相同的线性序列。它们包括融合多肽,免 疫原性的多肽,和以糖基化和非糖基化形式存在的多肽,SEQ.ID NOS: 67-76中列出了一些优选的抗原肽。本发明中还包括编码任一个前述多 肽的分离的和非天然产生的多核苷酸,以及克隆载体,表达载体和由它 们得到的被转染的宿主细胞。本发明的另一个实施方案是生产本发明的 多核苷酸或多肽的方法,此方法包括复制本发明的载体或在适当的宿主 细胞中表达多核苷酸。

本发明的另一个实施方案是特异针对本发明中包括的糖蛋白B多 肽,或特异于在本发明所包含的多核苷酸编码区编码的糖蛋白B的单克 隆或分离的多克隆抗体。所述抗体特异于RFHV/KSHV亚族的成员,而不 与更远相关的糖蛋白B序列,特别是SEQ.ID NOS:30-41交叉反应。

其它糖蛋白B抗体为特异针对权利要求9的多肽,而不是具有SEQ. ID NOS:30-41任一氨基酸序列的多肽的特异性单克隆或分离的多克隆 抗体。

本发明的另一个实施方案是含有本发明的多肽和药物可接受的赋形 剂,也可非强制性地含有佐剂的疫苗。本发明的另一个实施方案是含有 本发明的多核苷酸的疫苗,它可以是活病毒或病毒表达载体的形式。本 发明的另一个实施方案是含有本发明的抗体和药物可接受的赋形剂的疫 苗。其它实施方案是或预防性地或在正进行着的感染过程中治疗疤疹病 毒感染的方法,所述方法包括施用前述实施方案中的一个。

本发明的另一个实施方案是特异于γ疱疹病毒亚族,RFHV/KSHV亚 族,RFHV,和KSHV的糖蛋白B编码序列的寡核苷酸,尤其是SEQ.ID NOS: 24-63中所列的那些。本发明还包括得到编码糖蛋白B的多核苷酸的扩 增拷贝的方法,所述方法包括将多核苷酸与一个或多个前述的寡核苷酸 接触。欲被扩增的多核苷酸可以取自患有以成纤维细胞增殖和胶原沉积 为特征之疾病的个体,所述疾病包括但不限于腹膜后纤维瘤病或卡波济 氏肉瘤,或淋巴细胞谱系的恶性肿瘤

本发明的另一个实施方案是检测样品中病毒DNA或RNA的方法,一 个方法包括的步骤有:将样品中的DNA或RNA与含有本发明的多核苷酸 或寡核苷酸的探针接触,所处条件应能允许探针与具有SEQ.ID NO:1 或SEQ.ID NO:3,或这两者所示序列的多核苷酸,而不与具有除RFHV/KSHV 亚族以外的疱疹病毒序列,尤其是SEQ.ID NOS:5-13的多核苷酸形 成稳定的双螺旋;和检测由此形成的任何双螺旋的存在。涉及的条件是 一单套反应参数,如保温时间,温度,溶质浓度和洗涤步骤。在这些条 件下,多核苷酸如果与具有SEQ.ID NO:1所示序列的多核苷酸,或具 有SEQ.ID NO:3所示序列的多核苷酸,或同时具有这两者的多核苷酸 接触,可以形成稳定的双螺旋,如果与具有SEQ.ID NO:5-13中任一 个的序列的多核苷酸接触,不能形成稳定的双螺旋。另一个方法包括的 步骤有:在扩增反应中使用本发明的寡核苷酸作为引物对样品中的DNA 或RNA进行扩增反应,并检测任何经扩增的拷贝的存在。本发明还包括 由前述方法鉴定的分离的多核苷酸,所述多核苷酸可能存在于天然产生 的病毒的基因组或被感染的组织中。

本发明的另一个实施方案是检测生物样品中与疱疹病毒感染相关之 成分的诊断试剂盒,所述生物样品可得自怀疑具有这种感染的个体,所 述试剂盒中含有适当包装的本发明的多核苷酸,寡核苷酸,多肽或抗体。 本发明还包括检测个体感染的方法,所述方法包括对得自个体的生物样 品使用本发明的试剂,方法,或试剂盒。

本发明的另一个实施方案是用于治疗被γ疱疹病毒感染之个体的治 疗性的化合物和组合物,所包括的治疗剂含有以基因疗法为目的的本发 明的多核苷酸和载体。本发明还包括通过将本发明中所包含的多肽与所 述化合物接触,并测定多肽的生化功能是否改变而鉴定的药用化合物。 本发明还包括基于糖蛋白B分子的结构和生化特征,由合理的药物设计 得到的药用化合物。

                      附图简述

图1列出了从RFHV和KSHV的糖蛋白B编码区扩增的多核苷酸序列。 下划线部分是残基36-354之间的319-碱基的多核苷酸区段,并表示 用于扩增它的引物之间的各个病毒基因区段。与多核苷酸序列排在一起 的是可用作杂交探针或PCR引物的寡核苷酸。Type1寡核苷酸含有γ疱 疹病毒共有序列,可被用于扩增γ疱疹病毒的糖蛋白B基因区段,所示 例子是NIVPA和TVNCB。Type2寡核苷酸含有RFHV/KSHV亚族的共有序 列,可被用于扩增属于此亚族的病毒的糖蛋白B基因区段,所示例子是 SHMDA,CFSSB,ENTFA和DNIQB。所示的其它寡核苷酸是Type3寡核苷 酸,这些寡核苷酸含有直接取自RFHV或KSHV序列的序列,并且特异于 各个病毒的序列。在编码序列的方向上起始扩增的寡核苷酸(名称以“A” 结束)以5’→3’的方向被列出。以与编码序列的方向相反的方向起始 扩增的寡核苷酸(名称以“B”结束)以3’→5’的方向被列出。图1中 还示出了由RFHV和KSHV多核苷酸序列编码的多肽。在两个序列中由核 苷酸238-240编码的天冬酰胺是潜在的N-键糖基化位点,此位点在这 两种病毒和其它疱疹病毒中是保守的。

图2是据信包含在KSHV基因组,和RFHV/KSHV亚族其它成员的基 因组中的编码糖蛋白B的DNA序列的图谱。所示出的是本文所述的KSHV 糖蛋白B序列的大致位置。还示出了表示Type1共有/简并寡核苷酸之 杂交位点的推断的保守区段,它可用于从γ疱疹病毒中探测和扩增出糖 蛋白B序列。

图3列出了一些以前已知的疱疹病毒糖蛋白B的蛋白质序列,和它 排在一起的是完整的KSHV糖蛋白B蛋白质序列和RFHV1及RFHV2的片 断。被框着的区域表示推断的加工前的信号序列和跨膜区。下划线的是 半胱氨酸残基,在疱疹病毒糖蛋白B序列中高度保守的残基下标星号 (*)。只在KSHV糖蛋白B中出现的半胱氨酸下标圆点(.)。

图4列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示出 了保守区域,和由此设计出的Type1寡核苷酸FRFDA。

图5列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示出 了保守区域,和由此设计出的Type1寡核苷酸NIVPA和NIVPASQ。

图6列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示出 了保守区域,和由此设计出的Type1寡核苷酸TVNCA,TVNCB和TVNCBSQ。

图7列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示出 了保守区域,和由此设计出的Type1寡核苷酸FAYDA。

图8列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示出 了保守区域,和由此设计出的Type1寡核苷酸IYGKA和IYGKASQ。

图9列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示出 了保守区域,和由此设计出的Type1寡核苷酸CYSRA和CYSRASQ。

图10列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示 出了保守区域,和由此设计出的Type1寡核苷酸NIDFB和NIDFBSQ。

图11列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示 出了保守区域,和由此设计出的Type1寡核苷酸FREYA,FREYB和NVFDA。

图12列出了以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,示 出了保守区域,和由此设计出的Type1寡核苷酸GGMA。

图13列出了得自RFHV和KSHV的糖蛋白B多核苷酸序列的部分, 排在一起的是以前已知的γ疱疹病毒糖蛋白B的多核苷酸序列,每个共 用的残基以小圆点表示。

图14列出了不同γ疱疹病毒的糖蛋白B多肽序列的比较,所述蛋 白质由多核苷酸序列中NIVPA和TVNCB的杂交位点之间的区域编码。据 推测下划线所示的Ⅱ类序列片断是RFHV/KSHV交叉反应的抗原肽,而 以小写字母表示的Ⅲ类序列是RFHV或KSHV病毒特异性的肽。

图15排列了较广范围的α,β,和γ亚族疱疹病毒中的糖蛋白B 的多肽序列。

图16是以图15所示多肽序列为基础的糖蛋白B关系图谱。

图17列出了Type2(亚族-特异性)寡核苷酸的例子,排在一起 的是得到它们的核苷酸序列。

图18是KSHV基因组中出现的糖蛋白B和DNA聚合酶的大致图谱, 显示了寡核苷酸引物的杂交位置。

图19列出了通过从图1所示序列的上游和下游扩增片断而得到的 KSHV DNA序列。显示了完整的KSHV糖蛋白B序列的开放阅读框,其侧 翼是衣壳成熟基因和DNA聚合酶的开放阅读框。核苷酸序列中的下划线 部分是推断的糖蛋白B启动子。

图20是NIVPA和TVNCB之间编码的106个核苷酸的RFHV糖蛋白B 多肽片段的Hopp-Woods抗原性图,下面示出的是序列中疏水性和抗原 性残基的跨度。

图21是NIVPA和TVNCB之间编码的106个核苷酸的KSHV糖蛋白B 多肽片段的Hopp-Woods抗原性图。

图22是KSHV完整的糖蛋白B的Hopp-Woods抗原性图。

图23列出了被称为RFHV2的RFHV/KSHV亚族的第三个成员的糖蛋 白B片断的DNA和蛋白质序列。下划线部分是残基36-354之间的319 个碱基的多核苷酸区段,并表示用于扩增它的引物之间的糖蛋白B编码 区段。

                   实施本发明的最佳方式

我们已从疱疹病毒RFHV/KSHV亚族中发现并鉴定了编码糖蛋白B的 多核苷酸,本发明中包含的多核苷酸,寡核苷酸,多肽和抗体能用于诊 断,临床监测和治疗疱疹病毒感染以及相关疾病。

RFHV糖蛋白B的多核苷酸来源是取自患有腹膜后纤维瘤病(“RF”) 的豚尾猴的被感染组织的样品,KSHV糖蛋白B的多核苷酸得自取自患有 卡波济氏肉瘤(“KS”)的人的被感染组织的样品。已知用于本发明的 组织含有RFHV或KSHV的遗传物质,因为以前已成功地使用它们克隆了 相应的编码DNA聚合酶的片断。在共有的美国专利申请60/001,148中 描述了DNA聚合酶区域的扩增。

为了从这些样品中扩增糖蛋白B序列,我们由其它疱疹病毒的序列 设计了寡核苷酸。由于糖蛋白B暴露于病毒包膜的外部,从而处于它们 所感染的宿主的免疫系统的选择压力之下,因此预计疱疹病毒之间的糖 蛋白B较不保守。相应地,由据信与RFHV和KSHV最密切相关的疱疹病 毒的序列设计了寡核苷酸。由DNA聚合酶序列可以知道这两个病毒是密 切相关的γ型疱疹病毒。

主要从先前已知的四个γ疱疹病毒:sHV1,eHV2,bHV4,mHV68和 hEBV的糖蛋白B序列设计了寡核苷酸,这四个糖蛋白B分子的氨基酸序 列的比较揭示了九个相对保守的区域。根据序列资料构建的寡核苷酸含 有简并区段和共有区段,这一点将在以下段落中描述。已经将这些寡核 苷酸中的三个用作扩增反应中的引物,所述反应已从RF和KS组织中产 生了RFHV和KSHV糖蛋白B编码区段的片断。

最终的扩增反应步骤之后得到的RFHV和KSHV多核苷酸序列片段示 于图1(分别为SEQ.ID NO:1和SEQ.ID NO:3),所包括的区段的 每一末端对应于扩增反应中所用NIVPA和TVNCB引物的杂交区域。引物 结合区段之间的片断长为319个碱基对(残基36-354),据信它是RFHV 和KSHV基因组的各个糖蛋白B编码区域序列的准确反映。

得自RFHV的编码糖蛋白B的319个碱基对长的多核苷酸区段与

sHV1和bHV4的相应部分仅有60%相同,后两个序列是RFHV/KSHV 亚族以外的最密切相关的序列。得自KSHV的319个碱基对长的多核苷 酸区段与sHV1和bHV4的相应部分仅有63%相同。RFHV和KSHV之间的 此区段有76%相同。

还显示了相应的推测的氨基酸序列(SEQ.ID NO:2和SEQ.ID NO: 4)。多肽序列是新的,并且与其它疱疹病毒的糖蛋白B序列部分同源, 推测所示片断约为整个糖蛋白B序列的1/8,它们约从加工前蛋白质的 推测的N-端甲硫氨酸下游80个氨基酸处开始。根据序列Asn-Xaa- (Thr/Ser),在氨基酸序列的第80位有一个潜在的N-键糖基化位点, RFHV和KSHV之间的此位点是保守的,在其它已知的γ疱疹病毒中此位 点也是保守的。在第58位也有一个半胱氨酸残基,此残基在γ,β, 和α亚族的疱疹病毒之间是保守的,可能对于维持蛋白质的三维结构起 作用。

RFHV和KSHV之间由扩增引物之间的319个碱基对编码的106个氨 基酸长的糖蛋白B区段有91%相同,但在KSHV和bHV4的相应部分之间 只有65%相同,bHV4的所述序列是RFHV/KSHV亚族以外最接近的序列。

预期由RFHV/KSHV疱疹病毒亚族表达的糖蛋白B分子具有其它疱疹 病毒糖蛋白B所具有的很多特性。糖蛋白B分子的大小一般约为110kDa, 对应于约800-900个氨基酸或约2400-2700个碱基对。疏水性作图显 示出从N末端至C末端以下列次序排列的区域:对应于导向膜的前导序 列的疏水区;对应于细胞外区的混合极性区;对应于跨膜区的疏水区; 对应于胞质区的另一个混合极性区。

图19所示的KSHV糖蛋白B的完整序列进一步证实了这些推测:此 基因编码了包括C末端附近的信号肽和跨膜区的约845个氨基酸。KSHV 和其它糖蛋白B序列之间的半胱氨酸残基是保守的,另一个潜在的二硫 键可有助于稳定三维结构。

糖蛋白B一般在感染性和缺损的病毒颗粒包膜,和被感染的细胞表 面表达。它一般是糖基化的,可含有5-20或更多个糖基化位点。它一 般被表达成蛋白质二聚体,在病毒芽殖前转运至宿主细胞表面的过程中 装配。负责二聚化的位点似乎位于约氨基酸475至跨膜区段之间(Navarro 等人)。

以往的研究已经绘出涉及糖蛋白B分子不同区域的感染性的几个生 化功能图。糖蛋白B和糖蛋白C都涉及HSV1和牛疱疹病毒1型与靶细 胞的最初的结合(Herold等人,Byme等人)。由糖蛋白B识别的细胞 上的组成成分似乎是硫酸乙酰肝素;通过液相肝素可以抑制结合。缺乏 糖蛋白C的突变体仍可结合靶细胞,但对于既缺乏糖蛋白C又缺乏糖蛋 白B的突变体而言,其进入细胞的能力受到严重损害。

糖蛋白B的另一个明显重要的功能是促进膜融合和病毒进入细胞的 能力。在人CMV中,融合作用似乎由糖蛋白B的第一个疏水区来担当, 该作用可能与此区域内部保守的甘氨酸残基有关(Reschke等人)。在 HSV1突变体中,糖蛋白B促进合胞体形成的能力归功于蛋白质胞质区C 末端附近的多个位点(Kostal等人)。

为了行使这些更复杂的功能中的一些功能,糖蛋白B看上去似乎不 仅与第二个糖蛋白B分子相关,而且与病毒编码的其它成分相关,例如, 糖蛋白B似乎需要UL45基因产物来诱导融合(Haanes等人)。已经有人假 设糖蛋白B与其它表面蛋白合作以在靶细胞表面形成疏水融合微孔(Pereira 等人)。已发现糖蛋白B能产生潜在的可中和完整病毒的抗体应答,具有 中和活性的单克隆抗体可针对糖蛋白B分子上的多个不同位点。

因而,预期糖蛋白B分子携有的位点可与靶细胞相互作用,可有助 于促进融合,并与其它病毒蛋白质相关。预测RFHV/KSHV亚族病毒的糖 蛋白B分子会在其它种疱疹病毒中行使糖蛋白B的很多功能,并且携有 具有一些相同特性的活性区域。用药物,抗体,或通过突变干扰这些活 性区域中的任何一个可能会有损于病毒的感染性或毒力

在发现了RFHV和KSHV的糖蛋白B之后,在猕猴的被感染的组织样 品中鉴定出RFHV/KSHV亚族的第三个成员(实施例12),该成员的糖蛋 白B与RFHV的密切相关但不相同,将该成员称为RFHV2。预测RFHV/KSHV 亚族的其它成员也会出现,包括一些对人是病原体的成员。这一发现的 教导是如何检测和鉴定亚族的新成员。

RFHV/KSHV亚族内糖蛋白B序列之间的同源性意味着本发明中包含 的多核苷酸和多肽是亚族的不同毒株中可靠的标记物。本发明中包含的 多核苷酸,多肽和抗体在这种应用中可用于检测和治疗个体中因RFHV, KSHV,或相同亚族的其它疱疹病毒造成的病毒感染。在下文中将更详细 地描述与糖蛋白B相关的多核苷酸,寡核苷酸探针,多肽,抗体和疫苗 组合物,以及这些化合物的制备和用途。

缩写

本文使用的下列缩写指的是疱疹病毒的种类,以及从中得到的多核 苷酸和多肽:                       表1:疱疹病毒株的缩写    名称            病毒     暂时的亚族排布    RFHV    KSHV    mHV68    bHV4    eHV2    sHV1    hEBV    hCMV    mCMV    gpCMV    hHV6    HVZV    HSV1    HSV2    sHVSA8    eHV1    iHV1     与猕猴腹膜后纤维瘤病     相关的疱疹病毒     与人卡波济氏肉瘤相关     的疱疹病毒     鼠疱疹病毒68型     牛疱疹病毒4型     马疱疹病毒2型     松鼠猴疱疹病毒1型     人Epstein-Barr病毒     人巨细胞病毒     鼠巨细胞病毒     豚鼠巨细胞病毒     人疱疹病毒6型     人水痘-带状疱疹病毒     人单纯疱疹病毒1型     人单纯疱疹病毒2型     猴疱疹病毒A8型     马疱疹病毒1型     ictalurid catfish疱疹病毒      γ-疱疹病毒      β-疱疹病毒      α-疱疹病毒

一般性的定义

“糖蛋白B”是疱疹病毒的特定的蛋白质成分,它由病毒基因组编 码,据信表达于完整病毒的表面。对某些种类的疱疹病毒,尤其是HSV1, hCMV和牛疱疹病毒1型进行的功能性研究已在有关病毒感染性的多种生 化功能中涉及到糖蛋白B,这些功能包括与靶细胞表面的成分,如硫酸 乙酰肝素结合,病毒膜与靶细胞的膜融合,病毒衣壳穿入细胞内,和多 核化合胞体细胞的形成。据观察糖蛋白B是同二聚体,它可以与其它病 毒表面蛋白相互作用以行使它的一些生化功能。不同的生化功能,尤其 是硫酸乙酰肝素结合和膜融合,似乎应归功于糖蛋白B分子的不同部分。 包括RFHV/KSHV亚族成员的其它疱疹病毒的糖蛋白B分子可行使这些功 能中的任何一部分或全部。本文所用的术语糖蛋白B包括非糖基化的, 部分糖基化的,和完全糖基化的形式,既包括单体也包括多聚体。

本文所用的糖蛋白B片断,区域,或区段是糖蛋白B分子的片断, 或编码糖蛋白B的多核苷酸亚区的转录本。完整的糖蛋白B分子,或全 长的转录本将行使如上文所述的那些与病毒活性相关的生化功能。这些 功能中的一些或全部可在此片断上被保留,或此片断可来自不能依靠自 身行使这些功能的完整分子的一部分。

“糖蛋白B活性”指的是糖蛋白B的任何生化功能,或疱疹病毒的 可归功于糖蛋白B的任何生物活性。这些可包括但不局限于蛋白质与细 胞,如硫酸乙酰肝素的细胞受体,和受体类似物的结合;病毒结合或穿 透细胞,或细胞融合。

术语“糖蛋白B基因”指的是含有编码如上文所定义的糖蛋白B分 子之序列的基因。应理解糖蛋白B基因可产生经加工和经改变的翻译产 物,包括但不局限于具有或不具有信号或前导序列的糖蛋白B形式,截 短的或内部缺失的形式,多聚体的形式,和具有不同程度的糖基化的形 式。

本文所用的“DNA聚合酶”是蛋白质或蛋白质类似物,在适当条件 下能够催化DNA多核苷酸与序列的装配,所述序列与用作模板的多核苷 酸互补。DNA聚合酶也可以含有其它催化活性,如3′-5′外切核酸酶活 性;任何一种活性都可能占优势。DNA聚合酶可能需要与附加的蛋白质 或辅-因子连接以行使其催化功能。

“RFHV”是在患有腹膜后纤维瘤病(RF)的豚尾猴组织样品中检测 到的疱疹病毒家族的病毒,“RFHV”是术语“RFHV1”,“RFHVMn”和 “RFMn”的同义词。“KSHV”是在患有卡波济氏肉瘤(KS)的人的组织 样品中检测到的疱疹病毒家族的病毒。RFHV/KSHV亚族的第三成员是在 猕猴中鉴定出的病毒,本文中将此病毒称作“RFHV2”,“RFHV2”是术 语“RFHVMm”和“RFMm”的同义词。

“RFHV/KSHV亚族”这一术语用于本文是指能感染脊椎动物种类的 疱疹病毒的总和,组成这一亚族的成员所具有的糖蛋白B序列与RFHV 或KSHV的相应序列之间的相关性相对于与其它任何疱疹病毒之间的相 关性而言,前者更加密切,所述其它疱疹病毒包括sHV1,eHV2,bHV4, mHV68和hEBV。优选编码糖蛋白B的多核苷酸含有在残基36和354之 间与RFHV(SEQ.ID NO:1)或KSHV(SEQ.ID NO:3)的相应部分至 少有65%相同的区段;或与寡核苷酸SHMDA至少约有74%相同,或与 寡核苷酸CFSSB至少约有73%相同,或与核苷酸ENTFA至少约有72%相 同,或与核苷酸DNIQB至少约有80%相同。RFHV和KSHV是RFHV/KSHV 亚族成员的例子,RFHV/KSHV亚族代表一亚组γ亚族的疱疹病毒。

术语“多核苷酸”和“寡核苷酸”可以互换使用,它们指的是任何 长度的核苷酸的聚合形式,所述核苷酸或者是脱核糖核苷酸或者是核 糖核苷酸,或者是它们的类似物。多核苷酸可以具有任何三维结构,并 可行使已知或未知的任何功能。以下是多核苷酸非限制性的例子:基因 或基因片段,外显子,内含子,信使RNA(mRNA),转运RNA,核糖体RNA, 核酶,cDNA,重组多核苷酸,分支多核苷酸,质粒,载体,任何序列分 离的DNA,任何序列分离的RNA,核酸探针和引物。多核苷酸可含有经 修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在修饰,则 可在聚合物装配之前或之后对核苷酸结构进行修饰。非核苷酸成分可打 断核苷酸的序列,聚合之后可通过例如与标记成分结合进一步修饰多核 苷酸。

本文使用的术语多核苷酸既可指双链也可指单链分子。除非另有特 别说明或需要,本文所述发明的任何实施方案中的多核苷酸既包含双链 形式,也包含已知或预测组成此双链形式的两个互补单链形式中的每一 种。

在多核苷酸的上下文中,“线性序列”或“序列”是多核苷酸中5′ 至3′方向上的核苷酸顺序,其中在序列中互为邻居的残基在多核苷酸的 一级结构中是邻接的。“部分序列”是已知在一个或两个方向上含有额 外残基的多核苷酸之一部分的线性序列。

“杂交”指的是一种或多种多核苷酸反应形成复合物的反应,所述 复合物通过核苷酸残基碱基之间的氢键得以稳定。Watson-Crick碱基 配对,Hoogsteen结合或任何其它序列-特异性方式都可能产生氢键键 合。复合物可含有形成双螺旋结构的两条链,形成多链复合物的三条或 更多条链,单条自身杂交链或任何它们的组合。在更加外延的方法,如 PCR的起始,或通过核酶酶促裂解多核苷酸中,杂交反应可构成一个步 骤。

可在不同的“严紧”条件下进行杂交反应。增加杂交反应严紧性的 条件已广为人知并已在本技术领域中公开,例见Sambrook Fritsch & Maniatis。相关条件的例子包括(以增加严紧性的次序):保温温度为 25℃,37℃,50℃和68℃;缓冲液浓度为10×SSC,6×SSC,1×SSC, 0.1×SSC(其中SSC是0.15M NaCl和15mM柠檬酸缓冲液)和使用其它 缓冲液系统的它们的等同物;甲酰胺浓度为0%,25%,50%和75%; 保温时间为5分钟至24小时;1,2,或更多次的洗涤步骤;1,5,或15 分钟的洗涤保温时间;洗涤溶液是6×SSC,1×SSC,0.1×SSC或去离 子水。

“Tm”是实验条件下50%多核苷酸双螺旋解离成单链时的摄氏温 度,所述双螺旋由通过Watson-Crick碱基配对在反平行方向以氢键键 合的互补链组成。根据标准公式可预测Tm,例如:

Tm=81.5+16.6 log[Na+]+0.41(%G/C)-0.61(%F)-600/L

其中Na+是以mol/L表示的阳离子浓度(通常为钠离子);(%G/C) 是以在双螺旋中占总残基的百分比表示的G和C残基的数目;(%F) 是溶液中甲酰胺的百分含量(wt/Vol);L是双螺旋的每一链中核苷酸 的数目。

多核苷酸“稳定的双螺旋”或生化反应中任何两个或多个成分之间 形成的“稳定的复合物”指的是在双螺旋或复合物的形成和其随后的检 测之间能维持足够长时间的双螺旋或复合物。双螺旋或复合物无论在何 种条件存在下都应该能维持,或在形成时刻和检测时刻之间的某一时刻 被导入,这些条件是所进行的检测或反应的参数。非强制性存在的能破 坏双螺旋或复合物的有关条件包括洗涤,加热,在反应混合物中加入额 外的溶质或溶剂(如变性剂),和与多余的反应类别竞争。稳定的双螺 旋或复合物可以是不可逆的,也可以是可逆的,但必须满足此定义的其 它必需条件。因此,反应混合物中可能形成瞬时复合物,但是如果它自 动解离或者由于在检测前引入新增加的条件或操作而发生解离,就不能 构成稳定的复合物。

当在两个单链多核苷酸之间以反平行的构型形成稳定的双螺旋时, 特别是在高度严紧的条件下,链基本上是“互补的”。双链多核苷酸可 以与另一个多核苷酸“互补”,条件是第一多核苷酸中的一条链和第二 多核苷酸中的一条链之间能形成稳定的双螺旋。从单链多核苷酸序列推 测的互补序列是根据广泛为人接受的碱基配对规则预期与单链多核苷酸 形成氢键键合的标准核苷酸的最适序列。

“有义”链和“反义”链当用于相同的上下文中时指的是相互之间 互补的单链多核苷酸。它们可以是双链多核苷酸的相反链,或者根据广 泛为人接受的碱基配对规则由一条链推测另一条链。如果不是特指,可 任意地将一条链或其它链指定为“有义”或“反义”链,至于编码肽的 多核苷酸区段,“有义”链一般指的是含有编码区段的链。

当在多核苷酸之间进行相同程度比较时,只能理解为容易产生互补 链,选择有义或反义链,或者预测它们能使被比较的多核苷酸之间的相 同程度最大化。例如,当被比较的多核苷酸中的一个或两个是双链时, 如果第一多核苷酸的一条链与第二多核苷酸的一条链相同,则序列相 同。类似地,当多核苷酸探针被描述成与其靶相同时,应理解它是靶的 互补链,所述互补链参与了探针和靶之间的杂交反应。

如果两个序列都能与相同的互补多核苷酸杂交形成双螺旋,则其中 一个核苷酸的线性序列与另一个线性序列“基本上相同”,更优选能在 较严紧的条件下杂交的序列。应理解杂交反应可容纳核苷酸序列中的插 入,缺失和取代。因此即使一些核苷酸残基不能精确地对应或匹配,核 苷酸的线性序列也基本上相同,相比之下更优选与本发明公开的更加对 应或匹配的序列。通常约为25个残基的多核苷酸区域与另一个区域基 本上相同,条件是序列至少约85%相同;更优选序列至少约90%相同; 更优选序列至少约95%相同;再更优选序列为100%相同。在同源部分 相互匹配之后,40或更多个残基的多核苷酸区域与另一个区域基本上相 同,条件是序列至少约75%相同;更优选序列至少约80%相同;更优 选序列至少约85%相同;甚至更优选序列至少约90%相同;再更优选 序列为100%相同。

在测定多核苷酸序列是否基本上相同时,特别优选保留了多核苷酸 的功能性并以此进行比较的序列。可通过不同的参数测定功能性,例如, 如果多核苷酸用于涉及与另一个多核苷酸杂交的反应中,则优选的序列 为那些在类似条件下与相同靶杂交的序列。通常,对于200或更多个残 基的双螺旋而言,序列的同一性每减少1%,DNA双螺旋的Tm约降低1 ℃;或对于少于40个残基的双螺旋而言约降低5℃,这取决于错配残基 的位置(例见Meinkoth等人)。一般而言,约100个残基的基本上相 同的序列在低于Tm约20℃时能与彼此各自互补的序列形成稳定的双螺 旋;优选它们能在低于Tm约15℃时形成稳定的双螺旋;更优选它们能 在低于Tm约10℃时形成稳定的双螺旋,甚至更优选它们能在低于Tm约 5℃时形成稳定的双螺旋;再更优选它们能在约Tm时形成稳定的双螺旋。 在另一个实施例中,如果由多核苷酸编码的多肽是其功能性的重要部 分,则优选的序列为那些编码相同或基本上相同的多肽的序列。因此能 导致保守的氨基酸取代的核苷酸差异比那些导致非保守取代的核苷酸差 异更加优选,更优选不会改变氨基酸序列的核苷酸差异,而甚至更优选 相同的核苷酸。导致多肽插入或缺失的多核苷酸插入或缺失比那些导致 下游编码区移码的多核苷酸插入或缺失更加优选,甚至更优选不含插入 或缺失的多核苷酸序列。杂交特性和多核苷酸编码的多肽序列的相对重 要性取决于本发明的应用。

多核苷酸具有与另一个多核苷酸相同的“特性”,条件是这两个多 核苷酸在类似的最高严紧度的条件下,都能与特殊的第三个多核苷酸形 成稳定的双螺旋。优选除了类似的杂交特性外,多核苷酸也编码基本上 相同的多肽。

多核苷酸序列的“保守”残基是那些不变地出现在被比较的两个或 多个相关序列的相同位置上的残基。相对保守的残基是那些在更相关的 序列中保守或相对于在序列别处出现的残基而言具有更高程度的相同性 的残基。

“相关的”多核苷酸是共用的相同残基占相当比例的多核苷酸。

本文所用的“简并”寡核苷酸序列是按下述衍生自至少两个相关的 来源多核苷酸序列的经设计的序列:在来源序列中保守的残基被保留在

简并序列中,而在来源序列中不保守的残基可以简并序列中的几个 可替代物提供。例如,可从来源序列ATACA和ACAGA出发设计简并序列 AYASA,其中Y是C或T,S是C或G。Y和S是“多义”残基的例子。 简并区段是含有简并序列的多核苷酸区段。

应理解含有简并序列的合成寡核苷酸实际上是除了在多义位置以外 共用相同序列的密切相关的寡核苷酸混合物。这种寡核苷酸通常被合成 为多义位置处的核苷酸的所有可能的组合的混合物,混合物中每种寡核 苷酸被称作“可替换的形式”,混合物中该形式的数目等于 Π i = 1 n k i

其中ki是每个位置处允许的可替换核苷酸的数目。

本文所用的“共有”寡核苷酸序列是按下述衍生自至少两个相关的 来源多核苷酸序列的经设计序列:在所有来源序列中保守的残基被保留 在共有序列中;而在残基不保守的位置处,从来源序列中选择了一个替 代物。通常选择的核苷酸是在来源序列中以最高频率出现的核苷酸。例 如,可由来源序列CAAAA,AAGAA和AAAAT出发设计共有序列AAAAA, 共有区段是含有共有序列的多核苷酸区段。

本文所用的多核苷酸“片段”或“插入物”通常表示全长形式的次 分区域,但也可包括完整的全长多核苷酸。

如果据信多核苷酸可以互相衍生或来自共同的祖先,则多核苷酸相 互“对应”。例如,如果不同病毒基因的编码区有显著水平的同一性, 在基因组图谱上处于相同的位置,或编码行使类似生化功能的蛋白质, 则可认为它们相互对应。信使RNA对应于它所转录的基因,cDNA对应于 产生它的RNA,以及编码RNA的基因。蛋白质对应于编码它的多核苷酸, 和能与它特异性结合的抗体。

在多核苷酸操作上下文中所用的“探针”指的是以试剂的形式提供 以通过与靶杂交检测受试样品中潜在存在的靶的寡核苷酸。通常探针会 含有标记物或者使标记物在杂交反应之前或之后能被结合的物质。适当 的标记物包括但不限于放射性同位素,荧光染料化学发光化合物,染 料和包括酶的蛋白质。

“引物”是通常具有游离的3′-OH基团的寡核苷酸,它能通过与靶杂 交来结合受试样品中潜在存在的靶,然后促使与靶互补的多核苷酸聚合。

产生相同多核苷酸的复制拷贝的方法,如PCR或基因克隆在本文中 被统称为“扩增”或“复制”。例如,可以复制单链或双链DNA以形成 具有相同序列的另一个DNA。例如可通过RNA指导的RNA聚合酶,或通 过逆转录DNA然后进行PCR来复制RNA。在后一种情况下,RNA的扩增 拷贝是具有相同序列的DNA。

聚合酶链反应”(“PCR”)是使用一种或多种引物和聚合作用 催化剂,如逆转录酶或DNA聚合酶,特别是热稳定性的聚合酶由靶多核 苷酸制成复制拷贝的反应。通常PCR涉及反复形成的三个步骤:“退火”, 其中温度被调节,以使寡核苷酸引物能与欲被扩增的多核苷酸形成双螺 旋;“延伸”,其中温度被调节,以使通过DNA聚合酶,使用它们已与 之形成双螺旋的多核苷酸为模板,使得已形成双螺旋的寡核苷酸被延 伸;和“解链”,其中温度被调节,以使多核苷酸和被延伸的寡核苷酸 解离。然后重复此循环直至得到所需量的经扩增的多核苷酸。PCR方法 参见美国专利号4,683,195(Mullis)和4,683,202(Mullis等人)。

“调控元件”或“调控序列”是涉及对多核苷酸的功能性调节有贡 献的分子相互作用的核苷酸序列,所述作用包括多核苷酸的复制,重复, 转录,剪接,翻译,或降解。调节可以影响到进程的频率,速度或特异 性,也可以在性质上逐渐增强或被抑制。调控元件是本技术领域中已知 的。例如,“启动子”就是一例调控元件。启动子是能在某些条件下结 合RNA聚合酶并起动位于启动子下游(3′方向)的编码区转录的DNA区 域。“有效连接”指的是遗传元件的并列,其中元件的排列关系应能允 许它们以预期的方式起作用。例如,如果启动子帮助起动编码序列的转 录,则启动子与编码区域有效地连接,在启动子和编码区域之间应存在 有相关的残基,只要这种功能关系能得以维持。

术语“多肽”,“肽”和“蛋白质”在本文中可互换使用,意指任 何长度的氨基酸的聚合物。聚合物可以是线性的或分支的,它可含有经 修饰的氨基酸,可被非氨基酸打断。此术语也包含已被自然修饰或通过 间插修饰过的氨基酸聚合物;修饰可包括例如,二硫键的形成,糖基化, 脂化,乙酰化,磷酸化,或任何其它操作,如与标记物成分缀合。

在多肽的上下文中,“线性序列”或“序列”是多肽中N末端至C 末端方向上的氨基酸顺序,其中序列中互相邻接的残基在多肽的一级结 构中是邻接的。“部分序列”是已知在一个或两个方向上含有额外残基 的多肽的一部分的线性序列。

如果氨基酸的线性序列与另一个序列具有相当大程度上的序列同一 性,则这两个序列“基本上相同”。应理解蛋白质的折叠和生化功能可 容纳氨基酸序列中的插入,缺失和取代。因此,即使一些残基不能精确 地对应或匹配,氨基酸的线性序列也基本上相同,更加优选与本发明公 开的序列更紧密对应或匹配的序列。还应理解一些氨基酸的取代更容易 忍受。例如由具有类似特性侧链的另一个氨基酸取代具有疏水侧链,芳 香侧链,极性侧链,具有正或负电荷的侧链,或含有两个或较少原子 的侧链的氨基酸不会影响两个序列基本上相同的特性。测定同源区域和 评价同源性程度的方法是本技术领域中熟知的;例见Altschul等人和 Henikoff等人。较能忍受的序列差异指的是“保守的取代”,因此具有 保守取代的序列比那些在相同位置具有其它取代的序列更加优选;更优 选在相同位置处具有相同残基的序列。通常,在同源部分排列之后,多 肽区域与另一个区域基本上相同的条件是:序列至少约92%相同;更优 选至少约95%相同;更优选它们至少约95%相同,并含有至少另一个2% 的相同或保守取代;更优选它们至少约97%相同;更优选它们至少约97% 相同,并含有至少另一个2%的相同或保守取代;更优选它们至少约99% 相同;再更优选序列100%相同。

在测定是否多肽序列基本上相同时,特别优选保留了与其进行比较 的多肽的功能性的序列。可通过不同的参数确定功能性,如酶活性,底 物-酶或受体-配体相互作用中的结合速率或亲和性,与抗体的结合亲 和性和X-射线晶体结构

如果多肽与另一个多肽显示出相同的生化功能,如酶活性,配体结 合或抗体反应性,则这两个多肽具有相同的“特性”。与糖蛋白B或糖 蛋白B片段相关之多肽的优选特性是:结合被其它疱疹病毒种类的糖蛋 白B结合的细胞表面受体类似物的能力,促进膜与靶细胞融合的能力, 促进病毒穿透宿主细胞的能力。也优选与所比较的多肽显示出相同生化 功能的多肽,另外还优选据信通过计算机模拟预测或通过如X-射线晶 体学这类技术测定,与所比较的多肽具有类似三维构象的多肽。

多肽的“生化功能”,“生物学功能”或“生物活性”包括通过适 当的实验研究可检测到的多肽的任何特征。“改变的”生化功能指的是 通过例如分子量测定,圆二色性,抗体结合,差异光谱学或核磁共振可 以检测到的多肽一级,二级,三级或四级结构的改变。它也可以指反应 性的改变,如催化某一反应的能力,或结合辅因子,底物,抑制物,药 物,半抗原或其它多肽的能力。如果某物质以这些方式中的任一种改变 了多肽的生化功能,就可以说此物质“干扰”了多肽的生化功能。

“融合多肽”是与天然出现的多肽相比,含有序列中不同位置处的 区域的多肽。此区域可以在不同的蛋白质中正常地存在,并在融合多肽 中被连在一起;或者它们也可以正常地存在于相同的蛋白质中,但在融 合多肽中以新的安排被放置。可通过例如化学合成,或通过以所需的关 系产生和翻译编码肽区域的多核苷酸来产生融合多肽。

“抗体”是能够通过位于免疫球蛋白分子可变区上的至少一个抗原 识别位点与靶(如多肽)特异性结合的免疫球蛋白分子。本文所用的术 语不仅包含完整的抗体,也包含其片段,其突变体,融合蛋白,人源化 抗体,和含有所需特异性的抗原识别位点的免疫球蛋白分子的任何其它 经修饰的构型。

“免疫识别”或“免疫反应性”指的是通过免疫球蛋白或相关分子 上的至少一个抗原识别位点,如B细胞受体或T细胞受体与靶特异性地 结合。

术语“抗原”指的是抗体通过其抗原识别位点特异性结合的靶分子。 抗原可以但不必需在化学上与刺激抗体生成的免疫原相关。抗原可以是 多价的或单价的半抗原。可被抗体识别的多种抗原的例子包括多肽,多 核苷酸,其它抗体分子,寡糖,复合脂,药物和化合物。

“免疫原”是当注射到适当宿主,通常为哺乳动物体内时能够刺激 抗体生成的抗原。具有此特性的化合物被描述成“免疫原性的”。通过 本技术领域中已知的各种技术可使化合物变成免疫原性的化合物,所述 技术包括与载体交联或缀合以增加价位,与促细胞分裂原混合以增强免 疫应答,和与佐剂联合以增强呈递作用。

“疫苗”是供人或动物使用的药物制品,施用疫苗的目的是赋予受 体抗特殊靶或靶组一定程度的特异性免疫反应性。免疫反应性可以是对 靶具有免疫反应性的抗体或细胞(尤其是B细胞,浆细胞,T辅助细胞 和细胞毒T淋巴细胞和它们的前体),或它们的任何组合。可能的靶包 括外来的或病理性的化合物,如外源蛋白质,病原性病毒或由癌细胞表 达的抗原。免疫反应性对于实验目的,治疗特殊疾病,消除特殊物质或 预防特殊疾病或物质是合乎需要的。除非特别地指出,本文所指的疫苗 可以是被动疫苗,也可以是主动疫苗,或者同时具有两者的特性。

“被动疫苗”是不需要受体免疫应答参与以产生其效果的疫苗。通 常它由对靶反应的抗体分子组成。抗体可得自供体受试者,并被充分纯 化以施用给受体,或者它们也可在体外产生,例如来自杂交瘤细胞培养 物,或者通过经遗传工程改造的编码抗体分子的多核苷酸产生。

“主动疫苗”是经施用意欲在受体体内产生特异性免疫应答的疫 苗,所述免疫应答则具有合乎需要的针对靶的免疫反应性。主动疫苗含 有适当的免疫原。合乎需要的免疫应答可以是体液的或细胞的,全身性 的或分泌性的,或它们的任何组合。

“试剂”多核苷酸,多肽或抗体是为反应提供的物质,此物质具有 一些已知的和合乎反应需要的参数。

反应混合物中也可含有试剂能与之反应的“靶”,如多核苷酸,抗 体或多肽。例如在一些类型的诊断试验中,通过加入试剂,使试剂和靶 反应,并测量反应产物的量可测定样品中靶的量。在临床处理的上下文 中,“靶”也可以是被施用物质,如药物化合物之目标的细胞、细胞集 合、组织或器官。身为病毒感染靶的细胞是病毒为了复制或转化成潜伏 形式的目的而优先定位的细胞。

“分离的”多核苷酸,多肽,蛋白质,抗体,或其它物质指的是该 物质制品缺乏至少一些该物质或类似物质天然存在或最初取得时也可存 在的其它成分。因此例如可通过使用纯化技术从来源混合物中富集以制 备分离的物质。可在绝对的基础(如每体积溶液的重量)之上测量富集, 或者相对于来源混合物中存在的潜在干扰的第二物质来测量富集。本发 明实施方案中富集的增加更为优选。因此,例如优选2-倍富集,更优选 10-倍富集,更优选100-倍富集,甚至更优选1000-倍富集。通过人 工装配的方法,如通过化学合成或重组表达也可以分离的状态提供物质。

反应中使用的多核苷酸,如杂交反应中使用的探针,PCR中使用的 引物,或药物制品中存在的多核苷酸为“特异性的”或“选择性的”的 条件是,相对于它与可替换的物质杂交或反应而言,它与想要的靶的杂 交或反应更加频繁,更加快速,或者持续的时间更长。类似地,多肽为 “特异性的”或“选择性的”的条件是:相对于它与可替换的物质的结 合而言,它与想要的靶,如配体,半抗原,底物,抗体或其它多肽的结 合更加频繁,更加快速,或持续的时间更长。抗体为“特异性的”或“选 择性的”的条件是:相对于它与可替换的物质的结合而言,它通过至少 一个抗原识别位点与想要的靶的结合更加频繁,更加快速,或持续的时 间更长。多核苷酸,多肽或抗体被说成“选择性地抑制”或“选择性地 干扰”反应的条件是:相对于它抑制或干扰可替换的底物之间的反应而 言,它抑制或干扰特殊底物之间的反应的程度更高或持续时间更长。

“候选药物”或“候选药剂”是据信具有治疗潜力的化合物,其效 力有待检测。候选药物的“筛选”指的是进行能够评价候选药物的效力 和/或特异性的试验。在这一上下文中,“效力”指的是候选药物以有 利的方式影响细胞或它所施用的生物体的能力:例如,限制因侵入病毒 导致的病理学。

药物制品的“效应物成分”是当施用给提供细胞的受试者时,通过 以合乎需要的方式改变靶细胞的功能以修饰靶细胞的成分。一些先进的 药物制品也具有“靶向成分”,如抗体,它可协助将效应物成分更有效 地传递到靶位点。依据所需要的作用,效应物成分可具有多种作用模式 中的任何一种。例如,它可以恢复或增强细胞的正常功能,它可消除或 抑制细胞不正常的功能,或者它可改变细胞的表型。或者它可使具有病 理学特征的细胞,如被病毒感染的细胞被杀死或变成休眠状态。以后的 章节中会提供效应物成分的例子。

“细胞系”或“细胞培养物”表示在体外生长或维持的较高级的真 核生物的细胞。应理解细胞的后代与母细胞不完全相同(无论是形态学, 基因型还是表型)。

“宿主细胞”是通过施用外源多核苷酸已经被转化,或者能够被转 化的细胞。“宿主细胞”包括原始转化子的后代。

“遗传改变”指的是不通过自然的细胞分裂而使遗传因子导入细胞 的过程。所述遗传因子对于细胞而言可以是异源的,它也可以是细胞中 已存在的遗传因子的多余的拷贝或改良的形式。通过例如本领域中已知 的任何方法用重组质粒或其它多核苷酸转染细胞,所述方法如电穿孔, 磷酸沉淀,与多核苷酸-脂质体复合物接触,或者通过用DNA或RNA 病毒或病毒载体转导或感染能够实现遗传改变。这种改变优选、但并不 必需由经改变细胞的后代遗传下去。

“个体”指的是脊椎动物,特别是哺乳动物种的成员,它包括但不 限于家养动物,野生动物和包括人的灵长类动物。

本文所用的术语“灵长类动物”指的是哺乳动物中进化地位最高的 任何成员。它们包括(但不限于)原猴类,如狐猴和懒猴;跗猴类,如 跗猴;新世界猴,如松鼠猴(Saimiri sciureus)和 ;旧世界猴, 如猕猴(包括豚尾猴,食蟹猴,和日本猴);长臂猿类,如长臂猿和合 趾猴;猩猩类,如马来猩猩,大猩猩,和黑猩猩;和包括人的人科动物。

由疱疹病毒感染引起的“病理学”是损害宿主健康或正常生理学的 一切事情。它可包括(但不限于)病毒破坏性地侵入先前未被感染的细 胞,病毒在损害细胞正常代谢的情况下复制,病毒产生毒素或其它非天 然的分子,细胞或细胞间结构的不规则生长(包括纤维变性),被感染 细胞的不寻常或受抑制的生物活性,恶性转化,干扰邻近细胞的正常功 能,炎症或免疫反应的加重或抑制,对其它病原生物体和疾病的易感性 增加。

对个体或细胞的“治疗”是试图改变个体或细胞的自然进程的任何 形式的介入。例如,进行对个体的治疗可以降低或限制由感染个体的疱 疹病毒引起的病理学。治疗包括(但不限于)施用如药物组合物的组合 物,可以在病理事件开始或与病原因子接触之后预防性地,也可以治疗 性地进行。

应理解临床或生物“样品”包含得自受试者并可用于体外步骤,如 诊断试验的各种样品类型。此定义包含以外科手术切除的方式得到的固 体组织样品,病理学样本,或活体解剖样本,从中得到的组织培养物或 细胞及其后代,从这些来源中的任一个制备的切片或涂片。非限制性的 例子是得自被感染的部位,纤维化的部位,未受影响的部位和肿瘤的样 品。此定义也包含血液,脊髓液和生物来源的其它液体样品,也可以指 其中悬浮的细胞或细胞片段,或指液体介质及其溶质。此定义也包括已 经被溶解或已经富集了某些成分,如DNA,RNA,蛋白质或抗体的样品。

本文所述的寡核苷酸引物和探针已经按下述被命名:名称的第一部 分是它们所根据的多肽保守区部分的单个氨基酸密码子,通常为4个残 基长。紧随其后的是字母A或B,分别表示寡核苷酸与DNA编码区的有 义或反义链互补。用于测序和标记反应的次级共有寡核苷酸在名称末端 具有字母SQ。

一般技术

除非另有说明,本发明的操作将使用本技术领域中熟知的分子生物 学,微生物学,重组DNA和免疫学的常规技术。这类技术在文献中有全 面的解释,例见“Molecular Cloning:A laboratory Manual”,第 二版(Sambrook,Fritsch & Maniatis,1989),“Oligonucleotide Synthesis”(M.J.Gait,编,1984),“Animal Cell Culture”(R. I.Freshney,编,1987);系列“Methods in Enzymology”(Academic Press,Inc.);“Handbook of Experimental Immunology”(D.M.Weir & C.C.Blackwell,编),“Gene Transfer Vectors for Mammalian Cells”(J.M.Miller & M.P.Calos,编,1987),“Current Protocols in Molecular Biology”(F.M.Ausubel等,编,1987);和“Current Protocols in Immunology”(J.E.Coligan等,编,1991)。

上文和下文提到的所有专利,专利申请,文章和出版物都已列入本 文参考文献。

编码疱疹病毒RFHV/KSHV亚族糖蛋白B的多核苷酸

本发明包括衍生自疱疹病毒中存在的糖蛋白B基因的分离的多核苷 酸区段,所述多核苷酸区段编码糖蛋白B多肽的片段。多核苷酸与疱疹 病毒RFHV/KSHV亚族有关。列举的多核苷酸编码RFHV或KSHV的糖蛋白 B片段。优选的片段包括那些按下文实施例所述得到的示于图1的片断 及其亚片断。特别优选的多核苷酸含有SEQ.ID NO:1,SEQ.ID NO: 3,或SEQ.ID NO:96的残基36和354之间的序列,或SEQ.ID NO: 92中所含的多核苷酸。

RFHV和KSHV的残基36和354之间的多核苷酸区段76%相同,共 用残基在图1中由“*”表示,此区段内RFHV和KSHV之间共用的最长 亚区的长度为15,17和20个核苷酸。

相对于它们中的任一个与以前已经测序的任何疱疹病毒的相应区段 相比,RFHV和KSHV在扩增引物结合位点之间的319个碱基对的片段相 互之间更加一致。下一个最密切相关的序列是sHV1和bHV4的有关序列, 所述序列与KSHV的相应序列63%相同,与RFHV的相应序列60%相同。 糖蛋白B片断和先前已测序的任何病毒之间共用的最长数目的连串碱基 是14。据信RFHV或KSHV序列16个碱基对或更长的任何亚片段对于 RFHV/KSHV亚族而言,或者对于此亚族内特定的疱疹病毒种和变体而言 是独特的。

本发明包括RFHV/KSHY亚族的糖蛋白B基因中所含的亚片段,优选 包含对应于SEQ.ID NO:1,SEQ.ID NO:3,或SEQ.ID NO:96的残 基36和354之间,或SEQ.ID N0:92中的任何位置处的319个碱基对 的区域。优选亚片段至少约16个核苷酸长;更优选它们至少长为18个 核苷酸;更优选它们至少长为21个核苷酸;更优选它们至少长约为25 个核苷酸;更优选它们至少长约35个核苷酸;再更优选它们至少长约50 个核苷酸;更加优选它们至少长约75个核苷酸,甚至更优选它们为100 个核苷酸长或更长。本发明中还包括含有每种独自的疱疹病毒糖蛋白B 的整个开放阅读框的多核苷酸。

相对于RFHV或KSHV与表1所列的任何其它病毒的比较而言,组成 RFHV/KSHV亚族的成员所具有的序列与RFHV或KSHV的相应序列更加一 致。根据图1相应区域中糖蛋白B基因的序列可鉴定出此家族中优选的 成员。表2提供了此区域内序列同一性的程度:            表2:KSHV和其它疱疹病毒的糖蛋白B之间的序列同一性 糖蛋白B序列   SEQ.ID NO:         与多核苷酸片断的同一性   RFHV(SEQ.ID NO:1)     碱基 36-354  KSHV(SEQ.ID NO:3)    碱基 36-354            RFHV    1 RFHV/KSHV 亚族            KSHV    3       (100%)        76%        76%      (100%) 其它γ疱疹 sHV1    5 病毒       bHV4    6            eHV2    7            mHV68   8            hEBV    9        60%        60%        52%        56%       <50%        63%        63%        54%        54%        52% α和β疱疹 hCMV    10 病毒       hHV6    11            hVZV    12            HSV1    13       <50%       <50%       <50%       <50%       <50%       <50%       <50%       <50%

通过首先排列被编码的氨基酸序列,进行编码多核苷酸的相应对 比,然后计算所比较的序列之间每个排列位置处共用的残基数目即可计 算出序列同一性的百分比。插入或缺失的存在不会产生不利的后果,但 是只有在被排列的序列之一中需要容纳数目明显增加的氨基酸残基的地 方才允许插入或缺失。无论在多肽水平上还是在多核苷酸水平上都不允 许仅为了改善序列排列的补偿性插入。因此,多核苷酸序列中的任何插 入的长度均为3的倍数。给出了受试序列中与比较或参照序列中的残基 相同的残基的百分比。

本发明优选的编码糖蛋白B的多核苷酸序列是那些衍生自 RFHV/KSHV疱疹病毒亚族的序列。它们包括那些与RFHV或KSHV序列的 碱基36和354之间至少65%相同的序列;更优选序列至少67%相同; 更优选序列至少约70%相同;更优选序列至少约75%相同;更优选序 列至少约80%相同;更优选序列至少约85%相同;更优选序列至少约90 %相同;甚至更优选序列95%以上相同。也包括位于能满足所述同一性 标准之区域的上游或下游的糖蛋白B编码区域。

下一章节将更详细地描述,通过与RFHV/KSHV亚族特异性的寡核苷 酸(Type2寡核苷酸)相比之下的同一性百分比可鉴定出其它优选的编 码糖蛋白B的多核苷酸序列。RFHV和KSHV糖蛋白B与Type2寡核苷酸 实例之间的同一性百分比示于表3:              表3:选定疱疹病毒的糖蛋白B和RFHV/KSHV亚族                   特异性的寡核苷酸之间的序列同一性 糖蛋白B  序列 SEQ.ID  NO: 与SHMDA的   同一性   (SEQ. IDNO:41) 与CFSSB的   同一性   (SEQ. IDNO:43)  与ENTFA的  同一性(SEQ.  ID NO:45) 与DNIQB的同一 性(SEQ.IDNO:       46)  RFHV           1  KSHV           3    91%    100%    91%    85%      89%      89%       91%       97%  sHVl           5  bHV4           6  eHV2           7  mHV68          8  hEBV           9    71%    57%    57%    <50%    57%    70%    64%    61%    55%    55%      66%      69%      54%      54%      60%       66%       74%       60%       77%       51%  hCMV           10  hHV6           11  hVZV           12  hSV1           13    57%    <50%    54%    57%    55%    52%    58%    60%      60%      60%      66%      54%       51%       57%       57%       54%

为了序列排列的目的,可通过不允许寡核苷酸或多肽中有缺口计算 出这一长度的寡核苷酸的同一性百分率。在本发明的所有内容中,每当 被比较的两个序列中至少有一个是含有多义残基的简并寡核苷酸时,如 果简并寡核苷酸的至少一个可替换形式与与之相比较的序列相同,则这 两个序列相同。例如,由于AYAAA是ATAAA和ACAAA的混合物,所以AYAAA 与ATAAA 100%相同。

优选的糖蛋白B编码序列是那些所覆盖的相应区域与SHMDA至少约 72%相同的序列;更优选它们至少约74%相同;更优选它们至少约77% 相同;更优选它们至少约80%相同;更优选它们至少85%相同,更加 优选它们至少约91%相同。其它优选的糖蛋白B编码序列是那些所覆盖 的相应区域与CFSSB至少约71%相同的序列;更优选它们至少约73% 相同;更优选它们至少约77%相同;更优选它们至少约80%相同;更优 选它们至少约85%相同。其它优选的糖蛋白B编码序列是那些所覆盖的 相应区域与ENTFA至少约70%相同的序列,更优选它们至少约72%相 同;更优选它们至少约75%相同;更优选它们至少约80%相同;更优选 它们至少约85%相同,甚至更优选它们至少89%相同。其它优选的糖蛋 白B编码序列是那些所覆盖的相应区域与DNIQB至少约78%相同的序 列;更优选它们至少约80%相同;更优选它们至少约85%相同;更优 选它们至少约91%相同。也包括位于能满足所述同一性标准之区域的上 游或下游的糖蛋白B编码区。

通过使用RFHV或KSHV序列,或者亚族特异性寡核苷酸的前述序列 比较中的任一种鉴定出的RFHV/KSHV亚族成员的糖蛋白B编码序列同样 是优选的。例举的序列是RFHV和KSHV的糖蛋白B编码序列。本发明中 还包括亚族的任何糖蛋白B编码序列的片段,和含有这种多核苷酸片段 的较长的多核苷酸。

本章节描述的多核苷酸序列提供了得到以后章节中概述的合成的寡 核苷酸,蛋白质和抗体的基础。使用本领域普通技术人员已知的一般性 技术可制备这些化合物,如下文所述,所述化合物可用于各种研究,诊 断和治疗目的。

多核苷酸的制备

可通过本领域中已知的任何适当的方法制备本发明的多核苷酸和寡 核苷酸。例如,如下文实施例3和实施例11所述,在PCR扩增得自被 疱疹病毒感染之组织的DNA时,可以使用寡核苷酸引物。或者如下文实 施例8所述,可以使用寡核苷酸鉴定DNA文库中适当的细菌克隆。

也可以通过化学合成由本文提供的序列出发直接制备多核苷酸。本 领域中已知几种合成方法,包括三酯法和亚磷酸酯法。在优选的方法中, 通过使用单核苷氨基亚磷酸酯偶联单位的固相合成法制备多核苷酸,例 见Horise等,Beaucage等,Kumar等,和U.S.专利号4,415,732。

典型的固相合成包括重复进行的四个步骤:脱保护,偶联,加帽和 氧化。这可以导致在3′至5′方向上逐步合成寡核苷酸。

在第一步中,其3′末端通过(-O-)基团与固相支持物结合的逐渐 增长的寡核苷酸在其5′末端脱保护。例如,通过-ODMT基团可以保护5′ 末端,所述-ODMT基团是通过与吡啶中的4,4′-二甲氧基三苯甲基氯 (DMT-Cl)反应而形成的。此基团在碱性条件下是稳定的,但是在酸性条件 下容易被除去,例如在二氯乙酸(DCA)或三氯乙酸(TCA)的存在下易 被除去。脱保护提供了5′-OH反应基团。

在第二步中,寡核苷酸与所需的核苷酸单体反应,所述单体自身已 先转变成5′-保护的3′-氨基亚磷酸酯。单体的5′-OH可以例如-ODMT 基团的形式被保护,3′-OH基团可以转变成氨基亚磷酸酯,例如 -OP(OR′)NR2;其中R是异丙基-CH(CH3)2;R′是例如-H(产生氨基亚磷酸 酯二酯),或-CH3,-CH2CH3,或β氰乙基-CH2CH2CN(产生氨基亚磷酸 酯三酯)。单体的3′-氨基亚磷酸酯基团与逐渐增长的寡核苷酸的5′-OH基团反应可产生亚磷酸酯连键5′-OP(OR′)O-3′。

在第三步中,未与单体偶联的寡核苷酸退出进一步合成以防止不完 全聚合物的形成。通过与乙酸酐(CH3C(O)-O-C(O)CH3)反应,以乙酸酯 (-OC(O)CH3)的形式给保持原状的5′-OH基团加帽可以做到这一点。

在第四步中,新形成的亚磷酸酯基团(即5′-OP(OR′)O-3′)被氧化 成磷酸酯基团(即5′-OP(=O)(OR′)O-3′);例如可通过与含水的碘和吡 啶反应做到这一点。

由于在所述方法最后得到的寡核苷酸的5′端得到保护,并可用于第 一步中,因此可重复进行四步法。当已得到合乎要求的全长寡核苷酸时, 可通过例如碱和热处理从固相支持物上将它裂解下来。此步骤也可用于 将磷酸三酯(即当R′不是-H时)转变成磷酸二酯(-OP(=O)2O-),并 使核苷酸碱基的碱基-不稳定地被保护的氨基基团脱保护。

可以通过任何一般性技术,如PCR扩增或基因克隆来复制通过这些 方法中的任一种而制备的多核苷酸,以提供较丰富的多核苷酸来源。

含有编码糖蛋白B之多核苷酸的克隆和表达载体

本发明中提供的克隆载体和表达载体含有编码疱疹病毒糖蛋白B的 序列或其变异体或其片段。可根据标准技术构建适当的克隆载体,或者 也可从本领域中适用的大量克隆载体中选择。尽管根据欲被使用的宿主 细胞而选择的克隆载体会有所不同,但有用的克隆载体一般应具有自我 复制的能力,对于特定的限制性核酸内切酶具有单个作用位点,并携有 能用于选择被转染之克隆的标记物的基因。适当的例子包括质粒和细菌 的病毒;如pUC 18,mp 18,mp 19,pBR 322,pMB 9,ColE 1,pCR 1, RP 4,噬菌体DNA和如pSA 3和pAT 28的穿梭载体。

表达载体通常为与适当的转录和翻译调控元件有效连接的编码多肽 的可复制多核苷酸构建体。转录调控元件的例子是启动子,增强子,转 录起始位点和转录终止位点。翻译调控元件的例子是核糖体结合位点, 翻译起始位点和终止密码子。也可包括蛋白质加工元件:例如编码前导 或信号肽以及将多肽跨膜转运或从细胞中分泌出来所需的蛋白酶裂解位 点的区域。所用元件在用于表达的宿主细胞中可能是功能性的。调控元 件可以得自与载体中所用相同的糖蛋白B基因,或者它们也可以是异源 的(即衍生自其它基因和/或其它生物体)。

可以通过本领域中任何已知方法将多核苷酸插入宿主细胞。适当的 宿主细胞包括如大肠杆菌,分枝杆菌的细菌细胞,其它原核微生物和真 核细胞(包括真菌细胞,昆虫细胞,植物细胞和动物细胞)。通过直接 摄入,胞吞作用,转染,f-交配或电穿孔插入外源多核苷酸可以转化 细胞。随后,外源多核苷酸在细胞内以未-整合的载体,如质粒的形式 被维持,或者也可以被整合到宿主细胞基因组中。

克隆载体可被用于得到它们所含的多核苷酸的复制拷贝,或者作为 将多核苷酸贮存到仓库中以供将来回收的工具。表达载体和宿主细胞可 被用于得到由它们所含的多核苷酸转录的多肽。它们也可以用于如药物 筛选试验的试验中,其中具有能合成多肽的完整细胞才合乎需要。

γ疱疹病毒糖蛋白B的合成的Type1寡核苷酸

本发明中包括的由疱疹病毒糖蛋白B序列设计的寡核苷酸可被用作 鉴定相关序列的探针,或者在如PCR的扩增反应中用作引物。

在以下章节中描述了具有不同特性的不同寡核苷酸。被称作Type 1 的寡核苷酸是从先前已知的γ疱疹病毒糖蛋白B多核苷酸序列中被设计 出的。它们被设计成能与编码任何γ疱疹病毒糖蛋白B的多核苷酸杂交, 并可用于检测先前已知的γ疱疹病毒种。它们也可用于检测和鉴定γ疱 疹病毒新种。被称作Type 2的寡核苷酸是从RFHV和KSHV糖蛋白B多 核苷酸序列这两者中被设计出的,它们被设计成能与RFHV/KSHV亚族(包 括但不限于RFHV和KSHV)的编码糖蛋白B的多核苷酸杂交。被称作Type 3的寡核苷酸是从RFHV或KSHV糖蛋白序列中被设计出的,所述序列对 于各个病毒而言是相对独特的,这类寡核苷酸被设计成只能与RFHV或 KSHV和密切相关的病毒株的编码糖蛋白B的多核苷酸特异性杂交。

一些优选的Type 1寡核苷酸的例子列于表4,这些寡核苷酸对于 广范围疱疹病毒的编码糖蛋白B的多核苷酸具有特异性。                表4:用于检测、扩增或鉴定疱疹病毒编码糖蛋白B                          的多核苷酸的Type 1寡核苷酸              靶:疱疹病毒,尤其是γ疱疹病毒的糖蛋白B    名称         序列(5′至3′)   长度   类型   数目  方向  SEQ  ID:    FRFDA  GCTGTTCAGATTTGACTTAGAYMANM  CNTGYCC    33    256    有义  13    NIVPA   NIVPASQ  GTGTACAAGAAGAACATCGTGCCNTA  YATNTTYAA  GTGTACAAGAAGAACATCGTGCC    32    23     64     1  有义  14  15    TVNCB   TVNCBSQ  AACATGTCTACAATCTCACARTTNAC  NGTNGT  AACATGTCTACAATCTCACA    32    20    128     1  反义  16  17    FAYDA  AATAACCTCTTTACGGCCCAAATTCA  RTWYGCNTAYGA    38     64  有义  18    IYGKA   IYGKASQ  CCAACGAGTGTGATGTCAGCCATTTA  YGGNAARCCNGT  CCAACGAGTGTGATGTCAGCC    38    21     64     1  有义  19  20    CYSRA   CYSRASQ  TGCTACTCGCGACCTCTAGTCACCTT  YAARTTYRTNAA  TGCTACTCGCGACCTCTAGTCACC    38    24     64     1  有义  21  22    NIDFB   NIDFBSQ  ACCGGAGTACAGTTCCACTGTYTTRA  ARTCDATRTT  TGTCACCTTGACATGAGGCCA    36    21     48     1  反义  23  24    FREYA  TTTGACCTGGAGACTATGTTYMGNGA  RTAYAA    32     64  有义  25    FREYB  GCTCTGGGTGTAGTAGTTRTAYTCYC  TRAACAT    33     16  反义  26    NVFDB  TCTCGGAACATGCTCTCCAGRTCRAA  MACRTT    32     32  反义  27    GGMA  ACCTTCATCAAAAATCCCTTNGGNGG  NATGYT    32    128  有义  28    TVNCA  TGGACTTACAGGACTCGAACNACNGT  NAAYTG    32    128  有义  29

表4所示方向是相对于多核苷酸的编码区。“有义”方向的寡聚体 与编码链的反义链杂交并以编码序列的方向起动扩增。“反义”方向的 寡聚体与编码链杂交并以与编码序列相反的方向起动扩增。

这些寡核苷酸已被设计成具有几个希望有的特性:1)即使当来源 材料中存在的靶DNA拷贝数很低时,对靶DNA仍有敏感性;2)有足够 的特异性以避免与不需要的序列,如具有有限的类似性的宿主序列杂 交;3)有足够的交叉反应性以使未知靶和用于设计它的序列之间的差 异不会阻止寡核苷酸与靶形成稳定的双螺旋。

对于一些应用而言,特别有效的设计是在3′末端具有简并区段的寡 核苷酸,所述寡核苷酸是从至少2个据信在某种程度上与多核苷酸靶有 保守部分的已知多核苷酸的区域设计成的。多义残基的各种变换有助于 确保寡核苷酸的至少一个可替换的形式能与靶杂交。在寡核苷酸的5′末 端与简并区段邻接的是加强任何可能形成的双螺旋或允许在较高温度下 进行杂交或扩增反应的共有区段。简并区段位于分子的3′末端以增加寡 核苷酸和靶之间在聚合酶链反应过程中延伸开始的位点处紧密匹配的可 能性。

根据下列密码子表示序列简并部分中的多义残基:    表5:多义位置的单字母密码子    密码子       代表物      R      Y      W      S      M      K      B      D      H      V      N     A或G(嘌呤)     C或T(嘧啶)       A或T       C或G       A或C       G或T    C或G或T(非A)    A或G或T(非C)    A或C或T(非G)    A或C或G(非T)     A或C或G或T

表4所示的Type 1寡核苷酸通常用于与编码糖蛋白B的多核苷酸 区段杂交。可以进行这种杂交以检测多核苷酸的存在,或者引发扩增反 应以使多核苷酸可以被进一步鉴定。适当的靶包括编码广谱γ疱疹病毒 糖蛋白B区域的多核苷酸,所述病毒包括RFHV/KSHV亚族中的成员。适 当的病毒是那些感染任何脊椎动物,包括人和非人灵长类动物的病毒, 不论糖蛋白B或病毒是否已知或已经被描述。非限制性的例子包括编码 表1所列任何γ疱疹病毒的糖蛋白B的多核苷酸。

寡核苷酸可以特别地用于引发从寡核苷酸杂交的位点起向3′方向扩 增靶多核苷酸区域的反应。FRFDA,HIVPA,TVNCB,FAYDA,IYGKA,CYSRA, NIDFB,FREYA,FREYB,NVFDB,GGMA,和TVNCA是在邻近简并区段处具 有共有区段的寡核苷酸,可以用于此目的。

图2显示了RFHV/KSHV亚族的整个糖蛋白B多核苷酸序列上前述寡 核苷酸引物有望杂交的位置。此图没有按比例绘制,但准确地显示出了 沿着糖蛋白B编码链的5’-3’方向上的推测的杂交位点的顺序。此图 还显示出了通过在扩增反应中使用多套引物而产生的扩增产物的大致长 度。所示长度包括每个末端的引物结合位点,和它们之间包含的多核苷 酸。

用作表4寡核苷酸的靶的优选DNA来源是任何生物样品(包括固形 组织和组织培养物),特别是已知或怀疑携带疱疹病毒的脊椎动物来源 的样品。通过本领域中已知的任何方法,包括用有机溶剂提取或在高盐 浓度下沉淀可从样品来源中提取DNA。

优选的扩增方法是聚合酶链反应:一般可参见美国专利号4,683,195 (Mullis)和4,683,202(Mullis等人);对于病毒多核苷酸的应用参 见美国专利5,176,995(Sninsky等人)。通过将欲被扩增的靶多核苷 酸与能同靶杂交的短寡核苷酸合并,并用作聚合反应的引物即可进行扩 增反应。还需加入底物单核苷酸和热稳定性的依赖于DNA的糖蛋白B, 如Taq。用于扩增反应的条件一般为本领域中已知的条件,使用已知病 毒源,如RFHV,KSHV,hEBV或HSV1凭经验可使条件最优化。条件也可 以改变,例如可改变扩增循环,尤其是杂交时相的时间和温度;改变寡 核苷酸引物的重量摩尔成分;改变缓冲液浓度;改变扩增循环的数目。 细微调节扩增的条件对于本领域技术人员而言是常规技术。

在一个方法中,扩增中使用了本发明的单个引物,可选择使用第二 个引物,如随机引物以起动相反方向上的第一引物下游的复制。在优选 的方法中,相同反应中至少使用了两个本发明的引物以起动相反方向上 的复制。至少两个特异性引物的使用增强了扩增反应的特异性,并限定 了样品之间比较片段的大小。例如,使用引物NIVPA和TVNCB可以进行 扩增。更优选以嵌套方式使用几套引物以增强扩增。通过使用产生中间 体产物的引物进行首次扩增可实现嵌套,所述引物含有另一个引物的一 个或多个内部结合位点。接着使用与上述套中的一个引物联合的新引 物,或两个新引物进行第二次扩增,因此第二次扩增的产物是第一次产 物的亚片断。如有必要,可使用另一个引物进行另一轮扩增。

因此,使用三个或更多个寡核苷酸引物的任何组合可进行嵌套扩增 反应,所述引物组合中含有至少一个有义方向上的引物和一个反义方向 上的引物。优选选定的引物能使中间体扩增产物不超过约2000个碱基 对;更优选它们不超过约1500个碱基对;甚至更优选它们不超过约750 个碱基对。优选最靠内的引物提供的最终扩增产物不超过约1200个碱 基对;更优选它们不超过约750个碱基对;甚至更优选它们不超过约500 个碱基对。因此,优选的组合是选自FAYDA,IYGKA,CYSRA,NIDFB,NVFDB, 和FREYB的至少三个引物。另一个优选的组合是选自FRFDA,NIVPA, TVNCA,NIDFB,NVFDB和FREYB的至少三个引物。

特别优选使用引物FRFDA和TVNCB第一次扩增,再使用引物NIVPA 和TVNCB第二次扩增。当对KSHV的糖蛋白B基因的多核苷酸进行扩增 时,包括引物结合区域的最终片断的大小约为386个碱基。

在扩增反应的任何阶段,通过例如大小测定即可鉴定出经扩增的多 核苷酸。优选通过在约1-2%的琼脂糖凝胶上电泳多核苷酸来进行鉴 定。如果凝胶中的多核苷酸以充足的量存在,即可用溴化乙锭染色并在 紫外光下检测。或者也可以在上样到约6%的聚丙烯酰胺凝胶之前,用 如32P或35S的放射性同位素标记多核苷酸,随后可利用凝胶产生放射自 显影图。优选的标记经扩增之多核苷酸的方法是使用多核苷酸激酶和γ -[32P]-ATP,连续扩增约5-15个循环以用32P末端标记如NIVPA的 寡核苷酸引物。

如果需要,在制备经扩增的多核苷酸时也可将大小分离用作一个步 骤。当发现扩增混合物含有不同大小的假象多核苷酸,如可能是由于与 不需要的靶的交叉反应性而引起这一现象时,所述方法特别有用。如上 一段落中描述的分离的凝胶被放在其背后的纸上晾干并用于产生放射自 显影图。切下凝胶中对应于放射自显影图上所需带的位置,并通过标准 技术提取。提取出的多核苷酸能被直接鉴定,克隆或用于下一个扩增循 环。

寡核苷酸NIVPASQ,TVNCBSQ,IYGKASQ,CYSRASQ,和NIDFBSQ中 的每一种都得自共有-简并的Type1寡核苷酸,它们保留了共有区段, 但缺乏简并区段。它们对于测定使用共有-简并寡核苷酸成功扩增的糖 蛋白B多核苷酸片断的序列特别有用。

通过采用这种类型的引物也可以降低扩增反应混合物中不需要的多 核苷酸的比例。例如,使用1/5至1/25正常量的引物NIVPA和TVNCB 进行最初的3-5个循环扩增,然后加入摩尔过量(例如50pmol)的 NIVPASQ和/或TVNCBSQ,再继续扩增30-35个循环。这可以降低扩增 混合物中存在的寡核苷酸的复杂度,并允许反应温度增高以减少不需要 的多核苷酸的扩增。

RFHV/KSHV亚族糖蛋白B的Type2型寡核苷酸引物

Type2寡核苷酸用于RFHV/KSHV亚族任何病毒的糖蛋白B的检测或 扩增反应。它们是由RFHV和KSHV,而不是其它先前已测序的γ疱疹病 毒之间相对很保守的糖蛋白B编码区的区段设计成的。优选的例子示于 表6:              表6:用于检测,扩增,或鉴定编码疱疹病毒糖蛋白B                        的多核苷酸的Type 2型寡核苷酸                     靶:疱疹病毒RFHV/KSHV亚族的糖蛋白B    名称      序列(5′至3′)   长度   类型   数目    方向    SEQ    ID:    SHMDA   SHMDASQ  AGACCCGTGCCACTCTATGARATHA  GYCAYATGGA  AGACCCGTGCCACTCTATGA    35    20    24     1    有义    41    42    CFSSB   CFSSBSQ  GTTCACAACAATCTTCATNGARCTR  AARCA  GTTCACAACAATCTTCAT    30    18    32     1    反义    43    44    ENTFA  GTCAACGGAGTAGARAAYACNTTYA  CNGA    29   128    有义    45    DNIQB   DNIQBSQ  ACTGGCTGGCTAAAGTACCTTTGAA  TRTTRTCNGT  ACTGGCTGGCTAAAGTACCTTTG    35    23    16     1    反义    46    47

Type2寡核苷酸可用于需要RFHV/KSHV亚族特异性的多种目的,包 括检测或扩增得自已知的RFHV/KSHV亚族病毒的糖蛋白B,或鉴定此亚 族新成员的糖蛋白B。

SHMDA,CFSSB,ENTFA和DNIQB是具有简并的3′末端的共有-简并 寡核苷酸,可用作PCR扩增的最初的引物,它们包括与RFHV或KSHV中 的任一个都不相同的RFHV/KSHV亚族的多核苷酸。SHMDASQ,CFSSBSQ 和DNIQBSQ仅含有共有区段,例如可用于标记使用共有-简并寡核苷酸 已经扩增的多核苷酸,或测定所述多核苷酸的序列。

在一个应用中,可单个使用或者组合使用这些Type 2寡核苷酸作 为扩增引物。在此应用的一个实施例中,对得自组织样品中的DNA直接 使用寡核苷酸以得到衍生自RFHV/KSHV亚族,而不是存在于相同组织中 的如hEBV,hCMV或HSV1的更不相关之病毒的糖蛋白B。因此,SHMDA 和DNIQB可用作PCR中的引物,任选使用如NIVPA和TVNCB的Type1寡 核苷酸预扩增所述引物。其它组合也适用。在另一个实施例中,将表6 的Type2寡核苷酸中的一个与前文所列的适当的Type1寡核苷酸联合使 用。因此,NIVPA可以与DNIQB联合,或SHMDA可以与TVNCB联合以用 作PCR引物。可任选使用NIVPA和TVNCB预扩增DNA源。其它组合也适 用。

在另一个应用中,Type 2寡核苷酸,或含有这些序列的寡核苷酸或 其片段被用作检测试验中的探针。例如,它们可被提供成具有适当的标 记物,如32p,然后用于具有适当靶,如使用FRFDA和/或NIVPA,和TVNCB 一起扩增的DNA的杂交试验中。

RFHV或KSHV糖蛋白B特异性的Type3寡核苷酸引物

Type3寡核苷酸用于特殊病毒特异性的检测或扩增反应,它们是 RFHV或KSHV糖蛋白B编码区的非简并区段,相对于此区域的其它区段 而言,此区段在这两个病毒之间比其它疱疹病毒相对更易变。优选的例 子示于表7和实施例部分:            表7:用于检测,扩增,或鉴定编码疱疹病毒糖蛋白B                        的多核苷酸的Type3型寡核苷酸                           靶:RFHV的糖蛋白B   名称     序列(5′至3′)   长度  类型  数目  方向   SEQ   ID:   GMTEB   AAITB  TGCTGCTTCTGTCATACCGCG  TATTTGTTTGTGATTGCTGCT     21     21    1    1  反义  反义    48    49   GMTEA   KYEIA   TDRDB   VEGLB  GCGGTATGACAGAAGCAGCAA  AACAAATATGAGATCCCCAGG  TCATCCCGATCGGTGAACGTA  TTGTCAGTTAGACCTTCGACG     21     21     21     21    1    1    1    1  有义  有义  反义  反义    50    51    52    53   VEGLA   PVLYA  CCCGTCGAAGGTCTAACTGAC  AGCCAACCAGTACTGTACTCT     21     21    1    1  有义  有义    54    55                          靶:KSHV的糖蛋白B   名称     序列(5′至3′)   长度  类型  数目  方向   SEQ   ID:   GLTEB   TNKYB  TGATGGCGGACTCTGTCAAGC  GTTCATACTTGTTGGTGATGG     21     21    1    1  反义  反义    56    57   GLTEA   YELPA   VNVNB   TFTDV  GGGCTTGACAGAGTCCGCCAT  ACAAGTATGAACTCCCGAGAC  ACCCCGTTGACATTTACCTTC  TCGTCTCTGTCAGTAAATGTG     21     21     21     21    1    1    1    1  有义  有义  反义  反义    58    59    60    61   TVFLA   SQPVA  CCACAGTATTCCTCCAACCAG  GGTACTTTAGCCAGCCGGTCA     21     21    1    1  有义  有义    62    63  

GMTEB,AAITB,GMTEA,KYEIA,TDRDB,VEGLB,VEGLA和PVLYA是 RFHV糖蛋白B的特异性非简并寡核苷酸,可用于扩增或检测RFHV来源 的编码糖蛋白B的多核苷酸。优选使用嵌套形式的寡核苷酸进行扩增: 例如使用GMTEA和VEGLB作为引物进行首次扩增;然后使用KYEIA和 TDRDB作为引物进行第二次扩增。这可以提供特异于RFHV糖蛋白B的极 度敏感的扩增试验。GMTEB和AAITB在片断的5’末端附近杂交,并可与 在上游杂交的Type1寡核苷酸联合使用以扩增或检测5’方向上的序列。 VEGLA和PVLYA在片断的3’末端附近杂交,可与在下游杂交的Type1寡 核苷酸联合使用以扩增或检测3’方向上的序列。

类似地,GLTEB,TNKYB,GLTEA,YELPA,VNVNB,ENTFB,SQPVA和 TVFLA是KSHV糖蛋白B的特异性非简并寡核苷酸,可以类似的方式被使 用,包括作为扩增反应的引物。优选使用嵌套形式的寡核苷酸进行扩增: 例如使用GLTEA和ENTFB作为引物进行首次扩增;然后使用YELPA和 VNVNB作为引物进行第二次扩增。这可以提供特异于KSHV糖蛋白B的极 度敏感的扩增试验。GLTEB和TNKYB在片断的5’末端附近杂交,可与在 上游杂交的Type1寡核苷酸联合使用以扩增或检测5’方向上的序列。 SQPVA和TVFLA在片断的3’末端附近杂交,可与在下游杂交的Type1寡 核苷酸联合使用以扩增或检测3’方向上的序列。

本领域技术人员会很快认识到Type 1,2和3寡核苷酸(尤其是那 些表4,6和7中所示的)可以互相联合用于PCR以扩增编码糖蛋白B 之多核苷酸的不同部分。扩增反应的特异性一般由具有最少量交叉反应 性的引物决定。扩增片段的大小和位置由扩增的最后一次循环所用的引 物决定。例如,NIVPA与SQPVB联合使用会扩增约310个碱基的编码与 KSHV密切相关之病毒的糖蛋白B的多核苷酸。寡核苷酸的适当联合可被 用作嵌套形式的扩增引物。

使用合成的寡核苷酸鉴定多核苷酸靶

如前面章节所述,本发明中包含的寡核苷酸可被用作引物以扩增编 码疱疹病毒糖蛋白B的多核苷酸,尤其在聚合酶链反应中更是如此。

进行PCR的条件取决于所使用寡核苷酸的特性。具体地说,当所用 寡核苷酸含有的简并区段或共有区段与靶的相应区段只部分相同时,和 当靶多核苷酸含有未知序列时,条件的选择对于扩增的成功会很重要。 对于新引物或新多核苷酸靶的条件的最优化是本领域技术人员的常规技 术。下文是有助于此目的的指导性方案。

首先,使PCR退火步骤的温度最优化以增加被扩增的靶多核苷酸的 量,使之大于被扩增的不相关多核苷酸的量。理想状态下,所述温度允 许引物与靶序列杂交,而不与其它序列杂交。对于含有共有区段的引物 (Type1型)而言,PCR重复循环中退火步骤的温度一般至少约为45℃; 优选至少约50℃。优选首先在如55或甚至60℃的较高温度下进行几轮 PCR循环。较高的温度可以在循环过程中强使退火更具有序列特异性, 并可降低不相关序列的背景扩增。可以在较不严紧的条件下进行随后循 环的退火步骤以提高扩增率。在特别优选的方法中,最初的PCR扩增循 环含有在60℃下进行约1分钟的退火步骤。在每个循环的温度递减2℃ 的条件下进行随后的循环中的退火步骤,直至温度达到50℃。然后进行 退火温度为50℃的后续循环,直至达到所需程度的扩增。

病毒特异性并不含共有区段的引物更具选择性,可在较宽的温度范 围内有效。PCR扩增循环中退火步骤的优选温度介于50℃到65℃之间。

第二,使缓冲液条件最优化。我们已发现由Taq聚合酶的商购制品 提供的缓冲液有时难以使用,这部分是由于对镁离子浓度的严格的依赖 性。使用如M.Wigler(Lisitsyn等)推荐的缓冲液一般更容易进行使用本 发明的寡核苷酸进行的PCR。优选最终的PCR反应混合物含有(NH4)2SO4代替 KCl作为主要的离子源。优选最终反应混合物中(NH4)2SO4的浓度约为5 -50mM,更优选约10-30mM,甚至更优选16mM。缓冲成分优选为Tris, 优选其终浓度约67mM,pH约8.8。在这些条件下,MgCl2浓度不必严格 限制。优选其终浓度约1-10mM,更优选约3-6mM,最佳约为4mM。反 应混合物也含有约10mM β-疏基乙醇和0.05-1mg/ml牛血清白蛋白。 特别优选的缓冲液是WB4缓冲液(67mM Tris缓冲液,pH8.8,4mMMgCl2, 16mM(NH4)2SO4,10mM β-疏基乙醇和0.1mg/ml白蛋白)。下文实施 例3中提供了进行此反应的优选条件。

为了进行PCR反应,需制备含有寡核苷酸引物,四种脱氧核苷酸, 适当缓冲液,欲扩增的DNA,和热稳定性的依赖于DNA的DNA聚合酶的 混合物。然后通过退火,延伸,和解链步骤的温度循环加工混合物,直 至达到所需程度的扩增。例如,通过溴化乙锭染色可以测定产生的DNA 的量,染色可在琼脂糖凝胶上分离扩增片段后进行。

扩增反应可能的复杂情况是寡核苷酸引物自身的二聚体化和扩增, 在琼脂糖凝胶上可以轻易检测出低分子量(<100个碱基对)的此片断。 通过琼脂糖或聚丙烯酰胺凝胶分离可除去扩增引物,通过稍微调节一下 反应条件,尤其是退火步骤的温度可以降低扩增的二聚体的量。也优选 预混合引物,脱氧核苷酸和缓冲液,并在加入欲扩增的DNA前,将混合 物加热到80℃。

使用本发明的任何寡核苷酸作为引物的扩增反应产生了编码糖蛋白 B部分的多核苷酸片段。通过本领域技术人员已知的大量技术可以鉴定 这些片段。一些鉴定片段的非限制性方法如下所述:

在一个方法中,可根据本领域已知的任何序列测定法测定片段的序 列,所述方法包括Maxam & Gilbert法,或者Sanger & Nicholson法。 或者也可以将片段提交给任何提供多核苷酸测序服务的商业机构。在测 序前可任选将片段克隆和/或扩增。核苷酸序列可被用于预测由此片段 编码的氨基酸序列。可使用序列资料在多核苷酸水平上或者在氨基酸水 平上与其它已测序的糖蛋白B比较,以鉴定原始来源材料中存在的疱疹 病毒种类。在制作模型的算法规则中也可使用序列资料预测抗原区或三 维结构。

在第二个鉴定方法中,可通过任何适当的方法测定片段的大小,所 述方法如在聚丙烯酰胺或琼脂糖凝胶上电泳,或通过适当的密度梯度离 心。例如,对于RFHV和KSHV而言,NIVPA和TVNCB之间的片段约为319 个碱基。因此包括引物结合区域的整个扩增片段的长度约为386个碱基 相应的sHV1片段含有额外的6个碱基对。因此,例如通过将由每个片 段扩增的多核苷酸片段置于分离凝胶的相邻泳道上电泳,或者通过将 sHV1片段置于适当的分子量标准旁边电泳即可将sHV1片段与RFHV或 KSHV的片段区分开来。在大小上与RFHV和KSHV相同的多核苷酸片段 可衍生自相同或相关的病毒种类。大小基本上不同的片段更可能衍生自 不同的疱疹病毒。

在第三个鉴定方法中,通过尝试将片段与寡核苷酸探针杂交来检测 片段。在优选的实施例中,检测了片段与RFHV或KSHV的糖蛋白B编码 区的相关性。可使用含有糖蛋白B编码区序列或其遗传互补物的探针进 行试验。适当的探针是含有RFHV或KSHV的序列的多核苷酸,如表7所 列的Type3寡核苷酸。

探针的长度和特性以及杂交条件的选择取决于试验的目的。如果目 的是仅仅检测得自RFHV或KSHV的多核苷酸,包括次要的株变体,那么 在高严紧性的条件下进行杂交。使用了来自各个RFHV或KSHV糖蛋白B 的序列。较长的序列改善了试验的特异性,可以在较高严紧性的条件下 使用。优选探针含有至少约30个核苷酸的糖蛋白B序列;更优选此序 列至少约50个核苷酸;甚至更优选此序列至少约75个核苷酸长。

如果目的是检测与RFHV或KSHV密切相关但不相同的多核苷酸,如 在筛选试验或征集先前未曾描述过的RFHV/KSHV亚族病毒的试验中,可 选择不同的条件。得自RFHV或KSHV的序列可以被使用,但一般优选两 个的混合物或简并探针。选择序列的长度和杂交反应的条件以提供足够 的特异性,从而排除不需要的序列,但要么提供与潜在靶的最大程度的 交叉反应性。使用上文给出的公式,通过计算Tm,再计算能忍受的最大 程度错配的相应温度即可预测适当的条件。通过检测探针与含有编码疱 疹病毒糖蛋白B的已知靶多核苷酸样品的交叉反应性,即可凭经验检测 出条件的适当性。

在此试验条件下形成稳定双螺旋所需的最小程度的互补性将决定何 种糖蛋白B序列会与探针杂交。可以考虑,例如扩增得自人或非人灵长 类动物的靶产生对应于SEQ.ID NO:3的碱基36-354的片段,再用KSHV 多核苷酸的相应片段来作探针。根据表2中的资料,如果杂交反应在仅 需要约50%相同即可形成稳定双螺旋的条件下进行,探针会与得自任何 已被测序的γ疱疹病毒(包括hEBV和sHV1)糖蛋白B基因的靶杂交。如 果反应在需要探针和靶之间至少约有65%相同,优选至少约67%相同, 更优选至少约70%相同,甚至更优选至少约75%相同才能形成稳定双 螺旋的条件下进行,此试验将检测到来自RFHV/KSHV亚族即或者是 RFHV,KSHV,或者是具有仍未被测序的糖蛋白B多核苷酸的密切相关疱 疹病毒的靶多核苷酸。甚至在仅需要约50-55%的同一生以形成稳定的 双螺旋的杂交条件下,由于据信bHV4,eHV2或mHV68不能感染灵长类 动物,因此阳性反应不能显示这些病毒的存在。

可以将通过大小的鉴定与通过杂交的鉴定联合。例如,可在丙烯酰 胺或琼脂糖凝胶上分离被扩增的多核苷酸,将所述多核苷酸印迹到适当 材料的膜上,如硝酸纤维素膜上,然后与具有适当标记物,如32P的探 针杂交。洗涤后标记物的存在反映了样品中可杂交材料的存在,而与适 当分子量标准比较的迁移距离反映了材料的大小。在高严紧度条件下与 前述探针之一杂交但具有非预期大小的片段序列表示与探针有高水平的 同一性,但与RFHV或KSHV有所不同的糖蛋白B序列。

使用多核苷酸和寡核苷酸检测疱疹病毒感染

本发明中包含的编码疱疹病毒糖蛋白B的多核苷酸,和根据此多核 苷酸的合成寡核苷酸可用于诊断与疱疹病毒感染相关的临床疾病。例 如,临床样品中可检测到疱疹病毒糖蛋白B的存在可暗示各个疱疹病毒 作为病原因子参与了疾病的发展。特殊组织而不是周围组织中糖蛋白B 的存在可用于定位感染的损害。临床样品中γ疱疹病毒和其它疱疹病毒 之间的鉴别可用于预测感染的临床进程或选择适于治疗的药物。由于糖 蛋白B是由复制病毒,L-颗粒,和感染细胞表达的,因此我们预测它 可用作与任何这些形式的蛋白质表达有关之疾病的活动期和潜伏期的有 用的标记物。

进行诊断试验的方法是本领域中广为人知的,对于本领域普通技术 人员而言是常规技术。通常为了进行本发明的诊断方法,本发明的一个 组合物被提供成试剂以检测临床样品中与之反应的靶。例如,本发明的 多核苷酸可被用作试剂以检测如可能存在于被疱疹病毒感染的细胞中的 DNA或RNA靶。本发明的多肽可被用作试剂以检测能与之形成特异性复 合物的靶。如抗体分子或(如果多肽是受体)相应配体。本发明的抗体 可被用作试剂以检测它特异性识别的靶,如由病毒感染细胞表达的多 肽。

通过从被测量诊断参数的个体处得到适当的组织样品即可提供靶。 相关的试验样品是那些得自怀疑携带疱疹病毒的个体的样品。多种类型 的样品适于这一目的,包括那些通过活组织检查或外科解剖得自感染或 病理学可疑部位附近的样品,衍生自它们的体外细胞培养物,溶解的提 取物,血液和血液成分。如果需要,在进行检测前可从样品中将靶部分 纯化或扩增。通过在允许试剂与靶之间形成复合物的条件下将试剂与样 品接触来进行反应。可在溶液中进行反应,或者例如使用组织学切片在 固体组织样品上进行反应。通过各种本领域中已知的技术可检测复合物 的形成。例如可提供具有标记物的试剂,从复合物中除去未反应的试剂; 从而剩下的标记物的量可表示所形成复合物的量。在说明书下文中将提 供复合物检测的进一步的细节和替换物。

为了测定所形成的复合物的量是否代表了感染或未感染疱疹病毒的 细胞,优选将试验结果与对对照样品进行的类似试验结果相比较。一般 优选使用得自未感染来源的对照样品,要么对照样品在组成上类似于被 检测的临床样品。然而,如果已知对照样品中靶的相对量,或者此相对 量能用于比较的目的,则任何对照样品都适合。通常优选同时对试验样 品和对照样品进行检测。然而,如果所形成复合物的量可以定量并且有 足够的一致性,则在不同日期或不同实验室检测试验样品和对照样品是 可以接受的。

因此,本发明所包含的编码RFHV/KSHV亚族糖蛋白B的多核苷酸和 合成的寡核苷酸可被用于检测生物样品中可能存在的γ疱疹病毒的多核 苷酸。在具体的诊断试验中使用多核苷酸的一般方法是本领域技术人员 所熟知的,例见日本专利申请5309000(latron)。

例如:1)通过与特异性探针进行杂交反应;2)通过与特异性引物 进行扩增,或3)通过上述两种方法的联合可使使用多核苷酸试剂的检 测变成特异性的。

为了进行因与特异性探针杂交而被赋予特异性的试验,选定的多核 苷酸应具有所需程度的与想要的靶的互补性。优选的探针包括长度至少 约为16个核苷酸的编码RFHV,KSHV或RFHV/KSHV亚族其它成员糖蛋白 B的一部分的多核苷酸。更加优选的探针含有至少约18,21,25,30, 50或100个核苷酸长的糖蛋白B编码区。还优选在所用条件下能与 RFHV/KSHY亚族的多核苷酸而不能与其它疱疹病毒的多核苷酸形成稳定 双螺旋的简并探针。

一般情况下提供的探针具有标记物。经常用于这种类型检测的一些 标记物包括如32p和33P的放射性同位素,化学发光剂或如荧光素的荧光 剂,能产生有色溶质或沉淀物的酶,如碱性磷酸酶。标记物对于试剂而 言可以是内源性的,它可通过直接的化学键被连接,或者通过一系列中 间反应分子,如生物素-亲和素复合物或一系列相互反应的多核苷酸被 连接。可在与靶多核苷酸杂交之前或之后在试剂中加入标记物。为了改 善试验的敏感性,经常需要增加因杂交引起的信号,通过以复合标记物 成分掺入每个复合物的方式使用系列杂交的多核苷酸或分支的多核苷酸 的联合可以实现这一目的,参见美国专利号5,124,246(Urdea等人)。

如果需要,可从样品中提取靶多核苷酸,也可以将靶多核苷酸部分 纯化。为了测量病毒颗粒,优选富集DNA的制备;为了测量糖蛋白B的 活性转录,优选富集RNA的制备。一般预期临床样品中疱疹病毒的多核 苷酸水平较低,潜伏有病毒的每个细胞中仅有几拷贝编码糖蛋白B的 DNA,或正在复制病毒的每个细胞中有多至几百拷贝的DNA。与那些基因 在其中无活性的细胞相比,活跃表达蛋白质的细胞中mRNA的水平较高, 因此需要通过扩增DNA或RNA来增强样品中靶的水平。适当的扩增方法 是PCR,优选使用本发明包含的一个或多个寡核苷酸引物进行PCR。通过 使用逆转录酶制备cDNA拷贝,然后使用上述引物进行PCR可以扩增RNA。

靶多核苷酸可任选经受任何额外处理的联合,包括用限制性核酸内 切酶消化,例如通过在琼脂糖或聚丙烯酰胺中电泳以进行大小分离,和 贴在反应基质,如印迹材料上。

在适当的反应条件下,通过将试剂多核苷酸与怀疑含有靶多核苷酸 的样品混合,可允许杂交发生。接着通过洗涤或分离以除去未反应的试 剂。一般情况下,靶多核苷酸和试剂必须都至少部分地被平衡成单链形 式以便互补序列能有效杂交。因此,通过本领域技术人员已知的标准变 性技术制备样品是有用的(特别是在DNA检测中)。

选定的杂交条件的严紧性水平取决于检测的目的。如果需要此检测 对于RFHV或KSHV是特异性的,则可使用含有各个糖蛋白B一个区段的 探针,在高严紧性的条件下进行反应。例如对于优选的50个或更多个 核苷酸的探针所用的一套优选条件是37℃,50%甲酰胺,6×SSC,然后 在低离子强度下洗涤。一般需要靶与多核苷酸探针至少约90%相同才形 成稳定的双螺旋。通过增加所用探针的长度也可以增加对特定可疑病毒 的反应的特异性。因此对于本发明的这一应用特别优选较长的探针。或 者,如果需要试验能检测与KSHV相关的其它疱疹病毒,则可使用较低 的严紧性。适当的探针包括得自KSHV糖蛋白B多核苷酸的片段,其混 合物,或如表7所列的那些寡核苷酸。

适当的杂交条件被确定成仅允许探针与糖蛋白B序列杂交,所述序 列具有所需程度的与探针的同一性。所需的严紧性取决于多核苷酸探针 的长度和探针与所需靶序列之间同一性的程度。可以考虑例如探针由 NIVPA和TVNCB杂交位点之间的KSHV多核苷酸片段组成,需要最少60 %同一性的条件会导致与KSHV和如sHV1的其它y疱疹病毒的相应多核 苷酸形成稳定的双螺旋;需要最少90%同一性的条件会导致仅与KSHV 和密切相关的变体的多核苷酸形成稳定的双螺旋;需要最少65-70%同 一性的中间严紧度的条件会允许与KSHV,和RFHV/KSHV亚族的一些其 它成员的糖蛋白B多核苷酸形成双螺旋,而不与其它已知的疱疹病毒, 包括γ疱疹病毒eHV2,sHV1,mHV68,bHV4,EBV,和如hCMV,hHV6,hVZV 和HSV1的其它人病原体的相应多核苷酸形成双螺旋。

使用上文给出的公式可预先估计条件。优选通过用已知含有多核苷 酸的分离样品检测探针以进一步确证精确的条件,所述样品包括那些在 试验中需被检测的和那些不需被检测的多核苷酸。或者通过由公开序列 合成多核苷酸,或者通过从据信被各个疱疹病毒感染的组织中提取和扩 增DNA可以提供这种样品。确定杂交条件对于本领域技术人员而言是一 种常规的调整,不需要太多的实验。由于eHV2,sHV1,mHV68,bHV4和 EBV相对于α和β亚族的成员而言,与RFHV/KSHV亚族更加密切相同,排 除了RFHV/KSHV亚族以外的γ疱疹病毒的条件一般也排除了表1所列的 其它疱疹病毒。另外,如果据信在最终测定中,某些病毒不会存在于受 试样品中(如eHV2,mHV68或bHV4在人组织样品中),那么当确定了 试验条件后即可任选忽略相应的靶序列。因此条件可被确定为允许如表 6所列的那些Type2寡核苷酸探针能与含有SEQ.ID NO:1或SEQ.ID NO: 3的多核苷酸序列,而不与选自SEQ.ID NO:5-13的序列形成稳定的 双螺旋。条件也可被确定为允许含有SEQ.ID NO:1或SEQ.ID NO:3 的至少21个或更多个连串碱基的适当片段能与含有SEQ.ID NO:1和 SEQ.ID NO:3的多核苷酸,而不与含有SEQ.ID NO:5-13中任何一 个的多核苷酸形成稳定的双螺旋。

或者为了进行因用特异性引物扩增而被赋予特异性的试验,可如前 所述从生物样品中制备DNA或RNA。任选在PCR中使用非种特异性的引 物,如表4或6中所列的那些,预扩增靶多核苷酸。然后使用特异性引 物,如表7中所列的那些,或得自表4,6和7的引物的联合扩增靶。 在优选的实施方案中,以嵌套形式使用寡核苷酸引物进行了两轮扩增: 第一轮中为病毒特异性或非特异性;第二轮中为病毒特异性。这提供了 既敏感又特异的试验。

扩增过程中特异性Type3引物的使用足以提供所需的特异性。扩增 系列的最后充足的反应产物的存在表示阳性试验。通过例如将反应混合 物印迹到如硝酸纤维素的介质上并用溴化乙锭染色可以检测被扩增的多 核苷酸。或者可以在最终的扩增循环期间在混合物中加入经放射性标记 的底物;将掺入的标记物与未掺入的标记物分开(例如通过印迹或通过 大小分离),检测标记物(例如通过计数或放射性自显影)。如果在琼 脂糖或聚丙烯酰胺凝胶上电泳,产物的大小将有助于进一步证实被扩增 片段的本质。通过使用得自前述方法的扩增混合物作为前文概述的杂交 反应的靶源,在特异性扩增之后可进行特异性杂交。

多核苷酸用于基因治疗

本发明中包含的药物含有病毒特异性多核苷酸,多肽或抗体作为活 性组分。这种组合物会降低病毒或感染细胞本身的病理学,或者使得病 毒或被感染的细胞对非特异性药物化合物的治疗更加敏感。

可以使用本发明编码疱疹病毒糖蛋白B部分的多核苷酸,例如给被 感染的个体用药以进行基因治疗(一般参见美国专利号5,399,346; Anderson等人)。一般的原理是以或者促进或者减弱其编码的多肽表达 的方式施用多核苷酸。

优选的基因治疗模式是以能在细胞内部复制,增强和延长效果的方 式提供多核苷酸。因此,可使多核苷酸与适当的启动子有效连接,所述 启动子如相应基因的天然启动子,在靶组织类型的细胞中有内在活性的 异源启动子,或能够通过适当试剂被诱导的异源启动子。通过本领域中 已知的适当技术,如以适当的载体,如病毒表达载体的形式提供多核苷 酸,或将多核苷酸包裹在脂质体内,便于多核苷酸进入细胞。多核苷酸 可以全身性注射,或者通过抗原特异性寻靶机制,或通过直接注射将多 核苷酸提供给感染部位。

在一个有所变化的方案中,多核苷酸含有的启动子与具有相同方向 的多核苷酸链连接,所述链在疱疹病毒感染的过程中被转录。优选被编 码的糖蛋白B包括外部成分,跨膜成分和转运至表面的信号序列。被这 种多核苷酸转染的感染了病毒的细胞有望在表面表达增强水平的糖蛋白 B。这种形式的增强的糖蛋白B表达可增强通过免疫系统因子对这些细 胞的识别,所述因子包括抗体(和依赖于抗体的效应物,如ADCC)和病 毒特异性的细胞毒T细胞。

在另一个有所变化的方案中,多核苷酸含有的启动子与具有相反方 向的多核苷酸链连接,所述链在疱疹病毒感染的过程中被转录。被这种 多核苷酸转染的感染了病毒的细胞有望表达降低水平的糖蛋白B。转录 本有望与由病毒基因转录的互补链杂交,并防止它被翻译。已知这种方 法为反义疗法。

RFHV/KSHV亚族具有糖蛋白B活性的多肽及其片段

图1所示的RFHV和KSHV多核苷酸都具有开放阅读框。被它编码的 多肽分别示于SEQ.ID NO:2和SEQ.ID NO:4。用于得到多核苷酸序 列的引物NIVPA和TVNCB的杂交区域之间编码的是在RFHV和KSHV之间 有91%相同的106个氨基酸的糖蛋白B分子的片断。KSHV糖蛋白B的整 个蛋白质序列示于SEQ.ID NO:94,RFHV/KSHV亚族的第三成员RFHV2 的糖蛋白B片断示于SEQ.ID NO:97。

有很多已被测序的其它疱疹病毒的糖蛋白B分子的同源性残基,SEQ. ID NO:2或SEQ.ID NO:4而不是其它疱疹病毒已知的序列中所含的 最长序列为9个氨基酸长,所述其它已知序列中有两个除外(SEQ.ID NOS:64和65)。在糖蛋白B氨基酸序列的别处发现了较长的匹配部分, 最长的是SEQ.ID NO:99所示的得自bHV4的21个氨基酸长的序列, 其余的都是16个氨基酸长或更短。除SEQ.ID NO:99以外,RFHV和KSHV 糖蛋白B蛋白质序列的17个氨基酸或更长的任何片段据信分别对于RFHV 或KSHV,或密切相关的株而言是特异性的。由于据信bHV4和具有匹配 区段的其它病毒不能感染灵长类动物,因此SEQ.ID NO:4中所含的在 灵长类动物中发现的约10个或更多个氨基酸的任何片断会显示与KSHV 密切相关的感染因子的存在。

本发明既包含RFHV/KSHV亚族疱疹病毒完整的糖蛋白B,也包含对 此亚族有特异性的其任何片段。本发明的优选糖蛋白B片段至少10个 氨基酸长;更优选它们至少13个氨基酸长;更优选它们至少至少17个 氨基酸长;更优选它们至少20个氨基酸长;甚至更优选它们至少约25 个氨基酸长,再更优选它们至少约30个氨基酸长。

SEQ.ID NOS:2,4,94和96所示的RFHV和KSHV糖蛋白B片段 的氨基酸序列可用于鉴定病毒特异性和交叉反应性的抗原区域。

原则上,特异性的抗体会识别序列间非抗体来源物种共有的任何氨 基酸差异。抗体结合位点一般应足够大以包含抗原的5至9个氨基酸残 基,所述位点应足能识别单个氨基酸的差异。特异性抗体可能是多克隆 应答的一部分,所述应答在被表达糖蛋白B的病毒感染的动物中自发地 产生。也可以通过给实验动物注射完整的糖蛋白B或糖蛋白B片段来诱 导特异性的抗体。

因此,KSHV独特的5个或更多个氨基酸的任何肽是潜在的病毒特异 性抗原,可以被KSHV-特异性抗体识别。类似地,在RFHV/KSHV亚族 内部,而不是与其它疱疹病毒之间共用的足够长度的任何肽是潜在的亚 族特异性抗原。

优选肽的一些例子示于表8。本领域技术人员很快会认识到通过细 微改变所列肽的长度和/或在任一方向上将肽的框架移动几个残基即可 设计出具有类似特异性的其它肽。

在γ疱疹病毒亚族的某些其它成员的糖蛋白B和KSHV的糖蛋白B之 间,表8所示的Ⅰ类肽是保守的。针对此区域中的一个这种糖蛋白B的 抗体因此能与一些其它抗体交叉反应。在RFHV和KSHV的糖蛋白B之间 Ⅱ类肽是保守的,但在其它γ疱疹病毒之间Ⅱ类肽却不保守。针对此区 域的抗体预期在RFHV,KSHV和RFHV/KSHV亚族的其它病毒之间能交叉 反应;但不能与此亚族以外的疱疹病毒交叉反应。RFHV,KSHV和其它已 知的γ疱疹病毒之间的Ⅲ类肽有所不同。与此区域,特别是与其中所 含的不相同的残基结合的抗体预期可将RFHV与KSHV糖蛋白B互相区分, 并与更远相关的疱疹病毒的糖蛋白B区分开来。                                  表8:抗原肽           特异性             序列   长度  SEQ.ID     NO:     Ⅰ类:    在RFHV/    KSHV亚族   和一些其它γ       疱疹病毒     中共用 与下列病毒     共用     YRKIATSVTVYRG    13     64     bHV4  bHV4,mHV68     RYFSQP     6     66     bHV4     IYAEPGWFPGIYRVR     IYAEPGWFPGIYRVRTTVNCE    15    21     65     99     mHV68     VLEELSRAWCREQVRD    16    100          Ⅱ类:     在RFHV/KSHV亚族中           共用     VTVYRG     6     67     AITNKYE     7     68     SHMDSTY     7     69     VENTFTD     7     70     TVFLQPV     7     71     TDNIQRY     7     72     Ⅲ类:  病毒特异    性的1     特异于     RGMTEAA     RGLTESA     7     7     73     75     RFHV     KSHV     RFHV     KSHV     PVLYSEP     PVIYAEP     7     7     74     76 1-不与任何其它已测序的疱疹病毒共用;可能存在于一些未测序的RFHV/KSHV亚族的                                   病毒中

特别优选的Ⅲ类肽是那些如实施例中所述的包含糖蛋白B区域的 肽,所述区域具有适于抗原表位的极性特征。给定KSHV和RFHV/KSHV 亚族其它成员的糖蛋白B的完整序列,通过类似分析可预测分子其它区 域的病毒或亚族特异性肽。

多肽的制备

可通过本领域技术人员已知的几个不同方法制备本发明的多肽。

例如,通过化学合成可由序列资料方便地制备长度约为5-50个氨 基酸的短多肽。优选的方法是固相Merrifield技术。或者可以根据前 述方法中的一个分离或合成编码所需多肽的mRNA,并使用体外翻译系 统,如兔网织红细胞系统翻译,例见Dorsky等人。

使用适当的表达系统可以方便地制备大到并包括整个糖蛋白B的较 长的多肽。例如,将全长cDNA的编码链与适当的启动子有效连接,插 入表达载体,并转染适当的宿主细胞。再在允许转录和翻译发生的条件 下培养宿主细胞,随后回收多肽。例如从其它种疱疹病毒中表达和回收 糖蛋白B,参见美国专利号4,642,333(Person);5,244,792(Burke 等人);Manservigi等人。

对于多种目的而言,使用重组的糖蛋白B多核苷酸特别方便,所述 多核苷酸包括编码转运至细胞表面的信号的区域,但缺乏编码蛋白质跨 膜区的区域。可在跨膜编码区的5’截短多核苷酸,或者多核苷酸可含有 细胞外和胞质这两个编码区,但缺乏跨膜区。预期这种特性的构建体可 从细胞中以可溶的形式分泌出来。在需要糖蛋白B片断为单体时,可将 重组体设计成能限制蛋白质的约前475个氨基酸的翻译。

例如,为了在酵母中表达任何这些形式的糖蛋白B,可使用甘油 -3-磷酸-脱氢酶(GAPDH)启动子区和终止区制备盒(cassette)。 在酵母文库中鉴定GAPDH基因片断,分离之并以适当的构型连接。将所 述的盒克隆到pBR322中,分离之并通过DNA测序进一步证实。构建出 的pCI/I质粒含有糖蛋白B插入物和GAPDH启动子区和终止区。用此质 粒转化酵母菌株啤酒糖酵母(S.cerevisiae),培养后离心沉淀酵母细 胞,并将细胞沉淀物重新悬浮于含有蛋白酶抑制剂的缓冲液中,所述抑 制剂如1mM的苯甲基磺酰氟和0.1μg/ml的胃酶抑制剂。用玻璃珠旋涡 破碎经洗涤的细胞并重新离心。通过例如使用按下文所述制备的抗糖蛋 白B的抗体进行Western印迹可进一步证实上清液中正确大小的糖蛋白 B的存在。通过标准的蛋白质化学技术的联合可从上清液中纯化糖蛋白 B,所述技术包括离子交换层析,使用抗体或底物的亲和层析和高压液 相层析。

为了在哺乳动物细胞中表达糖蛋白B,例如可使用如pSV1/dhfr的 哺乳动物表达载体。此质粒具有氨苄青霉素-抗性的β内酰胺酶基因, 和与SV40早期启动子连接的可选择的哺乳动物细胞标记物二氢叶酸还 原酶。将糖蛋白B多核苷酸的钝端片断连接到pSV1/dhfr载体中,并用 核酸内切酶消化以提供包括SV40启动子,糖蛋白编码区,和SV40剪接 和聚腺苷酸化位点的盒。例如使用质粒转化dhfr有缺陷的CHO细胞, 并选择转化子,通过例如使用抗糖蛋白B的抗体作为第一抗体的免疫荧 光可鉴定表达糖蛋白B的细胞。

在另一个实施例中,表达糖蛋白B的重组质料被克隆使之在附加型 复制载体pRP-RSV中的Rous肉瘤病毒长的末端重复的控制之下,所述 质粒含有人乳多空病毒BK的复制起点和早期区域,以及dhfr抗性标记 物。然后可使用此载体例如转化人293细胞。通过使用缺乏跨膜区的糖 蛋白B编码区,糖蛋白B多肽能以0.15-0.25pg/细胞/天的速度组成型 分泌到培养基中。在0.6-6μM氨甲蝶呤的存在下,由于附加型重组体 的扩增,产量可增加10-100倍。以这种方式制备的糖蛋白B特别适用 于诊断新的和复发的疱疹病毒感染,并制备抗这种感染的保护性疫苗 (Manservigi等)。

使用多肽评估疱疹病毒感染

在几个不同的应用中,本发明所包含的多肽也可被用来检测或评估 个体中疱疹病毒感染的现状。

在一个应用中,编码疱疹病毒糖蛋白B一部分的多肽被提供成检测 用的试剂以检测可特异性地识别它的抗体的存在。这种抗体可能存在于 例如目前或继往暴露于疱疹病毒中的个体的循环系统中。

循环系统中抗糖蛋白B之抗体的存在能提供病毒感染的敏感的早期 征兆。由于糖蛋白B是病毒包膜的功能性成分,因此它比病毒颗粒内被 隔绝的其它转录本产量更高,比似乎只在病毒生命循环中短暂停留的转 录本分布更广。另外,它不仅可被完整的病毒表达,也可被病毒可感染 的细胞的非感染性产物,如L-颗粒表达。已知多种疱疹病毒的糖蛋白 B具有强烈的免疫原性,因此,个体中抗糖蛋白B的抗体的检测可以是 正在发展中的活跃的疱疹病毒感染,潜伏的感染,先前的暴露,或用糖 蛋白B疫苗处理的征兆。

被测量其中的抗体水平的适当临床样品包括得自怀疑有γ疱疹病毒 感染的个体的血清或血浆。通过例如免疫测定法可测定抗体的存在。

本领域中已确立了大量免疫测定法以使用病毒肽进行抗体的定量 (例见美国专利号5,350,671:Houghton等人)。例如,可以将潜在含 有特异性抗体的试验样品与预先确定的不限定量的试剂多肽混合。此试 剂可含有直接结合的标记物,如酶或放射性同位素。对于液相检测而言, 通过如过滤或层析的分离技术除去未反应的试剂。或者,通过固相上的 试剂首先捕获样品中的抗体。所述试剂可以是例如特异性的多肽,抗- 免疫球蛋白,或A蛋白,然后用如结合有标记物的特异性多肽,抗-免 疫球蛋白或A蛋白的第二试剂检测被捕获的抗体。至少一种捕获试剂或 检测试剂必须是特异性多肽。在第三种变化中,含有多肽的细胞或组织 切片可首先被含有抗体的试验样品覆盖,然后被如经标记的抗-免疫球 蛋白的检测试剂覆盖。在所有这些例子中,复合物中捕获的标记物的量 与试验样品中存在的特异性抗体的量正相关。可设计类似的试验,其中 试验样品中的抗体与经标记的抗体竞争同有限量的特异肽结合,那么复 合物中标记物的量与试验样品中特异性抗体的量负相关。比较试验样品 和得自未被感染之个体的对照样品之间使用这些试验中的任一个得到的 结果。

通过适当选择试剂多肽,可检测所需特异性的抗体。例如,如果使 用完整的糖蛋白B,或者使用含有疱疹病毒保守区域的片段,则在试验 样品中检测到的抗体可能是病毒特异性的,交叉反应性的,或两者皆是。 优选将多-表位的试剂用于与疱疹病毒感染有关的抗体的一般性筛选试 验中。为了使试验特异针对抗RFHV或抗KSHV的抗体,可选择含有适当 病毒糖蛋白B的非保守区的抗原肽,如表8的Ⅲ类所列的那些肽,优 选使用这种肽的混合物。为了同时检测抗RFHV,KSHV,和密切相关的γ 疱疹病毒家族的病毒,而不抗sHV1和EBV的抗体,可选择具有表8Ⅱ 类所列肽之特性的抗原肽,优选使用这种肽的混合物。

一旦感染消退,在疱疹病毒感染期间刺激产生的抗体也会消退,或 者它们也可以作为宿主免疫记忆的一部分被保存。在后一种情况下,通 过测定抗体的类别可将因目前的感染产生的抗体与因免疫记忆产生的抗 体区分开来。例如,可进行这样一种试验,其中试验样品中的抗体被特 异性的多肽捕获,再用经标记的抗-IgM或抗-IgG使之显现出来。试 验样品中IgM类特异性抗体的存在表明感染正在发生,而只存在IgG抗 体表明活性是由于先前感染或免疫接种的免疫记忆而产生的。

使用多肽设计或筛选抗病毒药物

干扰糖蛋白B基因或基因产物会修饰感染的进程或疾病的进展。本 发明的目的之一是提供一种方法,通过此方法可开发和试验有用的药物 组合物和利用这种化合物治疗γ疱疹病毒感染的方法。特别优选可用于 治疗RFHV,KSHV和RFHV/KSHV亚族的其它成员感染的药物化合物。适 当的药物可以干扰糖蛋白B基因的转录或翻译,并能干扰由此基因编码 的多肽的生物学功能。不需要知道干扰的机理;只需要对于与感染过程 相关的反应而言,干扰是优先的。

优选的药物包括那些竞争干扰糖蛋白B与靶细胞上其底物,如硫酸 乙酰肝素和其类似物结合的药物,另外优选的药物竞争干扰糖蛋白B与 其它病毒包膜成分的任何相互作用,所述成分可能是病毒行使一种生物 学功能,如侵入靶细胞所必需的。另外优选的分子能够交联或要不然的 话固定化糖蛋白B,从而防止糖蛋白B结合其底物或行使在病毒感染性 中起作用的任何生物学功能。

本发明提供了筛选候选药物以决定哪种适于临床使用的方法。此方 法会瞄准目前已知的抗病毒化合物和那些将来设计的抗病毒化合物。

此方法包括将有活性的糖蛋白B与候选药物联合,并测定候选药物 是否改变了生化功能。糖蛋白B可以是由RFHV/KSHV亚族的糖蛋白B基 因编码的具有糖蛋白B活性的任何片段。通过表达编码分子活性位点的 经遗传工程改造的多肽,或通过用蛋白酶裂解糖蛋白B并纯化活性片段 可得到适当的片段。在优选的实施方案中,提供了完整的糖蛋白B。反 应混合物也可含有测量蛋白质生物活性所必需的其它成分。例如,在测 量底物结合的试验中,可以提供硫酸乙酰肝素或其类似物,可以将它们 与固相支持物连接以便于测量结合反应。

筛选方法的一个实施方案是测量候选药物直接与分离的糖蛋白B或 其片断的结合。预期与分子的活性位点结合的化合物可以干扰糖蛋白B 活性,因此,将含有活性位点的整个糖蛋白B或片断与候选药物混合。 通过例如以放射性标记或稳定的-同位素标记的形式提供候选药物可直 接测量候选药物的结合。通过例如用适当抗体沉淀糖蛋白B,或通过提 供与固相结合的分子并在反应后洗涤固相可以检测与糖蛋白B结合的标 记物的存在。通过例如用示差光谱学,核磁共振或圆二色性检测构象的 变化也可显示出候选药物与糖蛋白B的结合。或者,也可以在竞争试验 中检测结合:例如,将糖蛋白B与候选药物混合,然后加入调节性亚单 位的经标记的核苷酸或片断。候选药物与生化相关位点的结合应能抑制 经标记的化合物随后的结合。

筛选方法的第二个实施方案是测量候选药物抑制糖蛋白B与底物或 底物类似物结合的能力。优选的类似物是与如SepharoseTM珠的固相支 持物偶联的肝素。通过例如提供经标记的糖蛋白B,将它与候选药物一 起保温,加入亲和性树脂,然后洗涤并计数树脂以测定是否候选药物已 降低了被结合的放射性的量,即可测量抑制作用。也可以检测候选药物 竞争干扰糖蛋白B与其它疱疹病毒蛋白质之间的相互作用的能力。

筛选方法的第三个实施方案是测量候选药物抑制如病毒颗粒的活性 颗粒由糖蛋白B介导的活性的能力。此颗粒经改造可以表达糖蛋白B而 不是能介导相同功能的其它成分。然后在存在和不存在候选药物的情况 下,通过提供适当的靶以检测颗粒抑制生物学功能的能力,所述功能如 底物结合或膜融合。

本发明也通过合理的药物设计提供了治疗疱疹病毒感染之药物的开 发,一般可参见Hodgson和Erickson等人。在此实施方案中,或者通 过以氨基酸序列为基础的预测模型,或者优选通过实验测定法可测定糖 蛋白B的三维结构。实验的方法包括抗体作图,突变分析和抗-独特型 的形成。特别优选X-射线晶体学。知道糖蛋白的三维结构,特别是底 物结合位点附近的重要氨基酸基团的方向,就可以从头设计化合物,或 者可适当修饰现有的化合物。经设计的化合物要具有适当的电荷平衡, 疏水性,和/或形状以使得它能在糖蛋白B活性位点的附近结合,并在 空间上干扰此位点的正常生化功能。优选随后在上文所述的药物筛选试 验中检测通过此方法设计的化合物。

抗糖蛋白B的抗体及其制备

本发明中包含的糖蛋白B分子的氨基酸序列对于所述病毒感染的宿 主而言是外源的。已知其它种类疱疹病毒的糖蛋白B对于哺乳动物具有 强烈的免疫原性。例如,人被hCMV感染的通常结果是形成抗-糖蛋白B 的抗体。与之类似,预期RFHV,KSHV和RFHV/KSHV亚族的其它成员的 糖蛋白B对于包括人的哺乳动物而言是免疫原性的。这些预期得到下文 实施例所述观察结果的支持。

一般可通过本领域已知的任何方法制备抗多肽的抗体。为了在实验 动物体内刺激抗体的产生,经常优选通过如与戊二醛聚合,或与如弗氏 佐剂等佐剂联合这类技术增强多肽的免疫原性。将免疫原注射到适当的 实验动物体内:优选注射到啮齿动物体内以制备单克隆抗体;优选注射 到如兔或绵羊的较大动物中以制备多克隆抗体。优选在约4周后提供第 二次或加强注射,并在不少于约1周后开始收获抗体源。

从经免疫的动物体内收获的血清提供了多克隆抗体的来源。从来源 材料中纯化特异性抗体活性的详细方法是本领域中已知的。如有必要, 可通过如A蛋白层析,硫酸铵沉淀,离子交换层析,高效液相层析和在 偶联至固体支持物上的免疫多肽柱上进行的免疫亲和层析之类的技术进 一步纯化特异性抗体活性。

通过完整的糖蛋白B或含有保守序列的片段免疫产生的多克隆抗体 在疱疹病毒之间可能有交叉反应。通过用适当的特异性抗原,如上文表 8中所列的那些抗原免疫可产生病毒或亚族特异性的抗体。或者,通过 例如使抗体穿过由糖蛋白B制成的吸附剂并收集未结合的级分以除去不 需要的抗其它病毒糖蛋白B的活性,可以使得抗较大片段产生的多克隆 抗体为特异性的。

或者,可以从免疫动物体内回收如脾细胞等免疫细胞并用于制备能 产生单克隆抗体的细胞系,例见Harrow & Lane(1988),美国专利号 4,472,500(Milstein等人),和U.S.4,444,887(Hoffman等人)。

简单地说,可以特别地通过细胞融合,或者通过用Epstein Barr 病毒转化产生抗体的细胞,或者用致癌DNA转化来产生能生产抗体的细 胞系。克隆并培养经处理的细胞,选择能产生所需特异性抗体的克隆。 可通过多种技术对培养物上清液进行特异性检测,所述技术如在标准的 免疫测定法中使用免疫多肽作为检测试剂,或者在免疫组化法中使用表 达多肽的细胞。可从大体积的组织培养物上清液,或者从注射有克隆的 适当准备的宿主动物腹水液中纯化选定克隆的单克隆抗体供应。

此方法的有效变动包括对分离的细胞进行多肽的免疫接种。通过标 准的蛋白质化学方法,如用蛋白酶使抗体裂解可制备抗体片段和其它衍 生物。通过得到编码抗体的多核苷酸,并应用一般的分子生物学方法以 引入突变并翻译变异体可以产生抗体的经遗传工程改造的变异体。

通过注射完整的糖蛋白B或含有保守序列的片段而产生的单克隆抗 体在疱疹病毒之间可能有交叉反应。通过用适当的特异性抗原,如选自 表8的那些抗原免疫可产生病毒或亚族特异性的抗体。或者,通过在筛 选方法中使用适当的抗原,如选自表8中的Ⅲ类抗原可从经克隆的杂 交瘤中选择病毒特异性的克隆。

抗疱疹病毒糖蛋白B的特异性抗体在开发,诊断和治疗工作中作用 很多。例如,抗体可用于筛选药物(见美国专利号5,120,639),如下 文所述,它们也可用作被动疫苗的成分或用作检测生物样品中的疱疹病 毒和靶向药物。

也可制备与糖蛋白B相关的抗-独特型,通过根据上述方法学首先 制备糖蛋白B抗体,通常是单克隆抗体可做到这一点。然后将抗体用作 自愿者或实验动物的免疫原以产生抗-独特型。此抗-独特型可以是单 克隆的也可以是多克隆的,它的形成一般根据第一抗体所用的方法学。 使用免疫原抗体作为阳性选择子,使用不相关特异性的抗体作为阴性选 择子来选择抗-独特型或表达抗-独特型的杂交瘤克隆。通常阴性选择 子抗体是多克隆的免疫球蛋白制品或含有相同免疫球蛋白类和亚类并与 免疫原抗体种类相同的单克隆抗体的集合体。抗-独特型可用作抗糖蛋 白B的主动疫苗的可替换成分。

使用抗体检测生物样品中的糖蛋白B

特异于糖蛋白B的抗体可被用于检测可能存在于,例如,固形组织 样品和经培养的细胞中病毒来源的糖蛋白B多肽和片段。进行这种测定 的免疫组织学技术对于本领域技术人员而言是显而易见的。一般情况下 通过下述技术的联合可保护组织,所述技术可包括冷冻,交换成不同的 溶剂,用如低聚甲醛的试剂固定,用如醇的试剂干燥,或在如石蜡或OCT 的商购介质中包埋。适当制备样品的切片,并用特异针对蛋白质的第一 抗体覆盖。

可直接提供具有适当标记物的第一抗体。更多情况下使用多种易制 备或可商购的显色剂中的一种来检测第一抗体。典型地,这些显色剂是 抗-免疫球蛋白或A蛋白,它们一般具有的标记物包括但不限于:如荧 光素的荧光标记物,如过氧化物酶的能沉淀适当化合物的酶,如胶体金 的电子密度高的标记物或如125I的放射性同位素。再使用适当的显微技 术观察切片,比较怀疑受病毒感染的细胞和对照细胞之间的标记水平, 所述对照细胞如感染区域周围或得自较远部位的细胞。

在标准的定量免疫测定法中,也可检测由糖蛋白B基因编码的蛋白 质。如果蛋白质由受感染的细胞以任何可估计的量分泌或排出,则可在 血浆或血清样品中检测到蛋白质。或者,可从固形组织样品中溶解或提 取靶蛋白质。定量前可通过例如印迹技术或使用捕获抗体将蛋白质粘附 于固相上。

本领域中已建立了大量进行定量的免疫测定法,例如,可将蛋白质 与预定的非限制性量的特异针对蛋白质的试剂抗体相混合。试剂抗体可 含有直接结合的标记物,如酶或放射性同位素,或者也可加入第二个经 标记的试剂,如抗免疫球蛋白或A蛋白。对于固相测定法而言,通过洗 涤除去未反应的试剂。对于液相测定法而言,通过一些其它的分离技术, 如过滤或层析除去未反应的试剂。复合物中捕获的标记物量与试验样品 中存在的靶蛋白质量正相关。此技术的变化是竞争测定法,其中靶蛋白 质与经标记的类似物竞争特异性抗体的结合位点,此时被捕获的标记物 量与试验样品中存在的靶蛋白质的量负相关。比较试验样品和得自未受 感染之来源的对照样品之间使用任何这类检定法得到的结果。

使用抗体使药物靶向作用

抗体如何能被用于治疗疱疹病毒感染的例子是效应物成分的特异性 靶向作用,被病毒感染的细胞一般呈现病毒的肽,尤其是在病毒包膜外 部表达的蛋白质,因此肽为被感染的细胞提供了可与特异性抗体结合的 标记物。而与抗体结合的效应物成分在被感染的细胞附近变得密集;改 善了对感染细胞的效应并降低了对未受感染之细胞的效应。并且,如果 抗体能诱导胞吞作用,则可促进效应物进入细胞内部。

为了靶向作用这一目的,优选通过共价或高亲和性键使特异针对病 毒多肽(此时为糖蛋白B的区域)的抗体与适当的效应物成分缀合。这 种组合物中适当的效应物成分包括如131I等放射性核素,有毒的化合物 和如白喉毒素的有毒肽。另一个适当的效应物成分是可包裹于脂质体中 的反义多核苷酸。

诊断试剂盒

诊断实验室,实验性实验室,技术人员或私人都可进行使用本发明 的多核苷酸,寡核苷酸,肽或抗体的诊断方法。本发明提供了能用于这 些装置的诊断试剂盒。在得自受感染个体的临床样品中,个体中存在疱 疹病毒表现为样品中所含DNA,RNA,蛋白质或抗体的改变。与得自健康 个体的样品中的成分相比,因疱疹病毒的存在而导致的这些成分之一的 变化采取的形式是成分水平的增加或降低,或成分形式的变化。任选预 处理临床样品以富集被检测的靶。然后使用者可使用试剂盒中所含的试 剂以检测诊断成分改变的水平或形式变化。

每个试剂盒必须含有赋予方法特异性的试剂:用于检测靶DNA或RNA 的试剂多核苷酸;用于检测靶蛋白质的试剂抗体;用于检测欲被分析的 样品中可能存在的靶抗体的试剂多肽。可以适于贮存的固体形式或液体 缓冲液形式提供试剂,然后当进行试验时,用于交换或加入反应介质中。 还提供了适当的包装。此试剂盒可提供对此方法有用的另外的成分,这 些可选择的成分包括缓冲剂,捕获试剂,显色剂,标记物,反应表面, 检测的工具,对照样品,说明书和解释性的资料。

RFHV/KSHV亚族的其它成员

RFHV和KSHV是RFHV/KSHV亚族成员的例子。本发明包含编码如本 文所限定的亚族其它成员糖蛋白B的多核苷酸序列。本文所述的共有- 简并γ疱疹病毒寡核苷酸Type1和Type2引物以及方法被设计成适于鉴 定RFHV/KSHV亚族其它成员的相应多核苷酸片断。一个这类成员是感染 猴的另一个病毒,它被称为RFHV2。如实施例12所述,从得自猕猴的RF 组织中克隆了此病毒糖蛋白编码序列的区段。

为了鉴定和描述此家族中的其它成员,对提取自怀疑被这种病毒感 染的组织样品的DNA使用本发明的试剂和方法。

用于此目的适当来源的DNA包括得自在人和其它脊椎动物中出现的 广范围疾病的生物样品。优选疾病中的因子与γ疱疹病毒亚族的其它成 员相似,被怀疑是嗜淋巴细胞的;例如非EBV来源的感染性单核细胞增 多。更优选的疾病在至少一个临床或组织学特征上类似于与RFHV或KSHV 相关之疾病。这些疾病包括:a)纤维增殖是疾病病理学一部分的疾病, 尤其是与胶原沉积相关的疾病,和尤其是纤维组织被打乱的疾病;b) 涉及血管发育异常的疾病;c)涉及恶性转化的疾病,特别是但不限于 淋巴细胞谱系的细胞;d)隐伏的免疫缺损影响疾病的频率或严重性的 疾病;e)在器官的各个位点或在全身自发产生的疾病;f)其流行病学 的资料暗示与传染性或环境因子相关的疾病。相对而言更优选满足不止 一个上述标准的疾病。特别优选的一些疾病的例子包括腹膜后纤维变 性,小结状纤维瘤病,假肉瘤纤维瘤病,纤维肉瘤,硬化肠系膜炎,急 性呼吸病综合征,自发性肺纤维变性,不同类型的扩散增殖性肾小球肾 炎,神经胶质瘤,成胶质细胞瘤,神经胶质增生和所有类型的白血病和 淋巴瘤。

所用组织样品的类型取决于疾病的临床表现。更可能含有与疾病相 关之病毒的样品可取自涉及疾病病原学的部位,或有病毒向性的一些其 它迹象的部位。被感染的个体的外周血单核细胞也可用作RFHV/KSHV亚 族病毒的载体。在卡波济氏肉瘤(Moore等人,1995b)和Castleman 病(Dupin等人)患者的PBMC中已经检测到KSHV。其它适当的来源是 由这种来源形成的细胞培养物,和得自这种来源的浓缩或分离的病毒制 品。对于阴性对照样品而言,组织可得自相同个体明显未受感染的部位, 或得自明显不会患有此病的匹配个体。

鉴定RFHV/KSHV亚族之成员的方法优选包括或单独地或联合地使用 本发明提供的方法和试剂。

一个方法涉及扩增编码疱疹病毒糖蛋白B的多核苷酸,所述多核苷 酸得自从样品中提取的DNA。例如可通过在如PCR的反应中扩增多核苷 酸来实施此方法。在一个有所变动的方法中,使用如表4所示的那些有 广泛特异性的共有-简并Type1寡核苷酸引发扩增反应,此方法主要扩 增γ型疱疹病毒。由于RFHV/KSHV亚族是一亚组γ疱疹病毒,因此由此 经变动的方法检测的糖蛋白B序列需被鉴定以进一步测定它们是否属于 RFHV/KSHV亚族。在第二个有所变动的方法中,使用如表7所列的那些 RFHV或KSHV特异性的Type3寡核苷酸,或取自这些病毒的其它糖蛋 白B多核苷酸区段引发扩增反应。扩增在低严紧性介质的条件下进行, 以使寡核苷酸与相关种类的病毒交叉-杂交。在更优选的有所变动的方 法中,使用如表6所列的那些RFHV/KSHV亚族特异性的Type2寡核苷 酸引发扩增反应。在适当的杂交条件下,这些引物会优选扩增此亚族疱 疹病毒的糖蛋白B。

使用糖蛋白B多核苷酸探针检测的此亚族的优选成员是那些在SEQ. ID NO:1或SEQ.ID NO:3的残基36-354之间与RFHV或KSHV之糖 蛋白B核苷酸序列至少有65%相同的成员。更优选那些至少约67%相 同的成员;更优选那些至少约70%相同的成员;更优选那些至少约80 %相同的成员;甚至更优选那些至少约90%或更多相同的成员。

通过使用适当的探针对样品中的多核苷酸进行杂交试验也可鉴定亚 族的成员。在例如通过使用Type1或Type2寡核苷酸作为引物,在进行 杂交试验以前,任选扩增欲被检测的多核苷酸。然后在杂交反应中用适 当的经标记的探针检测靶。优选探针含有SEQ.ID NOS:1和3中RFHV 或KSHV的糖蛋白B序列所含的至少21个核苷酸,优选至少约25个核 苷酸,更优选至少约50个核苷酸。甚至更优选探针含有SEQ.ID NOS: 1或3的核苷酸36-354。其它优选的探针包括如表6所示的那些Type2 寡核苷酸。选择的杂交条件允许探针与RFHV/KSHV亚族的糖蛋白B多核 苷酸序列杂交,而不与先前已测序的疱疹病毒,尤其是sHV1,bHV4,eHV2, mHV68,hEBV,hCMV,hHV6,hVZV和HSV1的相应序列杂交。在这些条 件下与受试多核苷酸形成稳定的双螺旋表明在样品中有得自RFHV/KSHV 亚族之成员的多核苷酸存在。

也可以使用Ⅱ类抗体鉴定亚族的成员,所述抗体的制备上文已有 概述。Ⅱ类抗体能与由RFHV/KSHV亚族成员产生的抗原交叉反应,但不 与其它抗原,包括由非亚族成员的疱疹病毒产生的那些抗原交叉反应。 通过例如在对制备自患有上文所列疾病之个体的组织切片进行免疫组化 研究中使用抗体可检测新亚族成员。组织切片被抗体正染色表明样品中 存在RFHV/KSHV亚族之成员的糖蛋白B,这可能是由于组织已被病毒感 染。另外,如果组织切片不能与RFHV和KSHV特异性Ⅲ类抗体反应, 则组织中的糖蛋白B可能来自此亚族的另一个成员。类似地,如果在个 体的循环系统中发现Ⅱ类抗体,这表明个体已经被RFHV/KSHV亚族的 成员现时或既往感染。

一旦通过上述方法中的任何一种鉴定出了推断的新病毒,通过得到 和测序此病毒糖蛋白B基因区域,根据RFHV/KSHV亚族的定义将此区域 与RFHV或KSHV的相应区域进行比较,即可证实其为RFHV/KSHV亚族的 成员。对于RFHV/KSHV亚族的新成员而言,本发明的其它实施方案将致 力于检测、诊断和药物开发的目的。使它们适于新亚族成员的变化如果 是必需的,则希望此变化较小,并且根据新的序列资料是显而易见的, 或者可以常规调节。

RFHV/KSHV亚族之糖蛋白B的变化形式

本发明也包括RFHV/KSHV亚族之糖蛋白B的变化形式。

对于HSV1和hCMV糖蛋白B的自然产生的和经诱导的突变的大量研 究集中于分子的某些区域对于其多种生化功能的作用。例见Reschke等 人和Baghian等人的羧基端氨基酸对融合的作用;Shiu等人和Pellett 等人的表位对中和抗体的作用;Gage等人的涉及合胞体形成的分子区 域;Navarro等人(1992)的涉及病毒侵入和细胞-细胞传播的区域; Quadri等人和Novarro等人(1991)的涉及生物合成过程中糖蛋白B 细胞内转运的区域。

以前已研究过的病毒的糖蛋白B分子和本文所述的糖蛋白B分子之 间的一些所述残基可能是保守的。类似地,预期RFHV/KSHV亚族糖蛋白 B中相同残基的突变具有与所述的其它病毒的相应效应类似的效应。或 者,可以联合不同糖蛋白B分子的功能性区域以产生具有经改变的功能 的糖蛋白B重组体。例如,用非病原体病毒的糖蛋白B基因置换病原体 病毒的相应基因可降低重组体的病原性(Kostal等人)。RFHV/KSHV疱 疹病毒亚族糖蛋白B的突变和重组都可导致减毒株,所述减毒株中感染 性,复制活性或病原性有所降低。本发明中考虑了具有这些效应的糖蛋 白B序列改变。

疱疹病毒的减毒株可用于例如开发多价疫苗。特别是在发展中国家 需要提供能刺激免疫系统同时抗几种潜在的病原体的预防性疫苗。经遗 传工程改造可表达几种不同病原体的免疫原性肽的病毒可实现此目的。 由于疱疹病毒大的基因组可轻易容纳几千个碱基的编码肽的额外DNA, 因此疱疹病毒是特别合适的载体。理想的情况是病毒载体足够完整以表 现出一些生物活性并吸引宿主免疫系统的注意,而同时又被充分减毒以 免引起显著的病理状况。因此,RFHV/KSHV亚族的减毒病毒可用作抗类 似毒性形式的疫苗,并且可以被修饰以表达另外的肽和拓宽免疫保护的 范围。

疱疹病毒减毒形式的另一用途是作为基因疗法的传递载体 (Latchman等人,Glorioso等人)。为了有效,基因疗法中的多核苷 酸必须被传递到靶组织部位。在治疗纤维性疾病,恶性肿瘤和相关疾病 的过程中,由于RFHV/KSHV亚族的减毒病毒载体具有靶向受感染组织的 能力,故优于其它靶向作用机理,包括其它疱疹病毒。在此实施方案中, 病毒先被减毒,然后被修饰以含有基因疗法所需的多核苷酸,如前文所 概述的那些。

RFHV/KSHV亚族疫苗中的糖蛋白B

由于糖蛋白B在感染性病毒的包膜和被感染的细胞上较为显著,因 此预期糖蛋白B能成为免疫效应物的有用的靶。疱疹病毒糖蛋白B一般 是免疫原性的,可引起能中和病毒的抗体并预防此病毒进入复制期。另 外,糖蛋白B能产生T-细胞反应,所述反应通过进攻宿主细胞中病毒 复制的位点可有助于消灭发展中的病毒感染。

本发明包括疫苗组合物,和使用它们预防和处理RFHV/KSHV亚族病 毒感染的方法。

一个系列的实施方案与主动疫苗有关。这些组合物被设计成能刺激 被治疗的个体抗糖蛋白B的免疫应答。它们一般含有糖蛋白B分子,其 免疫原性的片断或变体,或者能表达糖蛋白B分子的细胞或颗粒。或者 它们可含有编码免疫原性的糖蛋白B片断的多核苷酸(Horn等人),优 选的多核苷酸形式是表达载体。多核苷酸疫苗可任选含有如脂质体或病 毒载体颗粒的传递载体,或者可以作为裸露的DNA被施用。

以呈递免疫原性的片断以刺激适当免疫细胞类型的增殖和/或生物 学功能的方式设计本发明的疫苗组合物。目的在于引发抗体反应的组合 物含有或编码B细胞表位,也可含有或编码能增强抗原-呈递细胞的摄 取和展示,或能征集T细胞帮助的其它因子。目的在于产生T辅助细胞, 尤其是CD4+细胞的组合物一般含有在Ⅱ类组织相容性分子的上下文中 能被呈递的T细胞表位。目的在于刺激细胞毒T细胞和它们的前体,尤 其是CD8+细胞的组合物一般含有在Ⅰ类组织相容性分子的上下文中能被 呈递的T细胞表位。

在保护将来可能接触疱疹病毒的个体时,抗体应答可能已足够。预 防性的组合物优选含有可引起B细胞应答的成分。成功地消灭处于发展 中的疱疹病毒感染可能涉及细胞毒T细胞,T辅助-诱导细胞,或这两 者的参与。治疗发展中的感染的组合物优选含有能产生T辅助细胞和细 胞毒T细胞的成分。甚至更优选能优先刺激Type1辅助(TH1)细胞而不 是Type2辅助(TH2)细胞的组合物。有关主动疫苗的适当组合物的制备 和检测在下文中有所概述。

另一系列的实施方案涉及被动疫苗和过继转移的其它材料。这些组 合物一般含有立即准备参与病毒中和或消灭的抗糖蛋白B的特异性免疫 成分。优选使用这些组合物的治疗方法可防止最近暴露于病毒的病理学 结果。它们在不能对主动疫苗发起足够的免疫应答的免疫妥协的个体中 也是优选的。这种个体包括那些具有先天性的免疫缺损,获得性免疫缺 损(如那些被HIV感染或进行肾透析的个体),和那些接受免疫抑制治 疗,如皮质类固醇的个体。

过继转移的适当材料包括如下文所述的针对糖蛋白B的特异性抗 体,也包括免疫细胞的过继转移。例如,针对糖蛋白B反应的T细胞可 取自供体,任选在体外克隆或培养,然后转移到组织相容性受体中。更 优选被转移的细胞是受体自身的细胞,并在体外被刺激。因此,从需要 治疗的个体中纯化T细胞,在糖蛋白B免疫原性成分和适当的刺激因子 的存在下培养T细胞以产生病毒-特异性的细胞,然后重新施用之。

本文所包含的某些组合物可能具有主动疫苗和被动疫苗这两者的特 性,例如,由过继转移得到的糖蛋白B抗体可赋予即时的抗疱疹病毒的 保护,也可通过抗-独特型网络,或通过增强病毒抗原的免疫呈递来刺 激发展中的应答。

含有糖蛋白B多肽的疫苗

刺激抗糖蛋白B的免疫应答的疫苗的特异性成分包括完整的糖蛋白 B分子和对于宿主而言为免疫原性的糖蛋白B片断。

通过上文所述的任何方法,尤其是由含有编码糖蛋白B的多核苷酸 的适当表达载体纯化可制备完整的糖蛋白B及其较长的片断。得自其它 病毒株的分离的糖蛋白B刺激保护性免疫应答(见美国专利号 5,171,568;Burke等人)。优选的片断含有完整的病毒包膜外部暴露 的分子区域;位于成熟蛋白质N-末端的约650个氨基酸内。

糖蛋白B的糖基化并不是免疫原性所必需的(O’Donnell等人), 因此,同样优选糖基化和非糖基化形式的分子。由标准技术可测定糖基 化;例如,在用商购的F或H型内切糖苷酶处理之前和之后在SDS聚丙 烯酰胺凝胶电泳中比较蛋白质的迁移率。

含有糖蛋白B特殊表位的5-50个氨基酸的较小片断也是适当的疫 苗成分。通过上文所述的任何方法可制备这些片断;最方便的方法是化 学合成。优选的片断是那些免疫原性的和在病毒包膜外部表达的片断。 甚至更优选涉及糖蛋白B生物学功能的片断,所述功能如与细胞表面的 受体结合或病毒穿透靶细胞。

可由本技术中已知的规则推测多种表位的免疫原性。通过例如鉴定 可变的极性区可测定B细胞受体的抗原性区域(Hopp等人,见实施例9)。 通过例如鉴定能在组织相容性分子的呈递沟中形成两亲性螺旋的区域可 测定T细胞受体的抗原性区域。通过与其它病毒种类的糖蛋白B分子的 类比也可鉴定抗原性区域。例见Sanchez-Pescador等人和Mester等人 的HSV1之B细胞表位;Liu等人的hCMV之HLA-限制的T辅助细胞表 位;和Hanke等人的HSV1之细胞毒T淋巴细胞表位。

通过多种不同的技术可实验性地测量多种表位的免疫原性。这些技 术一般包括制备含有潜在的抗原性区域的长为5-20个氨基酸的蛋白质 片断,并在特异性的生物试验中检测它们。通过CNBr和/或蛋白酶裂解 降解糖蛋白B的较大区段,并通过例如凝胶电泳和印迹到硝酸纤维素上 纯化可制备片断(Demotz等人)。通过标准的肽合成也可制备片断 (Schumacher等人,Liu等人)。在优选的方法中,使用尼龙膜支持物 上的F-Moc化学,根据成熟的糖蛋白B分子的整个细胞外区域合成有8 个残基重叠的12个氨基酸的连串肽(见实施例11)。

然后测定暴露于完整病毒或糖蛋白B成分的个体的样品中针对经制 备的片断的反应性。通过故意施用已将此个体实验性地暴露于糖蛋白B 成分,或者,此个体已自然发生病毒感染,此自然感染优选通过阳性扩 增反应来证实,所述扩增反应使用糖蛋白B或DNA聚合酶的病毒-特异 性寡核苷酸探针。通过标准技术从个体中取得血液样品,并用于制备血 清,T细胞,和外周血单核细胞(PBMC)。

可在酶联免疫吸附测定法中检测血清中糖蛋白B特异性抗体的存 在,例如,将与如尼龙膜的固相支持物结合的肽与血清一起保温,洗涤, 与酶联抗-免疫球蛋白一起保温,和使用酶底物显色。试验孔中反应产 物水平比含有不相关肽的孔中反应产物的水平高显示针对特殊的糖蛋白 B肽的抗体的存在(实施例11)。

可在增殖试验中检测淋巴细胞制品中糖蛋白B特异性T辅助细胞的 存在。在自身扩散或扩散的作为抗原呈递细胞的105个PBMC存在的条件 下,将约2×104个T辅助细胞与10-4-10-6M的肽一起保温约3天。在 培养的约最后16小时加入[3H]胸苷,然后收获细胞并洗涤,经洗涤的细 胞的放射性水平比那些在缺乏肽的条件下培养的细胞高约10倍反映了 特异于此肽的T细胞的增殖(Liu等人)。如有必要,可克隆具有CD3+ 4+8-表型的细胞以进一步鉴定T辅助细胞反应。

在51Cr释放试验中检测淋巴细胞制品中糖蛋白B特异性细胞毒T细 胞的存在。通过用含有可表达的糖蛋白B基因的疱疹病毒感染同种异型 细胞来制备靶,或者,可使用被糖蛋白B表达载体转染的同种异型细胞。 在37℃将靶与51Cr保温约90分钟,然后洗涤。在37℃将约5×104个 靶细胞与10-4-10-5M的肽和0.1-2×104个试验T细胞保温约30分钟。 释放至上清液中的放射性水平比自发裂解产生的放射性高反映了CTL活 性。如有必要,可克隆具有CD3+4-8+表型的细胞以进一步鉴定CTL反 应。

在疫苗中,糖蛋白B肽可任选与相同病毒的其它肽联合,适当的肽 包括疱疹病毒任何其它成分的肽,如糖蛋白C,D,H,E,I,J和G。糖 蛋白B肽也可任选与不同病毒的免疫原性的肽联合以提供抗不止一种病 原性有机体的多价疫苗。通过制备肽溶液的混合物,或通过合成多种肽 成分相连的融合蛋白可联合肽。

含有适当表位的糖蛋白B形式可任选被化学处理以增强它们的免疫 原性,尤其是如果它们含有100个或更少的氨基酸时。这种处理可包括 例如与戊二醛交联;与如匙孔血蓝蛋白(KLH)或破伤类毒素的蛋白 质载体连接。

肽或肽混合物可单独使用,但正常情况下将与生理学和药物学可接 受的赋形剂联合,所述赋形剂如水,盐水,生理缓冲盐水或糖溶液。

在优选的实施方案中,主动疫苗也含有佐剂,佐剂可增强免疫原的 呈递或要不然的话强调针对免疫原的免疫应答,所述佐剂如明矾,氢氧 化,β-2微球蛋白(WO 91/16924:Rock等人),胞壁酰二肽,胞 壁酰三肽(美国专利号5,171,568:Burke等人)和单磷脂A(美国专 利号4,436,728:Ribi等人;和WO 92/16231:Francotte等人)。也 可存在如白介素2的免疫调节剂。肽和其它成分(如果有的话)任选被 包裹于脂质体或微球体中。多种佐剂的实验性检测的概述见美国专利号 5,171,568(Burke等人)。多种佐剂有效。佐剂的选择至少部分取决 于在佐剂存在下疫苗的稳定性,施药的途径,和尤其是当给人使用时佐 剂的调节接受性。

多肽疫苗一般具有宽的有效范围,通常的施药途径是肌内,但也要 开发通过其它途径给药也有效的制品,所述其它途径包括静脉内,腹膜 内,口腔,鼻内和通过吸入给药。肌内给药的每剂量疫苗中糖蛋白B多 肽的总量一般约为10μg-5mg;通常约为50μg-2mg;更通常约为100 -500μg。优选首先以引发剂量施用疫苗,然后通常在至少4周后,再 以加强剂量施用疫苗,可在定期的基础上以进一步加强的剂量给药以增 强或复壮反应。

含有表达糖蛋白B的病毒颗粒的疫苗

主动疫苗也可被制备成表达糖蛋白B免疫原性表位的颗粒。

一个这种疫苗含有重组疱疹病毒的L-颗粒(见美国专利号 5,284,122:Cunningham等人)。重组病毒基因组中的衣壳成分有缺陷, 或要不然的话不能形成完整的病毒;然而,它保留了制备L-颗粒的能 力。经遗传工程改造的基因组包括与重组病毒的控制元件有效相连的本 发明编码糖蛋白B的多核苷酸。然后例如在经培养的细胞中培养病毒, 通过在适当的梯度,如FICOLLTM中离心以纯化此颗粒。这种制品不含有 感染性的病毒,并能表达大量不同的合乎需要的表位的肽成分。

另一个这种疫苗含有将本发明的糖蛋白B作为异源抗原表达的活病 毒,这种病毒包括HIV,SIV,FIV,马感染性贫血症病毒,维斯纳病毒 和其它种类的疱疹病毒。被处理的病毒种应该是天生非病原性的;或者 应该通过遗传修饰例如降低复制或毒力以减毒。通过突变涉及复制的基 因,如DNA聚合酶基因也可使疱疹病毒减毒。通过缺失必需的晚期成分, 如糖蛋白H也可使疱疹病毒减毒(WO 92/05263:Inglis等人)。活疫 苗可以在宿主中低水平地复制,这样做的特殊条件是能增强蛋白质的表 达,但不至于在被治疗的受试者中引起任何病理学表现。

优选的制备活疫苗的病毒种类是腺病毒。对于治疗人而言,人腺病 毒4型和7型已显示出没有副作用,适合将它们用作载体。因此,本发 明的糖蛋白B多核苷酸可以被遗传工程改造,例如插入病毒基因组的E1 或E3区域。已知表达HSV1或HSV2的糖蛋白B的腺病毒载体能刺激高 滴度的可中和病毒的抗体产生(McDermott等人)。此反应可保护实验 动物抵抗各个活病毒的致死量攻击。

活重组疫苗中的病毒也优选重组痘病毒,尤其是痘苗。甚至更优选 已经被修饰以灭活非必需的毒力因子的痘苗病毒株,所述修饰为缺失或 插入与所述因子相关的开放阅读框(美国专利号5,364,773:Paoletti 等人)。为了制备疫苗,将本发明编码糖蛋白B的多核苷酸经遗传工程 改造插入病毒基因组,并在痘苗病毒启动子的控制下表达。这种类型的 重组体可直接用于以每剂量约107-108个噬斑形成单位来免疫接种。单 次剂量足以刺激抗体应答。含有HSV1的糖蛋白B的痘苗病毒重组体可 有效保护小鼠抵抗致死量的HSV1感染(Cantin等人)。

这一类型的另一个疫苗是自我装配的复制缺陷型杂合病毒。例见WO 92/05263(Inglis等人)。此颗粒可含有例如衣壳和包膜糖蛋白,但 不含有完整的病毒基因组。病毒包膜中的一个糖蛋白是本发明所包含的 糖蛋白B。

在优选的实施方案中,通过第一类病毒载体以及异源种类的衣壳和 包膜编码区生产颗粒,所述第一类病毒载体具有足够的该种类基因组区 段以进行复制(见美国专利号5,420,026:Payne)。选择第一种类的 遗传元件以使载体对真核细胞的感染产生能自我装配成复制缺陷型颗粒 的衣壳和包膜糖蛋白。在此实施方案的变体中,由衍生自第一病毒种类 的两个分离的载体提供编码衣壳和包膜糖蛋白的多核苷酸。衣壳编码区 可得自慢病毒属,如HIV,SIV,FIV,马感染性贫血症病毒或维斯纳病 毒。包膜编码区含有本发明编码糖蛋白B的多核苷酸。优选所有的包膜 成分由疱疹病毒,尤其是RFHV/KSHV亚族的疱疹病毒编码。通过用载体 感染敏感的真核细胞系,如BSC-40并在约18小时后收获上清液能得到 有缺陷的病毒颗粒。如有必要,可通过穿过蔗糖垫层离心进一步纯化病 毒颗粒。在作为疫苗施用前也可以在40℃下用0.8%的福尔马林将颗粒 处理24小时。

含有活的减毒病毒或病毒类似物的疫苗可被冻干以冷藏。稀释剂可 任选包括组织培养基,山梨醇,明胶,碳酸氢钠,白蛋白,盐水溶液, 磷酸盐缓冲液和无菌水。可任选加入其它活性成分,如麻疹,腮腺炎和 风疹病毒的减毒株以产生多价疫苗。通过例如气注技术可使悬浮液冻 干。按下述进行冻干:将疫苗小管放入预冷至约-45℃并充有10-18Pa 干燥无菌氩气的冻干室中,每小时将温度升高约5-25℃直至温度达+30 ℃,在完全真空条件下进行第二次冻干循环,然后在氩气下以一般性的 方式密封小管(见EP0290197B1:Mcaleer等人)。对于含有活疱疹病 毒的疫苗,最终的冻干制品优选含有2-8%的水分。

据认为主动疫苗的大量可替换的组合物不局限于本文详细描述的那 些,都能有效引发特异性B-和T-细胞免疫力。所有这种组合物都包 括在本发明的精神中,条件是它们包括作为活性成分的RFHV/KSHV亚族 糖蛋白B多核苷酸或多肽。

含有糖蛋白B抗体的疫苗

通过过继转移施用针对RFHV/KSHV亚族糖蛋白B的抗体以直接赋予 被治疗的受试者一定的体液免疫力。被动施用抗糖蛋白B的抗体甚至可 实验性地保护T-细胞免疫妥协的受试者以抵抗其它疱疹病毒的致死量 攻击(Eis-Hubinger等人)。

需要抗糖蛋白B的保护作用,所用的抗体分子应该针对糖蛋白B。 所述抗体应不与其它抗原,尤其是被治疗的受试者的内源性抗原交叉反 应。抗体可特异针对整个RFHV/KSHV亚族(Ⅱ类抗体),或者针对特殊 的病毒种类(Ⅲ类抗体),这取决于治疗的目的。优选抗体对多价抗 原的全部亲和性至少约为108M-1;更优选至少约为1010M-1;更优选至 少约为1012M-1;甚至更优选至少约为1013M-1或更高。可使用完整的抗 体分子,重组体,融合蛋白或抗体片断;然而,优选能表达天然抗体效 应物功能的完整的抗体分子或重组体。相关的效应物功能包括但不局限 于病毒聚集;依赖于抗体的细胞的细胞毒性;补体激活;和调理作用。

根据上文提供的描述可制备抗体。对于全身性保护而言,优选抗体 是单体,并优选抗体为IgG类单体。对于粘膜保护而言,抗体可以是多 聚体,优选是IgA类多聚体。抗体可以是单克隆的也可以是多克隆的; 典型地优选单克隆抗体的混合物。也优选得自最初抗体来源的其它生物 学成分基本上纯净的制品。纯化后可加入具有所需反应性的其它抗体分 子,和载体或稳定剂。

在有些情况下,需要抗体与需被治疗的种的抗体尽可能地密切相 似。这可预防被施用的抗体将其自身变成受体免疫应答的靶。当受试者 具有主动免疫系统,或当抗体以重复的剂量被施用时这种类型的抗体尤 其合乎需要。

因此,本发明包括人或人源化的抗-糖蛋白B的抗体。可从先前已 被各个RFHV/KSHV亚族疱疹病毒感染的人个体血清中,或施用了主动疫 苗的志愿者中纯化多克隆的人抗体。可由得自这种个体的例如外周血的 淋巴细胞产生单克隆的人抗体。一般可根据上文概述的方法产生人杂交 瘤。通常,稳定的人杂交瘤的产生需要多种技术的联合,如既与人骨髓 瘤细胞系融合又用例如EBV转化。

在优选的方法中,由具有功能性人免疫球蛋白基因座的嵌合的非灵 长类动物产生人抗体(WO 91/10741:Jakobovits等人)。非灵长类动 物株(典型地为小鼠)不能表达内源性免疫球蛋白的重链,并且最理想 的情况下也不表达至少一个内源性免疫球蛋白的轻链。此动物经遗传工 程改造可以表达人重链,并且最理想的情况下也能表达人轻链。用 RFHV/KSHV亚族疱疹病毒的糖蛋白B接种这些动物,然后用它们的血清 制备多克隆抗体,用它们的淋巴细胞以一般性的方式制备杂交瘤。适当 选择和纯化后,所得抗体是具有所需特异性的人抗体。

在另一个优选的方法中,首先在如小鼠等的另一种类中开发针对糖 蛋白B的具有所需特异性的单克隆抗体,然后再人源化。为了使抗体人 源化,可分离编码特异性抗体的多核苷酸,得到抗原结合区,然后与编 码不相关特异性的人免疫球蛋白元件的多核苷酸重组。或者,得到特异 性抗体的核苷酸序列,并将此序列用于设计具有人特性的相关序列,通 过例如化学合成可制备所述序列。用所需类型的人免疫球蛋白的恒定区 取代特异性抗体的重链恒定区或轻链恒定区,优选同时取代这两者。优 选互补决定区(CDR)外部的这两条链的可变区区段也被它们的人等价 物取代(EP 0329400:Winter)。

甚至更优选可变区区段被它们的人等价物取代,条件是它们不涉及 抗原结合或结合位点结构的维持。例如按Padlan所述可鉴定重要的氨 基酸。在一个特定的技术中(WO 94/11509:Couto等人),使用已知 免疫球蛋白的序列和晶体学资料得到位置共有序列。将糖蛋白B特异性 抗体的氨基酸序列与模式序列相比较,鉴定出涉及抗原结合,与CDR接 触,或与相反链接触的氨基酸。在需要时可改变其它氨基酸使它们与人 免疫球蛋白序列的共有序列一致。然后制备编码人源化序列的多核苷 酸,将所述多核苷酸转染至宿主细胞,并用于产生具有与最初得到的抗 体克隆相同的糖蛋白B特异性的人源化抗体。

使用这些方法中的任何一种得到的特异性抗体一般是无菌的,并与 药物可相容的赋形剂混合。也可存在如0.3摩尔甘氨酸等的稳定剂和如 1∶10,000乙基汞硫代水杨酸钠等的防腐剂。通过例如碳酸钠可将悬浮 液缓冲至中性pH(-7.0)。通过加入正常的人IgG可任选地调节效力, 所述IgG是通过例如Cohn冷乙醇分级方法从正常血浆大库中得到的。 如白蛋白溶液等的其它稀释剂可用作替换物。调节浓度以使单剂量施用 为0.005-0.2mg/kg,优选约0.06mg/kg。优选单剂量导致循环水平的 抗-糖蛋白B,这可由ELISA或其它适当的技术来测定,所述水平可与 在已接受过主动的糖蛋白B疫苗或已从相应病毒的急性感染中恢复的个 体,或从实验工作中已知具有抗病理剂量的病毒攻击的保护作用的个体 中观察到的水平相比。

一般应通过肌内而不是静脉内注射进行施药,应小心操作以确保针 头不进入血管。对于施用了人白蛋白后有全身性变态反应病史的个体应 格外小心。如上文所述,对于预防性应用而言,抗体制品可任选与针对 糖蛋白B的主动疫苗联合施用。对于暴露后的施用而言,优选在暴露1 周内施用抗体制品,更优选在24小时内,或暴露后尽可能地马上施用 抗体制品。任选以约3个月的间隔给予下一剂量。

至于本文所述的所有治疗仪器,所用组合物的量,和施药的适当途 径和时间表取决于临床状况和被治疗的特殊个体的需要。特殊方案的选 择最终是开药的医生或兽医的责任。

前文描述特别地提供了有关疱疹病毒,尤其是RFHV/KSHV亚族的那 些病毒的糖蛋白B编码区如何被鉴定和它们的序列如何被得到的详细解 释。提供了RFHV和KSHV糖蛋白B编码区域的多核苷酸序列。

据信本文所列的RFHV和KSHV的多核苷酸序列是用于此研究之组织 样品中疱疹病毒多核苷酸所含序列的精确复本,它们表示得自多个克隆 的共有序列资料。然而据认为由如PCR的扩增方法得到的序列可能由于 扩增而在序列中含有偶然的错误。对于单次测定而言,估计错误率在约 0.44%至0.75%之间;对于总共n个不同的测定而言,错误率约为相同 的频率被√(n-1)除。不过,错误率可能高至1%或更高。通过制备疱疹 病毒多核苷酸序列文库,使用如表7所提供的那些寡核苷酸选择相关克 隆,并测定选定克隆中DNA的序列即可得到没有扩增错误的序列。相关 的方法学是本领域普通技术人员所熟知的,他们也许希望参考下文实施 例中的描述。

据认为出现了疱疹病毒的等位变体和逃逸变体,在不违背本发明精 神的前提下,可分离或得到掺入突变的多核苷酸和多肽,所述突变或者 为自然产生,或者为偶然地或故意地诱导产生。

提供下文所示实施例是为了进一步指导本领域的普通技术人员,而 不是以任何方式限制本发明。

                           实施例

实施例1:疱疹病毒糖蛋白B的寡核苷酸引物

已知的疱疹病毒糖蛋白B的氨基酸序列得自PIR蛋白质数据库,或 衍生自得自GenBank数据库的DNA序列,序列是通过计算机辅助的排列 程序和通过手工排列的。

结果示于图3,使用sHV1,bHV4,mHV68,EBV和hHV6序列鉴定尤 其在γ疱疹病毒中相对较保守的区域。选择九个区域设计扩增引物。然 后将这些区域的DNA序列用于设计寡核苷酸引物,引物被设计成在3’ 末端具有8-14碱基对的简并区段,在5’末端具有18-30碱基的共有 区段。这可提供具有最适敏感性和特异性的引物。

简并区段延伸跨越了疱疹病毒糖蛋白B序列的高度保守的区域,该 区域包含最少数目的可替换密码子。因此引物可以在简并位置用可替换 的核苷酸残基合成并产生最少数目的组合。所得到的每个引物有不超过 256个的可替换形式。

共有区段衍生自糖蛋白B序列的相应侧翼区域。通常,通过选择被 分析的所有糖蛋白B序列的每个位置处最经常出现的核苷酸可得到共有 区段。然而,更倾向于选择C或G核苷酸以使引物形成稳定双螺旋的能 力最大化。

结果示于图4-12,并概括于表4。在PCR中,通过与编码链的反 义链杂交,并在与糖蛋白B编码序列的相同方向上起动聚合可将表4中 所列的具有“有义”方向的寡核苷酸用作引物。表4中所列的具有“反 义”方向的寡核苷酸会与编码链杂交并在与糖蛋白B编码序列相反的方 向上起动聚合。

根据设计好的序列的合成寡核苷酸订购自Oligo Etc,Inc。

实施例2:DNA提取

活组织检查的样本得自被诊断为患AIDS的人受试者的卡波济氏肉 瘤损害,样本被固定于低聚甲醛中并包埋于石蜡中,如此进行以供正常 的组织学检查。

在1.5ml的EPPENDORFTM圆锥形离心管中用500μl的二甲苯提取石 蜡样品的片段。在室温下将样品缓慢摇晃5分钟,将试管置于 EPPENDORFTM台式离心机中,以14,000rpm的转速离心5分钟。用巴氏 吸管除去二甲苯后,加入500μl 95%的乙醇,重新悬浮样品,然后再 离心。除去乙醇,重复洗涤步骤。再将样品自然干燥约1小时,加入500μl 蛋白酶-K缓冲液(0.5%TWEENTM 20,一种去污剂;50mM Tris缓冲液, pH7.5,50mM NaCl)和5μl蛋白酶K(20mg/ml),将样品在55℃下 保温3小时。通过在95℃下保温10分钟使蛋白酶K失活。

收集得自KS组织的DNA样品以提供用于扩增反应的多核苷酸的一 致的来源。如共同拥有的美国专利申请60/001,148中所述,通过KSHV DNA 聚合酶序列的扩增可检测出此收集物中含有得自KSHV的DNA。

实施例3:得到KSHV糖蛋白B的经扩增区段

根据下述方法,使用实施例1中得到的寡核苷酸扩增实施例2中从 KSHV组织提取的DNA区段。

使用2μl收集的DNA模板,1μl寡核苷酸FRFDA(50pmol/μl),1μl 寡核苷酸TVNCB(50pmol/μl),10μl 10×缓冲液,1μl含有2.5mM的 各种脱氧核糖核苷酸三磷酸(dNTPs),65μl蒸馏水和65μl矿物油进 行第一次PCR反应。在Perkin-Elmer(Model 480)PCR仪中将混合物 加热至80℃,再加入0.5μl Taq聚合酶(BRL,5U/μl)和19.5μl水。 以下列顺序进行35次扩增循环:94℃1分钟,退火温度1分钟和72℃1 分钟。第一次循环中退火温度是60℃,每次循环降低2℃直至达到50℃, 使用50℃作为退火温度进行其余的循环。

按下述进行第二次PCR反应:在前一步骤的1μl反应混合物中加入 1μl寡核苷酸NIVPA(50 pmol/μl),1μl寡核苷酸TVNCB(50pmol/μl), 10μl 10×缓冲液,1μl dNTPs,66μl水和65μl矿物油。将混合物加热 至80℃,加入于19.5μl水中的0.5μl Taq聚合酶。使用与上相同的温 度逐步降低的方法进行35次扩增循环。通过在2%的琼脂糖凝胶上电泳 和用溴化乙锭染色来分析PCR产物。

使用14个试验缓冲液进行两轮扩增,5个缓冲液产生的PCR产物的 大致的大小由与其它疱疹病毒序列类似的方法推测。这些缓冲液包括WB4 缓冲液(10×WB4缓冲液是:0.67M Tris缓冲液,pH8.8,40 mM MgCl2, 0.16M(NH4)2SO4,0.1Mβ-巯基乙醇,1mg/ml牛血清白蛋白,此缓冲 液在反应时被稀释10倍)。也试验了WB2缓冲液(与WB4缓冲液相同, 除了在10倍浓缩液中为20 mM MgCl2)。另外还试验的缓冲液当稀释至 最终的反应体积时含有10mM Tris,pH8.3,3.5mM MgCl2和25mM KCl; 或10mM Tris,pH8.3,3.5 mM MgCl2和75mM KCl;或10mM Tris,pH8.8, 3.5 mM MgCl2和75mM KCl。 WB4缓冲液显示了最强的带,和一些另外的 较微弱的带。这可能是由于WB4样品中经标记的扩增的多核苷酸的总量 较多的原因。

选择用WB2缓冲液扩增的产物以进一步研究。进行第三轮循环以引 入放射性标记。用γ32P-ATP末端标记最后使用的寡核苷酸(TVNCB), 在得自前一扩增步骤的20μl反应混合物中加入γ32P-ATP和1μl 25mM dNTP。将混合物加热至80℃,加入0.5μl Taq聚合酶。经过94℃,60 ℃和72℃的5轮循环进行扩增,使用8.8μl得自Circumvent测序凝胶 试剂盒的上样缓冲液终止反应。

于51℃在6%的聚丙烯酰胺测序凝胶上将经放射性标记的反应产物 的~4μl等分试样电泳1.5小时,将凝胶干燥1.5小时,通过暴露12 小时产生放射性自显影,鉴定两个带,较大的带具有类似于其它γ疱疹 病毒序列的片断的预期大小。

较大的带被标明并切下,通过在40μl TE缓冲液(10mM Tris和1mM EDTA,pH8.0)中保温洗脱DNA。使用1μl洗脱液,10μl 10×WB2缓冲 液,1μl 2.5mM dNTP,1μl第二套寡核苷酸引物中的每一种(NIVPA和 TVNCB)和65μl水对提取的DNA进行进一步的扩增反应。将混合物加热 至80℃,加入于19.5μl水中的0.5μl Taq聚合酶。使用与上相同的温 度逐步降低的方法进行35次扩增循环。

实施例4:KSHV糖蛋白B的386个碱基之片段的序列

根据下述方法纯化和克隆KSHV糖蛋白B基因的经扩增的多核苷酸 片断。

在2%的琼脂糖凝胶上电泳40μl扩增产物,并使用0.125μg/ml溴 化乙锭染色。切下约400个碱基对的单带,并使用QIAGENTMⅡ凝胶提取 试剂盒,根据厂商的说明纯化此带。

将经纯化的PCR产物连接到pGEMTM-t克隆载体上,使用载体转化 感受态细菌(大肠杆菌JM-109)。挑选并培养含有经扩增之DNA的细 菌克隆。裂解细菌,并接着使用酚氯仿通过乙醇沉淀来提取DNA。使 用含有正确大小的插入物的菌落得到DNA以测序。根据厂商的说明,借 助于SEQUENASETM 7-脱氮dGTP试剂盒,使用载体-特异性寡核苷酸(正 向和反向引物)从两端测定克隆插入物的序列。通过将得自一个KSHV糖 蛋白B扩增产物的5个克隆的序列资料联合可得到新片断的共有序列。

引物杂交区域之间的片段长度为319个碱基对。核苷酸序列列为SEQ. ID NO:3并示于图1。被编码的多肽序列列为SEQ.ID NO:4。

图13比较了糖蛋白B基因片断的序列与其它γ疱疹病毒的相应序 列。单点(.)表示其它γ疱疹病毒中与KSHV序列相同的残基。短横(-) 表示加入缺口以提供被编码的蛋白质的最佳排列的位置。在KSHV序列 和任何其它已列出的序列之间相同的最长一段连串核苷酸是14个。短 的保守序列散布于整个片断。总的来说,KSHV和两个最接近的疱疹病毒 sHV1和bHV4的序列之间的多核苷酸片断有63%相同。

使用序列资料设计长度为20-40个碱基对的Type3寡核苷酸引物, 引物被设计成优先与KSHV糖蛋白B多核苷酸杂交,而不与其它已测序 的编码糖蛋白B的多核苷酸杂交。这种引物的例子已列入上文的表7。

图14比较了由相同的糖蛋白B基因片断编码的推测的氨基酸序列。 在氨基酸水平上,KSHV和先前已知的γ疱疹病毒bHV4共用两个短区段, 第一个(SEQ.ID NO:64)长度为13个氨基酸,位于片断的N-末端附 近,第二个(SEQ.ID NO:65)长度为15个氨基酸,位于片断的C-末 端附近。KSHV和其它γ疱疹病毒共用的所有其它区段为9个氨基酸或更 短。

实施例5:RFHV糖蛋白B的386个碱基之片段的序列

组织样本得自华盛顿大学地方灵长类动物研究中心的豚尾猴肿瘤。 样本被固定于低聚甲醛中并包埋于石蜡中,根据实施例2中的方法从样 本中提取DNA。

通过使用与DNA聚合酶基因杂交的寡核苷酸引物进行PCR扩增反应 来测定DNA制品中RFHV多核苷酸的存在。此方法的细节见共同拥有的 美国专利申请60/001,148。收集以这种方式测定的含有RFHV多核苷酸 的DNA提取物以用于本研究。

含有RFHV多核苷酸的DNA制品用作PCR扩增反应中的模板,所述 扩增反应的第一轮使用糖蛋白B共有简并寡核苷酸FRFDA和TVNCB, 第二轮扩增使用寡核苷酸NIVPA和TVNCB。条件基本上与实施例3中的 相同,不同的是用最初来源的DNA量和所用的条件只有WB4缓冲液产生 很亮的带。与上文相同,用32P末端标记的NIVPA标记经扩增的DNA; 在6%的聚丙烯酰胺凝胶上电泳产物,得到放射性自显影。观察到对应 于约386个碱基对和约10个较高分子量的多联体的带的阶梯。从凝胶 上切下386个碱基对的带(与同时电泳的KSHV片断的迁移率相同)并 提取之。

为了测定此提取物中的DNA是否得自特殊的扩增反应,仅使用 NIVPASQ,仅使用TVNCBSQ或同时使用这两个引物建立PCR。缓冲液的 条件与最初的扩增反应相同,混合物被加热至80℃,加入Taq聚合酶, 使用温度逐步降低的方法进行35轮扩增循环。理论上说,当使用一个 引物时,特异性扩增反应按线性方式积累产物,当使用方向相反的两个 引物时,则按指数方式积累产物。因此,通过使用两个引物的反应中产 物更多可以显示特异性,而在所有三个混合物中产物相等则暗示了非- 特异性扩增。在被溴化乙锭染色的琼脂糖凝胶上分析这些检测反应中得 到的扩增产物,RF提取物未显示出有NIVPASQ反应的产物,它在适当的 迁移率处,有TVNCBSQ反应的中度染色的带,对于同时使用两个引物的 反应而言有强染色的带。对于平行检测的KSHV片断而言,有NIVPASQ 反应的微弱的带,没有TVNCBSQ反应的带,对于同时使用两个引物的反 应而言有强染色的带。我们推断出RF提取物中的386个碱基对的带表 示特异性的扩增产物。

因此,在制备性的2%琼脂糖凝胶上电泳40μl已用这两种引物扩 增的RF提取物,切下~386个碱基对的带,使用QIAGENTM试剂盒除去 琼脂糖,如实施例4中所述将产物克隆到E.coli中并测定产物的序列。 测定得自相同的经扩增的RFHV产物的3个不同克隆的共有序列。

将RFHV糖蛋白B片断的多核苷酸序列(SEQ.ID NO:1)与KSHV 的相应序列一起排列于图1中,还显示了被编码的RFHV氨基酸序列(SEQ. ID NO:2)。在引物杂交区域之间(核苷酸36-354),多核苷酸序列 有76%相同:氨基酸序列有91%相同。在这两种病毒之间,内在的半 胱氨酸残基和潜在的N-糖基化位点都是保守的。

使用序列资料设计长度为20-40个碱基对的Type3寡核苷酸引物, 引物被设计成优先与RFHV糖蛋白B多核苷酸杂交,而不与其它已测序 的编码糖蛋白B的多核苷酸杂交。这种引物的例子已列入上文的表7。

图15比较了由糖蛋白B基因片断的核苷酸36-354编码的推测的 氨基酸序列。至于KSHV序列,RFHV和先前已知的γ疱疹病毒bHV4共 用两个短区段。RFHV和其它γ疱疹病毒共用的所有其它区段的长度小于 9个氨基酸。

图16是可得到序列资料的疱疹病毒范围中相同糖蛋白B片断的序 列资料排列。图17根据图16所示的糖蛋白B部分氨基酸序列的同一性 程度,显示了疱疹病毒之间系统发育的关系。根据所示病毒中氨基酸的 同源性,RFHV和KSHV与bHV4,eHV2和sHV1最密切相关。

实施例6:RFHV/KSHV亚族的寡核苷酸引物和探针

以针对RFHV和KSHV得到的多核苷酸片断为基础,设计了7个Type2 寡核苷酸,所述寡核苷酸可用作RFHV/KSHV亚族成员的PCR引物或杂交 探针。

图17显示了四个共有-简并Type2寡核苷酸,即SHMDA,CFSSB, ENTFA和DNIQB,排在一起的是衍生它们的序列。与实施例1中的寡核 苷酸类似,在5’末端具有共有区段,在3’末端具有简并区段。然而, 这些寡核苷酸仅以RFHV和KSHV的序列为基础,因此优先与RFHV/KSHV 亚族的糖蛋白B形成稳定的双螺旋。上文表6显示了一列Type2寡核苷 酸的例子。

不同的Type2寡核苷酸具有有义或无义方向。在PCR扩增中可同时 使用具有相反方向的引物,或者,Type2寡核苷酸可与具有相反方向的 Type1寡核苷酸联合使用。

实施例7:上游和下游的糖蛋白B序列

进行进一步的扩增反应以得到另外的序列资料。KSHV DNA的来源 是根据实施例2制备的或者是冷冻的组织或者是石蜡-包埋组织的卡 波济氏肉瘤组织,或由具有KSHV病原学的癌症,如体腔淋巴瘤形成的 细胞系。经培养增殖的KSHV也适合(Weiss等人)。

得到编码链5’方向上进一步的序列资料的一般策略是将与片断上 游杂交的共有-简并(Type1)寡核苷酸作为5’引物,并与作为3’引物 的最接近的病毒-特异性(Type3)寡核苷酸联合使用以进行扩增反应。 因此,例如使用FRFDA和TNKYB作为第一套引物进行第一系列的扩增循 环,任选接着使用例如FRFDA和GLTEB作为第二套引物进行第二系列的 扩增循环。

所用的条件类似于实施例3和4中所述的那些。使用实施例3中所 述的温度逐步降低法在WB4缓冲液中进行反应,两轮扩增后,使用经γ32p -ATP末端标记的最后使用的病毒-特异性寡核苷酸(此时为GLTEB) 标记产物。在6%聚丙烯酰胺上电泳经标记的产物,切下对应于通过与 其它疱疹病毒的类比预测的适当大小的带。重新扩增之后,如前文所述 纯化,克隆和测序产物,通过联合约3个测定的结果得到了新片断的共 有序列。

为了得到编码链3’方向上进一步的序列资料,可将与片断下游杂 交的共有-简并(Type1)寡核苷酸作为3’引物,并与作为5’引物的最 接近的病毒-特异性(Type3)寡核苷酸联合使用以进行扩增反应。在 一个实施例中,使用NVFDB和TVFLA进行第一系列的扩增循环,任选接 着使用NVFDB和SQPVA进行第二系列的扩增循环。如前文所述进行扩增 和测序。使用新序列设计具有有义方向的另一个Type3寡核苷酸,它与 其它能与下游杂交的Type1寡核苷酸(如FREYB和NVFDB)一起使用能 得到进一步的序列资料。或者,使用具有相反方向的Type1寡核苷酸能 得到3’方向上进一步的序列资料:例如,两个引物选自FRFDA,NIVPA, TVNCA,NIDFB,NVFDB和FREYB;可选择另外的引物以进行嵌套扩增。

为了得到最下游的寡核苷酸引物的3’端的序列资料,可将如CYSRA 的Type1引物,或如TVFLA的Type3引物与同DNA聚合酶基因5’末端 杂交的引物联合使用。在共同拥有的美国专利申请60/001,148中描述 了能与疱疹病毒的DNA聚合酶基因杂交的寡核苷酸引物,所述疱疹病毒 与RFHV和KSHV相关。DNA聚合酶编码区位于糖蛋白B编码区的3’端。 预期使用这种联合引物进行的PCR扩增出的多核苷酸含有糖蛋白B编码 区的3’末端,可能有的任何插入序列,和DNA聚合酶编码区的5’末端。

此策略按下述实施:

从被称为RiGr的冷冻的卡波济氏肉瘤样品,和被称为BC-1的从 体腔淋巴瘤中衍生的细胞系中制备含有KSHV的糖蛋白B编码序列的 DNA。

为了得到整个5’序列,设计了怀疑是糖蛋白B上游的编码序列即 衣壳成熟基因(CAPMAT)的Type1寡核苷酸探针。使用其它病毒的CAPMAT 的已知序列鉴定相关的保守区,并设计了被称为FENSA的共有-简并引 物以与糖蛋白B有义方向上的CAPMAT杂交。设计了怀疑是糖蛋白B下 游的编码序列即DNA聚合酶的Type1寡核苷酸探针。这些寡核苷酸列 于表9:                        表9:检测,扩增或鉴定疱疹病毒多核苷酸                             所用的另外的Type1寡核苷酸                        靶:疱疹病毒,尤其是γ疱疹病毒的衣壳/成熟基因   名称     序列(5’-3’)   长度  类型数目 方向   SEQ.ID:  FENSAC     GCCTTTGAGAATTCYAARTAYATHAAR    27     48 有义     77  FENSAG     GGGTTTGAGAATTCYAARTAYATHAAR    27     48 有义     78                        靶:疱疹病毒,尤其是γ疱疹病毒的DNA聚合酶基因   名称     序列(5’-3’)   长度  类型数目 方向   SEQ.ID:  CVNVB  TAAAAGTACAGCTCCTGCCCGAANACRTTNACRCA    35     64 反义     79

使用覆盖整个糖蛋白B编码区的有义和反义引物对进行扩增,得到 的片断包括表10所列的那些。                        表10:所得的KSHV糖蛋白B片断     片段    长度              位置    1  NIVPA→TVNCB  0.39kb           原始的片断    2  FENSA→VNVNB  0.9kb   横跨至CAPMAT的片断1的5’端    3  TVNCA→FREYB  2.3kb          片断1’的3’端    4  FAYDA→FREYB  0.65kb          片断1的3’端    5  SQPVA→HVLQB  2.5kb 横跨至DNA聚合酶的片断1的3’端    6  FREYA→SCGFB  1.1kb 横跨至DNA聚合酶的片断2的3’端

用于扩增和测序的方法如下所述:使用具有引物对(如FREYA和 SCGFB)的DNA模板进行PCR扩增,以94℃45秒,60℃45秒和72℃45 秒进行35次循环;然后接着在72℃最后延伸10分钟。使用Quiagen 的QIAQUICKTM PCR纯化试剂盒在琼脂糖凝胶上纯化推测长度的PCR产 物。在第二轮扩增中重新扩增经纯化的PCR产物,或者以嵌套或非嵌套 的形式进行第二轮扩增。在给出的实施例中,使用FREYA和SCGFB,或 使用FREYA和HVLQB进行第二轮扩增。以94℃45秒,65℃45秒和72℃ 45秒进行35次扩增循环;然后接着在72℃最后延伸60分钟。

将PCR产物连接到Novagen PT7 BLUETM载体上,并转化到Novablue 感受态的E.coli中,使用Novagen方案进行连接和转化。通过使用M13 正向和反向寡核苷酸的PCR筛选菌落。使用Quiaquick质粒分离试剂盒, 从已在37℃下,5ml的LB肉汤中培养过夜的PCR阳性菌落中分离质粒。 按照USB Sequenase Kit方案(USB)使用M13正向和反向测序引物对 质粒手工测序。通过ABI方法进行自动测序。

当KSHV序列出现时,设计了另外的KSHV-特异性的Type3寡核苷 酸。Type3寡核苷酸可用于多对联合或与Type1寡核苷酸一起使用以PCR 扩增,克隆和测序KSHV DNA片断。所用的Type3寡核苷酸列于表11:             表11:检测,扩增或鉴定疱疹病毒编码糖蛋白B的                   多核苷酸所用的另外的Type3寡核苷酸                          靶:KSHV的糖蛋白B  名称            序列          (5’-3’)  长  度  类型  数目     方向    SEQ    ID:  GAYTA  DTYSB  AIYGB  VTECA  CEHYB  DLGGB  DLGGA  RAPPA     TGTGGAAACGGGAGCGTACAC     TCAGACAAGAGTACGTGTCGG     TACAGGTCGACCGTAGATGGC     CGCCATTTCCGTGACCGAGTG     TGATGAAGTAGTGTTCGCAGG     GATGCCACCCAGGTCCGCCAC     GTGGCGGACCTGGGTGGCATC     CGTAGATCGCAGGGCACCTCC  21  21  21  21  21  21  21  21     1     1     1     1     1     1     1     1     有义     反义     反义     有义     反义     反义     有义     有义     80     81     82     83     84     85     86     87                          靶:KSHV的DNA聚合酶  名称             序列           (5’-3’) 长 度  类型  数目     方向    SEQ    ID:  GEVFB  HVLQB  SCGFB     GTCTCTCCCGCGAATACTTCT     GAGGGCCTGCTGGAGGACGTG     CGGTGGAGAAGCCGCAGGATG  21  21  21     1     1     1     反义     反义     反义     88     89     90

图18显示了与KSHV DNA杂交的寡核苷酸的位置图。所用缩写如下 所述:d或h=与疱疹病毒序列杂交的共有-简并探针(Type 1);sq =可使用的另外的测序尾;g=与γ疱疹病毒杂交的探针(Type 1);f =与RFHV/KSHV亚族疱疹病毒杂交的探针(Type 2);ks=KSHV特异 性的探针(Type 3)。

图19列出了通过汇编每个已鉴定的片断的序列资料得到的共有序 列,显示了多核苷酸序列(SEQ.ID NO:91)。本发明的实施方案中包 括在DNA聚合酶编码序列之前掺入区域的核苷酸1-3056(SEQ.ID NO: 92),此共有序列表示得自卡波济氏肉瘤样品RiGr和淋巴瘤细胞系BC -1的共有序列资料,对于上述每个样品和每个基因区段而言,都有多 个克隆已被测序。在每个位置处进行约3-9次测定。

图19中还显示了三个开放阅读框(SEQ.ID NOS:93-95)的氨基 酸翻译,被编码的CAPMAT蛋白质片断(SEQ.ID NO:93)在不同时相 上与糖蛋白B编码序列(SEQ.ID NO:94)的5’末端重叠。在更加上 游的位置处,CAPMAT编码序列由于与Epstein Barr病毒的RNA聚合酶 2的结合位点具有同源性,因而也被怀疑含有糖蛋白B转录的调控元件。 图中的下划线部分是这种推断的启动子区域。在糖蛋白B编码序列的3’ 末端,有一个包括聚腺苷酸信号的非翻译序列,其更下游的位置处是DNA 聚合酶片断的编码序列(SEQ.ID NO:95)。

当将糖蛋白B编码序列与GenBank中的其它序列相比较时,发现仅与 其它疱疹病毒的糖蛋白B序列具有同源性。几个疱疹病毒只共用20个或更 少的核苷酸的偶然序列。与eHV2共用序列ATGTTCAGGGAGTACAACTACTACAC (SEQ.ID NO:98)。除了此序列以外,与其它先前已知的序列相比,KSHV 编码区域的21个或更多个核苷酸的区段显然是独特的。

在糖蛋白B编码序列内,在使用卡波济氏肉瘤样品得到的序列资料 和使用体腔淋巴瘤细胞系得到的序列资料之间标明了多核苷酸水平上的 四个等位基因变体,它们在图中由箭头表示。除了一个以外,所有的变 体都是沉默的。第四个变体导致了基因产物中脯氨酸变成亮氨酸的差 异。

由KSHV糖蛋白B基因编码的蛋白质产物具有下列特征:在N-末端 有一个对应于其它疱疹病毒糖蛋白B的信号肽区域(“前导序列”)的 区域。图3提供了完整的KSHV糖蛋白B氨基酸序列和其它疱疹病毒已 知的相应序列,并显示了同源性区域。疱疹病毒糖蛋白B序列中高度保 守的残基以星号(*)标明。在其它疱疹病毒糖蛋白B序列中保守的半胱 氨酸残基也出现在KSHV的相应序列中。另外,有两个可形成额外的内部 二硫键并稳定三维结构的额外的半胱氨酸(以“·”表示)。KSHV糖蛋 白B序列也具有对应于其它疱疹病毒糖蛋白B跨膜区的推测的跨膜区。

通过类似的策略得到RFHV的整个糖蛋白B序列。RFHV DNA的来源 类似地制备自华盛顿大学地方灵长类动物研究中心的被感染的猴组织。 按实施例5所述提取DNA。

为了得到编码链5’方向上进一步的序列资料,将与片断上游杂交 的共有-简并(Type1)寡核苷酸作为5引物,并与作为3’引物的最接 近的病毒-特异性(Type3)寡核苷酸联合使用以进行扩增。因此,例 如使用FRFDA和AAITB作为第一套引物进行第一系列的扩增循环,接着 使用相同引物,或使用FRFDA和GMTEB嵌套引物进行第二系列的扩增循 环。扩增条件与所描述的KSHV的相类似。

为了得到编码链3’方向上进一步的序列资料,可将与片断下游杂 交的共有-简并(Type1)寡核苷酸作为3’引物,并与作为5’引物的最 接近的病毒-特异性(Type3)寡核苷酸联合使用以进行扩增。因此, 使用NVFDB和VEGLA进行第一系列的扩增循环,接着使用NVFDB和PVLYA 进行第二系列的扩增循环。如前文所述进行扩增和测序。使用新序列设 计具有有义方向的另一个Type3寡核苷酸,它与其它能与下游杂交的 Type1寡核苷酸(即FREYB和NVFDB)一起使用能得到进一步的序列资 料。

使用多核苷酸和氨基酸序列资料将RFHV和KSHV的糖蛋白B互相比 较,并与其它疱疹病毒的糖蛋白B比较。如实施例6所述,可使用RFHV 和KSHV序列设计另一个亚族-特异性的Type2寡核苷酸。

实施例8:得自DNA文库的糖蛋白B序列

通过从被感染的组织中建立DNA文库可得到或进一步证实整个糖蛋 白B序列。用于此研究的DNA来源同实施例7。

用蛋白酶K消化DNA裂解物,使用酚-氯仿提取DNA。充分透析后, 用Sau3AI限制性核酸内切酶部分消化制品。在蔗糖梯度中离心消化物, 回收约10-23千碱基的片段。通过用BamHI切割制备λDASH-2TM载体 噬菌体(Stratagene)。然后将选定大小的片段与载体混合,并使用DNA 连接酶连接。

根据厂商的指导,用Stratagene的包装提取物制备经连接的载体, 将所述载体用于感染XL1-BLUETM MRA细菌。在琼脂上以每个平板约 20,000个细菌的密度涂布约200,000个被噬菌体感染的细菌。培养后, 用硝酸纤维素覆盖平板上的菌落,将硝酸纤维素切成片段,从片段上洗 脱噬菌体,使用适当的病毒特异性引物对它们的DNA进行扩增反应。在 琼脂糖凝胶上电泳反应产物,并用溴化乙锭染色。从显示出所期望之大 小的经扩增的DNA的平板区域回收噬菌体。将回收的噬菌体用于感染新 的XL1细菌并重新涂布于新鲜培养基上,重复此过程直至得到有限稀释 的单个克隆。

然后使用限制性核酸酶作出由此方法选择的每个克隆的图谱以确证 所掺入的片段大小。使用载体特异性引物由两个末端测定大于完整DNA 聚合酶序列的插入物的序列。将此序列与完整的EBV基因组的已知多核 苷酸序列相比较以确定此片段是否跨越了完整的糖蛋白B序列。从适当 的克隆中得到DNA,剪切,并通过根据标准技术的枪克隆测定DNA的 序列。

实施例9:糖蛋白B的抗原性区域

糖蛋白B基因中NIVPA和TVNCB杂交位点之间的多核苷酸片断具有 图14所示的推测的氨基酸序列。根据这些序列,可鉴定出RFHV或KSHV 独特的肽,或种之间共用的肽。

图14显示了长度为6或7个氨基酸的肽的例子。与相应的γ疱疹病 毒肽相比,一些肽含有对RFHV或KSHV而言(Ⅲ类)或者对RFHV/KSHV 亚族而言(Ⅱ类)为独特的一个或多个残基。

为了进一步证实糖蛋白B的这一106个氨基酸的区域内所含区域可 以被抗体识别,可进行计算机分析以产生Hopp和Wooks抗原性图。Hopp 和Woods测定法部分地基于连串氨基酸残基的相对亲水性和疏水性(Hopp 等人)。结果示于图20,21和22。图标:~=抗原性的;^=疏水性的; #=潜在的N-键糖基化位点。图20表示RFHV的106个氨基酸的糖蛋白 B片断的分析;图21表示KSHV片断的分析,图22表示整个KSHV序列 的分析。

RFHV和KSHV都含有经预测可能是抗体靶位点的几个区域。尤其是 KSHV序列在此片断的N-末端附近和潜在的N-键糖基化位点附近显示 了抗原性区域。全长的KSHV序列显示出既对应于信号肽(残基~25) 又对应于跨膜区(残基~750)的疏水性的小段序列。观察到评分>1.0 或>1.5的推断的大量抗原性区域。特别值得注意的是在约残基440-460 处出现了评分达到~2.5的区域。

实施例10:病毒特异性的糖蛋白B扩增试验

在嵌套病毒特异性扩增反应中使用Type3寡核苷酸检测得自潜在感 染的受试者的一系列组织样品中RFHV或KSHV的存在。

对于KSHV而言,从被怀疑携有此病毒的组织;尤其是患有卡波济 氏肉瘤损害和体腔B-细胞淋巴瘤的人受试者的活检样品中提取DNA。 使用了大量不同的组织样品,包括得自KS损害,得自相同个体的明显 未受感染的组织,得自没有明显的KS损害的HIV阳性个体和得自HIV 阴性个体的一些样品。每种类型得到5个样品,按实施例2所述制备DNA。

寡核苷酸引物GLTEA,YELPA,VNVNB和ENTFB订购自Oligos Etc., Inc。分两个阶段扩增DNA,在第一阶段中使用引物GLTEA和ENTFB,在 第二阶段中使用引物YELPA和VNVNB。扩增的条件与实施例3中的类似。 在2%琼脂糖凝胶上电泳反应产物,用溴化乙锭染色并在紫外灯下检查。 通过溴化乙锭染色检测出反应产物中高丰度的多核苷酸的存在表示阳性 结果,这反映了样品中得自KSHV的DNA的存在;尤其是从YELPA至VNVNB 的糖蛋白B编码片断的存在。将结果与病人的病史和样品的组织病理学 相比较以确定阳性的试验结果是否与对KS的怀疑一致。

对于RFHV而言,从取自生长于华盛顿大学地方灵长类动物研究中 心的灵长类群体的豚尾猴和食蟹猴的冷冻组织样品中提取DNA。从具有 明显的纤维瘤病症状的组织部位,相同猴的明显未受感染的部位,和没 有显示症状的猴的相应部位各取10个样品。先使用GMTEA和VEGLB, 再使用KYEIA和TDRDB进行嵌套PCR扩增。如上文所述电泳和染色扩增 产物以测定样品中是否存在RFHV多核苷酸。

实施例11:糖蛋白B的免疫原性区域

为了鉴定在KSHV感染的自然过程中会产生何种抗体,从10-20个 具有卡波济氏肉瘤损害的AIDS受试者,10-20个HIV-阳性症状-阴 性的受试者和10-20个HIV-阴性的对照者中得到血清样品。在最初的 研究中,收集每一群体的血清以分析抗体。

根据成熟的KSHV糖蛋白B分子的推测的整个细胞外区域合成12个 残基长的肽。制备出的顺序肽覆盖了整个序列,并重叠了8个残基。通 过标准的F-Moc化学法,根据厂商的指导使用得自Genosys的SPOTSTM 试剂盒在尼龙膜支持物上制备肽。用血清覆盖制备出的膜,洗涤之并用 与β-半乳糖偶联的抗-人IgG覆盖此膜。通过加入底物X-gal显色此 试验,阳性染色表示血清中有抗相应肽的IgG抗体的反应性。

类似地,为了鉴定RFHV感染的自然过程中形成的抗体,从10只豚 尾猴和10只食蟹猴中收集血样,这些猴中的一部分显示了明显的纤维 瘤病症状。通过如实施例10中所述,使用RFHV-特异性寡核苷酸进行 PCR扩增试验进一步证实正在发生的RFHV感染存在与否。通过离心分离 血浆和血细胞,在类似于KSHV所用的方法中,使用这些血清检测抗体, 不同之处在于根据RFHV糖蛋白B序列合成12-聚体。

也要在动物模型中测试选定的RFHV和KSHV肽以测定它们与合乎需 要的佐剂,如明矾和DETOXTM等联合使用时的免疫原性。适当的肽包括 那些在上述实验中被鉴定出能在病毒感染的自然过程中产生抗体的肽。 其它候选者包括那些据信能参与糖蛋白B的生物学功能的肽,和那些与 已知能产生中和病毒之抗体的其它疱疹病毒肽相对应的肽。将此肽偶联 到作为载体的匙孔血蓝蛋白(KLH)上,根据标准方法与佐剂联合,给 兔肌内注射于1-2ml接种物中的相当于100μg的肽。4周后,用第二 剂量加强免疫动物,过2周后取血化验。

通过用免疫原或不相关的肽-KLH对照物包被来制备用于ELISA的 微量滴定板孔。用得自试验血样的系列稀释血浆覆盖孔,洗涤,使用β -半乳糖抗-人IgG和X-gal显色。在试验孔而不是对照孔中的阳性染 色表示肽在所用的条件下是免疫原性的。

实施例12:RFHV/KSHV亚族其它成员的糖蛋白B的鉴定和特征描述

冷冻保存怀疑含有上文未曾描述过的γ疱疹病毒,尤其是纤维增殖 性疾病,淋巴细胞恶性肿瘤和与免疫缺损和免疫抑制相关之疾病,如急 性呼吸道疾病综合症(ARDS)的组织样品,按实施例2所述提取DNA。 在第一轮中使用Type1寡核苷酸FRFDA和TVNCB,然后在第二轮中使用 嵌套的Type1或Type2寡核苷酸进行两轮PCR扩增。

任选地,通过用适当的探针探测扩增产物来证实RFHV/KSHV亚族糖 蛋白B多核苷酸的存在。在琼脂糖上电泳经扩增的多核苷酸并印迹到尼 龙膜上。将印迹与经32P标记的,含有得自编码糖蛋白B之KSHV多核苷 酸的多核苷酸片段探针(SEQ.ID NO:3的残基36-354)杂交。在允 许探针和疱疹病毒糖蛋白B之间形成稳定的双螺旋,但不允许探针与 RFHV/KSHV亚族以外来源的编码糖蛋白B的多核苷酸之间形成稳定双螺 旋的条件下进行杂交反应。杂交条件需要探针和靶的杂交区段之间有大 约70%的同一性以形成稳定的复合物。根据探针的长度和序列和靶的相 应序列,使用上文给出的公式计算这些条件。估计条件如下:a)允许 探针在室温下,缺乏甲酰胺时,于6×SSC(0.15M NaCl,15mM柠檬酸 钠缓冲液)中与靶杂交;和b)在室温下用2×SSC将新形成的双螺旋洗 涤较短时间(5-10分钟)。

选择在这些条件下与经标记的探针杂交的经扩增的多核苷酸以进一 步鉴定。或者,怀疑与从KSHV推测的大小大致相同的PCR扩增产物具 有相关序列。如果样品也已被用于得到包含疱疹病毒基因组的其它区 域,如DNA聚合酶的多核苷酸,则可怀疑此样品具有相关序列。按实施 例4中所述,横跨此片断测定含有由于大小差异或者来源不同而与RFHV 或KSHV潜在不同之片断的样品的序列。通过与实施例7或8中类似的 方法,使用具有新序列的这些片断测定整个糖蛋白B基因序列。

按下述得到RFHV/KSHV疱疹病毒亚族第三成员的糖蛋白B编码序 列。

从两个冷冻的得自患有腹膜后纤维瘤病的猕猴的组织样品中提取 DNA,根据实施例1进行提取,在40μg糖原作为载体存在时,用乙醇 沉淀提取的DNA,用70%的乙醇洗涤,并重新悬浮于10mM的Tris,pH8.0 缓冲液中。使用提取的DNA得到151个碱基对的疱疹病毒DNA聚合酶基 因片断,此片断与KSHV,RFHV或任何其它先前已鉴定的DNA聚合酶的 相应片断不相同。这导致了下列怀疑:样品含有不同疱疹病毒的基因组 DNA,可用于对新的糖蛋白B基因进行鉴定和特征描述。

使用半-嵌套的PCR从样品中扩增386个碱基对的糖蛋白B编码序 列的片断。方法类似于实施例4和5中所用的方法,使用FRFDA和TVNCB 进行第一轮扩增,接着使用NIVPA和TVNCB进行第二轮扩增,如上文所 述测定最终的PCR产物的序列。

图23列出了多核苷酸序列(SEQ.ID NO:96)以及相应的氨基酸 翻译(SEQ.ID NO:97)。下划线的是两个引物杂交位点之间的319个 碱基对的序列,此序列与KSHV和RFHV的相应序列不同。糖蛋白B得自 疱疹病毒RFHV/KSHV亚族的被称为RFHV2的新成员。

                      参考文献

Altschul等,(1986)。数学生物学通报,48:663-616。

Ambroziuk等,(1995)。科学,268:582-583。

A.M.Eis-Hubinger等,(1993)。普通病毒学杂志,74:379- 385。

Baghian A.等,(1993)。病毒学杂志,67:2396-2401。

Basco等,(1992)。生物与化学杂志,267:19427-19434。

Basco等,(1993)。染色体,102:32-38。

Beaucage等,(1981)。四面体通讯,22:1859-1862。

Berel V.等,(1990)。柳叶刀,335:123-128。

Bernard等,(1989)。细胞,59:219-228。

Bernard等,(1990)。美国国家科学院院刊,87:4610-4614。

Boshoff等,(1995)。天然药物学,1:1274-1278。

Byrne K.M.等,(1995)。病毒学,290:230-235。

Cantin E.M.等,(1987)。美国国家科学院院刊,84:5908-5912。

Cesarman E.等,(1995)。新英格兰医学杂志,332:1186-1191。

Chang Y.等,(1994)。科学,266:1865-1869。

Demotz S.等,(1989)。免疫学方法杂志,122:67-72。

Derbyshire等,(1991)。EMBO J.,10:17-24。

Digard P.等,(1995)。美国国家科学院院刊,92:1456-1460。

Dorsky D.I.等,(1990)。病毒学杂志,64:1394-1397。

Dorsky D.I.等,(1988)。病毒学杂志,62:3224-3232。

Dupin N.等,(1995)。新英格兰医学杂志,333:798。

Emery V.C.等,(1992)。pp.257-277见,AIDS机会感染的分子 和细胞生物学;S.Myint & A.Cann,eds,Chapman & Hall.

Erickson等,(1990)。科学249:527-533。

Fields B.N.& Knipe D.M.,eds.(1991)。基础病毒学,第2 版,Raven Press。

Firesmith T.H.等,(1994)。Int.J.Dematol.33:755-762。

Gage P.J.等,(1993)。病毒学杂志,67:2191-2201。

Gao S-J.等,(1996)。新英格兰医学杂志,335:233-241。

Gibbs J.S.等,(1988a)。美国国家科学院院刊,85:6672-6676。

Gibbs J.S.等,(1988b)。美国国家科学院院刊,85:7969-7973。

Giddens W.E.Jr.等,(1983)。pp.249-253见,非人灵长类的 病毒和免疫性疾病;Alan R.Liss Inc。

Glorioso J.C.等,(1994)。Dev.Biol.Stand 82:79-87。

Haanes E.J.等,(1994)。病毒学杂志,68:5825-5834。

Haffey M.L.等,(1988)。病毒学杂志,62:4493-4498。

Hall J.D.等,(1989)。核酸研究,17:9231-9244。

Hanke T.等,(1991)。病毒学杂志,,65:1177-1186。

Henikoff等,(1992)。美国国家科学院院刊,89:10915-10919。

Herold B.C.等,(1994)。普通病毒学杂志,75:1211-1222。

Hirose等,(1978)。四面体通讯,(1978)19:2449-2452。

Hodgson(1991)。生物/技术学,9:19-21。

Horn等,(1995)。人基因疗法,6:565-573。

Hopp T.P.等,(1981)。美国国家科学院院刊,78:3824-3828。

Johnson P.A.等,(1994)。细胞生物学方法,43A:191-210。

Karlin S.等,(1994)。病毒学杂志,68:1886-1902。

Kedes D.H.等,(1996)。天然药物学,2:918-924。

Knopf C.W.等,(1988)。生物化学与生物物理学报,951:298- 314。

Kostal M.等,(1994)。Acta Virologica,38:77-88。

Kumar等,(1984)。有机化学杂志,49:4905-4912。

Larder B.A.等,(1987)。EMBO J.6:169-175。

Latchman D.S.等,(1994)。分子生物技术,2:179-195。

Lin L.S.等,(1995)。医学病毒学杂志,45:99-105。

Lisitsyn N.等,(1993)。科学,259:946-。

Liu M.Y.等,(1989)。医学病毒学杂志,28:101-105。

Liu Y.-N.C.等,(1993)。普通病毒学杂志,74:2207-2214。

Manservigi R.等,(1990)。病毒学杂志,64:431-436。

Marcy A.I.等,(1990)。病毒学杂志,64:5883-5890。

Martin R.W.等,(1993)。医学,72:245-26。

McDermott M.R.等,(1989)。病毒学,169:244-247。

Meier J.L.等,(1993),病毒学杂志,67:7573-7581。

Meinkoth J.等,(1984)。分析生物化学,138:267-。

Mester J.C.等,(1990)。病毒学杂志,64:5277-5283。

Miles S.A.(1994)。当代肿瘤学论点,6:497-502。

Miller G.(1996)。新英格兰医学杂志,334:1292-1297。

Mitsuyasu R.T.(1993)。当代肿瘤学论点,5:835-844。

Moore P.S.等,(1995a)。新英格兰医学杂志,332:1181-1185。

Moore P.S.等,(1995b)。新英格兰医学杂志,333:798-799。

Moore P.S.等,(1996)。病毒学杂志,70:549-558。

Navarro D.等,(1991)。病毒学,184:253-264。

Navarro D.等,(1992)。病毒学,186:99-112。

Northfelt.D.W.(1994)。药学(新西兰),48:569-582。

Nugent C.T.等,(1994)。病毒学杂志,68:7644-7648。

O′Donnell C.A.等,(1991)。临床实验免疫学,86:30-36。

O′Donnell M.E.等,(1987)。生物与化学杂志,262:4252-4259。

O′Leary J.J.,(1996)。天然药物学,2:862-863。

Padlan E.A.,(1991)。分子免疫学,28:489-494。

Pellett P.E.等,(1985)。病毒学杂志,53:243-253。

Pereira L.,(1994)。疾病传染因子,3:9-28。

Qadri I.等,(1991)。病毒学,180:135-152。

Reardon J.E.等,(1989)。生物与化学杂志,264:7405-7411。

Reschke M.等,(1995)。普通病毒学杂志,76:113-122。

Sanchez-Pescador L.等,(1992)。传染病杂志,166:623-627。

Schumacher T.N.等,(1992)。欧洲免疫学杂志,22:1405-1412。

Shiu S.Y.W.等,(1994)。Arch.Virol.,137:133-138。

Simon等,(1991)。EMBO J.10:2165-2171。

Soengas等,(1992)。EMBO J.11:4227-4237。

Stow N.D.(1993)。核酸研究,21:87-92。

Tsai C.-C.等,(1986)。实验动物科学,36:119-124。

VanDevanter等,(1996)。临床微生物学杂志,34:1666-1671。

Wang T.S.-F.等,(1989)。FASEB J.3:14-21。

Ward P.L.等,(1994)。遗传学趋势,10:267-274。

Weiss R.A.等,(1996)。天然药物学,2:277-278。

Yeung K.C.等,(1991)。当代眼科研究,10(Suppl.)31-37。

Zhong W.等,(1996)。美国国家科学院院刊,93:6641-6646。

专利和专利申请:

US 4762708 Cohen等                (Gd疫苗)

US 4415732 Caruthers M.H.等       (多核苷酸合成)

US 4444887 Hoffman M.K.           (mAb方法)

US 4472500 Milstein C.等          (mAb细胞)

US 4642333 Person S.              (HSV Gb表达)

US 4683195 Mullis K.B.            (PCR)

US 4683202 Mullis K.B.等          (PCR)

US 5124246 Urdea M.S.等           (分支的DNA)

US 5171568 Burke R.L.等           (HSV Gb/Gd疫苗)

US 5176995 Sninsky J.J.等         (病毒的PCR方法)

US 5244792 Burke R.L.等           (HSV Gb表达)

US 5350671 Houghton M.等          (HCV诊断)

US 5354653 Matsumoto T.等         (HSV菌株探针检测)

US 5364773 Paoletti等             (痘苗疫苗)

US 5384122 Cunningham等           (疱疹病毒L-颗粒疫苗)

US 5399346 Anderson W.F等         (基因疗法)

US 5420026 Payne                  (装配缺损颗粒)

WO 91/16420 Blum等                (聚合酶突变)

WO 92/05263 Inglis等              (减毒的疱疹病毒)

WO 92/16231 Francotte等           (Gd/MPL-A疫苗)

WO 94/11509 Couto等               (人源化ab)

EP 0239400 Winter                 (人源化ab)

EP 0290197 Mcaleer等              (疱疹病毒活疫苗)

JP 5309000 Iatron Lab Inc         (EBV POL的PCR检测)

美国专利申请60/001,148;和1996年7月11日提交的部分继续申请[流 水号待定;代理人案号299938-20001.00]:T.M.Rose,M.Bosch,K.Strand & G.Todaro。“与卡波济氏肉瘤和腹膜后纤维瘤病相关的γ疱疹病毒的DNA 聚合酶”。

                            序列表  SEQ.ID  名称           描述   类型        来源     1  RFHV     糖蛋白B的PCR区段  dsDNA         图1     2  RFHV     糖蛋白B的PCR区段  蛋白质         图1     3  KSHV     糖蛋白B的PCR区段  dsDNA         图1     4  KSHV     糖蛋白B的PCR区段  蛋白质         图1     5  sHV1       糖蛋白B序列  dsDNA  GenBank HSVSPOLGBP     6  bHV4       糖蛋白B序列  dsDNA   GenBank BHT4GLYB     7  eHV2       糖蛋白B序列  dsDNA   GenBank EHVU20824     8  mHV68       糖蛋白B序列  dsDNA   GenBank MVU08990     9  hEBV       糖蛋白B序列  dsDNA      Genbank EBV    10  hCMV       糖蛋白B序列  dsDNA   Genbank HEHCMVGB    11  hHV6       糖蛋白B序列  dsDNA    Genbank HH6GBXA    12  hVZV       糖蛋白B序列  dsDNA    Genbank HEVZVXX    13  HSV1       糖蛋白B序列  dsDNA    Genbank HSlGLYB    14  sHV1       糖蛋白B序列  蛋白质         翻译    15  bHV4       糖蛋白B序列  蛋白质         翻译    16  eHV2       糖蛋白B序列  蛋白质         翻译    17  mHV68       糖蛋白B序列  蛋白质         翻译    18  hEBV       糖蛋白B序列  蛋白质         翻译    19  hCMV       糖蛋白B序列  蛋白质         翻译    20  hHV6       糖蛋白B序列  蛋白质         翻译    21  hVZV       糖蛋白B序列  蛋白质         翻译    22  HSV1       糖蛋白B序列  蛋白质         翻译    23  sHVSA8       糖蛋白B序列  蛋白质         翻译  24-40      Type1寡核苷酸   (γ疱疹病毒糖蛋白B)  ssDNA (IUPAC)          表4  41-47      Type2寡核苷酸  (RFHV/KSHV亚族糖蛋白B)  ssDNA (IUPAC)          表6  48-55      Type3寡核苷酸-     RFHV特异性糖蛋白B  ssDNA          表7  56-63      Type3寡核苷酸-     KSHV特异性糖蛋白B  ssDNA          表7  64-66       Ⅰ类抗原肽    (γ疱疹病毒糖蛋白B)  蛋白质          表8  67-72       Ⅱ类抗原肽      (RFHV/KSHV亚族糖蛋白B)   蛋白质     表8   73-74            Ⅲ类抗原肽-        RFHV特异性糖蛋白B   蛋白质     表8   75-76            Ⅲ类抗原肽        KSHV特异性糖蛋白B   蛋白质     表8   77-78           Type1寡核苷酸      (γ疱疹病毒衣壳成熟基因)   SsDNA  (IUPAC)     表9    79           Type1寡核苷酸-        (γ疱疹病毒DNA聚合酶)   ssDNA  (IUPAC)     表9   80-87           Type3寡核苷酸-         KSHV特异性糖蛋白B     表11   88-90           Type3寡核苷酸-         KSHV特异性DNA聚合酶     表11    91    KSHV  含有衣壳成熟片断,糖蛋白B和DNA    聚合酶片断的编码区的DNA序列   DsDNA     图18    92    KSHV    含有衣壳成熟片断和糖蛋白B编     码区的DNA序列(残基1-3056)   DsDNA    实施例7    93    KSHV            衣壳成熟序列   蛋白质     图18    94    KSHV             糖蛋白B序列   蛋白质     图18    95    KSHV            DNA聚合酶序列   蛋白质     图18    96    RFHV2           糖蛋白B PCR区段   dsDNA     图22    97   RFHV2           糖蛋白B PCR区段   蛋白质     图22    98              共用的序列   dsDNA    实施例7   99-100         糖蛋白B的Ⅰ类抗原肽   蛋白质     表8

                         部分序列表

(1)一般性资料:

   (ⅰ)申请人:Rose,Timothy M.

               Bosch,Marnix

               Strand,Kurt

   (ⅱ)发明题目:RFHV/KSHV亚族疱疹病毒的糖蛋白B

   (ⅲ)序列的数目:40

   (ⅳ)联系地址:

      (A)联系人:Morrison & Foerster

      (B)街道:755 Page Mill Road

      (C)城市:Palo Alto

      (D)州:CA

      (E)国家:美国

      (F)邮编:94304-1018

   (ⅷ)代理人/代理资料:

      (A)姓名:Schiff,J.Michael

      (B)登记号:40,253

      (C)参考文献/概要号:29938-20002.00

   (ⅸ)电讯资料:

      (A)电话:(415)813-5600

      (B)传真:(415)494-0792

      (C)电传:706141 SEQ ID NO:1: GTGTACAAGA AGAACATCGT GCCGTACATT TTCAAGGTAC GCAGGTACAT AAAAATAGCA       60 ACATCTGTCA CGGTCTACCG CGGTATGACA GAAGCAGCAA TCACAAACAA ATATGAGATC      120 CCCAGGCCCG TGCCTCTCTA CGAGATCAGT CACATGGACA GCACCTACCA GTGCTTTAGT      180 TCCATGAAAA TTGTAGTGAA CGGAGTCGAA AATACGTTCA CCGATCGGGA TGACGTAAAC      240 AAAACCGTAT TTCTCCAGCC CGTCGAAGGT CTAACTGACA ACATACAAAG ATACTTTAGC      300 CAACCAGTAC TGTACTCTGA ACCCGGATGG TTCCCAGGTA TCTACAGGGT TGGGACAACA      360 GTAAACTGTG AGATTGTAGA CATGTT                                           386 SEQ ID NO:2:

Val Tyr Lys Lys Asn Ile Val Pro Tyr Ile Phe Lys Val Arg Arg Tyr

Ile Lys Ile Ala Thr Ser Val Thr Val Tyr Arg Gly Met Thr Glu Ala

Ala Ile Thr Asn Lys Tyr Glu Ile Pro Arg Pro Val Pro Leu Tyr Glu

Ile Ser His Met Asp Ser Thr Tyr Gln Cys Phe Ser Ser Met Lys Ile

Val Val Asn Gly Val Glu Asn Thr Phe Thr Asp Arg Asp Asp Val Asn

Lys Thr Val Phe Leu Gln Pro Val Glu Gly Leu Thr Asp Asn Ile Gln

Arg Tyr Phe Ser Gln Pro Val Leu Tyr Ser Glu Pro Gly Trp Phe Pro

Gly Ile Tyr Arg Val Gly Thr Thr Val Asn Cys Glu Ile Val Asp Met SEQ ID NO:3: GTGTACAAGA AGAACATCGT GCCGTATATT TTTAAGGTGC GGCGCTATAG GAAAATTGCC       60 ACCTCTGTCA CGGTCTACAG GGGCTTGACA GAGTCCGCCA TCACCAACAA GTATGAACTC      120 CCGAGACCCG TGCCACTCTA TGAGATAAGC CACATGGACA GCACCTATCA GTGCTTTAGT      180 TCCATGAAGG TAAATGTCAA CGGGGTAGAA AACACATTTA CTGACAGAGA CGATGTTAAC      240 ACCACAGTAT TCCTCCAACC AGTAGAGGGG CTTACGGATA ACATTCAAAG GTACTTTAGC      300 CAGCCGGTCA TCTACGCGGA ACCCGGCTGG TTTCCCGGCA TATACAGAGT TAGGACAACA      360  GTCAACTGTG AGATTGTAGA CATGTT                                           386 SEQ ID NO:4:

Val Tyr Lys Lys Asn Ile Val Pro Tyr Ile Phe Lys Val Arg Arg Tyr

Arg Lys Ile Ala Thr Ser Val Thr Val Tyr Arg Gly Leu Thr Glu Ser

Ala Ile Thr Asn Lys Tyr Glu Leu Pro Arg Pro Val Pro Leu Tyr Glu

Ile Ser His Met Asp Ser Thr Tyr Gln Cys Phe Ser Ser Met Lys Val

Asn Val Asn Gly Val Glu Asn Thr Phe Thr Asp Arg Asp Asp Val Asn

Thr Thr Val Phe Leu Gln Pro Val Glu Gly Leu Thr Asp Asn Ile Gln

Arg Tyr Phe Ser Gln Pro Val Ile Tyr Ala Glu Pro Gly Trp Phe Pro

Gly Ile Tyr Arg Val Arg Thr Thr Val Asn Cys Glu Ile Val Asp Met SEQ ID NO:5: ATGGTACCTA ATAAACACTT ACTGCTTATA ATTTTGTCGT TTTCTACTGC ATGTGGACAA        60 ACGACACCTA CTACAGCTGT TGAAAAAAAT AAAACTCAAG CTATATACCA AGAGTATTTC       120 AAATATCGTG TATGTAGTGC ATCAACTACT GGAGAATTGT TTAGATTTGA TTTAGACAGA       180 ACTTGTCCAA GTACTGAAGA CAAAGTTCAT AAGGAAGGCA TTCTTTTAGT GTACAAAAAA       240 AATATAGTTC CATATATCTT TAAAGTCAGA AGATACAAAA AAATCACAAC ATCAGTCCGT       300 ATTTTTAATG GCTGGACTAG AGAAGGTGTT GCTATTACAA ACAAATGGGA ACTTTCTAGA       360 GCTGTTCCAA AATATGAGAT AGATATTATG GATAAGACTT ACCAATGTCA TAATTGCATG       420 CAGATAGAAG TAAACGGAAT GTTAAATTCT TACTATGACA GAGATGGAAA TAACAAAACT       480 GTAGACTTAA AGCCTGTAGA TGGTCTAACG GGTGCAATTA CAAGATACAT TAGCCAACCT       540 AAAGTTTTTG CTGATCCTGG CTGGCTATGG GGAACTTACA GGACTCGAAC TACCGTTAAC       600 TGTGAAATTG TAGACATGTT TGCTAGGTCT GCTGACCCTT ACACATACTT TGTGACTGCG       660 CTTGGCGACA CAGTAGAAGT GTCTCCTTTC TGTGATGTAG ATAATTCATG CCCAAATGCA       720 ACTGACGTGT TGTCAGTACA AATAGACTTA AATCACACTG TTGTTGACTA TGGAAATAGA       780 GCTACATCAC AGCAGCATAA AAAAAGAATA TTTGCTCATA CTTTAGATTA TTCTGTTTCT       840 TGGGAAGCTG TAAACAAATC CGCGTCAGTA TGCTCAATGG TTTTTTGGAA GAGTTTTCAA       900 CGAGCTATCC AAACTGAACA TGACTTAACT TATCATTTCA TTGCTAATGA AATAACAGCA       960 GGATTCTCTA CAGTGAAAGA ACCCTTAGCA AATTTTACAA GTGATTACAA TTGTCTTATG      1020 ACTCATATCA ACACTACTTT AGAGGATAAG ATAGCAAGAG TCAACAATAC TCACACTCCA      1080 AATGGTACAG CAGAATATTA TCAAACAGAA GGTGGAATGA TTTTAGTGTG GCAGCCATTA      1140 ATAGCAATAG AATTAGAAGA AGCAATGTTG GAAGCAACTA CATCTCCAGT AACTCCTAGT      1200 GCACCAACTA GCTCATCTAG AAGTAAGCGA GCAATAAGAA GCATAAGACA TGTGAGTGCA      1260 GGTTCAGAAA ATAATGTGTT TCTATCACAA ATACAATATG CATATGATAA GCTACGTCAA      1320 AGTATCAACA ACGTGCTAGA AGAGTTAGCT ATAACATGGT GTAGAGAACA AGTGAGACAA      1380 ACAATGGTGT GGTATGAGAT AGCAAAAATT AATCCAACAA GTGTTATGAC AGCAATATAT      1440 GGAAAACCTG TCTCTCGTAA AGCTTTAGGA GATGTAATCT CTGTTACAGA ATGTATAAAT      1500 GTTGACCAAT CTAGTGTGAG CATACACAAG AGTCTTAAAA CAGAAAATAA TGACATATGC      1560 TATTCACGGC CTCCAGTTAC ATTTAAATTT GTTAACAGTA GTCAGCTGTT TAAAGGACAG      1620 TTAGGGGCTA GAAATGAAAT TCTTCTGTCA GAAAGTCTTG TAGAAAATTG CCACCAAAAT      1680 GCAGAGACTT TTTTTACAGC TAAAAATGAA ACTTACCACT TTAAAAATTA TGTGCATGTA      1740 GAAACTTTGC CAGTGAATAA CATTTCAACT TTAGACACTT TTTTAGCTCT TAACCTAACT      1800 TTCATAGAAA ATATTGACTT TAAAGCTGTT GAATTGTATT CAAGTGGAGA GAGAAAGTTA      1860 GCAAACGTGT TTGATTTAGA GACTATGTTT AGAGAATATA ACTATTACGC TCAGAGTATA      1920 TCTGGCTTAA GAAAAGATTT TGATAACTCT CAAAGAAACA ACAGAGACAG AATCATTCAA      1980 GATTTTTCAG AAATTCTAGC AGACTTAGGC TCTATCGGCA AAGTTATTGT TAATGTGGCA      2040 AGCGGCGCAT TTTCTCTTTT TGGAGGTATT GTAACAGGCA TATTAAATTT TATTAAAAAT      2100 CCTTTAGGTG GCATGTTCAC ATTTCTATTA ATAGGAGCAG TTATAATCTT AGTAATTCTA      2160 CTAGTACGGC GCACAAATAA TATGTCTCAA GCTCCAATTA GAATGATTTA CCCAGATGTT      2220 GAGAAATCTA AATCTACTGT GACGCCTATG GAGCCTGAAA CAATTAAACA AATTTTGCTT      2280 GGAATGCATA ACATGCAGCA AGAAGCATAT AAGAAAAAAG AAGAACAAAG AGCTGCTAGA      2340 CCGTCTATTT TTAGACAAGC TGCTGAGACA TTTTTGCGTA AGCGATCTGG TTACAAACAG      2400 ATTTCAACCG AAGACAAAAT AGTAT                                            2425 SEQ ID NO:6: ATGTATTATA AGACTATCTT ATTCTTCGCT CTAATTAAGG TATGCAGTTT CAACCAGACC        60 ACTACACACT CAACCACAAC CTCACCAAGT ATTTCATCAA CCACCTCTTC CACAACAACA       120 TCAACAAGCA AGCCATCAAA CACAACCTCA ACAAATAGTT CATTAGCTGC CTCTCCCCAG       180 AACACGTCAA CAAGCAAGCC ATCCACTGAT AATCAGGGTA CCAGTACCCC CACTATTCCA       240 ACTGTTACTG ATGACACAGC CAGTAAAAAT TTTTATAAAT ACAGAGTATG CAGTGCATCA       300 TCTTCCTCTG GAGAACTATT CAGATTTGAC CTTGATCAGA CATGTCCAGA TACAAAAGAT       360 AAAAAACATG TGGAAGGCAT CCTGCTGGTA CTAAAAAAGA ATATTGTCCC ATACATCTTC       420 AAAGTGAGGA AATATAGAAA AATTGCCACC TCAGTGACAG TTTACAGAGG GTGGTCCCAG       480 GCAGCTGTTA CCAATAGGGA TGATATCAGC AGAGCCATAC CCTATAATGA AATTTCAATG       540 ATAGATAGGA CCTATCATTG TTTCTCTGCT ATGGCAACAG TCATTAATGG GATTCTGAAC       600 ACCTATATAG ACAGGGATTC TGAAAATAAG TCTGTTCCCC TCCAGCCAGT GGCCGGACTG       660 ACTGAGAACA TAAACAGATA CTTTAGTCAA CCTCTCATAT ATGCAGAACC TGGCTGGTTT       720 CCAGGGATTT ATAGAGTGAG AACAACTGTT AATTGTGAGG TTGTTGACAT GTATGCCCGC       780 TCTGTGGAAC CATATACTCA CTTTATTACA GCTCTGGGGG ACACTATTGA AATCTCCCCA       840 TTCTGTCACA ACAATTCTCA ATGCACCACT GGTAATTCCA CCTCAAGGGA TGCCACAAAG       900 GTATGGATAG AAGAAAATCA CCAAACTGTT GACTATGAAA GACGGGGGCA TCCCACTAAA       960 GATAAAAGAA TCTTTCTAAA AGATGAGGAA TATACCATCT CCTGGAAAGC AGAAGATAGA      1020 GAGAGAGCTA TTTGTGATTT TGTGATATGG AAAACCTTTC CCAGGGCCAT ACAAACAATC      1080 CATAATGAGA GCTTTCACTT TGTGGCAAAT GAAGTCACAG CCAGCTTTTT AACATCCAAC      1140 CAAGAAGAAA CGGAGCTACG TGGAAATACC GAGATATTGA ATTGCATGAA TAGTACCATA      1200 AATGAAACTC TAGAAGAGAC AGTCAAAAAA TTTAACAAAT CCCATATCAG AGATGGGGAG      1260 GTAAAGTACT ATAAAACAAA TGGGGGACTA TTCCTTATCT GGCAGGCAAT GAAACCCCTT      1320 AATCTGTCAG AACACACAAA CTACACTATT GAAAGGAATA ACAAGACTGG AAATAAATCA      1380 AGACAAAAAA GGTCTGTAGA TACAAAGACC TTCCAAGGCG CCAAGGGCCT GTCCACTGCC      1440 CAGGTTCAAT ATGCCTATGA CCATTTAAGA ACAAGCATGA ATCACATCCT AGAGGAATTA      1500 ACCAAAACAT GGTGCCGGGA ACAAAAAAAG GACAATCTAA TGTGGTATGA GCTGAGTAAA      1560 ATTAACCCAG TGAGTGTCAT GGCAGCCATT TATGGGAAAC CTGTGGCAGT GAAAGCCATG      1620 GGAGATGCAT TCATGGTTTC TGAGTGCATC AATGTTGACC AGGCAAGTGT CAATATCCAT      1680 AAAAGTATGA GAACGGATGA TCCCAAGGTA TGTTACTCCA GACCCCTGGT CACATTTAAA      1740 TTTGTGAATA GTACTGCCAC CTTCAGGGGT CAGCTTGGAA CAAGGAATGA AATCTTGCTC      1800 ACAAACACAC ACGTGGAAAC TTGTAGACCA ACAGCAGATC ATTATTTTTT TGTAAAGAAC      1860 ATGACACACT ATTTTAAGGA CTATAAATTT GTGAAGACAA TGGATACCAA TAACATATCC      1920 ACCCTGGATA CATTTTTAAC TCTCAATTTA ACTTTTATAG ACAATATAGA TTTCAAGACA      1980 GTGGAACTTT ACAGTGAGAC TGAAAGAAAG ATGGCCAGTG CCCTCGACCT GGAGACGATG      2040 TTTAGAGAGT ATAATTACTA CACACAGAAG CTTGCAAGTC TGAGAGAAGA TCTAGACAAC      2100 ACCATTGACC TGAACAGGGA CAGACTAGTT AAAGATCTCT CTGAAATGAT GGCAGACCTT      2160 GGAGACATTG GAAAAGTGGT GGTCAACACA TTCAGTGGCA TTGTCACTGT TTTTGGGTCT      2220 ATAGTTGGTG GATTTGTCAG TTTTTTCACA ACCCCCATTG GGGGCGTGAC GATCATCCTC      2280 CTTCTCATAG TTGTGGTTTT TGTTGTTTTT ATAGTCTCCA GGAGAACCAA TAACATGAAC      2340 GAGGCCCCCA TAAAAATGAT CTATCCAAAC ATTGACAAAG CCTCTGAGCA GGAGAACATT      2400 CAGCCCCTAC CCGGAGAGGA GATTAAGCGC ATCCTCCTTG GAATGCACCA GCTCCAGCAA      2460 AGTGAGCACG GCAAATCTGA GGAAGAGGCT AGCCATAAAC CAGGGTTGTT CCAACTATTG      2520 GGGGATGGCC TACAATTGCT GCGCAGGCGC GGGTATACTA GGTTACCAAC TTTTGACCCC      2580 AGTCCAGGCA ATGACACATC TGAGACACAC CAAAAATATG TTT                        2623 SEQ ID NO:7: ATGGGGGTCG GGGGCGGGCC TCGCGTCGTC CTCTGTCTAT GGTGCGTCGC TGCGCTTCTC        60 TGCCAGGGGG TGGCGCAAGA AGTTGTGGCT GAAACGACCA CCCCGTTCGC AACCCACAGA       120 CCAGAAGTGG TGGCCGAGGA GAACCCGGCC AACCCCTTTC TGCCGTTCAG GGTATGCGGG       180 GCCTCGCCTA CGGGCGGAGA GATATTCAGG TTCCCCCTGG AGGAGAGCTG CCCCAACACG       240 GAAGACAAGG ACCACATAGA GGGCATAGCT CTCATCTACA AGACCAACAT AGTGCCTTAT       300 GTTTTTAATG TCAGAAAGTA TAGGAAGATC ATGACCTCGA CCACCATCTA CAAGGGTTGG       360 AGCGAGGATG CCATAACAAA CCAGCACACG AGGAGCTACG CCGTCCCCCT GTACGAGGTC       420 CAGATGATGG ACCACTATTA TCAGTGCTTT AGCGCCGTAC AGGTCAACGA GGGGGGGCAC       480 GTCAACACCT ACTATCACAG GGACGGGTGG AACGAGACCG CCTTCCTCAA ACCGGCCGAT       540 GGTCTCACCT CTAGCATAAC GCGCTATCAG AGTCAACCAG AGGTGTACGC CACCCCCAGA       600 AACCTGTTGT GGTCTTACAC AACAAGAACC ACAGTCAACT GCGAGGTGAC AGAGATGTCT       660 GCGAGATCCA TGAAACCATT TGAGTTCTTT GTGACGTCTG TTGGTGACAC TATAGAGATG       720 TCGCCCTTTT TAAAAGAAAA TGGCACAGAG CCAGAGAAAA TCTTGAAAAG ACCACACTCT       780 ATTCAACTGC TGAAAAACTA TGCTGTCACA AAGTACGGTG TGGGGTTGGG GCAGGCTGAT       840 AACGCTACCA GATTCTTTGC AATATTTGGG GACTATTCCC TGTCTTGGAA AGCCACCACT       900 GAAAACAGCT CCTACTGTGA TTTAATTTTA TGGAAGGGGT TTTCCAATGC CATTCAAACT       960 CAACACAATA GCAGTCTCCA TTTTATTGCC AATGATATAA CAGCCTCCTT CTCTACTCCT      1020 TTAGAAGAAG AGGCTAATTT TAACGAGACA TTTAAGTGTA TATGGAACAA CACCCAAGAA      1080 GAAATTCAAA AAAAGTTAAA AGAGGTTGAA AAAACTCACA GACCTAACGG TACTGCGAAG      1140 GTCTATAAAA CAACAGGCAA TCTGTACATT GTTTGGCAAC CGCTTATACA GATAGACCTG      1200 CTAGATACTC ATGCCAAGCT GTACAATCTC ACAAACGCTA CAGCTTCACC TACATCAACA      1260 CCCACAACAT CTCCCAGGAG AAGACGCAGG GATACTTCAA GTGTTAGTGG CGGTGGAAAT      1320 AATGGAGACA ACTCAACTAA GGAAGAGAGT GTGGCGGCCT CCCAGGTTCA GTTTGCCTAT      1380 GACAATCTCA GAAAGAGCAT CAACAGGGTG TTGGGAGAGC TGTCCAGGGC ATGGTGCAGG      1440 GAACAGTACA GGGCCTCGCT CATGTGGTAC GAGCTGAGCA AGATCAACCC CACCAGCGTC      1500 ATGAGCGCCA TCTATGGCAG GCCAGTGTCT GCCAAGTTGA TAGGGGACGT GGTGTCAGTG      1560 TCAGATTGTA TCAGTGTTGA CCAAAAGAGC GTGTTTGTGC ACAAAAATAT GAAGGTGCCT      1620 GGCAAAGAAG ACCTGTGTTA CACCAGGCCT GTGGTGGGCT TCAAGTTTAT CAATGGGAGC      1680 GAACTGTTTG CTGGCCAGCT GGGTCCCAGG AACGAGATTG TGCTGTCCAC CTCTCAGGTG      1740 GAGGTCTGCC AGCACAGCTG CGAGCACTAC TTCCAGGCCG GGAACCAGAT GTACAAGTAC      1800 AAGGACTACT ACTATGTCAG TACCCTCAAC CTGACTGACA TACCCACCCT ACACACCATG      1860 ATTACCCTGA ACCTGTCTCT GGTAGAGAAT ATAGATTTTA AGGTGATTGA GCTCTATTCT      1920 AAAACAGAGA AAAGGCTGTC CAACGTGTTT GACATCGAGA CCATGTTCAG GGAGTACAAC      1980 TACTACACTC AGAACCTCAA CGGGCTGAGG AAGGACCTGG ATGACAGCAT AGATCATGGC      2040 AGGGACAGCT TCATCCAGAC CCTGGGTGAC ATCATGCAGG ACCTGGGCAC CATAGGCAAG      2100 GTGGTGGTCA ATGTGGCCAG CGGAGTGTTC TCCCTCTTTG GGAGCATAGT CTCGGGGGTG      2160 ATAAGCTTTT TCAAAAATCC CTTTGGGGGC ATGCTGCTCA TAGTCCTCAT CATAGCCGGG      2220 GTAGTGGTGG TGTACCTGTT TATCACCAGG TCCAGGAGCA TATACTCTGC CCCCATTAGA      2280 ATGCTCTACC CCGGGGTGGA GAGGGCGGCC CAGGAGCCGG GCGCGCACCC GGTGTCAGAA      2340   GACCAAATCA GGAACATCCT GATGGGAATG CACCAATTTC AGCAGCGGCA GCGGGCGGAA      2400 GAGGAGGCCC GACGAGAGGA AGAAGTAAAA GGAAAAAGAA CTCTCTTTGA AGTGATAAGA      2460 GACTCTGCGA CCAGCGTTCT GAGGAGGAGA AGAGGGGGTG GTGGGTACCA GCGCCTACAG      2520 CGAGACGGGA GCGACGATGA GGGGGATTAT GAGCCATTGA GGCGACAAGA TGGAGGCTAC      2580 GACGACGTGG ACGTGGAGGC AGGCACGGCG GATACCGGTG TGTAA                      2625 SEQ ID NO:8: ATGTACCCTA CAGTGAAAAG TATGAGAGTC GCCCACCTAA CCAATCTCCT AACCCTTCTG        60 TGTCTGCTGT GCCACACGCA TCTCTACGTA TGTCAGCCAA CCACTCTGAG GCAGCCATCA       120 GACATGACCC CAGCCCAGGA CGCTCCAACA GAGACTCCCC CACCCCTCTC AACTAACACT       180 AACAGAGGAT TTGAGTACTT TCGCGTGTGT GGGGTGGCTG CCACGGGGGA GACCTTCAGG       240 TTTGATTTAG ACAAAACATG CCCCAGTACA CAAGATAAGA AGCATGTGGA GGGCATCTTG       300 CTCGTGTATA AGATCAACAT CGTGCCCTAC ATCTTCAAAA TCAGGAGATA TAGAAAAATA       360 ATTACTCAAC TGACCATCTG GCGAGGCCTA ACCACTAGTT CAGTCACTGG TAAATTTGAA       420 ATGGCCACTC AGGCCCACGA GTGGGAAGTG GGCGACTTTG ACAGCATCTA TCAGTGCTAC       480 AATAGCGCCA CCATGGTGGT AAACAACGTC AGACAGGTGT ATGTGGACAG AGATGGGGTC       540 AATAAAACTG TGAACATACG CCCTGTTGAT GGTCTAACAG GGAATATCCA AAGATACTTT       600 AGTCAGCCCA CCCTTTATTC AGAACCTGGT TGGATGCCTG GCTTTTATCG TGTTCGAACC       660 ACCGTTAACT GTGAAATTGT AGACATGGTG GCACGCTCCA TGGATCCCTA TAACTACATC       720 GCTACCGCCC TGGGAGACAG CCTGGAGCTC TCCCCGTTTC AAACCTTTGA CAACACCAGC       780 CAGTGTACTG CGCCTAAGAG AGCTGATATG AGGGTCAGGG AGGTCAAGAA TTACAAGTTT       840 GTAGATTATA ATAACAGGGG AACTGCCCCC GCTGGACAAA GCAGGACCTT TCTAGAGACT       900 CCCTCTGCCA CTTACTCCTG GAAAACAGCC ACCAGACAAA CTGCCACGTG CGACCTGGTG       960 CACTGGAAAA CATTCCCTCG CGCCATCCAA ACTGCTCATG AACATAGCTA CCATTTTGTG      1020 GCCAATGAAG TCACCGCCAC CTTCAATACA CCCCTGACTG AGGTAGAAAA TTTCACCAGC      1080 ACGTATAGCT GCGTCAGTGA CCAGATCAAT AAGACCATCT CTGAATATAT CCAAAAGTTG      1140 AACAACTCCT ACGTGGCCAG TGGGAAAACA CAGTATTTCA AGACTGATGG TAACCTGTAC      1200 CTCATCTGGC AACCACTCGA ACATCCAGAG ATTGAAGACA TAGACGAGGA CAGCGACCCA      1260 GAACCAACCC CCGCCCCACC AAAGTCCACA AGGAGAAAAA GAGAGGCAGC TGACAATGGA      1320 AACTCAACAT CTGAGGTCTC AAAGGGCTCA GAAAATCCGC TCATTACGGC CCAAATTCAA      1380 TTTGCCTATG ACAAGCTGAC CACCAGCGTC AACAACGTGC TTGAGGAGTT GTCCAGGGCG      1440 TGGTGTAGAG AACAGGTCAG AGACACCCTC ATGTGGTATG AGCTTAGCAA GGTCAACCCT      1500 ACGAGTGTGA TGTCTGCCAT TTATGGAAAG CCTGTCGCTG CCAGGTACGT GGGCGACGCC      1560 ATATCTGTGA CAGACTGTAT CTATGTGGAC CAAAGTTCAG TCAACATCCA CCAGAGCTTG      1620 CGGCTGCAGC ATGATAAAAC CACCTGCTAC TCGAGACCTA GAGTCACCTT CAAATTTATA      1680 AACAGTACAG ACCCGCTAAC TGGCCAGTTG GGTCCTAGAA AAGAAATTAT CCTCTCCAAC      1740 ACAAACATAG AAACATGCAA GGATGAGAGT GAACACTACT TCATTGTGGG GGAATACATT      1800 TACTATTATA AAAATTACAT TTTTGAAGAA AAGCTAAACC TCTCAAGCAT CGCTACCCTA      1860 GACACATTTA TAGCCCTCAA TATCTCATTT ATTGAAAATA TCGACTTCAA AACAGTAGAA      1920 CTGTACTCCT CTACTGAAAG GAAACTCGCA TCGAGCGTCT TTGATATAGA ATCCATGTTT      1980 AGGGAATATA ACTATTACAC CTACAGCCTC GCGGGCATTA AGAAGGACCT AGACAACACC      2040 ATCGACTACA ATAGAGACAG ACTGGTTCAG GACCTGTCAG ACATGATGGC TGATCTGGGA      2100 GACATTGGAA GATCTGTGGT GAATGTGGTC AGCTCGGTAG TCACATTTTT CAGTAGTATT      2160 GTGACAGGGT TCATTAAATT CTTTACCAAC CCTCTAGGGG GAATATTCAT TCTCCTAATT      2220 ATTGGTGGAA TAATCTTCTT GGTGGTAGTC CTAAATAGAA GAAACTCACA GTTTCACGAT      2280 GCACCCATCA AAATGCTGTA CCCTTCTGTT GAAAACTACG CTGCCAGACA GGCGCCACCT      2340 CCCTATAGCG CATCACCTCC AGCTATAGAC AAAGAGGAAA TTAAGCGCAT ACTTTTGGGC      2400 ATGCATCAGG TACACCAGGA AGAAAAGGAA GCACAGAAAC AACTAACCAA CTCTGGCCCT      2460 ACTTTGTGGC AGAAAGCCAC AGGATTCCTT AGAAATCGCC GGAAGGGATA CAGCCAACTT      2520 CCTCTGGAAG ATGAATCAAC TTCCCTCT                                         2548 SEQ ID NO:9: ATGACTCGGC GTAGGGTGCT AAGCGTGGTC GTGCTGCTAG CCGCCCTGGC GTGCCGTCTC        60 GGTGCGCAGA CCCCAGAGCA GCCCGCACCC CCCGCCACCA CGGTGCAGCC TACCGCCACG       120 CGTCAGCAAA CCAGCTTTCC TTTCCGAGTC TGCGAGCTCT CCAGCCACGG CGACCTGTTC       180 CGCTTCTCCT CGGACATCCA GTGTCCCTCG TTTGGCACGC GGGAGAATCA CACGGAGGGC       240 CTGTTGATGG TGTTTAAAGA CAACATTATT CCCTACTCGT TTAAGGTCCG CTCCTACACC       300 AAGATAGTGA CCAACATTCT CATCTACAAT GGCTGGTACG CGGACTCCGT GACCAACCGG       360 CACGAGGAGA AGTTCTCCGT TGACAGCTAC GAAACTGACC AGATGGATAC CATCTACCAG       420 TGCTACAACG CGGTCAAGAT GACAAAAGAT GGGCTGACGC GCGTGTATGT AGACCGCGAC       480 GGAGTTAACA TCACCGTCAA CCTAAAGCCC ACCGGGGGCC TGGCCAACGG GGTGCGCCGC       540 TACGCCAGCC AGACGGAGCT CTATGACGCC CCCGGGTGGT TGATATGGAC TTACAGAACA       600 AGAACTACCG TCAACTGCCT GATAACTGAC ATGATGGCCA AGTCCAACAG CCCCTTCGAC       660 TTCTTTGTGA CCACCACCGG GCAGACTGTG GAAATGTCCC CTTTCTATGA CGGGAAAAAT       720 AAGGAAACCT TCCATGAGCG GGCAGACTCC TTCCACGTGA GAACTAACTA CAAGATAGTG       780 GACTACGACA ACCGAGGGAC GAACCCGCAA GGCGAACGCC GAGCCTTCCT GGACAAGGGC       840 ACTTACACGC TATCTTGGAA GCTCGAGAAC AGGACAGCCT ACTGCCCGCT TCAACACTGG       900 CAAACCTTTG ACTCGACCAT CGCCACAGAA ACAGGGAAGT CAATACATTT TGTGACTGAC       960 GAGGGCACCT CTAGCTTCGT GACCAACACA ACCGTGGGCA TAGAGCTCCC GGACGCCTTC      1020 AAGTGCATCG AAGAGCAGGT GAACAAGACC ATGCATGAGA AGTACGAGGC CGTCCAGGAT      1080 CGTTACACGA AGGGCCAGGA AGCCATTACA TATTTTATAA CGAGCGGAGG ATTGTTATTA      1140 GCTTGGCTAC CTCTGACCCC GCGCTCGTTG GCCACCGTCA AGAACCTGAC GGAGCTTACC      1200 ACTCCGACTT CCTCACCCCC CAGCAGTCCA TCGCCCCCAG CCCCATCCGC GGCCCGCGGG      1260 AGCACCCCCG CCGCCGTTCT GAGGCGTCGG AGGCGGGATG CGGGGAACGC CACCACACCG      1320 GTGCCCCCCA CGGCCCCCGG GAAGTCCCTG GGCACCCTCA ACAATCCCGC CACCGTCCAG      1380 ATCCAATTTG CCTACGACTC CCTGCGCCGC CAGATCAACC GCATGCTGGG AGACCTTGCG      1440 CGGGCCTGGT GCCTGGAGCA GAAGAGGCAG AACATGGTGC TGAGAGAACT AACCAAGATT      1500 AATCCAACCA CCGTCATGTC CAGCATCTAC GGTAAGGCGG TGGCGGCCAA GCGCCTGGGG      1560 GATGTCATCT CAGTCTCCCA GTGCGTGCCC GTTAACCAGG CCACCGTCAC CCTGCGCAAG      1620 AGCATGAGGG TCCCTGGCTC CGAGACCATG TGCTACTCGC GCCCCCTGGT GTCCTTCAGC      1680 TTTATCAACG ACACCAAGAC CTACGAGGGA CAGCTGGGCA CCGACAACGA GATCTTCCTC      1740 ACAAAAAAGA TGACGGAGGT GTGCCAGGCG ACCAGCCAGT ACTACTTCCA GTCCGGCAAC      1800 GAGATCCACG TCTACAACGA CTACCACCAC TTTAAAACCA TCGAGCTGGA CGGCATTGCC      1860 ACCCTGCAGA CCTTCATCTC ACTAAACACC TCCCTCATCG AGAACATTGA CTTTGCCTCC      1920 CTGGAGCTGT ACTCACGGGA CGAACAGCGT GCCTCCAACG TCTTTGACCT GGAGGGCATC      1980 TTCCGGGAGT ACAACTTCCA GGCGCAAAAC ATCGCCGGCC TGCGGAAGGA TTTGGACAAT      2040 GCAGTGTCAA ACGGAAGAAA TCAATTCGTG GACGGCCTGG GGGAACTTAT GGACAGTCTG      2100 GGTAGCGTGG GTCAGTCCAT CACCAACCTA GTCAGCACGG TGGGGGGTTT GTTTAGCAGC      2160 CTGGTCTCTG GTTTCATCTC CTTCTTCAAA AACCCCTTCG GCGGCATGCT CATTCTGGTC      2220 CTGGTGGCGG GGGTGGTGAT CCTGGTTATT TCCCTCACGA GGCGCACGCG CCAGATGTCG      2280 CAGCAGCCGG TGCAGATGCT CTACCCCGGG ATCGACGAGC TCGCTCAGCA ACATGCCTCT      2340 GGTGAGGGTC CAGGCATTAA TCCCATTAGT AAGACAGAAT TACAAGCCAT CATGTTAGCG      2400 CTGCATGAGC AAAACCAGGA GCAAAAGAGA GCAGCTCAGA GGGCGGCCGG ACCCTCAGTG      2460 GCCAGCAGAG CATTGCAGGC AGCCAGGGAC CGTTTTCCAG GCCTACGCAG AAGACGCTAT      2520 CACGATCCAG AGACCGCCGC CGCACTGCTT GGGGAGGCAG AGACTGAGTT TT              2572 SEQ ID NO:I0: ATGGAATCCA GGATCTGGTG CCTGGTAGTC TGCGTTAACC TGTGTATCGT CTGTCTGGGT        60 GCTGCGGTTT CCTCTTCTAG TACTTCCCAT GCAACTTCTT CTACTCACAA TGGAAGCCAT       120 ACTTCTCGTA CGACGTCTGC TCAAACCCGG TCAGTCTATT CTCAACACGT AACGTCTTCT       180 GAAGCCGTCA GTCATAGAGC CAACGAGACT ATCTACAACA CTACCCTCAA GTACGGAGAT       240 GTGGTGGGAG TCAACACTAC CAAGTACCCC TATCGCGTGT GTTCTATGGC CCAGGGTACG       300 GATCTTATTC GCTTTGAACG TAATATCATC TGCACCTCGA TGAAGCCTAT CAATGAAGAC       360 TTGGATGAGG GCATCATGGT GGTCTACAAG CGCAACATCG TGGCGCACAC CTTTAAGGTA       420 CGGGTCTACC AAAAGGTTTT GACGTTTCGT CGTAGCTACG CTTACATCTA CACCACTTAT       480 CTGCTGGGCA GCAATACGGA ATACGTGGCG CCTCCTATGT GGGAGATTCA TCACATCAAC       540 AAGTTTGCTC AATGCTACAG TTCCTACAGC CGCGTTATAG GAGGCACGGT TTTCGTGGCA       600 TATCATAGGG ACAGTTATGA AAACAAAACC ATGCAATTAA TTCCCGACGA TTATTCCAAC       660 ACCCACAGTA CCCGTTACGT GACGGTCAAG GATCAGTGGC ACAGCCGCGG CAGCACCTGG       720 CTCTATCGTG AGACCTGTAA TCTGAACTGT ATGCTGACCA TCACTACTGC GCGCTCCAAG       780 TATCCTTATC ATTTTTTTGC AACTTCCACG GGTGATGTGG TTTACATTTC TCCTTTCTAC       840 AACGGAACCA ATCGCAATGC CAGCTACTTT GGAGAAAACG CCGACAAGTT TTTCATTTTC       900 CCGAACTACA CCATCGTTTC CGACTTTGGA AGACCCAACG CTGCGCCAGA AACCCATAGG       960 TTGGTGGCTT TTCTCGAACG TGCCGACTCG GTGATCTCTT GGGATATACA GGACGAGAAG      1020 AATGTCACCT GCCAGCTCAC CTTCTGGGAA GCCTCGGAAC GTACTATCCG TTCCGAAGCC      1080 GAAGACTCGT ACCACTTTTC TTCTGCCAAA ATGACTGCAA CTTTTCTGTC TAAGAAACAA      1140 GAAGTGAACA TGTCCGACTC CGCGCTGGAC TGCGTACGTG ATGAGGCTAT AAATAAGTTA      1200 CAGCAGATTT TCAATACTTC ATACAATCAA ACATATGAAA AATACGGAAA CGTGTCCGTC      1260 TTCGAAACCA GCGGCGGTCT GGTGGTGTTC TGGCAAGGCA TCAAGCAAAA ATCTTTGGTG      1320 GAATTGGAAC GTTTGGCCAA TCGATCCAGT CTGAATATCA CTCATAGGAC CAGAAGAAGT      1380 ACGAGTGACA ATAATACAAC TCATTTGTCC AGCATGGAAT CGGTGCACAA TCTGGTCTAC       1440 GCCCAGCTGC AGTTCACCTA TGACACGTTG CGCGGTTACA TCAACCGGGC GCTGGCGCAA       1500 ATCGCAGAAG CCTGGTGTGT GGATCAACGG CGCACCCTAG AGGTCTTCAA GGAACTCAGC       1560 AAGATCAACC CGTCAGCCAT TCTCTCGGCC ATTTACAACA AACCGATTGC CGCGCGTTTC       1620 ATGGGTGATG TCTTGGGCCT GGCCAGCTGC GTGACCATCA ACCAAACCAG CGTCAAGGTG       1680 CTGCGTGATA TGAACGTGAA GGAATCGCCA GGACGCTGCT ACTCACGACC CGTGGTCATC       1740 TTTAATTTCG CCAACAGCTC GTACGTGCAG TACGGTCAAC TGGGCGAGGA CAACGAAATC       1800 CTGTTGGGCA ACCACCGCAC TGAGGAATGT CAGCTTCCCA GCCTCAAGAT CTTCATCGCC       1860 GGGAACTCGG CCTACGAGTA CGTGGACTAC CTCTTCAAAC GCATGATTGA CCTCAGCAGT       1920 ATCTCCACCG TCGACAGCAT GATCGCCCTG GATATCGACC CGCTGGAAAA TACCGACTTC       1980 AGGGTACTGG AACTTTACTC GCAGAAAGAG CTGCGTTCCA GCAACGTTTT TGACCTCGAA       2040 GAGATCATGC GCGAATTCAA CTCGTACAAG CAGCGGGTAA AGTACGTGGA GGACAAGGTA       2100 GTCGACCCGC TACCGCCCTA CCTCAAGGGT CTGGACGACC TCATGAGCGG CCTGGGCGCC       2160 GCGGGAAAGG CCGTTGGCGT AGCCATTGGG GCCGTGGGTG GCGCGGTGGC CTCCGTGGTC       2220 GAAGGCGTTG CCACCTTCCT CAAAAACCCC TTCGGAGCCT TCACCATCAT CCTCGTGGCC       2280 ATAGCCGTAG TCATTATCAC TTATTTGATC TATACTCGAC AGCGGCGTCT GTGCACGCAG       2340 CCGCTGCAGA ACCTCTTTCC CTATCTGGTG TCCGCCGACG GGACCACCGT GACGTCGGGC       2400 AGCACCAAAG ACACGTCGTT ACAGGCTCCG CCTTCCTACG AGGAAAGTGT TTATAATTCT       2460 GGTCGCAAAG GACCGGGACC ACCGTCGTCT GATGCATCCA CGGCGGCTCC GCCTTACACC       2520 AACGAGCAGG CTTACCAGAT GCTTCTGGCC CTGGCCCGTC TGGACGCAGA GCAGCGAGCG       2580 CAGCAGAACG GTACAGATTC TTTGGACGGA CAGACTGGCA CGCAGGACAA GGGACAGAAG       2640 CCTAACCTGC TAGACCGGCT GCGACATCGC AAAAACGGCT ACAGACACTT GAAAGACTCC       2700 GACGAAGAAG AGAACGTCTG AA                                                2722 SEQ ID NO:11: ATGAGCAAGA TGAGAGTATT ATTCCTGGCT GTCTTTTTGA TGAATAGTGT TTTAATGATA         60 TATTGCGATT CGGATGATTA TATCAGAGCG GGCTATAATC ACAAATATCC TTTTCGGATT        120 TGTTCGATTG CCAAAGGCAC TGATTTGATG CGGTTCGACA GAGATATTTC GTGTTCGCCA        180 TATAAGTCTA ATGCAAAGAT GTCGGAGGGT TTTTTCATCA TTTACAAAAC AAATATCGAG        240 ACCTACACTT TTCCAGTGAG AACATATAAA AACGAGCTGA CGTTCCAAAC CAGTTACCGT        300 GATGTGGGTG TGGTTTATTT TCTGGATCGG ACGGTGATGG GTTTGGCCAT GCCGGTGTAC        360 GAAGCAAATT TAGTTAATTC TCGTGCGCAG TGTTATTCAG CCGTAGCGAT AAAACGACCC        420 GATGGTACGG TGTTTAGTGC CTATCATGAG GATAATAATA AAAACGAAAC TCTAGAATTA        480 TTTCCTCTGA ATTTCAAGTC TGTTACTAAT AAAAGATTTA TCACTACGAA AGAACCCTAC        540 TTTGCAAGGG GTCCTTTGTG GCTCTATTCT ACATCGACGT CTCTCAATTG TATTGTGACG        600 GAGGCTACGG CTAAGGCGAA ATATCCGTTT AGTTACTTTG CTTTGACGAC TGGTGAAATC        660 GTGGAAGGGT CTCCGTTCTT CGACGGTTCA AACGGTAAAC ATTTTGCAGA GCCGTTAGAA        720 AAATTGACAA TCTTGGAAAA CTATACTATG ATAGAAGATC TAATGAATGG TATGAATGGG        780 GCTACTACGT TAGTAAGGAA GATCGCTTTT CTGGAGAAAG GGGATACTTT GTTTTCTTGG        840 GAAATCAAGG AAGAGAATGA ATCGGTGTGT ATGCTAAAGC ACTGGACTAC GGTGACTCAC        900 GGGCTTCGAG CGGAGACGGA TGAGACTTAT CACTTTATTT CTAAGGAGTT GACAGCCGCT        960 TTCGTCGCCT CCAAGGAGTC TTTAAATCTT ACCGATCCCA AACAAACGTG TATTAAGAAT       1020 GAATTTGAGA AGATAATTAC AGATGTCTAT ATGTCAGATT ATAATGATGA CTACAGCATG       1080 AACGGTAGTT ATCAAATTTT TAAGACTACG GGAGATCTGA TTTTGATTTG GCAGCCTCTT       1140 GTGCAAAAAT CTCTTATGGT TCTTGAGCAG GGTTCAGTAA ACTTACGTAG GAGGCGAGAT       1200 TTGGTGGATG TCAAGTCTAG ACATGATATT CTTTATGTGC AATTACAGTA CCTCTATGAT       1260 ACTTTGAAAG ATTATATCAA CGATGCCTTG GGGAATTTGG CAGAATCTTG GTGCCTCGAT       1320 CAAAAACGAA CGATAACGAT GTTGCACGAA CTTAGTAAGA TCAGTCCATC GAGTATCGTG       1380 TCTGAGGTTT ACGGTCGTCC GATATCTGCA CAGTTGCATG GTGATGTGTT AGCTATCTCG       1440 AAATGCATAG AAGTTAATCA ATCATCCGTT CAGCTTTATA AGAGTATGCG GGTCGTCGAT       1500 GCGAAGGGAG TAAGGAGTGA AACGATGTGT TATAATCGGC CCTTGGTGAC GTTTAGCTTT       1560 GTGAACTCCA CGCCTGAGGT TGTCCTTGGT CAGCTAGGGT TAGATAATGA GATTCTGTTG       1620 GGTGATCATA GGACAGAGGA ATGTGAGATA CCTAGTACAA AGATATTTCT ATCTGGAAAT       1680 CATGCACACG TGTATACCGA TTATACGCAT ACGAATTCGA CGCCCATAGA AGACATTGAG       1740 GTATTGGATG CTTTTATTAG ACTAAAGATC GACCCTCTCG AAAATGCTGA TTTTAAACTA       1800 CTTGATTTAT ATTCGCCGGA CGAATTGAGT AGAGCAAACG TTTTCGATTT AGAGAATATT       1860 CTTCGTGAAT ATAACTCATA TAAGAGCGCA CTATATACTA TAGAAGCTAA AATTGCTACT       1920 AATACGCCGT CGTATGTCAA TGGGATTAAT TCTTTTTTAC AAGGGCTTGG GGCTATAGGC       1980 ACTGGATTGG GCTCGGTTAT AAGTGTTACG GCAGGAGCAC TTGGGGATAT TGTGGGTGGA       2040 GTGGTGTCTT TTTTAAAAAA TCCATTCGGG GGTGGTCTCA TGTTGATTTT AGCGATAGTA       2100 GTTGTCGTTA TAATAATTGT GGTTTTCGTT AGACAAAAAC ATGTGCTTAG TAAGCCTATT       2160 GACATGATGT TTCCTTATGC CACCAATCCG GTGACTACTG TGTCCAGTGT TACGGGGACC       2220 ACTGTCGTCA AGACGCCTAG TGTTAAAGAT GCTGACGGGG GCACATCTGT TGCGGTTTCG       2280 GAAAAAGAGG AGGGTATGGC TGACGTCAGT GGACAAATAA GTGGTGATGA ATATTCACAA      2340 GAAGATGCTT TAAAAATGCT CAAGGCCATA AAGTCTTTAG ACGAGTCCTA CAGAAGAAAA      2400 CCTTCGTCTT CTGAGTCTCA TGCCTCAAAA CCTAGTTTGA TAGACAGGAT CAGGTATAGA      2460 GGTTATAAGA GTGTAAATGT AGAAGAAGCG TGA                                   2493 SEQ ID NO:12: ATGTTTGTTA CGGCGGTTGT GTCGGTCTCT CCAAGCTCGT TTTATGAGAG TTTACAAGTA        60 GAGCCCACAC AATCAGAAGA TATAACCCGG TCTGCTCATC TGGGCGATGG TGATGAAATC       120 AGAGAAGCTA TACACAAGTC CCAGGACGCC GAAACAAAAC CCACGTTTTA CGTCTGCCCA       180 CCGCCAACAG GCTCCACAAT CGTACGATTA GAACCAACTC GGACATGTCC GGATTATCAC       240 CTTGGTAAAA ACTTTACAGA GGGTATTGCT GTTGTTTATA AAGAAAACAT TGCAGCGTAC       300 AAGTTTAAGG CGACGGTATA TTACAAAGAT GTTATCGTTA GCACGGCGTG GGCCGGAAGT       360 TCTTATACGC AAATTACTAA TAGATATGCG GATAGGGTAC CAATTCCCGT TTCAGAGATC       420 ACGGACACCA TTGATAAGTT TGGCAAGTGT TCTTCTAAAG CAACGTACGT ACGAAATAAC       480 CACAAAGTTG AAGCCTTTAA TGAGGATAAA AATCCACAGG ATATGCCTCT AATCGCATCA       540 AAATATAATT CTGTGGGATC CAAAGCATGG CATACTACCA ATGACACGTA CATGGTTGCC       600 GGAACCCCCG GAACATATAG GACGGGCACG TCGGTGAATT GCATCATTGA GGAAGTTGAA       660 GCCAGATCAA TATTCCCTTA TGATAGTTTT GGACTTTCCA CGGGAGATAT AATATACATG       720 TCCCCGTTTT TTGGCCTACG GGATGGTGCA TACAGAGAAC ATTCCAATTA TGCAATGGAT       780 CGTTTTCACC AGTTTGAGGG TTATAGACAA AGGGATCTTG ACACTAGAGC ATTACTGGAA       840 CCTGCAGCGC GGAACTTTTT AGTCACGCCT CATTTAACGG TTGGTTGGAA CTGGAAGCCA       900 AAACGAACGG AAGTTTGTTC GCTTGTCAAG TGGCGTGAGG TTGAAGACGT AGTTCGCGAT       960 GAGTATGCAC ACAATTTTCG CTTTACAATG AAAACACTTT CTACCACGTT TATAAGTGAA      1020 ACAAACGAGT TTAATCTTAA CCAAATCCAT CTCAGTCAAT GTGTAAAGGA GGAAGCCCGG      1080 GCTATTATTA ACCGGATCTA TACAACCAGA TACAACTCAT CTCATGTTAG AACCGGGGAT      1140 ATCCAGACCT ACCTTGCCAG AGGGGGGTTT GTTGTGGTGT TTCAACCCCT GCTGAGCAAT      1200 TCCCTCGCCC GTCTCTATCT CCAAGAATTG GTCCGTGAAA ACACTAATCA TTCACCACAA      1260 AAACACCCGA CTCGAAATAC CAGATCCCGA CGAAGCGTGC CAGTTGAGTT GCGTGCCAAT      1320 AGAACAATAA CAACCACCTC ATCGGTGGAA TTTGCTATGC TCCAGTTTAC ATATGACCAC      1380 ATTCAAGAGC ATGTTAATGA AATGTTGGCA CGTATCTCCT CGTCGTGGTG CCAGCTACAA      1440 AATCGCGAAC GCGCCCTTTG GAGCGGACTA TTTCCAATTA ACCCAAGTGC TTTAGCGAGC      1500 ACCATTTTGG ATCAACGTGT TAAAGCTCGT ATTCTCGGCG ACGTTATCTC CGTTTCTAAT      1560 TGTCCAGAAC TGGGATCAGA TACACGCATT ATACTTCAAA ACTCTATGAG GGTATCTGGT      1620 AGTACTACGC GTTGTTATAG CCGTCCTTTA ATTTCAATAG TTAGTTTAAA TGGGTCCGGG      1680 ACGGTGGAGG GCCAGCTTGG AACAGATAAC GAGTTAATTA TGTCCAGAGA TCTGTTAGAA      1740 CCATGCGTGG CTAATCACAA GCGATATTTT CTATTTGGGC ATCACTACGT ATATTATGAG      1800 GATTATCGTT ACGTCCGTGA AATCGCAGTC CATGATGTGG GAATGATTAG CACTTACGTA      1860 CATTTAAACT TAACACTTCT TAAAGATAGA GAGTTTATGC CGCTGCAAGT ATATACAAGA      1920 GACGAGCTGC GGGATACAGG ATTACTAGAC TACAGTGAAA TTCAACGCCG AAATCAAATG      1980 CATTCGCTGC GTTTTTATGA CATAGACAAG GTTGTGCAAT ATGATAGCGG AACGGCCATT      2040 ATGCAGGGCA TGGCTCAGTT TTTCCAGGGA CTTGGGACCG CGGGCCAGGC CGTTGGACAT      2100 GTGGTTCTTG GGGCCACGGG AGCGCTGCTT TCCACCGTAC ACGGATTTAC CACGTTTTTA      2160 TCTAACCCAT TTGGGGCATT GGCCGTGGGA TTATTGGTTT TGGCGGGACT GGTAGCGGCC      2220 TTTTTTGCGT ACCGGTACGT GCTTAAACTT AAAACAAGCC CGATGAAGGC ATTATATCCA      2280 CTCACAACCA AGGGGTTAAA ACAGTTACCG GAAGGAATGG ATCCCTTTGC CGAGAAACCC      2340 AACGCTACTG ATACCCCAAT AGAAGAAATT GGCGACTCAC AAAACACTGA ACCGTCGGTA      2400 AATAGCGGGT TTGATCCCGA TAAATTTCGA GAAGCCCAGG AAATGATTAA ATATATGACG      2460 TTAGTATCTG CGGCTGAGCG CCAAGAATCT AAAGCCCGCA AAAAAAATAA GACTAGCGCC      2520 CTTTTAACTT CACGTCTTAC CGGCCTTGCT TTACGAAATC GCCGAGGATA CTCCCGTGTT      2580 CGCACCGAGA ATGTAACGGG GGTGTAAA                                         2608 SEQ ID NO:13: ATGCGCCAGG GCGCCGCGCG GGGGTGCCGG TGGTTCGTCG TATGGGCGCT CTTGGGGTTG        60 ACGCTGGGGG TCCTGGTGGC GTCGGCGGCT CCGAGTTCCC CCGGCACGCC TGGGGTCGCG       120 GCCGCGACCC AGGCGGCGAA CGGGGGACCT GCCACTCCGG CGCCGCCCGC CCCTGGCCCC       180 GCCCCAACGG GGGACACGAA ACCGAAGAAG AACAAAAAAC CGAAAAACCC ACCGCCGCCG       240 CGCCCCGCCG GCGACAACGC GACCGTCGCC GCGGGCCACG CCACCCTGCG CGAGCACCTG       300 CGGGACATCA AGGCGGAGAA CACCGATGCA AACTTTTACG TGTGCCCACC CCCCACGGGC       360 GCCACGGTGG TGCAGTTCGA GCAGCCGCGC CGCTGCCCGA CCCGGCCCGA GGGTCAGAAC       420 TACACGGAGG GCATCGCGGT GGTCTTCAAG GAGAACATCG CCCCGTACAA GTTCAAGGCC       480 ACCATGTACT ACAAACACGT CACCGTTTCG CAGGTGTGGT TCGGCCACCG CTACTCCCAG       540 TTTATGGGGA TCTTTGAGGA CCGCGCCCCC GTCCCCTTCG AGGAGGTGAT CGACAAGATC       600 AACGCCAAGG GGGTCTGTCG GTCCACGGCC AAGTACGTGC GCAACAACCT GGAGACCACC       660 GCGTTTCACC GGGACGACCA CGAGACCGAC ATGGAGCTGA AACCGGCCAA CGCCGCGACC         720 CGCACGAGCC GGGGCTGGCA CACCACCGAC CTCAAGTACA ACCCCTCGCG GGTGGAGGCG         780 TTCCACCGGT ACGGGACGAC GGTAAACTGC ATCGTCGAGG AGGTGGACGC GCGCTCGGTG         840 TACCCGTACG ACGAGTTTGT GCTGGCGACT GGCGACTTTG TGTACATGTC CCCGTTTTAC         900 GGCTACCGGG AGGGGTCGCA CACCGAACAC ACCAGCTACG CCGCCGACCG CTTCAAGCAG         960 GTTGACGGCT TCTACGCGCG CGACCTCACC ACCAAGGCCC GGGCCACGGC GCCGACCACC        1020 CGGAACCTGC TCACGACCCC CAAGTTCACC GTGGCCTGGG ACTGGGTGCC AAAGCGCCCG        1080 TCGGTCTGCA CCATGACCAA GTGGCAGGAG GTGGACGAGA TGCTGCGCTC CGAGTACGGC        1140 GGCTCCTTCC GATTCTCCTC CGACGCCATA TCCACCACCT TCACCACCAA CCTGACCGAG        1200 TACCCGCTCT CGCGCGTGGA CCTGGGGGAC TGCATCGGCA AGGACGCCCG CGACGCCATG        1260 GACCGCATCT TCGCCCGCAG GTACAACGCG ACGCACATCA AGGTGGGCCA GCCGCAGTAC        1320 TACCTGGCCA ATGGGGGCTT TCTGATCGCG TACCAGCCCC TTCTCAGCAA CACGCTCGCG        1380 GAGCTGTACG TGCGGGAACA CCTCCGAGAG CAGAGCCGCA AGCCCCCAAA CCCCACGCCC        1440 CCGCCGCCCG GGGCCAGCGC CAACGCGTCC GTGGAGCGCA TCAAGACCAC CTCCTCCATC        1500 GAGTTCGCCC GGCTGCAGTT TACGTACAAC CACATACAGC GCCATGTCAA CGATATGTTG        1560 GGCCGCGTTG CCATCGCGTG GTGCGAGCTG CAGAATCACG AGCTGACCCT GTGGAACGAG        1620 GCCCGCAAGC TGAACCCCAA CGCCATCGCC TCGGCCACCG TGGGCCGGCG GGTGAGCGCG        1680 CGGATGCTCG GCGACGTGAT GGCCGTCTCC ACGTGCGTGC CGGTCGCCGC GGACAACGTG        1740 ATCGTCCAAA ACTCGATGCG CATCAGCTCG CGGCCCGGGG CCTGCTACAG CCGCCCCCTG        1800 GTCAGCTTTC GGTACGAAGA CCAGGGCCCG TTGGTCGAGG GGCAGGTGGG GGAGAACAAC        1860 GAGCTGCGGC TGACGCGCGA TGCGATCGAG CCGTGCACCG TGGGACACCG GCGCTACTTC        1920 ACCTTCGGTG GGGGCTACGT GTACTTCGAG GAGTACGCGT ACTCCCACCA GCTGAGCCGC        1980 GCCGACATCA CCACCGTCAG CACCTTCATC GACCTCAACA TCACCATGCT GGAGGATCAC        2040 GAGTTTGTCC CCCTGGAGGT GTACACCCGC CACGAGATCA AGGACAGCGG CCTGCTGGAC        2100 TACACGGAGG TCCAGCGCCG CAACCAGCTG CACGACCTGC GCTTCGCCGA CATCGACACG        2160 GTCATCCACG CCGACGCCAA CGCCGCCATG TTCGCGGGCC TGGGCGCGTT CTTCGAGGGG        2220 ATGGGCGACC TGGGGCGCGC GGTCGGCAAG GTGGTGATGG GCATCGTGGG CGGCGTGGTA        2280 TCGGCCGTGT CGGGCGTGTC CTCCTTCATG TCCAACCCCT TTGGGGCGCT GGCCGTGGGT        2340 CTGTTGGTCC TGGCCGGCCT GGCGGCGGCT TTCTTCGCCT TTCGCTACGT CATGCGGCTG        2400 CAGAGCAACC CCATGAAGGC CCTGTACCCG CTAACCACCA AGGAGCTCAA GAACCCCACC        2460 AACCCGGACG CGTCCGGGGA GGGCGAGGAG GGCGGCGACT TTGACGAGGC CAAGCTAGCC        2520 GAGGCCCGGG AGATGATACG GTACATGGCC CTGGTGTCTG CCATGGAGCG CACGGAACAC        2580 AAGGCCAAGA AGAAGGGCAC GAGCGCGCTG CTCAGCGCCA AGGTCACCGA CATGGTCATG        2640 CGCAAGCGCC GCAACACCAA CTACACCCAA GTTCCCAACA AAGACGGTGA CGCCGACGAG        2700 GACGACCTGT GAC                                                           2713 SEQ ID NO:14:

 Met Val Pro Asn Lys His Leu Leu Leu Ile Ile Leu Ser Phe Ser Thr

 Ala Cys Gly Gln Thr Thr Pro Thr Thr Ala Val Glu Lys Asn Lys Thr

 Gln Ala Ile Tyr Gln Glu Tyr Phe Lys Tyr Arg Val Cys Ser Ala Ser

 Thr Thr Gly Glu Leu Phe Arg Phe Asp Leu Asp Arg Thr Cys Pro Ser

 Thr Glu Asp Lys Val His Lys Glu Gly Ile Leu Leu Val Tyr Lys Lys

 Asn Ile Val Pro Tyr Ile Phe Lys Val Arg Arg Tyr Lys Lys Ile Thr

 Thr Ser Val Arg Ile Phe Asn Gly Trp Thr Arg Glu Gly Val Ala Ile

 Thr Asn Lys Trp Glu Leu Ser Arg Ala Val Pro Lys Tyr Glu Ile Asp

 Ile Met Asp Lys Thr Tyr Gln Cys His Asn Cys Met Gln Ile Glu Val

 Asn Gly Met Leu Asn Ser Tyr Tyr Asp Arg Asp Gly Asn Asn Lys Thr

 Val Asp Leu Lys Pro Val Asp Gly Leu Thr Gly Ala Ile Thr Arg Tyr

 Ile Ser Gln Pro Lys Val Phe Ala Asp Pro Gly TrD Leu Trp Gly Thr

 Tyr Arg Thr Arg Thr Thr Val Asn Cys Glu Ile Val Asp Met Phe Ala

 Arg Ser Ala Asp Pro Tyr Thr Tyr Phe Val Thr Ala Leu Gly Asp Thr

 Val Glu Val Ser Pro Phe Cys Asp Val Asp Asn Ser Cys Pro Asn Ala

 Thr Asp Val Leu Ser Val Gln Ile Asp Leu Asn His Thr Val Val Asp

 Tyr Gly Asn Arg Ala Thr Ser Gln Gln His Lys Lys Arg Ile Phe Ala

 Mis Thr Leu Asp Tyr Ser Val Ser Trp Glu Ala Val Asn Lys Ser Ala

 Ser Val Cys Ser Met Val Phe Trp Lys Ser Phe 6ln Arg Ala Ile Gln

 Thr Glu His Asp Leu Thr Tyr His Phe Ile Ala Asn Glu Ile Thr Ala

 Gly Phe Ser Thr Val Lys Glu Pro Leu Ala Asn Phe Thr Ser Asp Tyr

 Asn Cys Leu Met Thr His Ile Asn Thr Thr Leu Glu Asp Lys Ile Ala

 Arg Val Asn Asn Thr His Thr Pro Asn Gly Thr Ala Glu Tyr Tyr Gln

 Thr Glu Gly Gly Met Ile Leu Val Trp Gln Pro Leu Ile Ala Ile Glu

 Leu Glu Glu Ala Met Leu Glu Ala Thr Thr Ser Pro Val Thr Pro Ser

 Ala Pro Thr Ser Ser Ser Arg Ser Lys Arg Ala Ile Arg Ser Ile Arg

 Asp Val Ser Ala Gly Ser Glu Asn Asn Val Phe Leu Ser Gln Ile Gln

 Tyr Ala Tyr Asp Lys Leu Arg Gln Ser Ile Asn Asn Val Leu Glu Glu

 Leu Ala Ile Thr Trp Cys Arg Glu Gln Val Arg Gln Thr Met Val Trp

 Tyr Glu Ile Ala Lys Ile Asn Pro Thr Ser Val Met Thr Ala Ile Tyr

 Gly Lys Pro Val Ser Arg Lys Ala Leu Gly Asp Val Ile Ser Val Thr

 Glu Cys Ile Asn Val Asp Gln Ser Ser Val Ser Ile His Lys Ser Leu

 Lys Tnr Glu Asn Asn Asp Ile Cys Tyr Ser Arg Pro Pro Val Thr Phe

 Lys Phe Val Asn Ser Ser Gln Leu Phe Lys Gly Gln Leu Gly Ala Arg

 Asn Glu Ile Leu Leu Ser Glu Ser Leu Val Glu Asn Cys His Gln Asn

 Ala Glu Thr Phe Phe Thr Ala Lys Asn Glu Thr Tyr His Phe Lys Asn

 Tyr Val His Val Glu Thr Leu Pro Val Asn Asn lle Ser Thr Leu Asp

 Thr Phe Leu Ala Leu Asn Leu Thr Phe Ile Glu Asn Ile Asp Phe Lys

 Ala Val Glu Leu Tyr Ser Ser Gly Glu Arg Lys Leu Ala Asn Val Phe

 Asp Leu Glu Thr Met Phe Arg Glu Tyr Asn Tyr Tyr Ala Gln Ser Ile

 Ser Gly Leu Arg Lys Asp Phe Asp Asn Ser Gln Arg Asn Asn Arg Asp

 Arg Ile Ile Gln Asp Phe Ser Glu Ile Leu Ala Asp Leu Gly Ser Ile

 Gly Lys Val Ile Val Asn Val Ala Ser Gly Ala Phe Ser Leu Phe Gly

 Gly Ile Val Thr Gly Ile Leu Asn Phe Ile Lys Asn Pro Leu Gly Gly

 Met Phe Thr Phe Leu Leu Ile Gly Ala Val Ile Ile Leu Val Ile Leu

 Leu Val Arg Arg Thr Asn Asn Met Ser Gln Ala Pro Ile Arg Met Ile

 Tyr Pro Asp Val Glu Lys Ser Lys Ser Thr Val Thr Pro Met Glu Pro

 Glu Thr Ile Lys Gln Ile Leu Leu Gly Met His Asn Met Gln Gln Glu

 Ala Tyr Lys Lys Lys Glu Glu Gln Arg Ala Ala Arg Pro Ser Ile Phe

 Arg Gln Ala Ala Glu Thr Phe Leu Arg Lys Arg Ser Gly Tyr Lys Gln

 Ile Ser Thr Glu Asp Lys Ile Val SEQ ID NO:15:

 Met Tyr Tyr Lys Thr Ile Leu Phe Phe Ala Leu Ile Lys Val Cys Ser

 Phe Asn Gln Tnr Thr Thr His Ser Thr Thr Thr Ser Pro Ser Ile Ser

 Ser Thr Thr Ser Ser Thr Thr Thr Ser Thr Ser Lys Pro Ser Asn Thr

 Thr Ser Thr Asn Ser Ser Leu Ala Ala Ser Pro Gln Asn Thr Ser Thr

 Ser Lys Pro Ser Thr Asp Asn Gln Gly Thr Ser Thr Pro Thr Ile Pro

 Thr Val Thr Asp Asp Thr Ala Ser Lys Asn Phe Tyr Lys Tyr Arg Val

 Cys Ser Ala Ser Ser Ser Ser Gly Glu Leu Phe Arg Phe Asp Leu Asp

 Gln Thr Cys Pro Asp Thr Lys Asp Lys Lys His Val Glu Gly Ile Leu

 Leu Val Leu Lys Lys Asn Ile Val Pro Tyr Ile Phe Lys Val Arg Lys

 Tyr Arg Lys Ile Ala Thr Ser Val Thr Val Tyr Arg Gly Trp Ser Gln

 Ala Ala Val Thr Asn Arg Asp Asp Ile Ser Arg Ala Ile Pro Tyr Asn

 Glu Ile Ser Met Ile Asp Arg Thr Tyr His Cys Phe Ser Ala Met Ala

 Thr Val Ile Asn Gly Ile Leu Asn Thr Tyr Ile Asp Arg Asp Ser Glu

 Asn Lys Ser Val Pro Leu Gln Pro Val Ala Gly Leu Thr Glu Asn Ile

 Asn Arg Tyr Phe Ser Gln Pro Leu Ile Tyr Ala Glu Pro Gly Trp Phe

 Pro Gly Ile Tyr Arg Val Arg Thr Thr Val Asn Cys Glu Val Val Asp

 Met Tyr Ala Arg Ser Val Glu Pro Tyr Thr His Phe Ile Thr Ala Leu

 Gly Asp Thr Ile Glu Ile Ser Pro Phe Cys His Asn Asn Ser Gln Cys

 Thr Thr Gly Asn Ser Thr Ser Arg Asp Ala Thr Lys Val Trp Ile Glu

 Glu Asn His Gln Thr Val Asp Tyr Glu Arg Arg Gly His Pro Thr Lys

 Asp Lys Arg Ile Phe Leu Lys Asp Glu Glu Tyr Thr Ile Ser Trp Lys

 Ala Glu Asp Arg Glu Arg Ala Ile Cys Asp Phe Val Ile Trp Lys Thr

 Phe Pro Arg Ala Ile Gln Thr Ile His Asn Glu Ser Phe His Phe Val

 Ala Asn Glu Val Thr Ala Ser Phe Leu Thr Ser Asn Gln Glu Glu Thr

 Glu Leu Arg Gly Asn Thr Glu Ile Leu Asn Cys Met Asn Ser Thr Ile

 Asn Glu Thr Leu Glu Glu Thr Val Lys Lys Phe Asn Lys Ser His Ile

 Arg Asp Gly Glu Val Lys Tyr Tyr Lys Thr Asn Gly Gly Leu Phe Leu

 Ile Trp Gln Ala Met Lys Pro Leu Asn Leu Ser Glu His Thr Asn Tyr

 Thr Ile Glu Arg Asn Asn Lys Thr Gly Asn Lys Ser Arg Gln Lys Arg

 Ser Val Asp Thr Lys Thr Phe Gln Gly Ala Lys Gly Leu Ser Thr Ala

 Gln Val Gln Tyr Ala Tyr Asp His Leu Arg Thr Ser Met Asn His Ile

 Leu Glu Glu Leu Thr Lys Thr Trp Cys Arg Glu Gln Lys Lys Asp Asn

 Leu Met Trp Tyr Glu Leu Ser Lys Ile Asn Pro Val Ser Val Met Ala

 Ala Ile Tyr Gly Lys Pro Val Ala Val Lys Ala Met Gly Asp Ala Phe

 Met Val Ser Glu Cys Ile Asn Val Asp Gln Ala Ser Val Asn Ile His

 Lys Ser Met Arg Thr Asp Asp Pro Lys Val Cys Tyr Ser Arg Pro Leu

 Val Thr Phe Lys Phe Val Asn Ser Thr Ala Thr Phe Arg Gly Gln Leu

 Gly Thr Arg Asn Glu Ile Leu Leu Thr Asn Thr His Val Glu Thr Cys

 Arg Pro Thr Ala Asp His Tyr Phe Phe Val Lys Asn Met Thr His Tyr

 Phe Lys Asp Tyr Lys Phe Val Lys Thr Met Asp Thr Asn Asn Ile Ser

 Thr Leu Asp Thr Phe Leu Thr Leu Asn Leu Thr Phe Ile Asp Asn Ile

 Asp Phe Lys Thr Val Glu Leu Tyr Ser Glu Thr Glu Arg Lys Met Ala

 Ser Ala Leu Asp Leu Glu Thr Met Phe Arg Glu Tyr Asn Tyr Tyr Thr

 Gln Lys Leu Ala Ser Leu Arg Glu Asp Leu Asp Asn Thr Ile Asp Leu

 Asn Arg Asp Arg Leu Val Lys Asp Leu Ser Glu Met Met Ala Asp Leu

 Gly Asp Ile Gly Lys Val Val Val Asn Thr Phe Ser Gly Ile Val Thr

 Val Phe Gly Ser Ile Val Gly Gly Phe Val Ser Phe Phe Thr Asn Pro

 Ile Gly Gly Val Thr Ile Ile Leu Leu Leu Ile Val Val Val Phe Val

 Val Phe Ile Val Ser Arg Arg Thr Asn Asn Met Asn Glu Ala Pro Ile

 Lys Met Ile Tyr Pro Asn Ile Asp Lys Ala Ser Glu Gln Glu Asn Ile

 Gln Pro Leu Pro Gly Glu Glu Ile Lys Arg Ile Leu Leu Gly Met His

 Gln Leu Gln Gln Ser Glu His Gly Lys Ser Glu Glu Glu Ala Ser His

 Lys Pro Gly Leu Phe Gln Leu Leu Gly Asp Gly Leu Gln Leu Leu Arg

 Arg Arg Gly Tyr Thr Arg Leu Pro Thr Phe Asp Pro Ser Pro Gly Asn

 Asp Thr Ser Glu Thr His Gln Lys Tyr Val SEQ ID NO:16:

 Met Gly Val Gly Gly Gly Pro Arg Val Val Leu Cys Leu Trp Cys Val

 Ala Ala Leu Leu Cys Gln Gly Val Ala Gln Glu Val Val Ala Glu Thr

 Thr Thr Pro Phe Ala Thr His Arg Pro Glu Val Val Ala Glu Glu Asn

 Pro Ala Asn Pro Phe Leu Pro Phe Arg Val Cys Gly Ala Ser Pro Thr

 Gly Gly Glu Ile Phe Arg Phe Pro Leu Glu Glu Ser Cys Pro Asn Thr

 Glu Asp Lys Asp His Ile Glu Gly Ile Ala Leu Ile Tyr Lys Thr Asn

 Ile Val Pro Tyr Val Phe Asn Val Arg Lys Tyr Arg Lys Ile Met Thr

 Ser Thr Thr Ile Tyr Lys Gly Trp Ser Glu Asp Ala Ile Thr Asn Gln

 His Thr Arg Ser Tyr Ala Val Pro Leu Tyr Glu Val Gln Met Met Asp

 His Tyr Tyr Gln Cys Phe Ser Ala Val Gln Val Asn Glu Gly Gly His

 Val Asn Thr Tyr Tyr Asp Arg Asp Gly Trp Asn Glu lhr Ala Phe Leu

 Lys Pro Ala Asp Gly Leu Thr Ser Ser Ile Thr Arg Tyr Gln Ser Gln

 Pro Glu Val Tyr Ala Thr Pro Arg Asn Leu Leu Trp Ser Tyr Thr Thr

 Arg Thr Thr Val Asn Cys Glu Val Thr Glu Met Ser Ala Arg Ser Met

 Lys Pro Phe Glu Phe Phe Val Thr Ser Val Gly Asp Thr Ile Glu Met

 Ser Pro Phe Leu Lys Glu Asn Gly Thr Glu Pro Glu Lys Ile Leu Lys

 Arg Pro His Ser Ile Gln Leu Leu Lys Asn Tyr Ala Val Thr Lys Tyr

 Gly Val Gly Leu Gly Gln Ala Asp Asn Ala Thr Arg Phe Phe Ala Ile

 Phe Gly Asp Tyr Ser Leu Ser Trp Lys Ala Thr Thr Glu Asn Ser Ser

 Tyr Cys Asp Leu Ile Leu Trp Lys Gly Phe Ser Asn Ala Ile Gln Thr

 Gln His Asn Ser Ser Leu His Phe Ile Ala Asn Asp Ile Thr Ala Ser

 Phe Ser Thr Pro Leu Glu Glu Glu Ala Asn Phe Asn Glu Thr Phe Lys

 Cys Ile Trp Asn Asn Thr Gln Glu Glu Ile Gln Lys Lys Leu Lys Glu

 Val Glu Lys Thr His Arg Pro Asn Gly Thr Ala Lys Val Tyr Lys Thr

 Thr Gly Asn Leu Tyr Ile Val Trp Gln Pro Leu Ile Gln Ile Asp Leu

 Leu Asp Thr His Ala Lys Leu Tyr Asn Leu Thr Asn Ala Thr Ala Ser

 Pro Thr Ser Thr Pro Thr Thr Ser Pro Arg Arg Arg Arg Arg Asp Thr

 Ser Ser Val Ser Gly Gly Gly Asn Asn Gly Asp Asn Ser Thr Lys Glu

 Glu Ser Val Ala Ala Ser Gln Val Gln Phe Ala Tyr Asp Asn Leu Arg

 Lys Ser Ile Asn Arg Val Leu Gly Glu Leu Ser Arg Ala Trp Cys Arg

 Glu Gln Tyr Arg Ala Ser Leu Met Trp Tyr Glu Leu Ser Lys Ile Asn

 Pro Thr Ser Val Met Ser Ala Ile Tyr Gly Arg Pro Val Ser Ala Lys

 Leu Ile Gly Asp Val Val Ser Val Ser Asp Cys Ile Ser Val Asp Gln

 Lys Ser Val Phe Val His Lys Asn Met Lys Val Pro Gly Lys Glu Asp

 Leu Cys Tyr Thr Arg Pro Val Val Gly Phe Lys Phe Ile Asn Gly Ser

 Glu Leu Phe Ala Gly Gln Leu Gly Pro Arg Asn Glu Ile Val Leu Ser

 Thr Ser Gln Val Glu Val Cys Gln His Ser Cys Glu His Tyr Phe Gln

 Ala Gly Asn Gln Met Tyr Lys Tyr Lys Asp Tyr Tyr Tyr Val Ser Thr

 Leu Asn Leu Thr Asp Ile Pro Thr Leu His lhr Met Ile Thr Leu Asn

 Leu Ser Leu Val Glu Asn Ile Asp Phe Lys Val Ile Glu Leu Tyr Ser

 Lys Thr Glu Lys Arg Leu Ser Asn Val Phe Asp Ile Glu Thr Met Phe

 Arg Glu Tyr Asn Tyr Tyr Thr Gln Asn Leu Asn Gly Leu Arg Lys Asp

 Leu Asp Asp Ser Ile Asp His Gly Arg Asp Ser Phe Ile Gln Thr Leu

 Gly Asp Ile Met Gln Asp Leu Gly Thr Ile Gly Lys Val Val Val Asn

 Val Ala Ser Gly Val Phe Ser Leu Phe Gly Ser Ile Val Ser Gly Val

 Ile Ser Phe Phe Lys Asn Pro Phe Gly Gly Met Leu Leu Ile Val Leu

 Ile Ile Ala Gly Val Val Val Val Tyr Leu Phe Met Thr Arg Ser Arg

 Ser Ile Tyr Ser Ala Pro Ile Arg Met Leu Tyr Pro Gly Val Glu Arg

 Ala Ala Gln Glu Pro Gly Ala His Pro Val Ser Glu Asp Gln Ile Arg

 Asn Ile Leu Met Gly Met His Gln Phe Gln Gln Arg Gln Arg Ala Glu

 Glu Glu Ala Arg Arg Glu Glu Glu Val Lys Gly Lys Arg Thr Leu Phe

 Glu Val Ile Arg Asp Ser Ala Thr Ser Val Leu Arg Arg Arg Arg Gly

 Gly Gly Gly Tyr Gln Arg Leu Gln Arg Asp Gly Ser Asp Asp Glu Gly

 Asp Tyr Glu Pro Leu Arg Arg Gln Asp Gly Gly Tyr Asp Asp Val Asp

 Val Glu Ala Gly Thr Ala Asp Thr Gly Val SEQ ID NO:17:

 Met Tyr Pro Thr Val Lys Ser Met Arg Val Ala His Leu Thr Asn Leu

 Leu Thr Leu Leu Cys Leu Leu Cys His Thr His Leu Tyr Val Cys Gln

 Pro Thr Thr Leu Arg Gln Pro Ser Asp Met Thr Pro Ala Gln Asp Ala

 Pro Thr Glu Thr Pro Pro Pro Leu Ser Thr Asn Thr Asn Arg Gly Phe

 Glu Tyr Phe Arg Val Cys Gly Val Ala Ala Thr Gly Glu Thr Phe Arg

 Phe Asp Leu Asp Lys Thr Cys Pro Ser Thr Gln Asp Lys Lys His Val

 Glu Gly Ile Leu Leu Val Tyr Lys Ile Asn Ile Val Pro Tyr Ile Phe

 Lys Ile Arg Arg Tyr Arg Lys Ile Ile Thr Gln Leu lhr Ile Trp Arg

 Gly Leu Thr Thr Ser Ser Val Thr Gly Lys Phe Glu Met Ala Thr Gln

 Ala His Glu Trp Glu Val Gly Asp Phe Asp Ser Ile Tyr Gln Cys Tyr

 Asn Ser Ala Thr Met Val Val Asn Asn Val Arg Gln Val Tyr Val Asp

 Arg Asp Gly Val Asn Lys Thr Val Asn Ile Arg Pro Val Asp Gly Leu

 Thr Gly Asn Ile Gln Arg Tyr Phe Ser Gln Pro Thr Leu Tyr Ser Glu

 Pro Gly Trp Met Pro Gly Phe Tyr Arg Val Arg Thr Thr Val Asn Cys

 Glu Ile Val Asp Met Val Ala Arg Ser Met Asp Pro Tyr Asn Tyr Ile

 Ala Thr Ala Leu Gly Asp Ser Leu Glu Leu Ser Pro Phe Gln Thr Phe

 Asp Asn Thr Ser Gln Cys Thr Ala Pro Lys Arg Ala Asp Met Arg Val

 Arg Glu Val Lys Asn Tyr Lys Phe Val Asp Tyr Asn Asn Arg Gly Thr

 Ala Pro Ala Gly Gln Ser Arg Thr Phe Leu Glu Thr Pro Ser Ala lhr

 Tyr Ser Trp Lys Thr Ala Thr Arg Gln Thr Ala Thr Cys Asp Leu Val

 His Trp Lys Thr Phe Pro Arg Ala Ile Gln Thr Ala His Glu His Ser

 Tyr His Phe Val Ala Asn Glu Val Thr Ala Thr Phe Asn Thr Pro Leu

 Thr Glu Val Glu Asn Phe Thr Ser Thr Tyr Ser Cys Val Ser Asp Gln

 Ile Asn Lys Thr Ile Ser Glu Tyr Ile Gln Lys Leu Asn Asn Ser Tyr

 Val Ala Ser Gly Lys Thr Gln Tyr Phe Lys Thr Asp Gly Asn Leu Tyr

 Leu Ile Trp Gln Pro Leu Glu His Pro Glu Ile Glu Asp Ile Asp Glu

 Asp Ser Asp Pro Glu Pro Thr Pro Ala Pro Pro Lys Ser Thr Arg Arg

 Lys Arg Glu Ala Ala Asp Asn Gly Asn Ser Thr Ser Glu Val Ser Lys

 Gly Ser Glu Asn Pro Leu Ile Thr Ala Gln Ile Gln Phe Ala Tyr Asp

 Lys Leu Thr lhr Ser Val Asn Asn Val Leu Glu Glu Leu Ser Arg Ala

 Trp Cys Arg Glu Gln Val Arg Asp Thr Leu Met Trp Tyr Glu Leu Ser

 Lys Val Asn Pro Thr Ser Val Met Ser Ala Ile Tyr Gly Lys Pro Val

 Ala Ala Arg Tyr Val Gly Asp Ala Ile Ser Val Thr Asp Cys Ile Tyr

 Val Asp Gln Ser Ser Val Asn Ile His Gln Ser Leu Arg Leu Gln His

 Asp Lys Thr Thr Cys Tyr Ser Arg Pro Arg Val Thr Phe Lys Phe Ile

 Asn Ser Thr Asp Pro Leu Thr Gly Gln Leu Gly Pro Arg Lys Glu Ile

 Ile Leu Ser Asn Thr Asn Ile Glu Thr Cys Lys Asp Glu Ser Glu His

 Tyr Phe Ile Val Gly Glu Tyr Ile Tyr Tyr Tyr Lys ASn Tyr Ile Phe

 Glu Glu Lys Leu Asn Leu Ser Ser Ile Ala Thr Leu Asp Thr Phe Ile

 Ala Leu Asn Ile Ser Phe Ile Glu Asn Ile Asp Phe Lys Thr Val Glu

 Leu Tyr Ser Ser Thr Glu Arg Lys Leu Ala Ser Ser Val Phe Asp Ile

 Glu Ser Met Phe Arg Glu Tyr Asn Tyr Tyr Thr Tyr Ser Leu Ala Gly

 Ile Lys Lys Asp Leu Asp Asn Thr Ile Asp Tyr Asn Arg Asp Arg Leu

 Val Gln Asp Leu Ser Asp Met Met Ala Asp Leu Gly Asp Ile Gly Arg

 Ser Val Val Ash Val Val Ser Ser Val Val Thr Phe Phe Ser Ser Ile

 Val Thr Gly Phe Ile Lys Phe Phe Thr Asn Pro Leu Gly Gly Ile Phe

 Ile Leu Leu Ile Ile Gly Gly Ile Ile Phe Leu Val Val Val Leu Asn

 Arg Arg Asn Ser Gln Phe His Asp Ala Pro Ile Lys Met Leu Tyr Pro

 Ser Val Glu Asn Tyr Ala Ala Arg Gln Ala Pro Pro Pro Tyr Ser Ala

 Ser Pro Pro Ala Ile Asp Lys Glu Glu Ile Lys Arg Ile Leu Leu Gly

 Met His Gln Val His Gln Glu Glu Lys Glu Ala Gln Lys Gln Leu Thr

 Asn Ser Gly Pro Thr Leu Trp Gln Lys Ala Thr Gly Phe Leu Arg Asn

 Arg Arg Lys Gly Tyr Ser Gln Leu Pro Leu Glu Asp Glu Ser Thr Ser

 Leu SEQ ID NO:18:

 Met Thr Arg Arg Arg Val Leu Ser Val Val Val Leu Leu Ala Ala Leu

 Ala Cys Arg Leu Gly Ala Gln Thr Pro Glu Gln Pro Ala Pro Pro Ala

 Thr Thr Val Gln Pro Thr Ala Thr Arg Gln Gln Thr Ser Phe Pro Phe

 Arg Vat Cys Glu Leu Ser Ser His Gly Asp Leu Phe Arg Phe Ser Ser

 Asp Ile Gln Cys Pro Ser Phe Gly Thr Arg Glu Asn His Thr Glu Gly

 Leu Leu Met Val Phe Lys Asp Asn Ile Ile Pro Tyr Ser Phe Lys Val

 Arg Ser Tyr Thr Lys Ile Val Thr Asn Ile Leu Ile Tyr Asn Gly Trp

 Tyr Ala Asp Ser Val Thr Asn Arg His Glu Glu Lys Phe Ser Val Asp

 Ser Tyr Glu Thr Asp Gln Met Asp Thr Ile Tyr Gln Cys Tyr Asn Ala

 Val Lys Met Thr Lys Asp Gly Leu Thr Arg Val Tyr Val Asp Arg Asp

 Gly Val Asn Ile Thr Val Asn Leu Lys Pro Thr Gly Gly Leu Ala Asn

 Gly Val Arg Arg Tyr Ala Ser Gln Thr Glu Leu Tyr Asp Ala Pro Gly

 Trp Leu Ile Trp Thr Tyr Arg Thr Arg Thr Thr Val Asn Cys Leu Ile

 Thr Asp Met Met Ala Lys Ser Asn Ser Pro Phe Asp Phe Phe Val Thr

 Thr Thr Gly Gln Thr Val Glu Met Ser Pro Phe Tyr Asp Gly Lys Asn

 Lys Glu Thr Phe His Glu Arg Ala Asp Ser Phe His Val Arg lhr Asn

 Tyr Lys Ile Val Asp Tyr Asp Asn Arg Gly lhr Asn Pro Gln Gly Glu

 Arg Arg Ala Phe Leu Asp Lys Gly lhr Tyr Thr Leu Ser Trp Lys Leu

 Glu Asn Arg lhr Ala Tyr Cys Pro Leu Gln His Trp Gln Thr Phe Asp

 Ser Thr Ile Ala Thr Glu Thr Gly Lys Ser Ile His Phe Val Thr Asp

 Glu Gly Thr Ser Ser Phe Val Thr Asn Thr Thr Val Gly Ile Glu Leu

 Pro Asp Ala Phe Lys Cys Ile Glu Glu Gln Val Asn Lys Thr Met His

 Glu Lys Tyr Glu Ala Val Gln Asp Arg Tyr Thr Lys Gly Gln Glu Ala

 Ile Thr Tyr Phe Ile Thr Ser Gly Gly Leu Leu Leu Ala Trp Leu Pro

 Leu Thr Pro Arg Ser Leu Ala Thr Val Lys Asn Leu Thr Glu Leu Thr

 Thr Pro Thr Ser Ser Pro Pro Ser Ser Pro Ser Pro Pro Ala Pro Ser

 Ala Ala Arg Gly Ser Thr Pro Ala Ala Val Leu Arg Arg Arg Arg Arg

 Asp Ala Gly Asn Ala Thr Thr Pro Val Pro Pro Thr Ala Pro Gly Lys

 Ser Leu Gly Thr Leu Asn Asn Pro Ala Thr Val Gln Ile Gln Phe Ala

 Tyr Asp Ser Leu Arg Arg Gln Ile Asn Arg Met Leu Gly Asp Leu Ala

 Arg Ala Trp Cys Leu Glu Gln Lys Arg Gln Asn Met Val Leu Arg Glu

 Leu Thr Lys Ile Asn Pro Thr Thr Val Met Ser Ser Ile Tyr Gly Lys

 Ala Val Ala Ala Lys Arg Leu Gly Asp Val Ile Ser Val Ser Gln Cys

 Val Pro Val Asn Gln Ala Thr Val Thr Leu Arg Lys Ser Met Arg Val

 Pro Gly Ser Glu Thr Met Cys Tyr Ser Arg Pro Leu Val Ser Phe Ser

 Phe Ile Asn Asp Thr Lys Thr Tyr Glu Gly Gln Leu Gly Thr Asp Asn

 Glu Ile Phe Leu lhr Lys Lys Met Thr Glu Val Cys Gln Ala Thr Ser

 Gln Tyr Tyr Phe Gln Ser Gly Asn Glu Ile His Val Tyr Asn Asp Tyr

 His His Phe Lys Thr Ile Glu Leu Asp Gly Ile Ala Thr Leu Gln Thr

 Phe Ile Ser Leu Asn Thr Ser Leu Ile Glu Asn Ile Asp Phe Ala Ser

 Leu Glu Leu Tyr Ser Arg Asp Glu Gln Arg Ala Ser Asn Val Phe Asp

 Leu Glu Gly Ile Phe Arg Glu Tyr Asn Phe Gln Ala Gln Asn Ile Ala

 Gly Leu Arg Lys Asp Leu Asp Asn Ala Val Ser Asn Gly Arg Asn Gln

 Phe Val Asp Gly Leu Gly Glu Leu Met Asp Ser Leu Gly Ser Val Gly

 Gln Ser Ile Thr Asn Leu Val Ser Thr Val Gly Gly Leu Phe Ser Ser

 Leu Val Ser Gly Phe Ile Ser Phe Phe Lys Asn Pro Phe Gly Gly Met

 Leu Ile Leu Val Leu Val Ala Gly Val Val Ile Leu Val Ile Ser Leu

 Thr Arg Arg lhr Arg Gln Met Ser Gln Gln Pro Val Gln Met Leu Tyr

 Pro Gly Ile Asp Glu Leu Ala Gln Gln His Ala Ser Gly Glu Gly Pro

 Gly Ile Asn Pro Ile Ser Lys Thr Glu Leu Gln Ala Ile Met Leu Ala

 Leu His Glu Gln Asn Gln Glu Gln Lys Arg Ala Ala Gln Arg Ala Ala

 Gly Pro Ser Val Ala Ser Arg Ala Leu Gln Ala Ala Arg Asp Arg Phe

 Pro Gly Leu Arg Arg Arg Arg Tyr His Asp Pro Glu Thr Ala Ala Ala

 Leu Leu Gly Glu Ala Glu Thr Glu Phe SEQ ID NO:19:

 Met Glu Ser Arg Ile Trp Cys Leu Val Val Cys Val Asn Leu Cys Ile

 Val Cys Leu Gly Ala Ala Val Ser Ser Ser Ser Thr Arg Gly Thr Ser

 Ala Thr His Ser His His Ser Ser His Thr Thr Ser Ala Ala His Ser

 Arg Ser Gly Ser Val Ser Gln Arg Val Thr Ser Ser Gln Thr Val Ser

 His Gly Val Asn Glu Thr Ile Tyr Asn lhr Thr Leu Lys Tyr Gly Asp

 Val Val Gly Val Asn Thr Thr Lys Tyr Pro Tyr Arg Val Cys Ser Met

 Ala Gln Gly Thr Asp Leu Ile Arg Phe Glu Arg Asn Ile Val Cys Thr

 Ser Met Lys Pro Ile Asn Glu Asp Leu Asp Glu Gly Ile Met Val Val

 Tyr Lys Arg Asn Ile Val Ala His Thr Phe Lys Val Arg Val Tyr Gln

 Lys Val Leu Thr Phe Arg Arg Ser Tyr Ala Tyr Ile His Thr Thr Tyr

 Leu Leu Gly Ser Asn Thr Glu Tyr Val Ala Pro Pro Met Trp Glu Ile

 His His Ile Asn Ser His Ser Gln Cys Tyr Ser Ser Tyr Ser Arg Val

 Ile Ala Gly Thr Val Phe Val Ala Tyr His Arg Asp Ser Tyr Glu Asn

 Lys Thr Met Gln Leu Met Pro Asp Asp Tyr Ser Asn Thr His Ser Thr

 Arg Tyr Val Thr Val Lys Asp Gln Trp His Ser Arg Gly Ser Thr Trp

 Leu Tyr Arg Glu Thr Cys Asn Leu Asn Cys Met Val Thr Ile Thr Thr

 Ala Arg Ser Lys Tyr Pro Tyr His Phe Phe Ala Thr Ser Thr Gly Asp

 Val Val Asp Ile Ser Pro Phe Tyr Asn Gly Thr Asn Arg Asn Ala Ser

 Tyr Phe Gly Glu Asn Ala Asp Lys Phe Phe Ile Phe Pro Asn Tyr Thr

 Ile Val Ser Asp Phe Gly Arg Pro Asn Ser Ala Leu Glu Thr His Arg

 Leu Val Ala Phe Leu Glu Arg Ala Asp Ser Val Ile Ser Trp Asp Ile

 Gln Asp Glu Lys Asn Val Thr Cys Gln Leu Thr Phe Trp Glu Ala Ser

 Glu Arg Thr Ile Arg Ser Glu Ala Glu Asp Ser Tyr His Phe Ser Ser

 Ala Lys Met Thr Ala Thr Phe Leu Ser Lys Lys Gln Glu Val Asn Met

 Ser Asp Ser Ala Leu Asp Cys Val Arg Asp Glu Ala Ile Asn Lys Leu

 Gln Gln Ile Phe Asn Thr Ser Tyr Asn Gln Thr Tyr Glu Lys Tyr Gly

 Asn Val Ser Val Phe Glu Thr Thr Gly Gly Leu Val Val Phe Trp Gln

 Gly Ile Lys Gln Lys Ser Leu Val Glu Leu Glu Arg Leu Ala Asn Arg

 Ser Ser Leu Asn Leu Thr His Asn Arg Thr Lys Arg Ser Thr Asp Gly

 Asn Asn Ala lhr His Leu Ser Asn Met Glu Ser Val His Asn Leu Val

 Tyr Ala Gln Leu Gln Phe Thr Tyr Asp Thr Leu Arg Gly Tyr Ile Asn

 Arg Ala Leu Ala Gln Ile Ala Glu Ala Trp Cys Val Asp Gln Arg Arg

 Thr Leu Glu Val Phe Lys Glu Leu Ser Lys Ile Asn Pro Ser Ala Ile

 Leu Ser Ala Ile Tyr Asn Lys Pro Ile Ala Ala Arg Phe Met Gly Asp

 Val Leu Gly Leu Ala Ser Cys Val Thr Ile Asn Gln Thr Ser Val Lys

 Val Leu Arg Asp Met Asn Val Lys Glu Ser Pro Gly Arg Cys Tyr Ser

 Arg Pro Val Val Ile Phe Asn Phe Ala Asn Ser Ser Tyr Val Gln Tyr

 Gly Gln Leu Gly Glu Asp Asn Glu Ile Leu Leu Gly Asn His Arg Thr

 Glu Glu Cys Gln Leu Pro Ser Leu Lys Ile Phe Ile Ala Gly Asn Ser

 Ala Tyr Glu Tyr Val Asp Tyr Leu Phe Lys Arg Met Ile Asp Leu Ser

 Ser Ile Ser Thr Val Asp Ser Met Ile Ala Leu Asp Ile Asp Pro Leu

 Glu Asn Thr Asp Phe Arg Val Leu Glu Leu Tyr Ser Gln Lys Glu Leu

 Arg Ser Ser Asn Val Phe Asp Leu Glu Glu Ile Met Arg Glu Phe Asn

 Ser Tyr Lys Gln Arg Val Lys Tyr Val Glu Asp Lys Val Val Asp Pro

 Leu Pro Pro Tyr Leu Lys Gly Leu Asp Asp Leu Met Ser Gly Leu Gly

 Ala Ala Gly Lys Ala Val Gly Val Ala Ile Gly Ala Val Gly Gly Ala

 Val Ala Ser Val Val Glu Gly Val Ala Thr Phe Leu Lys Asn Pro Phe

 Gly Ala Phe Thr Ile Ile Leu Val Ala Ile Ala Val Val Ile Ile Ile

 Tyr Leu Ile Tyr Thr Arg Gln Arg Arg Leu Cys Met Gln Pro Leu Gln

 Asn Leu Phe Pro Tyr Leu Val Ser Ala Asp Gly Thr Thr Val Thr Ser

 Gly Asn Thr Lys Asp Thr Ser Leu Gln Ala Pro Pro Ser Tyr Glu Glu

 Ser Val Tyr Asn Ser Gly Arg Lys Gly Pro Gly Pro Pro Ser Ser Asp

 Ala Ser Thr Ala Ala Pro Pro Tyr Thr Asn Glu Gln Ala Tyr Gln Met

 Leu Leu Ala Leu Val Arg Leu Asp Ala Glu Gln Arg Ala Gln Gln Asn

 Gly Thr Asp Ser Leu Asp Gly Gln Thr Gly Thr Gln Asp Lys Gly Gln

 Lys Pro Asn Leu Leu Asp Arg Leu Arg His Arg Lys Asn Gly Tyr Arg

 His Leu Lys Asp Ser Asp Glu Glu Glu Asn Val SEQ ID NO:20:

 Met Ser Lys Met Val Val Leu Phe Leu Ala Val Phe Leu Met Asn Ser

 Val Leu Met Ile Tyr Cys Asp Pro Asp His Tyr Ile Arg Ala Gly Tyr

 Asn His Lys Tyr Pro Phe Arg Ile Cys Ser Ile Ala Lys Gly Thr Asp

 Leu Met Arg Phe Asp Arg Asp Ile Ser Cys Ser Pro Tyr Lys Ser Asn

 Ala Lys Met Ser Glu Gly Phe Phe Ile Ile Tyr Lys Thr Asn Ile Glu

 Thr Tyr Thr Phe Pro Val Arg Thr Tyr Lys Lys Glu Leu Thr Phe Gln

 Ser Ser Tyr Arg Asp Val Gly Val Val Tyr Phe Leu Asp Arg Thr Val

 Met Gly Leu Ala Met Pro Val Tyr Glu Ala Asn Leu Val Asn Ser His

 Ala Gln Cys Tyr Ser Ala Val Ala Met Lys Arg Pro Asp Gly Thr Val

 Phe Ser Ala Phe His Glu Asp Asn Asn Lys Asn Asn Thr Leu Asn Leu

 Phe Pro Leu Asn Phe Lys Ser Ile Thr Asn Lys Arg Phe Ile Thr Thr

 Lys Glu Pro Tyr Phe Ala Arg Gly Pro Leu Trp Leu Tyr Ser Thr Ser

 Thr Ser Leu Asn Cys Ile Val lhr Glu Ala Thr Ala Lys Ala Lys Tyr

 Pro Phe Ser Tyr Phe Ala Leu Thr Thr Gly Glu Ile Val Glu Gly Ser

 Pro Phe Phe Asn Gly Ser Asn Gly Lys His Phe Ala Glu Pro Leu Glu

 Lys Leu Thr Ile Leu Glu Asn Tyr Thr Met Ile Glu Asp Leu Met Asn

 Gly Met Asn Gly Ala lhr lhr Leu Val Arg Lys Ile Ala Phe Leu Glu

 Lys Ala Asp Thr Leu Phe Ser Trp Glu Ile Lys Glu Glu Asn Glu Ser

 Val Cys Met Leu Lys His Trp lhr Thr Val Thr His Gly Leu Arg Ala

 Glu Thr Asp Glu Thr Tyr His Phe Ile Ser Lys Glu Leu Thr Ala Ala

 Phe Val Ala Pro Lys Glu Ser Leu Asn Leu Thr Asp Pro Lys Gln Thr

 Cys Ile Lys Asp Glu Phe Glu Lys Ile Ile Asn Glu Val Tyr Met Ser

 Asp Tyr Asn Asp Thr Tyr Ser Met Asn Gly Ser Tyr Gln Ile Phe Lys

 Thr Thr Gly Asp Leu Ile Leu Ile Trp Gln Pro Leu Val Gln Lys Ser

 Leu Met Phe Leu Glu Gln Gly Ser Glu Lys Ile Arg Arg Arg Arg Asp

 Val Val Asp Val Lys Ser Arg His Asp Ile Leu Tyr Val Gln Leu Gln

 Tyr Leu Tyr Asp Thr Leu Lys Asp Tyr Ile Asn Asp Ala Leu Gly Asn

 Leu Ala Glu Ser Trp Cys Leu Asp Gln Lys Arg Thr Ile Thr Met Leu

 His Glu Leu Ser Lys Ile Ser Pro Ser Ser Ile Val Ser Glu Val Tyr

 Gly Arg Pro Ile Ser Ala Gln Leu His Gly Asp Val Leu Ala Ile Ser

 Lys Cys Ile Glu Val Asn Gln Ser Ser Val Gln Leu His Lys Ser Met

 Arg Val Val Asp Ala Lys Gly Val Arg Ser Glu Thr Met Cys Tyr Asn

 Arg Pro Leu Val Thr Phe Ser Phe Val Asn Ser Thr Pro Glu Val Val

 Pro Gly Gln Leu Gly Leu Asp Asn Glu Ile Leu Leu Gly Asp His Arg

 Thr Glu Glu Cys Glu Ile Pro Ser Thr Lys Ile Phe Leu Ser Gly Asn

 His Ala His Val Tyr Thr Asp Tyr Thr His Thr Asn Ser Thr Pro Ile

 Glu Asp Ile Glu Val Leu Asp Ala Phe Ile Arg Leu Lys Ile Asp Pro

 Leu Glu Asn Ala Asp Phe Lys Val Leu Asp Leu Tyr Ser Pro Asp Glu

 Leu Ser Arg Ala Asn Val Phe Asp Leu Glu Asn Ile Leu Arg Glu Tyr

 Asn Ser Tyr Lys Ser Ala Leu Tyr Thr Ile Glu Ala Lys Ile Ala lhr

 Asn Thr Pro Ser Tyr Val Asn Gly Ile Asn Ser Phe Leu Gln Gly Leu

 Gly Ala Ile Gly Thr Gly Leu Gly Ser Val Ile Ser Val Thr Ala Gly

 Ala Leu Gly Asp Ile Val Gly Gly Val Val Ser Phe Leu Lys Asn Pro

 Phe Gly Gly Gly Leu Met Leu Ile Leu Ala Ile Val Val Val Val Ile

 Ile Ile Val Val Phe Val Arg Gln Arg His Val Leu Ser Lys Pro Ile

 Asp Met Met Phe Pro Tyr Ala lhr Asn Pro Val Thr Thr Val Ser Ser

 Val Thr Gly Thr Thr Val Val Lys lhr Pro Ser Val Lys Asp Val Asp

 Gly Gly Thr Ser Val Ala Val Ser Glu Lys Glu Glu Gly Met Ala Asp

 Val Ser Gly Gln Val Ser Asp Asp Glu Tyr Ser Gln Glu Ala Ala Leu

 Lys Met Leu Lys Ala Ile Lys Ser Leu Asp Glu Ser Tyr Arg Arg Lys

 Pro Ser Ser Ser Glu Ser His Ala Ser Lys Pro Ser Leu Ile Asp Arg

 Ile Arg Tyr Arg Gly Tyr Lys Ser Val Asn Val Glu Glu Ala SEQ ID NO:21:

 Met Phe Val Thr Ala Val Val Ser Val Ser Pro Ser Ser Phe Tyr Glu

 Ser Leu Gln Val Glu Pro Thr Gln Ser Glu Asp Ile Thr Arg Ser Ala

 His Leu Gly Asp Gly Asp Glu Ile Arg Glu Ala Ile His Lys Ser Gln

 Asp Ala Glu lhr Lys Pro Thr Phe Tyr Val Cys Pro Pro Pro Thr Gly

 Ser Thr Ile Val Arg Leu Glu Pro Thr Arg Thr Cys Pro Asp Tyr His

 Leu Gly Lys Asn Phe Thr Glu Gly Ile Ala Val Val Tyr Lys Glu Asn

 Ile Ala Ala Tyr Lys Phe Lys Ala Thr Val Tyr Tyr Lys Asp Val Ile

 Val Ser Thr Ala Trp Ala Gly Ser Ser Tyr Thr Gln Ile Thr Asn Arg

 Tyr Ala Asp Arg Val Pro Ile Pro Val Ser Glu Ile Thr Asp Thr Ile

 Asp Lys Phe Gly Lys Cys Ser Ser Lys Ala Thr Tyr Val Arg Asn Asn

 His Lys Val Glu Ala Phe Asn Glu Asp Lys Asn Pro Gln Asp Met Pro

 Leu Ile Ala Ser Lys Tyr Asn Ser Val Gly Ser Lys Ala Trp His Thr

 Thr Asn Asp Thr Tyr Met Val Ala Gly Thr Pro Gly Thr Tyr Arg Thr

 Gly Thr Ser Val Asn Cys Ile Ile Glu Glu Val Glu Ala Arg Ser Ile

 Phe Pro Tyr Asp Ser Phe Gly Leu Ser Thr Gly Asp Ile Ile Tyr Met

 Ser Pro Phe Phe Gly Leu Arg Asp Gly Ala Tyr Arg Glu His Ser Asn

 Tyr Ala Met Asp Arg Phe His Gln Phe Glu Gly Tyr Arg Gln Arg Asp

 Leu Asp Thr Arg Ala Leu Leu Glu Pro Ala Ala Arg Asn Phe Leu Val

 Thr Pro His Leu Thr Val Gly Trp Asn Trp Lys Pro Lys Arg Thr Glu

 Val Cys Ser Leu Val Lys Trp Arg Glu Val Glu Asp Val Val Arg Asp

 Glu Tyr Ala His Asn Phe Arg Phe Thr Met Lys Thr Leu Ser lhr Thr

 Phe Ile Ser Glu Thr Asn Glu Phe Asn Leu Asn Gln Ile His Leu Ser

 Gln Cys Val Lys Glu Glu Ala Arg Ala Ile Ile Asn Arg Ile Tyr Thr

 Thr Arg Tyr Asn Ser Ser His Val Arg Thr Gly Asp Ile Gln Thr Tyr

 Leu Ala Arg Gly Gly Phe Val Val Val Phe Gln Pro Leu Leu Ser Asn

 Ser Leu Ala Arg Leu Tyr Leu Gln Glu Leu Val Arg Glu Asn Thr Asn

 His Ser Pro Gln Lys His Pro Thr Arg Asn Thr Arg Ser Arg Arg Ser

 Val Pro Val Glu Leu Arg Ala Asn Arg Thr Ile Thr Thr Thr Ser Ser

 Val Glu Phe Ala Met Leu Gln Phe Thr Tyr Asp His Ile Gln Glu His

 Val Asn Glu Net Leu Ala Arg Ile Ser Ser Ser Trp Cys Gln Leu Gln

 Asn Arg Glu Arg Ala Leu Trp Ser Gly Leu Phe Pro Ile Ash Pro Ser

 Ala Leu Ala Ser Thr Ile Leu Asp Gln Arg Val Lys Ala Arg Ile Leu

 Gly Asp Val Ile Ser Val Ser Asn Cys Pro Glu Leu Gly Ser Asp Thr

 Arg Ile Ile Leu Gln Asn Ser Met Arg Val Ser Gly Ser Thr Thr Arg

 Cys Tyr Ser Arg Pro Leu Ile Ser Ile Val Ser Leu Asn Gly Ser Gly

 Thr Val Glu Gly Gln Leu Gly Thr Asp Asn Glu Leu Ile Met Ser Arg

 Asp Leu Leu Glu Pro Cys Val Ala Asn His Lys Arg Tyr Phe Leu Phe

 Gly His His Tyr Val Tyr Tyr Glu Asp Tyr Arg Tyr Val Arg Glu Ile

 Ala Val His Asp Val Gly Met Ile Ser Thr Tyr Val Asp Leu Asn Leu

 Thr Leu Leu Lys Asp Arg Glu Phe Net Pro Leu Gln Val Tyr Thr Arg

 Asp Glu Leu Arg Asp Thr Gly Leu Leu Asp Tyr Ser Glu Ile Gln Arg

 Arg Asn Gln Met His Ser Leu Arg Phe Tyr Asp Ile Asp Lys Val Val

 Gln Tyr Asp Ser Gly Thr Ala Ile Met Gln Gly Met Ala Gln Phe Phe

 Gln Gly Leu Gly Thr Ala Gly Gln Ala Val Gly His Val Val Leu Gly

 Ala Thr Gly Ala Leu Leu Ser Thr Val His Gly Phe Thr Thr Phe Leu

 Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu Val Leu Ala Gly

 Leu Val Ala Ala Phe Phe Ala Tyr Arg Tyr Val Leu Lys Leu Lys Thr

 Ser Pro Met Lys Ala Leu Tyr Pro Leu lhr Thr Lys Gly Leu Lys Gln

 Leu Pro Glu Gly Met Asp Pro Phe Ala Glu Lys Pro Asn Ala Thr Asp

 Thr Pro Ile Glu Glu Ile Gly Asp Ser Gln Asn Thr Glu Pro Ser Val

 Asn Ser Gly Phe Asp Pro Asp Lys Phe Arg Glu Ala Gln Glu Met Ile

 Lys Tyr Met Thr Leu Val Ser Ala Ala Glu Arg Gln Glu Ser Lys Ala

 Arg Lys Lys Asn Lys Thr Ser Ala Leu Leu Thr Ser Arg Leu Thr Gly

 Leu Ala Leu Arg Asn Arg Arg Gly Tyr Ser Arg Val Arg Thr Glu Asn

 Val Thr Gly Val SEQ ID NO:22:

 Met Arg Gln Gly Ala Ala Arg Gly Cys Arg Trp Phe Val Val Trp Ala

 Leu Leu Gly Leu lhr Leu Gly Val Leu Val Ala Ser Ala Ala Pro Ser

 Ser Pro Gly Thr Pro Gly Val Ala Ala Ala Thr Gln Ala Ala Asn Gly

 Gly Pro Ala Thr Pro Ala Pro Pro Ala Pro Gly Pro Ala Pro Thr Gly

 Asp Thr Lys Pro Lys Lys Asn Lys Lys Pro Lys Asn Pro Pro Pro Pro

 Arg Pro Ala Gly Asp Asn Ala Thr Val Ala Ala Gly His Ala Thr Leu

 Arg Glu His Leu Arg Asp Ile Lys Ala Glu Asn Thr Asp Ala Asn Phe

 Tyr Val Cys Pro Pro Pro Thr Gly Ala Thr Val Val Gln Phe Glu Gln

 Pro Arg Arg Cys Pro Thr Arg Pro Glu Gly Gln Asn Tyr Thr Glu Gly

 Ile Ala Val Val Phe Lys Glu Asn Ile Ala Pro Tyr Lys Phe Lys Ala

 Thr Met Tyr Tyr Lys Asp Val Thr Val Ser Gln Val Trp Phe Gly His

 Arg Tyr Ser Gln Phe Met Gly Ile Phe Glu Asp Arg Ala Pro Val Pro

 Phe Glu Glu Val Ile Asp Lys Ile Asn Ala Lys Gly Val Cys Arg Ser

 Thr Ala Lys Tyr Val Arg Asn Asn Leu Glu Thr Thr Ala Phe His Arg

 Asp Asp His Glu Thr Asp Met Glu Leu Lys Pro Ala Asn Ala Ala Thr

 Arg Thr Ser Arg Gly Trp His Thr Thr Asp Leu Lys Tyr Asn Pro Ser

 Arg Val Glu Ala Phe His Arg Tyr Gly Thr Thr Val Asn Cys Ile Val

 Glu Glu Val Asp Ala Arg Ser Val Tyr Pro Tyr Asp Glu Phe Val Leu

 Ala Thr Gly Asp Phe Val Tyr Met Ser Pro Phe Tyr Gly Tyr Arg Glu

 Gly Ser His Thr Glu His Thr Ser Tyr Ala Ala Asp Arg Phe Lys Gln

 Val Asp Gly Phe Tyr Ala Arg Asp Leu Thr Thr Lys Ala Arg Ala Thr

 Ala Pro Thr Thr Arg Asn Leu Leu Thr Thr Pro Lys Phe Thr Val Ala

 Trp Asp Trp Val Pro Lys Arg Pro Ser Val Cys Thr Met Thr Lys Trp

 Gln Glu Val Asp Glu Met Leu Arg Ser Glu Tyr Gly Gly Ser Phe Arg

 Phe Ser Ser Asp Ala Ile Ser Thr Thr Phe Thr Thr Asn Leu Thr Glu

 Tyr Pro Leu Ser Arg Val Asp Leu Gly Asp Cys Ile Gly Lys Asp Ala

 Arg Asp Ala Met Asp Arg Ile Phe Ala Arg Arg Tyr Asn Ala Thr His

 Ile Lys Val Gly Gln Pro Gln Tyr Tyr Leu Ala Asn Gly Gly Phe Leu

 Ile Ala Tyr Gln Pro Leu Leu Ser Asn Thr Leu Ala Glu Leu Tyr Val

 Arg Glu His Leu Arg Glu Gln Ser Arg Lys Pro Pro Asn Pro Thr Pro

 Pro Pro Pro Gly Ala Ser Ala Asn Ala Ser Val Glu Arg Ile Lys Thr

 Thr Ser Ser Ile Glu Phe Ala Arg Leu Gln Phe Thr Tyr Asn His Ile

 Gln Arg His Val Asn Asp Met Leu Gly Arg Val Ala Ile Ala Trp Cys

 Glu Leu Gln Asn His Glu Leu Thr Leu Trp Asn Glu Ala Arg Lys Leu

 Asn Pro Asn Ala Ile Ala Ser Ala Thr Val Gly Arg Arg Val Ser Ala

 Arg Met Leu Gly Asp Val Met Ala Val Ser Thr Cys Val Pro Val Ala

 Ala Asp Asn Val Ile Val Gln Asn Ser Met Arg Ile Ser Ser Arg Pro

 Gly Ala Cys Tyr Ser Arg Pro Leu Val Ser Phe Arg Tyr Glu Asp Gln

 Gly Pro Leu Val Glu Gly Gln Val Gly Glu Asn Asn Glu Leu Arg Leu

 Thr Arg Asp Ala Ile Glu Pro Cys Thr Val Gly His Arg Arg Tyr Phe

 Thr Phe Gly Gly Gly Tyr Val Tyr Phe Glu Glu Tyr Ala Tyr Ser His

 Gln Leu Ser Arg Ala Asp Ile Thr Thr Val Ser Thr Phe Ile Asp Leu

 Asn Ile Thr Met Leu Glu Asp His Glu Phe Val Pro Leu Glu Val Tyr

 Thr Arg His Glu Ile Lys Asp Ser Gly Leu Leu Asp Tyr Thr Glu Val

 Gln Arg Arg Asn Gln Leu His Asp Leu Arg Phe Ala Asp Ile Asp Thr

 Val Ile His Ala Asp Ala Asn Ala Ala Met Phe Ala Gly Leu Gly Ala

 Phe Phe Glu Gly Met Gly Asp Leu Gly Arg Ala Val Gly Lys Val Val

 Met Gly Ile Val Gly Gly Val Val Ser Ala Val Ser Gly Val Ser Ser

 Phe Met Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu Val Leu

 Ala Gly Leu Ala Ala Ala Phe Phe Ala Phe Arg Tyr Val Met Arg Leu

 Gln Ser Asn Pro Met Lys Ala Leu Tyr Pro Leu Thr Thr Lys Glu Leu

 Lys Asn Pro Thr Asn Pro Asp Ala Ser Gly Glu Gly Glu Glu Gly Gly

 Asp Phe Asp Glu Ala Lys Leu Ala Glu Ala Arg Glu Met Ile Arg Tyr

 Met Ala Leu Val Ser Ala Met Glu Arg lhr Glu His Lys Ala Lys Lys

 Lys Gly Thr Ser Ala Leu Leu Ser Ala Lys Val Thr Asp Met Val Met

 Arg Lys Arg Arg Asn Thr Asn Tyr Thr Gln Val Pro Asn Lys Asp Gly

 Asp Ala Asp Glu Asp Asp Leu SEC ID NO:23:

 Het Arg Pro Arg Gly Thr Pro Pro Ser Phe Leu Pro Leu Pro Val Leu

 Leu Ala Leu Ala Val Ile Ala Ala Ala Gly Arg Ala Ala Pro Ala Ala

 Ala Ala Ala Pro Thr Ala Asp Pro Ala Ala Thr Pro Ala Leu Pro Glu

 Asp Glu Glu Val Pro Asp Glu Asp Gly Glu Gly Val Ala Thr Pro Ala

 Pro Ala Ala Asn Ala Ser Val Glu Ala Gly Arg Ala Thr Leu Arg Glu

 Asp Leu Arg Glu Ile Lys Ala Arg Asp Gly Asp Ala Thr Phe Tyr Val

 Cys Pro Pro Pro lhr Gly Ala Thr Val Val Gln Phe Glu Gln Pro Arg

 Pro Cys Pro Arg Ala Pro Asp Gly Gln Asn Tyr Thr Glu Gly Ile Ala 

 Val Val Phe Lys Glu Asn Ile Ala Pro Tyr Lys Phe Lys Ala Thr Met

 Tyr Tyr Lys Asp Val Thr Val Ser Gln Val Trp Phe Gly His Arg Tyr

 Ser Gln Phe Met Gly Ile Phe Glu Asp Arg Ala Pro Val Pro Phe Glu

 Glu Val Met Asp Lys Ile Asn Ala Lys Gly Val Cys Arg Ser Thr Ala

 Lys Tyr Val Arg Asn Asn Met Glu Ser Thr Ala Phe His Arg Asp Asp

 His Glu Ser Asp Met Ala Leu Lys Pro Ala Lys Ala Ala Thr Arg Thr

 Ser Arg Gly Trp His Thr Thr Asp Leu Lys Tyr Asn Pro Ala Arg Val

 Glu Ala Phe His Arg Tyr Gly Thr Thr Val Asn Cys Ile Val Glu Glu

 Val Glu Ala Arg Ser Val Tyr Pro Tyr Asp Glu Phe Val Leu Ala Thr

 Gly Asp Phe Val Tyr Met Ser Pro Phe Tyr Gly Tyr Arg Asp Gly Ser

 His Gly Glu His Thr Ala Tyr Ala Ala Asp Arg Phe Arg Gln Val Asp

 Gly Tyr Tyr Glu Arg Asp Leu Ser Thr Gly Arg Arg Ala Ala Ala Pro

 Val Thr Arg Ash Leu Leu Thr Thr Pro Lys Phe Thr Val Gly Trp Asp

 Trp Ala Pro Lys Arg Pro Ser Val Cys Thr Leu Thr Lys Trp Arg Glu

 Val Asp Glu Met Leu Arg Ala Glu Tyr Gly Pro Ser Phe Arg Phe Ser

 Ser Ala Ala Leu Ser Thr Thr Phe Thr Ala Asn Arg Thr Glu Tyr Ala

 Leu Ser Arg Val Asp Leu Ala Asp Cys Val Gly Arg Glu Ala Arg Glu

 Ala Val Asp Arg Ile Phe Leu Arg Arg Tyr Asn Gly Thr His Val Lys

 Val Gly Gln Val Gln Tyr Tyr Leu Ala Thr Gly Gly Phe Leu Ile Ala

 Tyr Gln Pro Leu Leu Ser Asn Ala Leu Val Glu Leu Tyr Val Arg Glu

 Leu Val Arg Glu Gln Thr Arg Arg Pro Ala Gly Gly Asp Pro Gly Glu

 Ala Ala Thr Pro Gly Pro Ser Val Asp Pro Pro Ser Val Glu Arg Ile

 Lys Thr Thr Ser Ser Val Glu Phe Ala Arg Leu Gln Phe Thr Tyr Asp

 His Ile Gln Arg His Val Asn Asp Met Leu Gly Arg Ile Ala Thr Ala

 Trp Cys Glu Leu Gln Asn Arg Glu Leu Thr Leu Trp Asn Glu Ala Arg

 Arg Leu Asn Pro Gly Ala Ile Ala Ser Ala Thr Val Gly Arg Arg Val

 Ser Ala Arg Met Leu Gly Asp Val Met Ala Val Ser Thr Cys Val Pro

 Val Ala Pro Asp Asn Val Ile Met Gln Asn Ser Ile Gly Val Ala Ala

 Arg Pro Gly Thr Cys Tyr Ser Arg Pro Leu Val Ser Phe Arg Tyr Glu

 Ala Asp Gly Pro Leu Val Glu Gly Gln Leu Gly Glu Asp Asn Glu Ile

 Arg Leu Glu Arg Asp Ala Leu Glu Pro Cys Thr Val Gly His Arg Arg

 Tyr Phe Thr Phe Gly Ala Gly Tyr Val Tyr Phe Glu Glu Tyr Ala Tyr

 Ser His Gln Leu Gly Arg Ala Asp Val Thr Thr Val Ser Thr Phe Ile

 Asn Leu Asn Leu Thr Met Leu Glu Asp His Glu Phe Val Pro Leu Glu

 Val Tyr Thr Arg Gln Glu Ile Lys Asp Ser Gly Leu Leu Asp Tyr Thr

 Glu Val Gln Arg Arg Asn Gln Leu His Ala Leu Arg Phe Ala Asp Ile

 Asp Thr Val Ile Lys Ala Asp Ala His Ala Ala Leu Phe Ala Gly Leu

 Tyr Ser Phe Phe Glu Gly Leu Gly Asp Val Gly Arg Ala Val Gly Lys

 Val Val Met Gly Ile Val Gly Gly Val Val Ser Ala Val Ser Gly Val

 Ser Ser Phe Leu Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu

 Val Leu Ala Gly Leu Ala Ala Ala Phe Phe Ala Phe Arg Tyr Val Met

 Arg Leu Gln Arg Asn Pro Met Lys Ala Leu Tyr Pro Leu Thr lhr Lys

 Glu Leu Lys Ser Asp Gly Ala Pro Leu Ala Gly Gly Gly Glu Asp Gly

 Ala Glu Asp Phe Asp Glu Ala Lys Leu Ala Gln Ala Arg Glu Met Ile

 Arg Tyr Met Ala Leu Val Ser Ala Met Glu Arg Thr Glu His Lys Ala

 Arg Lys Lys Gly Thr Ser Ala Leu Leu Ser Ala Lys Val Thr Asp Ala

 Val Met Arg Lys Arg Ala Arg Pro Arg Tyr Ser Pro Leu Arg Asp Thr

 Asp Glu Glu Glu Leu SEQ ID NO:24: GCTGTTCAGA TTTGACTTAG AYMANMCNTG YCC                                       33 SEQ ID NO:25: GTGTACAAGA AGAACATCGT GCCNTAYATN TTYAA                                     35 SEQ ID NO:26: GTGTACAAGA AGAACATCGT GCC                                                  23         SEQ ID NO:27: AACATGTCTA CAATCTCACA RTTNACNGTN GT                                        32 SEQ ID NO:28: AACATGTCTA CAATCTCACA                                                      20 SEQ ID NO:29: AATAACCTCT TTACGGCCCA AATTCARTWY GCNTAYGA                                  38 SEQ ID NO:30: CCAACGAGTG TGATGTCAGC CATTTAYGGN AARCCNGT                                  38 SEQ ID NO:31: CCAACGAGTG TGATGTCAGC C                                                    21 SEQ ID NO:32: TGCTACTCGC GACCTCTAGT CACCTTYAAR TTYRTNAA                                  38 SEQ ID NO:33: TGCTACTCGC GACCTCTAGT CACC                                24 SEQ ID NO:24: ACCGGAGTAC AGTTCCACTG TYTTRAARTC DATRTT                   36 SEQ ID NO:35: TGTCACCTTG ACATGAGGCC A                                   21 SEQ ID NO:36: TTTGACCTGG AGACTATGTT YMGNGARTAY AA                       32 SEQ ID NO:37: GCTCTGGGTG TAGTAGTTRT AYTCYCTRAA CAT                      33 SEQ ID NO:38: TCTCGGAACA TGCTCTCCAG RTCRAAMACR TT                       32 SEQ ID NO:39: ACCTTCATCA AAAATCCCTT NGGNGGNATG YT                       32 SEQ ID NO:40: TGGACTTACA GGACTCGAAC NACNGTNAAY TG                       32

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈