本发明的一个目的是提供一种多核苷酸序列,该多核苷酸序列编码一种人转录因子 ( human cyto kine receptor,hTF)。
本发明的另一个目的是提供一种蛋白,该蛋白被命名为人转录因子(hTF)。
本发明的再一个目的是提供一种利用重组技术生产所述的hTF蛋白的方法。
本发明还提供了这种hTF核酸序列和蛋白的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,它包括:编码具有人hTF蛋 白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.1中从核苷酸370-2592位的 核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.1中从核苷酸370-2592位的核苷酸序列杂交。较佳地,所述的序列编码一多肽,该多 肽具有SEQ ID NO.2所示的序列。更佳地,该序列具有SEQ ID NO.1中从核苷酸370-2592 位的核苷酸序列。
在本发明的另一方面,提供了一种分离的hTF蛋白多肽,它包括:具有SEQ ID NO.2 氨基酸序列的多肽、或其活性
片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO. 2序列的多肽。
在本发明的另一方面,提供了一种载体,它含有上述分离出的DNA。
在本发明的另一方面,提供了一种所述载体转化的宿主细胞。
在本发明的另一方面,提供了一种产生具有hTF蛋白活性的多肽的方法,该方法包括:
(a)将编码具有hTF蛋白活性的多肽的核苷酸序列可操作地连于表达
调控序列,形成 hTF蛋白表达载体,所述的核苷酸序列与SEQ ID NO.1中从核苷酸370-2592位的核苷酸序 列有至少70%的同源性;
(b)将步骤(a)中的表达载体转入宿主细胞,形成hTF蛋白的重组细胞;
(c)在适合表达hTF蛋白多肽的条件下,培养步骤(b)中的重组细胞;
(d)分离出具有hTF蛋白活性的多肽。
在本发明的一个具体实施方案中,本发明的分离的多核苷酸全长为2594个核苷酸, 其详细序列见SEQ ID NO.1,其中开放读框位于370-2592位核苷酸。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已 从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随 核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“hTF蛋白(或多肽)编码序列”指编码具有HTF蛋白活性的多肽的 核苷酸序列,如SEQ ID NO.1中370-2592位核苷酸序列及其简并序列。该简并序列是指, 位于SEQ ID NO.1序列的编码框370-2592位核苷酸中,有一个或多个密码子被编码相同氨 基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.1中 370-2592位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.2所述的序 列。该术语还包括能在中度严紧条件下,更佳地在高度严紧条件下与SEQ ID NO.1中从核 苷酸370-2592位的核苷酸序列杂交的核苷酸序列。此外,该术语还包括与SEQ ID NO.1中 从核苷酸370-2592位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90% 的核苷酸序列。
该术语还包括能编码具有与人HTF相同功能的蛋白的、SEQ ID NO.1序列的变异形 式。这些变异形式包括(但并不限于):若干个(通常为1-90个,较佳地1-60个,更佳地1-20 个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60 个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较 佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合 适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本 上不含天然状态下的伴随其的组分。
在本发明中,术语“hTF蛋白多肽”指具有hTF蛋白活性的SEQ ID NO.2序列的多肽。 该术语还包括具有与人hTF相同功能的、SEQ ID NO.2序列的变异形式。这些变异形式包 括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨 基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内, 较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的 氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个 或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括hTF蛋白的活性片段和活性衍 生物。
该多肽的变异形式包括:同源序列、等位变异体、天然突变体、诱导突变体、在高 或低的严谨度条件下能与hTF DNA杂交的DNA所编码的蛋白、以及利用抗hTF多肽的抗 血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含hTF多肽或其片段的融合蛋白。 除了几乎全长的多肽外,本发明还包括了hTF多肽的可溶性片段。通常,该片段具有hTF 多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续 氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
发明还提供hTF蛋白或多肽的类似物。这些类似物与天然hTF多肽的差别可以是氨基 酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包 括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过
辐射或暴露于诱 变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括 具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的 氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的 多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或 羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基 化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如
哺乳动物的糖 基化酶或去糖基化酶)而完成。修饰形式还包括具有磷
酸化氨基酸残基(如
磷酸酪氨酸,磷 酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白
水解性能或优化了溶 解性能的多肽。
本发明还包括hTF多肽编码序列的反义序列。这种反义序列可用于抑制细胞内hTF的 表达。
本发明还包括一种探针分子,该分子通常具有hTF多肽编码序列的8-100个,较佳地 15-50个连续核苷酸。该探针可用于检测样品中是否存在编码hTF的核酸分子。
本发明还包括检测hTF核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然 后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对 应于hTF多肽的编码序列,并可位于该编码序列的两侧或中间。引物长度一般为20-50个核 苷酸。
在本发明中,可选用本领域已知的各种载体,如市售的载体。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的 例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括
酵母细胞,昆虫细胞、和哺乳 动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
另一方面,本发明还包括对hTF DNA或是其片段编码的多肽具有特异性的多克隆抗 体和单克隆
抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于hTF基因产物 或片段。较佳地,指那些能与hTF基因产物或片段结合但不识别和结合于其它非相关
抗原 分子的抗体。本发明中抗体包括那些能够结合并抑制hTF蛋白的分子,也包括那些并不影 响hTF蛋白功能的抗体。本发明还包括那些能与修饰或未经修饰形式的hTF基因产物结合 的抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段, 如Fab′或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子(Ladner等人,美 国
专利No.4,946,778);或
嵌合抗体,如具有鼠抗体结合特异性但仍保留来自人的抗体部分 的抗体。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的 hTF基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之 相似的,表达hTF或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗 体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人, Nature 256;495,1975;Kohler等人, Eur.J.Immuno1.6:511,1976;Kohler等人, Eur.J.Immunol. 6:292,1976;Hammerling等人, In Monoclonal Antibodies and T Cell Hybridomas,Elsevier, N.Y.,1981)。本发明的抗体包括能阻断hTF功能的抗体以及不影响hTF功能的抗体。本发明 的各类抗体可以利用hTF基因产物的片段或功能区,通过常规免疫技术获得。这些片段或 功能区可以利用重组方法制备或利用多肽合成仪合成。与hTF基因产物的未修饰形式结合 的抗体可以用原核细胞(例如E.Coli)中生产的基因产物来免疫动物而产生;与翻译后修饰 形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞) 中产生的基因产物来免疫动物而获得。
在本发明中,人hTF的cDNA核苷酸序列是如此获得的,以人睾丸λgt10cDNA文库 (购自Clontech公司)为模板,用两对寡核苷酸为引物:A1 gcttgaacct tgtcacccct c;B1 tcgac tacctcctcc aacact为正向引物;A2:TCACA GCCTGGCCAT TTGCAA;B2 TCTC ATTCCAGATC TTCAGAT为反向引物,进行PCR。PCR条件为93℃4分钟,随之以93℃1 分钟、64℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟。
电泳检测得到的PCR 片断,大小分别为约一千五百和一千二百个碱基对的片段及杂质。去除杂质,用NcoI分别 酶切上述两个片段,然后连接,得到目的片段。将核苷酸序列装入载体,导入宿主细胞。 宿主细胞就可表达出相应蛋白,经过分离纯化就将得到本发明的hTF蛋白。
本发明的hTF蛋白在Non-redundant GenBank+EMBL+DDBJ+PDB
数据库及 Non-redundant GenBank CDS translations+PDB+SwissProt+Spupdate+PIR数据库中用 BLAST
软件进行核酸和蛋白同源检索,结果发现它具有锌指蛋白和叉形头蛋白的特征序 列。
锌指结构异常将会导致许多细胞分化与胚胎发育相关的疾病,如:神经病,多指趾畸 型及韦尔姆斯氏瘤等。由叉形头蛋白异常引起的疾病有:角虹膜发育异常,里格氏发育异 常,青光眼和虹膜发育不全,Bamforth-Lazarus综合征,T
细胞免疫缺陷,先天性脱发及 指甲发育不良等。
本发明的hTF可形成锌指结构,具有DNA结合区特征,可作为一种转录因子与核酸 结合并相互作用以调控基因表达,从而对细胞乃至生物体的生理活动起到调控作用。这些 生理作用包括促进组织生长,调控细胞的生长和增殖,诱导细胞向某个特定的趋势发展等 等。
将本发明的hTF核酸、其反义链及片段制成探针,可检测hTF基因异常;将hTF蛋白 序列制成
试剂盒或药物,可调节细胞生长增殖分化,促进烫伤烧伤、组织
切除乃至器官摘 除后的
伤口愈合,防止伤口感染。将本发明的hTF核酸反义链或hTF抗体制成试剂盒可用 于减轻或
辅助治疗由于hTF表达量过高而导致的疾病,也可辅助临床上
肿瘤和癌症的诊 断,
预防及治疗。此外,本发明hTF还可以与该家族的其他成员进行融合或交换片段,以 产生新的蛋白,例如可将本发明hTF的N端与鼠TF的N端进行交换,以产生新的活性更高 或具有新特性的蛋白。针对本发明hTF的抗体,用于筛选该家族的其他成员,或者用于亲 和纯化相关蛋白(如该家族的其他成员)。
实施例1
hTF的cDNA序列的克隆和测定
1.引物扩增
以人睾丸λgt10cDNA文库(购自Clontech公司)为模板,用两对寡核苷酸为引物:A1 GCTTGAACCT TGTCACCCCT C;B1 TCGAC TACCTCCTCC AACACT为正向引物;A2: TCACA GCCTGGCCAT TTGCAA;B2 TCTC ATTCCAGATC TTCAGAT为反向引物,进 行PCR。PCR条件为93℃4分钟,随之以93℃1分钟、64℃1分钟和72℃1分钟进行35个循环, 最后72℃延伸5分钟。电泳检测得到的PCR片断,大小分别为约一千五百和一千二百个碱 基对的片段及杂质。去除杂质,用NcoI分别酶切上述两个片段,然后连接,得到目的片段。
2.PCR产物的测序
将上述目的片段与pGEM-TTM载体(Promega)连接,转化大肠杆菌JM103,用QIAprep Plasmid试剂盒(QIAGEN)提取质粒,用双链嵌套式缺失试剂盒(Pharmacia)对插入片段进行 定向系列缺失,然后用PCR对缺失子进行快速鉴定及排序。用SequiTherm EXCELTM DNA 测序试剂盒(Epicentre Technologies)对依次截短的缺失子进行测序,最后获得全长cDNA序 列,共2594bp,详细序列见SEQ ID NO.1,其中开放读框位于370-2592位核苷酸。
根据得到的全长cDNA序列推导出hTF的氨基酸序列,共740个氨基酸残基,其氨基酸 序列详见SEQ ID NO.2。
实施例2
hTF在大肠杆菌中的表达
在该实施例中,将编码hTF的cDNA序列,用对应于该DNA序列的5′和3′端的PCR寡核 苷酸引物进行扩增,获得hTF cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为:
5’-G TATGGATCCA TGATGCAGGA ATCTGCGA,该引物含有BamHI限制性内切 酶的酶切位点,在该酶切位点之后是由起始密码子开始的hTF的部分编码序列;
3′端引物序列为:
5’-TTCCAGATC TTCAGATAAAAAGCTTATTACG,该引物含有HindIII限制性内切 酶的酶切位点、翻译终止子和hTF的部分编码序列。
引物上的限制性内切酶的酶切位点对应于细菌表达载体pQE-9(Qiagen Inc., Chatsworth,CA)上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr)、一个细 菌复制起点(ori)、一个IPTG-可调启动子/操纵子(P/O)、一个核糖体结合位点(RBS)、一个 6-组氨酸标记物(6-His)以及限制性内切酶克隆位点。
用BamHI和HindIII消化pQE-9载体和插入片段,随后将插入片段连接到pQE-9载体并 保持开放读框在细菌RBS起始。随后用连接混合物转化购自Qiagen,商品名为M15/rep4的 E.coli菌株,M15/rep4含有多拷贝的质粒pREP4,其表达lacI阻遏物并携带卡那霉素抗性 (Kanr)。在含有Amp和Kan的LB培养皿上筛选转化子,抽提质粒,用NcoI酶切鉴定插入片 段大小及方向,并测序验证hTF的cDNA片段已正确插入了载体。
在补加Amp(100μg/ml)和Kan(25μg/ml)的LB液体培养基中过夜培养(O/N)含所需构 建物的阳性转化子克隆。过夜(O/N)培养物以1∶100-1∶250的稀释率稀释,然后接种到大 体积培养基中,培养细胞生长至600光
密度(OD600)为0.4-0.6时,加入IPTG(“异丙基硫代- β-D-半乳糖苷”)至终浓度为1mM。通过使lacI阻遏物失活,IPTG诱导启动P/O导致基因表 达水平提高。继续培养细胞3-4小时,随后离心(6000×g,20分钟)。超声裂解包涵体,收 集细胞并将细胞沉淀溶于6M的
盐酸胍中。澄清后,通过在能使含6-His标记物蛋白紧密结 合的条件下,用镍-螯合柱层析从溶液中纯化溶解的hTF。用6M盐酸胍(pH5.0)从柱中洗脱 hTF。可用几种方法从盐酸胍中变性沉淀蛋白。或者使用
透析步骤除去盐酸胍,或者从镍 -螯合柱中分离出纯化蛋白,纯化后的蛋白可以结合到第二个柱中,该柱中具有递减的线 性盐酸胍梯度。在结合到该柱时蛋白质变性,随后用盐酸胍(pH5.0)洗脱。最后,将可溶的 蛋白质对含PBS进行透析,然后将蛋白质保存在终浓度为10%(w/v)甘油的贮存液中。
此外,用常规方法对表达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发 现与SEQ ID NO.2的序列一致。
实施例3
hTF在真核细胞(CHO细胞株)中的表达
在该实施例中,将编码hTF的cDNA序列下列寡核苷酸引物进行扩增,获得hTF cDNA 作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为:
5’-G TATAAGCTTA TGATGCAGGA ATCTGCGA
该引物含有HindIII限制性内切酶的酶切位点,在该酶切位点之后是由起始密码子开 始的hTF的部分编码序列;
3′端引物序列为:
5’-TTCCAGATC TTCAGATAAAAAGCTTATTACG
该引物含有BamHI限制性内切酶的酶切位点、一个翻译终止子和hTF的部分编码序 列。
引物上的限制性内切酶的酶切位点对应于CHO细胞表达载体pcDNA3上的限制性内 切酶酶切位点,该质粒载体编码抗生素抗性(Ampr和Neor)、一个
噬菌体复制起点(fl ori)、 一个病毒复制起点(SV40 ori)、一个T7启动子、一个病毒启动子(P-CMV)、一个Sp6启动子、 一个SV40启动子、一个SV40加尾
信号和相应的polyA顺序、一个BGH加尾信号和相应的 polyA顺序。
用HindIII及BamHI消化pcDNA3载体和插入片段,随后将插入片段连接到pcDNA3载 体。随后用连接混合物转化E.coli DH5α菌株。在含有Amp的LB培养皿上筛选转化子,在 补加Amp(100μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的克隆。抽提质粒, 用NcoI酶切鉴定插入片段大小及方向,并测序验证hTF的cDNA片段已正确插入了载体。
质粒
转染CHO细胞是用脂转染法,用Lipofectin(GiBco Life)进行,转染48小时后,经 2-3周的持续G418加压筛选,收集细胞及细胞上清测定表达蛋白酶活
力。去G418,连续传 代培养;对混合克隆细胞极限稀释,选择具有较高蛋白活性的细胞亚克隆。按常规方法大 量培养上述阳性亚克隆。48小时后,开始收集细胞及上清,用超声裂解方法
破碎细胞。以 含0.05%Triton的50mMTris·HCl(pH7.6)溶液为平衡液及洗脱液,用经预平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mMTris·HCl(pH8.0)平衡的DEAE-Sepharose柱, 以含0-1M NaCl的50mMTris·HCl(pH8.0)溶液为洗脱液进行梯度洗脱,收集上述蛋白的活 性峰。然后以PBS(pH7.4)为
透析液对表达蛋白溶液进行透析。最后冻干保存。
此外,用常规方法对表达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发 现与SEQ ID NO.2的序列一致。
实施例4
同源比较
用实施例2和实施例3得到的hTF蛋白(SEQ ID NO.2)本发明的hTF蛋白在 Non-redundant GenBank+EMBL+DDBJ+PDB数据库及Non-redundant GenBank CDS translations+PDB+SwissProt+Spupdate+PIR数据库中用BLAST软件进行核酸和蛋白同源检 索,结果发现它具有锌指蛋白和叉形头蛋白的特征序列。
锌指是在Xenopus转录因子TFIIIA中首次发现的能与核酸结合的蛋白结构域,至今, 该结构域已在各种核酸结合蛋白中发现。锌指结构的特征序列可用下述格式表示: C-x(2,4)-C-x(3)-[LIVMFYWC]-x(8)-H-x(3,5)-H。其中,x表示任意氨基酸,括号中的数字 表示氨基酸残疾的数量,[LIVMFYWC]表示从方括号中的氨基酸中任选一个。本发明所述 的hTF的蛋白序列具有锌指蛋白结构域的典型序列为: VCKWPGCESICEDFGQFLKHLNNEH(SEQ ID NO 2中371-396)。锌指结构异常将会导 致许多细胞分化与胚胎发育相关的疾病,如:神经病,多指趾畸型及韦尔姆斯氏瘤等。 (Science 1988 Sep 16;241(4872):1489-92;Parraga G,Horvath SJ,Eisen A,Taylor WE,Hood L,Young ET,Klevit RE.;Klug A.,Rhodes D.Trends Biochem.Sci.12:464-469(1987).; Evans R.M.,Hollenberg S.M.Cell 52:1-3(1988).)。锌指结构是目前所发现的转录因子中最 普遍的DNA结合结构域。
本发明的hTF蛋白还具有叉形头蛋白结构域。叉形头蛋白,它不含有与其它转录因子 同源的功能域或锌指特征,与先前鉴定的DNA结合区也没有相似性。它包含一个由100 个氨基酸残基组成的DNA结合区,形成有侧翼的螺旋结构,这个结构域被定名为“叉形 头”(Weigel D.,Jurgens G.,Kuttner F.,Seifert E.,Jackle H.Cell 57:645-658(1989))。叉形 头功能域与B型DNA结合,这在许多转录因子中都发现过(包括果蝇FD1-5,哺乳动物 HNF-3,人HTLF,酵母HCM1,等等)(Clark K.L.,Halay E.D.,Lai E.,Burley S.K.Nature 364: 412-420(1993).)。尽管具有该结构域的转录因子类型各不相同,但这些因子有一个共同的 特点是都参与在胚胎早期决定细胞命运(Hacker U.,Grossniklaus U.,Gehring W.J.,Jackle H. Proc.Natl.Acad.Sci.U.S.A.89:8754-8758(1992)。本发明的hTF的蛋白序列含有叉形头蛋 白的特征序列:VRPPFTYATLIRQAIMESSDRQLTLNEIYSWFTRTFAYFRR NAATWKNAVRHNLSLHKCFVRVENVKGAVWTVDEVEYQKR(SEQ ID NO 2中 527-608)。由叉形头蛋白异常引起的疾病有:角虹膜发育异常,里格氏发育异常,青光 眼和虹膜发育不全,Bamforth-Lazarus综合征,T细胞免疫缺陷,先天性脱发及指甲发育 不良等。这进一步说明本发明的hTF可与DNA相互作用,参与转录调控,
综上所述,本发明的hTF可形成锌指结构,具有DNA结合区特征,可作为一种转录 因子与核酸结合并相互作用以调控基因表达,从而对细胞乃至生物体的生理活动起到调控 作用。这些生理作用包括促进组织生长,调控细胞的生长和增殖,诱导细胞向某个特定的 趋势发展等等。
将本发明的hTF核酸、其反义链及片段制成探针,可检测hTF基因异常;将hTF蛋白 序列制成试剂盒或药物,可调节细胞生长增殖分化,促进烫伤烧伤、组织切除乃至器官摘 除后的伤口愈合,防止伤口感染。将本发明的hTF核酸反义链或hTF抗体制成试剂盒可用 于减轻或辅助治疗由于hTF表达量过高而导致的疾病,也可辅助临床上肿瘤和癌症的诊 断,预防及治疗。此外,本发明hTF还可以与该家族的其他成员进行融合或交换片段,以 产生新的蛋白,例如可将本发明hTF的N端与鼠TF的N端进行交换,以产生新的活性更高 或具有新特性的蛋白。针对本发明hTF的抗体,用于筛选该家族的其他成员,或者用于亲 和纯化相关蛋白(如该家族的其他成员)。
本发明的hTF除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一 起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明hTF还可以与该家 族的其他成员进行融合或交换片段,以产生新的蛋白,例如可将本发明hTF的N端与鼠CKR 的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明hTF的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如 该家族的其他成员)。
实施例5
制备抗体
将实施例2或3获得的重组蛋白用来免疫动物以产生抗体,具体如下。重组分子用层 析法进行分离后备用。也可用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中切下, 并用等体积的完全Freund’s佐剂乳化。用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜 内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原,对小鼠以50-100μg/0.2ml的剂 量进行腹膜内注射以加强免疫。每隔14天进行一次加强免疫,至少进行三次。获得的抗血 清的特异反应活性用它在体外沉淀hTF基因翻译产物的能力加以评估。
实例6
作为微矩阵的底物
微矩阵,又称为DNA芯片。通过使用一些著名的生物软件(如LASERGENE SOFTWARE(DNASTAR),来选择将hTF全长cDNA、EST、或基因片段作为微矩阵的底 物样品。然后通过使用喷墨技术及一系列化学方法如射线、化学、
热力学、机械方法等把 样品固定在载体上,如玻璃上,得到芯片(Schena,M.et al.(1995)Science 270:467-470;and Shalon,D.et al.(1996)Genome Res.6:639-645.),形成的元件有点状、条形等等。一
块典 型的芯片通常含有一定数量的元件。杂交反应后,洗去未结合的探针,然后用
扫描仪来检 测发生杂交反应的元件及反应的程度。探针与每一个芯片元件的互补性和结合量都可通 过对扫描出的图像的分析来判断。
杂交结果可用于检测出hTF基因变异、突变及多态现象,理解由于hTF表达不正常 引起的疾病的分子
基础,诊断疾病,并可改进及监测相关药剂的活性。
实施例7:
试剂盒的制备
试剂盒1:
它含有(1)特异性扩增hTF的引物对和使用说明。该试剂盒还可含有或不含有将 mRNA逆转录成cDNA的所需试剂。其中,该特异性引物的序列衍生自SEQ ID NO:1的 序列。对逆转录成的cDNA进行特异性扩增,以检测样品中是否含有hDGF7的核酸序列。 该试剂盒还可含有进行PCR反应所需的其他试剂,例如缓冲液等。
此外,较佳地,至少一个所用的引物跨越了两个外显子,因为此时对应于hTF的基 因组序列将不产生扩增产物。
试剂盒2:
该试剂盒含有针对hTF的特异性的抗体(例如实施例5中制备的多克隆抗体,或者用 标准的杂交瘤技术产生的抗hTF的单克隆抗体),和使用说明。该试剂盒用于直接检测样 品中是否存在或缺失hTF蛋白。先通过特异性免疫反应形成免疫复合物,然后用常规技 术检测免疫复合物。
试剂盒3:
该试剂盒含有可特异性地与hTF的mRNA杂交的探针。它还可含有或不含有杂交缓 冲液。该试剂盒通过核酸分子与hTF特异性探针之间的杂交反应来检测样品中是否存在 hTF的核酸分子。
试剂盒也可用于检测出基因变异、突变及多态现象,并检测出一系列与本发明的 hTF相关的基因,从而对相关疾病的诊断、治疗起辅助作用。
实例8:
制成药物
本发明的hTF蛋白及其抗体、
抑制剂、拮抗剂或受体等可作为药物,可促进烫伤烧 伤、组织切除乃至器官摘除后的伤口愈合,防止伤口感染。将本发明的hTF核酸反义链 或hTF抗体制成试剂盒可用于减轻或辅助治疗由于hTF表达量过高而导致的疾病,也可 辅助临床上肿瘤和癌症的诊断,预防及治疗。
本发明蛋白及其抗体、抑制剂、拮抗剂或受体等,当在治疗上进行施用(
给药)时,可 提供不同的效果。通常,可将这些物质配制于无毒的、惰性的和药学上可接受的水性载体 介质中,其中pH通常为约5-8,较佳地pH约为6-8,尽管pH值可随被配制物质的 性质以及待治疗的病症而有所变化。配制好的药物组合物可以通过常规途径进行给药,其 中包括(但并不限于):肌内、腹膜内、皮下、皮内、或局部给药。
此外,本发明hTF核酸(编码序列或反义序列)可以直接引入细胞,以提高hTF的表达 水平或者抑制hTF的过度表达。本发明的hTF蛋白或其活性多肽片段可以施用于病人,以 治疗或减轻因hTF缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的 核酸序列或抗体进行有关的诊断或
预后判断。
当本发明的hTF蛋白多肽被用作药物时,治疗有效剂量通常至少约10微克/千克体重, 而且在大多数情况下不超过约8毫克/千克体重,较佳地该剂量是约10微克/千克体重-约1 毫克/千克体重。当然,具体剂量还应考虑给药途径、病人健康状况等因素,这些都是熟 练医师技能范围之内的。
序列表 <210>1 <211>2594 <212>核苷酸 <213>人类 <220> <221>编码序列 <222>(370)..(2592) <223> <400>1 gcttgaacct tgtcacccct cacgtgcaca ccaaagacat accctagtga ttaaatgctg 60 atttgtgtac gatgtccacg gacgccaaaa caatcacaga gctgcttgat tgttttaatt 120 atccagcaca aaatgccatc agtctgggac gtgatcgggc agaggtgtac tcacagtagt 180 gtaaatactg ctgtaaatag tgtctgatgg tggcttgaca gtgagctagc ttctgagttt 240 tcccttcttt ttatactgtt ttctgtgctg gcttttttga atcttcctaa tttttcatct 300 ctttaacaaa ctcctatgaa gttgaaaccg ggaagtttgc tctaacattt ccagagaagg 360 tattaagtc atg atg cag gaa tct gcg aca gag aca ata agc aac agt tca 411
Met Met Gln Glu Ser Ala Thr Glu Thr Ile Ser Asn Ser Ser
1 5 10 atg aat caa aat gga atg agc act cta agc agc caa tta gat gct ggc 459 Met Asn Gln Asn Gly Met Ser Thr Leu Ser Ser Gln Leu Asp Ala Gly 15 20 25 30 agc aga gat gga aga tca agt ggt gac acc agc tct gaa gta agc aca 507 Ser Arg Asp Gly Arg Ser Ser Gly Asp Thr Ser Ser Glu Val Ser Thr
35 40 45 gta gaa ctg cta cat ctg caa caa cag cag gct ctc cag gca gca aga 555 Val Glu Leu Leu His Leu Gln Gln Gln Gln Ala Leu Gln Ala Ala Arg
50 55 60 caa ctt ctt tta cag cag caa aca agt gga ttg aaa tct cct aag agc 603 Gln Leu Leu Leu Gln Gln Gln Thr Ser Gly Leu Lys Ser Pro Lys Ser
65 70 75 agt gat aaa cag aga cca ctg cag gaa ttg ctt cca gaa aca aaa tta 651 Ser Asp Lys Gln Arg Pro Leu Gln Glu Leu Leu Pro Glu Thr Lys Leu
80 85 90 tgt atc tgt ggc cac tct tct ggt gat ggg cat cct cac aac aca ttt 699 Cys Ile Cys Gly His Ser Ser Gly Asp Gly His Pro His Asn Thr Phe 95 100 105 110 gca gtg cct gtg tca gtg gcc atg atg act ccc cag gtg atc acc cct 747 Ala Val Pro Val Ser Val Ala Met Met Thr Pro Gln Val Ile Thr Pro
115 120 125 cag caa atg cag cag atc ctt cag caa caa gtc ctg tct cct cag cag 795 Gln Gln Met Gln Gln Ile Leu Gln Gln Gln Val Leu Ser Pro Gln Gln
130 135 140 cta caa gcc ctt ctc caa caa cag cag gct gtc atg ctg cag cag caa 843 Leu Gln Ala Leu Leu Gln Gln Gln Gln Ala Val Met Leu Gln Gln Gln
145 150 155 caa cta caa gag ttt tac aag aaa cag caa gag cag tta cat ctt cag 891 Gln Leu Gln Glu Phe Tyr Lys Lys Gln Gln Glu Gln Leu His Leu Gln
160 165 170 ctt ttg cag cag cag cag caa cag cag cag cag caa caa cag cag caa 939 Leu Leu Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln 175 180 185 190 caa cag cag cag caa caa caa caa caa cag cag caa caa cag cag cag 987 Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
195 200 205 cag cag caa cag cag cag cag cag caa cag cat cct gga aag caa gcg 1035 Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His Pro Gly Lys Gln Ala
210 215 220 aaa gag cag cag cag cag cag cag cag caa cag caa ttg gca gcc cag 1083 Lys Glu Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Leu Ala Ala Gln
225 230 235 cag ctt gtc ttc cag cag cag ctt ctc cag atg caa caa ctc cag cag 1131 Gln Leu Val Phe Gln Gln Gln Leu Leu Gln Met Gln Gln Leu Gln Gln
240 245 250 cag cag cat ctg ctc agc ctt cag cgt cag gga ctc atc tcc att cca 1179 Gln Gln His Leu Leu Ser Leu Gln Arg Gln Gly Leu Ile Ser Ile Pro 255 260 265 270 cct ggc cag gca gca ctt cct gtc caa tcg ctg cct caa gct ggc tta 1227 Pro Gly Gln Ala Ala Leu Pro Val Gln Ser Leu Pro Gln Ala Gly Leu
275 280 285 agt cct gct gag att cag cag tta tgg aaa gaa gtg act gga gtt cac 1275 Ser Pro Ala Glu llc Gln Gln Leu Trp Lys Glu Val Thr Gly Val His
290 295 300 agt atg gaa gac aat ggc att aaa cat gga ggg cta gac ctc act act 1323 Ser Met Glu Asp Asn Gly Ile Lys His Gly Gly Leu Asp Leu Thr Thr
305 310 315 aac aat tcc tcc tcg act acc tcc tcc aac act tcc aaa gca tca cca 1371 Asn Asn Ser Ser Ser Thr Thr Ser Ser Asn Thr Ser Lys Ala Ser Pro
320 325 330 cca ata act cat cat tcc ata gtg aat gga cag tct tca gtt cta agt 1419 Pro Ile Thr His His Ser Ile Val Asn Gly Gln Ser Ser Val Leu Ser 335 340 345 350 gca aga cga gac agc tcg tca cat gag gag act ggg gcc tct cac act 1467 Ala Arg Arg Asp Ser Ser Ser His Glu Glu Thr Gly Ala Ser His Thr
355 360 365 ctc tat ggc cat gga gtt tgc aaa tgg cca ggc tgt gaa agc att tgt 1515 Leu Tyr Gly His Gly Val Cys Lys Trp Pro Gly Cys Glu Ser Ile Cys
370 375 380 gaa gat ttt gga cag ttt tta aag cac ctt aac aat gaa cac gca ttg 1563 Glu Asp Phe Gly Gln Phe Leu Lys His Leu Asn Asn Glu His Ala Leu
385 390 395 gat gac cga agc act gct cag tgt cga gtg caa atg cag gtg gtg caa 1611 Asp Asp Arg Ser Thr Ala Gln Cys Arg Val Gln Met Gln Val Val Gln
400 405 410 cag tta gaa ata cag ctt tct aaa gaa cgc gaa cgt ctt caa gca atg 1659 Gln Leu Glu Ile Gln Leu Ser Lys Glu Arg Glu Arg Leu Gln Ala Met 415 420 425 430 atg acc cac ttg cac atg cga ccc tca gag ccc aaa cca tct ccc aaa 1707 Met Thr His Leu His Met Arg Pro Ser Glu Pro Lys Pro Ser Pro Lys
435 440 445 cct cta aat ctg gtg tct agt gtc acc atg tcg aag aat atg ttg gag 1755 Pro Leu Asn Leu Val Ser Ser Val Thr Met Ser Lys Asn Met Leu Glu
450 455 460 aca tcc cca cag agc tta cct caa acc cct acc aca cca acg gcc cca 1803 Thr Ser Pro Gln Ser Leu Pro Gln Thr Pro Thr Thr Pro Thr Ala Pro
465 470 475 gtc acc ccg att acc cag gga ccc tca gta atc acc cca gcc agt gtg 1851 Val Thr Pro Ile Thr Gln Gly Pro Ser Val Ile Thr Pro Ala Ser Val
480 485 490 ccc aat gtg gga gcc ata cga agg cga cat tca gac aaa tac aac att 1899 Pro Asn Val Gly Ala Ile Arg Arg Arg His Ser Asp Lys Tyr Asn Ile 495 500 505 510 ccc atg tca tca gaa att gcc cca aac tat gaa ttt tat aaa aat gca 1947 Pro Met Ser Ser Glu Ile Ala Pro Asn Tyr Glu Phe Tyr Lys Asn Ala
515 520 525 gat gtc aga cct cca ttt act tat gca act ctc ata agg cag gct atc 1995 Asp Val Arg Pro Pro Phe Thr Tyr Ala Thr Leu Ile Arg Gln Ala Ile
530 535 540 atg gag tca tct gac agg cag tta aca ctt aat gaa att tac agc tgg 2043 Met Glu Ser Ser Asp Arg Gln Leu Thr Leu Asn Glu Ile Tyr Ser Trp
545 550 555 ttt aca cgg aca ttt gct tac ttc agg cgt aat gca gca act tgg aag 2091 Phe Thr Arg Thr Phe Ala Tyr Phe Arg Arg Asn Ala Ala Thr Trp Lys
560 565 570 aat gca gta cgt cat aat ctt agc ctg cac aag tgt ttt gtt cga gta 2139 Asn Ala Val Arg His Asn Leu Ser Leu His Lys Cys Phe Val Arg Val 575 580 585 590 gaa aat gtt aaa gga gca gta tgg act gtg gat gaa gta gaa tac cag 2187 Glu Asn Val Lys Gly Ala Val Trp Thr Val Asp Glu Val Glu Tyr Gln
595 600 605 aag cga agg tca caa aag ata aca gga agt cca acc tta gta aaa aat 2235 Lys Arg Arg Ser Gln Lys Ile Thr Gly Ser Pro Thr Leu Val Lys Asn
610 615 620 ata cct acc agt tta ggc tat gga gca gct ctt aat gcc agt ttg cag 2283 Ile Pro Thr Ser Leu Gly Tyr Gly Ala Ala Leu Asn Ala Ser Leu Gln
625 630 635 gct gcc ttg gca gag agc agt tta cct ttg cta agt aat cct gga ctg 2331 Ala Ala Leu Ala Glu Ser Ser Leu Pro Leu Leu Ser Asn Pro Gly Leu
640 645 650 ata aat aat gca tcc agt ggc cta ctg cag gcc gtc cac gaa gac ctc 2379 Ile Asn Asn Ala Ser Ser Gly Leu Leu Gln Ala Val His Glu Asp Leu 655 660 665 670 aat ggt tct ctg gat cac att gac agc aat gga aac agt agt ccg ggc 2427 Asn Gly Ser Leu Asp His Ile Asp Ser Asn Gly Asn Ser Ser Pro Gly
675 680 685 tgc tca cct cag ccg cac ata cat tca atc cac gtc aag gaa gag cca 2475 Cys Ser Pro Gln Pro His Ile His Ser Ile His Val Lys Glu Glu Pro
690 695 700 gtg att gca gag gat gaa gac tgc cca atg tcc tta gtg aca aca gct 2523 Val Ile Ala Glu Asp Glu Asp Cys Pro Met Ser Leu Val Thr Thr Ala
705 710 715 aat cac agt cca gaa tta gaa gac gac aga gag att gaa gaa gag cct 2571 Asn His Ser Pro Glu Leu Glu Asp Asp Arg Glu Ile Glu Glu Glu Pro
720 725 730 tta tct gaa gat ctg gaa tga ga 2594 Leu Ser Glu Asp Leu Glu 735 740 <210> 2 <211> 740 <212> 氨基酸 <213> 人类 <400> 2 Met Met Gln Glu Ser Ala Thr Glu Thr Ile Ser Asn Ser Ser Met Asn 1 5 10 15 Gln Asn Gly Met Ser Thr Leu Ser Ser Gln Leu Asp Ala Gly Ser Arg
20 25 30 Asp Gly Arg Ser Ser Gly Asp Thr Ser Ser Glu Val Ser Thr Val Glu
35 40 45 Leu Leu His Leu Gln Gln Gln Gln Ala Leu Gln Ala Ala Arg Gln Leu
50 55 60 Leu Leu Gln Gln Gln Thr Ser Gly Leu Lys Ser Pro Lys Ser Ser Asp 65 70 75 80 Lys Gln Arg Pro Leu Gln Glu Leu Leu Pro Glu Thr Lys Leu Cys Ile
85 90 95 Cys Gly His Ser Ser Gly Asp Gly His Pro His Asn Thr Phe Ala Val
100 105 110 Pro Val Ser Val Ala Met Met Thr Pro Gln Val Ile Thr Pro Gln Gln
115 120 125 Met Gln Gln Ile Leu Gln Gln Gln Val Leu Ser Pro Gln Gln Leu Gln
130 135 140 Ala Leu Leu Gln Gln Gln Gln Ala Val Met Leu Gln Gln Gln Gln Leu 145 150 155 160 Gln Glu Phe Tyr Lys Lys Gln Gln Glu Gln Leu His Leu Gln Leu Leu
165 170 175 Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
180 185 190 Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
195 200 205 Gln Gln Gln Gln Gln Gln Gln Gln His Pro Gly Lys Gln Ala Lys Glu
210 215 220 Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Leu Ala Ala Gln Gln Leu 225 230 235 240 Val Phe Gln Gln Gln Leu Leu Gln Met Gln Gln Leu Gln Gln Gln Gln
245 250 255 His Leu Leu Ser Leu Gln Arg Gln Gly Leu Ile Ser Ile Pro Pro Gly
260 265 270 Gln Ala Ala Leu Pro Val Gln Ser Leu Pro Gln Ala Gly Leu Ser Pro
275 280 285 Ala Glu Ile Gln Gln Leu Trp Lys Glu Val Thr Gly Val His Ser Met
290 295 300 Glu Asp Asn Gly Ile Lys His Gly Gly Leu Asp Leu Thr Thr Asn Asn 305 310 315 320 Ser Ser Ser Thr Thr Ser Ser Asn Thr Ser Lys Ala Ser Pro Pro Ile
325 330 335 Thr His His Ser Ile Val Asn Gly Gln Ser Ser Val Leu Ser Ala Arg
340 345 350 Arg Asp Ser Ser Ser His Glu Glu Thr Gly Ala Ser His Thr Leu Tyr
355 360 365 Gly His Gly Val Cys Lys Trp Pro Gly Cys Glu Ser Ile Cys Glu Asp
370 375 380 Phe Gly Gln Phe Leu Lys His Leu Asn Asn Glu His Ala Leu Asp Asp 385 390 395 400 Arg Ser Thr Ala Gln Cys Arg Val Gln Met Gln Val Val Gln Gln Leu
405 410 415 Glu Ile Gln Leu Ser Lys Glu Arg Glu Arg Leu Gln Ala Met Met Thr
420 425 430 His Leu His Met Arg Pro Ser Glu Pro Lys Pro Ser Pro Lys Pro Leu
435 440 445 Asn Leu Val Ser Ser Val Thr Met Ser Lys Asn Met Leu Glu Thr Ser
450 455 460 Pro Gln Ser Leu Pro Gln Thr Pro Thr Thr Pro Thr Ala Pro Val Thr 465 470 475 480 Pro Ile Thr Gln Gly Pro Ser Val Ile Thr Pro Ala Ser Val Pro Asn
485 490 495 Val Gly Ala Ile Arg Arg Arg His Ser Asp Lys Tyr Asn Ile Pro Met
500 505 510 Ser Ser Glu Ile Ala Pro Asn Tyr Glu Phe Tyr Lys Asn Ala Asp Val
515 520 525 Arg Pro Pro Phe Thr Tyr Ala Thr Leu Ile Arg Gln Ala Ile Met Glu
530 535 540 Ser Ser Asp Arg Gln Leu Thr Leu Asn Glu Ile Tyr Ser Trp Phe Thr 545 550 555 560 Arg Thr Phe Ala Tyr Phe Arg Arg Asn Ala Ala Thr Trp Lys Asn Ala
565 570 575 Val Arg His Asn Leu Ser Leu His Lys Cys Phe Val Arg Val Glu Asn
580 585 590 Val Lys Gly Ala Val Trp Thr Val Asp Glu Val Glu Tyr Gln Lys Arg
595 600 605 Arg Ser Gln Lys Ile Thr Gly Ser Pro Thr Leu Val Lys Asn Ile Pro
610 615 620 Thr Ser Leu Gly Tyr Gly Ala Ala Leu Asn Ala Ser Leu Gln Ala Ala 625 630 635 640 Leu Ala Glu Ser Ser Leu Pro Leu Leu Ser Asn Pro Gly Leu Ile Asn
645 650 655 Asn Ala Ser Ser Gly Leu Leu Gln Ala Val His Glu Asp Leu Asn Gly
660 665 670 Ser Leu Asp His Ile Asp Ser Asn Gly Asn Ser Ser Pro Gly Cys Ser
675 680 685 Pro Gln Pro His Ile His Ser Ile His Val Lys Glu Glu Pro Val Ile
690 695 700 Ala Glu Asp Glu Asp Cys Pro Met Ser Leu Val Thr Thr Ala Asn His 705 710 715 720 Ser Pro Glu Leu Glu Asp Asp Arg Glu Ile Glu Glu Glu Pro Leu Ser
725 730 735 Glu Asp Leu Glu
740