首页 / 专利库 / 动物学 / 节肢动物 / 昆虫中利用可变剪接的基因表达系统

昆虫中利用可变剪接的基因表达系统

阅读:437发布:2020-12-17

专利汇可以提供昆虫中利用可变剪接的基因表达系统专利检索,专利查询,专利分析的服务。并且提供了多核苷酸表达系统,其能够可变剪接多核苷酸序列的RNA转录物,从而在 生物 体中表达。,下面是昆虫中利用可变剪接的基因表达系统专利的具体信息内容。

1.多核苷酸表达系统,其包括:
编码定义在起始密码子和终止密码子之间的功能性蛋白的至少一个 异源多核苷酸序列,和/或干扰RNA(RNAi)的多核苷酸,从而在生物体内 表达;
至少一个与之可操作地连接的启动子;和
至少一个剪接控制序列,其与剪接体合作,能够(i)调节编码序列的 RNA转录物的剪接,从而产生第一剪接的信使RNA(mRNA)产物,和 (ii)调节所述RNA转录物的至少一次可变剪接,从而产生可变剪接的 mRNA产物;
其中,当所述至少一个异源多核苷酸序列编码功能性蛋白时,成熟 mRNA产物中的至少一种包括从所述起始密码子延伸到所述终止密码子 的连续开放阅读框(ORF),由此定义了一种蛋白质,即为所述功能性蛋 白,或通过至少一个基酸的删除与所述功能性蛋白相关,并且其被翻译 后是功能性的,且任选地,经历了翻译后的修饰;
所述调节选自由下列各项组成的组:性别-特异性调节、阶段-特异性 调节、种系-特异性调节、组织-特异性调节,和其组合。
2.按照权利要求1的多核苷酸表达系统,其中调节是性别-特异性的。
3.按照权利要求1或2的多核苷酸表达系统,其中待表达的多核苷酸 序列包括两个或多个关于所述功能性蛋白的编码外显子。
4.按照以上权利要求中任一项的多核苷酸表达系统,其中所述蛋白质 是标记,或具有致死、有害或不育效应。
5.按照权利要求4的多核苷酸表达系统,其中所述蛋白质具有导致不 育化的致死效应。
6.按照权利要求5的多核苷酸表达系统,其中所述蛋白质的致死效应 是条件性可抑制的。
7.按照权利要求4的多核苷酸表达系统,其中所述蛋白质选自由程序 性细胞死亡-诱导因子、Hid、Reaper(Rpr)和Nipp1Dm组成的组。
8.按照以上权利要求中任一项的多核苷酸表达系统,其中所述系统包 括至少一种正向反馈机制,即至少一种待通过可变剪接差异表达的功能性 蛋白,和至少一个与之有关的启动子,其中待表达基因的产物对所述至少 一个启动子起到正向转录控制因子的作用,且由此所述产物,或产物的表 达是可控制的。
9.按照权利要求8的多核苷酸表达系统,其中增强子与所述启动子关 联,所述基因产物通过所述增强子起到增强所述启动子活性的作用。
10.按照权利要求9的多核苷酸表达系统,其中所述控制因子是tTA 基因产物或其类似物,且其中一个或多个tetO操纵基因单位与所述启动子 可操作地连接,并且是通过tetO起增强所述启动子活性作用的增强子、tTA 或其类似物。
11.按照以上权利要求中任一项的多核苷酸表达系统,其中所述功能 性蛋白自身是转录反式激活蛋白,诸如tTAV系统,其包括tTAV、tTAV2或 tTAV3。
12.按照以上权利要求中任一项的多核苷酸表达系统,其中所述启动 子由环境条件或由环境温度改变而激活,其中所述环境条件例如tet系统 中存在或缺乏特殊因子诸如四环素
13.按照权利要求1-11中任一项的多核苷酸表达系统,其中所述启动 子选自由下列各项组成的组:srya胚胎-特异性启动子,或其同源物,果蝇 (Drosophila)基因slow as molasses(slam),或其同源物。
14.按照以上权利要求中任一项的多核苷酸表达系统,其进一步包括 增强子。
15.按照以上权利要求中任一项的多核苷酸表达系统,其中可变剪接 的调节是性别-特异性的且剪接控制序列源自tra内含子。
16.按照权利要求15的多核苷酸表达系统,其中所述剪接控制序列源 自地中海实蝇转换基因Cctra,或来自果蝇转换基因的另一种直向同源物 或同源物。
17.按照权利要求16的多核苷酸表达系统,其中,其中所述果蝇转换 基因的另一种直向同源物或同源物来自tephritid果蝇。
18.按照权利要求17的多核苷酸表达系统,其中,其中所述tephritid 果蝇是纳塔小条实蝇(C.rosa)或桃果实蝇(B.zonata)。
19.按照权利要求1-14中任一项的多核苷酸表达系统,其中所述剪接 控制序列源自Actin-4基因的可变剪接机制。
20.按照权利要求19的多核苷酸表达系统,其中所述Actin-4基因来 自伊蚊属物种(Aedes spp)。
21.按照权利要求19的多核苷酸表达系统,其中所述Actin-4基因来 自埃及伊蚊(Aedes aegypti)AeActin-4。
22.按照权利要求1-14中任一项的多核苷酸表达系统,其中所述剪接 机制包括双性(dsx)基因的至少一个片段,优选地其源自果蝇、家蚕蛾(B. mori)、红铃虫、苹果皮小卷蛾或蚊,具体地冈比亚伊蚊(Aedes gambiae) 或特别地埃及伊蚊(Aedes aegypti)。
23.按照权利要求19-22的多核苷酸表达系统,其中以小基因构建体 或盒外显子的形式提供所述剪接控制序列,编码定义在起始密码子和终止 密码子之间的功能性蛋白的异源多核苷酸序列,和/或干扰RNA(RNAi) 的多核苷酸,从而在生物体中表达。
24.按照权利要求4的多核苷酸表达系统,其中所述系统是质粒或构 建体,其选自由图16-18,22-24,26-32,49,52-55和61-69,和/或SEQ ID NOs 46-48,50-56,143-145和151-162中任一项组成的组。
25.按照以上权利要求中任一项的多核苷酸表达系统,其中所述至少 一个剪接控制序列是内含子的,且在RNA中,在其5’末端包含嘌呤(G) 核苷酸。
26.按照以上权利要求中任一项的多核苷酸表达系统,其中所述至少 一个剪接控制序列是内含子的,且在RNA中,在其5’末端包括UG核苷 酸并在其3’末端包括UT。
27.按照以上权利要求中任一项的多核苷酸表达系统,其中所述调节 是性别-特异性的,且进一步受到TRA蛋白或TRA/TRA2蛋白复合物,或 其同源物的结合的调节或控制。
28.按照权利要求27的多核苷酸表达系统,其中所述系统包括共有序 列:TCWWCRATCAACA,其中W=A或T且R=A或G。
29.按照以上权利要求中任一项的多核苷酸表达系统,其中所述生物 体是哺乳动物、鱼、无脊椎动物节肢动物、昆虫或植物
30.按照以上权利要求中任一项的多核苷酸表达系统,其中所述生物 体是来自双翅目种类的昆虫。
31.按照权利要求30的多核苷酸表达系统,其中所述昆虫是tephritid 果蝇,其选自由下列各项组成的组:地中海实蝇(地中海实蝇(Ceratitis capitata)),墨西哥按实蝇(墨西哥按实蝇(Anastrepha ludens)),橘果实蝇(橘 果实蝇(Bactrocera dorsalis)),油橄榄果实蝇(油橄榄果实蝇(Bactrocera oleae)),瓜实蝇(瓜实蝇(Bactrocera cucurbitae)),纳塔耳小条实蝇(纳 塔耳小条实蝇(Ceratitis rosa)),樱桃绕实蝇(樱桃绕实蝇(Rhagoletis cerasi)),昆士兰果实蝇(昆士兰果实蝇(Bactrocera tyroni)),桃果实蝇(桃 果实蝇(Bactrocera zonata)),加勒比按实蝇(加勒比按实蝇(Anastrepha suspensa))和西印度按实蝇(西印度按实蝇(Anastrepha obliqua))。
32.按照权利要求30的多核苷酸表达系统,其中所述昆虫是来自黄热 蚊属(Stegomyia)、伊蚊属(Aedes)、按蚊属(Anopheles)或库蚊属(Culex)的蚊。
33.按照权利要求32的多核苷酸表达系统,其中所述蚊选自:埃及伊 蚊、白纹伊蚊(Aedes albopictus),斯氏按蚊(Anopheles stephensi),白端 按蚊(Anopheles albimanus)和冈比亚按蚊(Anopheles gambiae)。
34.按照权利要求30的多核苷酸表达系统,其中所述昆虫选自由下列 各项组成的组:新大陆螺旋蝇蛆(New world screwworm)(嗜人锥蝇 (Cochliomyia hominivorax)),蛆症金蝇(Old world screwworm)(蛆症金蝇 (Chrysomya bezziana)),澳大利亚绵羊丽蝇(Australian sheep blowfly)( 绿蝇(Lucilia cuprina)),苹果皮小卷蛾(苹果皮小卷蛾(Cydia pomonella)), 蚕(家蚕蛾(Bombyx mori)),棉红铃虫(棉红铃虫(Pectinophora gossypiella)),小菜蛾(小菜蛾(Plutella xylostella)),舞毒蛾(舞毒蛾 (Lymantria dispar)),脐橙虫(Navel Orange Worm)(Amyelois transitella),桃 芽蛾(Peach Twig Borer)(桃条麦蛾(Anarsia lineatella))和稻三化螟(rice stem borer)(三化螟(Tryporyza incertulas)),夜蛾(noctuid moths),特别 地实夜蛾亚科(Heliothinae),日本金龟子(日本金龟子(Popilla japonica)), 白缘甲虫(White-fringed beetle)(Graphognatus属物种),棉铃象(Boll weevil) (棉铃象(Anthonomous grandis)),玉米根虫(corn root worm)(Diabrotica 属物种)和科罗拉多铃薯甲虫(Colorado potato beetle)(马铃薯叶甲 (Leptinotarsa decemlineata))。
35.按照权利要求30的多核苷酸表达系统,其中所述昆虫不是果蝇 类。
36.按照以上权利要求中任一项的多核苷酸表达系统,其中所述异源 多核苷酸序列的表达在生物体中引起表型结果。
37.按照权利要求1或2的多核苷酸表达系统,其中所述待表达的多 核苷酸序列包括干扰RNA(RNAi)的多核苷酸。
38.在其自然环境中进行生物体种群控制的方法,其包括:
i)饲养生物体原种,所述生物体携带包含按照权利要求1-36中任一 项的系统的基因表达系统,所述系统是显性致死遗传系统,
ii)将所述原种动物分配到在种群控制场所的环境中;和
iii)通过由后代中致死系统的表达引起的早期阶段致死性实现种群控 制,所述后代由所述原种个体和野生种群的异性个体的杂种繁殖产生。
39.按照权利要求38的方法,其中所述早期阶段致死性是胚胎的或在 性成熟前。
40.按照权利要求39的方法,其中所述早期阶段致死性发生在发育的 早期。
41.按照权利要求38或39的方法,其中所述致死系统的致死效应是 有条件的,且通过致死基因的表达发生在所述自然环境中,所述致死基因 的表达处于可抑制的反式激活蛋白的控制下,所述饲养在这样的物质存在 的许可条件下,所述物质是所述自然环境中缺乏的并能够抑制所述反式激 活蛋白。
42.生物学控制方法,其包括:
i)饲养雄性和雌性生物体原种,所述生物体是在许可的条件下用按照 权利要求1-36中任一项的系统转化的,容许雄性和雌性的生存,以提供双 性别生物学控制媒介物;
ii)任选地,在下一步前,施加或允许限制性条件以引起一种性别的 个体死亡,并由此提供单一性别生物学控制媒介物,其包含携带条件性致 死遗传系统的另一种性别个体;
iii)释放双性别或单性别生物学控制媒介物到生物学控制场所的环境 中;和
iv)通过后代中遗传系统的表达实现生物学控制,所述后代由生物学 控制媒介物个体和野生种群的异性个体的杂种繁殖产生。
43.性别分离方法,其包括:
i)饲养雄性和雌性生物体原种,所述生物体是在许可的或限制性条件 下用按照权利要求1-36中任一项的表达系统转化的,容许雄性和雌性的生 存;和
ii)去除许可的或限制性条件,从而通过致死基因的性别-特异性可变 剪接在一种性别而非另一种性别中诱导致死基因的致死效应。
44.生物学或种群控制方法,其包括:
i)饲养雄性和雌性生物体原种,所述生物体是在许可的或限制性条件 下用按照权利要求1-36中任一项的基因表达系统转化的,容许雄性和雌性 的生存;
ii)去除许可的或限制性条件,从而通过致死基因的性别-特异性可变 剪接在一种性别而非另一种性别中诱导致死基因的致死效应,由此实现性 别分离;
iii)使分离的个体不育化或部分不育化;和
iv)通过分离的不育或部分不育个体向生物体自然环境中的释放来实 现所述控制。

说明书全文

介绍

发明涉及基因表达系统,其与剪接控制序列结合,所述控制序列为 可变剪接提供机制。

可变剪接涉及一个或多个内含子的去除和旁侧外显子的连接。该反应 由剪接体催化,所述剪接体是由5种RNA和数百种蛋白质组成的高分子 机器(Jurica,M.S.& Moore,M.J.(2003)分子细胞(Mol.Cell)12,5-14)。可 变剪接从单基因产生多种mRNA,因此增加蛋白质组的多样性(Graveley,B. R.(2001)遗传学趋势(Trends Genet.)17,100-107)。

可变剪接还在许多发育过程,从性别确定到程序性细胞死亡中的基因 表达调控中具有重要作用(Black,D.L.(2003)生物化学年度综述(Annu. Rev.Biochem.)72,291-336),且已将可变剪接中的缺陷与许多人类病症联 系起来了(Caceres,J.F.& Kornblihtt,A.R.(2002)遗传学趋势(Trends Genet.)18,186-193)。通常,可变剪接受到这样的蛋白质的调控,所述蛋 白质与前mRNA相关且起到增强或抑制剪接体识别受调控的外显子旁侧 的剪接位点的能(Smith,C.W.& Valcarcel,J.(2000)生物化学科学趋势 (Trends Biochem.Sci.)25,381-388)。

认为每个细胞中成熟RNA包含或排除具体的可变外显子是由许多正 向和负向剪接调节子的相对浓度和这些因子与前mRNA和剪接体成分的 相互作用决定的(Smith,C.W.& Valcarcel,J.(2000)生物化学科学趋势 (Trends Biochem.Sci.)25,381-388)。

剪接体是由核内小RNA和蛋白质微粒(snRNPs)组成的大复合物,所 述snRNP与前mRNA组合从而通过从真核核内RNA中去除内含子完成 RNA剪接,由此生成mRNA,然后在核糖体中该mRNA被翻译为蛋白质。 尽管至少74%的人基因编码可变剪接的mRNA(Johnson,J.M.,Castle,J., Garrett-Engele,P.,Kan,Z.,Loerch,P.M.,Armour C.D.,Santos,R.,Schadt,E. E.,Stoughton,R.& Shoemaker,D.D.(2003)科学(Science)302,2141-2144), 但是识别了相对很少的剪接调节子。

发明概述

因此,在第一方面,本发明提供多核苷酸表达系统,其包括:

至少一个异源多核苷酸序列,其编码定义在起始密码子和终止密码子 之间的功能性蛋白,和/或干扰RNA(RNAi)的多核苷酸,从而在生物体内 表达;

至少一个与之可操作地连接的启动子;和

至少一个剪接控制序列,其与剪接体合作,能够(i)调节编码序列的 RNA转录物的剪接,从而产生第一剪接信使RNA(mRNA)产物,和(ii) 调节所述RNA转录物的至少一次可变剪接,从而产生可变剪接的mRNA 产物;

其中,当所述至少一个异源多核苷酸序列编码功能性蛋白时,成熟 mRNA产物中的至少一种包括从所述起始密码子延伸到所述终止密码子 的连续开放阅读框(ORF),由此定义了一种蛋白质,即为所述功能性蛋 白,或通过至少一个基酸删除与所述功能性蛋白相关,并且其被翻译后 是功能性的,且任选地,经历了翻译后的修饰;

所述调节选自由下列各项组成的组:性别-特异性调节、阶段-特异性 调节、种系-特异性调节、组织-特异性调节,和其组合。

表达系统可以是DNA或RNA或其杂化物或组合。设想该系统既包括 核糖核酸又包括脱核糖核酸,即DNA部分和RNA部分。这些能够对应 于不同的遗传元件,这样该系统是DNA/RNA杂化物,其具有有些由DNA 和其它由RNA提供的功能性元件。

优选地,调节处于性别-特异性、阶段-特异性、种系-特异性或组织- 特异性的方式。具体地,性别-特异性调节是特别优选的。然而,还优选的 是可以使用这四种调节方式的组合。特别优选地,当使用这些方式的组合 时,其包括性别-特异性调节。所述组合的特别优选实例是可变剪接的性别 -特异性、组织-特异性和阶段-特异性调节的组合。

该系统可以适合于基因的表达。优选地,待表达的多核苷酸序列包括 关于蛋白质或多肽的编码序列,即至少一个外显子,和优选地2个或更多 能够编码多肽,诸如蛋白质或其片段的外显子。

应该理解外显子是基因内的DNA的任何区域,其存在于源自该基因 的成熟RNA分子中,而不是从转录的RNA分子中剪接出来的。对于蛋白 质编码基因,成熟RNA分子对应于成熟mRNA分子,其可以编码一种或 多种蛋白质或多肽。许多真核基因的外显子由非编码DNA区段插入。

所述至少一个异源多核苷酸序列可以编码功能性蛋白,所述蛋白质定 义在起始密码子和终止密码子之间,从而在生物体内表达。备选地,或另 外,所述至少一个异源多核苷酸序列编码或包括关于干扰RNA(RNAi) 的多核苷酸,从而在生物体内表达。

在生物体内待表达的这些序列,还可以指这样的序列,其表达在所述 生物体内受到调控。

优选地,待表达的多核苷酸序列包括两个或更多编码外显子,即当从 mRNA翻译时,是编码氨基酸的多核苷酸的区段或序列。优选地,不同的 外显子是区别性剪接在一起的,从而提供可变mRNA。优选地,所述可变 剪接的mRNA具有不同的编码潜力,即编码不同的蛋白质或多肽序列。 因此,编码序列的表达以上述调节方式受到可变剪接的调控。

待表达的多核苷酸序列可以包括关于干扰RNA(RNAi)的多核苷酸。 该序列能够提供,例如,一段或多段双链RNA(dsRNA),优选地处于初 级转录物的形式,其依次能够被RNA Pol III样酶“切酶”处理。所述段 的序列包括,例如,能够形成环的单链RNA段,诸如短发夹RNA(shRNA) 中发现的那些,或具有较长的基本自互补区域的那些。

因此,如上所述,当系统是DNA时,关于干扰RNA的多核苷酸是脱 氧核糖核酸,当转录为前RNA核糖核酸时,提供一段dsRNA。

定位所述多核苷酸,从而最小化与可变剪接的干扰时,关于干扰 RNA的多核苷酸是特别优选的。这可以通过从可变剪接控制序列的远侧 定位这些多核苷酸而实现,优选地,在控制序列的3’。在另一个优选的实 施方案中,基本自互补的区域可以通过一个或多个调节可变剪接的剪接控 制序列,诸如内含子彼此分开。优选地,如别处定义地,将自互补区域安 排为一系列两个或多个反向重复,每个反向重复由剪接控制序列,优选地 内含子分开。

在该构造中,不同的可变剪接的转录物可以具有它们的基本自互补区 域,所述区域由成熟(可变剪接后的)转录物中不同长度的非自互补序列 分开。应该理解基本自互补区域是能够形成发夹的那些,例如,作为能够 与序列的其他部分配对的序列的部分。这两部分不必须完全彼此互 补,因为每个部分中可以存在一些错配或允许不彼此碱基配对的一段序 列。该段序列在其他部分可能不具有等价物,因此失去对称性并形成“凸 起”,正如通常对碱基配对互补所已知的。

在另一个优选的实施方案中,相对于至少一个剪接控制序列,定位一 个或多个与初级转录物另一部分基本互补的序列区段,从而使它不包括在 由初级转录物的可变剪接产生的全部转录物中。通过该方法,产生了一些 倾向于产生dsRNA的转录物,而其他不倾向于产生dsRNA的转录物;通 过可变剪接的调节,例如,性别-特异性调节、阶段-特异性调节、种系-特 异性调节、组织-特异性调节和其组合,可以以性别-特异性、阶段-特异性、 种系-特异性或组织-特异性方式,或其组合制备dsRNA。

该系统优选地能够表达至少一种目的蛋白质,即所述在生物体内待表 达的功能性蛋白。所述至少一种目的蛋白质可以具有治疗效应或可以,优 选地是标记,例如DsRed,绿色荧光蛋白(GFP)或其一种或多种突变体 或变体,或本领域中熟知的其他标记。

最优选地,在生物体内待表达的功能性蛋白具有致死、有害或不育效 应。当在本文中提及致死效应时,应该理解这延伸到有害或不育化效应, 诸如能够杀死生物体自身或其后代,或能够降低或破坏其某些组织的功能 的效应,在所述某些组织中,生殖组织是特别优选的,从而使该生物体或 其后代是不育的。因此,一些致死效应,诸如毒素,会在与它们寿命相比 的短期限内杀死生物体或组织,而其他的致死效应可以简单地降低生物体 发挥功能的能力,例如生殖的能力。

导致不育的致死效应是特别优选的,因为这容许该生物体在自然环境 (“在野外”)中与野生型生物体竞争,但是不育的昆虫不能再产生能生育 的后代。以这种方法,本发明在昆虫中获得了与诸如不育昆虫技术(SIT) 相似的结果,且不存在与SIT相关的问题,诸如成本、对使用者的危险和 受辐射生物体降低的竞争性。

优选地,系统包括至少一种正向反馈机制,即至少一种待通过可变剪 接差异表达的功能性蛋白,和至少一个与之有关的启动子,其中待表达基 因的产物起到对所述至少一个启动子的阳性转录控制因子的作用,且由此 该产物,或产物的表达是可控制的。优选地,增强子与启动子相关,基因 产物通过增强子起到增强启动子活性的作用。优选地,控制因子是tTA基 因产物或其类似物,且其中一个或多个tetO操纵基因单位与启动子可操作 地连接,并且是通过tetO起增强启动子活性作用的增强子、tTA或其类似 物。优选地,功能性蛋白编码tTAV或tTAF产物,且优选地,启动子在缺 乏阳性转录控制因子时基本失活。对于该系统合适的和优选地最小启动子 可以选自:hsp70、P最小启动子、CMV最小启动子、基于Act5C的最小 启动子、BmA3启动子片段、来自果蝇的启动子片段、Adh核心启动子和 Act5C最小启动子,或其组合。

在一个实施方案中,优选地,功能性蛋白是程序性细胞死亡-诱导因子, 诸如例如Cande等(细胞科学杂志(Journal of Cell Science)115,4727-4734 (2002))中所述的AIF蛋白或其同源物。在哺乳动物和甚至无脊椎动物,包 括昆虫、线虫真菌植物中发现了AIF同源物,这意味着AIF基因在真 核界完全是保守的。还优选的是Hid,即黑腹果蝇(Drosophila melanogaster) 的头部内卷缺陷(head involution defective)基因的蛋白质产物,或Reaper (Rpr),即果蝇(Drosophila)reaper基因的产物,或其突变物。由Heinrich 和Scott描述了Hid的用途(美国国家科学院学报(Proc.Natl Acad.Sci USA) 97,8229-8232(2000)。由Horn和Wimmer描述了突变衍生物HidAla5的用 途(自然生物技术(Nature Biotechnology)21,64-70(2003))。本文中描述了突 变衍生物Rpr,RprKR的用途(也见于White等,1996,Wing等,2001,和Olson 等,2003)。RPr和Hid是促-凋亡蛋白,认为其结合于IAP1。IAP1是充分 保守的抗-凋亡蛋白。因此,预期Hid和Rpr横跨广泛的系统发育范围(Huang 等,2002,Vernooy等,2000)起作用,尽管它们的自身序列不是充分保守的。

还优选的是Nipp1Dm,即哺乳动物Nipp1的果蝇同源物(Parker等, 生物化学杂志(Biochemical Journal)368,789-797(2002);Bennett等,遗传学 (Genetics)164,235-245(2003))。如技术人员应该理解地,Nipp1Dm是如果 以合适平表达,则具有致死效应的蛋白质的另一个实例。当然,具有致 死效应的蛋白质的许多其他实例应该是本领域技术人员已知的。

功能性蛋白自身还优选地是转录反式激活蛋白,诸如上述tTAV系统。

优选地,启动子能够通过环境条件,例如特殊因子诸如四环素在本文 所述的tet系统中的存在或缺乏而获得,从而使技术人员能够简便地操作 目的基因的表达。备选地,合适启动子的优选实例是hsp70热激启动子, 其容许使用者通过改变环境温度,例如将宿主暴露在实验室中或野外,控 制表达。温度控制的另一个优选的实例记述在Fryxell和Miller(经济昆虫 学杂志(Journal of Economic Entomology)88,1221-1232(1995))中。

作为启动子还优选的是来自黑腹果蝇的srya胚胎-特异性启动子(Horn & Wimmer(2003),或其同源物,或来自其他胚胎-特异性或胚胎-活性基因 的启动子,诸如果蝇基因slow as molasses(slam)的启动子,或其来自其他 物种的同源物。

还优选地,系统包括用于控制表达的其他上游5’因子和/或下游3’因 子。实例包括增强子,诸如来自果蝇卵黄蛋白基因的脂肪体增强子和来自 杆状病毒,例如AcMNPV的同源区域(hr)增强子。还应该理解RNA产 物应该包括例如,合适的5’和3’UTR。

除基因的启动子和/或增强子外,剪接控制序列容许额外水平的蛋白质 表达控制。例如,通过常规方法,仅是昆虫胚胎中的组织或性别-特异性表 达就极其困难。即使在果蝇中,尚不知具有该特异性的启动子。然而,利 用按照本发明的组合控制,胚胎-特异性启动子,例如srya,能够与合适的 可变剪接系统相结合。

优选地,设想了启动子和可变剪接机制的任意组合。启动子优选地特 异于具有短时间或限制的空间效应,例如细胞自主效应的特殊蛋白质。

备选地,优选地,启动子可以特异于更宽种类的蛋白质或具有长期和 /或广系统效应的特异性蛋白质,诸如激素、阳性或阴性生长因子、形态发 生素或其他分泌的或细胞表面信号传导分子。这应该容许,例如,更广的 表达模式,从而使形态发生素启动子与阶段-特异性可变剪接机制的组合能 够导致形态发生素仅在到达某一生命周期阶段时才表达,但是形态发生素 的效应在超出该生命周期阶段时应该仍然是明显的(即,形态发生素仍然 能够起作用并具有效应)。优选的实例应该是形态发生素/信号传导分子 Hedgehog,Wingless/WNTs,TGFβ/BMPs,EGF及其同源物,它们是众所周 知的进化-保守的信号传导分子。

还设想了由一定范围的蛋白质因子,例如反式激活蛋白,或具有广阔 系统效应,诸如激素或形态发生素,激活的启动子能够用在与可变剪接机 制的组合中,从而完成组织和性别-特异性控制或性别和阶段-特异性控制, 或阶段-、组织、种系-和性别-特异性控制的其他组合。

还设想了多于一个启动子,和任选地对其的增强子,能够用在本系统 中,作为用于起始相同蛋白质转录的选择性方法或因为该遗传系统包括多 于一个基因表达系统(即,多于一个基因及其相伴的启动子)的事实。

在另一方面,本发明提供转化方法,其包括表达两种或更多通过可变 剪接源自单初级转录物,或基本相似的初级转录物的RNA分子,所述两 种或更多RNA分子优选地在生物体内通过使生物体与表达系统接触编码 不同的蛋白质或多肽,并优选地诱导表达系统的表达。基因系统的诱导或 转化的方法以及表达的诱导在关于相应生物体的领域中是众所周知的。

还提供了转化本系统的生物体(即,转化体)。

当提及具体核苷酸或蛋白质序列时,应该理解这包括提及具有与其基 本等价生物活性的任何突变体或变体。优选地,突变体或变体具有与参照 序列至少85%,优选地至少90%,优选地至少95%,优选地至少99%,优 选地至少99.9%,和最优选地至少99.99%的序列同一性。

所提供的序列能够耐受一些序列变异,并仍然正确地剪接。存在一些 已知是重要的核苷酸。这些是所有剪接所需要的核苷酸,例如,如下图34 中所示。内含子的起始GU和终止AG是特别重要的并因此是优选的,如 别处讨论地,尽管~5%的内含子起始于GC。这种共有序列是优选的,尽 管其适用于所有剪接,而非特异于可变剪接。在图34中,Pu=A或G;Py =C或U。

优选地,系统是或包括质粒。如上所提及地,这可以是DNA、RNA 或二者的混合物。如果该系统包括RNA,则其对于通过反转录酶的方法 将RNA反向翻译为DNA是优选的。如果需要反转录,则该系统还可以包 括对RT蛋白的编码序列和对其合适的启动子。备选地,因此可以在单独 的系统,如病毒中提供RT酶(RTase)和启动子。在这种情形中,该系统应 该仅在用那种病毒感染后才被活化。对包括对反转录酶合适的顺式-作用序 列或RNA-依赖性RNA聚合酶的需要对本领域技术人员而言是显而易见 的。

然而,特别优选地,系统主要是DNA,且更优选地,仅由DNA组成, 至少关于在生物体内待表达的序列。

当在一些实施方案中,至少一个在生物体内待表达的异源多核苷酸序 列是干扰RNA(RNAi)的多核苷酸序列时,特别优选地,它是能够编码 功能性蛋白的多核苷酸序列。描述应该主要集中在编码功能性蛋白的多核 苷酸序列上,但是应该理解这也指干扰RNA(RNAi)的多核苷酸,除非 另外显而易见的。

应该理解对起始和终止密码子进行了参考,在所述起始和终止密码子 之间定义了在生物体内待表达的多核苷酸序列,但是这不排除至少一个剪 接控制序列,其元件,或其他序列,诸如内含子在该区域中的定位。实际 上,从本发明说明书中显而易见的是,在一些实施方案中,能够将剪接控 制序列定位在该区域中。

此外,剪接控制序列,例如能够与起始密码子重叠,至少在一些实施 方案中,ATG的G可以是剪接控制序列的起始5’G。因此,可以认为术语 “在......之间”指从起始密码子的开始(起始核苷酸的3’,即A),优选 地起始密码子的第二核苷酸的3’(即,T),直到终止密码子的第一核苷酸 的5’侧。备选地,如通过简单阅读多核苷酸序列而应该显而易见地,还可 以包括终止密码子。

所述至少一个在生物体内待表达的异源多核苷酸序列是异源序列。所 谓“异源”,应该理解这指这样的序列,其处于野生型时,通常不会发现 与至少一个剪接控制序列的至少一个元件或成分关联或连接。例如,当剪 接控制序列源自具体的生物体,且异源多核苷酸是蛋白质或多肽的编码序 列,即是编码功能性蛋白的多核苷酸序列时,则该编码序列能够,部分地 或完整地,源自来自相同生物体的基因,只要该转录多核苷酸序列的至少 一些部分的来源与至少一个剪接控制序列的来源不同。备选地,该编码序 列能够来自不同的生物体,且在本上下文中,可以认为是“外源的”。还 可以认为该异源多核苷酸是“重组体”,因为蛋白质或多肽的编码序列源 自不同位置,即在相同基因组内(即单物种或亚种的基因组)或来自不同 的基因组(即来自不同物种或亚种的基因组)。

异源可以指除剪接控制序列外的序列,且可以因此涉及启动子和其他 序列诸如5’UTR和/或3’UTR可以异源于在生物体内待表达的多核苷酸序 列的事实,只要所述多核苷酸序列处于野生型,即所述多核苷酸序列的自 然背景时,若有的话,不被发现与启动子、5’UTR和/或3’UTR关联或可 操作地连接。

应该理解异源还适用于“设计的”或杂合序列,其不来源于特定生物 体但基于许多来自不同生物体的成分,因为这也会满足序列和剪接控制序 列的至少一个成分不在野生型中连接或在其中关联的要求,即使发现杂合 序列的一个部分或元件如此,只要至少一个部分或元件不是这样。优选地, 杂合序列的至少50个核苷酸的一部分不与剪接控制序列的至少一个成分 关联,更优选地200个核苷酸和最优选地500个核苷酸如此。

还应该理解设想了天然存在的序列的合成形式。也认为该合成序列是 异源的,除非它们是与这样的序列相同的序列,所述这样的序列处于野生 型或自然背景时,通常关联于,或连接于,至少一个剪接控制序列的至少 一个元件或成分。

这同等地适用于当异源多核苷酸是干扰RNA的多核苷酸的情形。

在一个实施方案中,当待表达的多核苷酸序列包括蛋白质或多肽的编 码序列时,应该理解在生物体内表达指提供一种或多种转录RNA序列, 优选地成熟mRNA,但是这还可以,优选地,指在所述生物体内翻译的多 肽。

RT-PCR,其证明转录物,而非蛋白质的存在,可以用于识别转录的 RNA序列。由于RNAi、翻译后修饰或旋扭的折叠,当蛋白质自身没有被 翻译,或不是功能性的或不能由针对天然存在或野生型蛋白质激发的抗体 所识别时,这也是特别有效的。

在另一个实施方案中,当待表达的多核苷酸序列包括干扰RNA的多 核苷酸时,也应该理解在生物体内的表达涉及在RNAi途径中,干扰RNA 的多核苷酸或其转录物的相互作用,例如通过结合切酶或形成小干扰RNA (siRNA)。实际上,特别优选地,干扰RNA的多核苷酸包括siRNA序列, 且因此优选地20-25个核苷酸长,特别是当生物体是哺乳动物时。

特别地,在昆虫和线虫中,优选地,例如通过发夹的形成,提供dsRNA 的一部分,然后可由切酶系统对其进行处理。哺乳动物细胞通常产生针对 长dsRNA序列的干扰素反应,因此对于哺乳动物细胞,更普遍的是提供 较短的序列,诸如siRNA。按照本发明的一个实施方案,还将反义序列或 具有与微小RNA同源性的序列设想为RNAi的序列,所述微小RNA是天 然存在的靶向蛋白质3’UTR的RNA分子。

系统中每个剪接控制序列包括至少一个剪接接纳体位点和至少一个 剪接供体位点。供体和接纳体位点的数量可以变化,其取决于待一起剪接 的序列的区段数量。优选地,分支位点包括在每个剪接控制序列中。分支 位点是剪接供体最初与之结合的序列,见图32,其显示剪接以两个阶段发 生,其中分离5’外显子并再与3’外显子连接。

参考所述图,A是仅有的基本核苷酸,且因此,优选地被包括在内。 在没有理论束缚的前提下,认为前mRNA剪接通过套索中间体进行,正 如其在组II自-剪接中的情形。首先,裂解发生在5’接点——有时称为剪 接供体位点。内含子5’末端的磷酸接着与腺嘌呤的2’OH连接,所述腺嘌 呤在内含子3’末端上游的25个核苷酸处,其有时称为接纳体位点。该A 残基称为分支点。下一步是在3’剪接接点处发生裂解,并且下游外显子的 5’磷酸与上游外显子的3’OH相连接。

特别优选地,可变剪接的方式或机制是性别-特异的。优选地,剪接控 制序列源自tra内含子。然而,特别优选地,可变剪接机制源自地中海实 蝇(Medfly)转换基因Cctra,或来自果蝇转换基因的另一种直向同源物 或同源物,优选地来自纳塔小条实蝇(C.rosa)或桃果实蝇(B.zonata), 特别是来自tephritid果蝇的那些。

还优选地,剪接控制序列源自Actin-4基因可变剪接机制,具体地, 来自伊蚊物种(Aedes spp.)和最优选地来自AaActin-4,其为来自表现出 组织、阶段和性别-特异性剪接的伊蚊/埃及黄热蚊(Stegomyia aegypti)的 基因。

优选地,可变剪接,特别地通过Actin-4的调节,可以添加序列,所 述序列影响例如,RNA翻译或稳定性

还优选地,剪接机制包括双性(doublesex,dsx)基因的至少一个片段, 优选地其源自果蝇、家蚕蛾(B.mori)、红铃虫(Pink Boll Worm)、苹果 皮小卷蛾(Codling Moth)或蚊,具体地冈比亚伊蚊(A.gambiae)或特别 地埃及伊蚊(A.aegypti)。

优选地,以小基因构建体或盒外显子的形式提供剪接控制序列,编码 定义在起始密码子和终止密码子之间的功能性蛋白的异源多核苷酸,和/ 或干扰RNA(RNAi)的多核苷酸,以在生物体中表达。

特别优选地,当剪接控制序列源自dsx(优选地,如实施例中所述并 如SEQ ID NO.149中所代表的小基因1(外显子存在于SEQ ID NO.149 的位置1-135,1311-2446和3900-4389),其包含在构建体LA3491中)或 Actin-4。

实施例中提供了本发明特别优选的实例,且可以选自由质粒或构建体 组成的组,具体地,按照图19-31中任一图的任意的那些,特别是图16-18, 22-24,26-32,49,52-55和61-69中所示的任何质粒,和/或SEQ ID NOs 46-48,50-56,143-145和151-162。

优选地,生物体中待表达的功能性蛋白是tTAV,tTAV2或tTAV3。

结合所述功能性蛋白,优选地如别处所讨论的致死基因,设想了或进 行设想了生物体中待表达的其他蛋白质。

还可以认为连续的ORF是不间断的ORF,即成熟mRNA中的多核苷 酸序列,其不包括非编码核苷酸,例如具有被翻译为氨基酸的潜力的那些。 在该定义中,优选地不包括终止密码子。

在一些实施方案中,至少一个剪接控制序列通过内含子和外显子核苷 酸调控可变剪接。然而,在一个实施方案中,特别优选地,至少一个剪接 控制序列是内含子剪接控制序列。换言之,优选地,至少一个剪接控制序 列基本源自形成部分内含子并因此通过剪接从初级转录物中切除出来的 多核苷酸,这样这些核苷酸不保持在成熟mRNA序列中。

因此,内含子序列可以被认为是与“外显子”序列截然不同的,所述 “外显子”序列保持在处理的(剪接后的)RNA分子中。当处理的RNA 分子编码蛋白质或多肽序列,且能够被翻译,即具有正确的结构和修饰诸 如,例如帽和多聚腺苷化信号时,其被认为是成熟或处理的mRNA,接着 外显子序列中的一些当翻译时编码氨基酸。

应该理解在可变剪接中,在一些情况下(即,在一些可变剪接变体中), 序列可以是内含子的,但是在另一些情况下(即,在其他变体中),所述 序列是外显子的。因此,本发明的至少一个剪接控制序列优选地基本源自 这样的多核苷酸,所述多核苷酸在至少一种可变剪接变体,即在第一剪接 的mRNA产物或至少一种可变剪接的mRNA产物中形成内含子的部分。 因此,内含子或内含子的序列能够视为以至少一种转录物或转录物类型中 剪接出。

例如,考虑来自地中海实蝇(C.capitata)的tra内含子(Cctra内含子), 其为按照本发明的至少一个剪接控制序列的特别优选实例。按照Pane等 的图2A,如图33所重现地,强调的全部8个推定的Tra/Tra2结合位点在 它们位于转录物F1中剪接出的序列部分中的情况下,是内含子序列,但 是在另一方面,在它们位于包含或保持在转录物M1或M2或二者中的外 显子中的情况下,8个中的6个是外显子的。因此,这些Tra/Tra2结合位 点在它们能够控制可变剪接的这种情况下,是内含子的,但是被剪接出, 即不存在于至少一种可变剪接变体中,即以备选的方式从前-RNA中剪接 出的至少一种mRNA。

在“正常的”(非-可变的)剪接中和在可变剪接中,通常从前-RNA 去除内含子,从而形成剪接的mRNA,其然后可以被翻译为多肽,诸如具 有氨基酸序列的蛋白质或蛋白质片段。因此,如何确定本系统的被认为是 内含子而非外显子的那些序列对于技术人员容易是显而易见的。

当然容易意识到实际上仅翻译mRNA的部分,即典型地在起始密码子 和终止密码子之间的部分,尽管应该理解有时存在多个起始和终止。因此, 当本文提及mRNA序列的翻译时,应该意识到这涉及起始于起始密码子 第一核苷酸和终止于终止密码子的开始前的最后一个核苷酸之后的部分 的翻译,可将其认为是编码部分。

如上所提及地,外显子序列可以涉及可变剪接控制的调节,但是优选 地,至少一些内含子控制序列涉及可变剪接的调节。换言之,本发明的基 因表达系统还可以包括外显子中存在的剪接控制序列,只要存在一些内含 子涉及的控制。这些的特别优选实例是源自dsx基因或含有dsx基因元件 的剪接控制序列,当不被理论束缚时,认为外显子序列参与可变剪接机制。

因此,在一些实施方案中,至少一个剪接控制序列不包括外显子序列, 且应该理解由用于描述本发明的定义对其进行了设想。因此,应该显而易 见地,一些核苷酸可能包含在至少一个剪接控制序列的定义中,且也包含 在编码功能性蛋白的多核苷酸序列的定义中。换言之,这些元件的定义可 以重叠,因此某些核苷酸可以由多于一种元件的定义所涵盖。

然而,技术人员应该承认这在分子生物学中不罕见,因为核苷酸通常 能够具有多于一种作用。例如,在本发明中,核苷酸能够形成功能性蛋白 的编码序列的一部分,但也能够形成由剪接因子识别和结合的序列的一部 分,如别处所讨论地,所述剪接因子的实例是TRA蛋白或TRA/TRA复合 物。这并不罕见,因为,例如,当多核苷酸的相同序列片段能够编码两种 或甚至三种不同的蛋白质,每种以不同的框阅读时,一些病毒具有高度浓 缩的基因组。

当然,还可能是剪接控制序列或序列完全是内含子的,即无外显子影 响。实际上,这是特别优选的。

在一些实施方案中,优选地,所述至少一个剪接控制序列能够通过剪 接,从前-RNA中去除。优选地,所述至少一个剪接控制序列在至少一个 剪接变体中不导致移码。优选地,这是编码全长功能性蛋白的剪接变体。 换言之,至少所述一个剪接控制序列优选地不调节核苷酸的去除,所述核 苷酸形成部分,或意欲形成部分生物体内待表达的编码功能性蛋白的多核 苷酸序列,其被定义在起始密码子和终止密码子之间,和/或干扰RNA (RNAi)的多核苷酸。由此意指在至少一个剪接变体中,通过剪接切除 的核苷酸不是在蛋白质或基因的野生型中编码氨基酸的核苷酸。一种或多 种剪接变体可以含有被切除的核苷酸,但是至少一种变体必须保持这些核 苷酸,这样在至少一种变体中不诱导移码。这些去除的核苷酸是除正常剪 接出的序列,如内含子之外被去除的那些。

然而,考虑到上文,还设想不同的剪接变体可以引起以不同框阅读的 相同序列。

所述至少一个剪接控制序列与细胞剪接系统,例如剪接体的相互作用 导致或调节一系列优选地,至少50个来自初级转录物的连续核苷酸的去 除并与初级转录物中不连续的核苷酸序列(因为它们,或如果考虑反义序 列则它们的补体,在原始模板序列中是不连续的,初级转录物由所述原始 模板序列转录而来)连接(剪接)在一起。所述至少50个连续核苷酸的 系列包括内含子。该调节优选地,以性别-特异的、阶段-特异的、种系-特 异的或组织-特异的方式,或其组合起作用,从而使不同性别、阶段、组织 类型等中的等价初级转录物倾向于去除不同尺寸或序列的内含子,或在一 些情形中,可以在一种情形中而非另一种情形中去除内含子。这种现象, 即在不同情况中不同尺寸或序列的内含子的去除,或在不同情况中给定尺 寸或序列的内含子的区别性去除,称为可变剪接。可变剪接是自然界中众 所周知的现象,且已知许多实例,见上。

在一些优选的实施方案中,所述一个剪接控制序列与异源开放阅读框 关联,这样在至少一个剪接变体中,异源开放阅读框例如通过终止密码子 或移码破坏,而在至少一个可变剪接变体中,异源开放阅读框不破坏。第 二种类型的转录物编码或潜在地编码功能性蛋白,反之,第一种类型的那 些编码具有与第二种类型的那些相比改变的、破坏的或甚至无功能、活性 或稳定性的蛋白质。

一般地,对本领域技术人员显而易见地,异源开放阅读框自身可能是 来自不同来源的序列的组合或融合。产生功能性蛋白的剪接仍然可以产生 与原型异源开放阅读框相比改变的蛋白质,例如,如果插入的可变剪接的 内含子包括在全部可变剪接形式中都是外显子,且因此保持在第二种类型 的成熟mRNA中的序列。然而,特别优选地,至少一种转录物去除全部, 或基本全部插入的可变剪接的序列,这样将异源开放阅读框恢复,或基本 恢复到完整形式,其几乎没有或没有与在成熟mRNA中保持的内含子内 源关联的序列。本文中与异源对照使用内源,因此应该理解这指这样的序 列,所述这样的序列在处于野生型时,通常应该发现其关联于,或连接于, 所述至少一个剪接控制序列的至少一个元件或成分。

备选地,一种或多种转录物可以去除另外的核苷酸,从而使异源开放 阅读框破坏,所述破坏不是通过额外核苷酸(例如终止密码子或移码,还 有破坏该功能的潜在编码序列)的插入,而是通过从异源开放阅读框中删 除核苷酸,例如以如用于诱导移码一样的方法进行的。一种或多种剪接变 体可以具有所述切除的核苷酸,但是至少一种变体必须保持这些核苷酸, 从而使在至少一种变体中不诱导移码。这些去除的核苷酸是除了通常被剪 接出的序列,诸如内含子之外被去除的那些,其中可以认为内含子序列是 在所述天然类似物的至少一种可变剪接变体中形成内含子部分的序列。

当要去除外显子核苷酸时,如果需要避免移码,则这些必须以三的倍 数去除,但是如果需要诱导移码,则以单核苷酸或二的倍数(不同时是三 的倍数)去除。应该意识到如果仅去除一个或某几个二的倍数个核苷酸, 则这能够导致完全不同的在mRNA剪接接点处或周围编码的蛋白质序列。

这是所述系统实施方案的具体情形,其中盒外显子用于在一些剪接变 体但非其他中,诸如在,例如,tra,特别是Cctra中,中断开放阅读框。

在本发明的另一个优选实施方案中,全部或部分开放阅读框在盒外显 子上,例如,用例如盒外显子上的tTAV编码区域提供一些源自伊蚊的Dsx 实施方案,所述盒外显子仅出现在雌性-特异性剪接变体中。

当可变剪接的调节是性别-特异性的情形,优选地,编码在生物体内待 表达的功能性蛋白的剪接变体是F1剪接变体,即仅或主要存在于雌性中 的剪接变体,且优选地是雌性中存在的最丰富的变体,尽管这不是必须的。 相对于其中全部或部分功能性开放阅读框在盒外显子上的构造,优选地该 盒外显子包含在仅或主要存在于雌性中的转录物中,且优选地所述转录物 是,单独地或组合地,雌性中存在的最丰富的变体,尽管这不是必须的。

在一个优选的实施方案中,序列包含在源自天然存在的内含子序列的 杂合或重组序列或构建体中,所述天然存在的内含子序列自身在其天然或 原始背景中进行可变剪接。因此,可以将内含子序列认为是在天然类似物 的至少一种可变剪接变体中形成内含子部分的序列。因此,预想了对应于 天然存在内含子序列的单连续片段,以及所述序列的杂合,包括来自两种 不同的天然存在的内含子序列的杂合,还有相对于天然存在内含子序列单 连续片段具有删除或插入的序列,和它们的杂合。在本发明中,所述来自 天然存在的内含子序列的序列可以本身与非它们本身的部分任意天然存 在的内含子关联。如果转录所述序列,且所述序列优选地保持在至少一种 剪接变体的成熟RNA中,则可以认为它们是外显子的。

还应该意识到提及“移码”还可以指终止密码子的直接编码,这还可 能引起非功能蛋白质,所述非功能蛋白质应该是由核苷酸插入或删除引起 的剪接的mRNA序列的破坏。除产生其中一种或多种不具有预知或可辨 别的功能的两种或多种不同蛋白质或多肽序列以外,还预想了来自两种或 多种不同功能的不同蛋白质或多肽序列的不同剪接变体的产生。还预想了 来自两种或多种相似功能,但以亚细胞位置、稳定性或结合或关联其他蛋 白质或核酸的能力区别的不同蛋白质或多肽序列的不同剪接变体的产生。

优选地,所述至少一个剪接控制序列是内含子的,且在其5’末端包括 嘌呤(G)核苷酸。换言之,剪接控制序列的5’核苷酸,剪接供体位点 的3’,及优选地在外显子与剪接控制序列的分界处或接点处,在前-RNA 中,是鸟嘌呤(G),或者在与其对应的反义DNA序列中是C。

此外,相邻的核苷酸(所述G的3’)优选地,在前-RNA中是胞嘧啶 (C),或者在DNA序列中是对应的G,但是最优选地,在前-RNA中是 尿嘧啶(U),或在DNA反义序列中是相应的A。因此,优选地,剪接控 制序列的两个5’核苷酸是关于DNA有义链的5’GT,在初级转录物中的 5’-GU。

优选地,至少一个内含子的剪接控制序列在其3’末端还包括3’鸟嘌呤 核苷酸,和优选地在剪接接纳体位点与外显子的接点处的AG-3’,例如, 见图34。

优选地,系统中剪接供体位点5’的旁侧序列包括5’-TG,从而可将该 序列表示为5’-TG-*-剪接控制序列-**-3’,其中*表示剪接供体位点和** 表示剪接接纳体位点。

优选地,剪接控制序列在其3’侧还侧连于G核苷酸,且最优选地侧连 于GT核苷酸,这样可将该序列表示为:5'-TG-*-剪接控制序列-**-GT-3'。 应该理解这是有义链DNA序列(TG)。因此,转录的前-RNA应该阅读 UG,例如,当U代替T时。

还设想了具有相同功能的鸟嘌呤或胸腺嘧啶的衍生物。

特别优选地,剪接是性别-特异性的,且受到TRA蛋白或TRA/TRA2 蛋白复合物,或其同源物的结合的调节或控制。在昆虫中,例如,TRA蛋 白在不同性别中差异表达。具体地,已知TRA蛋白大量出现在雌性中, 且因此以这样的方法调节可变剪接,所述方法是编码序列以性别-特异性方 式表达,即在一些情形中,蛋白质仅在雌性中表达,或在雌性中以比在雄 性中高得多的水平表达,或备选地,在其他情形中,蛋白质仅在雄性中表 达,或在雄性中以比在雌性中高得多的水平表达。当优选地,所述蛋白质 仅在雄性中表达的同时,然而,特别优选地是,所述蛋白质仅在雌性中表 达。已知并讨论了实现这种由TRA蛋白或TRA/TRA-2复合物调节的性别 -特异性可变剪接的机制,例如,在Pane等(发育(Development)129, 3715-3725(2002))中。

优选地,所述至少一个剪接控制序列包括,且更优选地,由源自地中 海实蝇(Ceratitis capitata)的tra基因(Cctra)的tra内含子组成,其具有一 个可变剪接的区域。在F1转录物中,如图33(上述Pane等(2002)的图 2A)所示,这是第一内含子。tra基因在其他物种,诸如油橄榄果实蝇 (Bactrocera oleae),纳塔耳小条实蝇(Ceratitis rosa),桃果实蝇 (Bactrocera zonata)和黑腹果蝇中的同源物也在tra编码序列中的相似位 置具有可变剪接的区域,源自这些昆虫的tra内含子也是特别优选的。

具体地,Cctra中的剪接模式是充分保守的,其中相对于F1转录物, 在雄性中的那些转录物中发现含有额外外显子材料,这样这些转录物不编 码全长、功能性Tra蛋白。相反地,F1转录物编码全长、功能性Tra蛋白; 该转录物在大多数生命周期阶段中是基本雌性-特异性的,尽管推测两种性 别的非常早期胚胎可以含有小量该转录物。我们描述了从F1转录物,而 非雄性-特异的或非-性别-特异的转录物中剪接出的序列,作为tra内含子, 或甚至tra F1内含子。因此Cctra基因中存在的该序列的形式是Cctra内含 子。

因此,tra基因部分地受到性别-特异性可变剪接的调控,而其关键产 物,即Tra蛋白,自身涉及于可变剪接中。在昆虫中,由TRA蛋白,或 包含TRA和TRA2蛋白的复合物调节的性别-特异性可变剪接包括源自双 性(dsx)基因的双翅目昆虫剪接控制序列和还有tra内含子本身,尽管这 应该排除来自果蝇的tra内含子(Dmtra),其原则上受到果蝇中产生的Sxl 基因产物,而非TRA或TRA/TRA2复合物的调节。

在果蝇以外,Sxl基因产物不差异表达于不同性别中。不认为Sxl在非 -果蝇类(non-Drosophilid)昆虫中的性别-特异性可变剪接调节中起作用。

与在tra内含子中的结合蛋白位点(特别地由TRA蛋白识别的核苷酸 序列)结合的TRA蛋白的实例优选地来自双翅目(Diptera),优选地来自 实蝇科(Tephritidae)家族,更优选地来自小条实蝇属(Ceratitis)、按实 蝇属(Anastrepha)或果实蝇(Bactrocera)属。然而,还设想其他双翅昆 虫,诸如下述不同形式的果蝇类(Drosophilid)或蚊,也能够提供TRA蛋 白或其同源物,所述同源物能够结合于来自dsx基因、tra基因或tra内含 子的剪接控制序列,即在F1转录物中完全去除的可变剪接的tra内含子上 的合适位点,甚至在那些情形中,诸如果蝇,其中天然tra基因(Dmtra) 不是由TRA蛋白自我调控的。在一些实施方案中,可将“tra内含子”定 义为剪接控制序列,其中RNA转录物的可变剪接受例如,与之结合的TRA 调控,其单独地或与TRA2组合(即,当复合时)。这排除来自果蝇的tra 内含子。

特别优选地,剪接控制序列源自tra内含子。所述tra内含子可以源自, 如别处所讨论地,小条实蝇属,按实蝇属或果实蝇。来自转换基因的地中 海实蝇tra内含子最初由Pane等(2002)表征,见上。然而,应该理解同 源物存在于其他物种中,并且能够在所述物种和还有在它们不同的属中被 容易地识别。因此,当提及tra时,应该理解这还指其他物种中,特别是 小条实蝇属,按实蝇属或果实蝇属中的tra同源物。

所谓“来源”,应该理解,利用对tra内含子的参考,这指接近或准确 复制tra内含子的序列,如本领域中所述,在这种情形中由Pane等(2002) 所述,见上。然而,应该理解因为这些是内含子序列,所以在无实质性功 能缺失的条件下,能够添加或删除或取代一些核苷酸。

其优选的实例包括dsx内含子,其优选地以小基因的形式提供。在该 实例中,可能优选地,如我们在实施例中进行的一样,从可变剪接的内含 子中删除相当大的量,例如在一些情形中内含子的90%或更大,同时仍保 持可变剪接功能。因此,在预想了大删除的同时,还设想了较小的,例如 甚至单核苷酸插入、取代或删除也是优选的。

源自tra内含子的剪接控制序列的准确长度不是必须的,只要它能够 调节可变剪接。在这一点上,认为大约55-60个核苷酸是修饰的tra内含 子的最小长度,尽管来自地中海实蝇的野生型tra内含子(F1剪接变体) 处于1345个核苷酸长的区域内。

特别优选地,使用了Cctra的全长1345ntd序列。

如对本文所讨论的全部核苷酸序列,优选地设想了某些程度的序列同 源性,除非另外显而易见地。因此,优选地,剪接控制序列具有与参考SEQ ID NO.至少80%的序列同源性,优选地与参考SEQ ID NO.至少80%的序 列同源性,优选地与参考SEQ ID NO.至少80%的序列同源性,更优选地 与参考SEQ ID NO.至少90%的序列同源性,更优选地与参考SEQ ID NO. 至少95%的序列同源性,甚至更优选地与参考SEQ ID NO.至少99%的序 列同源性,和最优选地与参考SEQ ID NO.至少99.9%的序列同源性。合适 的运算法则诸如BLAST可以用于确定序列同源性。如果从野生型删除了 大量序列,则序列比较可以在野生型全长范围内或对比的相似同源性序列 的范围内。

然而,应该理解尽管以上序列同源性,但是为了系统的有效功能性, 必须保持某些元件,具体地旁侧核苷酸和剪接分支位点。换言之,当可以 删除或另外改变某些部分的同时,应该保持与野生型相比至少30%,优选 地50%,优选地70%,更优选地90%,和最优选地95%的可变剪接功能性 或活性。这通过适当地改造例如结合可变剪接因子或与剪接体相互作用的 位点,也可以与野生型相比增高。

具体地,优选地,当剪接控制序列包括修饰的TRA内含子时,这包 括来自5’和,优选地,因此所述内含子的3’末端的至少20-40个碱基对。 此外,提供了如由Pane等(2002)教导的地中海实蝇tra内含子的8个推 定TRA结合结构域中优选地,至少3个或4个和更优选地,至少5个, 优选地6个,更优选地7个和最优选地全部8个,或它们的同源物。当然, 如果及时地发现了更多的所述位点,则设想剪接控制序列能够包括多于8 个位点。实际上,设想可将多于8个位点改造到剪接控制序列中,且可以 以该方式调控可变剪接,特别地如果一些位点以不同的亲和性结合,则导 致不同的可变剪接的结果。

以下如SEQ ID NO 1,DNA序列,给定了对地中海实蝇tra内含子的 推定TRA结合结构域的共有序列,尽管相应的RNA等价物也是优选的。

优选的共有序列是1:TCWWCRATCAACA(SEQ ID NO.1),其中 W=A或T,且R=A或G。

相似的考虑适应于双性(doublesex),其中TRA蛋白的共有序列也给 定在SEQ ID NO.1中,因为包含Tra和TRA2蛋白的蛋白质复合物是双性 (doublesex)可变剪接的关键调节子,对于tra同源物(尽管不是果蝇类 中存在的tra同源物)也如此。

如上所提及地,剪接控制序列优选地源自tra内含子,其优选地来自 实蝇科家族。特别优选地,tra内含子源自桃果实蝇,或优选地,来自其他 非-果蝇类果蝇。然而,特别优选地,tra内含子源自小条实蝇属,具体地 纳塔耳小条实蝇,和最优选地,地中海实蝇。这些分别被更加广泛地称为 纳塔耳(Natal)和地中海(Mediterranean)果蝇。

关于源自桃果实蝇的tra内含子,我们显示出其能够在转基因墨西哥 按实蝇(Mexfly)(墨西哥按实蝇(Anastrapha ludens))和转基因地中海实蝇 (C.capitata)中引起性别-特异性可变剪接。我们还显示出多种蛋白质能 够通过可变剪接,以性别-特异性方式表达,其包括tTAV3和Rpr。

关于源自纳塔耳小条实蝇的tra内含子,我们成功地提供了处于地中 海实蝇中转基因的性别-特异性方式的可变剪接。

关于源自地中海实蝇(C.capitata)(Medfly)的tra内含子,我们显 示出其能够在转基因地中海实蝇中和其他Tephritids,和其他Tephritids诸 如墨西哥按实蝇(A.ludens(Mexfly))中调节性别-特异性剪接。我们不 仅显示出该内含子能够跨越整个昆虫的范围,具体地,双翅目昆虫,成功 地起作用。实际上,我们显示了来自地中海实蝇的TRA内含子(被称为 Cctra)能够在转基因果蝇和蚊埃及伊蚊中提供性别-特异性可变剪接,所 述转基因果蝇不是Tephritid。尽管蚊是双翅目昆虫,但是它们在约250百 万年前从果蝇和Tephritids中分离出来,且因此与果蝇类相比更加远离的 与Tephritids相关,为此,评估了趋异时间为120-150百万年。因此,这 显示本发明跨越广阔昆虫范围的广泛适用性。

关于源自dsx内含子的剪接控制序列,我们显示出其能够在广泛昆虫 范围内,用于以性别-特异性方式可变剪接。因此,特别优选地,dsx源自 家蚕蛾(Bombyx mori)(蚕)、棉红铃虫(Pectinophora gossypiella)(棉红铃虫)、 棉红铃虫、苹果皮小卷蛾(Cydia.Pomonella)(苹果皮小卷蛾(codling moth))、果蝇和蚊,诸如按蚊属(Anopheles sp.),例如冈比亚按蚊(A. gambiae)。特别优选的蚊包括黄热蚊属物种(Stegomyia spp.),具体地埃 及黄热蚊(S.aegypti)(也称为埃及伊蚊(Aedes aegypti))。

实际上,在埃及伊蚊中,我们显示了相当大数量的DNA构建体,其 能够提供性别-特异性可变剪接。

应该理解优选地作为质粒施用所述系统或构建体,但是通常在整合到 基因组后进行测试。施用可以通过本领域已知的方法,诸如肠胃外、静脉 内肌肉、口服、经皮、跨越粘膜递送,等。向胚胎中注射是特别优选的。 在施用前或过程中,可以线性化质粒,且不能将全部质粒整合到基因组中。 当仅有部分质粒整合到基因组中时,优选地这部分包括至少一个能够调节 可变剪接的剪接控制序列。

优选地,多核苷酸表达系统是重组显性致死遗传系统,其致死效应是 有条件的。合适的条件包括温度,从而使该系统例如在一种温度下表达, 但不在另一种温度下表达或以较低程度表达。该致死遗传系统可以作用于 特异性细胞或组织,或将其效应施加到整个生物体。还设想了不严格致死 但施加重大健康损害的系统,例如引起失明、不能飞行(对于能够正常飞 行的生物体),或不育。还设想了干扰性别确定的系统,例如将全部或部 分生物体从一种性别类型转化或趋向转化为另一种。应该理解全部所述系 统和结果由如本文所使用的术语致死所涵盖。类似地,“杀死”和相似的 术语指致死系统的有效表达,以及由此强加有害或性别-扭曲的表型,例如 死亡。

更优选地,多核苷酸表达系统是重组显性致死遗传系统,其致死效应 是有条件的,且在需要这样的物质存在的许可条件下不表达,所述物质是 生物体的天然环境中所缺乏的,这样致死系统的致死效应发生在生物体的 天然环境中。

换言之,该编码序列编码与系统,诸如WO 01/39599和/或 WO2005/012534中所述的tet系统相连接的致死因子。

实际上,优选地,所述致死基因的表达处于可抑制的反式激活蛋白的 控制下。还优选地,其表达受可变剪接调控的基因编码反式激活蛋白,诸 如tTA。这不与受调控的蛋白相矛盾,所述受调控的蛋白是致死因子。实 际上,特别优选地,是二者。在这点上,我们特别优选系统包括如 WO2005/012534教导的正向反馈系统。

优选地,显性致死系统的致死效应是有条件地抑制的。

在本系统下能够使用的合适的生物体包括哺乳动物,诸如小鼠、大鼠 和农牧动物。还优选的是鱼,诸如鲑鱼和鳟鱼。植物也是优选的,但是特 别优选地,宿主生物体是昆虫,优选地双翅目昆虫或tephritid。优选地, 生物体不是人类,优选地非-哺乳动物,优选地不是鸟类,优选地是无脊椎 动物,优选地是节肢动物

具体地,优选地,昆虫来自双翅目种类,特别地较高级的双翅目,和 具体地是tephritid果蝇,优选地地中海实蝇(地中海实蝇(Ceratitis capitata)),优选地墨西哥按实蝇(墨西哥按实蝇(Anastrepha ludens),优选 地橘果实蝇(橘果实蝇(Bactrocera dorsalis)),油橄榄果实蝇(油橄榄果实 蝇(Bactrocera oleae)),瓜实蝇(Melon fly)(瓜实蝇(Bactrocera cucurbitae)), 纳塔耳小条实蝇(纳塔耳小条实蝇(Ceratitis rosa)),樱桃绕实蝇(樱桃绕实 蝇(Rhagoletis cerasi)),昆士兰果实蝇(昆士兰果实蝇(Bactrocera tyroni)), 桃果实蝇(桃果实蝇(Bactrocera zonata)),加勒比按实蝇(加勒比按实蝇 (Anastrepha suspensa))或西印度按实蝇(西印度按实蝇(Anastrepha obliqua))。还特别优选地,宿主生物体是蚊,优选地来自黄热蚊属、伊蚊 属、按蚊属或库蚊属(culex)。特别优选的是埃及黄热蚊,也称为埃及伊蚊, 白线斑蚊(Stegomyia albopicta)(也称为白纹伊蚊(Aedes albopictus)), 斯氏按蚊(Anopheles stephensi),白端按蚊(Anopheles albimanus)和冈 比亚按蚊。

在双翅目中,另一优选组是丽蝇科(Calliphoridae),具体地,新大陆 螺旋蝇蛆(New world screwworm)嗜人锥蝇(Cochliomyia hominivorax),旧大 陆螺旋蝇蛆(Old world screwworm)蛆症金蝇(Chrysomya bezziana)和澳大 利亚绵羊丽蝇(Australian sheep blowfly)(绿蝇(Lucilia cuprina))。鳞翅 目和鞘翅目昆虫也是优选的,特别地蛾,包括苹果皮小卷蛾(苹果皮小 卷蛾),和蚕蛾(家蚕蛾),棉红铃虫(棉红铃虫),小菜蛾(diamondback moth) (Plutella xylostella),舞毒蛾(Gypsy moth)(Lymantria dispar),脐橙虫(Navel Orange Worm)(Amyelois transitella),桃芽蛾(Peach Twig Borer)(桃条麦蛾 (Anarsia lineatelld))和水稻三化螟(rice stem borer)(三化螟(Tryporyza incertulas)),还有夜蛾,特别地实夜蛾亚科(Heliothinae)。在鞘翅目昆 虫中,日本金龟子(日本金龟子(Popilla japonica)),白缘甲虫(White-fringed beetle)(Graphognatus属物种),棉铃象(Boll weevil)(棉铃象 (Anthonomous grandis)),玉米根虫(corn root worm)(Diabrotica属物种) 和科罗拉多铃薯甲虫(Colorado potato beetle)(马铃薯叶甲(Leptinotarsa decemlineata))是特别优选的。

优选地,昆虫不是果蝇类的,特别地Dm。因此,在一些实施方案中, 排除了在果蝇类,特别是Dm中的表达。在其他实施方案中,剪接控制序 列不源自果蝇类,特别是Dm的tra内含子。

优选地,异源多核苷酸序列的表达引起生物体中的表型结果。特别优 选地,功能性蛋白不是β-半乳糖苷酶,但能够与可视的标记(包括荧光)、 生存能力、能育性、生殖力、适应性、飞行能力、视力和行为差别相关。 应该理解,当然,在一些实施方案中,表达系统典型地是有条件的,其具 有仅在一些,例如限制性的条件下表达的表型。

在另一方面,还提供了生物体在其自然环境中种群控制的方法,其包 括:

i)饲养生物体原种,所述生物体携带包含按照本发明的系统的基因表 达系统,所述按照本发明的系统是显性致死遗传系统,

ii)将所述原种动物分配到在种群控制场所的环境中;和

iii)通过由后代中致死系统的表达引起的早期致死性实现种群控制, 所述后代由所述原种个体和野生种群的异性个体的杂种繁殖产生。

优选地,早期致死性是胚胎的或性别成熟前的,优选地,在发育早期, 最优选地在早期幼虫或胚胎生命阶段。

优选地,致死系统的致死效应是有条件的,并通过致死基因的表达发 生在所述自然环境中,所述致死基因的表达在可抑制反式激活蛋白的控制 下,所述饲养在这样的物质存在的许可条件下,所述物质在所述自然环境 中缺乏且能够抑制所述反式激活蛋白。

优选地,致死效应表达在所述后代的胚胎中。优选地,生物体是无脊 椎多细胞动物或如别处所讨论的。

还提供了生物学控制方法,其包括:

i)饲养雄性和雌性生物体原种,所述生物体是在许可的条件下用按照 本发明的表达系统转化的,容许雄性和雌性的生存,以提供双性别生物学 控制媒介物;

ii)任选地,在下一步前,施加或允许限制性条件以引起一种性别的 个体死亡,并由此提供单一性别生物学控制媒介物,其包含携带条件性致 死遗传系统的另一种性别的个体;

iii)释放双性别或单性别生物学控制媒介物到生物学控制场所的环境 中;和

iv)通过后代在遗传系统的表达实现生物学控制,所述后代由生物学 控制媒介物个体和野生种群的异性个体的杂种繁殖产生。

优选地,在生物体分配前,由性别特异性致死遗传系统的表达提供性 别分离。

优选地,致死效应导致杀死所释放的生物体和野生种群交配的后代靶 种类的多于90%。

还提供了性别分离方法,其包括:

i)饲养雄性和雌性生物体原种,所述生物体是在许可的或限制性条件 下用基因表达系统转化的,容许雄性和雌性的生存;和

ii)去除许可的或限制性条件,从而通过致死基因的性别-特异性可变 剪接在一种性别而非另一种性别中诱导致死基因的致死效应。

优选地,致死效应导致杀死所释放的生物体和野生种群交配的后代靶 种类的多于90%。

还提供了生物学或种群控制方法,其包括:

i)饲养雄性和雌性生物体原种,所述生物体是在许可的或限制性条件 下用基因表达系统转化的,容许雄性和雌性的生存;和

ii)去除许可的或限制性条件,从而通过致死基因的性别-特异性可变 剪接在一种性别而非另一种性别中诱导致死基因的致死效应,由此实现性 别分离;

iii)使分离的个体不育或部分不育;和

iv)通过分离的不育或部分不育个体向生物体自然环境中的释放实现 所述控制。

优选地,不育化是通过使用电离辐射完成的。然而,通常,避免辐射 的方法,如在不育昆虫技术(SIT)中所使用的是特别优选的,且具有许 多超越与辐射的使用联合或在使用辐射后的方法的成本和健康优势。

还提供了用于从种群中选择性消除雌性的方法。也设想了对于雄性的 等效方法。

性别分离的方法在商业上是非常重要的,例如在蚕中,雄性比雌性产 生更多且更好的丝。因此,消除雌性和具体地雌性蚕的性别分离方法是特 别优选的。

还设想功能性蛋白可能是在超过一种剪接变体,和优选地,因此在例 如两性中差异表达,但可检测到的。这样的实例包括荧光蛋白,诸如eGFP, CopGFP和DsRed2。这可以用在非致死性性别分离或分类的方法中,从而 能够在不杀死任何类型的条件下分离这两种类型。

我们还惊讶地发现能够改变剪接控制序列的定位并获得更好的结果。 优选地,当以5’到3’的方向,从启动子开始阅读时,剪接控制序列是“第 一”剪接控制序列。我们发现在系统的5’UTR中具有内含子的某些构建体 中,其引起由本发明的剪接控制序列调节的降低的水平或可变剪接的蛋白 质表达。

优选地,剪接控制序列位于起始密码子的3’。优选地,将剪接控制序 列插入到第一外显子,即紧邻转录起始位点3’的序列片段中。应该理解该 术语可以指编码转录物的DNA序列,或指RNA转录物本身。

当剪接控制序列位于起始密码子的3’时,优选地,它也位于第一符合 读框地终止密码子的5’(即为起始密码子的3’且符合起始密码子的读框), 从而可变剪接产生编码不同蛋白质或多肽序列的转录物。因此在优选的实 施方案中,关于有义链或初级转录物,构建体或多核苷酸序列包括处于5’ 到3’顺序的下列元件:转录起始、翻译起始、能够可变剪接的内含子、全 部或部分蛋白质的编码序列、终止密码子的编码序列。

可将剪接控制序列定义为优选地多达且包括5’G(GT/C)及其3’G等 价物,特别是在tra中,但如上提及地,其能够包括一些外显子序列且因 此能够包括外显子的最3’(最后)的核苷酸(即,G)。

特别优选地,剪接控制序列在3’方向,直接邻接起始密码子,从而 ATG的G位于剪接控制序列起始(5’末端)的5’。这是特别有利的,因为 其容许ATG起始密码子的G成为剪接控制序列的5’G旁侧序列。

备选地,剪接控制序列位于起始密码子的3’,但在1000个外显子bp 内,优选地500个外显子bp,优选地300个外显子bp,优选地200个外 显子bp,优选地150个外显子bp,优选地100个外显子bp,更优选地75 个外显子bp,更优选地50个外显子bp,更优选地30个外显子bp,更优 选地20个外显子bp,和最优选地10个或甚至5,4,3,2,或1个外显 子bp。

本发明是对在WO2005/012534中定义为LA1188的系统的改进。该质 粒具有许多缺陷,其中原理是其中用本文所用的Cctra内含子切离外显子 核苷酸,由此在转录物中导致诱导的移码。特别地,除源自Cctra的序列 (Cctra内含子)外,在雌性-特异性转录物中去除了tTAV序列的4个核 苷酸。因此,尽管产生了若干可变剪接的转录物,包括一种雌性-特异性转 录物,但是无一能够编码功能性tTAV蛋白。因此,该构建体不能提供功 能性tTAV蛋白的性别-特异性表达。

由于剪接不涉及通常在Cctra内含子中使用的剪接供体序列(5'-GT...), 所以清楚地,该构建体不包含指导处于Cctra内含子形式的剪接所需的全 部调节序列,所述Cctra内含子处于“其天然背景中”。然而,这突出了另 一个问题。可能地,唯一缺少的东西是旁侧TG...GT,其中可能仅有5’G 是要紧的。

本发明的关键优势是,具体地关于tra,对外显子序列的需要是如此小 (例如,在每个末端2个核苷酸),以至于能够利用遗传密码的冗余性容 易地将它们设计为大部分编码序列(most coding sequence)。因此,“额外” 的外显子核苷酸可以是异源蛋白质序列的一部分,且同时是处于其天然背 景中的内含子的旁侧序列。

此外,LA1188中的Cctra内含子是位于ATG起始密码子的G的3’的 +132bp(最后的外显子核苷酸)处。实际上,尽管LA1188中的Cctra内 含子是以5’到3’的方向,从ATG起始密码子阅读的第一内含子,但其不 是当以5’到3’的方向,从启动子阅读的“第一”内含子。实际上,它是第 二内含子,因为在ATG起始密码子的上游存在另一个内含子(源自黑腹 果蝇Adh基因)。表3中包括该信息。

应该理解当提及ATG起始密码子或旁侧G,或5'-TG...GT-3'序列时, 这与DNA序列相关,但是这还包括相应的DNA反义序列和,等同地,相 应的RNA序列。

本发明序列的描述

SEQ ID NO.1 tra共有序列

SEQ ID NO.2 LA30975'旁侧序列

SEQ ID NO.3 LA30973'旁侧序列

SEQ ID NO.4引物688-ie1-transcr

SEQ ID NO.5引物790-Aedsx-m-r2

SEQ ID NO.6引物761-Aedsx-fem-r

SEQ ID NO.7引物AedsxR1

SEQ ID NO.8 Pane等共有序列

SEQ ID NO.9 Scali等2005共有序列

SEQ ID NOS.10-33和107-138对果蝇推导的推定Tra/Tra2结合位 点的共有序列(见表2).

SEQ ID NO.34:tTAV的开放阅读框

SEQ ID NO.35:tTAV的蛋白质序列

SEQ ID NO.36:tTAV2的开放阅读框

SEQ ID NO.37:tTAV2的蛋白质序列

SEQ ID NO.38:tTAV3的开放阅读框

SEQ ID NO.39:tTAV3的蛋白质序列

SEQ ID NO.40:棉红铃虫dsx雌性特异性序列片段1

SEQ ID NO.41:棉红铃虫(PBW,棉红铃虫)dsx雌性特异性序列片段 2

SEQ ID NO.42:棉红铃虫(PBW,棉红铃虫)dsx雄性特异性序列

SEQ ID NO.43:埃及伊蚊dsx的部分基因序列。包括全部外显子序列, 但仅具有部分内含子序列-注释参见图47和48。

SEQ ID NO.44:苹果皮小卷蛾(苹果皮小卷蛾)dsx雌性基因序列: 包括未知核苷酸片段,优选地少于100,优选地小于50,更优选地小于20, 更优选地小于10,和最优选地小于5。

SEQ ID NO.45:苹果皮小卷蛾(苹果皮小卷蛾)dsx-雄性序列。

SEQ ID NO.46:pLA3435-家蚕蛾-dsx构建体/质粒的序列。

SEQ ID NO.47:pLA3359-冈比亚按蚊dsx构建体的序列。

SEQ ID NO.48:包括外显子2的构建体pLA3433-Agdsx(冈比亚按蚊) 的序列。

SEQ ID NO.49:pLA1 188-cctra内含子构建体的序列

SEQ ID NO.50:pLA3077-Cctra内含子-tTAV构建体的序列。

SEQ ID NO.51:pLA3097-Cctra内含子-tTAV构建体的序列。

SEQ ID NO.52:pLA3233-Cctra-内含子-tTAV2构建体的序列。

SEQ ID NO53:pLA3014-Cctra-内含子-泛蛋白-reaperKR构建体的序 列。

SEQ ID NO.54:pLA3166-Cctra内含子-泛蛋白-reaperKR构建体的序 列。

SEQ BD NO.55:pLA3376-Bztra内含子-reaperKR和Bztra-内含子 -tTAV3的序列。

SEQ ED NO.56:pLA3242-Crtra内含子-reaperKR构建体的序列。

SEQ ID NO.57:由LA3077转化体在黑腹果蝇中产生的雄性转录物的 部分序列,其与在地中海实蝇(Medfly)LA3077品系中产生的序列不同。 该序列对应于图36中所描述的M3转录物。

SEQ ID NO.58:桃果实蝇tra同源物的部分序列。预测以桃果实蝇tra 雌性-特异性转录物的形式剪接出的内含子序列(序列中+3到+970bp).外 显子旁侧核苷酸位于位置1-2和971-972,即位于内含子序列的5'和3'末 端。实际上,值得注意地,内含子序列通过鸟嘌呤核苷酸侧邻其5’末端, 认为这对于内含子的彻底脱离是关键的。

SEQ ID NO 59:纳塔耳小条实蝇tra同源物的部分序列。预测以纳塔 耳小条实蝇tra雌性-特异性转录物的形式剪接出的内含子序列(序列中 +3到1311bp)。外显子旁侧核苷酸位于位置1-2和1312-3。同样,值得注 意地,内含子序列通过鸟嘌呤核苷酸侧邻其5’末端,认为这对于内含子的 彻底脱离是关键的。

SEQ ID NOS.60-70:图44-46和50-51中提及的引物。

SEQ ID NO.71:棉红铃虫(PBW,棉红铃虫)dsx雌性特异性序列片 段3.

SEQ ID NO.72:黑腹果蝇泛蛋白的开放阅读框。

SEQ ID NO.73:黑腹果蝇泛蛋白的蛋白序列。

SEQ ID NOS.74-105是实施例中上述讨论的引物。

SEQ ID NO.106是LA1172核苷酸序列,包括质粒主链。

SEQ ID NOs107-138如上所述。

SEQ ID NO.139 HSP引物

SEQ ID NO.140 VP 16引物

SEQ ID NO.141引物AgexonlF

SEQ ID NO.142引物TETRR1

SEQ ID NO.143 LA3576质粒序列

SEQ ID NO.144 LA3582质粒序列

SEQ ID NO.145 LA3596质粒序列

SEQ ID NO.146 PBW-dsx(图6)

SEQ ID NO.147 bombyx-dsx(图6)

SEQ ID NO.148 codling-dsx(图6)

SEQ ID NO.149 来自构建体LA3491的DSX小基因1

SEQ ID NO.150 来自LA3534构建体的DSX小基因2

SEQ ID NO.151 LA3619完整质粒序列

SEQ ID NO.152 LA3612完整质粒序列

SEQ ID NO.153 LA3491质粒序列

SEQ ID NO.154 LA3515质粒序列

SEQ ID NO.155 LA3545质粒序列

SEQ ID NO.155 LA3545质粒序列

SEQ ID NO.156 LA3604质粒序列

SEQ ID NO.157 LA3646质粒序列

SEQ ID NO.158 LA3054质粒序列

SEQ ID NO.159 LA3056质粒序列

SEQ ID NO.160 LA3488质粒序列

SEQ ID NO.161 LA3641质粒序列

SEQ ID NO.162 LA3570质粒序列

现将通过参考下列非限制性实施例描述本发明。

实施例

转换基因

实施例1-地中海实蝇tra内含子

我们制备了向合成开放阅读框(ORP)中的Cctra内含子盒插入。该 剪接正确地存在于地中海实蝇中的两种形式,换言之Cctra内含子盒的剪 接如实地概括了在内源Cctra基因背景中通常会产生的作用。这是为了在 雌性中产生3种(主要或仅)剪接变体,其中之一是雌性-特异性的(称为 F1),而其他两种既存在于雄性中也存在于雌性中(称为M1和M2)。因 为该非-性别-特异性转录物中的每一个含有另外的具有终止密码子的外显 子物质,所以我们还对其进行安排,以使仅雌性剪接变体产生功能性蛋白。

这些构建体(LA3077和LA3097)中的每一个具有由TG和GT侧邻的 Cctra内含子(以提供5’...TG|内含子|GT...3’。不完善起作用的以前的构 建体是LA1188。非常充分地表征了LA1188—除了除去另外4个核苷酸外, 剪接完全如上。内含子处于5'...TGGCAC|内含子|GT...3'背景中;剪接去除 另外4个碱基,即5'...TG|GCAC内含子|GT...3'(图33)。

在全部情形中,内含子是不变的,且仅是完整的Cctra内含子序列。 如对内含子普遍地,其起始于GT并结束于AG。几乎全部内含子以GT 起始,因此在LA1188中使用极少变化的GC是令人吃惊的[GC-AG内含 子是已知备选的-在大规模调查中,报告了全部内含子的0.5%使用GC-AG (Burset等,2001),尽管这可能估计不足,特别是对于可变剪接的内含子, 其中可能5%可以使用GC-AG(Thanaraj和Clark,2001)]。

对LA3077进行了RT-PCR分析,(在tTAV开放阅读框中具有CcTRA 内含子的正向反馈构建体)。用基本不含四环素(“去四环素”)的饮食饲 养转化的成年两种性别的蝇7天。然后收集蝇以进行RNA提取,并且利 用引物(HSP-SEQ ID NO.104和VP16 SEQ ID NO.105)的RT PCR用于分 析CcTRA内含子的剪接模式(图34)。在两份雌性样品中,我们发现了 Cctra的正确剪接模式(776bp,与精确去除Cctra内含子相对应),且在雄 性中没有看到所述条带。

我们发现LA3077和LA3097相应地提供了可抑制的雌性-特异性致死 性。在四环素和去四环素条件下,通过对LA3077杂合的蝇与野生型的杂 交表型检验LA3077。雌性致死性在50-70%的范围内。LA3097(LA3077 的修饰形式,其中Cctra内含子在tTAV ORF中紧密跟随起始密码子),证 明了高得多的雌性特异致死性水平,以100%为峰值(图35)。还将Cctra 内含子在与LA3097相同的位置插入到构建体LA3233中的tTAV2中,且 这提供了与LA3097相似的表型结果(图35)。

我们还在果蝇中制备了LA3077的转化体。表型上,该构建体完善地 工作,这就是说它是高度有效的雌性-特异性致死因子。然而,这些插入物 之一的剪接变体的测序显示了果蝇在该构建体的剪接与地中海实蝇中的 (SEQ ID NO.57)不完全相同。关键的转录物,即雌性-特异性转录物,在 二者中相同,但至少一种非-性别-特异性转录物不同。它仍结合额外的具 有终止密码子的外显子序列,但是剪接连接不完全相同(图36)。这个观 察是非常重要的,因为它显示出该方法(通过使用可变剪接的内含子调节 基因的表达)能够跨越非常广阔的系统发育范围使用。

用于确定至今未表征的外显子剪接调节子(诸如增强子和抑制子)是 否可以改善可变剪接的内含子的功能的简单检验可以包括制备构建体和 将其引入到靶组织中,然后检查其剪接模式。在许多情形中,这应该不需 要种系转化,因此该检验可以非常迅速,例如通过在合适的组织培养细胞 或在体内瞬时表达。例如,昆虫中的体内检验能够通过由显微注射递送 DNA实现。然而,如技术人员应该理解地,例如,与电穿孔结合的显微 注射、或电穿孔、化学转化、弹果方法已经被用在许多不同的背景中,且 由此所述质粒引入和蛋白质表达的方法应该在本领域中已知。

我们近期还制备,并获得了用不同基因(LA3014)中Cctra内含子的 转基因学(以上全部实例在tTAV中)。LA3014在Cctra内含子的下游含 有泛蛋白-reaperKR融合。表型数据(图35)显示LA3014转基因地中海实 蝇提供了可抑制的雌性-特异致死性。利用引物(HSP,SEQ ID NO 74)和 ReaperKR(SEQ ID NO.75),对由去四环素饲养的成熟雄性和雌性提取的 RNA进行的RT-PCR分析,证明正确的剪接发生在雌性中(508bp条带), 且在雄性中没有发现该条带(图37)。LA3166是另一个具有Cctra内含子 的构建体,其位于与reaperKR融合的泛蛋白编码区中,但位于泛蛋白的不 同位置处。LA3166还在地中海实蝇中产生显性可抑制雌性-特异性致死效 应(图35)。

我们近期还制备,并获得了用在不同基因中具有内含子的基于“单独 内含子”Cctra的构建体的转基因学(以上全部实例在tTAV或其变体之一, 即tTAV2或tTAV3中)。这些构建体如预测地起作用。这是重要的结果, 由此显示出我们在tTAV中简单意外复制出(以功能,如果不必须以序列) 的Cctra中不存在基本外显子序列。我们还有该类型的ubi-rprKR构建体 (LA3014和LA3166),其验证了上述泛蛋白融合方法。

为了证明Cctra内含子的系统发育范围,我们产生了转基因LA3097 和LA3233墨西哥按实蝇。选择LA3097和LA3233,以用于向墨西哥按实 蝇注射,因为它们在地中海实蝇中表现出最佳雌性特异致死性(见实施例 13)。产生了关于4个独立的LA3097品系和1个LA3233品系的表型数据 (见图38)。当与地中海实蝇相比时,墨西哥按实蝇中的雌性特异致死性 通常略低,但在一个品系中达到100%。

分离了用LA3097转化并以四环素饲养直至羽化的墨西哥按实蝇,并 将其维持在去四环素的环境中7天。然后提取RNA,并利用引物HSP(SEQ ID NO.76)和TETRR1(SEQ ID NO.77)进行RT-PCR分析。在从雌性而非 雄性中分离的RNA(384bp)中观察到正确的雌性特异性(F1-样)剪接模 式,这证明了不同物种中Cctra内含子的功能(图39)。

纯化并沉淀最亮的雄性条带和雌性特异性条带,以用于测序。发现雌 性特异性转录物在墨西哥按实蝇雌性中是正确剪接的, 如对LA3097所预测的:

LA3097:AGCCACCATGGT...内含子...AGGTCAGCCGCC

上述两个旁侧序列分别是SEQ ID NOS.2和3。

实施例2:桃果实蝇tra内含子

我们利用引物ROSA1(SEQ ID NO.78),ROSA2(SEQ ID NO.79)和 ROSA3(SEQ ID NO.80),从桃果实蝇(B.zonata)分离tra内含子(SEQ ID NO.58)。

基于地中海实蝇和油橄榄果实蝇tra同源物的保守编码序列设计这些 引物序列。利用ROSA2和ROSA3或者ROSA1和ROSA3作为引物,从 桃果实蝇基因组DNA扩增tra内含子及其旁侧编码区域。然后我们使用这 些PCR产物作为模板,并扩增tra内含子片段,从而制成构建体-LA3376 (图31和SEQ ID NO.55)。将引物(BZNHE-SEQ ID NO.81和BZR-SEQ ID NO.82)用于制造构建体;这些引物含有用于克隆目的的另外的序列。 将LA3376中的Bztra内含子克隆到tTAV3和还有reaperKR的ORF中。生 成地中海实蝇转化体,并从雄性和雌性蝇中提取RNA。

然后对reaperKR(HB-SEQ ID NO.83)和Reaper KR-SEQ ID NO.84) 和tTAV3(SRY-SEQ ID NO.85)和AV3F-SEQ ID NO.86)剪接进行 RT-PCR。在雌性中产生了对reaperKR预测的200bp和对tTAV3预测的670bp 的片段(图40),其对应于以与Cctra的F1转录物等价模式的剪接(Pane 等,2002)。

实施例3:分离和剪接纳塔耳小条实蝇(C.rosa,纳塔耳小条实蝇)tra内含 子

基于地中海实蝇和油橄榄果实蝇的保守编码序列,设计引物ROSA2 (SEQ ID NO.87)和ROSA3(SEQ ID NO.88)。利用ROSA2和ROSA3作为 引物,从纳塔耳小条实蝇基因组DNA(SEQ ID NO.59)扩增tra内含子及其 旁侧编码区域。然后我们使用这些PCR产物作为模板,并扩增tra内含子 片段,从而制成构建体。在构建LA3242(SEQ ID NO.56和图32)的过 程中使用了引物(CRNHE-SEQ ID NO 89和CRR SEQ ID NO 90)。LA3242 在reaperKRORF的5’末端含有纳塔耳小条实蝇内含子。用LA3242的DNA 注射地中海实蝇胚胎,以基本无四环素的饮食饲养被注射的胚胎直到成年 期。从成年雄性和雌性中提取RNA;这些用作利用引物HB(SEQ ID NO.91) 和ReaperKR(SEQ ID NO.92)的RTPCR的模板。在雌性而非雄性中观察到 了预测的雌性-特异性剪接条带(200bp)(图41),其对应于以与Cctra的 转录物F1等价模式的剪接。

双性

实施例4:PBW中的家蚕蛾dsx

先前描述了果蝇Dsx(Bmdsx)的家蚕蛾(Bombyx mori)(蚕蛾)同源 物序列,并识别了雄性-和雌性-特异性剪接产物(Suzuki等,2001)。雄性 和雌性均使用相同的3’聚腺苷酸,且存在两个雌性特异性外显子。一篇论 文提示性别-特异性剪接不依赖于tra/tra2,换言之,即使模式似乎相同, 但是根本的机制可以不同(Suzuki等,2001),尽管它们的数据,然而主要地, 可识别的tra-tra2结合位点的缺乏不引人注目。另外,已经将家蚕蛾dsx 小基因构建体(含有外显子序列和截短的内含子序列)转化到家蚕蛾中, 并且种系转化体显示出性别-特异性剪接(Funaguma等,2005)。

我们还基于Funaguma等的论文中使用的序列,生成了Bmdsx小基因, 其具有一些显著的改变,并将其注射到蛾棉红铃虫中,从而确定其是否能 够在分支的物种中获得性别-特异性剪接。我们生成的小基因构建体不包括 外显子1,其既存在于雄性也存在于雌性中。另外,我们去除外显子3和 4(两个雌性特异性外显子)之间的内含子,纳入异源序列(含有多克隆 位点,MCS),使用来自杆状病毒AcNPV的Hr5-IE1增强子/启动子序列, 并使用源自SV40的3’转录终止序列(示意参见图42)。通过PCR扩增所 使用的单独外显子/旁侧内含子片段,并重组在一起,且将其连接到携带 Hr5/IE1增强子启动子片段和SV403'UTR的构建体中(图22和SEQ ID NO. 22)。

将LA3435注射到棉红铃虫胚胎中。5-7天后收集第一龄幼虫,并由 RT-PCR(利用引物IE1transcr-SEQ ID NO.93和SV40-RT-P2-SEQ ID NO. 94)单独进行分析,从而确定BMdsx是否能够经历雄性和雌性特异性剪 接(图43)。我们的分析检测在4份样品(泳道1,2,3和4)中有雄性 特异性条带(预测为442bp),且在一份样品(泳道5)中有雌性特异性条 带(预测为612bp)。

PBW中家蚕蛾dsx的正确剪接证明我们通过利用可变剪接系统,能够 在鳞翅目中获得(获得了)异源序列(于此,MCS)的性别-特异性表达。 此外,由于该剪接系统源自异源物种,这提示所述构建体可以遍及广阔系 统发育范围起作用。然而,还预想了目的物种中可变剪接系统的识别,并 且在此提供或本领域技术人员应该已知用于识别所述可变剪接系统的方 法。通过提供我们实施例中的MCS(见图42),由插入所述序列能够容易 地实现目的序列,例如目的蛋白的编码区域的表达。如果所述序列编码合 适的蛋白质,则能够由此将性别-特异性表型,例如有条件的性别-特异性 致死性引入到,例如棉红铃虫中。

实施例5:分离苹果皮小卷蛾dsx

通过利用引物进行3’RACE,分离来自苹果皮小卷蛾(苹果皮小卷蛾) 的dsx基因,所述引物基于来自油橄榄果实蝇,昆士兰果实蝇,地中海实 蝇,黑腹果蝇,家蚕蛾和冈比亚按蚊(的序列排列。从雄性和雌性苹果皮 小卷蛾中提取RNA,且为了产生cDNA,利用TT7T25引物(SEQ ID NO.95) 进行3’RACE。

利用引物dslc(SEQ ID NO.96)和TT7(SEQ ID NO.97)进行PCR。然 后,利用引物codling2a(SEQ ID NO.98)和TT7(SEQ ID NO.99)对第一次 PCR的产物进行两轮嵌套式PCR,并且对第二轮PCR的产物使用 Codling2b(SEQ ID NO.100)和TT7。分离的雄性和雌性特异性序列与先前 分离的dsx同源物共有序列相似性(雄性-SEQ ID NO.43和雌性-SEQ ID NO.42)。

实施例6:分离PBW dsx

通过利用引物进行的3’RACE分离来自棉红铃虫的dsx基因,所述引 物基于来自油橄榄果实蝇,昆士兰果实蝇,地中海实蝇,黑腹果蝇(D. melanogaster),家蚕蛾和冈比亚按蚊的序列排列。从雄性和雌性苹果皮小 卷蛾中提取RNA,且为了产生cDNA,利用TT7T25(本文定义的序列)进 行3’RACE。利用引物Pbwdsx2(SEQ ID NO.101)和TT7(SEQ ID NO.102) 进行PCR。然后,利用引物Pbwdsx3(SEQ ID NO.103)和TT7对第一次 PCR的产物进行嵌套式PCR。分离了三种雌性特异性序列: PBWdsx-F1(SEQ ID NO.40),PBWdsx-F2(图10)和PBWdsx-F3(SEQ ID NO.71),和一种雄性特异性序列(SEQ ID NO.42)。分离的雄性和雌性特异 性序列与先前分离的dsx同源物具有序列相似性。

实施例7:冈比亚按蚊中的dsx

先前描述了冈比亚按蚊dsx基因的序列(Scali等2005)。然而,当我们 试图重复该论文中所述的工作时,我们发现发生了一些剪接中的不同。当 我们试图重复利用由mRNA序列(登记号;雌性编码序列:AY903308和雄 性编码序列:AY903307)设计的引物进行的雌性特异性转录物的扩增时, 扩增失败。然而,当Scali和同事显示出存在共享的外显子时,这在从前 没有被描述过,我们设计了引物,以扩增完整dsx转录物和基因。利用这 些引物和从基因组DNA序列(登记号;GI:19611767)中设计的引物,我 们发现雌性转录物的剪接与Scali等2005所述的不同(图44)。显示出雌 性外显子的转录物位于不同的位置。对于这些差别存在若干解释,但是最 有可能的是我们用于从中获得数据的按蚊中的某种品系差别,或公布的序 列不是来自于冈比亚按蚊,或存在多于一种如实施例20中对埃及黄热蚊 所示的雌性同种型。

我们还成功地使用了关于我们的冈比亚按蚊dsx剪接形式设计的引 物,所述引物能够区别雄性和雌性冈比亚按蚊(图45)。这提供了良好的 证据,即所述系统与目的蛋白质,诸如tTAV或杀伤子(killer)融合时, 应该起到性别-特异性剪接机制的功能。

将我们从基因组DNA中分离的冈比亚按蚊dsx基因克隆到LA3359 (SEQ ID NO.47)和LA3433(SEQ ID NO.48)中,所述冈比亚按蚊dsx基因 与报告的基因组序列相比具有若干核苷酸序列的改变,示意图可以分别见 于图23和图24。

实施例8:埃及黄热蚊中的dsx

基因的剪接似乎与冈比亚按蚊dsx基因相似(Scali等,2005)。图47或 48中概括地图示了埃及黄热蚊dsx基因。生成了雄性-特异性转录物(M1), 其不包括外显子5a或5b。两种雌性特异性剪接变体(F1和F2)具有如下 结构;F1包含外显子1-4,5a,6和7,但是无5b,F2包含外显子1-4和 5b(图46)。另外,另一种转录物(C1)在雄性和雌性中均出现;其包含 外显子1-4和7,但无外显子5a,5b或6。

基因的剪接似乎与冈比亚按蚊dsx基因相似(Scali等,2005)。图47或 48中概括地图示了埃及黄热蚊dsx基因。

Actin4

实施例9:埃及黄热蚊Actin-4基因

一种获得目的基因的性别-,组织-和阶段-特异性表达的方法是将其与 埃及黄热蚊Actin-4(AeAct-4)基因连接。该基因仅在雌性埃及黄热蚊飞 行肌的发育中表达(Munoz等,2004)。它们使用与RNA的原位杂交,从 而检测AeAct-4的表达分布。我们获得了埃及黄热蚊Actin-4基因的片段, 其包括推定的启动子区域,可变剪接的内含子和5’非翻译区(UTR)部分, 并且将其置于编码tTAV序列的前面(图49),从而在与tTAV融合时,检 验性别特异性剪接的功能。

我们利用piggyBac,将LA1172整合到埃及黄热蚊基因组中。产生了 两种独立的品系(品系2和8)。这两种品系均显示出Actin-4-tTAV基因的 正确剪接(图50和51)。因此,Actin-4启动子和可变剪接的内含子能够 成功地用于提供埃及黄热蚊中目的基因的性别-、组织-和阶段-特异性剪 接。

附图说明和实施例1-9的序列列表

图19:P元件在生成目的基因(基因E)的种系-特异性表达中的一种 用途。

P元件IVS3和旁侧外显子序列向泛蛋白-基因E融合上游的插入容许 基因E在种系活性启动子的作用下的种系-特异性表达。A-种系活性启动 子;B-P-元件开放阅读框;C-P内含子“IVS3”;D-泛蛋白;E-目的蛋白, 例如tTAV的编码区。

图20:利用dsx的性别-特异性表达

A:用作上述Cctra内含子的内含子,但提供雄性-特异性表达。将dsx (此处,按蚊形式)片段插入到异源编码区(阴影框)。在雄性中完全去 除了内含子,但在雌性中过早地终止了编码区。

B:雄性-特异性表达的备选方法,其中异源编码区与dsx片段融合。

C:雌性-特异性表达:将异源编码区插入到雌性-特异性外显子中,其 作为与Dsx片段的符合读框地融合或具有其自身的起始和终止密码子。

D:差异表达:设计B和C能够组合提供雌性中基因a和雄性中基因 b的表达。

图21:Cctra的性别-特异性可变剪接

A:在雌性中剪接Cctra,从而产生三种转录物:F1,其编码功能性 Tra蛋白,和M1和M2,其不编码功能性Tra蛋白,因为它们包括另外的 具有终止密码子的外显子(从Pane等,2002重新绘图)。雄性仅产生转录 物M1和M2,并因此根本不产生功能性Tra蛋白。

B:如果该内含子在异源编码区中相似地起作用,则它应该相似地容 许雌性,但非雄性,产生功能性蛋白X。

图22:pLA3435构建体/质粒的图形表示(SEQ ID NO.46)。

图23:处于Hr5-IE1启动子控制下的pLA3359冈比亚按蚊dsx基因 的质粒图,从而用于通过瞬时表达评估剪接。

图24:处于Hr5-IE1启动子控制下的pLA3433-冈比亚按蚊dsx基因, 并外加外显子2,从而用于通过瞬时表达评估剪接。

图25:pLA1188构建体的图示。

图26:pLA3077构建体的示意图。

图27:pLA3097构建体的示意图。

图28:pLA3233构建体的示意图。

图29:pLA3014构建体的示意图。

图30:pLA3166构建体的示意图。

图31:pLA3376构建体的示意图。

图32:pLA3242构建体的示意图。

图33:Cctra的旁侧序列

LA3077和LA3097中Cctra内含子的剪接完全如你在天然Cctra内含 子中见到的。LA1188的剪接导致4个另外的核苷酸的去除。在全部情形 中,内含子侧邻5’外显子TG和3’GT。

图34:凝胶显示了内含子的正确性别-特异性剪接,所述内含子源自 由LA3077转化的地中海实蝇中CcTra(雌性中的776bp条带)。泳道1: 标记(来自Eurogentec的SmartLadderTM,指示大约0.8,1.0和1.5kb的条 带);泳道2和3:地中海实蝇LA3077/+雄性;泳道4和5:地中海实蝇 LA3077/+雌性。

图35:关于地中海实蝇中转化的雌性特异性构建体的表型数据。栏1: 由数字表示构建体名称LA#,例如LA3077,LA3097,LA3233等,其中由 字母指示独立插入品系;栏2和3:关于全部雄性(2)和全部雌性(3) 中给定的每种转化的品系的无-四环素(NT)结果。栏4和5:关于全部 雄性(4)和全部雌性(5)中给定的每种转化的品系的四环素(TET)结 果。

图36:果蝇和地中海实蝇中Cctra内含子构建体的转录物。最上面一 行表示构建体DNA,其包含侧邻所需要的基因(开放框)的tra内含子。 红色框表示雄性特异性外显子。由实线表示内含子。第一行上方的箭头表 示RT-PCR试验中使用的寡核苷酸的位置。杆表示该图的比例尺。

图37:凝胶显示了在由LA3014转化的雌性地中海实蝇中的CcTRA- 来源序列(508bp条带)的正确雌性特异性剪接。泳道1:标记(来自 Eurogentec的SmartLadderTM,指示大约0.4和1.0kb的条带);泳道2:地 中海实蝇LA3014/+雄性;泳道4:地中海实蝇LA3014/+雌性;泳道3和5: 无反转录酶阴性对照(泳道2和4中能够看见背景条带,可能来自基因组 DNA)。

图38:关于由LA3097或LA3233转化的转基因墨西哥按实蝇的表型 数据。栏1:指示的构建体LA#(LA3097或LA3233),其中用字母指示 独立插入品系;栏2和3:关于全部雄性(2)和全部雌性(3)中给定的 每种转化的品系的无-四环素(NT)结果。栏4和5:关于全部雄性(4) 和全部雌性(5)中给定的每种转化的品系的四环素(TET)结果。

图39:凝胶显示由LA3097转化的墨西哥按实蝇中CcTRA剪接(雌 性中的348bp的条带)的正确性别-特异性剪接。泳道1:标记(来自 Eurogentec的SmartLadderTM,指示大约0.4和1.0kb的条带);泳道2、3 和4:墨西哥按实蝇LA3097/+雄性;泳道5、6和7:墨西哥按实蝇LA3097/+ 雌性。

图40:凝胶显示LA3376的reaperKR(雌性中的200bp条带)和tTAV3 (雌性中的670bp条带)区域中BzTRA的正确性别-特异性剪接,所述 LA3376在由LA3376转化的地中海实蝇中。泳道1:标记(来自Eurogentec 的SmartLadderTM,指示大约0.2、0.6和1.0kb的条带);泳道2和3:为 reaperKR中的剪接检验的地中海实蝇LA3376/+雄性;泳道4和5:为 reaperKR中的剪接检验的地中海实蝇LA3376/+雌性;泳道6: SmartLadderTM;泳道7和8:为在tTAV中的剪接检验的地中海实蝇 LA3376/+雄性;泳道9和10:为tTAV中的剪接检验的地中海实蝇LA3376/+ 雌性;泳道11:SmartLadderTM。

图41:凝胶显示在CrTRA-reaperKR(雌性中的200bp的条带)中正 确的性别-特异性CrTRA剪接,所述CrTRA-reaperKR处于用LA3242注 射的地中海实蝇中。泳道1:标记(来自Eurogentec的SmartLadderTM,指 示大约0.2、0.6和1.0kb的条带);泳道2-7:用LA3242注射的地中海实 蝇野生型雄性;泳道8:SmartLadderTM;泳道9-14:用LA3242注射的地 中海实蝇野生型雌性;泳道15:SmartLadderTM。

图42:Bmdsx小基因构建体的图示。

示意性显示了源自家蚕蛾dsx基因的两种小基因构建体,以及这些构 建体的预测可变剪接(雌性模式显示在构建体的上方,雄性模式在下方)。 (A)是在Funaguma等.,2005中使用的家蚕蛾dsx小基因构建体,(B) 是pLA3435。A和B以下列若干方式彼此区别:(i)外显子1被排除在 pLA3435外,(ii)在pLA3435中去除了雌性特异性外显子3和4之间的 内含子,并插入了短异源序列,(iii)与使用了来自杆状病毒AcNPV的 hr5-IE1增强子/启动子和3’SV40 3’UTR的pLA3435相比,Funaguma等使 用了来自杆状病毒BmNPV的ie1启动子和BmA3 3’UTR,(iv)当与(A) 相比时,pLA3435使用稍微较长的内含子序列(序列参见图15)。示意性 显示了源自家蚕蛾dsx基因的两种小基因构建体,以及这些构建体的预测 可变剪接(雌性模式显示在构建体的上方,雄性模式在下方)。

图43:PBW中BMdsx小基因构建体的性别-特异性剪接。

利用RT-PCR由pLA3435的瞬时表达的分析显示出雄性中442bp片段 (泳道1、2、3和4)和雌性中612bp片段(泳道5)的存在,这显示具 有在外显子3和4之间插入的异源片段的BMdsx小基因能够在分支蛾, PBW中正确地剪接。标记是来自Eurogentec的SmartLadderTM;指示了大 约0.2、0.4和0.6kb的条带。

图44:冈比亚按蚊dsx的性别-特异性剪接。

按蚊(A)显示出Scali等,2005报告的剪接。然而,当利用我们的 引物(spl-agdsx-e3(SEQ ID NO.60)和spl-agdsx-m(SEQ ID NO.61))进行 RT-PCR时,对雌性显示出不同的剪接模式,由按蚊(B)表示。

图45:利用dsx引物鉴定雄性和雌性冈比亚按蚊。

从雄性和雌性冈比亚按蚊中提取RNA,并通过利用引物spl-agdsx-e3 (SEQ ID NO.62)和spl-agdsx-m(SEQ ID NO.63)的RT-PCR扩增dsx转录 物;上方的凝胶中显示了由此产生的带型。由白色箭头指示了对雄性和雌 性转录物预期的条带,对这些条带进行克隆和测序,并且它们与我们的dsx 转录物形式的预测序列相同(见SEQ ID NO.47(LA3359)和SEQ ID NO.48 (LA3433))。分子量标记以kb显示(来自Eurogentec的SmartLadderTM;尺 寸是大约的)。

图46:利用dsx引物鉴定雄性和雌性埃及黄热蚊

关于A和B的埃及黄热蚊RT-PCR引物是aedesxF1(SEQ ID NO.64) 和aedesxR5(SEQ ID NO.65),最初以蛹,即能够方便且准确地分辨性别 的埃及黄热蚊生命阶段,对它们进行了检验;由此产生的RT-PCR扩增显 示在凝胶图像(A)中。雄性和雌性蛹显示不同的性别特异性条带。然后 在来自幼虫的RNA提取物上检验引物,所述幼虫不能通过它们的形态学 而容易地分辨性别,且由此产生的RT-PCR扩增显示在凝胶图像(B)中。 幼虫显示出清楚的带型,所述带型明确地区别雄性和雌性。凝胶图像(C) 显示出大约600bp的条带,该条带来自利用引物aedessxF1和aedesxR2 (SEQ ID NO.66),从单独的雄性和雌性蛹进行的RT-PCR。该条带的测序 显示出雌性特异性剪接变体,其似乎不具有预测aedesxR5对其退火的雄 性共享的外显子(外显子7,见图56)。分子量标记以kb显示(来自 Eurogentec的SmartLadderTM;尺寸是大约的)。

图47:埃及黄热蚊dsx基因的部分的图示(不按比例)。

其上显示埃及黄热蚊dsx基因的片段。外显子5a和5b是雌性特异性, 且外显子6是雄性特异性外显子。发现了两种雌性-特异性剪接变体(F1 和F2),其包含外显子1-4,5b,6和7(F1)或1-4,5a(F2);雄性中的 转录物(M1)包含外显子1-4,6和7但无外显子5a或5b,且雄性和雌 性中显示出转录物(C1),其包含1-4和7但无外显子5a,5b或6。关于 每种外显子的#后的数字涉及contig1.370 (http://www.broad.mit.edu/annotation/disease vector/aedes aeqypti/),其以相 反的反向阅读,且*后的涉及SEQ ED NO.43显示的核苷酸序列。

图48:埃及黄热蚊dsx基因的图示。

其上显示完整的埃及黄热蚊dsx基因。外显子5是雌性特异性外显子, 且外显子6是推定的雄性特异性外显子。原则上,雌性中的转录物包含外 显子1,2,3,4,5和7,且雄性包含外显子1,2,3,4,6和7。关于 每种外显子的#后的数字涉及contig 1.370 (http://www.broad.mit.edu/annotation/disease vector/aedes aeqypti/),其以相 反的方向阅读,且*后的涉及图12。

图49:pLA1172的质粒图谱。

已将tTAV的编码区置于来自埃及黄热蚊actin-4基因的片段的控制下 (Munoz等2005),所述片段包括5’UTR、第一内含子和上游序列(推定的 启动子)。该构建体还包含tetO7 Nipper序列。该构建体具有piggyBac末 端和DsRed2标记,从而稳定地整合到基因组中。

图50:在LA1172转化体中tTAV的性别-特异性剪接。

从LA1172品系2雄性和雌性蛹提取的RNA的RT-PCR凝胶图像。使 用的引物是Agexon1(SEQ ID NO.67)和Tra(tTAV)seq+(SEQ ID NO.68)。 RT-PCR条带的测序显示在雄性和雌性中发生预测的剪接。图上显示的数 据是关于LA1172品系2的,品系8表现出完全相同的结果(数据未显示)。 标记是来自Eurogentec的SmartLadderTM;以kb表示大约尺寸)。

图51:野生型样品的RT-PCR,其显示出埃及黄热蚊Actin-4基因的性 别-特异性剪接变体。

从LA1172品系8的不同发育阶段和成虫解剖物中提取的RNA的 RT-PCR凝胶图像。使用的引物是Agexonl(SEQ ID NO.69)和外显子3 (SEQ ID NO.70)。凝胶图像显示由Actin-4基因的强烈表达仅发生在蛹阶 段,成虫表达通常仅限于雌性的胸节,其中发现了飞行肌的存在。表17, 见下,显示了每条泳道的内容。

表1.

更多实施例

实施例10:蛾。

我们最近基于我们的瞬时表达数据,使用源自家蚕蛾的重组小基因构 建体制造构建体。在以下标题为“蛾dsx序列排列和保守的基序”的部分 对其进行了进一步的讨论。

实施例11:使用Bztra

最近我们制造了两种基于Bztra的构建体,其表达在墨西哥按实蝇 (LA3376)中。LA3376提供可抑制的雌性-特异性致死性。LA3376先前已 经在地中海实蝇中显示出了功能和正确的剪接。用LA3376还产生了墨西 哥按实蝇(Mexfly(Anastrepha ludens))中的转化体。分析了它们Bztra 内含子的正确剪接,从而通过利用引物SRY和AV3F的RT-PCR证实了 Bztra内含子的系统发育范围(以上图15和“地中海实蝇RT-PCR凝胶” 部分)。这显示出墨西哥按实蝇中Bztra内含子的正确剪接。

实施例12:地中海实蝇中的Dmdsx(转基因地中海实蝇实例中的DmDsx: #797中的nipper融合)

最近我们还对地中海实蝇中的Dmdsx构建体获得了数据。该构建体使 用黑腹果蝇基因双性(doublesex)的片段,从而提供黑腹果蝇基因NipplDm 片段(我们称该片段为“nipper”)的性别-特异性表达。我们没有看到清 楚的性别-特异性剪接。然而,表型数据显示出一些性别-特异性;我们看 到了雌性增高的致死性,达到大约75%的渗透率。当然,该不完全的外显 率可能是因为地中海实蝇中表达水平,nipper毒性的缺乏,等。我们在雄 性数量上也获得的显著的减少,但是本试验中使用的tTA来源,即LA670, 自身能够杀死一些雄性。

我们还检验了三种独立的地中海实蝇转基因品系,其携带nipper与 DmDsx序列的融合物,所述融合物意欲在雌性中特异性表达。该构建体 不能充分地起作用,这可能是因为DmDsx需要的关于正确可变剪接和/或 Sxl结合位点的基本序列,且由于地中海实蝇在性别-决定途径中不使用 Sxl,DmDsx可能不能在地中海实蝇中,以正确的方式完全剪接该融合物。 然而,在全部三种品系中,与雄性相比,我们成功地可重复地以非常相似 的效率在雌性中引起增高的致死率(在雌性中观察到比雄性中大约高75% 的致死率)。这证明了dsx系统能够跨越关系相当远的物种(进化分离在 大约1.2-1.5亿年)起作用,且如果使用了Ccdsx序列,则由于DmDsx的 Sxl需要,它可以良好地起作用。

利用Tet014dsx剪接nipper(Pub EGFP)系统,显示了797结果如下。 它们显示出该系统在幼虫阶段是致死的(~50%),且可能在雌性中起到更 成功的作用(~75%)。用绿色(G)标记797,用红色(R)标记670。670 是tTAV来源,因此人们预期看到R+G蝇中的表型;单独的G(和R)是 对照。NF-非荧光(即,野生型)也是其中包括的对照。全部后代培养在 无tet的培养基上。

全部三种独立的品系似乎以相似的方式起作用。

797A/797A M2x 670A/+:

       蛹       成虫        雄性:雌性

G      184      176         85:91

R+G    74       57          44:13

797C/797C M1x 670A/+:

       蛹       成虫        雄性:雌性

G      169      157         89:68

R+G    94       67          54:13

797C/797C M2x 670A/+:

       蛹       成虫        雄性:雌性

G      406      377         179:198

R+G    171      147         121:26

670A/+x 797C/+M2:

       蛹       成虫        雄性:雌性

NF     198      192         92:100

G      162      147         67:80

R      149      72          43:29

R+G    45       22          20:2

全部3种品系的平均值:R+G雌性的数量=R+G雄性数量的21%,因 此与雄性相比,R+G雌性中存在大量超出的死亡率。该效应在单独R或 单独G对照雌性,或野生型中均没看到。

实施例13-15:

我们最近证明了:

(5)基于重组体Aadsx小基因构建体中的性别-特异性剪接;

(6)来自基于Cctra的构建体的性别-特异性表型;和

(7)基于伊蚊-Actin-4的构建体中的性别-特异性剪接。

至少这些实施例中每一个中的一些不仅显示出小基因,还实际上显示 出剪接,从而产生tTAV/tTAV2或ubi-tTAV2。

实施例13:伊蚊双性(dsx)小基因

还观察了标题为伊蚊dsx Tra2结合位点的部分。我们分离了埃及伊蚊 dsx基因(Aadsx),并从该区域鉴定了6种转录物(图1)。它们是:2种 雄性-特异性转录物(M1和M2),3种雌性-特异性转录物(F1,F2和F3), 和在雄性和雌性中都存在的转录物(MF)。我们还制造了2种小基因构建 体。在这些构建体中,删除了大多数内含子序列。例如,DSX小基因1 长度约为4.4kb,而其末端序列在其天然背景,即在埃及伊蚊基因组DNA 中,由大约26kb分隔开。

图1的小基因2中的剪接是有说明性的,因为剪接发生在雄性和雌性 的“雌性”形式中。这可能意味着该系统依赖于可变剪接接纳体的使用。 在该模型中,在可变剪接接纳体之间存在竞争,所述接纳体具有一些使其 产生倾向于此的性别-特异性因子,所述性别-特异性因子可能是Tra。但是 删除M1和M2的3’剪接接纳体通过去除二者之一,促使F形式中的剪接。

因此,优选地,与另外的3’剪接接纳体一起提供雌性-特异性(F1和/ 或F2)3’剪接接纳体中的一种或多种。最优选地,所述另外的剪接接纳体 是M1或M2剪接变体(或二者)的3’剪接接纳体,尽管设想了这不是必 要的,因为其他已知的3’剪接接纳体可能起作用。

图1说明了由埃及伊蚊双性基因(Aadsx)的可变剪接产生的不同转 录物。应该理解埃及伊蚊也称为埃及黄热蚊。该图显示了来自第四外显子 的Aadsx基因,其不是可变剪接的,即存在于在此讨论的所有转录物中。 编号开始自第四外显子(acgacgaact...)的第一个核苷酸。注意到图像不是按 比例的-内含子比外显子长得多。总可变剪接区域包含超过43kb。

该小基因片段包括在表达构建体(LA3515)中。利用Nimmo等的方 法,通过位点-特异性重组到attP位点中,生成转基因埃及伊蚊(2006: Nimmo,D.D.,Alphey,L.Meredith,J.M.和Eggleston,P(2006)。蚊基因组的 高效位点-特异性遗传工程(High efficiency site-specific genetic engineering of the mosquito genome)。昆虫分子生物学(Insect Molecular Biology),15: 129-136)。

类似地构建了第二个较小的小基因(DSX小基因2),并且将其表达 构建体插入到与DSX小基因1相同的attP位点,从而容许直接的比较 (LA3534)。DSX小基因2没有显示出性别-特异性剪接。这说明存在于 DSX小基因1中而非DSX小基因2中的序列(大约2029bp,见图1和SEQ ID NO.150,其中外显子存在于位置29-163和1535-2572)对正确的可变 剪接是必要的,即使两种构建体中均存在第一可变剪接的内含子和其紧密 侧邻的外显子序列。

我们利用埃及伊蚊dsx基因的小基因构建体,生成了两种转基因品系 (LA3491和LA3534)。LA3491是共享的外显子4、雌性-特异性盒外显子 和部分第一共享的3’外显子(转录物M1中的外显子5)的融合物。

通过反转录酶PCR(RT-PCR)和测序分析了来自LA3491的小基因区域 的转录物。与F2形式中的可变剪接相应的转录物存在于雌性而非雄性中 (图2和3),且在F1形式中,存在着一些雄性表达,但是非常低(图4)。 而在雄性而非雌性中检测到与M1形式相应的转录物(图2)。由于小基因 不包含M2变体的3’剪接接纳体,该转录物不可能来自该构建体。该小基 因不包含任何的外源性序列,尽管它清楚地证明了Aadsx片段,即实际上 高度删除的“小基因”片段的性别-特异性剪接。

应该显而易见地,某些序列对控制剪接是重要的,且应该因此被保留, 如别处讨论的。这可以简单地通过删除某些部分并利用例如RT-PCR检验 可变剪接来确定。

图2显示利用引物688-iel-transcr(SEQ ID NO.4)和790-Aedsx-m-r2 (SEQ ID NO.5),对来自LA3491埃及伊蚊转基因品系的雄性和雌性进行 的RT-PCR。利用这些引物,F2模式中的剪接应该给出大约985bp的条带, 而M1模式中的剪接应该给出大约516bp的条带。大约985bp的条带(F2) 仅出现在代表雌性的泳道中,且大约516bp的雄性特异性转录物1(M1) 条带仅出现在雄性中。对这些条带进行了测序,并且显示出发生了正确的 剪接,即分别地,F2-型和M1-型。无RT对照(-RTCON)中条带的缺乏 显示样品中没有基因组DNA污染。泳道1和11是标记(来自Eurogentec 的SmartLadderTM;指示了1.5kb-0.2kb的条带)。泳道2和3是阴性对照(无 反转录酶)且泳道2-9代表对来自标记的雄性或雌性中提取物进行的反应。

图3显示利用引物688-iel-transcr(SEQ ID NO.4)和761- Aedsx-fem-r(SEQ ID NO.6),对来自LA3491埃及伊蚊转基因品系的雄性 和雌性进行的RT-PCR。利用这些引物,F2模式中的剪接应该给出大约 525bp的条带。大约525bp的条带出现在对来自雌性的提取物的反应中, 但是不来自对来自雄性的提取物的相应反应。该525bp条带的测序证实了 发生了正确的,即F2-型剪接。标记(来自Eurogentec的SmartLadderTM; 指示了1.5kb-0.2kb的条带)。

图4显示利用引物688-iel-transcr(SEQ ID NO.4)和AedsxRl(SEQ ID NO.4),对来自LA3491埃及伊蚊转基因品系的雄性和雌性进行的RT-PCR。 利用这些引物,F1模式中的剪接应该给出283bp的条带。大约283bp的条 带主要出现在雌性中,尽管存在着雄性中有少量剪接的证据。测序证实了 该条带的确对应于F1模式中的剪接。标记(来自Eurogentec的 SmartLadderTM;指示了1.5kb-0.2kb的条带)。

除3’大约2kb的删除外,LA3534与LA3491相同。该构建体在雄性 和雌性间显示出区别性剪接(图1,小基因2)。没显示关于该情形的RT-PCR 凝胶。基于这些结果,设计了若干构建体,从而将LA3491的性别-特异性 剪接(图1,小基因1)引入到正向-反馈系统中。设计了LA3612(图5), 使得当产生F2雌性转录物时,泛蛋白被裂解且释放tTAV2,从而起始并 维持正向反馈系统,其中所述LA3612将泛蛋白和tTAV2的融合物引入到 dsx编码区中。LA3619(图5)具有无泛蛋白并使用其自身翻译起始密码 子的tTAV2。LA3646(图5)除诱变了关于dsx基因的起始密码子外与 LA3619相同;这应该提高通过去除非-特异性翻译产生的tTAV2的数量。

图5是基于埃及伊蚊dsx小基因中剪接的质粒的图示。为了清楚,应 该理解第一雌性内含子代表F1,F2或F3剪接中任一种,且图中的tTAV 指tTAV2(应该理解能够备选地使用其他蛋白质或其他形式的tTA或 tTAV)。在这些质粒中的每一种中,除了LA3491,向F2外显子添加异源 序列。“推定的ATG”代表相对于异源DNA位于5’的外显子序列中任意 的ATG三联体序列。在LA3646中,去除或修饰了这些推定的翻译起始密 码子(“推定的ATG”)。在LA3612构建体的情形中,来自上游(5’)ATG 的翻译,其符合ubi-tTAV编码区的读框,在由蛋白酶作用分离泛蛋白和 tTAV部分后,应该仍然产生功能性tTAV(设想没有居间的终止密码子)。 将不同的可变剪接盒可操作地与合适的启动子、转录终止子和其他调节序 列相连接。

该实施例显示出在异源背景中(即,异源启动子,5’UTR和3’UTR) 高度压缩的“小基因”片段的性别-特异性剪接。尽管它不显示非Aedes 序列的差异表达,因为可变剪接的外显子源自Aadsx基因,且不包含另外 的物质,但是它确实清楚地说明了该方法的可行性。在任何情形中,启动 子、5’UTR和3’UTR是异源的。我们有另外的构建体,其说明了用于通 过该dsx获得异源蛋白质差异(性别-特异性)表达的若干不同方法。

TRA序列对比

Pane等.(2002)提示与果蝇中Tra/Tra-2复合物的已知结合位点有关的 某些序列在调节Cctra的剪接中可能是重要的,且这对果蝇dsx也是已知 的,并且还对冈比亚按蚊dsx进行了提示(Scali等2005)。将共有序列不 同地描述为

UC(U/A)(U/A)C(A/G)AUCAACA(Pane等),SEQ ID NO.8,或

UC(U/A)(U/A)CAAUCAACA(Scali等,2005),SEQ ID NO.9。

值得注意地,这些定义是非常相似的。Pane等识别了与Cctra序列中 的这个共有区的8个部分匹配(7个或更多核苷酸匹配13个核苷酸的共有 序列)。Scali等在Agdsx中识别了6个匹配(9/13或更好)。还已知这样的 序列调控果蝇基因fruitless的可变剪接;Scali等对该序列中的3个匹配进 行综述(12/13或更好)。如Scali等讨论地,dsx的正确剪接还可以需要富 含嘌呤的区域。

如能够从表2和图7中观察到的,在我们的埃及伊蚊dsx小基因1中, 我们识别了被认为是Tra/Tra2结合位点的显著群集。

蛾dsx序列对比和保守基序

图6显示了来自棉红铃虫(棉红铃虫,PBW-dsx,SEQ ID NO.146)、蚕 (家蚕蛾,bombyx-dsx,SEQ ID NO.147)和苹果皮小卷蛾(苹果皮小卷蛾, codling-dsx,SEQ ID NO.148)的第二雌性-特异性外显子和dsx基因的旁侧 序列的对比。以粗体表示第二雌性-特异性外显子。我们鉴定了短的重复核 苷酸序列的多个拷贝,其在序列中是保守的,且大约位于这些相对关系疏 远的蛾之间;这些正好位于雌性-特异性外显子的5’。在保守重复序列 AGTGAC/T下划线。星号(*)代表相同的核苷酸,横线(-)代表为获得 最佳对比的空隙。通过下列核苷酸编号,以SEQ ID NOS表示外显子:SEQ ID NO.146 289-439;SEQ ID NO.147 339-492;和SEQ ID NO.148 285-439。

伊蚊dsx Tra2结合位点

在雌性黑腹果蝇中,Tra和组成型活性基因tra2的产物通过与dsx的 前mRNA上的剪接增强子位点的结合起到剪接调节子的作用,这激活雌 性-特异性外显子的弱3’接纳体位点(Scali等)。在雄性中,不存在TRA 的表达,且没识别出弱3’接纳体位点,并且剪接发生在雄性外显子处。为 了寻找推定的Tra/Tra2结合位点,我们使用了这些对果蝇Tra/Tra2推断的 结合位点的共有序列,并在埃及伊蚊dsx基因序列中寻找这些的分布。这 显示在表2中,见下。

       名称      序列    w=T或A         r=A或G          在小基因 1中存在       位置      与共有     序列的同一性            与wwcrat 的同一性            SEQ ID  NO.  共有区 tcwwcratcaaca / / /13 /6 138 1 tcaacaagcaaca Y 14917 12 5 10 2 ttatcaaacaaca Y 364 11 5 11 3 tcatcaattaaaa 1015 11 6 12 4 tcatcaatcaaac 6502 11 6 13 5 tcttcaaccaacc Y 14958 11 5 14 6 cctacaatctaca Y 14973 11 6 15 7 tcttagatcaaaa 16553 11 5 16 8 tcttcgatcatta 17386 11 6 17 9 ccaacaatctaca 28802 11 6 18 10 tcaaagatcacca 42096 11 5 19 11 tcttcggtcgacg Y 256 11 5 20 12 tcgacaaacaaaa 1277 11 <5 21 13 tattcaaacaacg 4061 11 5 22

  14 ttttcgataaaaa 4380 10 6 23 15 tcttcagtctgca 5399 10   5 24 16 gattcaatcatca 7723 10 6 25 17 ttatcgagcaaaa 8137 10 5 26 18 tcataactcaaga 9062 10 <5 27 19 tcagaaatcaaaa 9126 10 <5 28 20 tctttaatttaca 10639 10 5 29 21 tttacaatcctca 10646 10 6 30 22 tcatagatcagga 11214 10 5 31 23 acctcaaacaaca 11989 10 <5 32 24 tcatcgaacaccc 12020 10 5 33 25 tcaataatcgtca 12199 10 5 107 26 tcatcaaacgtca 13287 10 5 108 27 ttatcgttaaaca Y 13439 10 5 109 28 taaacagtcaata Y 13446 10 5 110 29 tacacgatcagca Y 14096 10 5 111 30 aatacaaacaaca Y 14637 10 5 112 31 tcatcaacaagca Y 14914 10 5 113 32 tctacaaaccaga Y 14980 10   5 114 33 acatcgattcaca 16085 10 6 115 34 cgctcaatcaaca 16175 10 5 116 35 tctaccataaaaa 16511 10 5 117 36 aaatgaatcaaca 20044 10 5 118 37 acatcgttcaacg 21374 10 5 119 38 tcttgattcacca 21580 10 <5 120 39 tctgcagacaaca 22408 10 <5 121 40 tcttcggtaatca 23285 10 5 122 41 tctataaacaata Y 25436 10 <5 123 42 taaacaataaata Y 25440 10 6 124 43 taaacaagcaaaa 28242 10 5 125 44 tcaacgatcggcg 30309 10 6 126 45 tgatccatcatca 30910 10 5 127 46 tcaacatgcaaga 32295 10 <5 128 47 tcttaaataaaga 32862 10 5 129 48 tcaaagatctata 40551 10 5 130 49 taatgaattaaca 40847 10 5 131 50 tttaccatcaact 41712 10 5 132 51 taatgaaacaaca 43380 10 <5 133 52* gtttcaattaaaa Y 13500 9 6 134 53* tattcaattataa Y 13602 9 6 135 54* tcttcaatcgttt Y 15002 9 6 136 55* tcaacgatccttt Y 15533 9 6 137

表2:*=在3491中,同一性仅9/13,但在核心区中是6/6。该表除了 在3491中与wwcrat核心序列具有6/6同一性的那些外,不包括9/13的同 一性。该共有区的核心序列(WWCRAT)是特别优选的。

图7是质粒LA3491的dsx编码区中推定的Tra/Tra2结合位点的图示。 该图是近似按比例的,并代表大约4kb的序列。我们能够计算随机匹配 Tra/Tra2共有序列的机会。假设全部4个核苷酸以相等的频率出现,则随 机序列中任何给定的核苷酸是与共有区10/13或更好匹配的第一个核苷酸 的机会是约7 x 10-4。因此,人们应该预期略微低于1个所述匹配/所述随机 序列的1000个核苷酸。对其的计算如下:

性别-特异性剪接:概率

问题

结合位点共有序列由13个碱基组成。那些(固定的)位置中的10个 (将这组称为X)必须各自是一个特异性碱基。其他三个(将这组称为Y) 可以各自是两个特异性碱基之一。假设每个可能的碱基A、G、C和T是 同等可能的,且位于每个位置处的碱基不依赖位于其他位置处的碱基,随 机选择的13个碱基的序列与该序列正确匹配的概率是多少?接近错配的 这样的序列的概率是多少(容许多达1、2、3或4个差别)?下表2中提 供了答案,并在其后显示了计算解答。

答案

表3

计箅解答

到3d.p.(3d.p.下面全部)

P(正好1个位置的错配)=P(10X位置中的1个错配或3Y位置中 的1个错配)

= P 1 = 10 ( 1 4 ) 9 ( 3 4 ) ( 1 2 ) 3 + 3 ( 1 4 ) 10 ( 1 2 ) 3 = ( 10 × 3 ) + 3 4 10 × 2 3 = 33 2 23 = 3.934 × 10 - 6

P(正好2个位置的错配)=P(10X中的2个错配或10X中的1个和 3Y中的1个错配或3Y中的2个错配)

= P 2 = 10 ! 2 ! 8 ! ( 1 4 ) 8 ( 3 4 ) 2 ( 1 2 ) 3 + 10 × 3 ( 1 4 ) 9 ( 3 4 ) ( 1 2 ) 3 + 3 ( 1 4 ) 10 ( 1 2 ) 3

= ( ( 45 × 3 2 ) + ( 30 × 3 ) + 3 ) 2 23 = 498 2 23 = 249 2 22 = 5.937 × 10 - 5

P(正好3个位置的错配)=P(10X中的3个错配或10X中的2个和 3Y中的1个错配或10X中的1个和3Y中的2个错配或3Y中的3个错配)

= P 3 = 10 ! 3 ! 7 ! ( 1 4 ) 7 ( 3 4 ) 3 ( 1 2 ) 3 + 10 ! 2 ! 8 ! 3 ( 1 4 ) 8 ( 3 4 ) 2 ( 1 2 ) 3 + 10 × 3 ( 1 4 ) 9 ( 3 4 ) ( 1 2 ) 3 + ( 1 4 ) 10 ( 1 2 ) 3

= ( ( 210 × 3 3 ) + ( 45 × 3 3 ) + ( 30 × 3 ) + 1 ) 2 23 = 5356 2 23 = 1339 2 21 = 6.385 × 10 - 4

P(正好4个位置的错配)=P(10X中的4个错配或10X中的3个和 3Y中的1个错配或10X中的2个和3Y中的2个的错配或10X中的1个 和3Y中的3个错配)

= P 4 = 10 ! 4 ! 6 ! ( 1 4 ) 6 ( 3 4 ) 4 ( 1 2 ) 3 + 10 ! 3 ! 7 ! 3 ( 1 4 ) 7 ( 3 4 ) 3 ( 1 2 ) 3 + 10 ! 2 ! 8 ! 3 ( 1 4 ) 8 ( 3 4 ) 2 ( 1 2 ) 3 + 10 ( 1 4 ) 9 ( 3 4 ) ( 1 2 ) 3

= ( ( 210 × 3 4 ) + ( 120 × 3 4 ) + ( 45 × 3 3 ) + ( 10 × 3 ) ) 2 23 = 27975 2 23 = 3.335 × 10 - 3

P(多达1个位置的错配)

= P 0 + P 1 = 1 + 33 2 23 = 17 2 22 = 4.053 × 10 - 6

P(多达2个位置的错配)

= P 0 + P 1 + P 2 = 1 + 33 + 498 2 23 = 532 2 23 = 133 2 21 = 6.342 × 10 - 5

P(多达3个位置的错配)

= P 0 + P 1 + P 2 + P 3 = 1 + 33 + 498 + 5356 2 23 = 5888 2 23

            = 23 2 15 = 7.019 × 10 - 4

P(多达4个位置的错配)

= P 0 + P 1 + P 2 + P 3 + P 4 = 1 + 33 + 498 + 5356 + 27975 2 23 = 33863 2 23

               = 4.037 × 10 - 3

试验14:Cctra

我们有一种LA3097品系(LA3097A),其显示出其荧光标记非常好的 表达;不知道该品系是否是单整合的结果。该品系的确显示出性别-特异性 剪接的证据,当去四环素饲养时,全部雌性在胚胎时期死亡,且当以 30μg/ml四环素饲养时,雄性和雌性均存活。

该实施例是重要的。它显示在伊蚊中Cctra提供性别-特异性可变剪接, 且这能够用于提供性别-特异性致死性。因此,这提供了关于Cctra剪接系 统发育范围的证据。由此,能够将本发明应用于全部双翅目似乎完全有可 能,因为我们显示了Cctra在果蝇、tephritids和蚊中起作用,所述果蝇、 tephritids和蚊基本跨越了整个双翅目种类。

令人惊讶地,假设tra的快速序列进化,Cctra在伊蚊中起作用。

我们用构建体LA3097转化埃及伊蚊。来自由此产生的转基因品系的 杂合雄性与野生型杂交,并在增补了最终浓度30μg/ml的四环素的水性培 养基中饲养其后代。如下重新获得成虫:14只雄性和1只雌性,由此显示 出显著的雌性-特异性致死性。

该物种和品系通常具有大约1:1的性别比,因此该构建体在埃及伊蚊 中提供了雌性-特异性致死性。不含有Cctra内含子序列的等价构建体提供 非-性别-特异性致死性。因此,Cctra内含子能够用于在蚊中提供基因表达 的区别性(即,性别-特异性)调节,且其能够进一步用于提供性别-特异 性致死性和用于从种群中选择性消除雌性的方法。

更详细地:在0μg/ml四环素时,雄性仅存活至蛹,即不发育到成虫。 雌性死亡得非常早以至于我们没有看到它们,可能在胚胎时,因此在性别 之间仍然存在着区别性效应。然而,雄性中蛹的致死性提示该系统在雄性 中不是完全关闭的。我们重新获得的单插入品系是不寻常的,因为其显示 出非常强烈的标记表达;其他具有更多典型性表达水平的插入有充分的理 由可以不显示雄性致死性。

LA3097A中的剪接

通过RT-PCR对来自LA3097A转基因蚊的LA3097的剪接的分析显示 雄性和雌性共享两种转录物,大约950bp的条带和大约800bp的较暗条带 (图59)。这些条带的测序显示~900bp的条带对应于非-性别-特异性剪接 变体(AeM2,~920bp),且较暗条带是非-性别-特异性剪接变体(AeM1, ~804bp)和雌性形式(AeF1,~765bp)的混合物,见图60。AeF1转录物 的剪接与对地中海实蝇中该构建体所显示的相同(图33)。M转录物的剪 接与在天然背景(地中海实蝇中的Cctra剪接,天然基因或如我们从转基 因地中海实蝇中LA3097观察到的)中观察到的略不同;在AeM1中,第 二可变剪接的外显子(ME1b)不包含在成熟的AeM1转录物中,且在AeM2 中,第二可变剪接的外显子(ME2b)类似地不包含在成熟的AeM2转录 物中。换言之,对于这些转录物中的每一种,相对于地中海实蝇原型,存 在第一而非第二盒外显子。注意,作为AeM1中缺乏第二盒外显子,和在 该构建体中相对于第一盒外显子的tTAV2阅读框的结果,以AeM1模式的 剪接不引起tTAV2开放阅读框的中断,而是在ATG和剩余的tTAV2开放 阅读框之间添加39个核苷酸(相当于13个氨基酸)。可能地,该tTAV2 变体相对于正常或原型tTAV2(如由F1剪接变体编码的)可以保持一些 活性。在缺乏四环素的情形中,在雄性和雌性中观察到表型效应,尽管在 雄性中比在雌性中更弱。来自雄性(和雌性)中AeM1转录物的部分活化 的tTAV2变体的产生可以对其进行解释。

图59—显示利用引物HSP(SEQ ID NO.139)和VP16(SEQ ID NO. 140),对来自LA3097A埃及伊蚊转基因品系的雄性和雌性进行的RT-PCR。 利用这些引物,处于CcF1模式中的剪接(即相应于地中海实蝇的F1变体) 应该提供大约765bp的条带,且处于CcM1的剪接提供1005bp,和处于 CcM2的剪接提供1094bp。在雄性和雌性中,连同大约800bp的暗条带(2) 一起观察到大约950bp的强条带(1)。标记(来自Eurogentec的 SmartLadderTM,指示了1.5kb-0.4kb的条带)。

来自雄性和雌性条带2(即,AeM1/AeF1剪接变体)的若干克隆的序 列分析显示来自雌性的5种克隆中的一种显示出AeM2剪接(20%),而 在雄性中,四种克隆中的三种显示出AeM2剪接(75%);全部其他克隆 显示出AeF1剪接。这说明了在雌性中存在比雄性中更多的AeF1转录物, 且这应该解释在它们之间观察到的区别性杀死效应。

图60举例说明了由来自LA3097A埃及伊蚊转基因品系的Cctra可变 剪接产生的不同转录物。3097代表Cctra的DNA序列,且数字涉及别处 描述的图。阴影和框也涉及图33。注意,该图不是按比例的。

实施例15:伊蚊Actin-4

我们有11种LA3545品系,其使用伊蚊actin-4基因(AeAct-4或 AaAct4)驱动tTAV2的表达。在构建体LA3545中,将编码tTAV2的序列 插入到AaAct4的第二外显子中(图10)。对于以特征为雌性中AaAct4剪 接的模式剪接的转录物,tTAV编码区的ATG应该是转录物的第一个ATG (紧邻5’)。以特征为雄性中AaAct4剪接的模式的剪接在tTAV2序列前引 入一批起始和终止密码子,其倾向于抑制或干扰从tTAV2编码区的ATG 开始的翻译。这些品系应该在雌性蛹中仅表达tTAV2。图8中显示了该剪 接,见下。

图8显示利用引物Agexon1F(SEQ ID NO.141)和TETRR1(SEQ ID NO. 142),对来自LA3545AeC埃及伊蚊转基因品系的雄性和雌性成虫进行的 RT-PCR。利用这些引物,处于与天然AaAct4基因等同的模式中的剪接应 该为雌性-类型剪接变体提供大约347bp的条带,和为雄性-类型剪接变体 提供大约595bp的条带。大约347bp的条带(F)仅存在于对来自雌性的 提取物的反应中;大约595bp的条带(M)存在于雄性和雌性二者中。测 序证实正确的剪接发生在雄性和雌性二者中。标记(来自Eurogentec的 SmartLadderTM,指示了1.5kb-0.2kb的条带)。

我们还有携带构建体LA3604的转基因埃及伊蚊,所述构建体LA3604 除了在外显子1的部分中具有改造的起始密码子外,与LA3545相似,所 述外显子存在于雄性-类型和雌性-类型转录物中(图10)。将其安排为每 种转录物类型中的第一个ATG。LA3604编码与泛蛋白融合的tTAV2 (LA3545编码tTAV,而LA3604编码ubi-tTAV2)。该构建体应该仅在雌 性中产生完全功能性tTAV2蛋白,即使雄性形式表达在雌性中,另外的雄 性外显子含有若干阻止Ubi-tTAV2融合蛋白翻译的起始和终止密码子。

AaAct4的可变剪接发生在(天然基因的)5’UTR中。它在天然基因中 可以或可以不具有调节功能。一种可能性如下:在雌性-特异性剪接变体中, AaAct4编码区的起始密码子是转录物的第一个ATG。然而,在雄性-特异 性剪接变体中存在若干位于AaAct4编码区的起始密码子5’的另外的ATG 序列;这些中的大多数具有符合读框的终止密码子短距离3’。该序列排列 可干扰AaAct4蛋白的有效翻译,并由此与雌性相比,减少雄性中蛋白质 的表达。这是LA3545中的排列。

然而,如果内含子包含在编码区(而非5’UTR)内,即插入到生物体 中用于表达的多核苷酸起始和终止密码子之间,则应该预期雄性和雌性之 间更加不同的效应。在该情形中,雄性-特异性盒外显子将改变转录物的编 码潜力,而不是简单地干扰翻译。

这在构建体LA3604中实现。我们修饰共享的第一外显子,从而在对 于翻译的起始合适的序列背景中包含ATG序列。在该修饰的序列中,这 是在雄性-类型(M)或雌性-类型(F)剪接变体中的第一个ATG。在以F 形式的剪接后,该(改造的)5’ATG符合ubi-tTAV编码区的读框。F-类型 的转录物因此编码融合蛋白,其包括由(i)通常Act4 5'UTR的一部分(但 是此处显然是翻译的,且因此完全不是UTR),(ii)泛蛋白编码区和(iii) tTAV2编码区编码的部分。

细胞泛蛋白蛋白酶的活性应该释放tTAV2蛋白。从改造的5’ATG开始 的翻译应该由符合读框的终止密码子终止,所述终止密码子存在于以M形 式剪接的转录物中的另外的序列(盒外显子)中。这应该因此阻止功能性 tTAV2在雄性中的表达,由此提供tTAV2的性别-特异性表达。显然,通过 用另一种目的蛋白质或序列替换tTAV2区段,这提供了用于性别-特异性 表达蛋白质的一般方法。利用该方案,我们提供了转基因学并显示了性别 -特异性剪接(图9)。

图9显示利用引物Agexon1F(SEQ ID NO.141)和TETRR1(SEQ ID NO. 142),对来自LA3604AeA埃及伊蚊转基因品系的雄性和雌性进行RT-PCR。 利用这些引物,在雌性形式中的剪接应该提供大约575bp的条带,而包含 雄性-特异性盒外显子应该将其增至大约823bp。从分析的每只雌性中观察 到大约575bp的条带,而从分析的每只雄性中观察到大约823bp的条带。 这些条带似乎基本特异于各自的性别。这些条带的测序显示正确的剪接发 生在雄性和雌性二者中。标记:来自Eurogentec的SmartLadderTM,指示 了1.5kb-0.2kb的条带。

图10,见下,是质粒LA3545和LA3604的图示。S1:共享的外显子 1;M1:雄性-特异性外显子1中包含的另外的序列;S2:共享的外显子2 (仅在5’末端);ubi:编码泛蛋白的序列;tTAV2:编码tTAV2的序列。

在若干LA3545转基因品系中观察到了性别-和组织-特异性效应:雌 性不能飞行。所述品系中的两种显示出90-100%的雌性不能飞行表型,一 种品系显示出70%不能飞行,和另一种显示50%的不能飞行。该表型大概 是由于在飞行肌的发育中tTAV2的雌性-特异性表达。品系间表型的差别 是由于对AaAct4启动子表达的位置效应。由于基因组表达中基因位置能 够受许多因子(异染色质或常染色质区域、增强子和抑制子元件、与其他 基因的近似性)的影响,所述因子能够以用于识别转基因的荧光标记容易 地看到。识别了全部11种LA3545品系,因为即使它们具有相同的启动子 和标记,它们具有不同的荧光分布。这些变化是由于位置效应。那么这意 味着由于位置效应,我们应该预期一些LA3545品系比其他品系表达更多 的tTAV2,且那些的确表达更多的品系将给出雌性-特异性不能飞行的表 型。

为了检验该假说,我们发展了单独的具有tetO-DsRed2报告基因的埃 及伊蚊品系(LA3576,见图17和SEQ ID NO.143),当与不同的LA3545 品系杂交时,其应该容许Actin-4-tTAV2表达的位置和时间的视觉化。在 与LA3576杂交的8种LA3545品系中,在晚期L4幼虫、蛹和成虫中全部 显示出了雌性-特异性间接的飞行肌荧光。在所述品系的4种中,DsRed2 表达似乎特异于(即,排他的)雌性间接飞行肌;在其他4种中,另外的 组织显示出DsRed2的表达。其中转基因的表达部分依赖于将其插入基因 组中的区域或位点的该现象,叫做位置效应,且应该是本领域技术人员所 熟知和理解的。

利用LA3576证明了LA3604中tTAV2的表达是雌性-特异性的,主要 发生在间接飞行肌中,并且是阶段-特异性的。然后构建了若干不同的tetO- 效应子构建体,以分析它们的效应。tetO-MichelobX转基因(LA3582,见图 15和SEQ ID NO.144)当与LA3545杂交时,全部显示出雌性-特异性的不 能飞行表型,该表型能够被四环素抑制。这证明Actin-4能够用于以阶段、 组织和性别-特异性方式驱动效应子基因。

因为一些LA3545品系在不存在诱导的效应子基因的条件下,具有雌 性-特异性不能飞行表型,这显示tTAV2能够起效应分子的作用。tTAV2 由tTA,即tetO结合结构域和VP16,即单纯疱疹病毒蛋白组成。VP16通 过利用其氨基-末端序列附着于一种或多种宿主-编码的蛋白质,活化即时 早期病毒基因的转录,所述宿主-编码的蛋白质识别它们启动子中的DNA 序列。在LA3604中,加入tetO-VP16效应子基因,从而增强tTAV2的效 应。在LA3604的三种转基因品系中,当无四环素饲养时,这引起了100% 的雌性-特异性不能飞行表型,从而显示出VP16是有效的效应分子。注意, LA3604具有改造的在可变剪接内含子5’的潜在起始密码子(ATG)。因此, 在该构建体中,预期雄性-特异性外显子中断开放阅读框编码tTAV (ubi-tTAV);由于雄性-特异性序列含有若干终止密码子,所以其应该倾 向于减少或消除雄性中功能性tTAV的产生。通过比较的方法,在LA3545 中,雄性-特异性外显子位于tTAV起始密码子的5’。然而,通过向tTAV 起始密码子(其为雌性转录物而非雄性转录物的第一个ATG)的5’插入许 多起始密码子,这些另外的起始密码子对功能性tTAV的有效产生都不适 合,其原因在于它们位于框外或具有介于其间的终止密码子,该排列也应 该倾向于减少或消除功能性tTAV在雄性中的产生,这与以上的表型数据 相一致。

实施例16:使用泛蛋白和内含子定位

我们最近获得了基于Cctra的构建体,其具有处于不同背景,即侧邻 不同序列的Cctra内含子盒。构建了携带它们的不同品系的转基因地中海 实蝇。这显示出该系统普通且有效的,即它应该对广泛范围的目的异源序 列起作用。

我们还有至少一种最近获得的提供正确剪接的Cctra-ubi-tTAV融合物 的实例(DsRed-cctra-ubi-tTAV)。

功能性蛋白的优选实例将关于泛蛋白或tTA,或它们的功能性突变体 和或变体诸如tTAV、tTAV2或tTAV3的编码序列置于内含子的3’。排列 了这些,以使得这些元件基本邻接内含子的3’末端,更优选地,使得编码 区起始在3’内含子的20个或更少核苷酸边界内,且最优选地,紧密邻接 内含子的3’末端,尽管如果使用泛蛋白系统,这较小地关联。

按照本发明的构建体的优选的实例列于表4中,见下。应该理解 LA1188不在本发明的范围内,因为它不编码功能性蛋白,即它不恰当地 起作用。认为这是因为未预料到的使用了位于与Cctra内含子序列接点的 5’4bp的剪接供体,从而导致在全部剪接中诱导移码。因此,包括它仅为 了信息。

表4

表4显示含有源自tra内含子的剪接控制序列的构建体。内含子源自 地中海实蝇,桃果实蝇或纳塔耳小条实蝇(见栏2)。将所述内含子插入到 编码区内,这样,在推定的起始子ATG和外显子的最后核苷酸之间的距 离如栏3中显示,所述外显子紧接在tra内含子的前面。如栏4中所示, 将内含子插入到或邻接于泛蛋白、tTAV、reaperKR、nipper或泛蛋白-DsRed 的编码区。它们在地中海实蝇中,和在一些情形中,也在黑腹果蝇(LA3077) 或墨西哥按实蝇(LA3097,LA3233,LA3376)中产生,并通过RT-PCR或表 型显示出其成功地剪接。另外,ATG和紧接在tra内含子(假设以F1-样 形式剪接)前面的外显子末端之间的距离在不产生对剪接不利结果的条件 下,能够在0bp-至少+949bp的范围内(见表4,栏3)。因此,合理地假 设了该距离能够高达至少900,且优选地高达至少949bp。

表5中总结了关于这些实例更多的信息。优选的选择是不使用内源序 列来获得表达的正确可变剪接控制(表4中+0bp)。我们优选将tra内含子 插入到待可变剪接的目的蛋白编码区内的旁侧二核苷酸TG...GT之间,从 而确保正确剪接,因为这可能很重要,然而,如果必要的话,我们不应该 使自己受限于此,因为其他旁侧核苷酸也可以正确地起作用。实例LA1038, LA3054和LA3056包括一些来自天然Cctra基因的内源旁侧外显子序列。 在表5中,如果与剪接接点3’或5’的特殊融合包括6个或更少核苷酸(包 括ATG起始密码子),为了该表的总结目的,未将这些认为是该融合的一 部分。可以将表4和表3联系起来,从而发现每个实例中使用那种tra内 含子(Cctra,Bztra或Crtra)。同样,包括LA1188仅为了信息的目的,且 超出了本发明。

表5

如上提及地,当将内含子置于蛋白质编码区(ORF-X)的5’时,优选 地定位或使用位于内含子3’,ORP-X的5’的泛蛋白,因此并提供雌性-特异 性ORF-X调节,同时引起序列和tra内含子间的物理分离,由此减少ORF-X 中序列会干扰tra内含子剪接的机会。

还设想了组合构建体和序列,例如具有下列形式:

X-ubi-Y

其具有在编码区X和编码泛蛋白(ubi)的区域之间,或在泛蛋白编 码区之内,或在编码泛蛋白的区域和编码区Y之间插入的可变剪接的内含 子。因此X应该在无需考虑内含子剪接的条件下表达,而Y仅在内含子 以合适的形式剪接时表达。该一般类型的更多结构和排列对于本领域技术 人员应该是显而易见的。其一些实例是LA3014,LA3054,LA3056,LA3166, LA3488和LA3596,它们全部以该方式使用泛蛋白融合物,从而证明了将 该想法成功地应用到转基因地中海实蝇中的能力。转基因蚊的备选实例包 括LA3604和LA3612,这显示出该系统的广泛系统发育适用性不仅在不 同的物种(蚊和地中海实蝇)中,还在不同的背景,包括AaActin4,Aadsx 和Cctra中。

LA3596(见图67和SEQ ID NO.145)是与LA3488相似的设计,预 期其在两种性别中产生绿色荧光(通过表达细胞核定位的TurboGreen荧 光蛋白),但仅在雌性中产生红色荧光(通过表达细胞核定位的DsRed2荧 光蛋白)。这是通过这两种蛋白质的融合完成的,所述蛋白质由Hr5-Ie1增 强子/启动子盒驱动,与短11个氨基酸的连接体(SG4连接体)和编码区 连接在一起,所述编码区包含泛蛋白(具有一个预期的点突变,从而通过 减少其向泛蛋白调节的降解的倾向,稳定由此产生的蛋白质)和Cctra内 含子,从而将DsRed2的表达限制于雌性。用该构建体产生了转基因地中 海实蝇。如所预料地,在该品系中红色荧光被限制于雌性,而在全部雄性 和雌性中均观察到绿色荧光。这可以通过对特殊荧光蛋白的荧光筛选,用 于性别分离,在该情形中,红色荧光代表DsRed2的表达。

实施例17:更多的Cctra范例

在其他实施例中,也对LA3014和LA3166以及由其获得的表型数据 进行了参考。

先前,我们制备并获得了具有在除tTAV外的功能性蛋白中的Cctra 内含子的转基因,见LA3014和LA3166。LA3014在Cctra内含子的下游 含有泛蛋白-reaperKR融合物。表型数据显示LA3014转基因地中海实蝇提 供可抑制的雌性-特异性致死性。利用引物和ReaperKR,对从去四环素饲 养的成年雄性和雌性提取的RNA进行的RT-PCR分析证明正确的剪接发 生在雌性中(508bp的条带),且在雄性中没有发现该条带(图37)。LA3166 是另一种具有Cctra内含子的构建体,所述Cctra内含子置于与reaperKR融 合的泛蛋白编码区内,但置于泛蛋白的不同位置。LA3166还在地中海实 蝇中产生显性的可抑制雌性-特异性致死效应。

LA1038是处于不同序列背景中Cctra内含子用途的一个新型实例,在 此将其置于叫做“nipper”的Nipp1Dm片段中,所述“nipper”在通过RT-PCR 分析时,也在转基因地中海实蝇中正确剪接(图12)。需要LA670作为tTAV 来源,从而驱动可变剪接的nipper的表达。

我们最近还制备并获得了具有基于‘单独内含子’Cctra的构建体的转 基因,所述构建体具有在不同基因中(许多以上实例,除非另外明显地, 在tTAV或其变体之一,即tTAV2或tTAV3中)的内含子。这些构建体如 预期地工作。这是重要的结果,因此显示出在Cctra中不存在基本外显子 序列,所述Cctra是我们在tTAV中意外地简单复制(以功能,如果不需要 以序列)出来的。我们还有该类型的ubi-rprKR构建体(LA3014和LA3166), 其也使如上所述的泛蛋白融合方法生效。如在实施例16中所述,通过 LA3054,LA3056和LA3488的RT-PCR分析进一步示范了泛蛋白的融合方 法(图11、13、14),见上。

实施例17:更多的Cctra范例

在其他实施例中,也对LA3014和LA3166以及由其获得的表型数据 进行了参考。

先前,我们制备并获得了具有在除tTAV外的功能性蛋白中的Cctra 内含子的转基因,见LA3014和LA3166。LA3014在Cctra内含子的下游 含有泛蛋白-reaperKR融合。表型数据显示LA3014转基因地中海实蝇提供 可抑制的雌性-特异性致死性。利用引物和ReaperKR,对从去四环素饲养 的成年雄性和雌性提取的RNA进行的RT-PCR分析证明正确的剪接发生 在雌性中(508bp的条带),且在雄性中没有发现该条带(图37)。LA3166 是另一种具有Cctra内含子的构建体,所述Cctra内含子置于与reaperKR融 合的泛蛋白编码区内,但置于泛蛋白的不同位置。LA3166还在地中海实 蝇中产生显性的可抑制雌性-特异性致死效应。

LA1038是处于不同序列背景中Cctra内含子用途的一个新型实例,在 此将其置于叫做“nipper”的Nipp1Dm片段中,所述“nipper”在通过RT-PCR 分析时,也在转基因地中海实蝇中正确剪接(图12)。需要LA670作为tTAV 来源,从而驱动可变剪接的nipper的表达。

我们最近还制备并获得了具有基于‘单独内含子’Cctra的构建体的转 基因,所述构建体具有在不同基因中(许多以上实例,除非另外明显地, 在tTAV或其变体之一,即tTAV2或tTAV3中)的内含子。这些构建体如 预期地工作。这是重要的结果,因此显示出在Cctra中不存在基本外显子 序列,所述Cctra是我们在tTAV中意外地简单复制(以功能,如果不需要 以序列)出来的。我们还有该类型的ubi-rprKR构建体(LA3014和LA3166), 其也使如上所述的泛蛋白融合方法生效。如在上述实施例16中所述,通 过LA3054,LA3056和LA3488的RT-PCR分析进一步示范了泛蛋白的融 合方法(图11、13、14)。

图11:显示在用LA3488转化的地中海实蝇中源自Cctra的内含子的 性别-特异性剪接(雌性中780bp的条带)的凝胶。以F1形式的剪接应该 产生大约780bp的产物。该尺寸的条带在雌性中清晰可见(泳道4),但在 来自雄性,或在关于省去了反转录酶(“无RT”)的反应的泳道中不可见。 因此,Cctra-来源的内含子能够在该新型序列背景中性别-特异性可变剪接。 泳道1:标记(来自Eurogentec的SmartLadderTM,指示了大约0.8、1.0 和1.5kb的条带);泳道2和3:地中海实蝇LA3488/+雄性(分别地,RT 和无RT对照);泳道4和5:地中海实蝇LA3488/+雌性(分别地,RT和 无RT对照)。

图12:显示在用LA1038转化的地中海实蝇中源自Cctra的内含子的 性别-特异性剪接的凝胶。以F1形式的剪接应该产生大约230bp的产物。 该尺寸的条带在雌性中清晰可见(泳道1、2、7、8、9和10),但在雄性 中不可见。因此,Cctra-来源的内含子能够在该新型序列背景中性别-特异 性可变剪接。泳道15:标记(来自Eurogentec的SmartLadderTM,指示了 大约0.2、0.4和0.6kb的条带);泳道1、2、7、8、9和10:地中海实蝇 LA670;LA1038雌性;泳道3、4、5、6、11、12、13和14:地中海实蝇 LA670;LA1038雄性。

图13:显示在用LA3054转化的地中海实蝇中源自CcTra的内含子的 性别-特异性剪接的凝胶。以F1形式的剪接应该产生大约340bp的产物。 该尺寸的条带在泳道7中清晰可见,但在雄性中不可见。因此,Cctra-来 源的内含子能够在该新型序列背景中性别-特异性可变剪接。泳道1:标记 (来自Eurogentec的SmartLadderTM,指示了大约0.4、0.6、0.8和1.0kb 的条带);泳道2-5:地中海实蝇LA3054雄性;泳道7:地中海实蝇LA3054 雌性。

图14:显示在用LA3056转化的地中海实蝇中源自Cctra的内含子的 性别-特异性剪接的凝胶。以F1形式的剪接应该产生大约200bp的产物。 该尺寸的条带在雌性(泳道6)中清晰可见,但在雄性(泳道2-4)中不可 见。因此,Cctra-来源的内含子能够在该新型序列背景中性别-特异性可变 剪接。泳道1:标记(来自Eurogentec的SmartLadderTM,指示了大约0.2、 0.4、0.6和0.8kb的条带);泳道2-5:地中海实蝇LA3056/+雄性;泳道6-7: 地中海实蝇LA3056/+雌性。

图15:显示在用LA3376转化的墨西哥按实蝇中源自BzTra的内含子 的性别-特异性剪接的凝胶。以F1形式的剪接应该产生大约672bp的产物。 该尺寸的条带在雌性(泳道4)中清晰可见,但在来自雄性,或在关于省 去了反转录酶(“无RT”)的反应的泳道中不可见,所使用的引物是SRY和 AV3F。因此,Bztra-来源的内含子能够在该新型序列背景和物种中性别- 特异性可变剪接。泳道1:标记(来自Eurogentec的SmartLadderTM,指示 了大约0.6、0.8和1.0kb的条带);泳道2和3:墨西哥按实蝇LA3376/+ 雄性(分别地,RT和无RT对照);泳道4和5:墨西哥按实蝇LA3376/+ 雌性(分别地,RT和无RT对照)。

图18和SE ID NOs 149和150显示DSX小基因1,DSX小基因2序 列和LA3619质粒图谱。

图19-51按照以上实施例1-9。图52-58、68和69显示不同质粒的图 和序列。图59-60如上所述,且图61-66显示不同的更多质粒的图和序列。 图67是pLA3596,如别处所讨论的。

除非另外显而易见地,据此引入本文引用的全部参考文献作为参考。

参考文献:

Allen ML,Christensen BM.关于2004年,飞行肌-特异性的act88F表达: 在转基因尖音库蚊组(双翅目:蚊科)中的GFP。(Flight muscle-specific expression of act88F:GFP in transgenic Culex quinquefasciatus Say(Diptera: Culicidae)).国际寄生虫学(Parasitol Int.)53(4):307-14.

Bennett D,Szoor B,Gross S,VereshchaginaN,Alphey L.2003蛋白质磷酸酶 类型1(PP1)的抑制剂的异常表达能够用于分析PP1在果蝇发育中的作 用(Ectopic expression of inhibitors of protein phosphatase type 1(PP1)can be used to analyze roles of PP1 in Drosophila development).遗传学(Genetics). 164(1):235-45.

Black,D.(2003).可变前-信使RNA剪接的机制(Mechanisms of alternative pre-messenger RNA splicing).生物化学年度综述(Annu Rev Biochem)72, 291-336。

Burset,M.,Seledtsov,L和Solovyev,V.(2001).剪接DB:哺乳动物基因组 中规范和非规范剪接位点的数据库(SpliceDB:database of canonical and non-canonical splice sites in mammalian genomes).核酸研究(Nucleic Acids Research)29,255-259。

Caceres JF,Kornblihtt AR.2002可变剪接:人类疾病中的多重控制机制和 情况(Alternative splicing:multiple control mechanisms and involvement in human disease).遗传学趋势(Trends Genet.)18(4):186-93。

Cande C,Cecconi F,Dessen P,Kroemer G.2002程序性细胞死亡-诱导因子 (AIF):保守的胱天蛋白酶不依赖性细胞死亡途径的关键? (Apoptosis-inducing factor(AIF):key to the conserved caspase-independent pathways of cell death?)细胞科学杂志(J Cell Sci.)115(24):4727-34。

Cartegni,L.,Chew,S.和Krainer,A.(2002).聆听寂静和理解基因突变:影响 剪接的外显子突变(Listening to silence and understanding nonsense:exonic mutations that affect splicing).自然遗传学综述(Nature Reviews Genetics) 3,285-298。

Clark,F和Thanaraj,T.(2002).由转录物-证实的组成性和可变剪接的来自 人类内含子和外显子的分类和表征(Categorization and characterization of transcript-confirmed constitutively and alternatively spliced introns and exons from human).人类分子遗传学(Human Molecular Genetics)11,451-464。

Funaguma,S.,Suzuki,M.,Tamura,T.,和Shimada,T.(2005).包含修平的内 含子的Bmdsx转基因在蚕,家蚕蛾(Bombyx mori)的组织中是性别-特异 性剪接的(The Bmdsx transgene including trimmed introns is sex-specifically spliced in tissues of the silkworm,Bombyx mori).昆虫科学杂志(J Insect Sci)5,17。

George,E.L.,Ober,M.B.和Emerson Jr,CP.(1989).黑腹果蝇肌肉肌球蛋白 重链基因的功能性结构域由可变剪接的外显子编码(Functional domains of the Drosophila melanogaster muscle myosin heavy-chain gene are encoded by alternatively spliced exons).分子细胞生物学(Mol Cell Biol.)9:2957-2974。 Graveley B R.2001可变剪接:蛋白质组学世界中增加的多样性(Alternative splicing:increasing diversity in the proteomic world).遗传学趋势(Trends Genet.)17(2):100-7。

Hammes,A.,Guo,J.K.,Lutsch,G.,Leheste,J.R.,Landrock,D.,Zeigler,U., Gubler,M.C.和Schedl,A.(2001).维耳姆斯瘤1基因的两种剪接变体在性 别确定和肾元形成的过程中具有不同的功能(Two splice variants of the Wilms'Tumour 1 gene have distinct functions during sex determination and nephron formation).细胞(Cell)106:319-329。

Hastings,G.A.和Emerson Jr,C.P(1991).由可变外显子编码的肌球蛋白功 能结构域表达于果蝇的特异性胸肌中(Myosin functional domains encoded by alternative exons are expressed in specific thoracic muscles of Drosophila). 细胞生物学杂志(J.Cell Biol.)114:263-276。

Hedley,M.L.和Maniatis(1991).性别-特异性剪接和dsx前mRNA的聚腺苷 酸化需要与tra-2蛋白在体内特异性结合的序列(Sex-specific splicing and polyadenylation of dsx pre-mRNA requires a sequence that binds specifically to a tra-2 protein in vivo).细胞(Cell)65:579-586。

Heinrich J.C.和Scott MJ.2000用于制造适合于不育-释放程序的转基因昆 虫品系的可抑制雌性-特异性致死遗传系统(A repressible female-specific lethal genetic system for making transgenic insect strains suitable for a sterile-release program)PNAS 97(15):8229-8232。

Horn C,Wimmer EA.2003用于虫害管理的基于转基因的胚胎-特异性致 死系统(A transgene-based,embryo-specific lethality system for insect pest management).自然生物技术(Nat Biotechnol.)21(1):64-70。

Hoshijima,K.K,Inoue,L.,Higuchi,L,Sakamoto,H.和Shimura,Y.(1991).果 蝇中由转换基因和转换基因-2控制双性可变剪接(Control of doublesex alternative splicing by transformer and transformer-2 in Drosophila).科学 (Science)252:833-836。

Huang,Q.,Deveraux,Q.L.,Maeda,S.,Salvesen,G.S.,Stennicke,H.R., Hammock,B.D.和Reed,J.C.(2002).程序性细胞死亡的进化保守性:程序 性细胞死亡蛋白的鳞翅类和杆状病毒抑制剂是哺乳动物胱天蛋白酶-9的 抑制剂(Evolutionary conservation of apoptosis mechanisms:Lepidopteran and baculoviral inhibitor of apoptosis proteins are inhibitor of mammalian caspase-9).农业科学(Agricultural Sciences)97(4):1427-1432。

Ito,Y.,Hirochicka,H.和Kurata,N.(2002).水稻的KNOX家族种类2同源框 基因的器官-特异性可变转录物(Organ-specific alternative transcripts of KNOX family class 2 homeobox genes of rice).基因(Gene)288:41-47。

Johnson JM,Castle J,Garrett-EngeleP,Kan Z,Loerch PM,Armour CD, Santos R,Schadt EE,Stoughton R,Shoemaker DD.2003用外显子连接微 阵列进行人类可变前mRNA剪接的基因组范围的调查(Genome-wide survey of human alternative Pre-mRNA splicing with exonj unction microarrays).科学(Science).302(5653):2141-4。

Jurica MS,Moore MJ.2003前mRNA的剪接:淹没在蛋白质的海洋中 (Pre-mRNA splicing:awash in a sea of proteins).分子细胞学(Mol Cell.) 12(1):5-14。

Kazzaz JA,Rozek C E.1989交替处理的果蝇肌球蛋白重链信使RNA的组 织-特异性表达(Tissue-specific expression of the alternately processed Drosophila myosin heavy-chain messenger RNAs).发育生物学(Dev Biol.) 133(2):550-61。

Maniatis,T.,和Tasic,B.(2002).后生动物中可变前mRNA剪接和蛋白质 组扩展(Alternative pre-mRNA splicing and proteome expansion in metazoans).自然(Nature)418,236-243。

Munoz,D.,Jimenez,A.,Marinotti,O.,和James,A.(2004).AeAct-4基因在雌 性埃及伊蚊发育飞行肌的过程中表达(The AeAct-4 gene is expressed in the developing flight muscles of females Aedes aegypti).昆虫分子生物学(Insect Molecular Biology)13,563-568.

Nishiyama,R.,Mizuno,H.,Okada,S.,Yamaguchi,T.,Takenaka,M., Fukuzawa,H.和Ohyama,K.(1999).两种编码-依赖性蛋白激酶的mRNA 种类通过可变剪接在地钱提取物的性器官中区别性表达(Two mRNA species encoding calcium-dependent protein kinases are differentially expressed in sexual organs of Marchantia polymorpha through alternative splicing).植物细胞生理学(Plant Cell Physiol.)40(2):205-212。

Nishiyama,R.,Yamato,K.T.,Miura,K.,Sakida,M.,Okada,S.,Kono,K., Takahama,M.,Sone,T.,Takenaka,M.,Fukuzawa,H.和Ohyama,K.(2000). 来自地钱提取物的雄性和雌性性器官的表达的序列标记的比较 (Comparison of expressed sequence tags from male and female sexual organs of Marchantia polymorpha).DNA研究(DNA Res.)7:165-174。

Olson,M.R.,Holley,C.L.,Ji Yoo,S.,Huh,J.R,Hay,B.A.和Kornbluth,S. (2003).Reaper由IAP-调节的遍在蛋白化的调控(Reaper is regulated by IAP-mediated Ubiquitination).生物化学杂志(J.Biol.Chem.), 278(6);:4028-4034。

Olson,M.R.,Holley,CX.,Gan,E.C.,Colon-Ramos,D.A.,Kaplan,B.和 Kornbluth,S.(2003).线粒体定位和IAP降解的诱导需要reaper中的GH3- 样结构域(A GH3-like domain in reaper is required for mitochondrial localization and induction of IAP degradation).生物化学杂志(J.Biol.Chem.) 278(45).44758-44768。

Pan,Q.,Shai,O.,Misquitta,C,Zhang,W.,Saltzman,A.,Mohammad,N., Babak,T.,Siu,H.,Hughes,T.,Morris,Q.,等.(2004).利用定量微阵列平台揭 示哺乳动物可变剪接的综合调节特征(Revealing global regulatory features of mammalian alternative splicing using a quantitative microarray platform). 分子细胞学(Mol Cell)16,929-941.

Pane,A.,Salvemini,M.,Delli Bovi,P.,Polito,C,和Saccone,G.(2002).地中 海实蝇中的转换基因为选择和记忆性别命运提供遗传基础(The transformer gene in Ceratitis capitata provides a genetic basis for selecting and remembering the sexual fate).发育(Development)129,3715-3725。

Park,J.,Parisky,K.,Celotto,A.,Reenan,R.,和Graveley,B.(2004).在果蝇中 由RNA干扰识别可变剪接调节子(Identification of alternative splicing regulators by RNA interference in Drosophila).美国自然科学院学报(Proc Nat'l Acad Sci(USA))101,15974-15979。

Parker L,Gross S,Beullens M,Bollen M,Bennett D,Alphey L.2002果蝇中 蛋白质磷酸酶类型1的细胞核抑制剂(NIPP1)和蛋白质磷酸酶类型1 (PP1)之间的功能相互关系:在蝇中过表达NIPP1的结果和由PP1的共 表达引起的抑制(Functional interaction between nuclear inhibitor of protein phosphatase type 1(NIPP1)and protein phosphatase type 1(PP1)in Drosophila:consequences of over-expression of NIPP1 in flies and suppression by co-expression of PP1).生物化学杂志(Biochem J.)368(3):789-97。

Raphael,K.A.,Whyard,S.,Shearman,D.,An,X.和Frommer,M.(2004).昆 士兰果实蝇和关系接近的pest-tephritids-分子分析和考察转基因控制方案 (Bactrocera tyroni and closely related pest-tephritids-molecular analysis and prospects for transgenic control strategies).昆虫生物化学和分子生物学 (Insect Biochem.Mol.Biol.)34:167-176。

Ryner,L.和Baker,B.S.(1991).通过3’-剪接位点的活化发生双性前mRNA 处理的调节(Regulation of doublesex pre-mRNA processing occurs by 3'- splice site activation).基因发育(Genes Dev.)5:2071-2085。

Saccone,G.,Pane,A.,和Polito,C.(2002).蝇、果蝇和蝴蝶中的性别决定 (Sex determination in flies,fruitflies and butterflies).遗传学(Genetica) 116,15-23。

Scali,C,Catteruccia,F.,Li,Q.,和Crisanti,A.(2005).冈比亚按蚊双性基因 的性别-特异性转录物的识别(Identification of sex-specific transcripts of the Anopheles gambiae doublesex gene).试验生物学杂志(J Exp Biol)208, 3701-3709。

Scott,M.,Heinrich,J.,和Li,X.(2004).向适合于单独雄性不育释放程序 的澳大利亚绵羊丽蝇(铜绿蝇)转基因品系发育的进展(Progress towards the development of a transgenic strain of the Australian sheep blowfly(Lucilia cuprina)suitable for a male-only sterile release program).昆虫生物化学和分 子生物学(Insect Biochem Mol Biol)34,185-192。

Seo,S-J.,Cheon,H-M.,Sun,J.,Sappington,T.W.和Raikhel,A.S.(2003).成 年蚊中具有7和8个配体-结合重复的两种载脂蛋白受体变体的组织-和阶 段-特异性表达(Tissue-and stage-specific expression of two lipophorin receptor variants with seven and eight ligand-binding repeats in the adult mosquito).生物化学杂志(J.Biol.Chem.)278(43):41954-41962。

Siebel CW,Fresco LD,Rio DC.1992果蝇P-元件前mRNA剪接的体抑制机 制:位于外显子假-5’剪接位点的多蛋白质复合物控制U1snRNP的结合 (The mechanism of somatic inhibition of Drosophila P-element pre-mRNA splicing:multiprotein complexes at an exon pseudo-5'splice site control Ul snRNP binding).基因发育(Genes Dev.)6(8):1386-401。

Shivikrupa,Singh.,R和Swarup,G.(1999).识别显示出组织-特异性表达的 新型C3G剪接变体(Identification of a novel splice variant of C3G which shows tissue-specific expression).DNA细胞生物学(DNA Cell Biol.)18: 701-708。

Smith,C,和Valcarcel,J.(2000).可变前mRNA剪接:组合控制的逻辑 (Alternative pre-mRNA splicing:the logic of combinatorial control).生物化 学科学趋势(Trends Biochem Sci)25,381-388。

Stoss,O.,Stoilov,P.,Hartmann,A.M.,Nayler,O.,和Stamm,S.(1999).分析 组织-特异性剪接的在体内小基因方法(The in vivo minigene approach to analyze tissue-specific splicing).脑研究方案(Brain Research Protocols) 4,383-394。

Stoss,O.,Olbrich,M,Hartmann,A.M.,Konig,H.,Memmott,J.,Andreadis,A 和Stamm,S.(2001).STAR/GSG家族蛋白质rSLM-2调控可变剪接位点的 选择(The STAR/GSG family protein rSLM-2 regulates the selection of alternative splice sites).生物化学杂志(J.Biol.Che m.)276(12):8665-8673。

Streuli,M.和Saito,H.(1989).组织-特异性可变剪接的调控:外显子-特异 性顺式-元件管理白细胞公共抗原前mRNA的剪接(Regulation of tissue-specific alternative splicing:exon-specific cis-elements govern the splicing of leukocyte common antigen pre-mRNA).EMBO杂志(EMBO J.) 8(3):787-796。

Suzuki,M.,Ohbayashi,F.,Mita,K.,和Shimada,T.(2001).双性基因的性别 -特异性剪接机制在黑腹果蝇和家蚕蛾之间不同(The mechanism of sex-specific splicing at the doublesex gene is different between Drosophila melanogaster and Bombyx mori).昆虫生物化学和分子生物学(Insect Biochem Mol Biol)31,1201-1211。

Thanaraj,T.,和Clark,F.(2001).具有弱供体位点的人类GC-AG可变内含子 同种型在接纳体外显子位置处显示出增强的共有区(Human GC-AG alternative intron isoforms with weak donor sites show enhanced consensus at acceptor exon positions).核酸研究(Nucleic Acids Research)29,2581-2593。

Thanaraj,T.,Stamm,S.,Clark,F.,Reithoven,J.,Le Texier,V.,和Muilu,J. (2004).ASD:可变剪接数据库(ASD:the alternative splicing Database).核 酸研究(Nucleic Acids Research)32,D64-D69。

Varshavsky,A.(2000).泛蛋白融合技术及其派生物(Ubiquitin fusion technique and its descendants).酶方法(Meth Enz)327。

Venables,J.(2002).睾丸中的可变剪接(Alternative splicing in the testes). 当前遗传和发育的观点(Curr Opin Genet Dev)12,615-619。

Venables JP.2004癌症中的异常和可变剪接(Aberrant and alternative splicing in cancer).癌症研究(Cancer Res.)64(21):7647-54。

Vernooy,S.Y.,Copeland,J.,Ghaboosi,N.,Griffin,E.E.,Yoo,SJ.和Hay,BA. (2000).细胞生物学杂志(J.Cell Biol.)150(2):F69-F75。

White,K.,Tahoaglu,E.和Steller,H.(1996).由果蝇基因reaper引起的细胞 杀死(Cell killing by the Drosophila gene reaper).科学(Science)271(5250): 805-807。

Wing,J.P.,Zhou,L.,Schwartz,LM.和Nambu,J.R.(2001)果蝇reaper、头 部内卷缺陷和grim基因的不同细胞杀死特征(Distinct cell killing properties of the Drosophila reaper,head involution defective,and grim genes).细胞死 亡差别(Cell Death Diffn)5(11):930-939。

Yali Chiu A.,和Pin Ouyang,A.B.,(2006).失去Pnn的表达削弱SR家族剪接 因子的表达水平并调节在体内可变前mRNA剪接(Loss of Pnn expression attenuates expression levels of SR family splicing factors and modulates alternative pre-mRNA splicing in vivo).生物化学和生物物理研究栏目 (Bioch.Biophys.Res.Comm.)341:663-671。

Yoshimura,K.,Yabuta,Y.,Ishikawa,T.和Shigeoka,S.(2002).在高等植物中 识别叶绿体抗坏血酸盐过氧化物酶前mRNA的组织-特异性可变剪接顺式 元件(Idenitification of a cis element for tissue-specific alternative splicing of chloroplast Ascorbate Peroxidase pre-mRNA in higher plants).生物学和化学 杂志(J.Biol.Chem)277(43):40623-40632。

序列注释

以下涉及本发明的不同质粒并强调了其中某些优选的元件的位置。

<223>pLA3359的序列(SED ID NO.47).

<***>关键特征包括:

1.冈比亚按蚊dsx(Agdsx)小基因,[小基因是源自具体基因(在该实 例中是Agdsx基因)的重组序列,其通过将非连续的区段连接在一起,而 保持最初的5’-3’的顺序获得;这等价于从源自该基因的较长的基因组序列 片段中删除一些内部区段],(1-3135):包括外显子3的Agdsx部分,外显子 4a(雌性),外显子4b(雌性)和外显子5的部分(雄性和雌性)。

<***>源自Agdsx的外显子,所述外显子来自位置426-560(外显子3的部 分);1068-2755(包括外显子4的部分,见于雌性中);1809-2755(包括 外显子4的部分,见于雌性中);和2914-3135(包括外显子5的部分,见 于雄性中)。

<***>可变剪接的转录物起始于源自杆状病毒AcMNPV Ie1(即时早期1) 的区段中的位置~8031处(Ie1片段是从位置7431到8060)。

<***>包括的特征:

1.源自果蝇scraps基因的另外内含子(‘scraps内含子’),其位于Agdsx 序列的位置8075-8137的上游。

<223>pLA3433的序列(SED ID NO.48)。

<***>关键特征包括:

1.Agdsx小基因(778-4623):包括外显子2的Agdsx部分,外显子3, 外显子4a(雌性),外显子4b(雌性)和外显子5的部分(雄性和雌性)。

<***>源自Agdsx的外显子,所述外显子来自位置778-908(外显子2的部 分);1913-2048(外显子3的部分);2556-2642(外显子4a的部分); 3297-4243(外显子4b的部分);和4402-4623(外显子5的部分)。

<***>可变剪接的转录物起始于源自杆状病毒AcMNPV Ie1(即时早期1) 的区段中的位置~606处(Ie1片段是从位置6到635)。

<***>包括的特征:

1.源自果蝇scraps基因的另外内含子(‘scraps内含子’),其位于Agdsx 序列的位置650-712的上游处。

<223>pLA3491的序列。

<***>关键特征包括:

1.埃及伊蚊dsx(Aadsx)小基因:包括Aadsx外显子4的部分,外 显子5a(雌性),外显子5b(雌性)和外显子6的部分(雄性和雌性)。

<***>源自Aadsx的外显子,所述外显子来自位置1316-1450(外显子4 的部分);2626-3761(外显子5a的部分);3293-3761(外显子5b的部分); 和5215-5704(外显子6的部分)。

<***>预测F1转录物的部分包括核苷酸~1174-1450,2626-3761, 5215-5850。

<***>预测F2转录物的部分包括核苷酸~1174-1450,3293-3761, 5215-5850。

<***>预测F3转录物的部分包括核苷酸~1174-1450,2626-3083,3293-3761, 5215-5850。

<***>预测M1转录物的部分包括核苷酸~1174-1450,5215-5850。

<***>可变剪接的转录物起始于源自杆状病毒AcMNPV Ie1(即时早期1) 的区段中的位置~1174处(Ie1片段是从位置574到1203)。

<***>包括的特征:

1.源自果蝇scraps基因的另外内含子(‘scraps内含子’),其位于Aadsx 序列位置1218-1280处的上游。

<223>pLA3646序列。

<***>关键特征包括:

1.Aadsx小基因(17218-11707):包括位置17113-16979的Aadsx外显 子4的部分,位置15803-15025+14010-13650的外显子5a,位置 15136-15025+14010-13650的外显子5b和位置12196-11707的外显子6(注 意:反方向)。

<***>外显子4的部分包含相对于野生型在位置17087(ATG-ACG),17053 (ATG-ACG),17050(ATG-ACG)和17041(ATG-ACG)处的4个点突变(注 意:反方向)。外显子5a和5b的部分包含相对于野生型在位置15129(ATG- ATA),15116(ATG-ATA)和15113(ATG-ATA)的3个点突变(注意:反方向)。 全部这些突变用于消除ATG序列。

<***>将tTAV2插入到位置15024-14011的重叠外显子5a和5b中(注意: 反方向)。

<***>可变剪接的转录物起始于hsp70来源的片段的位置~17312处(hsp70 片段从位置17354到17225);(注意:反方向)。

<***>包括的特征:

1.源自果蝇scraps基因的另外内含子(‘scraps内含子’),其位于Aadsx 序列的位置1107-1045的上游处(注意:反方向)。

pLA3435序列(SED ID NO.46)。

<223>关键特征包括:

1.家蚕蛾dsx(Bmdsx)小基因(1411-3161),其在融合的雌性外显子 3和4之间具有外源连接体。

<***>共享的外显子2的片段(1411bp-1554bp)

<***>利用外源连接体(2203bp-2224bp),与雌性特异性外显子4的一部分 (2225bp-2290bp)融合的雌性特异性外显子3的一部分(2121bp-2202)

<***>共享的外显子5的片段(3007bp-3161bp)

<***>雌性dsx小基因剪接产物由1411-1554+2121-2290+3007-3161编 码。

<***>雄性dsx小基因剪接产物由1411-1554+3007-3161编码。

<***>预测转录物起始于在源自杆状病毒AcMNPV Ie1(即时早期1)启动 子的区段(639bp-1268bp)中的大约位置~1239处。

<223>pLA3534序列。

<***>关键特征包括:

1 Aadsx小基因(6996-4425):包含Aadsx外显子4,外显子5a的部分(雌性) 和外显子5b的部分(雌性),包含Aadsx内含子片段。

<***>来自Aadsx的外显子在位置6968-6834(外显子4的部分);5462-4425 (外显子5a的部分);和4795-4425(外显子5b的部分);(注意反方向)

<***>预测F1转录物的部分包括核苷酸~7146-6834,5462-4300(注意:反 方向)。

<***>预测F2转录物的部分包括核苷酸~7146-6834,4795-4300(注意:反 方向)。

<***>预测F3转录物的部分包括核苷酸~7146-6834,5462-5005,4795-4300 (注意:反方向)。

<***>可变剪接的转录物起始于源自杆状病毒AcMNPV Ie1(即时早期1) 的区段中的位置~7146处(Ie1片段是从位置7746到7117,反方向)。

<223>pLA3612序列。

<***>关键特征包括:

1.插入到Aadsx基因的雌性外显子中的泛蛋白-tTAV2编码区。

<***>泛蛋白-tTAV2来自Aadsx中位置15185-16429(泛蛋白来自15185- 15412;tTAV2来自15413-16429),包含起始和终止密码子。

<***>源自Aadsx的序列:13150-15184,16438-18805。

<***>Aadsx-泛蛋白-tTAV2可变剪接的转录物起始于hsp70来源的区段 (hsp70片段来自13014-13143)。

<223>pLA3619序列。

<***>关键特征包括:

1.插入到Aadsx基因的雌性外显子中的tTAV2编码区。

<***>源自Aadsx的序列:5635-3641,2610-243(注意:反方向)。

<***>Aadsx-tTAV2可变剪接的转录物起始于hsp70来源的区段5642- 5771(注意:反方向)。

<***>预测tTAV2转录物包括起始和终止密码子在2619-3635之间翻译(注 意:反方向)。

<223>pLA3545序列。

<***>关键特征包括:

1.包括第一内含子的AaActin4启动子和5'UTR调控tTAV表达。

<***>源自AaActin4的序列来自位置923-4285。

<***>预测可变剪接的转录物起始在大约~2366。

<***>来自AaActin4(雌性剪接变体)的第一内含子是2458-4259。

<***>预测tTAV在4300-5316之间翻译,包含起始和终止密码子。

<223>pLA3604序列。

<***>关键特征包括:

1.AaActin4启动子和5'UTR调控泛蛋白-tTAV2的表达。

<***>源自AaActin4的序列来自位置5795-2407(注意:反方向)。

<***>预测可变剪接的转录物起始自大约~4353(注意:反方向)。

<***>来自AaActin4(雌性剪接变体)的第一内含子是2455-4254(注意: 反方向)。

<***>预测泛蛋白-tTAV2转录物从起始密码子开始翻译,所述起始密码子 是在位于4299-4297的AaAct4基因的第一外显子中改造的(泛蛋白是 2406-2179;tTAV2是2178-1162);(注意:反方向)。

<223>pLA3641序列。

<***>关键特征包括:

1.插入到CodlingDsx基因的雌性外显子中的tTAV编码区。

<***>tTAV在CodlingDsx基因中来自位置2731-3747。

<***>Dsx-tTAV可变剪接的转录物起始于hsp70来源的区段(hsp70片段 来自4811-4940)。

<***>预测tTAV转录物在2731-3747之间翻译,包含起始和终止密码子(注 意:反方向)。

<223>pLA3570序列。

<***>关键特征包括:

1.插入到PBW-Dsx基因的雌性外显子中的tTAV编码区。

<***>tTAV编码区来自2336-3352。

<***>Dsx-tTAV可变剪接的转录物起始于hsp70来源的区段(hsp70片段 来自4683-4812)。

<***>预测tTAV转录物在2336-3352之间翻译,包含起始和终止密码子(注 意:反方向)。

<223>pLA1188序列(SED ID NO.49)。

<***>关键特征包括:

1.具有插入的Cctra内含子的tTAV编码区。

<***>Cctra内含子在tTAV中来自位置3905-2561(注意:反方向)。

<***>tTAV可变剪接的转录物起始于hsp70来源的区段的位置4217处 (hsp70片段来自4260-4131);(注意:反方向)。

<***>预测tTAV F1转录物在4040-1679之间翻译(注意:反方向)。

<***>包括的特征:

1.在预测的F1转录物中的Adh内含子在位置4118-4049(注意:反方 向)。

<223>pLA3077序列(SED ID NO.50)。

<***>关键特征包括:

1.具有插入的Cctra内含子的tTAV编码区。

<***>Cctra内含子在tTAV中来自位置3975-2631(注意:反方向)。

<***>tTAV可变剪接的转录物起始于hsp70来源的区段的位置~4217处 (hsp70片段来自4260-4131);(注意:反方向)。

<***>预测tTAV F1转录物在4039-1678之间翻译,包含起始和终止密码 子(注意:反方向)。

<***>包括的特征:

1.在预测的F1转录物中的Adh内含子在位置4117-4048(注意:反 方向)。

<223>pLA3097序列(SED ID NO.51)。

<***>关键特征包括:

1.具有插入的Cctra内含子中的tTAV编码区。

<***>Cctra内含子在tTAV中来自位置3282-1938(注意:反方向)。

<***>tTAV可变剪接的转录物起始于hsp70来源的区段的位置~3382处 (hsp70片段来自3425-3296);(注意:反方向)。

<***>预测tTAVF1转录物在3285-924之间翻译,包含起始和终止密码子 (注意:反方向)。

<223>pLA3233序列(SED ID NO.52)。

<***>关键特征包括:

1.具有插入的Cctra内含子的tTAV2编码区。

<***>Cctra内含子在tTAV2中来自位置3289-1945(注意:反方向)。

<***>tTAV2可变剪接的转录物起始于hsp70来源的区段的位置~3389处 (hsp70片段来自3432-3303);(注意:反方向)。

<***>预测tTAV2 F1转录物在3292-931之间翻译,包含起始和终止密码 子,(注意:反方向)。

<223>pLA3014序列(SED ID NO.53)。

<***>关键特征包括:

1.具有插入的Cctra内含子的ubi-reaper[KR]编码区。

<***>Cctra内含子在ubi-reaper[KR]中来自位置3356-4700。

<***>ubi-reaper[KR]可变剪接的转录物起始于hsp70来源的区段的位置 ~3234处(hsp70片段来自3191-3320)。

<***>预测ubi-reaper[KR]F1转录物在3331-5143之间翻译,包含起始和 终止密码子(泛蛋白是3331-3355,4701-4948;reaper[KR]是4949-5143)。

<223>pLA3166序列(SED ID NO.54)。

<***>关键特征包括:

1.具有插入的Cctra内含子的ubi-reaper[KR]编码区。

<***>Cctra内含子在ubi-reaper[KR]中来自位置9987-8643(注意:反方向)。

<***>ubi-reaper[KR]可变剪接的转录物起始于hsp70来源的区段的位置 ~10227处(hsp70片段来自10270-10141);(注意:反方向)。

<***>预测ubi-reaper[KR]F1转录物在10126-8359之间翻译,包含起始和 终止密码子,(泛蛋白是10126-9988,8642-8554;reaper[KR]是8553- 8359);(注意:反方向)。

<223>pLA3376序列(SED ID NO.55)。

<***>关键特征包括:

1.具有插入的Cctra内含子的tTAV2编码区。

2.具有插入的Bztra内含子的tTAV3编码区。

3.具有插入的Bztra内含子的reaper[KR]编码区。

<***>Cctra内含子在tTAV2中来自位置3289-1945(注意:反方向)。

<***>Bztra内含子在tTAV3中来自位置5981-5014(注意:反方向)。

<***>Bztra内含子在reaper[KR]中来自位置16391-17358。

<***>tTAV2可变剪接的转录物起始于hsp70来源的区段的位置~3389处 (hsp70片段来自3432-3303);(注意:反方向)。

<***>tTAV3可变剪接的转录物起始于sry-α来源的区段的位置~6019处 (sry-α片段来自6243-5999);(注意:反方向)。

<***>reaper[KR]可变剪接的转录物起始于hunchback来源的区段的位置 ~16339处(hunchback片段来自16289-16372)。

<***>预测tTAV2 F1转录物在3292-931之间翻译,包含起始和终止密码 子,(注意:反方向)。

<***>预测tTAV3 F1转录物在5984-4006之间翻译,包含起始和终止密码 子,(注意:反方向)。

<***>预测reaper[KR]F1转录物在16385-17550之间翻译,包含起始和终 止密码子。

<223>pLA3242序列(SED ID NO.56)。

<***>关键特征包括:

1.具有插入的Cctra内含子的tTAV编码区。

2.具有插入的Cctra内含子的reaper[KR]编码区。

<***>Cctra内含子在tTAV中来自位置3282-1938(注意:反方向)。

<***>Cctra内含子在reaper[KR]中来自位置5488-4180(注意:反方向)。

<***>reaper[KR]可变剪接的转录物起始于hunchback来源的区段的位置 ~5540处(hunchback片段来自5590-5507);(注意:反方向)。

<***>tTAV可变剪接的转录物起始于hsp70来源的区段的位置~3382处 (hsp70片段来自3425-3296);(注意:反方向)。

<***>预测reaper[KR]F1转录物主要在4088-5494之间翻译,包含起始和 终止密码子,(注意:反方向)。

<***>预测tTAV F1转录物主要在924-3285之间翻译,包含起始和终止密 码子,(注意:反方向)。

<223>pLA1172序列(SED ID NO.106)。

<***>关键特征包括:

1.在AaActin4来源的片段之间的tTAV编码区。

<***>AaActin4来源的片段来自7868-11257和12366-13100。

<***>预测tTAV转录物在11342-12358之间翻译,包含起始和终止密码子。

<***>预测AaActin4-tTAV转录物在位置~9312处起始。

<***>AaActin4含有来自位置9403-11204的内含子(雌性-类型剪接变体)。

<223>pLA1038序列(图12)。

<***>关键特征包括:

1.具有具备旁侧tra外显子序列的插入的Cctra内含子的Nipp1Dm ('nipper')编码区片段。

<***>Cctra内含子在nipper中来自位置3365-4709。

<***>Cctra内含子在位置3343-3364和4710-4729处侧邻Cctra外显子序 列。

<***>nipper可变剪接的转录物起始于hsp70来源的区段的位置~3243处 (hsp70片段来自3200-3329)。

<***>预测nipper F1转录物在3340-5014之间翻译,包含起始和终止密码 子。

<223>pLA3054序列(SED ID NO.158)。

<***>关键特征包括:

1.具有具备旁侧tra外显子序列的插入的Cctra内含子的 DsRed-ubi-tTAV编码区。

<***>Cctra内含子在DsRed-ubi-tTAV中来自位置3509-2165(注意:反方 向)。

<***>Cctra内含子在位置3531-3510和2164-2145处侧邻Cctra外显子序 列(注意:反方向)。

<***>DsRed-ubi-tTAV可变剪接的转录物起始于hsp70来源的区段的位置 ~3243处(hsp70片段来自4930-4801)或Opie2来源的区段的位置~4353 处(Opie2片段来自4795-4255);(注意:反方向)。

<***>预测DsRed-ubi-tTAV F1转录物在4320-888之间翻译,包含起始和 终止密码子(DsRed来自4212-3538;泛蛋白来自2135-1908;tTAV来自 1907-888);(注意:反方向)。

<223>pLA3056序列(SED ID NO.159)。

<***>关键特征包括:

1.具有具备旁侧tra外显子序列的插入的Cctra内含子的 DsRed-ubi-tTAV编码区。

<***>Cctra内含子在DsRed-ubi-tTAV中来自位置3731-2387(注意:反方 向)。

<***>Cctra内含子在位置3753-3732和2386-2145处侧邻Cctra外显子序 列(注意:反方向)。

<***>DsRed-ubi-tTAV可变剪接的转录物起始于hsp70来源的区段的位置 ~5109处(hsp70片段来自5152-5023)或Opie2来源的区段的位置~4575 处(Opie2片段来自5017-4477);(注意:反方向)。

<***>预测DsRed-ubi-tTAV F1转录物在4542-888之间翻译,包含起始和 终止密码子(DsRed来自4434-3760;泛蛋白来自2135-1908;tTAV来自 1907-888);(注意:反方向)。

<***>包括的特征:

1.在预测的F1转录物中的来自位置2222-2168的源自Cctra基因的另 外的内含子(Cctra F1转录物的第二内含子)(注意:反方向)。

<223>pLA3488序列(SED ID NO.160)。

<***>关键特征包括:

1.具有插入的Cctra内含子的TurboGreen-ubi-DsRed编码区。

<***>Cctra内含子在TurboGreen-ubi-DsRed中来自位置2263-3607。

<***>TurboGreen-ubi-DsRed可变剪接的转录物起始于源自杆状病毒 AcMNPV Ie1(即时早期1)的区段的位置~1180处(Ie1片段来自580- 1209)。

<***>预测TurboGreen-ubi-DsRed F1转录物在1311-4467之间翻译,包含 起始和终止密码子(TurboGreen来自1311-2093;SG4连接体来自2094- 2123;泛蛋白来自2124-3696,包含Cctra内含子;DsRed来自3697-4467)。

<***>包括的特征:

1.在预测的F1转录物中的源自果蝇scraps基因的另外的内含子 ('scraps内含子')来自位置1224-1286。

<223>pLA3596序列(SED ID NO.145)。

<***>关键特征包括:

1.具有插入的Cctra内含子的TurboGreen-ubi-DsRed2编码区。

<***>Cctra内含子在TurboGreen-ubi-DsRed2中来自位置5947-7291。

<***>TurboGreen-ubi-DsRed2可变剪接的转录物起始于源自杆状病毒 AcMNPV Ie1(即时早期1)的区段的位置~4864处(Ie1片段来自4264- 4893)。

<***>预测TurboGreen-ubi-DsRed2 F1转录物在4995-8148之间翻译,包含 起始和终止密码子(TurboGreen来自4995-5777;SG4连接体来自5778- 5807;泛蛋白来自5808-7380,包含Cctra内含子;DsRed2来自7381-8151)。

<***>包括的特征:

1.在预测F1转录物中的来自位置4908-4970的源自果蝇scraps基因 的另外的内含子('scraps内含子')。

2.与LA3488相比在位置7294-7296的所预期的氨基酸突变。

序列表

<110>奥西泰克有限公司

<120>表达系统

<130>USP92438

<150>PCT/GB2004/003263

<151>2004-07-28

<160>162

<170>专利版本3.3

<210>1

<211>13

<212>DNA

<213>人工的

<220>

<223>地中海实蝇(Ceratitis capitata)tra共有序列

<400>1

<210>2

<211>10

<212>DNA

<213>人工的

<220>

<223>LA3097旁侧序列

<400>2

<210>3

<211>10

<212>DNA

<213>人工的

<220>

<223>LA3097旁侧序列

<400>3

<210>4

<211>21

<212>DNA

<213>人工的

<220>

<223>引物688-iel-transcr

<400>4

<210>5

<211>21

<212>DNA

<213>人工的

<220>

<223>引物790-Aedsx-m-r2

<400>5

<210>6

<211>21

<212>DNA

<213>人工的

<220>

<223>引物761-Aedsx-fem-r

<400>6

<210>7

<211>21

<212>DNA

<213>人工的

<220>

<223>引物AedsxR1

<400>7

<210>8

<211>13

<212>RNA

<213>人工的

<220>

<223>Pane等共有序列

<400>8

<210>9

<211>13

<212>RNA

<213>人工的

<220>

<223>Scali等2005共有序列

<400>9

<210>10

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>10

<210>11

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>11

<210>12

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>12

<210>13

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>13

<210>14

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>14

<210>15

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>15

<210>16

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>16

<210>17

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>17

<210>18

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>18

<210>19

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>19

<210>20

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>20

<210>21

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>21

<210>22

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>22

<210>23

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>23

<210>24

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>24

<210>25

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>25

<210>26

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>26

<210>27

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>27

<210>28

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>28

<210>29

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>29

<210>30

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>30

<210>31

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>31

<210>32

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>32

<210>33

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>33

<210>34

<211>1014

<212>DNA

<213>人工的

<220>

<223>tTAV构建体的开放阅读框

<400>34

<210>35

<211>338

<212>PRT

<213>人工的

<220>

<223>tTAV的蛋白质序列

<400>35

<210>36

<211>1014

<212>DNA

<213>人工的

<220>

<223>tTAV2的开放阅读框

<400>36

<210>37

<211>337

<212>PRT

<213>人工的

<220>

<223>tTAV2的蛋白质序列

<400>37

<210>38

<211>1011

<212>DNA

<213>人工的

<220>

<223>tTAV3的开放阅读框

<400>38

<210>39

<211>336

<212>PRT

<213>人工的

<220>

<223>tTAV3的蛋白质序列

<400>39

<210>40

<211>568

<212>DNA

<213>棉红铃虫(Pectinophora gossypiella)

<400>40

<210>41

<211>610

<212>DNA

<213>棉红铃虫(Pectinophora gossypiella)

<400>41

<210>42

<211>449

<212>DNA

<213>棉红铃虫(Pectinophora gossypiella)

<220>

<221>misc_feature

<222>(26)..(26)

<223>n是a,c,g或t

<400>42

<210>43

<211>28774

<212>DNA

<213>埃及伊蚊(Aedes aegypti)

<400>43

<210>44

<211>3399

<212>DNA

<213>苹果皮小卷蛾(Cydia pomonella)

<220>

<221>misc_feature

<222>(1179)..(1184)

<223>n是a,c,g或t

<400>44

<210>45

<211>996

<212>DNA

<213>苹果皮小卷蛾(Cydia pomonella)

<400>45

<210>46

<211>6751

<212>DNA

<213>人工的

<220>

<223>pLA3435-家蚕蛾-dsx构建体/质粒的序列

<220>

<221>misc_feature

<222>(1617)..(1622)

<223>n是a,c,g或t

<400>46

<210>47

<211>8183

<212>DNA

<213>人工的

<220>

<223>pLA3359-冈比亚按蚊(Anopheles gambiae)dsx构建体的序列

<400>47

<210>48

<211>7342

<212>DNA

<213>人工的

<220>

<223>具有包括的外显子2的pLA3433-Agdsx(冈比亚按蚊(Anopheles gambiae))

     构建体的序列

<400>48

<210>49

<211>11868

<212>DNA

<213>人工的

<220>

<223>49 pLA1188-cctra内含子构建体的序列

<400>49

<210>50

<211>11868

<212>DNA

<213>人工的

<220>

<223>pLA3077-a Cctra内含子-tTAV构建体的序列

<400>50

<210>51

<211>11788

<212>DNA

<213>人工的

<220>

<223>51 pLA3097-a Cctra内含子-tTAV构建体的序列

<400>51

<210>52

<211>13292

<212>DNA

<213>人工的

<220>

<223>pLA3233-Cctra-内含子-tTAV2构建体的序列

<400>52

<210>53

<211>14713

<212>DNA

<213>人工的

<220>

<223>pLA3014-Cctra-内含子-泛蛋白-reaperKR构建体的序列

<400>53

<210>54

<211>15848

<212>DNA

<213>人工的

<220>

<223>pLA3166-Cctra内含子-泛蛋白-reaperKR构建体的序列

<400>54

<210>55

<211>17802

<212>DNA

<213>人工的

<220>

<223>pLA3376-Bztra内含子-reaperKR和Bztra-内含子-tTAV3的序列

<400>55

<210>56

<211>15134

<212>DNA

<213>人工的

<220>

<223>pLA3242-Crtra内含子-reaperKR构建体的序列

<400>56

<210>57

<211>1403

<212>DNA

<213>人工的

<220>

<223>SEQ ID NO.57由LA3077转化体在黑腹果蝇(Drosophila melanogaster)

     中产生的雄性转录物的部分序列,其与在地中海实蝇LA3077品系中

     产生的序列不同。T

<400>57

<210>58

<211>972

<212>DNA

<213>桃果实蝇(Bactrocera zonata)

<400>58

<210>59

<211>1312

<212>DNA

<213>纳塔耳小条实蝇(Ceratitis rosa)

<400>59

<210>60

<211>21

<212>DNA

<213>人工的

<220>

<223>spl-agdsx-e3引物

<400>60

<210>61

<211>22

<212>DNA

<213>人工的

<220>

<223>spl-agdsx-m引物

<400>61

<210>62

<211>21

<212>DNA

<213>人工的

<220>

<223>引物spl-agdsx-e3

<400>62

<210>63

<211>22

<212>DNA

<213>人工的

<220>

<223>spl-agdsx-m引物

<400>63

<210>64

<211>20

<212>DNA

<213>人工的

<220>

<223>aedesxF1引物

<400>64

<210>65

<211>25

<212>DNA

<213>人工的

<220>

<223>aedesxR5引物

<400>65

<210>66

<211>19

<212>DNA

<213>人工的

<220>

<223>aedesxR2引物

<400>66

<210>67

<211>23

<212>DNA

<213>人工的

<220>

<223>Agexonl引物

<400>67

<210>68

<211>20

<212>DNA

<213>人工的

<220>

<223>Tra(tTAV)seq+引物

<400>68

<210>69

<211>23

<212>DNA

<212>人工的

<220>

<223>Agexonl引物

<400>69

<210>70

<211>26

<212>DNA

<213>人工的

<220>

<223>外显子引物

<400>70

<210>71

<211>632

<212>DNA

<213>棉红铃虫(Pectinophora gossypiella)

<400>71

<210>72

<211>222

<212>DNA

<213>黑腹果蝇(Drosophila melanogaster)

<400>72

<210>73

<211>74

<212>PRT

<213>黑腹果蝇(Drosophila melanogaster)

<400>73

<210>74

<211>34

<212>DNA

<213>人工的

<220>

<223>引物

<400>74

<210>75

<211>22

<212>DNA

<213>人工的

<220>

<223>引物

<400>75

<210>76

<211>34

<212>DNA

<213>人工的

<220>

<223>引物

<400>76

<210>77

<211>24

<212>DNA

<213>人工的

<220>

<223>引物

<400>77

<210>78

<211>28

<212>DNA

<213>人工的

<220>

<223>引物

<400>78

<210>79

<211>31

<212>DNA

<213>人工的

<220>

<223>引物

<400>79

<210>80

<211>33

<212>DNA

<213>人工的

<220>

<223>引物

<400>80

<210>81

<211>48

<212>DNA

<213>人工的

<220>

<223>引物

<400>81

<210>82

<211>41

<212>DNA

<213>人工的

<220>

<223>引物

<400>82

<210>83

<211>31

<212>DNA

<213>人工的

<220>

<223>引物

<400>83

<210>84

<211>22

<212>DNA

<213>人工的

<220>

<223>引物

<400>84

<210>85

<211>21

<212>DNA

<213>人工的

<220>

<223>引物

<400>85

<210>86

<211>23

<212>DNA

<213>人工的

<220>

<223>引物

<400>86

<210>87

<211>31

<212>DNA

<213>人工的

<220>

<223>引物

<400>87

<210>88

<211>33

<212>DNA

<213>人工的

<220>

<223>引物

<400>88

<210>89

<211>52

<212>DNA

<213>人工的

<220>

<223>引物

<400>89

<210>90

<211>41

<212>DNA

<213>人工的

<220>

<223>引物

<400>90

<210>91

<211>31

<212>DNA

<213>人工的

<220>

<223>引物

<400>91

<210>92

<211>22

<212>DNA

<213>人工的

<220>

<223>引物

<400>92

<210>93

<211>21

<212>DNA

<213>人工的

<220>

<223>引物

<400>93

<210>94

<211>23

<212>DNA

<213>人工的

<220>

<223>引物

<400>94

<210>95

<211>52

<212>DNA

<213>人工的

<220>

<223>引物

<400>95

<210>96

<211>33

<212>DNA

<213>人工的

<220>

<223>引物

<400>96

<210>97

<211>28

<212>DNA

<213>人工的

<220>

<223>引物

<400>97

<210>98

<211>37

<212>DNA

<213>人工的

<220>

<223>引物

<400>98

<210>99

<211>28

<212>DNA

<213>人工的

<220>

<223>引物

<400>99

<210>100

<211>32

<212>DNA

<213>人工的

<220>

<223>引物

<400>100

<210>101

<211>27

<212>DNA

<213>人工的

<220>

<223>引物

<400>101

<210>102

<211>28

<212>DNA

<213>人工的

<220>

<223>引物

<400>102

<210>103

<211>28

<212>DNA

<213>人工的

<220>

<223>引物

<400>103

<210>104

<211>34

<212>DNA

<213>人工的

<220>

<223>引物

<400>104

<210>105

<211>25

<212>DNA

<213>人工的

<220>

<223>引物

<400>105

<210>106

<211>14874

<212>DNA

<213>人工的

<220>

<223>LA1172核苷酸序列,包括质粒主链

<400>106

<210>107

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>107

<210>108

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>108

<210>109

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>109

<210>110

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>110

<210>111

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>111

<210>112

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>112

<210>113

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>113

<210>114

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>114

<210>115

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>115

<210>116

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>116

<210>117

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>117

<210>118

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>118

<210>119

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>119

<210>120

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>120

<210>121

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>121

<210>122

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>122

<210>123

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>123

<210>124

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>124

<210>125

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>125

<210>126

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>126

<210>127

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>127

<210>128

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>128

<210>129

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>129

<210>130

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>130

<210>131

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>131

<210>132

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>132

<210>133

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>133

<210>134

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>134

<210>135

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>135

<210>136

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>136

<210>137

<211>13

<212>DNA

<213>果蝇属物种(Drosophila sp.)

<400>137

<210>138

<211>13

<212>DNA

<213>人工的

<220>

<223>表2共有序列

<400>138

<210>139

<211>34

<212>DNA

<213>人工的

<220>

<223>引物

<400>139

<210>140

<211>25

<212>DNA

<213>人工的

<220>

<223>VP16引物

<400>140

<210>141

<211>24

<212>DNA

<213>人工的

<220>

<223>引物AgexpnlF

<400>141

<210>142

<211>24

<212>DNA

<213>人工的

<220>

<223>引物TETRR1

<400>142

<210>143

<211>6243

<212>DNA

<213>人工的

<220>

<223>LA3576质粒序列

<400>143

<210>144

<211>5746

<212>DNA

<213>人工的

<220>

<223>LA3582质粒序列

<400>144

<210>145

<211>15121

<212>DNA

<213>人工的

<220>

<223>LA3596质粒序列

<400>145

<210>146

<211>533

<212>DNA

<213>人工的

<220>

<223>146 PBW-dsx片段(图6)

<400>146

<210>147

<211>611

<212>DNA

<213>人工的

<220>

<223>Bombyx-dsx片段(图6)

<400>147

<210>148

<211>570

<212>DNA

<213>人工的

<220>

<223>codling-dsx片段(图6)

<400>148

<210>149

<211>4389

<212>DNA

<213>人工的

<220>

<223>来自构建体LA3491的DSX小基因1

<400>149

<210>150

<211>2572

<212>DNA

<213>人工的

<220>

<223>来自LA3534构建体的DSX小基因2

<400>150

<210>151

<211>18790

<212>DNA

<213>人工的

<220>

<223>LA3619完整质粒序列

<400>151

<210>152

<211>19053

<212>DNA

<213>人工的

<220>

<223>LA3612完整质粒序列

<400>152

<210>153

<211>10540

<212>DNA

<213>人工的

<220>

<223>LA3491质粒序列

<400>153

<210>154

<211>4446

<212>DNA

<213>人工的

<220>

<223>LA3515质粒序列

<400>154

<210>155

<211>12991

<212>DNA

<213>人工的

<220>

<223>LA3545质粒序列

<400>155

<210>156

<211>18411

<212>DNA

<213>人工的

<220>

<223>LA3604质粒序列

<400>156

<210>157

<211>18073

<212>DNA

<213>人工的

<220>

<223>LA3646质粒序列

<400>157

<210>158

<211>13293

<212>DNA

<213>人工的

<220>

<223>LA3054质粒序列

<400>158

<210>159

<211>13515

<212>DNA

<213>人工的

<220>

<223>LA3056质粒序列

<400>159

<210>160

<211>9423

<212>DNA

<213>人工的

<220>

<223>LA3488质粒序列

<400>160

<210>161

<211>17781

<212>DNA

<213>人工的

<220>

<223>LA3641质粒序列

<400>161

<210>162

<211>15482

<212>DNA

<213>人工的

<220>

<223>LA3570质粒序列

<220>

<221>misc_feature

<222>(1875)..(1875)

<223>n是a,c,g或t

<400>162

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈