首页 / 专利库 / 专利权 / 申请 / 国际申请 / 说明书 / 序列表 / 改良核酸表达的新序列

改良核酸表达的新序列

阅读:440发布:2020-05-11

专利汇可以提供改良核酸表达的新序列专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种新的抗阻抑物元件,其可用于改良核酸在宿主细胞中的表达。本发明还提供了使用所述新的抗阻抑物元件生产感兴趣 蛋白质 的方法。本发明还提供了包含抗阻抑物元件的表达盒的新构型。,下面是改良核酸表达的新序列专利的具体信息内容。

1.一种重组的核酸分子,其包含选自如下一组的具有抗阻抑物 活性的核酸序列:
a) SEQ.ID.NO.66,
b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,
c)与a)或b)的核苷酸序列至少70%相同的序列,其中所述序列 具有抗阻抑物活性,及
d)与a)-c)任一序列互补的序列;
所述重组核酸分子进一步包含表达盒,所述表达盒包含与感兴 趣核酸连接的一个异源启动子,其中所述感兴趣核酸优选编码全部 或者部分感兴趣蛋白质
2.权利要求1的分子,其中具有抗阻抑物活性的所述核酸序列 位于所述表达盒中所述启动子的上游。
3.权利要求2的分子,其中所述具有抗阻抑物活性的序列和所 述启动子相隔少于2kb。
4.前述任一项权利要求的分子,其中所述编码感兴趣蛋白质的 核酸存在于多顺反子基因中,所述多顺反子基因进一步编码一个可 选择标记基因。
5.前述任一项权利要求的分子,进一步包含至少一个其它的具 有抗阻抑物活性的序列,所述至少一个其它序列选自:
a)SEQ.ID.NO.1-65任一序列,
b)SEQ.ID.NO.1-65任一序列的片段,其中所述片段具有抗阻 抑物活性,及
c)与a)或b)的核苷酸序列至少70%相同的序列,其中所述序列 具有抗阻抑物活性,及
d)与a)-c)任一序列互补的序列。
6.一种包含表达盒的重组核酸分子,其包含:5’-抗阻抑物序列 A-启动子-编码全部或部分感兴趣蛋白质的核酸-抗阻抑物序列B- 3’,其中抗阻抑物序列A和B可以相同或者不同,选自:
(i)SEQ.ID.NO.1-65任一序列,
(ii)SEQ.ID.NO.1-65任一序列的片段,其中所述片段具有抗阻 抑物活性,
(iii)与a)或b)的核苷酸序列至少70%相同的序列,其中所述序 列具有抗阻抑物活性,及
(iv)与(i)-(iii)任一序列互补的序列,
特征在于所述表达盒在所述抗阻抑物序列A和B之间进一步包 含选自如下一组的具有抗阻抑物活性的序列:
a) SEQ.ID.NO.66,
b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,
c)与a)或b)的核苷酸序列至少70%相同的序列,其中所述序列 具有抗阻抑物活性,及
d)与a)-c)任一序列互补的序列。
7.一种包含权利要求1-6任一项的分子的细胞。
8.权利要求7的细胞,其是哺乳动物细胞。
9.权利要求8的细胞,其是CHO细胞。
10.一种生产感兴趣蛋白质的方法,包括培养包含编码感兴趣蛋 白质的重组核酸分子的细胞,以在所述细胞中表达编码感兴趣蛋白 质的所述核酸,特征在于所述重组核酸分子包含选自如下一组的具 有抗阻抑物活性的核酸序列:
a)SEQ.ID.NO.66,
b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,
c)与a)或b)的核苷酸序列至少70%相同的序列,其中所述序列 具有抗阻抑物活性,及
d)与a)-c)任一序列互补的序列。
11.权利要求10的方法,其进一步包括分离所述感兴趣蛋白 质。
12.权利要求10或11的方法,其中所述具有抗阻抑物活性的核 酸序列位于控制感兴趣蛋白质表达的启动子的上游。
13.权利要求12的方法,其中具有抗阻抑物活性的所述序列和 所述启动子间隔少于2kb。
14.权利要求10-13任一项的方法,其中编码感兴趣蛋白质的 所述核酸存在于多顺反子基因中,所述多顺反子基因进一步编码一 个可选择标记基因。
15.权利要求10-14任一项的方法,其中所述细胞是哺乳动物 细胞。
16.权利要求15的方法,其中所述细胞是CHO细胞。
17.选自如下一组的具有抗阻抑物活性的核酸序列在增加感兴趣 核酸表达中的应用:
a)SEQ.ID.NO.66,
b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,
c)与a)或b)的核苷酸序列至少70%相同的序列,其中所述序列 具有抗阻抑物活性,
d)与a)-c)任一序列互补的序列。
18.一种产生表达两种感兴趣多肽的宿主细胞的方法,所述方法 包括:
a)向宿主细胞中导入一或多种核酸分子,所述一种核酸分子或 多种核酸分子一起包含:
(i)与编码第一种感兴趣多肽和第一种可选择标记基因的序 列功能连接的启动子,及
(ii)与编码第二种感兴趣多肽和第二种可选择标记基因的序 列功能连接的启动子,及
(iii)至少一个具有抗阻抑物活性的序列,选自:(a)SEQ.ID. NO.66,(b)SEQ.ID.NO.66任一序列的片段,所述片段具有抗阻抑 物活性,(c)与(a)或(b)至少70%相同并具有抗阻抑物活性的序列, 及(d)与(a)-(c)任一序列互补的序列;
b)通过基本上同时选择表达所述第一种和第二种可选择标记基 因而选择宿主细胞。
19.一种表达两种感兴趣多肽的方法,所述方法包括:培养通过 权利要求18的方法获得的宿主细胞以表达所述第一种和第二种多 肽,任选分离所述多肽。
20.权利要求18或19的方法,其中所述具有抗阻抑物活性的序 列选自:
a) SEQ.ID.NO.66,
b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,
c)与a)或b)的核苷酸序列至少70%相同的的序列,其中所述序 列具有抗阻抑物活性,及
d)与a)-c)任一序列互补的序列。
21.权利要求18-20任一项的方法,其中所述两种多肽是多聚 体蛋白质的一部分。

说明书全文

发明涉及分子生物学和生物技术领域。更特别地,本发明涉 及改良可在宿主细胞中编码蛋白质的一或多种核酸的产生的手段和 方法。

可以在多种宿主细胞中产生的蛋白质在生物学和生物技术学中 具有广泛应用,例如可用于生物制药学。这种产生方法已经确立, 通常是使编码感兴趣蛋白质的核酸(也称作转基因)在宿主细胞中 表达。

与转基因的表达相关的一个问题是其是不可预知的,这是由于 转基因由于基因沉默而将变得无活性的高度可能性(McBurney et al., 2002),因此对于转基因的高表达需要测试许多宿主细胞克隆。另 外,一旦这种克隆已经确定,则所述转基因的表达通常是不稳定 的,在延长的宿主细胞培养期间常常观测到转基因表达沉默的现 象。在脊椎动物细胞中,这可能是由于异染色质在转基因座形成, 阻止了转基因的转录所致(Whitelaw et al,2001)。转基因沉默是随机 的,其通常可以在转基因整合进基因组之中后立刻发生,或者只是 在细胞分化之后发生。这样在延长的培养之后产生异质细胞群,其 中一些细胞持续表达高平的重组蛋白质,而其它细胞表达低水平 或者不可检测水平的蛋白质(Martin&Whitelaw,1996,McBurney et al.,2002)。用于产生异源蛋白质的细胞系衍生自单一细胞,通常对 其按比例扩大并长期维持在1000升或更大体积的培养器中每毫升1 千万个细胞以上的密度。这些大细胞群(1014-1016个细胞)由于转基 因沉默而倾向于生产明显下降(Migliaccio et al.,2000, Strutzenberger et al.,1999)。

克服上述问题的一种可能性是在表达系统中应用所谓的STAR 序列。多种这样的STAR序列在WO 03/004704中描述。这些序列可 用于在一些类型宿主细胞中使用表达构建体而改良蛋白质生产的可 预测性、产量和/或稳定性(WO 03/004704;Kwaks et al,2003)。

国际出版物WO 03/106674描述了STAR序列在一些细胞系中表 达编码重组蛋白质的核酸的应用。

国际出版物WO 03/106684描述了STAR序列表达编码多聚体蛋 白质如抗体的核酸的应用。

本发明提供了改良蛋白质生产的另外的手段和方法。

发明概述

一方面,本发明提供了包含选自如下一组的具有抗阻抑物活性 的核酸序列的重组核酸分子:a)SEQ.ID.NO.66,b)SEQ.ID.NO. 66的片段,其中所述片段具有抗阻抑物活性,c)与a)或b)的核苷酸 序列至少70%相同的序列,其中所述序列具有抗阻抑物活性,及d) 与a)-c)任一序列互补的序列;所述重组核酸分子进一步包含表达 盒,所述表达盒包含与感兴趣核酸连接的异源启动子,且其中所述 感兴趣核酸优选编码全部或部分感兴趣蛋白质。在一个优选的实施 方案中,所述具有抗阻抑物活性的核酸序列位于所述表达盒中所述 启动子的上游,在其特别优选的实施方案中,所述具有抗阻抑物活 性的序列和所述启动子间隔少于2kb。在某些实施方案中,所述编 码感兴趣蛋白质的核酸存在于多顺反子基因中,所述多顺反子基因 进一步编码可选择标记基因。在某些实施方案中,所述分子进一步 包含至少一个其它具有抗阻抑物活性的序列,所述至少一个其它序 列选自:a)SEQ.ID.NO.1-65任一序列;b)SEQ.ID.NO.1-65任 一序列的片段,其中所述片段具有抗阻抑物活性;c)与a)或b)核苷 酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性;及 d)与a)-c)任一序列互补的序列。本发明还提供了包含表达盒的重组 核酸分子,其包含5’-抗阻抑物序列A-启动子-编码全部或者部分感 兴趣蛋白质的核酸-抗阻抑物序列B-3’,其中抗阻抑物序列A和B 可以相同或不同,并选自:(i)SEQ.ID.NO.1-65任一序列;(ii) SEQ.ID.NO.1-65任一序列的片段,其中所述片段具有抗阻抑物活 性;(iii)与a)或b)核苷酸序列至少70%相同的序列,其中所述序列 具有抗阻抑物活性;及(iv)与(i)-(iii)任一序列互补的序列,特征在 于所述表达盒在所述抗阻抑物序列A和B之间进一步包含具有抗阻 抑物活性的序列,该序列选自:a)SEQ.ID.NO.66;b)SEQ.ID.NO. 66的片段,其中所述片段具有抗阻抑物活性;c)与a)或b)核苷酸序 列至少70%相同的序列,其中所述序列具有抗阻抑物活性;及d)与 a)-c)任一序列互补的序列。

本发明进一步提供了包含本发明分子的细胞。优选所述细胞是 哺乳动物细胞,在某些实施方案中所述细胞是CHO细胞。

本发明进一步提供了一种生产感兴趣蛋白质的方法,包括培养 包含编码感兴趣蛋白质的重组核酸分子的细胞,以在所述细胞中表 达编码感兴趣蛋白质的所述核酸,其特征在于所述重组核酸分子包 含具有抗阻抑物活性的、选自如下一组的核酸序列:a)SEQ.ID.NO. 66,b)SEQ.ID.NO.66的片段,其中所述片段具有抗阻抑物活性,c) 与a)或b)核苷酸序列至少70%相同的序列,其中所述序列具有抗阻 抑物活性;及d)与a)-c)任一序列互补的序列。在一个优选的实施 方案中,所述方法进一步包括分离所述感兴趣蛋白质。在优选的实 施方案中,所述具有抗阻抑物活性的核酸序列位于控制感兴趣蛋白 质表达的启动子的上游。在其优选的实施方案中,所述具有抗阻抑 物活性的序列与所述启动子间隔少于2kb。在某些实施方案中,所 述编码感兴趣蛋白质的核酸存在于多顺反子基因中,所述多顺反子 基因进一步编码可选择标记基因。在某些实施方案中,所述细胞是 哺乳动物细胞,例如CHO细胞。

本发明还提供了选自如下一组的具有抗阻抑物活性的核酸序列 在增加感兴趣核酸表达中的应用:a)SEQ.ID.NO.66;b)SEQ.ID. NO.66的片段,其中所述片段具有抗阻抑物活性;c)与a)或b)核苷 酸序列至少70%相同的序列,其中所述序列具有抗阻抑物活性;及 d)与a)-c)任一序列互补的序列。

另一方面,本发明提供了一种产生表达两种感兴趣多肽的宿主 细胞的方法,所述方法包括:a)向宿主细胞中导入一或多种核酸分 子,所述一种核酸分子或多种核酸分子一起包含:(i)与编码第一种 感兴趣多肽和第一种可选择标记基因的序列功能性连接的启动子, 及(ii)与编码第二种感兴趣多肽和第二种可选择标记基因的序列功能 性连接的启动子,及(iii)具有抗阻抑物活性的至少一个序列,选自: (a)SEQ.ID.NO.1-66任一序列,(b)SEQ.ID.NO.1-66任一序列的 片段,所述片段具有抗阻抑物活性,(c)与(a)或(b)至少70%相同并 具有抗阻抑物活性的序列,及(d)与(a)-(c)任一序列互补的序列;b) 通过基本上同时选择表达所述第一种和第二种可选择标记基因而选 择宿主细胞。本发明还提供了表达两种感兴趣多肽的方法,所述方 法包括:培养通过本发明的方法获得的宿主细胞以表达所述第一种 和第二种多肽,及任选分离所述多肽。在一个实施方案中,所述具 有抗阻抑物活性的序列选自:a)SEQ.ID.NO.66,b)SEQ.ID.NO. 66的片段,其中所述片段具有抗阻抑物活性,c)与a)或b)核苷酸序 列至少70%相同的序列,其中所述序列具有抗阻抑物活性,及d)与 a)-c)任一序列互补的序列。在某些实施方案中,所述两种多肽是多 聚体蛋白质的一部分。

发明详述

抗阻抑物序列

本发明使用的具有抗阻抑物活性的序列是当HP1或HPC2蛋白 质与DNA结合(tether)时,能至少部分抵消这些蛋白质的阻抑作 用的序列。适于本发明的具有抗阻抑物活性的序列(在本文有时也称 作抗阻抑物序列或者抗阻抑物元件)在WO 03/004704中揭示,其并 入本文参考,在该文章中将其称作STAR序列(在本文中无论什么情 况下将一序列称作STAR序列,则该序列具有本发明的抗阻抑物活 性)。作为非限制性的例子,称作STAR1-65的65个抗阻抑物元件的 序列(见WO 03/004704)在本文分别以SEQ.ID.NO.1-65表示。

根据本发明,一指定抗阻抑物元件的功能性片段或衍生物当其 仍具有抗阻抑物活性时,被认为与所述抗阻抑物元件等同。这种抗 阻抑物活性的存在可易于由本领域技术人员例如通过下述分析而检 测。功能性片段或者衍生物可易于由分子生物学领域技术人员通过 用指定的抗阻抑物序列起始产生缺失、添加、取代、翻转等而获得 (见例如WO 03/004704)。功能性片段或者衍生物还包含其它物种的 直向同源物(ortholog),其可以被本领域技术人员通过已知方法使 用已知的抗阻抑物序列发现(见例如WO 03/004704)。因此,本发明 涵盖抗阻抑物序列的片段,其中所述片段仍具有抗阻抑物活性。对 于指定序列的片段,相同性百分比是指在该片段中发现的参考天然 序列的部分。本发明还涵盖与所述具有抗阻抑物活性的序列或其具 有抗阻抑物活性的功能片段在核苷酸序列水平至少70%相同的序 列,只要这些至少70%相同的序列仍具有本发明的抗阻抑物活性。 优选地,所述序列与参考天然序列或其功能片段至少80%相同、更 优选至少90%相同、更优选至少95%相同。

根据本发明具有抗阻抑物活性的序列可以通过多种方法获得, 包括但不限于从人基因组或者另一种生物体的基因组中克隆,或者 通过例如利用对序列的了解例如通过PCR从这种基因组中直接扩增 已知抗阻抑物序列,或者可以部分或全部化学合成。

具有抗阻抑物活性的序列或其功能片段或衍生物在本发明通过 其序列在结构上加以限定,另外限定为具有抗阻抑物活性的序列进 行功能性限定,使用下文所述分析确定。

本发明的具有抗阻抑物活性的任何序列应至少能通过如下的功 能分析(见WO 03/004704,实施例1,并入本文作参考)。将人U-2 OS细胞(ATCC HTB-96)用pTet-Off质粒(Clontech K1620-A)及用编 码含有LexA DNA结合结构域和HP1或HPC2编码区的LexA-阻抑 物融合蛋白的核酸(当与DNA结合时抑制基因表达的果蝇Polycomb 群蛋白质;该分析对任一融合蛋白质均起作用),在Tet-Off转录调 节系统(Gossen and Buiard,1992)控制下稳定转染。这些细胞在下文 抗阻抑物活性分析中称作报道细胞。提供潮霉素抗性的报道质粒位 于四个LexA操纵基因位点与控制zeocin抗性基因的SV40启动子之 间含有一个多接头序列。可以将测试抗阻抑物活性的序列克隆在所 述多接头中。合适的报道质粒如pSelect的构建在WO 00/004704的 实施例1和图1中描述。将该报道质粒转染进报道细胞中,将该细 胞在潮霉素选择(25μg/ml;针对报道质粒的存在而选择)和四环素抑 制(强力霉素,10ng/ml;防止LexA-阻抑物融合蛋白表达)下培养。 在这些条件下生长一周后,将强力霉素的浓度降低至0.1ng/ml(或更 低)以诱导LexA-阻抑物基因,两天后加入250μg/ml的zeocin。将细 胞培养5周,直至对照培养物(用空白报道质粒转染,即在多接头中 没有克隆的抗阻抑物序列)被zeocin杀死(在这个对照质粒中,SV40 启动子被与LexA操纵位点结合的LexA-阻抑物融合蛋白抑制,导致 在这种细胞中无效的zeocin表达,以在zeocin选择中存活)。如果一 个序列克隆在报道质粒的多接头中,所述报道细胞在zeocin选择下 存活5周,则所述序列具有本发明的抗阻抑物活性。这种集落的细 胞在zeocin选择5周后仍可以在含有zeocin的新培养基上增殖,而 用没有抗阻抑物序列的报道质粒转染的细胞在含有zeocin的新培养 基上不能增殖。在这个分析中在5周后不能赋予在zeocin上这种生 长的任何序列不能认为是本发明具有抗阻抑物活性的序列或者其功 能片段或者功能衍生物。例如,已知的边界序列如Van der Vlag等 (2000)测试的那些序列,包括果蝇scs(Kellum and Schedl,1991)、鸡 β-球蛋白基因座的5’-HS4(Chung et al,1993,1997)或者Matrix Attachment Regions(MARs)(Phi-Van et al.,1990),在这个分析中不 存活。

另外,当与报道基因两侧无抗阻抑物或者具有较弱的阻抑封闭 序列如Drosophila scs相对比时,优选位于整合进U-2 OS或CHO细 胞基因组中的报道基因(例如荧光素酶,GFP)两侧的所述抗阻抑物 序列或者其功能片段或者衍生物产生较高比例的报道基因过表达克 隆。这可以使用例如pSDH载体或者相似的载体证实,如WO 03/004704的实施例1和图2所述。

本发明的抗阻抑物元件可具有生产蛋白质的三个结果的至少一 个:(1)在工业可接受水平提高鉴别表达蛋白质的宿主细胞系的可预 测性;(2)使得宿主细胞系的蛋白质产量增加;和/或(3)使得宿主细 胞系在延长的培养期间呈现更稳定的蛋白质产生。这些特性在下文 更详细地论述:(1)可预测性提高:转基因表达盒的整合可以在整个 宿主细胞基因组的随机位置发生。然而,许多基因组是转录沉默的 异染色质。当所述表达盒在转基因两侧包括抗阻抑物元件时,整合 的位置对表达具有减弱的作用。所述抗阻抑物元件削弱相邻异染色 质使转基因沉默的能力。因此,含有可接受表达水平的转基因的宿 主细胞比例增加。当转染同量的DNA时,抗阻抑物序列的掺入与无 抗阻抑物序列的相同转基因相比确实导致多至10倍的集落建立。

(2)产量:在转基因整合后立即测定原始重组宿主细胞群中蛋白 质的表达水平。群体中的个体表达水平不同。然而,当所述转基因 被抗阻抑物元件保护时,可变性降低。这种降低的可变性在回收低 水平表达的较少克隆中是最显著的。另外,具有抗阻抑物元件的群 体通常具有显著高水平表达的个体。这些高产量的个体对于蛋白质 的产生是有利的,无论对于收获还是改变细胞或者包含这种细胞的 生物体的表型均有利。

(3)增加的稳定性:抗阻抑物元件增加重组宿主细胞系中转基因 的稳定性,通过保证转基因在延长的培养期间不被转录沉默而实 现。对比试验表明,在未被抗阻抑物元件保护的转基因逐渐沉默的 条件下(5-25传代培养),抗阻抑物元件保护的转基因持续高水平表 达。这在蛋白质样分子的工业化生产期间是有利的,在此期间细胞 培养时间持续延长,从几周延长至几个月。相似地,延长期间的表 达稳定性在由于抗阻抑物保护的转基因的重组表达而产生的表型改 变的植物或动物中是有利的。

STAR67

本发明提供了具有抗阻抑物活性的新序列,其被称作STAR67 (SEQ.ID.NO.66)。当将这种抗阻抑物序列置于驱动感兴趣基因表达 的启动子的上游时明显增加表达,如本发明提供的实施例所揭示, 而迄今为止已知的有效抗阻抑物序列如STAR6或者STAR7看起来 在这种构型中不太有利(它们特别在位于在转基因两侧时起作用,即 当位于转基因的上游和下游时)。因此,STAR67提供了已知的抗阻 抑物序列的一种替代,当其被置于启动子上游时与已知的这类抗阻 抑物序列相对比时具有增加的益处。STAR67不是增强子-阻断 剂,与测试这种性质的其它抗阻抑物序列相反(Kwaks et al,2003), 其提供了STAR67与其它以前公开的抗阻抑物序列之间的另一种不 同之处。STAR67可以双向方式操纵,如实施例7所示。根据本发 明,表达盒中STAR67序列的存在提供了改良的可预测性和/或产量 和/或表达稳定性。本发明论证了STAR67与多种启动子组合在不同 细胞系中起作用。

表达盒

本发明的核酸分子,包括STAR67,可以是任何形式,例如是 DNA片段,任选存在于克隆载体如质粒、优选表达载体上,并且可 用于例如使用标准重组DNA技术进行克隆。在本发明优选的实施方 案中,核酸包含表达盒,其可用于在例如宿主细胞中表达感兴趣的 序列。

如本文所用,“表达盒”是指包含与希望表达的序列功能性连 接的至少一个启动子的核酸序列,希望表达的序列优选是编码全部 或部分感兴趣蛋白质的开放读框。所述启动子优选对于所述感兴趣 核酸而言是异源启动子,异源启动子是指不是所述感兴趣序列的天 然启动子的启动子。换而言之,已经使用了一些人类干预形式例如 分子克隆将异源启动子与感兴趣核酸功能组合,在本文中异源启动 子可以衍生自与感兴趣序列相同或者不同的生物体。优选地,表达 盒进一步含有转录终止和聚腺苷酸化序列。也可以包括其它调节序 列如增强子。本发明的表达单位进一步包含至少一个抗阻抑物序 列,如STAR67。在某些优选的实施方案中,所述抗阻抑物序列, 优选STAR67,被置于所述启动子的上游,优选所述抗阻抑物序列 的3’末端与启动子序列起始点之间间隔少于2kb。在优选的实施方 案中,所述抗阻抑物序列的3’末端与启动子序列的起始点之间间隔 少于1kb,更优选少于500个核苷酸(nt),更优选少于大约200、 100、50或者30个nt。在某些优选的实施方案中,所述抗阻抑物序 列直接克隆在启动子的上游,导致抗阻抑物序列的3’末端与启动子 序列起始点之间仅间隔大约0-20个nt。

为了获得编码重组蛋白质的核酸序列的表达,本领域技术人员 熟知可以将能驱动这种表达的序列与编码所述蛋白质的核酸序列功 能性连接,产生可表达形式的编码重组蛋白质的重组核酸分子。通 常,所述启动子序列置于编码感兴趣蛋白质的序列的上游。可用的 表达载体可在本领域获得,例如Invitrogen的pcDNA和pEF载体系 列,BD Sciences的pMSCV和pTK-Hyg,Stratagene的pCMV-Script 等等。

在编码感兴趣多肽的序列正确插入控制编码的多肽的转录和翻 译的序列中的情况中,所得表达盒可用于产生感兴趣蛋白质,这即 称作表达。驱动表达的序列可包括启动子、增强子等,及其组合。 这些序列应能在宿主细胞中起作用,从而驱动与其功能性连接的核 酸序列的表达。本领域技术人员知道可以使用多种启动子获得感兴 趣基因在宿主细胞中的表达。启动子可以是组成型或者被调节的, 可以得自多种来源,包括病毒、原核生物或者真核生物来源,或者 是人工设计的。感兴趣核酸的表达可以从天然启动子或其衍生物或 者从完全异源的启动子中表达(Kaufman,2000)。用于在真核细胞中 表达的一些熟知和常用的启动子包含衍生自病毒如腺病毒的启动 子,例如E1A启动子,衍生自巨细胞病毒(CMV)的启动子,如 CMV立即早期(IE)启动子(在本文称作CMV启动子)(可得自例如 pcDNA,Invitrogen),衍生自猿猴病毒40(SV40)的启动子(Das et al, 1985)等等。合适的启动子也可以衍生自真核细胞,如金属硫蛋白 (MT)启动子,延伸因子1a(EF-1α)启动子(Gill et al.,2001),遍在蛋 白C或UB6启动子(Gill et al.,2001;Schorpp et al,1996),肌动蛋白 启动子,免疫球蛋白启动子,热激启动子等等。适合本发明的在真 核细胞中获得表达的一些优选启动子是CMV启动子,哺乳动物 EF1-α启动子,哺乳动物遍在蛋白启动子如遍在蛋白C启动子,或 者SV40启动子(例如可得自pIRES,cat.no.63 1605,BD Sciences)。测 试启动子功能和强度由本领域技术人员常规进行,通常可例如包括 在启动子序列之后克隆一个测试基因如lacZ、荧光素酶、GFP等, 并测试该测试基因的表达。当然,启动子可以通过对序列进行缺 失、添加、突变而改变,并测试其功能性以发现新的弱化的或者改 良的启动子序列。

本发明的表达盒可以是单顺反子、双顺反子或者多顺反子的。 术语“双顺反子基因”是指能提供编码两种蛋白质/多肽的RNA分 子的基因。术语“单顺反子基因”是指能提供编码一种蛋白质/多肽 的RNA分子的基因。术语“多顺反子基因”是指能提供编码两或多 种蛋白质/多肽的RNA分子的基因,双顺反子基因因此包含在多顺 反子基因的范畴内。本发明所用术语“基因”可包含染色体DNA, cDNA,人工DNA,其组合等,并且也可以是其它核酸形式,例如 RNA。在某些实施方案中,蛋白质表达单位包含一个多顺反子基 因。包含一些顺反子的单位可以转录为单一mRNA。该RNA上存 在的第二个及其它编码区的翻译可以多种方式实现,包括使用翻译 再引发位点或者内在核糖体进入位点,优选后者。双或多顺反子单 位的一个优势是可以易于选择表达感兴趣蛋白质的克隆,通过将编 码可选择标记蛋白的核酸置于编码感兴趣蛋白质或多肽的核酸下游 而进行。

对于多聚体蛋白质的产生,可以使用两或多个表达盒。这个实 施方案经证实提供良好结果,例如抗体重链和轻链的表达。根据本 发明,至少一种表达盒,但优选每种表达盒,均应包含STAR序 列。在另一个实施方案中,多聚体蛋白质的不同亚单位或部分存在 于一个表达盒中。

代替或除了置于表达盒中启动子上游的抗阻抑物序列的存在之 外,在表达盒的两侧具有抗阻抑物序列经证实是非常有益的,这样 包含转基因的表达盒的两侧具有两个抗阻抑物序列,这两个序列在 某些实施方案中基本上彼此相同。当然,这也可以用STAR67进 行,获得在两侧具有两个STAR67序列的表达盒。表达盒中一个 STAR67序列的其它位置例如在转基因之后也是可能的,优选在转 录终止和聚腺苷酸化信号之后,STAR67序列的3’末端面对转基 因。

本发明的表达盒可任选包含一个选择标记基因。术语“选择标 记或者可选择标记”典型用于描述其存在可以直接或者间接在细胞 中检测的基因和/或蛋白质,例如使选择剂失活并且保护宿主细胞免 于该制剂的致死或者生长抑制作用的基因和/或蛋白质(例如抗生素抗 性基因和/或蛋白质)。另一种可能性是所述选择标记诱导荧光或者颜 色沉积(例如绿色荧光蛋白及衍生物,荧光素酶,lacZ,磷酸酶 等等)。在某些实施方案中,用于本发明的选择标记是zeocin,对于 选择第二种表达盒使用嘌呤霉素。本领域技术人员已知可以获得及 利用其它选择标记,例如新霉素、杀稻瘟素、嘌呤霉素、博来霉 素、潮霉素、dhfr等等。

术语“选择”典型是指使用选择标记/可选择标记和选择剂鉴别 具有特殊遗传性质的宿主细胞的过程(例如宿主细胞含有整合进其基 因组中的转基因)。本领域技术人员明白可以将选择标记组合。可能 的抗生素例子如上文提供。特别有利的一种抗生素是zeocin,因为 zeocin-抗性蛋白(zeocin-R)通过结合药物并使其无害而起作用。因 此,易于滴定测定杀死低水平表达zeocin-R的细胞的药物量,同时 使得高水平表达的细胞存活。常用的所有其它抗生素抗性蛋白是 酶,并因此通过催化起作用(与药物不是1∶1)。当进行两步选择时, 因此优选使用具有这种1∶1结合作用模式的抗生素抗性蛋白。因 此,抗生素zeocin是优选的选择标记。为方便起见,在两步选择方 法中,zeocin抗生素可以组合例如嘌呤霉素、杀稻瘟素或者潮霉 素,例如可存在于单顺反子基因中。

也可以将抗生素选择标记与提供诱导荧光或者提供颜色沉积的 选择标记组合。可以使用不同的启动子,只要其在使用的细胞中起 作用即可。

在某些实施方案中,提供了一种表达盒,其在例如感兴趣蛋白 质的开放读框与选择标记开放读框之间具有(弱)内在核糖体结合 位点(IRES)作为具有降低翻译效力的蛋白质翻译起始位点的例子。 蛋白质从IRES元件中的翻译比帽依赖性翻译的效力低:从IRES依 赖性开放读框(ORF)中翻译的蛋白质的量比从第一个ORF中翻译的 蛋白质的量低20%-50%(Mizuguchi et al.,2000)。另外,IRES元件 的突变可以使其活性弱化,并使从IRES依赖性ORF中的表达降低 至低于从第一个ORF中表达的10%(Lopez de Quinto&Martinez- Salas,1998,Rees et al.,1996)。当IRES依赖性ORF编码一种可选择 标记蛋白时,其相对低翻译水平意味着必须存在绝对高的转录水平 以选择重组宿主细胞。因此,选择的重组宿主细胞分离株必需表达 高量的转基因mRNA。因为重组蛋白质是从帽依赖性ORF中翻译 的,因此其可以大量产生,导致高产物产量。

常规的表达系统是重组质粒或者重组病毒基因组形式的DNA分 子。通过本领域已知方法将质粒或者病毒基因组导入(真核宿主)细胞 中,并优选整合进其基因组中。在优选的实施方案中,本发明还使 用这些类型的DNA分子输送其改良的转基因表达系统。本发明的一 个优选实施方案是使用质粒DNA输送表达系统。质粒含有许多成 分:本领域已知的常规成分是复制起点和可选择标记以使得质粒在 细菌细胞中增殖;在真核细胞中起作用以鉴别和分离携带整合的转 基因表达系统的宿主细胞的可选择标记;编码感兴趣蛋白质的核 酸,其高水平转录通过在真核细胞中起作用的启动子进行(例如人巨 细胞病毒主要立即早期启动子/增强子,pCMV(Boshart et al., 1985);及感兴趣的转基因和可选择标记的转录终止子(例如SV40聚 腺苷酸化位点(Kaufman&Sharp,1982)。使用的载体可以是适于克隆 DNA并且可用于转录感兴趣核酸的任何载体。当使用宿主细胞时, 优选所述载体是一种整合载体。或者,所述载体可以是附加型复制 载体。

图1提供了表达盒的可能构型的一些非限制性示意图。这是质 粒中以及整合进基因组中之后表达盒的DNA元件的构型。构建体A 含有包含编码蛋白质的开放读框的一个表达单位(基因)。其位于弱化 的EMCV IRES(Martinez-Salas et al 1999;Mizuguchi et al 2000; Rees et al 1996)和编码zeocin抗性可选择标记蛋白(zeo)的开放读框的 上游。所述基因盒在其3’末端具有SV40转录终止子(t)。这种双 顺反子转基因从CMV启动子中高水平转录。构建体B衍生自构建 体A,但是将STAR67克隆在CMV启动子的上游。构建体C衍生 自构建体B,但是将两种抗阻抑物元件(在这种情况中是STAR7)克 隆在完整表达盒的两侧。

表达盒中抗阻抑物序列的组合

本发明示出组合启动子上游的第一个抗阻抑物元件及表达盒两 侧的两个其它抗阻抑物序列提供了极佳的结果。特别地,当在CHO 细胞中使用SV40启动子时,在没有抗阻抑物序列的条件下表达已 经非常高,但是当将STAR67置于所述启动子上游及在完整表达盒 两侧具有两个抗阻抑物元件如STARβ、STAR7或STAR 40时,表 达显著增强。

因此,本发明的一个目的是提供包含表达盒的重组核酸分子, 所述表达盒包含(从5’至3’):抗阻抑物序列A-启动子-编码感兴趣 蛋白质的核酸-抗阻抑物序列B,特征在于所述表达盒在所述抗阻抑 物序列A与B之间进一步包含一个抗阻抑物序列C。在一个优选的 实施方案中,所述抗阻抑物序列C存在于所述启动子的上游,如上 述标题为“表达盒”的段落中描述的构型。抗阻抑物序列A与B之 间的表达盒可进一步包含如上述表达盒的元件,例如转录终止子序 列、聚腺苷酸化信号、选择标记基因、增强子等等,并且可以是如 上述单顺反子、双顺反子或者多顺反子。

抗阻抑物序列A、B和C的两个或所有三个可以相同或所有三 个可以不同。抗阻抑物序列A和B可以与抗阻抑物序列C相同或不 同。在某些实施方案中,抗阻抑物序列A和B彼此(基本)相同。 在一个实施方案中,抗阻抑物序列C是STAR67或者其功能片段或 衍生物。抗阻抑物序列A和B可以是任何抗阻抑物序列,在某些实 施方案中包含SEQ.ID.NO.1-65之一或其功能片段或衍生物。在某 些实施方案中,表达盒含有一个多顺反子基因,在其优选的实施方 案中,所述多顺反子基因包含编码感兴趣蛋白质和选择标记基因的 序列。或者,选择标记基因在单独的启动子控制下存在。

在某些实施方案中,在STAR序列A与B之间可以存在第四个 抗阻抑物序列D。在这种实施方案中,所述抗阻抑物序列D优选位 于编码感兴趣蛋白质的核酸的下游。再者,这个抗阻抑物序列D与 重组核酸分子中的其它抗阻抑物序列可以相同或不同,其可以是任 何抗阻抑物序列,在某些实施方案中其选自SEQ.ID.NO.1-66任一 序列或其功能片段或衍生物。

由于至少一些抗阻抑物序列可以是有方向的(WO 00/004704), 因此在表达盒两侧的抗阻抑物序列(抗阻抑物序列A和B)可以彼此 相反方向放置,由此这些抗阻抑物的3’末端向内面向表达盒(及彼此 向内面向)。因此,在优选的实施方案中,抗阻抑物元件的5’末端面 向DNA/染色质,其对转基因的影响通过所述抗阻抑物元件而降 低。对于表达盒中启动子上游的抗阻抑物序列而言,3’末端面向启 动子。除非特别指出,则序列表中的抗阻抑物元件的序列(SEQ.ID. NO.1-66)是以5’至3’方向提供的。

本发明的细胞

包含本发明的STAR序列和/或表达盒的核酸分子可用于改良核 酸的表达,优选在宿主细胞中的表达。术语“细胞‘V’宿主细胞” 及“细胞系‘V’宿主细胞系”典型分别是指通过本领域已知的方法在 细胞培养中可以保持并且具有表达异源或者同源蛋白质的能力的细 胞及其同种群。本发明的宿主细胞优选是真核细胞,更优选是哺乳 动物细胞,如啮齿动物细胞或者人细胞或者不同细胞的融合体。在 某些非限制性实施方案中,所述宿主细胞是U-2 OS骨肉瘤、CHO (中国仓鼠卵巢)、HEK 293、HuNS-1骨髓瘤、WERI-Rb-1成视网膜 细胞瘤、BHK、Vero、非分泌性小鼠骨髓瘤Sp2/0-Ag 14、非分泌性 小鼠骨髓瘤NSO、NCI-H295R肾上腺癌或者PER.C6细胞。

在本发明的某些实施方案中,宿主细胞是表达腺病毒的至少 E1A、优选也表达E1B的细胞。作为非限制性的例子,这种细胞可 以衍生自例如人体细胞,例如衍生自肾(例如HEK 293细胞,见 Graham et al,1977所述)、(例如A549,见例如WO 98/39411所述) 或者视网膜(例如HER细胞,商品名为PER.C6,见美国专利 5,994,128所述),或者衍生自羊水(例如N52.E6,见美国专利 6,558,948所述)及相似地衍生自其它细胞。获得这种细胞的方法见例 如美国专利5,994,128和US 6,558,948所述。本发明应用的PER.C6 细胞是在ECACC保藏号为96022940的细胞的上游或下游传代或者 上游或下游传代的后代。先前已经示出这种细胞能高水平表达蛋白 质(例如WO 00/63403及Jones et al,2003所述)。

表达本发明所需蛋白质的这种宿主细胞可以通过将本发明的核 酸分子、优选表达盒形式导入细胞中而获得。在另一个实施方案 中,将STAR67序列定向整合进染色体区域中以改良已经整合进该 基因组中的感兴趣基因的表达,例如天然发生的基因,任选在靶向 所述基因上游的异源启动子控制下调节所述基因的表达。

优选地,所述宿主细胞来自可以根据本领域技术人员已知的标 准方法选择和增殖的稳定克隆。这种克隆的培养物能产生感兴趣的 重组蛋白质。本发明的细胞优选能在无血清的培养基中悬浮生长。

本发明的感兴趣蛋白质可以是任何蛋白质,可以是单体蛋白质 或者多聚体蛋白质。多聚体蛋白质包含至少两个多肽链。感兴趣蛋 白质的非限制性例子是酶、激素、免疫球蛋白链、治疗性蛋白质如 抗癌蛋白质、血液凝聚蛋白如因子VIII,、多功能蛋白质如红细胞生 成素、诊断性蛋白质、或者用于接种目的的蛋白质或其片段,所有 这些蛋白质均为本领域技术人员所已知。

在某些实施方案中,本发明的表达盒编码免疫球蛋白重链或轻 链或其抗原结合部分、衍生物和/或相似物。在一个优选的实施方案 中,提供了本发明的蛋白质表达单位,其中所述感兴趣蛋白质是免 疫球蛋白重链。在另一个优选的实施方案中,提供了本发明的蛋白 质表达单位,其中所述感兴趣蛋白质是免疫球蛋白轻链。当这两种 蛋白质表达单位存在于同一(宿主)细胞中时,装配成多聚体蛋白 质,更特别地装配成抗体。因此在某些实施方案中,感兴趣蛋白质 是免疫球蛋白,如抗体,其是多聚体蛋白质。优选地,这种抗体是 人或人源化抗体。在其某些实施方案中,这种抗体是IgG、IgA或者 IgM抗体。免疫球蛋白可以由不同表达盒或者一个表达盒上的重链 和轻链编码,其中编码每个链的基因可以在多顺反子转录单位中单 独启动子的控制下,或者这两个链均可在多顺反子基因上编码。

感兴趣蛋白质可以来自任何来源,在某些实施方案中是哺乳动 物蛋白质,人工蛋白质(例如融合蛋白或者突变蛋白),优选是人 蛋白质。

显而易见,当最终的目的不是生产蛋白质而是RNA自身时,也 可以使用本发明的抗阻抑物序列和表达盒构型,例如从表达盒中生 产增加数量的RNA,这可用于调节其它基因(例如RNAi,反义 RNA)、基因治疗、体外蛋白质产生等目的。

生产感兴趣蛋白质的方法

一方面,本发明提供了一种表达感兴趣序列、优选编码感兴趣 蛋白质的序列的方法,通过提供具有本发明的核酸分子或者表达盒 的宿主细胞、培养该细胞并表达感兴趣序列而进行。

术语“表达”典型用于描述细胞中特异的一或多种RNA产物或 者特异的一或多种蛋白质的产生。在RNA产物的情况中,表达是指 转录过程。在蛋白质产物的情况中,表达是指转录、翻译及任选翻 译后修饰(例如糖基化、二硫键形成等)的过程。在分泌的蛋白质 的情况中,表达是指转录、翻译、及任选翻译后修饰及随后的分泌 过程。

导入要在细胞中表达的核酸可以通过如本领域技术人员已知的 几种方法之一进行,也依赖于导入的核酸的形式。所述方法包括但 不限于转染、感染、注射、转化等。

对细胞进行培养是使其能代谢和/或生长和/或分裂和/或产生感 兴趣的重组蛋白质。这种培养可以通过本领域技术人员熟知的方法 实现,包括但不限于为细胞提供营养。所述方法包括附着在表面生 长、悬浮生长或其组合。培养可以例如在培养皿、滚瓶或者在生物 反应器中进行,使用分批培养、补料分批培养、持续系统如灌注系 统等方式进行。为了达到在细胞培养期间大规模(持续)产生重组 蛋白质,优选使细胞能悬浮生长,及优选使细胞能在无得自动物或 人的血清或者得自动物或人的血清成分的条件下培养。

生长或者繁殖细胞的条件(见例如Tissue Culture,Academic Press, Kruse and Paterson,editors(1973))及表达重组产物的条件为本领域技 术人员所已知。通常,使哺乳动物细胞培养物的生产力最大化的原 理、方案及实践技术可见于Mammalian Cell Biotechnology:a Practical Approach(M.Butler,ed.,IRL Press,1991)所述。

在一个优选实施方案中,从细胞或者培养基或者这两者中收集 (分离)表达的蛋白质。然后使用本领域技术人员通常已知的方法 进一步纯化,例如通过过滤、柱层析等。

新的选择方法

本发明揭示了一种产生表达两种感兴趣多肽的宿主细胞的新方 法,所述方法提供了令人惊奇的良好结果,不使用抗阻抑物序列则 几乎没有或没有集落出现,而存在抗阻抑物序列则导致克隆在选择 下存活,这些克隆通常高水平表达感兴趣的两种多肽(实施例7,图 11)。本发明因此提供了一种产生表达两种感兴趣多肽的宿主细胞的 方法,所述方法包括:a)向宿主细胞中导入一或多种核酸分子,所 述核酸分子包含:(i)与编码第一种感兴趣多肽和第一种可选择标记 基因的序列功能性连接的启动子,及(ii)与编码第二种感兴趣多肽和 第二种可选择标记的序列功能性连接的启动子,及(iii)至少一种抗阻 抑物序列,其选自:(a)SEQ.ID.NO.1-66任一序列,(b)SEQ.ID. NO.1-66任一序列的片段,所述片段具有抗阻抑物活性,(c)与(a)或 (b)至少70%相同并具有抗阻抑物活性的序列,及(d)与(a)-(c)任一 序列互补的序列;b)通过基本上同时选择表达所述第一种和第二种 可选择标记基因而选择宿主细胞。选择的宿主细胞可便利地用于表 达所述两种多肽,通过培养所述选择的宿主细胞进行。在一个实施 方案中,两种核酸分子用于导入宿主细胞中,所述分子之一含有 (i),另一分子含有(ii)。在这个实施方案中,每个核酸分子优选含有 至少一种所述抗阻抑物序列。在另一个实施方案中,使用含有(i)和 (ii)两者的一个核酸分子,其然后必须含有至少一个所述抗阻抑物序 列。在一个核酸分子上具有这两种多肽的编码序列的一个优势是在 将核酸导入细胞之前仅需要一种核酸制品。另外,在这种实施方案 中,一次整合对于两种多肽的编码序列即足够,从而避免了编码第 一种多肽的核酸与编码第二种多肽的核酸整合位置不同或者具有不 同拷贝数的可能性。在优选的实施方案中,所述两种多肽可以形成 多聚体蛋白质如免疫球蛋白的部分。所述方法因此特别适于表达抗 体。所述两个启动子可以相同或不同,可以是前述任何启动子。当 使用含有(i)和(ii)两者的一个核酸分子时,这一个核酸分子上的两个 转录单位的方向可例如是同向的或者彼此面向反向或者彼此向外反 向的。在后者情况中,所述抗阻抑物序列可以置于两个启动子之间 (例如图HB所示)。适合本发明这方面的一个抗阻抑物序列是SEQ. ID.NO.66 (见实施例7),但是其它抗阻抑物序列也可以起作用。这 可易于由本领域技术人员使用本文揭示的方法测试,因此本发明这 方面使用其它抗阻抑物序列也包含在本发明范围内。另外,抗阻抑 物序列可以添加在一或两个转录单位两侧。标记基因必须是不同 的,可例如选自如前述的标记基因。在某些实施方案中,一种可选 择标记是zeocin,另一可选择标记是例如嘌呤霉素。然而,应清楚 可以使用其它组合,这也包含在本发明这方面范围内。标记的表达 应优选依赖于感兴趣多肽的表达。这可以通过将标记基因的表达与 感兴趣多肽的表达联系起来而建立,例如使用多顺反子基因进行, 例如使用如前述IRES序列。“基本上同时”选择是指至少在部分时 间、优选至少一天、更优选至少两天、更优选至少五天,这两种选 择剂均存在,这可以通过将这两种选择剂同时加入培养基中或者加 入包含这两种选择剂的培养基而进行(例如实施例7所述)。应清楚在 第一种选择剂已经存在于培养基中之后只是几小时或几天加入第二 种选择剂在本发明仍意味着是基本上同时选择。这种情况有别于其 中将细胞首先用第一种选择剂选择,一旦集落形成则将细胞在加入 了第二种选择剂而没有第一种选择剂的新的培养基上选择的情况(连 续选择,例如实施例5和WO 03/106684所述)。通过基本上同时选 择这两种可选择标记,本发明令人惊奇地提供了快速和强力的选 择,从而消除了许多低产量的克隆,明显降低了发现具有所需表达 特性的克隆的工作量。这对于生物技术工业特别有利,该行业在鉴 别具有高表达水平的所需克隆之前通常需要筛选几百甚至几千个集 落。

另外,该系统提供了测试抗阻抑物元件、至少STAR67但也可 以是其它抗阻抑物序列在这个系统中起作用的部分的功能性的可能 性。这个简单筛选在许多情况中提供了几乎或者甚至完全显而易见 的差异,因此有助于鉴别抗阻抑物序列的功能部分或衍生物,和/或 有助于鉴定新的抗阻抑物序列。所述筛选甚至可用于发现新的抗阻 抑物和/或表达增强序列(因为这种类型的筛选不是仅针对抗阻抑物活 性而是针对增强表达的活性进行选择,因此其也可以发现具有后者 而非前者活性的序列)。因此,本发明的另一方面提供了一种鉴别抗 阻抑物和/或表达增强序列或其功能片段或衍生物的方法,所述方法 包括:a)向宿主细胞中导入一或多种核酸分子,所述一种核酸分子 或多种核酸分子一起包含:(i)与第一种可选择标记基因功能连接的 启动子,及(ii)与第二种可选择标记功能连接的启动子,及(iii)要测 试抗阻抑物和/或表达增强活性的至少一个序列;b)通过基本同时选 择所述第一种和第二种可选择标记基因的表达选择宿主细胞。经过 这种筛选存活的细胞很可能含有功能性抗阻抑物和/或表达增强元 件。然后对这种元件可易于进一步分析,例如通过确定其序列和/或 通过将其进行如上述抗阻抑物活性的其它功能测试而分析。在一个 实施方案中,(i)和(ii)均在一个核酸分子上,例如由启动子分隔(第一 个和第二个可选择标记向外反向),在此之间可以克隆测试序列以进 行分析。优选地,所述可选择标记基因不是高表达的,例如通过使 用相对弱启动子直接驱动可选择标记基因,所述相对弱启动子是已 知的和/或可以由本领域技术人员通过常规分析鉴别,或者例如使用 强启动子进行转录,及使用IRES、优选如前述相对弱的IRES翻译 标记基因。所述标记基因也可以便利地置于编码多肽的核酸序列的 下游,并在多顺反子基因中例如通过IRES与其表达连接(例如实施 例7所述,图11示出可能的构型)。这种多肽可同样是感兴趣的多 肽,由此获得表达所述感兴趣多肽的直接可用克隆,但对于筛选目 的也可以是其表达可易于量化的标记,例如GFP或其衍生物、 SEAP、lacZ、荧光素酶等等。在这种组合中,多肽的表达可以直接 量化以挑选在同时选择期间提供足够的集落及提供高转录水平的抗 阻抑物和/或表达增强元件或其片段。当“随机”核酸(即仍未知其具 有抗阻抑物或表达增强活性的核酸),例如基因组片段形式,用作测 试序列测试抗阻抑物和/或表达增强活性时,可以发现新的抗阻抑物 和/或表达增强序列。当测试已知抗阻抑物序列时,这个分析可用于 对其进一步鉴定。当测试已知抗阻抑物序列的片段时,所述分析将 提供这种已知抗阻抑物序列的功能片段。

除非特别指出,实践本发明应用本领域技术人员已知的免疫 学、分子生物学、微生物学、细胞生物学及重组DNA等常规技术。 见例如Sambrook,Fritsch and Maniatis,Molecular Cloning:A Laboratory Manual,2nd edition,1989;Current Protocols in Molecular Biology,Ausubel FM,et al,eds,1987;the series Methods in Enzymology(Academic Press,Inc.);PCR2:A Practical Approach, MacPherson MJ,Hams BD,Taylor GR,eds,1995;  Antibodies:A Laboratory Manual,Harlow and Lane,eds,1988所述。

本发明在如下实施例中得以进一步解释。所述实施例非以任何 方式限制本发明。所述实施例只是为了阐明本发明。

实施例

实施例1:STAR67载体的构建

使用如WO 03/004704所述遗传筛选方法分离到一种新的抗阻抑 物序列,将这个新序列称作STAR67(SEQ.ID.NO.66)。测试了 STAR67对转基因在哺乳动物细胞中表达的作用。在此我们描述了 各种构建体的构建。

材料和方法

产生三种质粒(图1):

A)CMV-d2EGFP-ires-Zeo(CMV对照),

B)STAR67-CMV-d2EGFP-ires-Zeo(CMV-STAR67),

C)STAR7-STAR67-CMV-d2EGFP-ires-Zeo-STAR7(CMV-STAR67 7/7)

构建体A的构建如下所述。将质粒pd2EGFP(Clontech 6010-1) 通过在BsiWI位点插入一个接头而修饰,产生pd2EGFP-link。通过 退火寡核苷酸GTACGGATATCAGATCTTTAATTAAG(SEQ.ID. NO.67)和GTACCTTAATTAAAGATCTGATAT(SEQ.ID.NO.68)产 生的这一接头导入PacI、BglII和EcoRV限制性核酸内切酶位点。 这样产生了多克隆位点MCSII用以插入STAR元件。然后使用引物 GATCAGATCTGGCGCGCCATTTAAATCGTCTCGCGCGTTTCGGT GATGACGG(SEQ.ID.NO.69)和(AGGCGGATCCGAATGTATTTA GAAAAATAAACAAATAGGGG(SEQ.ID.NO.70)扩增pd2EGFP中 的一个0.37kb区域,将其插入在pIRES(Clontech 6028-1)的BglII位 点,产生pIRES-stuf。这样在MCSI导入AscI和SwaI限制性核酸内 切酶的位点,并且作为“填充片段”避免STAR元件与相邻启动子 之间的潜在干扰。将pIRES-stuf用BglII和FspI消化以释放由填充 片段、CMV启动子、IRES元件(两侧为多克隆位点MCS A和MCS B)及SV40聚腺苷酸化信号组成的DNA片段。将这个片段与通过 BamHI和StuI消化产生的pd2EGFP-link的载体主链连接,产生 pIRES-link。

如下所述将zeocin抗性基因的开放读框插入pIRES下游的 BamHI/NotI位点:通过使用引物 GATCGGATCCTTCGAAATGGCCAAGTTGACCAGTGC(SEQ.ID. NO.71)和AGGCGCGGCCGCAATTCTCAGTCCTGCTCCTC(SEQ. ID.NO.72)经PCR从质粒pCMV/zeo(Invitrogen,cat.no.V50 120)中扩 增zeocin-抗性ORF,用BamHI和NotI消化,并与BamHI/NotI-消 化的pIRES-link连接,产生pIRES-link-zeo。将d2EGFP报道ORF 导入pIRES-link-zeo中,这通过使用引物 GATCGAATTCTCGCGAATGGTGAGCAAGCAGATCCTGAAG (SEQ.ID.NO.73)和AGGCGAATTCACCGGTGTTTAAACTTACAC CCACTCGTGCAGGCTGCCCAGG(SEQ.ID.NO.74)扩增pd2EGFP (Clontech 6010-1),及将EcoRI-消化的d2EGFP表达盒插入pIRES- link-zeo质粒中的EcoRI位点而进行。这样产生构建体A,即CMV- d2EGFP-IRES-Zeo(CMV对照)。

将STAR67克隆在CMV启动子上游AscI位点(在STAR67与启 动子之间保留大约15个核苷酸)。这样产生构建体B,即STAR67- CMV-d2EGFP-ires-Zeo(CMV-STAR67)。

还将STAR67置于还含有STAR7(SEQ.ID.NO.7)的表达盒中进 行了测试,所述STAR7被定向克隆在5’SalI和XbaI位点以及3’ BglII和PacI位点以使STAR7位于整个表达盒的两侧。这是构建体 C(CMV-STAR67 7/7)。

实施例2:在稳定转染的CHO细胞中STAR67增强从CMV、EF1α 和UB6启动子的表达水平

我们测试了CMV、EF1α和UB6启动子邻近存在STAR67是否 影响这些启动子在CHO细胞中的表达水平。用于这个目的的构建体 是实施例1所述的构建体A和B(图1),它们针对各自的启动子进 行修饰:

1  CMV-d2EGFP-ires-Zeo(CMV对照)

2  STAR67-CMV-d2EGFP-ires-Zeo(CMV-STAR67)

3  EF1α-d2EGFP-ires-Zeo(EF1α对照)

4  STAR67-EF1α-d2EGFP-ires-Zeo(EF1α-STAR67)

5  UB6-d2EGFP-ires-Zeo(UB6对照)

6  STAR67-UB6-d2EGFP-ires-Zeo(UB6-STAR67).

材料和方法

将图1所述质粒中的CMV启动子更换为UB6和EF1α启动子。 UB6启动子如下克隆。如实施例1所述,将pd2EGFP质粒的0.37kb DNA填充片段经使用SEQ.ID.NO.69和70引物进行PCR扩增。将 所得DNA填充片段克隆进pUB6/V5-His[Invitrogen V250-20]的 BglII位点,产生pUB6-stuf。从pUB6-stuf中,将一个AscI-SacI片 段克隆进CMV-d2EGFP-IRES-Zeo中,从中除去CMV启动子。

用pEF1α/V5-His[Invitrogen V920-20]作为模板使用引物 GATCGGCGCGCCATTTAAATCCGAAAAGTGCCACCTGACG (SEQ.ID.NO.79)和AGGCGGGACCCCCTCACGACACCTGAAAT GGAAG(SEQ.ID.NO.80)经PCR扩增EF1α启动子。将PCR片段克 隆进CMV-d2EGFP-IRES-Zeo的AscI和PpuMI位点,从中除去 CMV启动子。

将中国仓鼠卵巢细胞系CHO-K1(ATCC CCL-61)在HAMS-F12 培养基+10%胎血清及2mM谷酰胺、100U/ml青霉素和 100μg/ml链霉素中在37℃/5%CO2条件下培养。使用SuperFect (QIAGEN)根据厂商所述将细胞用质粒转染。简而言之,将细胞接种 在培养容器中并生长过夜至70-90%铺满。将SuperFect试剂与质粒 DNA以6μl/μg比率组合(例如对于10cm Petri培养皿,使用20μg DNA和120μl SuperFect)并加入细胞中。在过夜保温后,将转染混和 物用新鲜培养基置换并进一步保温转染的细胞。在过夜培养后,将 细胞经胰蛋白酶消化并接种在具有新鲜培养基的新鲜培养容器中。 在再次过夜保温之后,加入zeocin至浓度为50μg/ml并进一步培养 细胞。过三天后,将培养基用含有zeocin(100μg/ml)的新鲜培养基 置换并进一步培养。当可见各个集落时(大约转染后10天),除去培 养基,用无zeocin的新鲜培养基更换。分离各个克隆并移至无 zeocin的24孔平板中。在分离集落1天后,向培养基中加入 zeocin。在转染后大约3周评定d2EGFP报道基因的表达。两周后测 定集落中的d2EGFP表达水平。当在转染后最初的两周后第一次测 定d2EGFP时,将集落在无zeocin或者其它抗生素的培养基中培 养。这持续至实验结束。

结果

图2示出了与无STAR67的“空白”对照CMV对照相比,含有克 隆在CMV启动子上游的STAR67的构建体的转染产生了许多表达显 著较高水平d2EGFP蛋白的CHO集落。当在转染后25天测定时,用 CMV对照质粒转染的10个集落中d2EGFP信号平均值为34。在转染 后60天,这10个集落中d2EGFP信号平均值降低为13,表明表达随着 时间的推移是不稳定的。对比之下,当在转染后25天测定时用 STAR67-CMV质粒转染的10个集落中d2EGFP信号的平均值为42,在 转染后60天测定时为32。因此在转染后60天,在稳定转染的克隆中 包含STAR67的CMV构建体比CMV启动子驱动的报道蛋白表达水平 高2.5倍。重要的是在转染25天后,在第一次测定之后,通过将集落 在无zeocin的培养基中培养而除去选择压力。因此,含有STAR67构 建体的集落在无选择压力的条件下与不含STAR67构建体的集落相比 随着时间的推移是更稳定的。

图3示出了与无STAR67的“空白”对照EF1α对照相比,含有克 隆在EF1α启动子上游的STAR67的构建体的转染产生了表达显著较 高水平d2EGFP蛋白的许多CHO集落。当在转染后25天测定时,用 EF1α对照质粒转染的10个集落中d2EGFP信号平均值为31。在转染 后60天,这10个集落中信号平均值为26。对比之下,当在转染后25 天测定时用EF1α-STAR67质粒转染的10个集落中d2EGFP信号的平均 值为60,在转染后60天测定时为76。因此在转染后25和60天,在稳 定转染的克隆中包含STAR67的EF1α构建体比EF1α启动子驱动的报 道蛋白表达水平高2.9倍。

图4示出了与无STAR67的“空白”对照UB6对照相比,含有克 隆在UB6启动子上游的STAR67的构建体的转染产生了许多表达显著 较高水平d2EGFP蛋白的CHO集落。当在转染后25天测定时,用UB6 对照质粒转染的10个集落中d2EGFP信号平均值为51。在转染后60 天,这10个集落中信号平均值为29,表明该表达随着时间的推移是 不稳定的。对比之下,当在转染后25天测定时用UB6-STAR67质粒 转染的10个集落中d2EGFP信号的平均值为218,在转染后60天测定 时为224。因此在转染后25天,在稳定转染的克隆中包含STAR67的 UB6构建体比UB6启动子驱动的报道蛋白表达水平高4.3倍。在60天 后高7.7倍,这是由于对照集落的表达不稳定性和UB6-STAR67集落 的稳定性所致。重要的是在转染25天后,在第一次测定后,通过将 集落在无zeocin的培养基中培养而除去选择压力。因此,含有 STAR67构建体的集落在无选择压力的条件下与不含有STAR67构建 体的集落相比随着时间的推移是更稳定的。

总之,STAR67增加从三种不同的彼此不相关的启动子的表达。

实施例3:在稳定转染的PER.C6细胞中STAR67增强从CMV、EF1α 和UB6启动子的表达水平

我们测试了在CMV、EF1α和UB6启动子邻近存在STAR67是否 影响这些启动子在除了CHO细胞之外的另一种细胞类型即人PER.C6 细胞中的表达水平。使用如实施例1中的相同构建体。

材料和方法

PER.C6细胞的转染、培养和分析

将PER.Cβ细胞在DMEM培养基+吡哆醇+9%胎牛血清(非加 热而失活)、8.9mM MgCl2、100U/ml青霉素和100μg/ml链霉素中 在37℃/10%CO2条件下培养。使用Lipofectamine 2000(Invitrogen) 如厂商所述将细胞用质粒转染。简而言之,将细胞接种在6孔平板 中并生长过夜至70-90%铺满。将Lipofectamine试剂与质粒DNA 以15μl/3μ比g率组合(例如对于10cm Petri培养皿,使用20μg DNA 和120μl Lipofectamine),在25℃保温30分钟之后加入细胞中。在保 温β小时之后,将转染混合物用新鲜培养基置换,并进一步保温转染 的细胞。在培养过夜后,将细胞经胰蛋白酶消化并接种于(1∶15、 1∶30、1∶60、1∶120稀释)新鲜petri培养皿(90mm)中的含有100 μg/ml浓度的zeocin的新鲜培养基,进一步培养细胞。当可见集落 时,通过刮擦分离各个集落并移至24孔平板中的含有zeocin的培养 基中。当生长至大约70%铺满时,将细胞移至6孔平板中。将稳定 的集落在6孔平板中扩增2周,之后在XL-MCL Beckman Coulter流 式细胞计量仪上确定d2EGFP信号。取d2EGFP信号的平均值作为 d2EGFP表达水平的量值。2周后对集落再次测量。之后将集落在无 zeocin的条件下进一步培养。

结果

图5示出了与无STAR67的“空白”对照CMV对照相比,含有克 隆在CMV启动子上游的STAR67的构建体的转染产生了许多表达显 著较高水平d2EGFP蛋白的PER.C6集落。当在转染后30天测定时, 用CMV对照质粒转染的10个集落中d2EGFP信号平均值为37。在转 染后60天,这10个集落中信号平均值降低为14,表明该表达随着时 间的推移是不稳定的。对比之下,当在转染后30天测定时用 STAR67-CMV质粒转染的10个集落中d2EGFP信号的平均值为101, 在转染后60天测定时为45。因此在转染后60天,在稳定转染的克隆 中包含STAR67的CMV构建体比CMV启动子驱动的报道蛋白表达水 平高3.2倍。

图6示出与无STAR67的“空白”对照EF1α对照相比,含有克隆 在EF1α-启动子上游的STAR67的构建体的转染产生了许多表达显著 较高水平d2EGFP蛋白的PER.C6集落。在转染30天后测定时,用 EF1α对照质粒转染的10个集落中d2EGFP信号的平均值为5。在转染 60天后这10个集落中d2EGFP信号平均值为6。对比之下,当在30天 后测定时,用EF1α-STAR67质粒转染的10个集落中d2EGFP信号平均 值为25,在转染后60天测定时为20。因此,在转染后30和60天,在 稳定转染的克隆中包含STAR67的EF1α构建体比EF1α启动子驱动的 报道蛋白表达水平高4倍。

图7示出与无STAR67的“空白”对照UB6对照相比,含有克隆 在UB6启动子上游的STAR67的构建体的转染产生了许多表达显著较 高水平d2EGFP蛋白的PER.C6集落。在转染30天后测定时,用UB6对 照质粒转染的10个集落中d2EGFP信号的平均值为4。在转染60天后 这10个集落中d2EGFP信号平均值为2。对比之下,当在30天后测定 时,用UB6-STAR67质粒转染的10个集落中d2EGFP信号平均值为 27,在转染后60天测定时为18。因此,在转染后30和60天,在稳定 转染的克隆中包含STAR67的UB6构建体比UB6启动子驱动的报道蛋 白表达水平高7-9倍。

因此,与无STAR67的构建体相对比,将STAR67置于启动子上 游在PER.C6细胞中产生显著较高的蛋白质表达水平。因此STAR67 在不同的彼此不相关的细胞类型中均起作用。

实施例4:STAR67组合其它抗阻抑物元件的新构型在CHO细胞中增 强SV40启动子

我们测试了SV40启动子邻近单独存在STAR67或者存在STAR67 与另一种抗阻抑物元件(在这个实施例中是STAR7)的组合是否影 响这个启动子的表达水平。用于这个目的的构建体是(见图8):

1  SV40-d2EGFP-ires-Zeo(SV40 Control)

2  STAR67-SV40-d2EGFP-ires-Zeo(SV40-STAR67)

3  STAR7-SV40-d2EGFP-ires-Zeo-STAR7(SV40-STAR7/7)

4  STAR7-STAR67-SV40--d2EGFP-ires-Zeo-STAR7(SV40- STAR67 7/7)

材料和方法

使用pIRES作模板,使用如下引物将SV40启动子经PCR扩增:

TTGGTTGGGGCGCGCCGCAGCACCATGGCCTGAAATAACCTCT GAAAGAGG(SEQ.ID.NO.81)和 TTGGTTGGGAGCTCAAGCTTTTTGCAAAAGCCTAGGCCTCCAA AAAAGCCTCCTC(SEQ.ID.NO.82)。将PCR片段克隆进CMV- d2EGFP-IRES-Zeo的AscI和SacI位点,从中除去CMV启动子。如实

施例2所述转染CHO细胞、分离集落及增殖和分析。

结果

图8示出了与无抗阻抑物元件的“空白”对照(SV40对照)相比, 含有克隆在SV40启动子上游的STAR67的构建体(SV40-STAR67)或者 含有克隆在完整构建体两侧的STAR7的构建体(SV40-STAR 7/7)的转 染不产生表达明显较高水平d2EGFP蛋白的CHO集落。当在转染后40 天测定时,用SV40对照质粒转染的18个集落中d2EGFP信号的平均 水平为86。对比之下,当在40天后测定用SV40-STAR67质粒转染的 18个集落中d2EGFP信号的平均水平为82,在40天后测定用SV40- STAR 7/7质粒转染的18个集落中信号平均水平为91。因此,观测到 这些抗阻抑物元件对CHO细胞中SV40启动子无明显作用。

看起来在这些细胞中从SV40启动子的表达水平已经非常高,甚 至高于用被认为是非常强的启动子的CMV启动子所观察到的表达水 平。这种在CHO细胞中使用SV40启动子在无抗阻抑物元件的条件下 的高背景表达,可以解释为什么观察到单独的STAR67或者位于转基 因两侧的STAR7无明显作用。

然而,当在40天后测定时,用SV40-STAR67 7/7质粒转染的18 个集落中d2EGFP信号的平均水平为209,这比18个对照集落的平均 水平(86)高2.4倍。因此,当STAR67元件与另一种抗阻抑物元件组 合使用时,产生了许多示出显著较高d2EGFP表达水平的稳定转染的 CHO集落。

因此在这种新的构型中(5’-STAR序列A-STAR序列C-启动子 -编码感兴趣蛋白质的核酸-STAR序列B-3’,其中在本实施例中 STAR序列A和B是STAR 7,STAR序列C是STAR67),STAR元件的 功能看起来均好于迄今为止揭示的构型。

我们进行了其中两侧的STAR7元件由两侧的STAR6元件(SEQ. ID.NO.6)或者两侧的STAR4元件(SEQ.ID.NO.4)置换,组合SV40 启动子上游的STAR67(分别为SV40-STAR67 6/6和SV40-STAR67 4/4,使用如上述相同命名法)的实验,使用这些组合也观测到改良的 表达。这证实了两侧的STAR7元件可以用其它STAR序列置换,并仍 观测到具有STAR序列的表达盒的新构型的改良作用。

实施例5:STAR67与STAR7的组合在稳定转染的CHO细胞中增强 UB6驱动的抗体表达水平

在实施例4中,我们示出STAR67与STAR7的组合增强了CHO细 胞中d2EGFP蛋白的表达水平。在此我们测试了STAR67与STAR7的 组合是否可用于产生抗体。我们选择抗EpCAM分子的抗体(Huls et al,1999)作为测试蛋白,并使用UB6启动子。

材料和方法

质粒

将重链cDNA(HC-EpCAM)克隆进包含UB6启动子的构建体中。 将HC-EpCAM通过IRES序列与Zeocin抗性基因结合。将轻链cDNA (LC-EpCAM)也克隆进包含UB6启动子的构建体中。将LC-EpCAM通 过IRES序列与嘌呤霉素抗性基因结合。这两个质粒代表UB6 (HC+LC)对照质粒(图9)。

为了测试STAR67和STAR7的作用,将STAR67克隆进这两个 HC+LC构建体中UB6启动子的上游。STAR7克隆在完整表达盒的两 侧5’和3’末端(图9)。这两个质粒代表STAR7-STAR67-UB6(HC+LC) STAR7。

CHO细胞的转染和培养

将中国仓鼠卵巢细胞系CHO-K1(ATCC CCL-61)如实施例2所 述转染和培养,使用zeocin(100μg/ml)和嘌呤霉素(2.5μg/ml)进行选 择。在转染后1天,向培养基中加入zeocin。当可见第一个集落时 (大约加入zeocin 7天后),除去培养基并用含有嘌呤霉素的培养基置 换。在大约7天后,分离集落并移至24孔平板中仅含有zeocin的培养 基中。

结果

图9示出与没有STAR67和STAR7的“空白”对照UB6(HC+LC) 对照相对比,含有克隆在UB6启动子上游的STAR67及克隆在完整表 达盒两侧的两个STAR7元件的抗体构建体的转染产生了大量表达显 著较高水平EpCAM抗体的CHO集落(使用抗人IgG抗体通过ELISA测 定)。当在转染后25天测定时,用UB6(HC+LC)对照质粒转染的18个 集落中EpCAM的产量平均为2.7pg/细胞/天。25天后除去选择剂 zeocin和嘌呤霉素。转染后45天,这18个集落中EpCAM的产量平均 为2.7pg/细胞/天。对比之下,当在转染后25天测定时,用STAR7- STAR67-UB6(HC+LC)-STAR7质粒转染的18个集落中EpCAM产量 信号平均为6.7pg/细胞/天,在转染后45天测定时是7.7pg/细胞/天。 因此,在转染30和45天后,在稳定转染的CHO克隆中包含 STAR67/STAR7的UB6构建体与UB6启动子驱动的EpCAM表达水平 相比高2.5-2.9倍。

因此,与不含STAR67/STAR7的构建体相比,将STAR67置于 启动子上游及将两个STAR7元件置于表达盒两侧导致CHO细胞中显 著较高的EpCAM抗体表达水平。

实施例6:STAR67不是增强子阻断剂(enhancer blocker),而 STAR6和STAR7是增强子阻断剂

已对其性质进行了测试的迄今为止所有已知STAR元件,包括 STAR6和STAR7,均是增强子阻断剂(WO 03/004704,Kwaks et al, 2003)。增强子阻断剂活性是通过将STAR元件置于强增强子和启动 子之间而测试。在此我们测试了STAR67是否是一种增强子阻断剂。

材料和方法

将d2EGFP基因使用引物TTGGTTGGTCATGAATGGTGAGCA AGGGCGAGGAGCTGTTC(SEQ.ID.NO.75)和ATTCTCTAGACTA CACATTGATCCTAGCAGAAGCAC(SEQ.ID.NO.76)经PCR扩增, 并克隆进质粒pGL3-启动子(Promega)中,使用NcoI和XbaI限制位点 代替萤光素酶基因以产生质粒pGL3-promoter-GFP。将一接头(通过 退火寡核苷酸CGATATCTTGGAGATCTACTAGTGGCGCG CCTTGGGCTAGCT(SEQ.ID.NO.77)和GATCAGCTAGCCCAAGG CGCGCCACTAGTAGATCTCCAAGATATCGAGCT(SEQ.ID.NO. 78)而产生)克隆进SacI和BglII位点,产生多克隆位点。原始的BglII位 点基于接头的连接而被破坏,产生接头DNA内一新的唯一的BglII位 点。使用BsaBI和BamHI将SV40-增强子从质粒pGL3-basic(Promega) 中切下,并使用EcoRV和BglII位点克隆进pGL3-linker-promoter-GFP 中,产生质粒pGL3-enhancer-promoter-GFP。使用KpnI和SacI位点将 STAR40元件(SEQ.ID.NO.40)置于SV40增强子上游,以防止增强子 对上游序列的作用。最后,使用SpeI和AscI限制位点将抗阻抑物元 件STAR6、STAR7和STAR67置于SV40增强子和SV40最小启动子之 间。

CHO细胞的转染和培养

中国仓鼠卵巢细胞系CHO-K1(ATCC CCL-61)如实施例2所述转 染。在转染后1天,在Epics XL流式细胞计量仪(Beckman Coulter)上 测定d2EGFP水平。

结果

图10示出STAR67不是增强子阻断剂,而STAR6和STAR7在相同 分析中发挥增强子阻断剂作用。将STAR6、STAR7和STAR67克隆在 d2EGFP基因上游的SV40增强子和最小SV40启动子之间。当在增强 子与启动子之间无STAR元件克隆时,发生强转录激活作用(设定为 100%)。当STAR6或STAR7置于增强子与启动子之间时,转录降低 至背景水平,表明STAR6和STAR7是强增强子阻断剂。相反,当 STAR67克隆在增强子与启动子之间时,相对的转录水平仍为对照组 的80%,表明STAR67不是好的增强子阻断剂,这与如先前所述的 STAR6和STAR7以及其它抗阻抑物元件(WO 03/004704,Kwaks et al, 2003)相反。

实施例7:STAR67增强稳定转染的CHO细胞中UB6和CMV驱动的抗 体表达水平

在实施例5中,我们示出使用含有重链和轻链的两种不同的质 粒,组合STAR67和STAR7增强CHO细胞中EpCAM抗体表达水平。 在本实施例中,我们测试了当重链和轻链被置于一个质粒上时 STAR67是否可以用于产生EpCAM抗体。我们针对每个选择标记使 用同时选择方法。

材料和方法

质粒

重链cDNA(HC-EpCAM)在UB6启动子的控制下,并通过IRES 序列与Zeocin抗性基因结合。轻链cDNA(LC-EpCAM)在CMV启动子 的控制下,并通过IRES序列与嘌呤霉素抗性基因结合。基本上这些 是实施例5中使用的构建体。将这两种表达盒置于一个质粒上,使这 两个表达单位的转录具有相反方向。在对照质粒中,UB6与CMV启 动子由一500bp填充片段间隔(EpCAM对照)(图10)。在另一个质粒 中,将STAR67置于UB6与CMV启动子之间(EpCAM STAR67)(图 10)。

CHO细胞的转染和培养

将中国仓鼠卵巢细胞系CHO-K1(ATCC CCL-61)如实施例2所述 转染和培养,使用zeocin(100μg/ml)和嘌呤霉素(2.5μg/ml)进行选 择。在实施例5中,使用针对两种选择标记的相继选择方法。相反, 在此这两种选择标记同时存在于培养基中。在转染后1天,向培养基 中加入zeocin和嘌呤霉素。持续存在选择培养基直至分离集落(转染 后大约14天)。在分离集落并移至24孔平板中之后,将细胞在存在 zeocin和嘌呤霉素的条件下培养。

结果

图11示出含有克隆在UB6和CMV启动子之间的STAR67的抗体 构建体的转染产生了许多表达EpCAM抗体的CHO集落(使用抗人IgG 抗体通过ELISA测定)。当在转染后25天测定时,用EpCAM STAR67 质粒转染的19个集落中EpCAM产量的平均值为9.8pg/细胞/天。

相反,令人惊奇地,用EpCAM对照质粒转染无集落存活。当只 用zeocin或者嘌呤霉素进行选择时,EpCAM对照集落存活。然而, 当通过对重链和轻链均施加选择压力而增加选择压力时,这些条件 使得只有在转染的质粒中存在STAR67的集落存活。

该结果还示出掺入STAR67对置于一个STAR67元件的上游和下 游的两种启动子(UB6和CMV启动子)均具有有益作用。这表明 STAR67可以双向方式操纵。

EpCAM对照和EpCAM STAR67质粒之间的差异是显著的,当选 择压力较高时,只有EpCAM STAR67转染导致集落建立。这使得有 机会使用这种质粒构型鉴别STAR67中介导这种作用的区域。将 STAR67的较小的重叠部分置于驱动EpCAM分子的UB6和CMV启动 子之间。当STAR67的一部分有功能时,集落在zeocin和嘌呤霉素同 时用作选择剂时存活。当STAR67的一部分没有功能时,在相同选择 条件下无集落存活。

因此,将STAR67置于启动子上游导致与没有这种抗阻抑物元件 的构建体对比在CHO细胞中明显较高的EpCAM抗体表达水平。进行 相似实验使用SV40启动子驱动抗-EpCAM抗体的重链和轻链的表 达。在其它实验中,将STAR67用其它STAR序列置换。在进一步的 实验中,改变编码重链和轻链的两个表达单位的方向,由此这两个 单位的方向一致。在另一个实验中,将重链和轻链的表达单位分别 置于不同的核酸分子上(如实施例5所述),对所得克隆针对两个选择 标记同时进行选择。在另一个实验中,改变宿主细胞类型。组合这 些变化进行实验。

附图描述

图1::本发明的示意图。

A)含有(从5’至3’)转基因(编码例如d2EGFP基因)、IRES和可 选择标记(zeo,赋予zeocin抗性)的在CMV启动子控制下的双顺反 子基因。表达单位在其3’末端具有SV40转录终止子(t)。该构建 体的名称是CMV-d2EGFP-ires-Zeo(CMV对照)。

B)如A的构建体,但是STAR 67克隆在CMV启动子的上游。 该构建体的名称是STAR67-CMV-d2EGFP-ires-Zeo(CMV- STAR67)。

C)如B的构建体,但是上游和下游STAR7元件克隆在完整构 建体的两侧。该构建体的名称是STAR7-STAR67-CMV-d2EGFP- ires-Zeo-STAR7(CMV-STAR67 7/7)。

图2:STAR67改良CHO细胞中CMV驱动的d2EGFP表达。 对10个单独的稳定集落的d2EGFP信号平均值针对CHO细胞中指 定构建体进行绘图。A)CMV对照;B)STAR67-CMV。X(10):10 个集落的平均d2EGFP表达水平。见实施例2详述。

图3:STAR67改良CHO细胞中EF1α驱动的d2EGFP表达。 与图2相同,但是使用EF1α启动子。A)EF1α对照;B)STAR67- EF1α。

图4:STAR67改良CHO细胞中UB6驱动的d2EGFP表达。与 图2和3相同,但是使用UB6启动子。A)UB6对照;B)STAR67- UB6。

图5:STAR67改良PER.C6细胞中CMV驱动的d2EGFP表 达。与图2相同,但是是在PER.C6细胞中。A)CMV对照;B) STAR67-CMV。

图6:STAR67改良PER.C6细胞中EF1α驱动的d2EGFP表达。 与图3相同,但是是在PER.C6细胞中。A)EF1α对照;B)STAR67- EF1α。

图7:STAR67改良PER.Cβ细胞中UB6驱动的d2EGFP表达。 与图4相同,但是是在PER.C6细胞中。A)UBβ对照;B)STAR67- UB6。

图8:STAR67组合其它STAR元件改良CHO-K1细胞中SV40 驱动的d2EGFP表达。与图2相似,但在CHO细胞中使用SV40启 动子及指定的构建体。对在转染60天后的18-20个单独的稳定集 落的d2EGFP信号进行绘图。A)SV40对照,SV40-STAR67,SV40- STAR7/7;B)SV40对照及SV40-STAR67 7/7。见实施例4详述。

图9:STAR67改良CHO-K1细胞中UB6驱动的EpCAM抗体 表达水平。见实施例5详述。A)无STAR元件的构建体;B)具有启 动子上游STAR67和两侧STAR7元件的构建体。抗-EpCAM抗体浓 度以pg/细胞/天表示。X(18):18个集落的平均产生水平。

图10:STAR67不是增强子阻断剂,而STAR 6和7是。见实 施例6详述。

图11:STAR67增强稳定转染的CHO细胞中UB6和CMV-驱 动的抗体表达水平。见实施例7详述。A)含有抗-EpCAM重链(HC) 和轻链(LC)的DNA分子,所述重链和轻链均在启动子之后,均与不 同的可选择标记基因连接(同时选择用于这两种标记):无STAR元件 的构建体。未发现集落;B)相同构建体,在两个启动子之间具有 STAR67。抗-EpCAM抗体浓度以pg/细胞/天表示。X(19):19个集 落的平均产生水平。

参考文献

Boshart,M,Weber,F,Jahn,G,Dorsch-Hasler,K,Fleckenstein,B, and Schaffner,W.(1985) A very strong enhancer is located upstream of an immediate early gene of human cytomegalovirus Cell 41,521-530.

Chung JH,Whiteley M,and Felsenfeld G.(1993)A5’element of the chicken beta-globin domain serves as an insulator in human erythroid cells and protects against position effect in Drosophila.Cell 74:505-514.

Chung JH,Bell AC,Felsenfeld G.(1997).Characterization of the chicken beta-globin insulator.Proc Natl Acad Sci USA 94:575-580.

Das,GC,Niyogi,SK,and Salzman,NP.(1985)SV40 promoters and their regulation Prog Nucleic Acid Res Mol Biol 32,217-236.

Gill DR,Smyth SE,Goddard CA,Pringle IA,Higgins CF, Colledge WH,and Hyde SC.(2001)Increased persistence of lung gene expression using plasmids containing the ubiquitin C or elongation factor 1αpromoter.Gene Therapy 8:1539-1546.

Gossen M,and Bujard H.(1992)Tight control of gene expression in mammalian cells by tetracycline-responsive promoters.Proc Natl Acad Sci USA 89:5547-5551.

Graham FO,Smiley J,Russell W and Nairn R.(1977). Characteristics of a human cell line transformed by DNA from human adenovirus type 5.J.Gen.Virol.36,59-72.

Huls GA,Heijnen IAFM,Cuomo ME,Koningsberger JC, Wiegrnan L,Boel E,van der Vuurst-de Vries A-R,Loyson SAJ,Helfrich W,van Berge Henegouwen GP,van Meijer M,de Kruif J,Logtenberg T. (1999).A recombinant,fully human monoclonal antibody with antitumor activity constructed from  phage-displayed  antibody fragments. Nat Biotechnol.17,276-281.

Jones D,Kroos N,Anema R,Van Montfort B,Vooys A,Van Der Kraats S,Van Der Helm E,Smits S,Schouten J,Brouwer K,Lagerwerf F, Van Berkel P,Opstelten D-J,Logtenberg T,Bout A(2003)High-level expression of recombinant IgG in the human cell line PER.C6. Biotechnol.Prog.19:163-168.

Kaufman,RJ.(2000)Overview of vector design for mammalian gene expression Mol Biotechnol 16,151-160.

Kaufman,RJ,and Sharp,PA.(1982)Construction of a modular dihydrofolate reductase cDNA gene:analysis of signals utilized for efficient expression Mol Cell Biol 2,1304-1319.

Kellum R,and Schedl P.(1991)A position-effect assay for boundaries of higher order chromosomal domains.Cell 64:941-950.

Kwaks TH,Barnett P,Hemrika W,Siersma T,Sewalt RG,Satijn DP,Brons JF,van Blokland R,Kwakman P,Kruckeberg AL,Kelder A, Otte AP.(2003)Identification of anti-repressor elements that confer high and stable protein production in mammalian cells.Nat Biotechnol 21, 553-558.Erratum in:Nat Biotechnol 21,822(2003).

Phi-Van L,Von Kreis JP,Ostertag W,and Strtling WH.(1990) The chicken lysozyme 5’matrix attachment region increases transcription from a heterologous promoter in heterologous cells and dampens position effects on the expression of transfected genes.Mol.Cell.Biol.10:2302- 2307.

Lopez de Quinto,S,and Martinez-Salas,E.(1998)Parameters influencing translational  efficiency in aphthovirus IRES-based bicistronic expression vectors Gene 217.51-56.

Martin,DI,and Whitelaw,E.(1996)The vagaries of variegating transgenes Bioessays 18,919-923.

Martinez-Salas,E.(1999)Internal ribosome entry site biology and its use in expression vectors Curr Opin Biotechnol 10,458-464.

McB umey,MW,Mai,T,Yang,X,and Jardine,K.(2002) Evidence for repeat-induced gene silencing in cultured Mammalian cells: inactivation of tandem repeats of transfected genes Exp Cell Res 274,1-8.

Migliaccio,AR,Bengra,C,Ling,J,Pi,W,Li,C,Zeng,S, Keskintepe,M,Whitney,B,Sanchez,M,Migliaccio,G,and Tuan,D. (2000)Stable and unstable transgene integration sites in the human genome:extinction of the Green Fluorescent Protein transgene in K562 cells Gene 256,197-214.

Mizuguchi,H,Xu,Z,Ishii-Watabe,A,Uchida,E,and Hayakawa, T.(2000)IRES-dependent second gene expression is significantly lower than cap-dependent first gene expression in a bicistronic vector Mol Ther 1,376-382.

Rees,S,Coote,J,Stables,J,Goodson,S,Harris,S,and Lee,MG. (1996)Bicistronic vector for the creation of stable mammalian cell lines that predisposes all antibiotic-resistant cells to express recombinant protein Biotechniques 20,102-104,106,108-110.

Schorpp,M,Jager,R,Schellander,K,Schenkel,J,Wagner,EF, Weiher,H,and Angel,P.(1996)The human ubiquitin C promoter directs high ubiquitous expression of transgenes in mice Nucleic Acids Res 24, 1787-8.

Strutzenberger,K,Borrh,N,Kunert,R,Steinfellner,W,and Katinger,H.(1999)Changes during subclone development and ageing of human antibody-producing recombinant CHO cells J Biotechnol 69,215- 26.

Van der Vlag,J,den Blaauwen,JL,Sewalt,RG,van Driel,R,and Otte,AP.(2000)Transcriptional repression mediated by polycomb group proteins and other chromatin-associated repressors is selectively blocked by insulators J Biol Chem 275,697-704.

Whitelaw,E,Sutherland,H,Kearns,M,Morgan,H,Weaving,L, and Garrick,D.(2001)Epigenetic effects on transgene expression Methods Mol Biol 158,351-68.

序列表

<110>科罗迈吉尼科斯公司

<120>改良核酸表达的新序列

<130>O111 WO 00 ORD

<150>PCT/EP2004/051405

<151>2004-07-08

<160>82

<170>PatentIn version 3.2

<210>1

<211>749

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR1

<400>1

atgcggtggg ggcgcgccag agactcgtgg gatccttggc ttggatgttt ggatctttct    60

gagttgcctg tgccgcgaaa gacaggtaca tttctgatta ggcctgtgaa gcctcctgga    120

ggaccatctc attaagacga tggtattgga gggagagtca cagaaagaac tgtggcccct    180

ccctcactgc aaaacggaag tgattttatt ttaatgggag ttggaatatg tgagggctgc    240

aggaaccagt ctccctcctt cttggttgga aaagctgggg ctggcctcag agacaggttt    300

tttggccccg ctgggctggg cagtctagtc gaccctttgt agactgtgca cacccctaga    360

agagcaacta cccctataca ccaggctggc tcaagtgaaa ggggctctgg gctccagtct    420

ggaaaatctg gtgtcctggg gacctctggt cttgcttctc tcctcccctg cactggctct    480

gggtgcttat ctctgcagaa gcttctcgct agcaaaccca cattcagcgc cctgtagctg    540

aacacagcac aaaaagccct agagatcaaa agcattagta tgggcagttg agcgggaggt    600

gaatatttaa cgcttttgtt catcaataac tcgttggctt tgacctgtct gaacaagtcg    660

agcaataagg tgaaatgcag gtcacagcgt ctaacaaata tgaaaatgtg tatattcacc    720

ccggtctcca gccggcgcgc caggctccc                                      749

<210>2

<211>883

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR2

<400>2

gggtgcttcc tgaattcttc cctgagaagg atggtggccg gtaaggtccg tgtaggtggg    60

gtgcggctcc ccaggccccg gcccgtggtg gtggccgctg cccagcggcc cggcaccccc    120

atagtccatg gcgcccgagg cagcgtgggg gaggtgagtt agaccaaaga gggctggccc    180

ggagttgctc atgggctcca catagctgcc ccccacgaag acggggcttc cctgtatgtg    240

tggggtccca tagctgccgt tgccctgcag gccatgagcg tgcgggtcat agtcgggggt    300

gccccctgcg cccgcccctg ccgccgtgta gcgcttctgt gggggtggcg ggggtgcgca    360

gctgggcagg gacgcagggt aggaggcggg gggcagcccg taggtaccct gggggggctt    420

ggagaagggc gggggcgact ggggctcata cgggacgctg ttgaccagcg aatgcataga    480

gttcagatag ccaccggctc cggggggcac ggggctgcga cttggagact ggccccccga    540

tgacgttagc atgcccttgc ccttctgatc ctttttgtac ttcatgcggc gattctggaa    600

ccagatcttg atctggcgct cagtgaggtt cagcagattg gccatctcca cccggcgcgg    660

ccggcacagg tagcggttga agtggaactc tttctccagc tccaccagct gcgcgctcgt    720

gtaggccgtg cgcgcgcgct tggacgaagc ctgccccggc gggctcttgt cgccagcgca    780

gctttcgcct gcgaggacag agagaggaag agcggcgtca ggggctgccg cggccccgcc    840

cagcccctga cccagcccgg cccctccttc caccaggccc caa                      883

<210>3

<211>2126

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR3

<400>3

atctcgagta ctgaaatagg agtaaatctg aagagcaaat aagatgagcc agaaaaccat    60

gaaaagaaca gggactacca gttgattcca caaggacatt cccaaggtga gaaggccata    120

tacctccact acctgaacca attctctgta tgcagattta gcaaggttat aaggtagcaa    180

aagattagac ccaagaaaat agagaacttc caatccagta aaaatcatag caaatttatt    240

gatgataaca attgtctcca aaggaacaag gcagagtcgt gctagcagag gaagcacgtg    300

agctgaaaac agccaaatct gctttgtttt catgacacag gagcataaag tacacaccac    360

caactgacct attaaggctg tggtaaaccg attcatagag agaggttcta aatacattgg    420

tccctcacag gcaaactgca gttcgctccg aacgtagtcc ctggaaattt gatgtccagt    480

atagaaaagc agagcagtca aaaaatatag ataaagctga accagatgtt gcctgggcaa    540

tgttagcagc accacactta agatataacc tcaggctgtg gactccctcc ctggggagcg    600

gtgctgccgg cggcgggcgg gctccgcaac tccccggctc tctcgcccgc cctcccgttc    660

tcctcgggcg gcggcggggg ccgggactgc gccgctcaca gcggcggctc ttctgcgccc    720

ggcctcggag gcagtggcgg tggcggccat ggcctcctgc gttcgccgat gtcagcattt    780

cgaactgagg gtcatctcct tgggactggt tagacagtgg gtgcagccca cggagggcga    840

gttgaagcag ggtggggtgt cacctccccc aggaagtcca gtgggtcagg gaactccctc    900

ccctagccaa gggaggccgt gagggactgt gcccggtgag agactgtgcc ctgaggaaag    960

gtgcactctg gcccagatac tacacttttc ccacggtctt caaaacccgc agaccaggag    1020

attccctcgg gttcctacac caccaggacc ctgggtttca accacaaaac cgggccattt    1080

gggcagacac ccagctagct gcaagagttg tttttttttt tatactcctg tggcacctgg    1140

aacgccagcg agagagcacc tttcactccc ctggaaaggg ggctgaaggc agggaccttt    1200

agctgcgggc tagggggttt ggggttgagt gggggagggg agagggaaaa ggcctcgtca    1260

ttggcgtcgt ctgcagccaa taaggctacg ctcctctgct gcgagtagac ccaatccttt    1320

cctagaggtg gagggggcgg gtaggtggaa gtagaggtgg cgcggtatct aggagagaga    1380

aaaagggctg gaccaatagg tgcccggaag aggcggaccc agcggtctgt tgattggtat    1440

tggcagtgga ccctcccccg gggtggtgcc ggaggggggg atgatgggtc gaggggtgtg    1500

tttatgtgga agcgagatga ccggcaggaa cctgccccaa tgggctgcag agtggttagt    1560

gagtgggtga cagacagacc cgtaggccaa cgggtggcct taagtgtctt tggtctcctc    1620

caatggagca gcggcggggc gggaccgcga ctcgggttta atgagactcc attgggctgt    1680

aatcagtgtc atgtcggatt catgtcaacg acaacaacag ggggacacaa aatggcggcg    1740

gcttagtcct acccctggcg gcggcggcag cggtggcgga ggcgacggca ctcctccagg    1800

cggcagccgc agtttctcag gcagcggcag cgcccccggc aggcgcggtg gcggtggcgc    1860

gcagccaggt ctgtcaccca ccccgcgcgt tcccaggggg aggagactgg gcgggagggg    1920

ggaacagacg gggggggatt caggggcttg cgacgcccct cccacaggcc tctgcgcgag    1980

ggtcaccgcg gggccgctcg gggtcaggct gcccctgagc gtgacggtag ggggcggggg    2040

aaaggggagg agggacaggc cccgcccctc ggcagggcct ctagggcaag ggggcggggc    2100

tcgaggagcg gaggggggcg gggcgg                                         2126

<210>4

<211>1625

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR4

<400>4

gatctgagtc atgttttaag gggaggattc ttttggctgc tgagttgaga ttaggttgag    60

ggtagtgaag gtaaaggcag tgagaccacg taggggtcat tgcagtaatc caggctggag    120

atgatggtgg ttcagttgga atagcagtgc atgtgctgta acaacctcag ctgggaagca    180

gtatatgtgg cgttatgacc tcagctggaa cagcaatgca tgtggtggtg taatgacccc    240

agctgggtag ggtgcatgtg gtgtaacgac ctcagctggg tagcagtgtg tgtgatgtaa    300

caacctcagc tgggtagcag tgtacttgat aaaatgttgg catactctag atttgttatg    360

agggtagtgc cattaaattt ctccacaaat tggttgtcac gtatgagtga aaagaggaag    420

tgatggaaga cttcagtgct tttggcctga ataaatagaa gacgtcattt ccagttaatg    480

gagacaggga agactaaagg tagggtggga ttcagtagag caggtgttca gttttgaata    540

tgatgaactc tgagagagga aaaacttttt ctacctctta gtttttgtga ctggacttaa    600

gaattaaagt gacataagac agagtaacaa gacaaaaata tgcgaggtta tttaatattt    660

ttacttgcag aggggaatct tcaaaagaaa aatgaagacc caaagaagcc attagggtca    720

aaagctcata tgccttttta agtagaaaat gataaatttt aacaatgtga gaagacaaag    780

gtgtttgagc tgagggcaat aaattgtggg acagtgatta agaaatatat gggggaaatg    840

aaatgataag ttattttagt agatttattc ttcatatcta ttttggcttc aacttccagt    900

ctctagtgat aagaatgttc ttctcttcct ggtacagaga gagcaccttt ctcatgggaa    960

attttatgac cttgctgtaa gtagaaaggg gaagatcgat ctcctgtttc ccagcatcag    1020

gatgcaaaca tttccctcca ttccagttct caaccccatg gctgggcctc atggcattcc    1080

agcatcgcta tgagtgcacc tttcctgcag gctgcctcgg gtagctggtg cactgctagg    1140

tcagtctatg tgaccaggag ctgggcctct gggcaatgcc agttggcagc ccccatccct    1200

ccactgctgg gggcctccta tccagaaggg cttggtgtgc agaacgatgg tgcaccatca    1260

tcattcccca cttgccatct ttcaggggac agccagctgc tttgggcgcg gcaaaaaaca    1320

cccaactcac tcctcttcag gggcctctgg tctgatgcca ccacaggaca tccttgagtg    1380

ctgggcagtc tgaggacagg gaaggagtga tgaccacaaa acaggaatgg cagcagcagt    1440

gacaggagga agtcaaaggc ttgtgtgtcc tggccctgct gagggctggc gagggccctg    1500

ggatggcgct cagtgcctgg tcggctgcaa gaggccagcc ctctgcccat gaggggagct    1560

ggcagtgacc aagctgcact gccctggtgg tgcatttcct gccccactct ttccttctaa    1620

gatcc                                                                1625

<210>5

<211>1571

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR5

<400>5

cacctgattt aaatgatctg tctggtgagc tcactgggtc tttactcgca tgctgggtcc    60

acagctccac tgtcctgcag ggtccgtgag tgtgggcccc ttatctattt catcatcata    120

accctgcgtg tcctcaactc ctggcacata ttgggtggcc ccatccacac acggttgttg    180

agtgaatcca tgagatgaca aaggctatga tgtagactat atcatgagcc agaaccaggc    240

tttcctacct ccagacaatc aagggccttg atttgggatt gagggagaaa ggagtagaag    300

ccaggaagga gaagagattg aggtttacca agggtgcaaa gtcctggccc ctgactgtag    360

gctgaaaact atagaaatga tagaacaatt ttgcaatgaa atgcagaaga ccctgcatca    420

actttaggtg ggacttcggg tatttttatg gccacagaac atcctcccat ttacctgcat    480

ggcccagaca cagacttcaa aacagttgag gccagcaggc tccaggtaag tggtaggatt    540

ccagaatgcc ctcagagtgt tgtgggaggc agcaggcgat tttcctggac ttctgagttt    600

atgagaaccc caaaccccaa ttggcattaa cattgaggtc tcaatgtatc atggcaggaa    660

gcttccgagt ggtgaaaagg aaagtgaaca tcaaagctcg gaagacaaga gggtggagtg    720

atggcaacca agagcaagac ccttccctct cctgtgatgg ggtggctcta tgtgaagccc    780

ccaaactgga cacaggtctg gcagaatgag gaacccactg agatttagcg ccaacatcca    840

gcataaaagg gagactgaca tagaatttga gttagttaaa aataaggcac aatgcttttc    900

atgtattcct gagttttgtg gactggtgtt caatttgcag cattcttagt tgattaaatc    960

tgagatgaag aaagagtgtc caacactttc accttggaaa gctctggaaa agcaaaaggg    1020

agagacaatt agcttcatcc attaactcac ttagtcatta tgcattcatt catgtaacta    1080

ccaaacacgt actgagtgcc taacactcct gagacactga gaagtttctt gggaatacaa    1140

agatgaataa aaaccacgcc aggcaggagt tggaggaagg ttctggatgc caccacgctc    1200

tacctcctgg ctggacacca ggcaatgttg gtaaccttct gcctccaatt tctgcaaata    1260

cataattaat aaacacaagg ttatcttcta aacagttctt aaaatgagtc aactttgttt    1320

aaacttgttc tttttagaga aaaatgtatt tttgaaagag ttggttagtg ctaggggaaa    1380

tgtctgggca cagctcagtc tggtgtgaga gcaggaagca gctctgtgtg tctggggtgg    1440

gtacgtatgt aggacctgtg ggagaccagg ttgggggaag gcccctcctc atcaagggct    1500

cctttgcttt ggtttgcttt ggcgtgggag gtgctgtgcc acaagggaat acgggaaata    1560

agatctctgc t                                                         1571

<210>6

<211>1173

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR6

<400>6

tgacccacca cagacatccc ctctggcctc ctgagtggtt tcttcagcac agcttccaga    60

gccaaattaa acgttcactc tatgtctata gacaaaaagg gttttgacta aactctgtgt    120

tttagagagg gagttaaatg ctgttaactt tttaggggtg ggcgagaggg atgacaaata    180

acaacttgtc tgaatgtttt acatttctcc ccactgcctc aagaaggttc acaacgaggt    240

catccatgat aaggagtaag acctcccagc cggactgtcc ctcggccccc agaggacact    300

ccacagagat atgctaactg gacttggaga ctggctcaca ctccagagaa aagcatggag    360

cacgagcgca cagagcaggg ccaaggtccc agggacagaa tgtctaggag ggagattggg    420

gtgagggtaa tctgatgcaa ttactgtggc agctcaacat tcaagggagg gggaagaaag    480

aaacagtccc tgtcaagtaa gttgtgcagc agagatggta agctccaaaa tttgaaactt    540

tggctgctgg aaagttttag ggggcagaga taagaagaca taagagactt tgagggttta    600

ctacacacta gacgctctat gcatttattt atttattatc tcttatttat tactttgtat    660

aactcttata ataatcttat gaaaacggaa accctcatat acccatttta cagatgagaa    720

aagtgacaat tttgagagca tagctaagaa tagctagtaa gtaaaggagc tgggacctaa    780

accaaaccct atctcaccag agtacacact cttttttttt ttccagtgta atttttttta    840

atttttattt tactttaagt tctgggatac atgtgcagaa ggtatggttt gttacatagg    900

tatatgtgtg ccatagtgga ttgctgcacc tatcaacccg tcatctaggt ttaagcccca    960

catgcattag ctatttgtcc tgatgctctc cctcccctcc ccacaccaga caggccttgg    1020

tgtgtgatgt tcccctccct gtgtccatgt gttctcactg ttcagctccc acttatgagt    1080

gagaacgtgt ggtatttggt tttctgttcc tgtgttagtt tgctgaggat gatggcttcc    1140

agcttcatcc atgtccctgc aaaggacacg atc                                 1173

<210>7

<211>2101

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR7

<400>7

aggtgggtgg atcacccgag gtcaggagtt caagaccagc ctggccaaca tggtaaaacc    60

tcgtctctac taaaaaatac gaaaaattag ctggttgtgg tggtgcgtgc ttgtaatccc    120

agctactcgg gaggctgagg caggagaatc acttgaatct gggaggcaga ggttgcagtg    180

agctgagata gtgccattgc actccagcct gggcaacaga cggagactct gtctccaaaa    240

aaaaaaaaaa aaatcttaga ggacaagaat ggctctctca aacttttgaa gaaagaataa    300

ataaattatg cagttctaga agaagtaatg gggatatagg tgcagctcat gatgaggaag    360

acttagctta actttcataa tgcatctgtc tggcctaaga cgtggtgagc tttttatgtc    420

tgaaaacatt ccaatataga atgataataa taatcacttc tgacccccct tttttttcct    480

ctccctagac tgtgaagcag aaaccccata tttttcttag ggaagtggct acgcactttg    540

tatttatatt aacaactacc ttatcaggaa attcatattg ttgccctttt atggatgggg    600

aaactggaca agtgacagag caaaatccaa acacagctgg ggatttccct cttttagatg    660

atgattttaa aagaatgctg ccagagagat tcttgcagtg ttggaggaca tatatgacct    720

ttaagatatt ttccagctca gagatgctat gaatgtatcc tgagtgcatg gatggacctc    780

agttttgcag attctgtagc ttatacaatt tggtggtttt ctttagaaga aaataacaca    840

tttataaata ttaaaatagg cccaagacct tacaagggca ttcatacaaa tgagaggctc    900

tgaagtttga gtttgttcac tttctagtta attatctcct gcctgtttgt cataaatgcg    960

tttagtaggg agctgctaat gacaggttcc tccaacagag tgtggaagaa ggagatgaca    1020

gctggcttcc cctctgggac agcctcagag ctagtgggga aactatgtta gcagagtgat    1080

gcagtgacca agaaaatagc actaggagaa agctggtcca tgagcagctg gtgagaaaag    1140

gggtggtaat catgtatgcc ctttcctgtt ttatttttta ttgggtttcc ttttgcctct    1200

caattccttc tgacaataca aaatgttggt tggaacatgg agcacctgga agtctggttc    1260

attttctctc agtctcttga tgttctctcg ggttcactgc ctattgttct cagttctaca    1320

cttgagcaat ctcctcaata gctaaagctt ccacaatgca gattttgtga tgacaaattc    1380

agcatcaccc agcagaactt aggttttttt ctgtcctccg tttcctgacc tttttcttct    1440

gagtgcttta tgtcacctcg tgaaccatcc tttccttagt catctaccta gcagtcctga    1500

ttcttttgac ttgtctccct acaccacaat aaatcactaa ttactatgga ttcaatccct    1560

aaaatttgca caaacttgca aatagattac gggttgaaac ttagagattt caaacttgag    1620

aaaaaagttt aaatcaagaa aaatgacctt taccttgaga gtagaggcaa tgtcatttcc    1680

aggaataatt ataataatat tgtgtttaat atttgtatgt aacatttgaa taccttcaat    1740

gttcttattt gtgttatttt aatctcttga tgttactaac tcatttggta gggaagaaaa    1800

catgctaaaa taggcatgag tgtcttatta aatgtgacaa gtgaatagat ggcagaaggt    1860

ggattcatat tcagttttcc atcaccctgg aaatcatgcg gagatgattt ctgcttgcaa    1920

ataaaactaa cccaatgagg ggaacagctg ttcttaggtg aaaacaaaac aaacacgcca    1980

aaaaccttta ttctctttat tatgaatcaa atttttcctc tcagataatt gttttattta    2040

tttattttta ttattattgt tattatgtcc agtctcactc tgtcgcctaa gctggcatga    2100

t                                                                    2101

<210>8

<211>1821

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR8

<400>8

gagatcaeet cgaagagagt ctaacgtccg taggaacgct ctcgggttca caaggattga    60

ccgaacccca ggatacgtcg ctctccatct gaggcttgct ccaaatggcc ctccactatt    120

ccaggcacgt gggtgtctcc cctaactctc cctgctctcc tgagcccatg ctgcctatca    180

cccatcggtg caggtccttt ctgaagagct cgggtggatt ctctccatcc cacttccttt    240

cccaagaaag aagccaccgt tccaagacac ccaatgggac attccccttc cacctccttc    300

tccaaagttg cccaggtgtt catcacaggt tagggagaga agcccccagg tttcagttac    360

aaggcatagg acgctggcat gaacacacac acacacacac acacacacac acacacacac    420

acacgactcg aagaggtagc cacaagggtc attaaacact tgacgactgt tttccaaaaa    480

cgtggatgca gttcatccac gccaaagcca agggtgcaaa gcaaacacgg aatggtggag    540

agattccaga ggctcaccaa accctctcag gaatattttc ctgaccctgg gggcagaggt    600

tggaaacatt gaggacattt cttgggacac acggagaagc tgaccgacca ggcattttcc    660

tttccactgc aaatgaccta tggcgggggc atttcacttt cccctgcaaa tcacctatgg    720

cgaggtacct ccccaagccc ccacccccac ttccgcgaat cggcatggct cggcctctat    780

ccgggtgtca ctccaggtag gcttctcaac gctctcggct caaagaagga caatcacagg    840

tccaagccca aagcccacac ctcttccttt tgttataccc acagaagtta gagaaaacgc    900

cacactttga gacaaattaa gagtccttta tttaagccgg cggccaaaga gatggctaac    960

gctcaaaatt ctctgggccc cgaggaaggg gcttgactaa cttctatacc ttggtttagg    1020

aaggggaggg gaactcaaat gcggtaattc tacagaagta aaaacatgca ggaatcaaaa    1080

gaagcaaatg gttatagaga gataaacagt tttaaaaggc aaatggttac aaaaggcaac    1140

ggtaccaggt gcggggctct aaatccttca tgacacttag atataggtgc tatgctggac    1200

acgaactcaa ggctttatgt tgttatctct tcgagaaaaa tcctgggaac ttcatgcact    1260

gtttgtgcca gtatcttatc agttgattgg gctcccttga aatgctgagt atctgcttac    1320

acaggtcaac tccttgcgga agggggttgg gtaaggagcc cttcgtgtct cgtaaattaa    1380

ggggtcgatt ggagtttgtc cagcattccc agctacagag agccttattt acatgagaag    1440

caaggctagg tgattaaaga gaccaacagg gaagattcaa agtagcgact tagagtaaaa    1500

acaaggttag gcatttcact ttcccagaga acgcgcaaac attcaatggg agagaggtcc    1560

cgagtcgtca aagtcccaga tgtggcgagc ccccgggagg aaaaaccgtg tcttccttag    1620

gatgcccgga acaagagcta ggcttccgga gctaggcagc catctatgtc cgtgagccgg    1680

cgggagggag accgccggga ggcgaagtgg ggcggggcca tccttctttc tgctctgctg    1740

ctgccgggga gctcctggct ggcgtccaag cggcaggagg ccgccgtcct gcagggcgcc    1800

gtagagtttg cggtgcagag t                                              1821

<210>9

<211>1929

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR9

<400>9

cacttcctgg gagtggagca gaggctctgc gtggagcatc catgtgcagt actcttaggt    60

acggaaggga ttgggctaaa ccatggatgg gagctgggaa gggaagggac caacttcagg    120

ccccactggg acactggagc tgccaccctt tagagccctc ctaaccctac accagaggct    180

gagggggacc tcagacatca cacacatgct ttcccatgtt ttcagaaatc tggaaacgta    240

gaacttcagg ggtgagagtg cctagatatt gaatacaagg ctagattggg cttctgtaat    300

atcccaaagg accctccagc tttttcacca gcacctaatg cccatcagat accaaagaca    360

cagcttagga gaggttcacc ctgaagctga ggaggaggca gccggattag agttgactga    420

gcaaggatga ctgccttctc cacctgacga tttcagctgc tgcccttttc ttttcctggg    480

aatgcctgtc gccatggcct tctgtgtcca caggagagtt tgacccagat actcatggac    540

caggcaaagg tgctgttcct cccagcccag ggcccaccat gaagcatgcc tgggagcctg    600

gtaaggaccc agccactcct gggctgttga cattggcttc tcttgcccag cattgtagcc    660

acgccactgc attgtactgt gagataagtc aaggtgggct caccaggacc tgcactaaat    720

tgtgaaattc agctccaaag aactttggaa attacccatg catttaagca aaatgaatga    780

tacctgagca aaccctttca cattggcaca agttacaatc ctgtctcatc ctcttgatta    840

caaattccat ccaggcaaga gctgtatcac cctgaggtct ccccattcat gttttggtca    900

ataatattta gtttcctttt gaaaatagat ttttgtgtta ctccattatg atgggcagag    960

gccagatgct tatattctat ttaaatgact atgtttttct atctgtaact gggtttgtgt    1020

tcaggtggta aatgcttttt ttttgcagtc agaagattcc tggaaggcga ccagaaatta    1080

gctggcegct gtcagacctg aagttacttc taaagggcct ttagaaatga attctttttt    1140

atgccttctc tgaattctga gaagtaggct tgacttcccc taagtgtgga gttgggagtc    1200

aactcttctg aaaagaaagt ttcagagcat tttccaaagc catggtcagc tgtgggaagg    1260

gaagacgatg gatagtacag ttgccggaaa acactgatgg aggcggatgc tccagctcag    1320

ccaaagacct ttgttctgcc caccccagaa atgccccttc ctcaatcgca gaaacgttgc    1380

cccatggctc ctgatactca gaatgcagcc tctgaccagg accatctgca tcctccagga    1440

gctcgtaaga aatgcagcat cgtgggacct gctggcacct ggtgaaccca aacctgcagg    1500

gctcctgggt gtgcttgggg cggctgcagg ggaagaggga gtcagcagcc tcctcctgac    1560

cttcccgggg gctgcttttc tgaggggcca gaatgcaccg gttgaccttg ttgcatcact    1620

ggcccatgac tggctgcttt ggtcaggtgt aaaaaggtgt ttccagaggg tctgctcctc    1680

tcactatcgg accaggtttc catggagagc tcagcctccc agcaaggata gagaacttca    1740

aatggctcaa agaactgaga ggccacacat gtgtgacctg aatagtctct gctgcaaaac    1800

aaagggtttc ttaatgtaaa acgttctctt cctcacagag gggttcccag ctgctagtgg    1860

gcatgttgca ggcatttcct gggctgcatc aggttgtcat aagccagagg atcatttttg    1920

ggggctcat                                                            1929

<210>10

<211>1167

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR10

<220>

<221>misc_feature

<222>(452)..(1143)

<223>n is a,c,g,or t on various positions

<400>10

aggtcaggag ttcaagacca gcctggccaa catggtgaaa ccctgtccct acaaaaaata    60

caaaaattag ccgggcgtgg tggggggcgc ctataatccc agctactcag gatgctgaga    120

caggagaatt gtttgaaccc gggaggtgga ggttgcagtg aactgagatc gcgccactgc    180

actccagcct ggtgacagag agagactccg tctcaacaac agacaaacaa acaaacaaac    240

aacaacaaaa atgtttactg acagctttat tgagataaaa ttcacatgcc ataaaggtca    300

ccttctacag tatacaattc agtggattta gtatgttcac aaagttgtac gttgttcacc    360

atctactcca gaacatttac atcaccccta aaagaagctc tttagcagtc acttctcatt    420

ctccccagcc cctgccaacc acgaatctac tntctgtctc tattctgaat atttcatata    480

aaggagtcct atcatatggg ccttttacgt ctaccttctt tcacttagca tcatgttttt    540

aagattcatc cacagtgtag cacgtgtcag ttaattcatt tcatcttatg gctggataat    600

gctctattgt atgcatatcc ctcactttgc ttatccattc atcaactgat tgacatttgg    660

gttatttcta ctttttgact attatgagta atgctgctat gaacattcct gtaccaatcg    720

ttacgtggac atatgctttc aattctcctg agtatgtaac tagggttgga gttgctgggt    780

catatgttaa ctcagtgttt catttttttg aagaactacc aaatggtttt ccaaagtgga    840

tgcaacactt tacattccca ccagcaagat atgaaggttc caatgtctct acatttttgc    900

caacacttgt gattttcttt tatttattta tttatttatt tatttttgag atggagtctc    960

actctgtcac ccaggctgga gtgcagtggc acaatttcag ctcactgcaa tctccacctc    1020

tcgggctcaa gcgatactcc tgcctcaacc tcccgagtaa ctgggattac aggcgcccac    1080

caccacacca agctaatttt ttgtattttt agtagagacg gggtttcatc atgtcggcca    1140

ggntgtactc gaactctgac ctcaagt                                        1167

<210>11

<211>1377

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR11

<400>11

aggatcactt gagcccagga gttcaagacc agcctgggca acatagcgag aacatgtctc    60

aaaaaggaaa aaaatggggg aaaaaaccct cccagggaca gatatccaca gccagtcttg    120

ataagctcca tcattttaaa gtgcaaggcg gtgcctccca tgtggatgat tatttaatcc    180

tcttgtactt tgtttagtcc tttgtggaaa tgcccatctt ataaattaat agaattctag    240

aatctaatta aaatggttca actctacatt ttactttagg ataatatcag gaccatcaca    300

gaatgtctga gatgtggatt taccctatct gtagctcact tcttcaacca ttcttttagc    360

aaggctagtt atcttcagtg acaacccctt gctgccctct actatctcct ccctcagatg    420

gactactctg attaagcttg agctagaata agcatgttat cccgggattt catatggaat    480

attttataca tgagtgagcc attatgagtt gtttgaaaat ttattatgtt gagggagggt    540

aaccgctgta acaaccatca ccaaatctaa tcgactgaat acatttgacg tttatttctt    600

gttcacctga cagttcagtg ttacctaaat ttacatgaag acccagaggc ccacgctcct    660

tcattttggg ctccaccgac ctccaaggtt tcagggccct ctgccccgcc ttctgcaccc    720

acaggggaag agagtggagg atgcacacgc ccaggcctgg aagtgacgca tgtggcttcc    780

ccgtccacag acttcaccca cagtccattg gccttcttaa gtcatggact cctgctgagc    840

tgccagggtg catgggaaat ccatgtgact gtgtgccctg gaggaagggg agcgtttcgg    900

tgagcacaca ggagtctttg ccactagacg ctgatgagga ttccccacag gcgatgaagc    960

atggagactc atcttgtaac aaacagatga gttgttgaca tctcttaagt ttactttgtg    1020

tgcagttttt attcagatag gaaaggctgt taaaatctta acacctaact ggaagaaggg    1080

ttttagagaa gtgtggtttt cagtaagcca gttctttcca caatccaaga aacgaaataa    1140

atttccagca tggagcagtt ggcaggtaag gtttttgttg tggtctcgcc caggcttgag    1200

tgtaaccggt gtggtcatag ctcactacat tctcaaactc ctggccttaa gtcatcctcc    1260

tgcctcagcc tcccaaaggc aagtaaggtt aagaataggg gaaaggtgaa gtttcacagc    1320

ttttctagaa ttctttttat tcaagggact ctcagatcat caaacccacc cagaatc       1377

<210>12

<211>1051

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR12

<400>12

atcctgcttc tgggaagaga gtggcctccc ttgtgcaggt gactttggca ggaccagcag    60

aaacccaggt ttcctgtcag gaggaagtgc tcagcttatc tctgtgaagg gtcgtgataa    120

ggcacgagga ggcaggggct tgccaggatg ttgcctttct gtgccatatg ggacatctca    180

gcttacgttg ttaagaaata tttggcaaga agatgcacac agaatttctg taacgaatag    240

gatggagttt taagggttac tacgaaaaaa agaaaactac tggagaagag ggaagccaaa    300

caccaccaag tttgaaatcg attttattgg acgaatgtct cactttaaat ttaaatggag    360

tccaacttcc ttttctcacc cagacgtcga gaaggtggca ttcaaaatgt ttacacttgt    420

ttcatctgcc tttttgctaa gtcctggtcc cctacctcct ttccctcact tcacatttgt    480

cgtttcatcg cacacatatg ctcatcttta tatttacata tatataattt ttatatatgg    540

cttgtgaaat atgccagacg agggatgaaa tagtcctgaa aacagctgga aaattatgca    600

acagtgggga gattgggcac atgtacattc tgtactgcaa agttgcacaa cagaccaagt    660

ttgttataag tgaggctggg tggtttttat tttttctcta ggacaacagc ttgcctggtg    720

gagtaggcct cctgcagaag gcattttctt aggagcctca acttccccaa gaagaggaga    780

gggcgagact ggagttgtgc tggcagcaca gagacaaggg ggcacggcag gactgcagcc    840

tgcagagggg ctggagaagc ggaggctggc acccagtggc cagcgaggcc caggtccaag    900

tccagcgagg tcgaggtcta gagtacagca aggccaaggt ccaaggtcag tgagtctaag    960

gtccatggtc agtgaggctg agacccaggg tccaatgagg ccaaggtcca gagtccagta    1020

aggccgagat ccagggtcca gggaggtcaa g                                     1051

<210>13

<211>1291

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR13

<400>13

agccactgag gtcctaactg cagccaaggg gccgttctgc acatgtcgct caccctctgt    60

gctctgttcc ccacagagca aacgcacatg gcaacgttgg tccgctcagc cactggttct    120

gtggtggaac ggtggatgtc tgcactgtga catcagctga gtaagtaaca acgactgagg    180

atgccgctga cccagggctg gggaagggga ctcccagctc agacaggctt ggctgtggtt    240

tgctttggga ggagagtgaa catcacaggg aatggctcat gtcagcccca ggagggtggg    300

ctggcccctg gtccccgggc tccttctggc cctgcaggcg atagagagcc tcaacctgct    360

gccgcttctc cttggcccgg gtgatggccg tctggaagag cctgcagtag aggtgcacag    420

ccagcggaga gtcgtcattg ccgggtacag ggtaggtgat gaggcagggg ttgcagttgg    480

tgtccacgat gcccactgtg gggatgttca tcttggctgc gtctctcacg gccacgtgtg    540

gctcaaagat gttgttgagc gtgtgcagga agatgatgag gtccggcagg cggaccgtgg    600

ggccaaagag gaggcgcgcg ttggtcagca tgccgcccct gaagtagcga gtgtgggcgt    660

actcgccaca gtcacgggcc atgttctcaa tcaggtacga gaactgccgg ttgcggctta    720

taaacaagat gatgcccttg cggtaggcca tgtgggcggt gaagttcaag gccagctgga    780

ggtgcgtggc tgtctgttcc aggtcgatga tgtcgtggtc caggcggctc ccaaagatgt    840

acggctccat aaacctgcca gagaccccac caaggcaagg gggatgagag ttcacggggc    900

catctccact ggctccttgc aggaacacag acgcccacca gggactcccg ggctcctctg    960

tgggggcact atgggctggg aagcacaatt tgcaacgctc cccgtgtgca tggacagcag    1020

tgcagaccca tccaggccac ccctctgcat gcctcgtctc gtggcttaac ccctcctacc    1080

ctctacctct tcccgaagga atcctaatag aactgacccc atatggatgt gtggacatcc    1140

aacatgacgc caaaaggaca ttctgccccg tgcagctcac agggcagccg cctccgtcac    1200

tgtcctcttc ccgaggcttt gcggatgagg cccctctggg gttggactta gcggggtgct    1260

ctgggccaaa agcattaagg gatcagggca g                                   1291

<210>14

<211>711

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR14

<400>14

ccctggacca gggtccgtgg tcttggtggg cactggcttc ttcttgctgg gtgttttcct    60

gtgggtctct ggcaaggcac tttttgtggc gctgcttgtg ctgtgtgcgg gaggggcagg    120

tgctctttcc tcttggagct ggaccctctg gggcgggtcc ccgtcggcct ccttgtgtgt    180

tttctgcacc tggtacagct ggatggcctc ctcaatgccg tcgtcgctgc tggagtcgga    240

cgcctcgggc gcctgtacgg cgctcgtgac tcgctttccc ctccttgcgg tgctggcgtt    300

ccttttaatc ccacttttat tctgtactgc ttctgaaggg cggtgggggt tgctggcttt    360

gtgctgccct ccttctcctg cgtggtcgtg gtcgtgacct tggacctgag gcttctgggc    420

tgcacgtttg tctttgctaa ccgggggagg tctgcagaag gcgaactcct tctggacgcc    480

catcaggccc tgccggtgca ccacctttgt agccggctct tggtgggatt tcgagagtga    540

cttcgccgaa ttttcatgtg tgtctggttt cttctccact gacccatcac atttttgggt    600

ctcatgctgt cttttctcat tcagaaactg ttctatttct gccctgatgc tctgctcaaa    660

ggagtctgct ctgctcatgc tgactgggga ggcagagccc tggtccttgc t             711

<210>15

<211>1876

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR15

<400>15

gagtccaaga tcaaggtgcc agcatcttgt gagggccttc ttgttacgtc actccctagc    60

gaaagggcaa agagagggtg agcaagagaa aggggggctg aactcgtcct tgtagaagag    120

gcccattccc gagacaatgg cattcatcca ttcactccac cctcatggcc tcaccacctc    180

tcatgaggct ccacctccca gccctggttt gttggggatt aaatttccaa cacatgcctt    240

ttgggggaca tgttaaaatt atagcacccc aaatgttaca ctatcttttg atgagcggta    300

gttctgattt taagtctagc tggcctactt tttcttgcac gtgggatgct ttctgcctgt    360

tccagggcag gcagctcttc tctgtccctc tgctggcccc acctcatcct ctgttgtcct    420

cttccctcct tctgtgccct ggggtcctgg tgggggtgtg actgtcaact gcgttgggct    480

aacttttttc cctgctggtg gcccgtaatg aaagaaagct tcttgctccc aagttcctta    540

aatccaagct catagacaac gcggtctcac agcaggcctg gggccagcct cacgtgagcc    600

ccttccctgg tgtagtcact ggcatggggg aatgggattt cctgttgccc tactgtgtgg    660

ctgaggtggg ggttgcttcc tggagccagg ccttgtggaa gggcagtgcc cactgcagtg    720

gatgctgggc cctgaatctg accccagtgt tcattggctc tgtgagaccc agtgagggca    780

gggagggaag tggagctggg gtgagaagta gaggccctgc agggcccacg tgccagccac    840

caggcctcag actaggctca gatgacggag agctgcacac ctgcccaacc caggccctgc    900

agtgcccaca tgccagccgc tggggcccag acttgctcca gagggcggag agctttacac    960

cggcccaacc caggccatgg ctccaaatgc gtgacagttt tgctgttgct tcttttagtc    1020

attgtcaagt tgatgcttgt tttgcagagg accaaggctt tatgaaccta ttaccctgtg    1080

tgaagagttt caccaggtta tggaaatttc tttaaaacca taccacagtt ttttcattat    1140

tcatgtatat ttttaaaaat aattactgca ctcagtagaa taacatgaaa atgttgcctg    1200

ttagcccttt tccagtttgc cccgagaata ctgggggcac ttgtggctgc aatgtttatc    1260

ctgcggcagc tttgccatga agtatctcac ttttattatt atttttgcat tgctcgagta    1320

tattgacttt ggaaacaaaa gacatcattc tatttatagc attatgtttt tagtagtggt    1380

atttccatat acaagataca gtaattttcc gtcaatgaaa atgtcaaatt ctagaaaatg    1440

taacattcct atgcgtggtg ttaacatcgt tctctaacag ttgttggccg aagattcgtt    1500

tgatgaatcc gatttttcca aaatagccga ttctgatgat tcagacgatt ctgatgttct    1560

gtttagaaat aattccaaga acagttttta cattttattt tcacattgaa aatcagtcag    1620

atttgcttca gcctcaaaga gcacgtttat gtaaaattaa atgagtgctg gcagccagct    1680

gcgctttgtt tttctaaatg ggaaaagggt taaatttcac tcagctttta aatgacagcg    1740

cacagcctgt gtcatagagg gttggaggag atgactttaa ctgcctgtgg ttaggatccc    1800

tttcccccag gaatgtctgg gagcccactg ccgggtttgc tgtccgtctc gtttggactc    1860

agttctgcat gtactg                                                    1876

<210>16

<211>1282

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR16

<400>16

cgcccacctc ggctttccaa agtgctggga ttacaggcat gagtcactgc gcccatcctg    60

attccaagtc tttagataat aacttaactt tttcgaccaa ttgccaatca ggcaatcttt    120

gaatctgcct atgacctagg acatccctct ccctacaagt tgccccgcgt ttccagacca    180

aaccaatgta catcttacat gtattgattg aagttttaca tctccctaaa acatataaaa    240

ccaagctata gtctgaccac ctcaggcacg tgttctcagg acctccctgg ggctatggca    300

tgggtcctgg tcctcagatt tggctcagaa taaatctctt caaatatttt ccagaatttt    360

actcttttca tcaccattac ctatcaccca taagtcagag ttttccacaa ccccttcctc    420

agattcagta atttgctaga atggccacca aactcaggaa agtattttac ttacaattac    480

caatttatta tgaagaactc aaatcaggaa tagccaaatg gaagaggcat agggaaaggt    540

atggaggaag gggcacaaag cttccatgcc ctgtgtgcac accaccctct cagcatcttc    600

atgtgttcac caactcagaa gctcttcaaa ctttgtcatt taggggtttt tatggcagtt    660

ccactatgta ggcatggttg ataaatcact ggtcatcggt gatagaactc tgtctccagc    720

tcctctctct ctcctcccca gaagtcctga ggtggggctg aaagtttcac aaggttagtt    780

gctctgacaa ccagccccta tcctgaagct attgaggggt cccccaaaag ttaccttagt    840

atggttggaa gaggcttatt atgaataaca aaagatgctc ctatttttac cactagggag    900

catatccaag tcttgcggga acaaagcatg ttactggtag caaattcata caggtagata    960

gcaatctcaa ttcttgcctt ctcagaagaa agaatttgac caagggggca taaggcagag    1020

tgagggacca agataagttt tagagcagga gtgaaagttt attaaaaagt tttaggcagg    1080

aatgaaagaa agtaaagtac atttggaaga gggccaagtg ggcgacatga gagagtcaaa    1140

caccatgccc tgtttgatgt ttggcttggg gtcttatatg atgacatgct tctgagggtt    1200

gcatccttct cccctgattc ttcccttggg gtgggctgtc cgcatgcaca atggcctgcc    1260

agcagtaggg aggggccgca tg                                             1282

<210>17

<211>793

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR17

<400>17

atccgagggg aggaggagaa gaggaaggcg agcagggcgc cggagcccga ggtgtctgcg    60

agaactgttt taaatggttg gcttgaaaat gtcactagtg ctaagtggct tttcggattg    120

tcttatttat tactttgtca ggtttcctta aggagagggt gtgttggggg tgggggagga    180

ggtggactgg ggaaacctct gcgtttctcc tcctcggctg cacagggtga gtaggaaacg    240

cctcgctgcc acttaacaat ccctctatta gtaaatctac gcggagactc tatgggaagc    300

cgagaaccag tgtcttcttc cagggcagaa gtcacctgtt gggaacggcc cccgggtccc    360

cctgctgggc tttccggctc ttctaggcgg cctgatttct cctcagccct ccacccagcg    420

tccctcaggg acttttcaca cctccccacc cccatttcca ctacagtctc ccagggcaca    480

gcacttcatt gacagccaca cgagccttct cgttctcttc tcctctgttc cttctctttc    540

tcttctcctc tgttccttct ctttctctgt cataatttcc ttggtgcttt cgccacctta    600

aacaaaaaag agaaaaaaat aaaataaaaa aaacccattc tgagccaaag tattttaaga    660

tgaatccaag aaagcgaccc acatagccct ccccacccac ggagtgcgcc aagacgcacc    720

caggctccat cacagggccg agagcagcgc cactctggtc gtacttttgg gtcaagagat    780

cttgcaaaag agg                                                       793

<210>18

<211>492

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR18

<400>18

atctttttgc tctctaaatg tattgatggg ttgtgttttt tttcccacct gctaataaat    60

attacattgc aacattcttc cctcaacttc aaaactgctg aactgaaaca atatgcataa    120

aagaaaatcc tttgcagaag aaaaaaagct attttctccc actgattttg aatggcactt    180

gcggatgcag ttcgcaaatc ctattgccta ttccctcatg aacattgtga aatgaaacct    240

ttggacagtc tgccgcattg cgcatgagac tgcctgcgca aggcaagggt atggttccca    300

aagcacccag tggtaaatcc taacttatta ttcccttaaa attccaatgt aacaacgtgg    360

gccataaaag agtttctgaa caaaacatgt catctttgtg gaaaggtgtt tttcgtaatt    420

aatgatggaa tcatgctcat ttcaaaatgg aggtccacga tttgtggcca gctgatgcct    480

gcaaattatc ct                                                        492

<210>19

<211>1840

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR19

<400>19

tcacttcctg atattttaca ttcaaggcta gctttatgca tatgcaacct gtgcagttgc    60

acagggcttt gtgttcagaa agactagctc ttggtttaat actctgttgt tgccatcttg    120

agattcatta taatataatt tttgaatttg tgttttgaac gtgatgtcca atgggacaat    180

ggaacattca cataacagag gagacaggtc aggtggcagc ctcaattcct tgccaccctt    240

ttcacataca gcattggcaa tgccccatga gcacaaaatt tgggggaacc atgatgctaa    300

gactcaaagc acatataaac atgttacctc tgtgactaaa agaagtggag gtgctgacag    360

cccccagagg ccacagttta tgttcaaacc aaaacttgct tagggtgcag aaagaaggca    420

atggcagggt ctaagaaaca gcccatcata tccttgttta ttcatgttac gtccctgcat    480

gaactaatca cttacactga aaatattgac agaggaggaa atggaaagat agggcaaccc    540

atagttcttt ttccttttag tctttcctta tcagtaaacc aaagatagta ttggtaaaat    600

gtgtgtgagt taattaatga gttagtttta ggcagtgttt ccactgttgg ggtaagaaca    660

aaatatatag gcttgtattg agctattaaa tgtaaattgt ggaatgtcag tgattccaag    720

tatgaattaa atatccttgt atttgcattt aaaattggca ctgaacaaca aagattaaca    780

gtaaaattaa taatgtaaaa gtttaatttt tacttagaat gacattaaat agcaaataaa    840

agcaccatga taaatcaaga gagagactgt ggaaagaagg aaaacgtttt tattttagta    900

tatttaatgg gactttcttc ctgatgtttt gttttgtttt gagagagagg gatgtggggg    960

cagggaggtc tcattttgtt gcccaggctg gacttgaact cctgggctcc agctatcctg    1020

ccttagcttc ttgagtagct gggactacag gcacacacca cagtgtctga cattttctgg    1080

attttttttt tttttttatt ttttttgtga gacaggttct ggctctgtta ctcaggttgc    1140

agtgcagtgg catgatagcg gctcactgca gcctcaacct cctcagctta agctactctc    1200

ccacttcagc ctcctgagta gccaggacta cagttgtgtg ccaccacacc tgtggctaat    1260

ttttgtagag atggggtctc tccacgttgc cgaggctggt ctccaactcc tggtctcaag    1320

cgaacctcct gacttggcct cccgaagtgc tgggattaca ggcttgagcc actgcatcca    1380

gcctgtcctc tgtgttaaac ctactccaat ttgtctttca tctctacata aacggctctt    1440

ttcaaagttc ccatagacct cactgttgct aatctaataa taaattatct gccttttctt    1500

acatggttca tcagtagcag cattagattg ggctgctcaa ttcttcttgg tatattttct    1560

tcatttggct tctggggcat cacactctct ttgagttact cattcctcat tgatagcttc    1620

ttcctagtct tctttactgg ttcttcctct tctccctgac tccttaatat tgtttttctc    1680

cccaggcttt agttcttagt cctcttctgt tatctattta cacccaattc tttcagagtc    1740

tcatccagag tcatgaactt aaacctgttt ctgtgcagat aattcacatt attatatctc    1800

cagcccagac tctcccgcaa actgcagact gatcctactg                          1840

<210>20

<211>780

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR20

<400>20

gatctcaagt ttcaatatca tgttttggca aaacattcga tgctcccaca tccttaccta    60

aagctaccag aaaggctttg ggaactgtca acagagctac agaaaagtca gtaaagacca    120

atggacccct caaacaaaaa cagccaagct tttctgccaa aaagatgact gagaagactg    180

ttaaagcaaa aaactctgtt cctgcctcag atgatggcta tccagaaata gaaaaattat    240

ttcccttcaa tcctctaggc ttcgagagtt ttgacctgcc tgaagagcac cagattgcac    300

atctcccctt gagtgaagtg cctctcatga tacttgatga ggagagagag cttgaaaagc    360

tgtttcagct gggcccccct tcacctttga agatgccctc tccaccatgg aaatccaatc    420

tgttgcagtc tcctttaagc attctgttga ccctggatgt tgaattgcca cctgtttgct    480

ctgacataga tatttaaatt tcttagtgct ttagagtttg tgtatatttc tattaataaa    540

gcattatttg tttaacagaa aaaaagatat atacttaaat cctaaaataa aataaccatt    600

aaaaggaaaa acaggagtta taactaataa gggaacaaag gacataaaat gggataataa    660

tgcttaatcc aaaataaagc agaaaatgaa gaaaaatgaa atgaagaaca gataaataga    720

aaacaaatag caatatgaaa gacaaacttg accgggtgtg gtggctgatg cctgtaatcc    780

<210>21

<211>607

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR21

<400>21

gatcaataat ttgtaatagt cagtgaatac aaaggggtat atactaaatg ctacagaaat    60

tccattcctg ggtataaatc ctagacatat ttatgcatat gtacaccaag atatatctgc    120

aagaatgttc acagcaaatc tctttgtagt agcaaaaggc caaaaggtct atcaacaaga    180

aaattaatac attgtggcac ataatggcat ccttatgcca ataaaaatgg atgaaattat    240

agttaggttc aaaaggcaag cctccagata atttatatca tataattcca tgtacaacat    300

tcaacaacaa gcaaaactaa acatatacaa atgtcaggga aaatgatgaa caaggttaga    360

aaatgattaa tataaaaata ctgcacagtg ataacattta atgagaaaaa aagaaggaag    420

ggcttaggga gggacctaca gggaactcca aagttcatgg taagtactaa atacataatc    480

aaagcactca aaatagaaaa tattttagta atgttttagc tagttaatat cttacttaaa    540

acaaggtcta ggccaggcac ggtggctcac acctgtaatc ccagcacttt gggaggctga    600

ggcgggt                                                              607

<210>22

<211>1380

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR22

<400>22

cccttgtgat ccacccgcct tggcctccca aagtgctggg attacaggcg tgagtcacta    60

cgcccggcca ccctccctgt atattatttc taagtatact attatgttaa aaaaagttta    120

aaaatattga tttaatgaat tcccagaaac taggatttta catgtcacgt tttcttatta    180

taaaaataaa aatcaacaat aaatatatgg taaaagtaaa aagaaaaaca aaaacaaaaa    240

gtgaaaaaaa taaacaacac tcctgtcaaa aaacaacagt tgtgataaaa cttaagtgcc    300

tgaaaattta gaaacatcct tctaaagaag ttctgaataa aataaggaat aaaataatca    360

catagttttg gtcattggtt ctgtttatgt gatggattat gtttattgat ttgtgtatgt    420

tgaacttatc tcaatagatg cagacaaggc cttgataaaa gtttttaaca ccttttcatg    480

ttgaaaactc tcaatagact aggtattgat gaaacatatc tcaaaataat agaagctatt    540

tatgataaac ccatagccaa tatcatactg agtgggcaaa agctggaagc attccctttg    600

aaaactggca caagacaagg atgccctctc tcaccactcc tattaaatgt agtattggaa    660

gttctggcca gagcaatcag gcaggagaaa gaaaaggtat taaaatagga agagaggaag    720

tcaaattgtc tctgtttgca gtaaacatga ttgtatattt agaaaacccc attgtctcat    780

cctaaaaact ccttaagctg ataaacaact tcagcaaagt ctcaggatac aaaatcaatg    840

tgcaaaaatc acaagcattc ctatacaccg ataatagaca gcagagagcc aaatcatgag    900

tgaagtccca ttcacaattg cttcaaagaa aataaaatac ttaggaatac aactttcacg    960

ggacatgaag gacattttca aggacaacta aaaaccactg ctcaaggaaa tgagagagga    1020

cacaaagaaa tggaaaaaca ttccatgctc atggaagaat caatatcatg aaaatggcca    1080

tactgcccaa agtaatttat agattcaatg ctaaccccat caagccacca ttgactttct    1140

tcacagaact agaaaaaaac tattttaaaa ctcatatgta gtcaaaaaga gtcggtatag    1200

ccaagacaat cctaagcata aagaacaaag ctggatgcat cacgctgact tcaaaccata    1260

ctacaaggct acagtaacca aaacagcatg gtactggtac caaaacagat agatagaccg    1320

atagaacaga acagaggcct cggaaataac accacacatc tacaaccctt tgatcttcaa    1380

<210>23

<211>1246

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR23

<400>23

atcccctcat ccttcagggc agctgagcag ggcctcgagc agctggggga gcctcactta    60

atgctcctgg gagggcagcc agggagcatg gggtctgcag gcatggtcca gggtcctgca    120

ggcggcacgc accatgtgca gccgccccca cctgttgctc tgcctccgcc acctggccat    180

gggcttcagc agccagccac aaagtctgca gctgctgtac atggacaaga agcccacaag    240

cagctagagg accttgtgtt ccacgtgccc agggagcatg gcccacagcc caaagaccag    300

tcaggagcag gcaggggctt ctggcaggcc cagctctacc tctgtcttca cacagatggg    360

agatttctgt tgtgattttg agtgatgtgc ccctttggtg acatccaaga tagttgctga    420

agcaccgctc taacaatgtg tgtgtattct gaaaacgaga acttctttat tctgaaataa    480

ttgatgcaaa ataaattagt ttggatttga aattctattc atgtaggcat gcacacaaaa    540

gtccaacatt gcatatgaca caaagaaaag aaaaagcttg cattccttaa atacaaatat    600

ctgttaacta tatttgcaaa tatatttgaa tacacttcta ttatgttaca tataatatta    660

tatgtatatg tatatataat atacatatat atgttacata taatatactt ctattatgtt    720

acatataata tttatctata agtaaataca taaatataaa gatttgagta gctgtagaac    780

attgtcttat gtgttatcag ctactactac aaaaatatct cttccactta tgccagtttg    840

ccatataaat atgatcttct cattgatggc ccagggcaag agtgcagtgg gtacttattc    900

tctgtgagga gggaggagaa aagggaacaa ggagaaagtc acaaagggaa aactctggtg    960

ttgccaaaat gtcaagtttc acatattccg agacggaaaa tgacatgtcc cacagaagga    1020

ccctgcccag ctaatgtgtc acagatatct caggaagctt aaatgatttt tttaaaagaa    1080

aagagatggc attgtcactt gtttcttgta gctgaggctg tgggatgatg cagatttctg    1140

gaaggcaaag agctcctgct ttttccacac cgagggactt tcaggaatga ggccagggtg    1200

ctgagcacta caccaggaaa tccctggaga gtgtttttct tactta                   1246

<210>24

<211>939

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR24

<400>24

acgaggtcac gagttcgaga ccagcctggc caagatggtg aagccctgtc tctactaaaa    60

atacaacaag tagccgggcg cggtgacggg cgcctgtaat cccagctact caggaggctg    120

aagcaggaga atctctagaa cccaggaggc ggaggtgcag tgagctgaga ctgccccgct    180

gcactctagc ctgggcaaca cagcaagact ctgtctcaaa taaataaata aataaataaa    240

taaataaata aataaataaa tagaaaggga gagttggaag tagatgaaag agaagaaaag    300

aaatcctaga tttcctatct gaaggcacca tgaagatgaa ggccacctct tctgggccag    360

gtcctcccgt tgcaggtgaa ccgagttctg gcctccattg gagaccaaag gagatgactt    420

tggcctggct cctagtgagg aagccatgcc tagtcctgtt ctgtttgggc ttgatcctgt    480

atcacttgat tgtctctcct ggactttcca tggattccag ggatgcaact gagaagttta    540

tttttaatgc acttacttga agtaagagtt attttaaaac attttagcaa aggaaatgaa    600

ttctgacagg ttttgcactg aagacattca catgtgagga aaacaggaaa accactatgc    660

tagaaaaagc aaatgctgtt gagattgtct cacaaacaca aattgcgtgc cagcaggtag    720

gtttgagcct caggttgggc acattttacc ttaagcgcac tgttggtgga acttaaggtg    780

actgtaggac ttatatatac atacatacat ataatatata tacatattta tgtgtatata    840

cacacacaca cacacacaca cacacagggt cttgctatct tgcccagggt ggtctccaac    900

tctgggtctc aagcgatcct ctgcctcccc ttcccaaag                           939

<210>25

<211>1067

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR25

<400>25

cagcccctct tgtgtttttc tttatttctc gtacacacac gcagttttaa gggtgatgtg    60

tgtataatta aaaggaccct tggcccatac tttcctaatt ctttagggac tgggattggg    120

tttgactgaa atatgttttg gtggggatgg gacggtggac ttccattctc cctaaactgg    180

agttttggtc ggtaatcaaa actaaaagaa acctctggga gactggaaac ctgattggag    240

cactgaggaa caagggaatg aaaaggcaga ctctctgaac gtttgatgaa atggactctt    300

gtgaaaatta acagtgaata ttcactgttg cactgtacga agtctctgaa atgtaattaa    360

aagtttttat tgagcccccg agctttggct tgcgcgtatt tttccggtcg cggacatccc    420

accgcgcaga gcctcgcctc cccgctgccc tcagcctccg atgacttccc cgcccccgcc    480

ctgctcggtg acagacgttc tactgcttcc aatcggaggc acccttcgcg ggagcggcca    540

atcgggagct ccggcaggcg gggaggccgg gccagttaga tttggaggtt caacttcaac    600

atggccgaag caagtagcgc caatctaggc agcggctgtg aggaaaaaag gcatgagggg    660

tcgtcttcgg aatctgtgcc acccggcact accatttcga gggtgaagct cctcgacacc    720

atggtggaca cttttcttca gaagctggtc gccgccggca ggtaaagtgg acgcagccgc    780

ggtgggagtg tttgttggca ccgaagctca aatcccgcga ggtcaggacg gccgcaggct    840

ggcgcgcggt gacgtgggtc cgcgttgggg gcggggcagt cggacgaggc gacccagtca    900

aatcctgagc cttaggagtc agggtattca cgcactgata acctgtagcg gaccgggata    960

gctagctact ccttcctaca ggaagccccg ttttcactaa aatttcaggt ggttgggagg    1020

aaagatagag cctttgcaaa ttagagcagg gttttttatt tttttat                  1067

<210>26

<211>540

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR26

<400>26

ccccctgaca agccccagtg tgtgatgttc cccactctgt gtccatgcat tctcattgtt    60

caactcccat ctgtgagtga gaacatgcag tgtttggttt tctgtccttg agatagtttg    120

ctgagaatga tggtttccag cttcatccat gtccttgcaa aggaagtgaa cttatccttt    180

tttatggctt catagtattc catggcacat atgtgccaca tttttttaat ccagtctatc    240

attgatggac atttgggttg gttccaagtc tttgctattg tgaatagcac cacaattaac    300

atatgtgtgc atgtatacat ctttatagta gcatgattta taatccttcg ggtatatacc    360

ctgtaatggg atcgctgggt caaatggtat ttctagttct agatccttga ggaatcacca    420

cactgctttc cacaatggtt gaactaattt acgctcccac cagcagtgta aaagcattcc    480

tatttctcca cgtcctctcc agtatctgtt gtttcctgac tttttaatga tcatcattct    540

<210>27

<211>1520

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR27

<400>27

cttggccctc acaaagcctg tggccaggga acaattagcg agctgcttat tttgctttgt   60

atccccaatg ctgggcataa tgcctgccat tatgagtaat gccggtagaa gtatgtgttc   120

aaggaccaaa gttgataaat accaaagaat ccagagaagg gagagaacat tgagtagagg   180

atagtgacag aagagatggg aacttctgac aagagttgtg aagatgtact aggcaggggg   240

aacagcttaa ggagagtcac acaggaccga gctcttgtca agccggctgc catggaggct   300

gggtggggcc atggtagctt tcccttcctt ctcaggttca gagtgtcagc cttgaacttc   360

taattcccag aggcatttat tcaatgtttt cttctagggg catacctgcc ctgctgtgga   420

agactttctt ccctgtgggt cgccccagtc cccagatgag acggtttggg tcagggccag   480

gtgcaccgtt gggtgtgtgc ttatgtctga tgacagttag ttactcagtc attagtcatt   540

gagggaggtg tggtaaagat ggagatgctg ggtcacatcc ctagagaggt gttccagtat   600

gggcacatgg gagggctgga aggataggtt actgctagac gtagagaagc cacatccttt   660

aacaccctgg cttttcccac tgccaagatc cagaaagtcc ttgtggtttc gctgctttct   720

cctttttttt tttttttttt tttctgagat ggagtctggc tctgtcgccc aggctggagt   780

gcagtggcac gatttcggct cactgcaagt tccgcctcct aggttcatac cattctccca   840

cctcagcctc ccgagtagct gggactacag gcgccaccac acccagctaa ttttttgtat   900

ttttagtaga gacggcgttt caccatgtta gccaggatgg tcttgatccg cctgcctcag   960

cctcccaaag tgctgggatt acaggcgtga gccaccgcgc ccggcctgct ttcttctttc   1020

atgaagcatt cagctggtga aaaagctcag ccaggctggt ctggaactct tgacctcaag   1080

tgatctgcct gcctcagcct cccaaagtgc tgagattaca ggcatgagcc agtccgaatg   1140

tggctttttt tgttttgttt tgaaacaagg tctcactgtt gcccaggctg cagtgcagtg   1200

gcatacctca gctccactgc agcctcgacc tcctgggctc aagcaatcct cccaactgag   1260

cctccccagt agctggggct acaagcgcat gccaccacgc ctggctattt tttttttttt   1320

tttttttttt gagaaggagt ttcattcttg ttgcccaggc tggagtgcaa tggcacagtc   1380

tcagctcact gcagcctccg cctcctgggt tcaagcgatt ctcctgcctc agcctcccga   1440

gtagctggga ttataggcac ctgccaccat gcctggctaa tttttttgta tttttagtag   1500

ggatggggtt tcaccatgtt                                               1520

<210>28

<211>961

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR28

<400>28

aggaggttat tcctgagcaa atggccagcc tagtgaactg gataaatgcc catgtaagat    60

ctgtttaccc tgagaagggc atttcctaac tctccctata aaatgccaag tggagcaccc    120

cagatgaaat agctgatatg ctttctatac aagccatcta ggactggctt tatcatgacc    180

aggatattca cccactgaat atggctatta cccaagttat ggtaaatgct gtagttaagg    240

gggtcccttc cacatggaca ccccaggtta taaccagaaa gggttcccaa tctagactcc    300

aagagagggt tcttagacct catgcaagaa agaacttggg gcaagtacat aaagtgaaag    360

caagtttatt aagaaagtaa agaaacaaaa aaatggctac tccataagca aagttatttc    420

tcacttatat gattaataag agatggatta ttcatgagtt ttctgggaaa ggggtgggca    480

attcctggaa ctgagggttc ctcccacttt tagaccatat agggtatctt cctgatattg    540

ccatggcatt tgtaaactgt catggcactg atgggagtgt cttttagcat tctaatgcat    600

tataattagc atataatgag cagtgaggat gaccagaggt cacttctgtt gccatattgg    660

tttcagtggg gtttggttgg cttttttttt tttttaacca caacctgttt tttatttatt    720

tatttattta tttatttatt tatatttttt attttttttt agatggagtc ttgctctgtc    780

acccaggtta gagtgcagtg gcaccatctc ggctcactgc aagctctgcc tccttggttc    840

acgccattct gctgcctcag cctcccgagt agctgggact acaggtgcct gccaccatac    900

ccggctaatt ttttctattt ttcagtagag acggggtttc accgtgttag ccaggatggt    960

c                                                                    961

<210>29

<211>2233

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR29

<400>29

agcttggaca cttgctgatg ccactttgga tgttgaaggg ccgccctctc ccacaccgct    60

ggccactttt aaatatgtcc cctctgccca gaagggcccc agaggagggg ctggtgaggg    120

tgacaggagt tgactgctct cacagcaggg ggttccggag ggaccttttc tccccattgg    180

gcagcataga aggacctaga agggccccct ccaagcccag ctgggcgtgc agggccagcg    240

attcgatgcc ttcccctgac tcaggtggcg ctgtcctaaa ggtgtgtgtg ttttctgttc    300

gccagggggt ggcggataca gtggagcatc gtgcccgaag tgtctgagcc cgtggtaagt    360

ccctggaggg tgcacggtct cctccgactg tctccatcac gtcaggcctc acagcctgta    420

ggcaccgctc ggggaagcct ctggatgagg ccatgtggtc atccccctgg agtcctggcc    480

tggcctgaag aggaggggag gaggaggcca gcccctccct agccccaagg cctgcgaggc    540

tgcaagcccg gccccacatt ctagtccagg cttggctgtg caagaagcag attgcctggc    600

cctggccagg cttcccagct aggatgtggt atggcagggg tgggggacat tgaggggctg    660

ctgtagcccc cacaacctcc ccaggtaggg tggtgaacag taggctggac aagtggacct    720

gttcccatct gagattcaag agcccacctc tcggaggttg cagtgagccg agatccctcc    780

actgcactcc agcctgggca acagagcaag actctgtctc aaaaaaacag aacaacgaca    840

acaaaaaacc cacctctggc ccactgccta actttgtaaa taaagtttta ttggcacata    900

gacacaccca ttcatttaca tactgctgcg gctgcttttg cattaccctt gagtagacga    960

cagaccacgt ggccatggaa gccaaaaata tttactgtct ggccctttac agaagtctgc    1020

tctagaggga gaccccggcc catggggcag gaccactggg cgtgggcaga agggaggcct    1080

cggtgcctcc acgggcctag ttgggtatct cagtgcctgt ttcttgcatg gagcaccagg    1140

ggtcagggca agtacctgga ggaggcaggc tgttgcccgc ccagcactgg gacccaggag    1200

accttgagag gctcttaacg aatgggagac aagcaggacc agggctccca ttggctgggc    1260

ctcagtttcc ctgcctgtaa gtgagggagg gcagctgtga aggtgaactg tgaggcagag    1320

cctctgctca gccattgcag gggcggctct gccccactcc tgttgtgcac ccagagtgag    1380

gggcacgggg tgagatgtca ccatcagccc ataggggtgt cctcctggtg ccaggtcccc    1440

aagggatgtc ccatcccccc tggctgtgtg gggacagcag agtccctggg gctgggaggg    1500

ctccacactg ttttgtcagt ggtttttctg aactgttaaa tttcagtgga aaattctctt    1560

tcccctttta ctgaaggaac ctccaaagga agacctgact gtgtctgaga agttccagct    1620

ggtgctggac gtcgcccaga aagcccaggt actgccacgg gcgccggcca ggggtgtgtc    1680

tgcgccagcc atgggcacca gccaggggtg tgtctacgcc ggccaggggt aggtctccgc    1740

cggcctccgc tgctgcctgg ggagggccgt gcctgacact gcaggcccgg tttgtccgcg    1800

gtcagctgac ttgtagtcac cctgcccttg gatggtcgtt acagcaactc tggtggttgg    1860

ggaaggggcc tcctgattca gcctctgcgg acggtgcgcg agggtggagc tcccctccct    1920

ccccaccgcc cctggccagg gttgaacgcc cctgggaagg actcaggccc gggtctgctg    1980

ttgctgtgag cgtggccacc tctgccctag accagagctg ggccttcccc ggcctaggag    2040

cagccgggca ggaccacagg gctccgagtg acctcagggc tgcccgacct ggaggccctc    2100

ctggcgtcgc ggtgtgactg acagcccagg agcgggggct gttgtaattg ctgtttctcc    2160

ttcacacaga accttttcgg gaagatggct gacatcctgg agaagatcaa gaagtaagtc    2220

ccgcccccca ccc                                                       2233

<210>30

<211>1851

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR30

<400>30

gggtgcattt ccacccaggg gacacttggc aatggtggga gacattgctt gttgtcacaa    60

ctgggcatgg gagtgctgct gcgtctagtg ggtagaggcc agagatgctc ctaatatcct    120

acaaggcaca gaacagcccc ccacaacaga gaattatcca gcctgaaaat gtccacagtg    180

ctgaggttgg gaaaccctat tctagagcca acaggctgtg aagcttgact catggttcca    240

tcaccaatag ctgcgtgacc ttggtgagtt ccttagctgc tctgtgcctc ggattcatgg    300

taggttttcc ttgttaggtt taaatgagtg aagttataca gagggcctga agtctcatgg    360

tattttacta gagcctcatt gtgttttagt tataattaga aattgggtaa ggtaaggaca    420

cagaagaagc catctgatct gggggcttca cacttagaag tgacctcgga gcaattgtat    480

tggggtggaa agggactaac agccaggagc agagggcaca ttggaattgg ggccagaggg    540

cacagactgc cttgtccatc aggcatagca atggacagag gaaggggaat gactagttat    600

ggctgcaagg ccaagtacag gggacttatt tctcatatct atctatctat ctacctaccg    660

tctatttatc tatcatctat ctacttattt atctatctat ttatgcatgt gtaccaaccg    720

aaagttttag taaatgcaca aactgcgata taatgaaaat ggaaattttc aaaagaagag    780

aaatcacctg ccacctgact accttaacaa atgagtggtt ttcatctctc cttccaggcc    840

tgtcattttt acagtgcttt agtcataaaa caggtcctct attctattgt tttatgtcac    900

atgaaattgt accataagca ttttccatga tgtgactcca ctgtttcatt ttccattttt    960

ttccagaatg aagataacct cattgttttt ttcctgattg taaaaatgct ctgtgctctt    1020

tttttttttt tttaacaatg caggcagtac caaaaagtat gaagaagaat gtaatagttc    1080

ccatttccca tctcactctt taaggccagc attttggtga acatccatcc gaacaaatct    1140

ccacgcgttt atcaatttgt tgacttactc cttcttttat gtaaatatga acatgattta    1200

actgccagtc catttggaac cttaaagtga aggtttttta ttgttggggt ttgctatggt    1260

ctgaatatgt gtgtcccccc aaaatttatg ttgaatccta acgcccaatg cgattaggag    1320

gtggggccat taggaggtga ttaagtcatg aagtcatcag ccctaatgaa tgggatttgt    1380

ggccttgaaa agggacccca gagagctgcc ttgccccttc tgccatgtaa ggacacagtg    1440

aggagctagg aagggggcct cagcagagac caaatgtgat ggtgcctcga tattggactt    1500

cccagcctcc agaatgtgag aaatgaattt ctgttgttta taagtcaccc agtctatagt    1560

attttgttct agcagcccaa acagactaag tcagggttgt tgttttagga agtggggaat    1620

ggggccatgc atgggtgtac gccagaacaa aggaagccag caagtcctga aagatactgg    1680

aaaagggaat agtgggcacg tgcagtgtgt tagtttcctg aggctgctat aacaaagcac    1740

cacaggttgg gtggcttaaa taacagaaat tcattctccc atcattctgg ggaccagacg    1800

tctgaaatca agactcctat gccatgctcc ttctgaaggc tccaggggag g             1851

<210>31

<211>1701

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR31

<220>

<221>misc_feature

<222>(159)..(1696)

<223>n is a,c,g,or t on various positions

<400>31

cacccgcctt ggccccccag agtgctggga ttacaagtgt aaaccaccat tcctggctag    60

atttaatttt ttaaaaaata aagagaagta ggaatagttc attttaggga gagcccctta    120

actgggacag gggcaggaca ggggtgaggc ttcccttant tcaagctcac ctcaaaccca    180

cccaggactg tgtgtcacat tctccaataa aggaaaggtt gctgcccccg cctgtgagtg    240

ctgcagtgga gggtagaggg ccgtgggcag agtgcttcat ggactgctca tcaagaaagg    300

cttcatgaca atcggcccag ctgctgtcat cccacattct acttccagct aggagaaggc    360

ggcttgccca cagtcaccca gccggcaagt gtcacccctg ggttggaccc agagctatga    420

tcctgcccag gggtccagct gagaatcagg cccacgttct aggcagaggg gctcacctac    480

tgggactcca gtagctgtag tgcatggagg catcatggct gcagcagcct ggacctggtc    540

tcacactggc tgtccctgtg ggcaggccat cctcaatgcc aggtcaggcc caagcatgta    600

tcccagacaa tgacaatggg gtggaatcct ctcttgtccc agaagccact cctcactgtt    660

ctacctgagg aaggcagggg catggtggaa tcctgaagcc tgctgtgagg gtctccagcg    720

aacttgcaca tggtcagccc tgccttctcc tccctgaact agattgagcg agagcaagaa    780

ggacattgaa ccagcaccca aagaattttg gggaacggcc tctcatccag gtcaggctca    840

cctccttttt aaaatttaat taattaatta attaattttt ttttagagac agagtcttac    900

tgtgtggccc aggctgtagt gcagtggcac aatcatagtt cactgcagcc tcaaactccc    960

cacctcagcc tctggattag ctgagactac aggtgcacca ccaccacacc cagctaatat    1020

ttttattttt gtagagagag ggtttcacca tcttgcccag gctggtctca aactcctggg    1080

ctcaagtgat cccgcccagg tctgaaagcc cccaggctgg cctcagactg tggggttttc    1140

catgcagcca cccgagggcg cccccaagcc agttcatctc ggagtccagg cctggccctg    1200

ggagacagag tgaaaccagt ggtttttatg aacttaactt agagtttaaa agatttctac    1260

tcgatcactt gtcaagatgc gccctctctg gggagaaggg aacgtgactg gattccctca    1320

ctgttgtatc ttgaataaac gctgctgctt catcctgtgg gggccgtggc cctgtccctg    1380

tgtgggtggg gcctcttcca tttccctgac ttagaaacca cagtccacct agaacagggt    1440

ttgagaggct tagtcagcac tgggtagcgt tttgactcca ttctcggctt tcttcttttt    1500

ctttccagga tttttgtgca gaaatggttc ttttgttgcc gtgttagtcc tccttggaag    1560

gcagctcaga aggcccgtga aatgtcgggg gacaggaccc ccagggaggg aaccccaggc    1620

tacgcacttt agggttcgtt ctccagggag ggcgacctga cccccgnatc cgtcggngcg    1680

cgnngnnacn aannnnttcc c                                              1701

<210>32

<211>771

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>seauence of STAR32

<400>32

gatcacacag cttgtatgtg ggagctagga ttggaacccc agaagtctgg ccccaggttc    60

atgctctcac ccactgcata caatggcctc tcataaatca atccagtata aaacattaga    120

atctgcttta aaaccataga attagtagcg taagtaataa atgcagagac catgcagtga    180

atggcattcc tggaaaaagc ccccagaagg aattttaaat cagctttcgt ctaatcttga    240

gcagctagtt agcaaatatg agaatacagt tgttcccaga taatgcttta tgtctgacca    300

tcttaaactg gcgctgtttt tcaaaaactt aaaaacaaaa tccatgactc ttttaattat    360

aaaagtgata catgtctact tgggaggctg aggtggtggg aggatggctt gagtttgagg    420

ctgcagtatg ctactatcat gcctataaat agccgctgca ttccagcttg ggcaacatac    480

ccaggcccta tctcaaaaaa ataaaaagta atacatctac attgaagaaa attaatttta    540

ttgggttttt ttgcattttt attatacaca gcacacacag cacatatgaa aaaatgggta    600

tgaactcagg cattcaactg gaagaacagt actaaatcaa tgtccatgta gtcagcgtga    660

ctgaggttgg tttgtttttt cttttttctt ctcttctctt ctcttttctt tttttttgag    720

acggagcttt gctctttttg cccaggcttg attgcaatgg cgtgatctca g             771

<210>33

<211>1368

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR33

<400>33

gcttttatcc tccattcaca gctagcctgg cccccagagt acccaattct ccctaaaaaa    60

cggtcatgct gtatagatgt gtgtggcttg gtagtgctaa agtggccaca tacagagctc    120

tgacaccaaa cctcaggacc atgttcatgc cttctcactg agttctggct tgttcgtgac    180

acattatgac attatgatta tgatgacttg tgagagcctc agtcttctat agcactttta    240

gaatgcttta taaaaaccat ggggatgtca ttatattcta acctgttagc acttctgttc    300

gtattaccca tcacatccca acatcaattc tcatatatgc aggtacctct tgtcacgcgc    360

gtccatgtaa ggagaccaca aaacaggctt tgtttgagca acaaggtttt tatttcacct    420

gggtgcaggt gggctgagtc tgaaaagaga gtcagtgaag ggagacaggg gtgggtccac    480

tttataagat ttgggtaggt agtggaaaat tacaatcaaa gggggttgtt ctctggctgg    540

ccagggtggg ggtcacaagg tgctcagtgg gagagccttt gagccaggat gagccagaag    600

gaatttcaca aggtaatgtc atcagttaag gcagggactg gccattttca cttcttttgt    660

ggtggaatgt catcagttaa ggcaggaacc ggccattttc acttcttttg tgattcttca    720

cttgcttcag gccatctgga cgtataggtg caggtcacag tcacagggga taagatggca    780

atggcatagc ttgggctcag aggcctgaca cctctgagaa actaaagatt ataaaaatga    840

tggtcgcttc tattgcaaat ctgtgtttat tgtcaagagg cacttatttg tcaattaaga    900

acccagtggt agaatcgaat gtccgaatgt aaaacaaaat acaaaacctc tgtgtgtgtg    960

tgtgtgtgag tgtgtgtgta tgtgtgtgtg tgtgtattag agaggaaaag cctgtatttg    1020

gaggtgtgat tcttagattc taggttcttt cctgcccacc ccatatgcac ccaccccaca    1080

aaagaacaaa caacaaatcc caggacatct tagcgcaaca tttcagtttg catattttac    1140

atatttactt ttcttacata ttaaaaaact gaaaatttta tgaacacgct aagttagatt    1200

ttaaattaag tttgttttta cactgaaaat aatttaatat ttgtgaagaa tactaataca    1260

ttggtatatt tcattttctt aaaattctga acccctcttc ccttatttcc ttttgacccg    1320

attggtgtat tggtcatgtg actcatggat ttgccttaag gcaggagg                 1368

<210>34

<211>755

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR34

<400>34

actgggcacc ctcctaggca ggggaatgtg agaactgccg ctgctctggg gctgggcgcc    60

atgtcacagc aggagggagg acggtgttac accacgtggg aaggactcag ggtggtcagc    120

cacaaagctg ctggtgatga ccaggggctt gtgtcttcac tctgcagccc taacacccag    180

gctgggttcg ctaggctcca tcctgggggt gcagaccctg agagtgatgc cagtgggagc    240

ctcccgcccc tccccttcct cgaaggccca ggggtcaaac agtgtagact cagaggcctg    300

agggcacatg tttatttagc agacaaggtg gggctccatc agcggggtgg cctggggagc    360

agctgcatgg gtggcactgt ggggagggtc tcccagctcc ctcaatggtg ttcgggctgg    420

tgcggcagct ggcggcaccc tggacagagg tggatatgag ggtgatgggt ggggaaatgg    480

gaggcacccg agatggggac agcagaataa agacagcagc agtgctgggg ggcaggggga    540

tgagcaaagg caggcccaag acccccagcc cactgcaccc tggcctccca caagccccct    600

cgcagccgcc cagccacact cactgtgcac tcagccgtcg atacactggt ctgttaggga    660

gaaagtccgt cagaacaggc agctgtgtgt gtgtgtgcgt gtatgagtgt gtgtgtgtga    720

tccctgactg ccaggtcctc tgcactgccc ctggg                               755

<210>35

<211>1193

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR35

<220>

<221>misc_feature

<222>(312)..(1191)

<223>n is a,c,g,or t on various positions

<400>35

cgacttggtg atgcgggctc ttttttggtt ccatatgaac tttaaagtag tcttttccaa    60

ttctgtgaag aaagtcattg gtaggttgat ggggatggca ttgaatctgt aaattacctt    120

gggcagtatg gccattttca caatgttgat tcttcctatc catgatgatg gaatgttctt    180

ccattagttt gtatcctctt ttatttcctt gagcagtggt ttgtagttct ccttgaagag    240

gtccttcaca tcccttgtaa gttggattcc taggtatttt attctctttg aagcaaattg    300

tgaatgggag tncactcacg atttggctct ctgtttgtct gctgggtgta taaanaatgt    360

ngtgatnttn gtacattgat ttngtatccn tgagacttng ctgaatttgc ttnatcngct    420

tnngggaacc ttttgggctg aaacnatggg attttctaaa tatacaatca tgtcgtctgc    480

aaacagggaa caatttgact tcctcttttc ctaattgaat acactttatc tccttctcct    540

gcctaattgc cctgggcaaa acttccaaca ctatgntngn aataggagnt ggtgagagag    600

ggcatccctg ttcttgttgc cagnttttca aagggaatgc ttccagtttt ggcccattca    660

gtatgatatg ggctgtgggt ngtgtcataa atagctctta tnattttgaa atgtgtccca    720

tcaataccta atttattgaa agtttttagc atgaangcat ngttgaattt ggtcaaaggc    780

tttttctgca tctatggaaa taatcatgtg gtttttgtct ttggctcntg tttatatgct    840

ggatnacatt tattgatttg tgtatatnga acccagcctn ncatcccagg gatgaagccc    900

acttgatcca agcttggcgc gcngnctagc tcgaggcagg caaaagtatg caaagcatgc    960

atctcaatta gtcagcaccc atagtccgcc cctacctccg cccatccgcc cctaactcng    1020

nccgttcgcc cattctcgcc catggctgac taatnttttt annatccaag cggngccgcc    1080

ctgcttganc attcagagtn nagagnnttg gaggccnagc cttgcaaaac tccggacngn    1140

ttctnnggat tgaccccnnt taaatatttg gttttttgtn ttttcanngg nga           1193

<210>36

<211>1712

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR36

<400>36

gatcccatcc ttagcctcat cgatacctcc tgctcacctg tcagtgcctc tggagtgtgt    60

gtctagccca ggcccatccc ctggaactca ggggactcag gactagtggg catgtacact    120

tggcctcagg ggactcagga ttagtgagcc ccacatgtac acttggcctc agtggactca    180

ggactagtga gccccacatg tacacttggc ctcaggggac tcaggattag tgagccccca    240

catgtacact tggcctcagg ggactcagga ttagtgagcc ccacatgtac acttggcctc    300

aggggactca ggactagtga gccccacatg tacacttggc ctcaggggac tcagaactag    360

tgagccccac atgtacactt ggcttcaggg gactcaggat tagtgagccc cacatgtaca    420

cttggacacg tgaaccacat cgatgtgctg cagagctcag ccctctgcag atgaaatgtg    480

gtcatggcat tccttcacag tggcacccct cgttccctcc ccacctcatc tcccattctt    540

gtctgtcttc agcacctgcc atgtccagcc ggcagattcc accgcagcat cttctgcagc    600

acccccgacc acacacctcc ccagcgcctg cttggccctc cagcccagct cccgcctttc    660

ttccttgggg aagctccctg gacagacacc ccctcctccc agccatggct ttttcctgct    720

ctgccccacg cgggaccctg ccctggatgt gctacaatag acacatcaga tacagtcctt    780

cctcagcagc cggcagaccc agggtggact gctcggggcc tgcctgtgag gtcacacagg    840

tgtcgttaac ttgccatctc agcaactagt gaatatgggc agatgctacc ttccttccgg    900

ttccctggtg agaggtactg gtggatgtcc tgtgttgccg gccacctttt gtccctggat    960

gccatttatt tttttccaca aatatttccc aggtctcttc tgtgtgcaag gtattagggc    1020

tgcagcgggg gccaggccac agatctctgt cctgagaaga cttggattct agtgcaggag    1080

actgaagtgt atcacaccaa tcagtgtaaa ttgttaactg ccacaaggag aaaggccagg    1140

aaggagtggg gcatggtggt gttctagtgt tacaagaaga agccagggag ggcttcctgg    1200

atgaagtggc atctgacctg ggatctggag gaggagaaaa atgtcccaaa agagcagaga    1260

gcccacccta ggctctgcac caggaggcaa cttgctgggc ttatggaatt cagagggcaa    1320

gtgataagca gaaagtcctt gggggccaca attaggattt ctgtcttcta aagggcctct    1380

gccctctgct gtgtgacctt gggcaagtta cttcacctct agtgctttgg ttgcctcatc    1440

tgtaaagtgg tgaggataat gctatcacac tggttgagaa ttgaagtaat tattgctgca    1500

aagggcttat aagggtgtct aatactagta ctagtaggta cttcatgtgt cttgacaatt    1560

ttaatcatta ttattttgtc atcaccgtca ctcttccagg ggactaatgt ccctgctgtt    1620

ctgtccaaat taaacattgt ttatccctgt gggcatctgg cgaggtggct aggaaagcct    1680

ggagctgttt cctgttgacg tgccagacta gt                                  1712

<210>37

<211>1321

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR37

<400>37

aggatcacat ttaaggaagt gtgtggggtc cctggatgac accagcaccc agtgcggctc    60

tgtctggcaa ccgctcccaa ggtggcagga gtgggtgtcc cctgtgtgtc agtgggcagc    120

tcctgctgag cctacagctc actggggagc ctgacagcgg ggccatgtgc ctgacactcc    180

tctctgcttg tggacctggc aaggcaggga gcagaaaaca gagccacttg aaggctttct    240

gtctgegtct gtgtgcagtg tggatttagt tgtgcttttt tcttgctggg agagcacagc    300

caccatttac aagcagtgtc accctcatgg gtggcgagga cagaacagga gcctctgctc    360

tctgtaccta tctgggcccg gtgggctccc ttgtcctggc ttccatctct gtctcagcga    420

ccattcagcc ctgcgcagga acacatgttg cttagaaaag ccaaattcag cccttgtctc    480

tgcctcctct ggtctcatga tgtgcatctg ttaccttgaa actggaaacc agtctatcaa    540

tgtctgtgcc aattttttat tccctcccca acctccttcc ccatacgact ttttatttat    600

gtaggatgtg tgctgtctaa tgatgggatg accacatttt tccatgttct aaaagtgctc    660

ctctcccgca gggtcccagg gctggtggtt gctttgggtc tacagctacg tcttacccgc    720

ctcctgcctc aacagcctgt gtggtggcaa agccggtgtg gggctgggga acgcagcgtt    780

ctccaggagg gggacccggc tctccttctg cagtgcaggc gaaggcctag atgccagtgt    840

gacctcccac aaggcgtggc ttccagactc cccggctgga agtgatgctt ttttgcctcc    900

ggccctgggt ttgaagcagc ctggctttct cttggtaagt ggctggtgtc ttagcagctg    960

caatctgagc tcagccacct acacaccacc gtggccgaca ctttcattaa aaagtttcct    1020

gagacgactt gcgtgcatgt tgacttcatg atcagcgccg ctgggaagaa cccctgagcc    1080

ggtggggtgg ggctggaagc agcaggtgca gtgatggggc tgggtgccca ggaggcctca    1140

gtgctcaatc aggccaaggt ggccaagccc aggctgcagg gaaggccggc ctgggggttg    1200

tgggtgagca caggcaggca ccagctgggc agtgttagga tgctggagca gcatccgtaa    1260

ccccactgag tggggtagtc tggttggggc agggaccgct gttgctttgg cagagagaga    1320

t                                                                    1321

<210>38

<211>1445

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR38

<220>

<221>misc_feature

<222>(348)..(949)

<223>n is a,c,g,or t on various positions

<400>38

gatctatggg agtagcttcc ttagtgagct ttcccttcaa atactttgca accaggtaga    60

gaattttgga gtgaaggttt tgttcttcgt ttcttcacaa tatggatatg catcttcttt    120

tgaaaatgtt aaagtaaatt acctctcttt tcagatactg tcttcatgcg aacttggtat    180

cctgtttcca tcccagcctt ctataaccca gtaacatctt ttttgaaacc agtgggtgag    240

aaagacacct ggtcaggaac gcggaccaca ggacaactca ggctcaccca cggcatcaga   300

ctaaaggcaa acaaggactc tgtataaagt accggtggca tgtgtatnag tggagatgca   360

gcctgtgctc tgcagacagg gagtcacaca gacacttttc tataatttct taagtgcttt   420

gaatgttcaa gtagaaagtc taacattaaa tttgattgaa caattgtata ttcatggaat   480

attttggaac ggaataccaa aaaatggcaa tagtggttct ttctggatgg aagacaaact   540

tttcttgttt aaaataaatt ttattttata tatttgaggt tgaccacatg accttaagga   600

tacatataga cagtaaactg gttactacag tgaagcaaat taacatatct accatcgtac   660

atagttacat ttttttgtgt gacaggaaca gctaaaatct acgtatttaa caaaaatcct   720

aaagacaata catttttatt aactatagcc ctcatgatgt acattagatc gtgtggttgt   780

ttcttccgtc cccgccacgc cttcctcctg ggatggggat tcattcccta gcaggtgtcg   840

gagaactggc gcccttgcag ggtaggtgcc ccggagcctg aggcgggnac tttaanatca   900

gacgcttggg ggccggctgg gaaaaactgg cggaaaatat tataactgna ctctcaatgc   960

cagctgttgt agaagctcct gggacaagcc gtggaagtcc cctcaggagg cttccgcgat   1020

gtcctaggtg gctgctccgc ccgccacggt catttccatt gactcacacg cgccgcctgg   1080

aggaggaggc tgcgctggac acgccggtgg cgcctttgcc tgggggagcg cagcctggag   1140

ctctggcggc agcgctggga gcggggcctc ggaggctggg cctggggacc caaggttggg   1200

cggggcgcag gaggtgggct cagggttctc cagagaatcc ccatgagctg acccgcaggg   1260

cggccgggcc agtaggcacc gggcccccgc ggtgacctgc ggacccgaag ctggagcagc   1320

cactgcaaat gctgcgctga ccccaaatgc tgtgtccttt aaatgtttta attaagaata   1380

attaataggt ccgggtgtgg aggctcaagc cttaatcccc agcacctggc gaggccgagg   1440

aggga                                                               1445

<210>39

<211>2331

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR39

<400>39

gtgaaataga tcactaaagc tgattcctct tgtctaaatg aaactttcta ccctttgatg    60

gacagctatg ctttccccat cctctcccgt cccccagccc ttggtaacca tcatcctact    120

ctctacttgt aggagttcaa cttgtttaga ttttgtgagt gagaacatgt ggtatttgcc    180

tttagagtcc tctaggttta tccatattgt gttaaatgac aggattccct gcctttttaa    240

ggctgaatag tatttcattg taatatatat acatacacac acacatatac acacacatat    300

atatacatat atacatatat gtacatagat acatatatat gtacatatat acacacacat    360

atacacacat atatacacat atatacatat acatatatac acatatatgt acatatatat    420

aacttttttt catttatcca ttcacttaat acatatgatg gagggcttta tatatgccag    480

gctctgtgat gaatgctgga aattcaatag tgagaaagac tcagtctctg cctccaaaga    540

gcatcatggg ctaggtgctg caacgaggaa ttgccaactg ttgtcatgag agcacagaga    600

agggactcaa ccagccttga agaatcaggg gaggcttcta agctaatggt gtgtgcctgg    660

ggatcacatt gtttcaagca gcagtaacag gatgtgctca ggtccagatg tgagagagag    720

agagagcata tgtcttcaag aaactaacag tagctcccta tagctgaagc aggagtacaa    780

aatagtgagt ttaagtgatg aggcaagaga tatgaagaag cttgaccatg cagctacacc    840

gggcagcatg ccctctgaga catctcatgg aagccggaaa tgggagtgcc ttgataccaa    900

gccagagaaa ttataatact aagtagatag actgagcagc actcctcctg ggaagaatga    960

gacaagccct gaatttggag gtaagttgtg gattggtgat tagaggagag gtaacaggca    1020

ccaaagcaag aaatagtatt gatgcaaagc tgaggttaat tggatgacaa aatgaagagc    1080

ataaggggct cagacacaga ctgagcagaa aacgagtagc atctgaacct agattgagtt    1140

actaatggat gagaaagagt tcttaaagtt gatgaccacg ggatccatat ataagaatgt    1200

ccaatctccc caaattgatc cacgagttca gtgcaatgcc aatcaaaatc ccactaacaa    1260

gtttatttta aaatgtaaat gaaaatacaa aatttttaaa aagcaaagca atattgaaaa    1320

cccaggaaaa attaggagga cttacacaac ctgatctcaa aacttaccat tatcaagaca    1380

gagtgttatt gacacaagga gagacaaata gataaacgga atgtggtagt ctggagatgc    1440

acccacatgt atgtggtcaa ttgatttttg gccaaggcac caagtcaatt caaaggagca    1500

aggaaagtag tacagaaaca accaaatatt gttttggaaa ataatgacaa agggcttata    1560

accagaatat aagcatataa atataattct ttcaaatcaa taataagaag gcaaatatct    1620

aataaaaatg agcaaagact tgaaaagtca cttaaaaagg cttattaatt agaaatatgc    1680

aaatgttatt agtcttcagt ggaatttaca ttaaaccaca agggatacta ttatatctta    1740

tgcccactag aataaccaaa ggaaaaaaga cagacaaaac aaaatgctgg tgaggatgtg    1800

aagcaactgg aactctcata cattattggt ggtaatgtaa aatttataca accattatga    1860

ataaaggttt ggcagtttct tacaaagttg aatgcacttc tccacgatga ctaggctttt    1920

cactcatagg cgtctggctc cctagaactg aaaacatatg ttcacaagaa gacttgcaaa    1980

tatatattct cccacgtcag gagatatttg ctatgcattt aactgacata agattagtgc    2040

tagagtttat aatgaggttc ttcaaatcta aaagaaaatg caaagcatat aatagtaagg    2100

ggtgcaggcc aggcgcagtg gctcactctg taatcccagc actttgggag gccgaggtgg    2160

gcggatcaca aggtcaggag ttcgagacca acctggccaa catagtgaaa ccctgtctct    2220

actaaaaata caaaaactag ccaggtgcgg tgtcatgcac ctgtagtccc agctactcgg    2280

gaggccgagg caggagaatc acttgaacct gggaggtgga ggttgcagtg a             2331

<210>40

<211>1071

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR40

<400>40

gctgtgattc aaactgtcag cgagataagg cagcagatca agaaagcact ccgggctcca    60

gaaggagcct tccaggccag ctttgagcat aagctgctga tgagcagtga gtgtcttgag    120

tagtgttcag ggcagcatgt taccattcat gcttgacttc tagccagtgt gacgagaggc    180

tggagtcagg tctctagaga gttgagcagc tccagcctta gatctcccag tcttatgcgg    240

tgtgcccatt cgctttgtgt ctgcagtccc ctggccacac ccagtaacag ttctgggatc    300

tatgggagta gcttccttag tgagctttcc cttcaaatac tttgcaacca ggtagagaat    360

tttggagtga aggttttgtt cttcgtttct tcacaatatg gatatgcatc ttcttttgaa    420

aatgttaaag taaattacct ctcttttcag atactgtctt catgcgaact tggtatcctg    480

tttccatccc agccttctat aacccagtaa catctttttt gaaaccagtg ggtgagaaag    540

acacctggtc aggaacgcgg accacaggac aactcaggct cacccacggc atcagactaa    600

aggcaaacaa ggactctgta taaagtaccg gtggcatgtg tattagtgga gatgcagcct    660

gtgctctgca gacagggagt cacacagaca cttttctata atttcttaag tgctttgaat    720

gttcaagtag aaagtctaac attaaatttg attgaacaat tgtatattca tggaatattt    780

tggaacggaa taccaaaaaa tggcaatagt ggttctttct ggatggaaga caaacttttc    840

ttgtttaaaa taaattttat tttatatatt tgaggttgac cacatgacct taaggataca    900

tatagacagt aaactggtta ctacagtgaa gcaaattaac atatctacca tcgtacatag    960

ttacattttt ttgtgtgaca ggaacagcta aaatctacgt atttaacaaa aatcctaaag    1020

acaatacatt tttattaact atagccctca tgatgtacat tagatctcta a             1071

<210>41

<211>1135

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR41

<400>41

cgtgtgcagt ccacggagag tgtgttctcc tcatcctcgt tccggtggtt gtggcgggaa    60

acgtggcgct gcaggacacc aacatcagtc acgtatttca ttctggaaaa aaaagtagca    120

caagcctcgg ctggttccct ccagctctta ccaggcagcc taagcctagg ctccattccc    180

gctcaaggcc ttcctcaggg gcctgctcac cacaggagct gttcccatgc agggactaag    240

gacatgcagc ctgcatagaa accaagcacc caggaaaaca tgattggatg gagcgggggg    300

gtgtggtctc tagccttgtc cacctccggt cctcatgggt ctcacacctc ctgagaatgg    360

gcaccgcaga ggccacagcc catacagcca agatgacaga ctccgtaagt gacagggatc    420

cacagcagag tgggtgaaat gttccctata aactttacaa aattaatgag ggcaggggga    480

ggggagaaat gaaaatgaac ccagctcgca gcacatcagc atcagtcact aggtcggcgt    540

gctctctgac tgcttcctcg tagctgcttg gtgtctcatt gcctcagaag catgtagacc    600

ctgtcacaag attgtagttc ccctaactgc tccgtagatc acaacttgaa ccttaggaaa    660

tgctgttttc cctttgagat attcctttgg gtcctgtata ctgatggagc tactgactga    720

gctgctccga aggaccccac gaggagctga ctaaaccaag agtgcagttt gtacaccctg    780

atgattacat cccccttgcc ccaccaatca actctcccaa ttttccagcc cctcaccctc    840

cagtcccctt aaaagcccca gcccaggccg ggcacagtgg ctcatgcctg taatcccagc    900

actttgggag gccaaggtgg gcagatcacc tgagggcagg aatttgagac cagcctgacc    960

aacatgaaga aaccccgtct ctattacaaa tacaaaatta gcegggcgtg ttgctgcata    1020

ctggtaatcc cagctacttg ggagggtgag gcaggagaat cacttgaatc tgggaggcgg    1080

aggttgcgat gagccgagac agcgccattg cactgcagcc tgggcaacaa gagca        1135

<210>42

<211>735

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR42

<400>42

aagggtgaga tcactaggga gggaggaagg agctataaaa gaaagaggtc actcatcaca    60

tcttacacac tttttaaaac cttggttttt taatgtccgt gttcctcatt agcagtaagc    120

cctgtggaag caggagtctt tctcattgac caccatgaca agaccctatt tatgaaacat    180

aatagacaca caaatgttta tcggatattt attgaaatat aggaattttt cccctcacac    240

ctcatgacca cattctggta cattgtatga atgaatatac cataatttta cctatggctg    300

tatatttagg tcttttcgtg caggctataa aaatatgtat gggccggtca cagtgactta    360

cgcccgtagt cccagaactt tgggaggccg aggcgggtgg atcacctgag gtcgggagtt    420

caaaaccagc ctgaccaaca tggagaaacc ccgtctctgc taaaaataca aaaattaact    480

ggacacggtg gcgtatgcct gtaatcccag ctactcggga agctgaggca ggagaactgc    540

ttgaacccag gaggcggagg ttgtggtgag tcgagattgc gccattgcac tccagcctgg    600

gcaacaagag cgaaattcca tctcaaaaaa aagaaaaaag tatgactgta tttagagtag    660

tatgtggatt tgaaaaatta ataagtgttg ccaacttacc ttagggttta taccatttat    720

gagggtgtcg gtttc                                                     735

<210>43

<211>1227

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR43

<400>43

caaatagatc tacacaaaac aagataatgt ctgcccattt ttccaaagat aatgtggtga    60

agtgggtaga gagaaatgca tccattctcc ccacccaacc tctgctaaat tgtceatgtc    120

acagtactga gaccaggggg cttattccca gcgggcagaa tgtgcaccaa gcacctcttg    180

tctcaatttg cagtctaggc cctgctattt gatggtgtga aggcttgcac ctggcatgga    240

aggtccgttt tgtacttctt gctttagcag ttcaaagagc agggagagct gcgagggcct    300

ctgcagcttc agatggatgt ggtcagcttg ttggaggcgc cttctgtggt ccattatctc    360

cagcccccct gcggtgttgc tgtttgcttg gcttgtctgg ctctccatgc cttgttggct    420

ccaaaatgtc atcatgctgc accccaggaa gaatgtgcag gcccatctct tttatgtgct    480

ttgggctatt ttgattcccc gttgggtata ttccctaggt aagacccaga agacacagga    540

ggtagttgct ttgggagagt ttggacctat gggtatgagg taatagacac agtatcttct    600

ctttcatttg gtgagactgt tagctctggc cgcggactga attccacaca gctcacttgg    660

gaaaacttta ttccaaaaca tagtcacatt gaacattgtg gagaatgagg gacagagaag    720

aggccctaga tttgtacatc tgggtgttat gtctataaat agaatgcttt ggtggtcaac    780

tagacttgtt catgttgaca tttagtcttg ccttttcggt ggtgatttaa aaattatgta    840

tatcttgttt ggaatatagt ggagctatgg tgtggcattt tcatctggct ttttgtttag    900

ctcagcccgt cctgttatgg gcagccttga agctcagtag ctaatgaaga ggtatcctca    960

ctccctccag agagcggtcc cctcacggct cattgagagt ttgtcagcac cttgaaatga    1020

gtttaaactt gtttattttt aaaacattct tggttatgaa tgtgcctata ttgaattact    1080

gaacaacctt atggttgtga agaattgatt tggtgctaag gtgtataaat ttcaggacca    1140

gtgtctctga agagttcatt tagcatgaag tcagcctgtg gcaggttggg tggagccagg    1200

gaacaatgga gaagctttca tgggtgg                                        1227

<210>44

<211>1586

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR44

<400>44

cacctgcctc agcctcccaa agtgctgaga ttcaaagaaa ttttcatgga gaggggacag    60

atggagtcaa ttcttgtggg gtgaacatga gtaccacagt tagactgagg ttgggaaaga    120

ttttccagac aattggaaga gcatgtgaaa gacacagatt ttgagaaatg ttaagtctag    180

ggaactgcaa ggcttttggc acaagaaagc cactgtagac tatagaggca ggatgcctag    240

attcaaatcc caactgctac acttctaagc tttgtaattt tggcaagttt ttaccctcta    300

ttttcttatc tataaaatat agattttata tatatagata tagatatata gatagataat    360

aattgtgcat gcctaataaa gttgtcaaag attaaatgtt atatgtgaag tattttgtac    420

ggtgatagga acccaggaag ggctctatga atattatgta ttattattat tctaaagtag    480

ctggaataca atgttcaaag gagatagtgg caggagataa gtttgaattg aaagattgag    540

gccagaacat aaagtgcctc ctatattata ttttacataa ttggaacatc attgaaaaat    600

ttaagtatta tttatgtgtg tatgtgtgtt ttatataatt aattctagtt catcatttta    660

aaatatcttt ctgatgtcac tgtgaacaac agatgagaag aagtgaatcc tgagttaagg    720

agaccagctc tctgattact gccataatcc agggagggta ccataaggat ttcaactgga    780

agtgaatcca tcatgatgga gaggaaggac agggctgaaa aatacttagg aagtagtatc    840

agtaggactg gttaagagag agcagaggca ggctacaggg gttggaggtg tcaatcacag    900

agatagggaa aatgggagga gaagcaggct ttgaaaaagt ggcttgtctt gtaaaattat    960

gtgctgttaa aacagtacaa gaaattaata tattcaatcc caaaatacag ggacaattct    1020

ttttgaaaga gttacccaga tagtcttcct tgaagttttc agttaaagaa atttcttgtt    1080

aacaaataat gtagtcatag aagaaaacac ttaaaacttt attgaataaa gctaataaat    1140

catttaatat aatttatagg aaattgttac ataacacaca cattcaatac tttttgctaa    1200

agtataaatt aatggaagga gagcacgcac acagaggttg aattatgttt atgactttat    1260

tagtcaagaa tacaaaattg agtagctaca tcaagcagaa gcacatgctt tacaatccag    1320

cacagaatcc cttgacatcc aaactcccga aacagacatg taaatacaga tgacattgtc    1380

agaacaaaat agggtctcac ccgacctata atgttctttt cttgatataa atatgcacat    1440

gaattgcata cggtcatatg gttccaatta ccattatttc ctctgggctt agctatccat    1500

ctaaggggaa tttacaccaa cactgtactt ctacttgcaa gaatatatga aagcatagtt    1560

aacttctggc ttaggaccce aactca                                         1586

<210>45

<211>1981

<212>DNA

<213>Homo sapiens

<220>

<221>mist_feature

<223>sequence of STAR45

<400>45

atggatcata gggtaaataa atttataatt tcttgagaaa gcttcgtact gttttccaag    60

atggctgtac taatttccat tcctaccaac agtgtacagg gtttcttttt ctccacatcc    120

tcaccaacac ttatcttcca tcttttttta taatagccct agtaaaatgt gtgaggtgat    180

atctcattgt ggcattgatt tgcacttctc tgataattag gaatgtttat gattttttca    240

tgtacctggt tggccttttg tatgatgtag gaaatgtcta ttctgattct ttgcttattt    300

tttaataagc atagtttttt tcttattttt gagtaggttg agttgcttat atattattat    360

atgagcccct tacctgatgt atggtttaaa aatattatcc catttgtggg ttctcttaat    420

tctatcattg cttcttttcc tgtggaaaag ttttaagttt tatgcagtct catttgtgtg    480

ttttgctttt gttgcctttt ggaataatct acagaaaatc atagctcagg ccaatgtcat    540

acagtctcct tctatatttc cttgtagtag ttttacattt aaactttaat tttgatttga    600

tgcttgtata aagagcaaaa taaaagtcaa attttattct tctgtatgtg gatagtcagt    660

tttgtctaca ccatttattg aaaataattt tctttcttca ctgtgtattt ttagttattt    720

tatcaaaaaa tcaattgacc acagacacac ggatttattt acaggttcta tatccctttg    780

tactgtttta catgtctgtt tttatgccat tgctatgctg ttttaattcc tatagctttg    840

taatagagtt tggagtcagg tagtctgatg cctccagctt tgttcttttt gttcaagatt    900

gctttggttg gtccaggtct tttgtggtte catacaaatt ttagcagtaa tttttctatt    960

tctgtgaaga atgacattgg aatttgatag tggttgcatt taatctgtag attgctttgg    1020

gtagcattga cacttttaca atactaattt ttgaatccat caatgaagga tgtttctcca    1080

tttatttatg ccattttaat ttttttcatc aatgtgctat agttttcagt atgtaaatct    1140

tttatggttt tgattaaatt tactcctgtc ttttatatat ttatatatct gttttgattc    1200

tattataaat tgaattgcct ttatttttca ggtaatagtt tgtcattagt taatagaaac    1260

aataatgata tttgtatgtt gattttgtaa ctattaactt tattgaattt cttcatcagc    1320

tataaccatt tattttggtg gaatctttaa gattttctct atcttaagat tatattttca    1380

aaaaacagaa acaatcttac ctcttccttc cctatgtgga tttcttttac gtctttgtct    1440

tgtgtaactg ttctggctag gcaattacac ataatgtttt catcatttat aattttacat    1500

cacatccatc tattgtggca cattgattgc tacttttcaa gttgtaaacc tggacattta    1560

tcactactct tcctccaata caggagtcea tggcgtggtg tgggccctac tgtgccacag    1620

tccagggcac ggctgggctg aggttctctt gtgcaagagt ccgtggctct gcggagcaag    1680

agttctccag tgccttagtc cagggttagg caggggtggg gctccttcag tagcttagtc    1740

cagtgcgccg ccctgcgagg gtcctcctga gcaggagtac acgatgaggc agggtcctac    1800

tgtgccttag cccaggaagc ggggggctgg gtcctctggt gccatagtcc aggctgccgg    1860

gagctgggtc ctctggtgcc atagctcagg ccggcgggag ctgggtcctc tggtgccgta    1920

gtccagggtg cagcagaaca ggagtcctgc ggagcagtag tccagggcac gctggggcgt    1980

g                                                                    1981

<210>46

<211>1859

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR46

<400>46

attgtttttc tcgcccttct gcattttctg caaattctgt tgaatcattg cagttactta    60

ggtttgcttc gtctccccca ttacaaacta cttactgggt ttttcaaccc tagttccctc    120

atttttatga tttatgctca tttctttgta cacttcgtct tgctccatct cccaactcat    180

ggcccctggc tttggattat tgttttggtc ttttattttt tgtcttcttc tacctcaaca    240

cttatcttcc tctcccagtc tccggtaccc tatcaccaag gttgtcatta acctttcata    300

ttattcctca ttatccatgt attcatttgc aaataagcgt atattaacaa aatcacaggt    360

ttatggagat ataattcaca taccttaaaa ttcaggcttt taaagtgtac ctttcatgtg    420

gtttttggta tattcacaaa gttatgcatt gatcaccacc atctgattcc ataacatgtt    480

caatacctca aaaagaagtc tgtactcatt agtagtcatt tcacattcac cactccctct    540

ggctctgggc agtcactgat ctttgtgtct ctatggattt gcctagtcta ggtattttta    600

tgtaaatggc atcatacaac atgtgacctt ttgtttggct tttttcattt agcaaaatgt    660

tatcaaggtc tgtccctgtt gtagcatgta ttagcacttc atttcttata tgctgaatga    720

tatactttat ttgtccatca gttgttcatg ctttatttgt ccatcagttg atgaacattt    780

gcgtttttgc cactttgggc tattaagaat aatgctactg tgaacaagtg tgtacaagtt    840

cctctacaaa tttttgtgtg gacatatcct ttcagttctc tcaggtgtat atctgggaat    900

tgaattgctg ggtcgtgtag tagctatgtt aaacactttg agaaactgct ataatgttct    960

ccagagctgt accattttaa attctgtgta tgaggattcc acgttctcca cttcctcacc    1020

agtgtatgga tttgggggta tactttttaa aaagtgggat taggctgggc acagtggctc    1080

acacctgtaa tcccaacact tcaggaagct gaggtgggag gatcacttga gcctagtagt    1140

ttgagaccag cctgggcaac atagggagac cctgtctcta caaaaaataa tttaaaataa    1200

attagctggg cgttgtggca cacacctgta gtcccagcta catgggaggc tgaggtggaa    1260

ggattccctg agcccagaag tttgaggttg cagtgagcca tgatggcagc actatactgt    1320

agcctgggtg tcagagcaag actccgtttc agggaagaaa aaaaaaagtg ggatgatatt    1380

tttgacactt ttcttcttgt tttcttaatt tcatacttct ggaaattcca ttaaattagc    1440

tggtaccact ctaactcatt gtgtttcatg gctgcatagt aatattgcat aatataaata    1500

taccattcat tcatcaaagt tagcagatat tgactgttag gtgccaggca ctgctctaag    1560

cgttaaagaa aaacacacaa aaacttttgc attcttagag tttattttcc aatggagggg    1620

gtggagggag gtaagaattt aggaaataaa ttaattacat atatagcata gggtttcacc    1680

agtgagtgca gcttgaatcg ttggcagctt tcttagtagt ataaatacag tactaaagat    1740

gaaattactc taaatggtgt tacttaaatt actggaatag gtattactat tagtcacttt    1800

gcaggtgaaa gtggaaacac catcgtaaaa tgtaaaatag gaaacagctg gttaatgtt     1859

<210>47

<211>1082

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR47

<400>47

atcattagtc attagggaaa tgcaaatgaa aaacacaagc agccaccaat atacacctac    60

taggatgatt taaaggaaaa taagtgtgaa gaaggacgta aagaaattgt aaccctgata    120

cattgatggt agaaatggat aaagttgcag ccactgtgaa aaacagtctg cagtggctca    180

gaaggttaaa tatagaaccc ctgttggacc caggaactct actcttaggc accccaaaga    240

atagagaaca gaaatcaaac agatgtttgt atactaatgt ttgtagcatc acttttcaca    300

ggagccaaaa ggtggaaata atccaaccat cagtgaacaa atgaatgtaa taaaagcaag    360

gtggtctgca tgcaatgcta catcatccat ctgtaaaaaa cgaacatcat tttgatagat    420

gatacaacat gggtggacat tgagaacatt atgcttagtg aaataagcca gacacaaaag    480

gaatatattg tataattgta attacatgaa gtgcctagaa tagtcaaatt catacaagag    540

aaagtgggat aggaatcacc atgggctgga aataggggga aggtgctata ctgcttattg    600

tggacaaggt ttcgtaagaa atcatcaaaa ttgtgggtgt agatagtggt gttggttatg    660

caaccctgtg aatatattga atgccatgga gtgcacactt tggttaaaag gttcaaatga    720

taaatattgt gttatatata tttccccacg atagaaaaca cgcacagcca agcccacatg    780

ccagtcttgt tagctgcctt cctttacctt caagagtggg ctgaagcttg tccaatcttt    840

caaggttgct gaagactgta tgatggaagt catctgcatt gggaaagaaa ttaatggaga    900

gaggagaaaa cttgagaatc cacactactc accctgcagg gccaagaact etgtctccca    960

tgctttgctg tcctgtctca gtatttcctg tgaccacctc ctttttcaac tgaagacttt    1020

gtacctgaag gggttcccag gtttttcacc tcggcccttg tcaggactga tcctctcaac    1080

ta                                                                   1082

<210>48

<211>1242

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR48

<400>48

atcatgtatt tgttttctga attaattctt agatacatta atgttttatg ttaccatgaa    60

tgtgatatta taatataata tttttaattg gttgctactg tttataagaa tttcattttc    120

tgtttacttt gccttcatat ctgaaaacct tgctgatttg attagtgcat ccacaaattt    180

tcttggattt tctatgggta attacaaatc tccacacaat gaggttgcag tgagccaaga    240

tcacaccact gtactccagc ctgggcgaca gagtgagaca ccatctcaca aaaacacata    300

aacaaacaaa cagaaactcc acacaatgac aacgtatgtg ctttcttttt ttcttcctct    360

ttctataata tttctttgtc ctatcttaac tgaactggcc agaaacccca ggacaatgat    420

aaatacgagc agtgtcaaca gacatctcat tccctttcct agcttttata aaaataacga    480

ttatgcttca acattacata tggtggtgtc gatggttttg ttatagataa gcttatcagg    540

ttaagaaatt tgtctgcgtt tcctagtttg gtataaagat tttaatataa atgaatgttg    600

tattttatca tcttattttt ttcctacatc tgctaaggta atcctgtgtt ttcccctttt    660

caatctccta atgtggtgaa tgacattaaa ataccttcta ttgttaaaat attcttgcaa    720

cgctgtatag aaccaatgcc tttattctgt attgctgatg gatttttgaa aaatatgtag    780

gtggacttag ttttctaagg ggaatagaat ttctaatata tttaaaatat tttgcatgta    840

tgttctgaag gacattggtg tgtcatttct ataccatctg gctactagag gagccgactg    900

aaagtcacac tgccggagga ggggagaggt gctcttccgt ttctggtgtc tgtagccatc    960

tccagtggta gctgcagtga taataatgct gcagtgccga cagttctgga aggagcaaca    1020

acagtgattt cagcagcagc agtattgcgg gatccccacg atggagcaag ggaaataatt    1080

ctggaagcaa tgacaatatc agctgtggct atagcagctg agatgtgagt tctcacggtg    1140

gcagcttcaa ggacagtagt gatggtccaa tggcgcccag acctagaaat gcacatttcc    1200

tcagcaccgg ctccagatgc tgagcttgga cagctgacgc ct                       1242

<210>49

<211>1015

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR49

<400>49

aaaccagaaa cccaaaacaa tgggagtgac atgctaaaac cagaaaccca aaacaatggg    60

agggtcctgc taaaccagaa acccaaaaca atgggagtga agtgctaaaa ccagaaaccc    120

aaaacaatgg gagtgtcctg ctacaccaga aacccaaaac gatgggagtg acgtgataaa    180

accagacacc caaaacaatg ggagtgacgt gctaaaccag aaacccaaaa caatgggagt    240

gacgtgctaa aacctggaaa cctaaaacaa tgcgagtgag gtgctaacac cagaatccat    300

aacaatgtga gtgacgtgct aaaccagaac ccaaaacaat gggagtgacg tgctaaaaca    360

ggaacccaaa acaatgagag tgacgtgcta aaccagaaac ccaaaacaat gggaatgacg    420

tgctaaaacc ggaacccaaa acaatgggag tgatgtgcta aaccagaaac ccaaaacaat    480

gggaatgaca tgctaaaact ggaacccaaa acaatggtaa ctaagagtga tgctaaggcc    540

ctacattttg gtcacactct caactaagtg agaacttgac tgaaaaggag gatttttttt    600

tctaagacag agttttggtc tgtcccccag agtggagtgc agtggcatga tctcggctca    660

ctgcaagctc tgcctcccgg gttcaggcca ttctcctgcc tcagcctcct gagtagctgg    720

gaatacaggc acccgccacc acacttggct aattttttgt atttttagta gagatggggt    780

ttcaccatat tagcaaggat ggtctcaatc tcctgacctc gtgatctgcc cacctcaggc    840

tcccaaagtg ctgggattac aggtgtgagc caccacaccc agcaaaaagg aggaattttt    900

aaagcaaaat tatgggaggc cattgttttg aactaagctc atgcaatagg tcccaacaga    960

ccaaaccaaa ccaaaccaaa atggagtcac tcatgctaaa tgtagcataa tcaaa         1015

<210>50

<211>2355

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR50

<400>50

caaccatcgt tccgcaagag cggcttgttt attaaacatg aaatgaggga aaagcctagt    60

agctccattg gattgggaag aatggcaaag agagacaggc gtcattttct agaaagcaat    120

cttcacacct gttggtcctc acccattgaa tgtcctcacc caatctccaa cacagaaatg    180

agtgactgtg tgtgcacatg cgtgtgcatg tgtgaaagta tgagtgtgaa tgtgtctata    240

tgggaacata tatgtgattg tatgtgtgta actatgtgtg actggcagcg tggggagtgc    300

tggttggagt gtggtgtgat gtgagtatge atgagtggct gtgtgtatga ctgtggcggg    360

aggcggaagg ggagaagcag caggctcagg tgtcgccaga gaggctggga ggaaactata    420

aacctgggca atttcctcct catcagcgag cctttcttgg gcaatagggg cagagctcaa    480

agttcacaga gatagtgcct gggaggcatg aggcaaggcg gaagtactgc gaggaggggc    540

agagggtctg acacttgagg ggttctaatg ggaaaggaaa gacccacact gaattccact    600

tagccccaga ccctgggccc agcggtgccg gcttccaacc ataccaacca tttccaagtg    660

ttgccggcag aagttaacct ctcttagcct cagtttcccc acctgtaaaa tggcagaagt    720

aaccaagctt accttcccgg cagtgtgtga ggatgaaaag agctatgtac gtgatgcact    780

tagaagaagg tctagggtgt gagtggtact cgtctggtgg gtgtggagaa gacattctag    840

gcaatgagga ctggggagag cctggcccat ggcttccact cagcaaggtc agtctcttgt    900

cctctgcact cccagccttc cagagaggac cttcccaacc agcactcccc acgctgccag    960

tcacacatag ttacacacat acaatcacat atatgttccc atatagacac attcacactc    1020

ataccttcac acatgcacac gcatgtgcac acacagtcac tcatttctgt gttggagatt    1080

gggtgaggac attcaatggg tgaggaccaa caggtgtgaa gattgctttc tagaaaatga    1140

ctcctgtctc tctttgccat tcttcccaat ccgatggagc tactaggctt ttccctcatt    1200

tcatgtttaa taaaccttcc caatggcgaa atgggctttc tcaagaagtg gtgagtgtcc    1260

catccctgcg gtggggacag gggtggcagc ggacaagcct gcctggaggg aactgtcagg    1320

ctgattccca gtccaactcc agcttccaac acctcatcct ccaggcagtc ttcattcttg    1380

gctctaattt cgctcttgtt ttctttttta tttttatcga gaactgggtg gagagctttt    1440

ggtgtcattg gggattgctt tgaaaccctt ctctgcctca cactgggagc tggcttgagt    1500

caactggtct ccatggaatt tcttttttta gtgtgtaaac agctaagttt taggcagctg    1560

ttgtgccgtc cagggtggaa agcagcctgt tgatgtggaa ctgcttggct cagatttctt    1620

gggcaaacag atgccgtgtc tctcaactca ccaattaaga agcccagaaa atgtggcttg    1680

gagaccacat gtctggttat gtctagtaat tcagatggct tcacctggga agccctttct    1740

gaatgtcaaa gccatgagat aaaggacata tatatagtag ctagggtggt ccacttctta    1800

ggggccatct ccggaggtgg tgagcactaa gtgccaggaa gagaggaaac tctgttttgg    1860

agccaaagca taaaaaaacc ttagccacaa accactgaac atttgttttg tgcaggttct    1920

gagtccaggg agggcttctg aggagagggg cagctggagc tggtaggagt tatgtgagat    1980

ggagcaaggg ccctttaaga ggtgggagca gcatgagcaa aggcagagag gtggtaatgt    2040

ataaggtatg tcatgggaaa gagtttggct ggaacagagt ttacagaata gaaaaattca    2100

acactattaa ttgagcctct actacgtgct cgacattgtt ctagtcactg agataggttt    2160

ggtatacaaa acaaaatcca tcctctatgg acattttagt gactaacaac aatataaata    2220

ataaaagtga acaaaagctc aaaacatgcc aggcactatt atttatttat ttatttattt    2280

atttatttat tttttgaaac agagtctcgc tctgttgccc aggctggagt gtagtggtgc    2340

gatctcggct cactg                                                     2355

<210>51

<211>2289

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR51

<400>51

tcacaggtga caccaatccc ctgaccacgc tttgagaagc actgtactag attgactttc    60

taatgtcagt cttcattttc tagctctgtt acagccatgg tctccatatt atctagtaca    120

acacacatac aaatatgtgt gatacagtat gaatataata taaaaatatg tgttataata    180

taaatataat attaaaatat gtctttatac tagataataa tacttaataa cgttgagtgt    240

ttaactgctc taagcacttt acctgcagga aacagttttt tttttatttt ggtgaaatac    300

aactaacata aatttattta caattttaag catttttaag tgtatagttt agtggagtta    360

atatattcaa aatgttgtgc agccgtcacc atcatcagtc ttcataactc ttttcatatt    420

gtaaaattaa aagtttatgc tcatttaaaa atgactccca atttcccccc tcctcaacct    480

ctggaaacta ccattctatt ttctgcctcc gtagttttgc ccactctaag tacctcacat    540

aagtggaatt tgtcttattt gcctgtttgt gaccggctga tttcatttag tataatgtcc    600

tcaagtttta ttcacgttat atagcatatg tcataatttt cttcactttt aagcttgagt    660

aatatttcat cgtatgtatc tcacattttg cttatccatt catctctcag tggacacttg    720

agttgcttct acattttagc tgttgtgaat actgctgcta tgaacatggg tgtataaata    780

tctcaagacc tttttatcag ttttttaaaa tatatactca gtagtagttt agctggatta    840

tatggtaatt ttatttttaa tttttgagga actgtcctac ccttttattc aatagtagct    900

ataccaattg acaattggca ttcctaccaa cagggcataa gggttctcaa ttctccacat    960

attccctgat acttgttatt ttcaggtgtt tttttttttt tttttttttt atgggagcca    1020

tgttaatggg tgtaaggtga tatttcatta tagttttgat ttgcatttcc ctaatgatta    1080

gtgatgttaa gcatctcttc atgtgcctat tggccatttg tatatcttct ttaaaaatat    1140

atatatactc attcctttgc ccatttttga attatgttta ttttttgtta ttgagtttca    1200

atacttttct atataaccta ggtattaatc ctttatcaga cttaagattt gcaaatattc    1260

tctttcattc cacaggttgc taattctctc tgttggtaat atcttttgat gctgttgtgt    1320

ccagaattga ttcattcctg tgggttcttg gtctcactga cttcaagaat aaagctgcgg    1380

accctagtgg tgagtgttac acttcttata gatggtgttt ccggagtttg ttccttcaga    1440

tgtgtccaga gtttcttcct tccaatgggt tcatggtctt gctgacttca ggaatgaagc    1500

cgcagacctt cgcagtgagg tttacagctc ttaaaggtgg cgtgtccaga gttgtttgtt    1560

ccccctggtg ggttcgtggt cttgctgact tcaggaatga agccgcagac cctcgcagtg    1620

agtgttacag ctcataaagg tagtgcggac acagagtgag ctgcagcaag atttactgtg    1680

aagagcaaaa gaacaaagct tccacagcat agaaggacac cccagcgggt tcctgctgct    1740

ggctcaggtg gccagttatt attcccttat ttgccctgcc cacatcctgc tgattggtcc    1800

attttacaga gtactgattg gtccatttta cagagtgctg attggtgcat ttacaatcct    1860

ttagctagac acagagtgct gattgctgca ttcttacaga gtgctgattg gtgcatttac    1920

agtcctttag ctagatacag aacgctgatt gctgcgtttt ttacagagtg ctgattggtg    1980

catttacaat cctttagcta gacacagtgc tgattggtgg gtttttacag agtgctgatt    2040

ggtgcgtctt tacagagtgc tgattggtgc atttacaatc ctttagctag acacagagtg    2100

ctgattggtg cgtttataat cctctagcta gacagaaaag ttttccaagt ccccacctga    2160

ccgagaagcc ccactggctt cacctctcac tgttatactt tggacatttg tccccccaaa    2220

atctcatgtt gaaatgtaac ccctaatgtt ggaactgagg ccagactgga tgtggctggg    2280

ccatgggga                                                            2289

<210>52

<211>1184

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR52

<400>52

ctcttctttg tttttttatt ttggggtgtg tgggtacgtg taagatgaga aatgtacaaa    60

cacaagtatt tcagaaactc caagtaatat tctgtctgtg agttcacggt aaataaataa    120

aaagggcaaa gtgacagaaa tacaggatta ttaaaagcaa aataatgttc tttgaaatcc    180

cccccttggt gtatttttta tcttaggatg cagcactttc agcatgccca agtattgaaa    240

gcagtgtttt tacgctacca cggtaatttt atttagaaac cccatgttca cttttagttt    300

taaaatggtc tttatgacat aaaattatca gcattcatat ttttgtgttt taatattcct    360

ttggctactt attgaaacag taaacattac gaaaattagt aaacaaatct ttgatagttg    420

cttatttttg tttaattgaa tgtttatttt attaggtaaa tatacaatca aatttattta    480

aaaataatga ggaaaagaat acttttcttt cgctttgcga aagcaaagtg atttttcatt    540

cttctccgtc cgattccttc tcttccagct gccacagccg actgacaggc tcccggcggc    600

ctgaggagta gtatgcaaat tttggatgat tgacacctac agtagaagcc aatcacgtca    660

aagtaggatg ctgattggtt gacaacaata ggcgtaaacc ttgacgtttt aaaaacctga    720

cacccaatcc aggcgattca tgcaaataaa ggaagggagt cacattacca ggggccagag    780

agacttgagt acgacctcac gtgttcagtg gtggatattg cacagacgtc tgcaaggtct    840

atataaacgc tacataatgt tcaactcaat tgcttgcctt ggcctttccc aaacttgtca    900

ctggaatata aattatccct tttttaaaaa taaaaaaata agaattatgt agtgcacata    960

tatgatggtt catgtagaaa tctaaatgga cttccaacgc atggaatttt cctatttccc    1020

cctttcttta aattaatcct cagtgaagga ggctgttttc ccctagattt caaaaggacg    1080

agatttacag agcctttcct tggagaaacc cgctctaggc acagatggtc agtaaattta    1140

gcttcttcag cgaagttcca catggcaccg ccagatggca taag                     1184

<210>53

<211>1431

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR53

<400>53

ccctgaggaa gatgacgagt aactccgtaa gagaaccttc cactcatccc ccacatccct    60

gcagacgtgc tattctgtta tgatactggt atcccatctg tcacttgctc cccaaatcat    120

tcccttctta caattttcta ctgtacagca ttgaggctga acgatgagag atttcccatg    180

ctctttctac tccctgccct gtatatatcc ggggatcctc cctacccagg atgctgtggg    240

gtcccaaacc ccaagtaagc cctgatatgc gggccacacc tttctctagc ctaggaattg    300

ataacccagg cgaggaagtc actgtggcat gaacagatgg ttcacttcga ggaaccgtgg    360

aaggcgtgtg caggtcctga gatagggcag aatcggagtg tgcagggtct gcaggtcagg    420

aggagttgag attgcgttgc cacgtggtgg gaactcactg ccacttattt ccttctctct    480

tcttgcctca gcctcaggga tacgacacat gcccatgatg agaagcagaa cgtggtgacc    540

tttcacgaac atgggcatgg ctgcggaccc ctcgtcatca ggtgcatagc aagtgaaagc    600

aagtgttcac aacagtgaaa agttgagcgt catttttctt agtgtgccaa gagttcgatg    660

ttagcgttta cgttgtattt tcttacactg tgtcattctg ttagatacta acattttcat    720

tgatgagcaa gacatactta atgcatattt tggtttgtgt atccatgcac ctaccttaga    780

aaacaagtat tgtcggttac ctctgcatgg aacagcatta ccctcctctc tccccagatg    840

tgactactga gggcagttct gagtgtttaa tttcagattt tttcctctgc atttacacac    900

acacgcacac aaaccacacc acacacacac acacacacac acacacacac acacacacac    960

acacaccaag taccagtata agcatctgcc atctgctttt cccattgcca tgcgtcctgg    1020

tcaagctccc ctcactctgt ttcctggtca gcatgtactc ccctcatccg attcccctgt    1080

agcagtcact gacagttaat aaacctttgc aaacgttccc cagttgtttg ctcgtgccat    1140

tattgtgcac acagctctgt gcacgtgtgt gcatatttct ttaggaaaga ttcttagaag    1200

tggaattgct gtgtcaaagg agtcatttat tcaacaaaac actaatgagt gcgtcctcgt    1260

gctgagcgct gttctaggtg ctggagcgac gtcagggaac aaggcagaca ggagttcctg    1320

acccccgttc tagaggagga tgtttccagt tgttgggttt tgtttgtttg tttcttctag    1380

agatggtggt cttgctctgt ccaggctaga gtgcagtggc atgatcatag c             1431

<210>54

<211>975

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR54

<400>54

ccataaaagt gtttctaaac tgcagaaaaa tccccctaca gtcttacagt tcaagaattt    60

tcagcatgaa atgcctggta gattacctga ctttttttgc caaaaataag gcacagcagc    120

tctctcctga ctctgacttt ctatagtcct tactgaatta tagtccttac tgaattcatt    180

cttcagtgtt gcagtctgaa ggacacccac attttctctt tgtctttgtc aattctttgt    240

gttgtaaggg caggatgttt aaaagttgaa gtcattgact tgcaaaatga gaaatttcag    300

agggcatttt gttctctaga ccatgtagct tagagcagtg ttcacactga ggttgctgct    360

aatgtttctg cagttcttac caatagtatc atttacccag caacaggata tgatagagga    420

cttcgaaaac cccagaaaat gttttgccat atatccaaag ccctttggga aatggaaagg    480

aattgcgggc tcccattttt atatatggat agatagagac caagaaagac caaggcaact    540

ccatgtgctt tacattaata aagtacaaaa tgttaacatg taggaagtct aggcgaagtt    600

tatgtgagaa ttctttacac taattttgca acattttaat gcaagtctga aattatgtca    660

aaataagtaa aaatttttac aagttaagca gagaataaca atgattagtc agagaaataa    720

gtagcaaaat cttcttctca gtattgactt ggttgctttt caatctctga ggacacagca    780

gtcttcgctt ccaaatccac aagtcacatc agtgaggaga ctcagctgag actttggcta    840

atgttggggg gtccctcctg tgtctcccca ggcgcagtga gcctgcaggc cgacctcact    900

cgtggcacac aactaaatct ggggagaagc aacccgatgc cagcatgatg cagatatctc    960

agggtatgat cggcc                                                     975

<210>55

<211>501

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR55

<400>55

cctgaactca tgatccgccc acctcagcct cctgaagtgc tgggattaca ggtgtgagcc    60

accacaccca gccgcaacac actcttgagc aaccaatgtg tcataaaaga aataaaatgg    120

aaatcagaaa gtatcttgag acagacaaaa atggaaacac aacataccaa aatttatggg    180

acacagcaaa agcagtttta ggagggaagt ttatagtgat gaatacctac ctcaaaatca    240

ttagcctgat tggatgacac tacagtgtat aaatgaattg aaaaccacat tgtgccccat    300

acatatatac aatttttatt tgttaattaa aaataaaata aaactttaaa aaagaagaaa    360

gagctcaaat aaacaaccta actttatacc tcaaggaaat agaagagcca gctaagccca    420

aagttgacag aaggaaaaaa atattggcag aaagaaatga aacagagact agaaagacaa    480

ttgaagagat cagcaaaact a                                              501

<210>56

<211>741

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR56

<400>56

acacaggaaa agatcgcaat tgttcagcag agctttgaac cggggatgac ggtctccctc    60

gttgcccggc aacatggtgt agcagccagc cagttatttc tctggcgtaa gcaataccag    120

gaaggaagtc ttactgctgt cgccgccgga gaacaggttg ttcctgcctc tgaacttgct    180

gccgccatga agcagattaa agaactccag cgcctgctcg gcaagaaaac gatggaaaat    240

gaactcctca aagaagccgt tgaatatgga cgggcaaaaa agtggatagc gcacgcgccc    300

ttattgcccg gggatgggga gtaagcttag tcagccgttg tctccgggtg tcgcgtgcgc    360

agttgcacgt cattctcaga cgaaccgatg actggatgga tggccgccgc agtcgtcaca    420

ctgatgatac ggatgtgctt ctccgtatac accatgttat cggagagctg ccaacgtatg    480

gttatcgtcg ggtatgggcg ctgcttcgca gacaggcaga acttgatggt atgcctgcga    540

tcaatgccaa acgtgtttac cggatcatgc gccagaatgc gctgttgctt gagcgaaaac    600

ctgctgtacc gccatcgaaa cgggcacata caggcagagt ggccgtgaaa gaaagcaatc    660

agcgatggtg ctctgacggg ttcgagttct gctgtgataa cggagagaga ctgcgtgtca    720

cgttcgcgct ggactgctgt g                                              741

<210>57

<211>1365

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR57

<400>57

tccttctgta aataggcaaa atgtatttta gtttccacca cacatgttct tttctgtagg    60

gcttgtatgt tggaaatttt atccaattat tcaattaaca ctataccaac aatctgctaa    120

ttctggagat gtggcagtga ataaaaaagt tatagtttct gattttgtgg agcttggact    180

ttaatgatgg acaaaacaac acattcttaa atatatattt catcaaaatt atagtgggtg    240

aattatttat atgtgcattt acatgtgtat gtatacataa atgggcggtt actggctgca    300

ctgagaatgt acacgtggcg cgaacgaggc tgggcggtca gagaaggcct cccaaggagg    360

tggctttgaa gctgagtggt gcttccacgt gaaaaggctg gaaagggcat tccaagaaaa    420

ggctgaggcc agcgggaaag aggttccagt gcgctctggg aacggaaagc gcacctgcct    480

gaaacgaaaa tgagtgtgct gaaataggac gctagaaagg gaggcagagg ctggcaaaag    540

cgaccgagga ggagctcaaa ggagcgagcg gggaaggccg ctgtggagcc tggaggaagc    600

acttcggaag cgcttctgag cgggtaaggc cgctgggagc atgaactgct gagcaggtgt    660

gtccagaatt cgtgggttct tggtctcact gacttcaaga atgaagaggg accgcggacc    720

ctcgcggtga gtgttacagc tcttaaggtg gcgcgtctgg agtttgttcc ttctgatgtt    780

cggatgtgtt cagagtttct tccttctggt gggttcgtgg tctcgctggc tcaggagtga    840

agctgcagac cttcgcggtg agtgttacag ctcataaaag cagggtggac tcaaagagtg    900

agcagcagca agatttattg caaagaatga aagaacaaag cttccacact gtggaagggg    960

accccagcgg gttgccactg ctggctccgc agcctgcttt tattctctta tctggcccca    1020

cccacatcct gctgattggt agagccgaat ggtctgtttt gacggcgctg attggtgcgt    1080

ttacaatccc tgcgctagat acaaaggttc tccacgtccc caccagatta gctagataga    1140

gtctccacac aaaggttctc caaggcccca ccagagtagc tagatacaga gtgttgattg    1200

gtgcattcac aaaccctgag ctagacacag ggtgatgact ggtgtgttta caaaccttgc    1260

ggtagataca gagtatcaat tggcgtattt acaatcactg agctaggcat aaaggttctc    1320

caggtcccca ccagactcag gagcccagct ggcttcaccc agtgg                    1365

<210>58

<211>1401

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR58

<400>58

aagtttacct tagccctaaa ttatttcatt gtgattggca ttttaggaaa tatgtattaa    60

ggaatgtctc ttaggagata aggataacat atgtctaaga aaattatatt gaaatattat    120

tacatgaact aaaatgttag aactgaaaaa aaattattgt aactccttcc agcgtaggca    180

ggagtatcta gataccaact ttaacaactc aactttaaca acttcgaacc aaccagatgg    240

ctaggagatt cacctattta gcatgatatc ttttattgat aaaaaaatat aaaacttcca    300

ttaaattttt aagctactac aatcctatta aattttaact taccagtgtt ctcaatgcta    360

cataatttaa aatcattgaa atcttctgat tttaactcct cagtcttgaa atctacttat    420

ttttagttac atatatatcc aatctactgc cgctagtaga agaagcttgg aatttgagaa    480

aaaaatcaga cgttttgtat attctcatat tcactaattt attttttaaa tgagtttctg    540

caatgcatca agcagtggca aaacaggaga aaaattaaaa ttggttgaaa agatatgtgt    600

gccaaacaat cccttgaaat ttgatgaagt gactaatcct gagttattgt ttcaaatgtg    660

tacctgttta tacaagggta tcacctttga aatctcaaca ttaaatgaaa ttttataagc    720

aatttgttgt aacatgatta ttataaaatt ctgatataac attttttatt acctgtttag    780

agtttaaaga gagaaaagga gttaagaata attacatttt cattagcatt gtccgggtgc    840

aaaaacttct aacactatct tcaaatcttt ttctccattg ccttctgaac atacccactt    900

gggtatctca ttagcactgc aaattcaaca ttttcgattg ctaatttttc tccctaaata    960

tttatttgtt ttctcagctt tagccaatgt ttcactattg accatttgct caagtatagt    1020

gacgcttcaa tgaccttcag agagctgttt cagtccttcc tggactactt gcatgcttcc    1080

aacaaaatga agcactcttg atgtcagtca ctcaaataaa tggaaatggg cccatttact    1140

aggaatgtta acagaataaa aagatagacg tgacaccagt tgcttcagtc catctccatt    1200

tacttgctta aggcctggcc atatttctca cagttgatat ggcgcagggc acatgtttaa    1260

atggctgttc ttgtaggatg gtttgactgt tggattcctc atcttccctc tccttaggaa    1320

ggaaggttac agtagtactg ttggctcctg gaatatagat tcataaagaa ctaatggagt    1380

atcatctccc actgctcttg t                                               1401

<210>59

<211>866

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR59

<400>59

gagatcacgc cactgcactc cagcctgggg gacagagcaa gactccatct cagaaacaaa    60

caaacacaca aagccagtca aggtgtttaa ttcgacggtg tcaggctcag gtctcttgac    120

aggatacatc cagcacccgg gggaaacgtc gatgggtggg gtggaatcta ttttgtggcc    180

tcaagggagg gtttgagagg tagtcccgca agcggtgatg gcctaaggaa gcccctccgc    240

ccaagaagcg atattcattt ctagcctgta gccacccaag agggagaatc gggctcgcca    300

cagaccccac aacccccaac ccaccccacc cccacccctc ccacctcgtg aaatgggctc    360

tcgctccgtc aggctctagt cacaccgtgt ggttttggaa cctccagcgt gtgtgcgtgg    420

gttgcgtggt ggggtggggc cggctgtgga cagaggaggg gataaagcgg cggtgtcccg    480

cgggtgcccg ggacgtgggg cgtggggcgt gggtggggtg gccagagcct tgggaactcg    540

tcgcctgtcg ggacgtctcc cctcctggtc ccctctctga cctacgctcc acatcttcgc    600

cgttcagtgg ggaccttgtg ggtggaagtc accatccctt tggactttag ccgacgaagg    660

ccgggctccc aagagtctcc ccggaggcgg ggccttgggc aggctcacaa ggatgctgac    720

ggtgacggtt ggtgacggtg atgtacttcg gaggcctcgg gccaatgcag aggtatccat    780

ttgacctcgg tgggacaggt cagctttgcg gagtcccgtg cgtccttcca gagactcatc    840

cagcgctagc aagcatggtc ccgagg                                         866

<210>60

<211>2067

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR60

<220>

<221>misc_feature

<222>92)..(1777)

<223>n is a,c,g,or t on various positions

<400>60

agcagtgcag aactggggaa gaagaagagt ccctacacca cttaatactc aaaagtactc    60

gcaaaaaata acacccctca ccaggtggca tnattactct ccttcattga gaaaattagg    120

aaactggact tcgtagaagc taattgcttt atccagagcc acctgcatac aaacctgcag    180

cgccacctgc atacaaacct gtcagccgac cccaaagccc tcagtcgcac caagcctctg    240

ctgcacaccc tcgtgccttc acactggccg ttccccaagc ctggggcata ctncccagct    300

ctgagaaatg tattcatcct tcaaagccct gctcatgtgt cctnntcaac aggaaaatct    360

cccatgagat gctctgctat ccccatctct cctgccccat agcttaggca nacttctgtg    420

gtggtgagtc ctgggctgtg ctgtgatgtg ttcgcctgcn atgtntgttc ttccccacaa    480

tgatgggccc ctgaattctc tatctctagc acctgtgctc agtaaaggct tgggaaacca    540

ggctcaaagc ctggcccaga tgccaccttt tccagggtgc ttccgggggc caccaaccag    600

agtgcagcct tctcctccac caggaactct tgcagcccca cccctgagca cctgcacccc    660

attacccatc tttgtttctc cgtgtgatcg tattattaca gaattatata ctgtattctt    720

aatacagtat ataattgtat aattattctt aatacagtat ataattatac aaatacaaaa    780

tatgtgttaa tggaccgttt atgttactgg taaagcttta agtcaacagt gggacattag    840

ttaggttttt ggcgaagtca aaagttatat gtgcattttc aacttcttga ggggtcggta    900

cntctnaccc ccatgttgtt caanggtcaa ctgtctacac atatcatagc taattcacta    960

cagaaatgtt agcttgtgtc actagtatct ccccttctca taagcttaat acacatacct    1020

tgagagagct cttggccatc tctactaatg actgaagttt ttatttatta tagatgtcat    1080

aataggcata aaactacatt acatcattcg agtgccaatt ttgccacctt gaccctcttt    1140

tgcaaaacac caacgtcagt acacatatga agaggaaact gcccgagaac tgaagttcct    1200

gagaccagga gctgcaggcg ttagatagaa tatggtgacg agagttacga ggatgacgag    1260

agtaaatact tcatactcag tacgtgccaa gcactgctat aagcgctctg tatgtgtgaa    1320

gtcatttaat cctcacagca tcccacggtg taattatttt cattatcccc atgagggaac    1380

agaaactcag aacggttcaa cacatatgcg agaagtcgca gccggtcagt gagagagcag    1440

gttcccgtcc aagcagtcag accccgagtg cacactctcg acccctgtcc agcagactca    1500

ctcgtcataa ggcggggagt gntctgtttc agccagatgc tttatgcatc tcagagtacc    1560

caaaccatga aagaatgagg cagtattcan gagcagatgg ngctgggcag taaggctggg    1620

cttcagaata gctggaaagc tcaagtnatg ggacctgcaa gaaaaatcca ttgtttngat    1680

aaatagccaa agtccctagg ctgtaagggg aaggtgtgcc aggtgcaagt ggagctctaa    1740

tgtaaaatcg cacctgagtc tcctggtctt atgagtnctg ggtgtacccc agtgaaaggt    1800

cctgctgcca ccaagtgggc catggttcag ctgtgtaagt gctgagcggc agccggaccg    1860

cttcctctaa cttcacctcc aaaggcacag tgcacctggt tcctccagca ctcagctgcg    1920

aggcccctag ccagggtccc ggcccccggc ccccggcagc tgctccagct tccttcccca    1980

cagcattcag gatggtctgc gttcatgtag acctttgttt tcagtctgtg ctccgaggtc    2040

actggcagca ctagccccgg ctcctgt                                        2067

<210>61

<211>1470

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR61

<220>

<221>misc_feature

<222>(130)..(976)

<223>n is a,c,g,or t on various positions

<400>61

cagcccccac atgcccagcc ctgtgctcag ctctgcagcg gggcatggtg ggcagagaca    60

cagaggccaa ggccctgctt cggggacggt gggcctggga tgagcatggc cttggccttc    120

gccgagagtn ctcttgtgaa ggaggggtca ggaggggctg ctgcagctgg ggaggagggc    180

gatggcactg tggcangaag tgaantagtg tgggtgcctn gcaccccagg cacggccagc    240

ctggggtatg gacccggggc cntctgttct agagcaggaa ggtatggtga ggacctcaaa    300

aggacagcca ctggagagct ccaggcagag gnacttgaga ggccctgggg ccatcctgtc    360

tcttttctgg gtctgtgtgc tctgggcctg ggcccttcct ctgctccccc gggcttggag    420

agggctggcc ttgcctcgtg caaaggacca ctctagactg gtaccaagtc tggcccatgg    480

cctcctgtgg gtgcaggcct gtgcgggtga cctgagagcc agggctggca ggtcagagtc    540

aggagaggga tggcagtgga tgccctgtgc aggatctgcc taatcatggt gaggctggag    600

gaatccaaag tgggcatgca ctctgcactc atttctttat tcatgtgtgc ccatcccaac    660

aagcagggag cctggccagg agggcccctg ggagaaggca ctgatgggct gtgttccatt    720

taggaaggat ggacggttgt gagacgggta agtcagaacg ggctgcccac ctcggccgag    780

agggccccgt ggtgggttgg caccatctgg gcctggagag ctgctcagga ggctctctag    840

ggctgggtga ccaggnctgg ggtacagtag ccatgggagc aggtgcttac ctggggctgt    900

ccctgagcag gggctgcatt gggtgctctg tgagcacaca cttctctatt cacctgagtc    960

ccnctgagtg atgagnacac ccttgttttg cagatgaatc tgagcatgga gatgttaagt    1020

ggcttgcctg agccacacag cagatggatg gtgtagctgg gacctgaggg caggcagtcc    1080

cagcccgagg acttcccaag gttgtggcaa actctgacag catgacccca gggaacaccc    1140

atctcagctc tggtcagaca ctgcggagtt gtgttgtaac ccacacagct ggagacagcc    1200

accctagccc cacccttatc ctctcccaaa ggaacctgcc ctttcccttc attttcctct    1260

tactgcattg agggaccaca cagtgtggca gaaggaacat gggttcagga cccagatgga    1320

cttgcttcac agtgcagccc tcctgtcctc ttgcagagtg cgtcttccac tgtgaagttg    1380

ggacagtcac accaactcaa tactgctggg cccgtcacac ggtgggcagg caacggatgg    1440

cagtcactgg ctgtgggtct gcagaggtgg                                     1470

<210>62

<211>1011

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR62

<400>62

agtgtcaaat agatctacac aaaacaagat aatgtctgcc catttttcca aagataatgt    60

ggtgaagtgg gtagagagaa atgcatccat tctccccacc caacctctgc taaattgtcc    120

atgtcacagt actgagacca gggggcttat tcccagcggg cagaatgtgc accaagcacc    180

tcttgtctca atttgcagtc taggccctgc tatttgatgg tgtgaaggct tgcacctggc    240

atggaaggtc cgttttgtac ttcttgcttt agcagttcaa agagcaggga gagctgcgag    300

ggcctctgca gcttcagatg gatgtggtca gcttgttgga ggcgccttct gtggtccatt    360

atctccagcc cccctgcggt gttgctgttt gcttggcttg tctggctctc catgccttgt    420

tggctccaaa atgtcatcat gctgcacccc aggaagaatg tgcaggccca tctcttttat    480

gtgctttggg ctattttgat tccccgttgg gtatattccc taggtaagac ccagaagaca    540

caggaggtag ttgctttggg agagtttgga cctatgggta tgaggtaata gacacagtat    600

cttctctttc atttggtgag actgttagct ctggccgcgg actgaattcc acacagctca    660

cttgggaaaa ctttattcca aaacatagtc acattgaaca ttgtggagaa tgagggacag    720

agaagaggcc ctagatttgt acatctgggt gttatgtcta taaatagaat gctttggtgg    780

tcaactagac ttgttcatgt tgacatttag tcttgccttt tcggtggtga tttaaaaatt    840

atgtatatct tgtttggaat atagtggagc tatggtgtgg cattttcatc tggctttttg    900

tttagctcag cccgtcctgt tatgggcagc cttgaagctc agtagctaat gaagaggtat    960

cctcactccc tccagagagc ggtcccctca cggctcattg agagtttgtc a             1011

<210>63

<211>1410

<212>DNA

<213>Homo sapiens

<220>

<221>mist_feature

<223>sequence of STAR63

<400>63

ccacagcctg atcgtgctgt cgatgagagg aatctgctct aagggtctga gcggagggag    60

atgccgaagc tttgagcttt ttgtttctgg cttaaccttg gtggattttc accctctggg    120

cattacctct tgtccagggg aggggctggg ggagtgcctg gagctgtagg gacagagggc    180

tgagtggggg ggactgcttg ggctgaccac ataatattct gctgcgtatt aatttttttt    240

tgagacagtc tttctctgtt gcccaggctg gagtgtaatg gcttgatagc tcactgccac    300

ctccgcctcc tgggttcaag tgattctcct gcttcagctt ccggagtagc tgggactgca    360

ggtgcccgcc accatggctg gctaattttt gtatttttat tagcaatggg gttttgctat    420

gttgcccagg ccggtcccga actcctgccc tcaagtgata cacctgcctc ggcctcccaa    480

agtgctggga ttagaggctt gagccactgc gcctggccag ctgcatattg ttaattagac    540

ataaaatgca aaataagatg atataaacac aaaggtgtga aataagatgg acacctgctg    600

agcgcgcctg tcctgaagca tcgcccctct gcaaaagcag gggtcagcat gtgttctccg    660

gtccttgctc ttacagagga gtgagctgcc tatgcgtctt ccagccactt cctgggctgc    720

tcagaggcct ctcacgggtg ttctgggttg ctgccacttg caggggtgct gaggcggggc    780

tcctcccgtg cggggcatgt ccaggccgcc ctctctgaag gcttggcagg tacaggtggg    840

agtgggggtc tctgggctgc tgtggggact gggcaggctc ctggaagacc tccctgtgtt    900

tgggctgaaa gcgcagcccg aggggaggtc cccagggagg ccgctgtcgg gggtgggggc    960

ttggaggagg gaggggccga ggagccggcg acactccgtg acggcccagg aacgtcccta    1020

aacaaggcgc cgcgttctcg atggggtggg gtccgctttc ttttctcaaa agctgcagtt    1080

actccatgct cggaggactg gcgtccgcgc cctgttccaa tgctgccccg gggccctggc    1140

cttggggaat cggggccttg gactggaccc tgggggcttc gcggagccgg gcctggcggg    1200

gcgagcggag cagaggctgg gcagccccgg ggaagcgctc gccaaagccg ggcgctgctc    1260

ccagagcgcg aggtgcagaa ccagaggctg gtcccgcggc gctaacgaga gaagaggaag    1320

cgcgctgtgt agagggcgcc caccccgtgg ggcgaacccc cttcctcaac tccatggacg    1380

gggctcatgg gttcccagcg gctcagacgc                                     1410

<210>64

<211>1414

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR64

<400>64

tggatcagat ttgttttata ccctcccttc tactgctctg agagttgtac atcacagtct    60

actgtatctg tttcccatta ttataatttt tttgcactgt gcttgcctga agggagcctc    120

aagttcatga gtctccctac cctcctccca aatgagacat ggacctttga atgctttcct    180

gggaccacca ccccaccttt catgctgctg ttatccagga ttttagttca acagtgtttt    240

aaccccccaa atgagtcatt tttattgttt cgtatagtga atgtgtattt gggtttgctt    300

atatggtgac ctgtttattt gctcctcatt gtacctcatg ctctgctctt tccttctaga    360

ttcagtctct ttcctaatga ggtgtctcgc agcaattctt tacaagacag ccaagatagg    420

ccagctctca gagcacttgt tgtctgaaaa agtcttgtct tatttaattt ctttttctta    480

gagatggggt ctcattatgt tacccacact ggtctcaaac ttctggctta aagcggtcct    540

cccaccttgg cctcccaaag tgctaggatt acaggcgtga gcgacctcgt ccagcctgtc    600

tgagaaagcg tttgttttgc ccttgctctc agatgacagt ttggggatag aattctaggt    660

ggacggtttt tttccttcag ccctttgaag agtctgtatt ttcattatct ccctgcatta    720

gatgttcttt tgcaagtaac gtgtcttttc tctctgggta ttcttaaggt tttctctttg    780

cctttggtga gctgcagtgg atttgctttt ttcaagaggt caagagaaag gaaagtgtga    840

ggtttctgtt ttttactgac aatttgtttg ttgatttgtt ttcccaccca gaggttcctt    900

gccactttgc caggctggaa ggcagacttc ttctggtgtc ctgttcacag acggggcagc    960

ctgcggaagg ccctgccaca tgcagggcct cggtcctcat tcccttgcat gtggacccgg    1020

gcgtgactcc tgttcaggct ggcacttccc agagctgagc cccagcctga ccttcctccc    1080

atactgtctt cacaccccct cctttcttct gatacctgga ggttttcctt tctttcctgt    1140

cacctccact tggattttaa atcctctgtc tgtggaattg tattcggcac aggaagatgc    1200

ttgcaagggc caggctcatc agccctgtcc ctgctgctgg aagcagcaca gcagagcctc    1260

atgctcaggc tgagatggag cagaggcctg cagacgagca cccagctcag ctggggttgg    1320

cgccgatggt ggagggtcct cgaaagctct ggggacgatg gcagagctat tggcagggga    1380

gccgcagggt cttttgagcc cttaaaagat ctct                                1414

<210>65

<211>1310

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR65

<400>65

gtgaatgttg atggatcaaa tatctttctg tgttgtttat caaagttaaa ataaatgtgg    60

tcatttaaag gacaaaagat gaggggttgg agtctgttca agcaaagggt atattaggag    120

aaaagcagaa ttctctccct gtgaagggac agtgactcct attttccacc tcatttttac    180

taactctcct aactatctgc ttaggtagag atatatccat gtacatttat aaaccacagt    240

gaatcatttg attttggaat aaagatagta taaaatgtgt cccagtgttg atatacatca    300

tacattaaat atgtctggca gtgttctaat tttacagttg tccaaagata atgttagggc    360

atactggcta tggatgaagc tccaatgttc agattgcaaa gaaacttaga attttactaa    420

tgaaaccaaa tacatcccaa gaaatttttc agaagaaaaa aagagaaact agtagcaaag    480

taaagaatca ccacaatatc atcagatttt ttttatatgt agaatattta ttcagttctt    540

ttttcaagta caccttgtct tcattcattg tactttattt tttgtgaagg tttaaattta    600

tttcttctat gtgtttagtg atatttaaaa tttttattta atcaagttta tcagaaagtt    660

ctgttagaaa atatgacgag gctttaattc cgccatctat attttccgct attatataaa    720

gataattgtt ttctcttttt aaaacaactt gaattgggat tttatatcat aattttttaa    780

tgtctttttt tattatactt taagttctgg gatacatgtg cagaacgtgc aggtgtgtta    840

catagatata cacgtgccat ggtggtttgc tgcacccact aacctgttat cgacattagg    900

tatttctcct aatgctatca ccccctattt ccccaccccc cgagaggccc cagtgtgtga    960

tgttctcctc cctgtgtcca tgtgttctca ttgttcatct cccacttatg gtatctacca    1020

taaccttgaa attgtcttat gcattcactt gtttggttgt tatatagcct ccatcaggac    1080

agggatattt gctgctgctt cttttttttt tctttttgag acagtcttgc tccgtcatcc    1140

aggctggagt gcttctcggc tcaatgcaac ctccacctcc caggtttaag cgattctcca    1200

acttcagcct cccaaatggc tgggactgca ggcatgcacc actacacctg gctaattttt    1260

gtatttgtaa tagagacaat gtttcaccat gttggccagg ctggtctcga               1310

<210>66

<211>1917

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<223>sequence of STAR67

<400>66

aggatcctaa aattttgtga ccctagagca agtactaact atgaaagtga aatagagaat    60

gaaggaatta tttaattaag tccagcaaaa cccaaccaaa tcatctgtaa aatatatttg    120

ttttcaacat ccaggtattt tctgtgtaaa aggttgagtt gtatgctgac ttattgggaa    180

aaataattga gttttcccct tcactttgcc agtgagagga aatcagtact gtaattgtta    240

aaggttaccc atacctacct ctactaccgt ctagcatagg taaagtaatg tacactgtga    300

agtttcctgc ttgactgtaa tgttttcagt ttcatcccat tgattcaaca gctatttatt    360

cagcacttac tacaaccatg ctggaaaccc aagagtaaat aggctgtgtt actcaacagg    420

actgaggtac agccgaactg tcaggcaagg ttgctgtcct ttggacttgc ctgctttctc    480

tctatgtagg aagaagaaat ggacataccg tccaggaaat agatatatgt tacatttcct    540

tattccataa ttaatattaa taaccctgga cagaaactac caagtttcta gacccttata    600

gtaccacctt accctttctg gatgaatcct tcacatgttg atacatttta tccaaatgaa    660

aattttggta ctgtaggtat aacagacaaa gagagaacag aaaactagag atgaagtttg    720

ggaaaaggtc aagaaagtaa ataatgcttc tagaagacac aaaaagaaaa atgaaatggt   780

aatgttggga aagttttaat acattttgcc ctaaggaaaa aaactacttg ttgaaattct   840

acttaagact ggaccttttc tctaaaaatt gtgcttgatg tgaattaaag caacacaggg   900

aaatttatgg gctccttcta agttctaccc aactcaccgc aaaactgttc ctagtaggtg   960

tggtatactc tttcagattc tttgtgtgta tgtatatgtg tgtgtgtgtg tgtgtttgta   1020

tgtgtacagt ctatatacat atgtgtacct acatgtgtgt atatataaat atatatttac   1080

ctggatgaaa tagcatatta tagaatattc ttttttcttt aaatatatat gtgcatacat   1140

atgtatatgc acatatatac ataaatgtag atatagctag gtaggcattc atgtgaaaca   1200

aagaagccta ttacttttta atggttgcat gatattccat cataggagta tagtacaact   1260

tatgtaacac acatttggct tgttgtaaaa ttttggtatt aataaaatag cacatatcat   1320

gcaaagacac ccttgcatag gtctattcat tctttgattt ttaccttagg acaaaattta   1380

aaagtagaat ttctgggtca agcagtatgc tcatttaaaa tgtcattgca tatttccaaa   1440

ttgtcctcca gaaaagtagt aacagtaaca attgatggac tgcgtgtttt ctaaaacttg   1500

catttttttc cttattggtg aggtttggca ttttccatat gtttattggc attttaattt   1560

tttttggttc atgtctttta ttcccttcct gcaaatttgt ggtgtgtctc aactttattt   1620

atactctcat tttcataatt ttctaaagga atttgacttt aaaaaaataa gacagccaat   1680

gctttggttt aatttcattg ctgctttttg aagtgactgc tgtgttttta tatactttta   1740

tattttgttg ttttagcaaa ttcttctata ttataattgt gtatgctgga acaaaaagtt   1800

atatttctta atctagataa aatatttcaa gatgttgtaa ttacagtccc ctctaaaatc   1860

atataaatag acgcatagct gtgtgatttg taattagtta tgtccattga tagatcc      1917

<210>67

<211>26

<212>DNA

<213>Artificial

<220>

<223>oligo for making linker containing MCSII of pd2EGFP-link

<400>67

gtacggatat cagatcttta attaag                                         26

<210>68

<211>24

<212>DNA

<213>Artificial

<220>

<223>oligo for making linker containing MCSII of pd2EGFP-link

<400>68

gtaccttaat taaagatctg atat                                           24

<210>69

<211>52

<212>DNA

<213>Artificial

<220>

<223>primer for amplification of 0.37 kb from pd2E6FP

<400>69

gatcagatct ggcgcgccat ttaaatcgtc tcgcgcgttt cggtgatgac gg            52

<210>70

<211>41

<212>DNA

<213>Artificial

<220>

<223>primer for amplification of 0.37 kb from pd2EGFP

<400>70

aggcggatcc gaatgtattt agaaaaataa acaaataggg g                           41

<210>71

<211>36

<212>DNA

<213>Artificial

<220>

<223>primer for amplifying zeocin resistance gene 0RF

<400>71

gatcggatcc ttcgaaatgg ccaagttgac cagtgc                                 36

<210>72

<211>32

<212>DNA

<213>Artificial

<220>

<223>primer for amplifying zeocin resistance gene ORF

<400>72

aggcgcggcc gcaattctca gtcctgctcc tc                                     32

<210>73

<211>40

<212>DNA

<213>Artificial

<220>

<223>primer for amplifying d2EGFP ORF

<400>73

gatcgaattc tcgcgaatgg tgagcaagca gatcctgaag                             40

<210>74

<211>52

<212>DNA

<213>Artificial

<220>

<223>primer for amplifying d2EGFP ORF

<400>74

aggcgaattc accggtgttt aaacttacac ccactcgtgc aggctgccca gg               52

<210>75

<211>41

<212>DNA

<213>Artificial

<220>

<223>primer for amplifying d2EGFP gene

<400>75

ttggttggtc atgaatggtg agcaagggcg aggagctgtt c                           41

<210>76

<211>36

<212>DNA

<213>Artificial

<220>

<223>primer for amplifying d2EGFP gene

<400>76

attctctaga ctacacattg atcctagcag aagcac                                 36

<210>77

<211>42

<212>DNA

<213>Artificial

<220>

<223>oligo for preparing linker for creating MCS in pGL3-promoter-GFP

<400>77

cgatatcttg gagatctact agtggcgcgc cttgggctag ct                          42

<210>78

<211>50

<212>DNA

<213>Artificial

<220>

<223>oligo for preparing linker for creating MCS in pGL3-promoter-GFP

<400>78

gatcagctag cccaaggcgc gccactagta gatctccaag atatcgagct                  50

<210>79

<211>40

<212>DNA

<213>Artificial

<220>

<223>primer for amplification of EF-lalfa promoter

<400>9

gatcggcgcg ccatttaaat ccgaaaagtg ccacctgacg                             40

<210>80

<211>34

<212>DNA

<213>Artificial

<220>

<223>primer for amplification of EF-lalfa promoter

<400>80

aggcgggacc ccctcacgac acctgaaatg gaag                                   34

<210>81

<211>51

<212>DNA

<213>Artificial

<220>

<223>primer for amplification of SV40 promoter

<400>81

ttggttgggg cgcgccgcag caccatggcc tgaaataacc tctgaaagag g                51

<210>82

<211>55

<212>DNA

<213>Artificial

<220>

<223>primer for amplification of SV40 promoter

<400>82

ttggttggga gctcaagctt tttgcaaaag cctaggcctc caaaaaagcc tcctc          55

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈