首页 / 专利库 / 遗传学 / 哺乳动物基因 / 与感染相关的哺乳动物基因

与感染相关的哺乳动物基因

阅读:145发布:2020-05-11

专利汇可以提供与感染相关的哺乳动物基因专利检索,专利查询,专利分析的服务。并且本 发明 涉及与与感染相关的或以其它方式与病原体的生命周期相关的核酸序列以及由这些序列编码的细胞 蛋白质 。本发明还涉及与感染相关的或以其它方式与病原体的生命周期相关的核酸序列的调节剂以及由这些序列编码的细胞蛋白质的调节剂。,下面是与感染相关的哺乳动物基因专利的具体信息内容。

1.一种鉴定抗病毒药剂的方法,包括:
a)将所述药剂给予含有表1所列细胞基因的细胞;并
b)检测由细胞基因产生的基因产物的平和/或活性,该基因产物 和/或基因产物活性的减少或消失表明该化合物具有抗病毒活性。
2.一种鉴定抗病毒药剂的方法,包括:
a)将所述药剂给予含有表1所列细胞基因的细胞;
b)使细胞和病毒接触
c)检测病毒感染的水平;并
d)将病毒感染水平与表1中基因的表达水平或表1中基因编码的 蛋白质的活性之间相关联,病毒感染的减轻或消失与基因表达和/或活 性的减少或消失相关就表明所述药剂为抗病毒药剂。
3.一种鉴定抗病毒药剂的方法,包括:
a)将所述药剂给予含有表1所列细胞基因的细胞;
b)使细胞和病毒接触;
c)检测病毒感染的水平;并
d)将病毒感染水平与表1中基因的表达水平或表1中基因编码的 蛋白质的活性之间相关联,病毒感染的减轻或消失与基因表达和/或活 性的减少或消失相关就表明所述药剂为抗病毒药剂。
4.一种除人外的转基因哺乳动物,具有表1所列一种或多种基因 的功能性缺失,其中所述哺乳动物对病原体感染敏感性降低。
5.权利要求4的转基因哺乳动物,其中所述病原体为病毒。
6.权利要求4的转基因哺乳动物,其中所述病原体为细菌。
7.权利要求4的转基因哺乳动物,其中所述病原体为真菌
8.一种细胞,具有发生了改变或被破坏的表1所列的基因,所述细 胞对病原体感染的敏感性降低。
9.权利要求8的细胞,其中所述病原体为病毒。
10.权利要求8的细胞,其中所述病原体为细菌。
11.权利要求8的细胞,其中所述病原体为真菌。
12.权利要求8的细胞,其中所述细胞为造血细胞。
13.一种具有发生了改变或被破坏的表1所列的基因的细胞群,所述 细胞群对病原体感染的敏感性降低。
14.一种抑制细胞感染的方法,包括抑制表1所列基因或基因产物的 表达或活性。
15.权利要求14的方法,其中所述感染为病毒感染。
16.权利要求14的方法,其中所述感染为细菌感染。
17.权利要求14的方法,其中所述感染为真菌感染。
18.一种降低或抑制受试者体内病毒感染的方法,包括给予受试者一 定量的抑制表1中基因或基因产物的表达或活性的组合物。
19.权利要求18的方法,其中所述感染为病毒感染。
20.权利要求18的方法,其中所述感染为细菌感染。
21.权利要求18的方法,其中所述感染为真菌感染。
22.一种除人外的动物群,具有表1所列一种或多种基因的变体形 式,其中所述群不易被感染。
23.权利要求22的群,其中除人外的动物来自禽类。
24.权利要求23的群,其中所述群为鸡群。
25.权利要求23的群,其中所述鸡群对禽流感不易感。
26.由权利要求1的方法鉴定得到的抗病毒药剂。
27.由权利要求1的方法鉴定得到的抗病毒药剂。
28.权利要求14的方法,其中表1所列基因或基因产物的表达或 活性通过将细胞与化学品、小分子、药物、蛋白质、cDNA、抗体、 morpholino、三链螺旋分子、siRNA、shRNA、反义RNA或核酶相接触来 抑制。
29.权利要求18的方法,其中所述组合物为化学品、小分子、药 物、蛋白质、cDNA、抗体、morpholino、三链螺旋分子、siRNA、shRNA、 反义RNA或核酶。

说明书全文

技术领域

发明涉及与感染相关的或以其它方式与一种或多种病原体例如病 毒、细菌、真菌或寄生物的生命周期相关的核酸序列以及由这些序列编 码的细胞蛋白质。本发明还涉及与感染相关的或以其它方式与病原体的 生命周期相关的核酸序列以及由这些序列编码的细胞蛋白质的调节剂。

背景技术

病毒感染的常规治疗方法包括使用针对特定病毒来源的蛋白质例如 HIV蛋白酶、反转录酶或重组(克隆)的免疫调节物(来自宿主)例如干 扰素的药物。但是,现有方法存在一些局限和缺点,其中包括病毒的高 突变率使抗病毒药物制剂失效。对于免疫调节物,效果有限、限制性的 副作用、缺乏特异性均使得这些药剂的广泛应用受到局限。同时,采用 现有抗病毒药物和免疫调节物的成功率也不尽如人意。
本发明着眼于这样一些基因,它们是病毒复制所必需的基因,但在 它们的一个或一对等位基因被破坏时对细胞存活并不产生致命的影响。 其发生可伴随剂量效应,其中将一个等位基因敲除可赋予细胞病毒抗性 表型。作为干预疗法的靶标,对这些细胞基因产物的抑制不太可能有很 严重的毒副作用,所述细胞基因产物包括蛋白质、部分蛋白质(包括但 不限于糖基化、脂质修饰物[十四烷基化等]的修饰酶)、脂质、转录元 件和RNA调节分子,并且病毒突变也不太可能克服“阻断”而成功复制。
通过处理病毒生长所必需的细胞基因,本发明相对于先前尝试的针 对病毒感染的干预疗法有明显的改进。因此,通过提供抑制病毒感染所 必需的细胞基因从而处理病毒的方法,本发明还提供了一种新的干预病 毒感染的治疗方法。对这些细胞基因的抑制还可用于治疗其它病原体例 如细菌、真菌和寄生物所致的感染。由于这些基因对细胞存活是非必需 的,因此,这些治疗方法可用于受试者,且不会对受试者造成在使用先 前方法时发现的那些严重的有害作用。

发明内容

本发明提供了与感染相关的或以其它方式与一种或多种病原体例如 病毒、细菌、真菌或寄生物的生命周期相关的核酸序列以及由这些序列 编码的细胞蛋白质。本发明还提供了鉴定一种调节剂的方法,所述调节 剂为与感染相关的或以其它方式与病原体的生命周期相关的核酸序列的 调节剂以及由这些序列编码的细胞蛋白质的调节剂。还提供了与感染相 关或以其它方式与病原体的生命周期相关的核酸序列的调节剂以及由这 些序列编码的细胞蛋白质的调节剂。
附图说明
图1显示对1型呼肠孤病毒感染有抗性的克隆RIE-1细胞的表型特 性的表征。(A)如前人所述[3]针对呼肠孤病毒抗原对细胞进行染色。如 免疫组织化学检测所得,只有PI细胞含有呼肠孤病毒抗原(黑孔)。上 方孔为来自针对呼肠孤病毒抗性所筛选的两组RIE-1突变型细胞系的克 隆突变型RIE-1细胞。下方孔,PI RIE-1(左)以及未感染的野生型RIE-1 (右)。(B)将在1ml完全培养基中给养的呼肠孤病毒易感L细胞单层用 来检测在由突变型细胞(上方两孔)、PI RIE-1细胞(左下孔)或未感染 亲代RIE-1细胞(右下孔)获得的100μl裂解物中是否存在病毒。请 注意,仅有暴露于PI RIE-1细胞的裂解物中的L细胞单层在暴露一周内 裂解(龙胆紫染色)。
图2显示RIE-1突变型细胞抗呼肠孤病毒所致溶解性感染。各列包 括未筛选的RIE-1细胞文库、RIE-140℃和代表性抗呼肠孤病毒的突变 型细胞克隆。制备了一系列二倍稀释的呼肠孤病毒,最高滴度在最上行, MOI=1×104。在感染后3至7天的突变细胞中观察到对1型呼肠孤病毒感 染的抗性。标注为“C”的最下行的细胞为未经感染的细胞,用作细胞成 活和增殖的对照。感染后4天用龙胆紫对细胞染色。澄清的孔表明病 毒感染之后细胞死亡。
图3表示呼肠孤病毒的生命周期模型以及基于本申请中通过插入诱 变识别的细胞基因的功能所提出的检查点。病毒生命周期开始于(顶部, 顺时针方向)病毒与细胞表面受体结合并被胞吞进入早期内体。然后这 些内体与膜联蛋白-II(Anax2)结合[85]并与含有新合成的、来自高尔 基体的溶酶体酶的膜联蛋白-II-相关囊泡融合[86],它随后再与溶酶体 融合。空泡H+-ATP酶将溶酶体酸化,使得酸依赖性蛋白酶能够消化病毒 颗粒的外层衣壳并将其激活[87]。然后这些被激活的颗粒穿过溶酶体膜 并开始mRNA的转录。当囊泡携带其新合成的物质穿过高尔基体叠层时, 高尔基体蛋白gm130(Golga2)被认为可介导囊泡停靠[88,89]。N- 乙酰葡糖基转移酶I(Mgat I)可启动细胞表面蛋白质(例如受体)的 糖基化,并可能通过亲缘识别在帮助维持溶酶体酶的正确分类中起重要 作用[90-94]。Igf2r使得与来自高尔基体的溶酶体结合的酶来回穿梭[95] 并将组织蛋白酶转移至溶酶体。Igf2过表达可改变igf2r结合物质向溶 酶体的送递(Sheng I,Organ EL,Hao C,Wells,KS,Ruley HE,Rubin DH.2004.Mutations in the IGF-II pathway that confer resistance to lytic reovirus infect ion.BMC Cell Biology,5:32(27 August 2004))。周期蛋白和α-原肌球蛋白彼此特异性结合,并且已知钙周期 蛋白可结合Anxa2[16,20]。因此,它们可能参与内体融合。Eif3s10特 异性结合病毒信息来开始进行其优势翻译。DnaJa1蛋白有助于具有伴侣 功能的病毒蛋白的正确折叠[96]。但是,DnaJal蛋白和Eif3分别可在病 毒运输或细胞凋亡中起其它作用。最终,在形成新的病毒体的结晶样阵 列、出现细胞溶解并且病毒被释放时完成形态发生。由突变基因编码的 很多细胞蛋白质对内体运输或溶酶体融合有着直接或间接作用,因此可 在早期分解或将具有转录活性病毒体送递至合适细胞位置的过程中发挥 作用。

具体实施方式

通过参照下面对本发明优选的实施方案以及本文中的实施例所进行 的详细描述,可更容易地理解本发明。
在公开和描述本发明的化合物、组合物、物品、设备和/或方法前, 应该理解的是,本发明并不限于特定的核酸、特定的多肽,或者具体的 方法,因为它们理所当然地可有所改变。还应该理解的是,本文所使用 的术语仅仅是为了描述具体的实施方案,无意于限定。
除非上下文另外明确指明,说明书和随后的权利要求书中所使用的 单数形式“一种”、“一个”和“该”包括复数指代形式。除非上下文另 外明确指明,术语“或者”指所述备选元素中的单个元素或者两个或多 个元素的组合。本文所使用的“包括”意思是“包含”。因此,“包括A 或B”意思是“包含A、B或A和B”,且不排除其它元素。
范围在本文中表示为从“约”一个具体数值,和/或到“约”另一具 体数值。这样表示范围时,另一实施方案则包括从一个具体数值和/或到 另一具体数值。同样,当通过在前面使用“约”将数值表示为近似数时, 应理解的是具体数值形成了另一实施方案。还应理解的是,每个范围的 端点在与另一端点相关时以及独立于另一端点时都是有意义的。
“任选的”或“任选地”意味着随后描述的事件或情况可能出现, 也可能不出现,并且意味着该描述包括所述事件或情况出现的情形以及 不出现的情形。例如,短语“任选在处理前获得”意味着可在处理前、 也可处理后获得,或者根本不处理即获得。
全文所使用的“受试者”意味着个体。优选地,所述受试者为哺乳 动物例如灵长类,更优选为人类。术语“受试者”包括驯养动物例如猫、 狗等,家畜(例如、猪、绵羊、山羊等),实验动物(例如小鼠、 兔、大鼠、沙土鼠、豚鼠等)以及禽类(例如鸡、火鸡、鸭、雉、家鸽、 野鸽、鹦鹉、凤头鹦鹉、鹅等)。本发明的受试者还可包括但不限于鱼类、 两栖类和爬行类。
本发明提供了几种细胞基因,它们是病毒在细胞中生长所必需的, 但并不是细胞存活所必需的。本文所使用的“细胞存活非必需的”细胞 基因意味着这样一种基因,它的一个或一对等位基因被破坏后细胞还可 存活至少一段时间,而这种破坏使得细胞中的病毒复制被减少或抑制。 这种减少可用于预防治疗用途或者用于研究。“病毒生长必需的”基因 意味着该基因的基因产物,不管是蛋白质还是RNA,无论分泌与否,均以 某种直接或间接方式成为病毒生长所必需的,因此,该基因产物(即功 能上可用的基因产物)不存在时,至少一些含有病毒的细胞会死亡。全 文所使用的“基因产物”为基因表达所得到的RNA或蛋白质。
与病毒感染相关的这些细胞基因或宿主核酸序列可使用基因捕获方 法鉴定。这些基因捕获方法在实施例以及美国专利6,448,000和 6,777,177中得到阐述。美国专利6,448,000和6,777,177均通过援引全 文纳入本文。例如,本文所阐述的宿主核酸序列可通过鉴定细胞中病毒 生长所必需的、而细胞存活非必需的细胞基因的方法得到鉴定,所述方 法包括:(a)将编码缺乏功能性启动子的选择性标记基因的载体转入细 胞培养物中,(b)筛选出表达标记基因的细胞,(c)用病毒感染细胞培 养物,以及(d)从存活细胞中分离其中插入了标记基因的细胞基因,由 此鉴定细胞中病毒生长所必需的、而细胞存活非必需的基因。宿主核酸 序列还可通过鉴定细胞中病毒生长所必需的、而细胞存活非必需的细胞 基因的方法得到鉴定,所述方法包括(a)将编码缺乏功能性启动子的选 择性标记基因的载体转入在含血清培养基中的细胞培养物中,(b)筛选 出表达标记基因的细胞,(c)将血清从培养基中除去,(d)用病毒感染 细胞培养物,以及(e)从存活细胞中分离其中插入了标记基因的细胞基 因,由此鉴定细胞中病毒生长所必需的、而细胞存活非必需的基因。
对这些宿主序列及其编码的蛋白质进行鉴定,可鉴定出可被靶向而 用于调节(例如减少基因表达和/或减小基因产物的活性,或者增加基因 表达和/或增大基因产物的活性)和/或治疗性干预的序列。
表1给出了与病毒感染相关的或以其它方式与病毒的生命周期相关 的宿主核酸序列。例如,这些核酸及其编码的蛋白质可参与到病毒生命 周期的全部阶段,包括但不限于病毒附着至细胞受体、病毒感染、病毒 进入、内化、病毒分解、病毒复制、病毒序列的基因组整合、mRNA的翻 译、病毒颗粒的组装、细胞裂解以及病毒脱离细胞。
本文所使用的基因是在调节序列如启动子或操纵基因等的操控下编 码多肽的核酸序列。该基因的编码序列为在合适调节序列的操控下转录 并翻译成为多肽(体内、体外或原位)的部分。编码序列的边界可通过5’ (氨基)端的起始密码子和3’(羧基)端的终止密码子确定。若欲使该 编码序列在真核细胞中表达,则可在编码序列的3’加上多腺苷酸化信号 和转录终止序列。
转录和翻译控制序列包括但不限于提供的用于表达编码序列(例如 在宿主细胞中表达)的DNA调节序列,例如启动子、增强子和终止子。 多腺苷酸化信号是示例性真核生物控制序列。启动子是能结合RNA聚合 酶并能启动下游(3’方向)编码序列转录的调节区域。另外,基因可包 括在分泌于或表达于细胞表面的蛋白质的编码序列起始处的信号序列。 该序列可编码信号肽(在成熟多肽的N端),它可指导宿主细胞转移多肽。
表1(第2列)还提供了由表1所列基因编码的蛋白质。在几种情况 下,用于捕获基因的基因捕获载体破坏了两个基因,其中一个基因的破 坏是由于载体占据了转录(transcribe off)了负链的基因中的位置。 这种事件的一个实例是相同载体对编码aprataxin的基因和编码DnaJ (Hsp40)同系物亚家族A成员1的基因的破坏。
表1还提供了所述基因在大鼠和人基因组(分别为第3列和第4列) 染色体上的位置。因此,本发明鉴定了与病毒感染相关的基因的基因组 基因座。通过鉴定基因及其在基因组中的位置,本发明提供了作为治疗 例如抗病毒治疗、抗细菌治疗、抗真菌治疗和抗寄生物治疗等等的靶标 的基因及其产物。
表1还提供了大鼠mRNA序列的GeneBank编号(第5列)、人mRNA序 列的GeneBank编号(第6列)以及人蛋白质序列的GeneBank编号(第7 列)。本文提及的以GeneBank编号提供的核酸序列和蛋白质序列全部通 过援引纳入本文。本领域的技术人员应知晓本文所述以GeneBank编号提 供的核苷酸序列可容易从美国国立医学图书馆的国立生物技术信息中心 (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=nucleotide) 获得。同样,本文所述蛋白质序列可容易从美国国立医学图书馆的国立 生物技术信息中心
(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=protein)获 得。本文提及的以GeneBank编号提供的核酸序列和蛋白质序列可通过援 引将其全部内容纳入本文。
表1还提供了插入基因捕获载体后获得的大鼠基因部分序列的 GeneBank编号(第9列)。简而言之,通过形成基因捕获文库可以分离这 些基因,基因捕获文库可通过以下方法形成:用反转录病毒基因捕获载 体感染细胞,然后选出其中发生基因捕获事件的细胞(即其中插入了载 体,藉此插入没有启动子的标记基因,由此细胞启动子启动标记基因的 转录,即插入至功能基因)。然后,使用特异性针对反转录病毒基因捕获 载体的探针可将其中插入反转录病毒基因捕获载体的基因从集落中分 离。因此,通过这种方法分离得到的核酸为分离的基因部分。然后,通 过序列比较和其它生物信息学方法,将这些部分用于识别每个基因的完 整序列。
还提供了大鼠基因和人基因(分别为第10列和第11列)的Entrez 基因编号。以表1所列Entrez基因编号提供的信息也通过援引将其全部 内容纳入本文。本领域的技术人员可容易地从美国国立医学图书馆的国 立生物技术信息中心
(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gene)获得该 信息。通过进入Entfez基因系统,本领域的技术人员可容易获得表1 所列每个基因的其它信息,例如基因的基因组位置、基因编码蛋白质的 性质概述、基因的同系物信息以及多个参比序列例如每种基因的基因组 序列、mRNA序列和蛋白质序列等。因此,除了表1中以GeneBank编号所 列出的序列外,本领域的技术人员还可容易通过获取以Entrez基因编号 提供的每种基因的其它信息来获得其它序列例如基因组序列、mRNA序列 和蛋白质序列。因此,可以从本文所阐述的Entrez基因编号容易地获得 的所有信息也通过援引将其全部内容纳入本文。
表2提供了根据基因在细胞中的作用对表1所述多种基因的分类。 调节序列(如转录因子)的几个实例提供于表2(例如Brd2、Brd3、Ctcf、 E2f2、Gtf2el、Hnrpl、Hoxcl3、Hpl-bp74、Id3、Znf207和Zfp7)。因 此,这些转录因子可控制多基因途径。在某些情况下,转录因子的破坏 对病毒生长有着直接影响。其它一些情况下,转录因子的破坏可通过影 响受其调控的一种或多种基因的转录或翻译来影响病毒生长。因此,本 发明还提供了受控于表1和表2所述转录因子的基因以作为治疗例如抗 病毒治疗、抗细菌治疗、抗寄生物治疗和抗真菌治疗的靶标。表2还提 供了参与其它途径例如膜泡运输、遍在蛋白化、细胞凋亡、代谢等的基 因的实例。因此,本申请还提供了这些途径中的其它基因作为治疗性干 预(治疗方法)的靶标,所述其它基因在表2所述这些途径的基因上游 或下游。例如,产生与遍在蛋白化途径中的上游或下游Ubel C相互作用 的基因产物的基因被认为是针对细胞内病原体的治疗靶标。例如,它可 为调控Ubelc表达的或与Ubelc结合的另一种蛋白质的表达的转录因子。 这些实例仅为示例性的,因为这可应用至本文所述全部基因以及这些基 因所参与的细胞途径。
提及表1中的一种或多种基因时,所述基因包括可起表1所列基因 或核酸作用的来自任何生物的任何基因、核酸、cDNA或RNA。提及表1 中的一种或多种蛋白质时,所述蛋白质包括可起表1所列蛋白质作用的 来自任何生物的任何蛋白质或其片段。例如,术语ANXA1(膜联蛋白1) 包括可起ANXA1基因或ANXA1核酸作用的来自任何生物的任何ANXA1基 因、核酸、cDNA或RNA。术语ANXA1还包括可起ANXA1蛋白质作用的来 自任何生物的任何蛋白质。
本文所使用的术语“核酸”指单链或多链分子,它可为DNA或RNA 或其任意组合,包括这些核酸的修饰物在内。核酸可代表编码链或其互 补链,或其任意组合。核酸序列可与本文所讨论的任何部分的天然存在 序列相同,或者包含编码与存在于天然存在序列中的相同氨基酸的备选 密码子。还可对这些核酸的典型结构进行修饰。所述修饰包括但不限于 核酸甲基化,用硫(产生硫代磷酸核苷酸)、硒(产生硒代磷酸脱氧 核苷酸(phosphorselenoate deoxynucleotide))或甲基(产生膦酸甲 酯脱氧核苷酸)取代磷酸盐残基的非桥连氧,AT富含区域的AT含量减少, 或者表达系统利用非偏好密码子的用法替换为表达系统利用偏好密码子 的用法。核酸可直接克隆至合适的载体内,或者如若需要,可对核酸进 行修饰以促进随后的克隆步骤。这种修饰步骤是常规的,其中的一个实 例是将含有限制酶切位点的寡核苷酸接头加至核酸末端。常规方法叙述 于Sambrook et a1.(2001)Molecular Cloning-A Laboratory Manua1 (3rd ed.)Vol.1-3,Cold Spring Harbor Laboratory,Cold Spring Harbor Press,NY,(Sambrook)。
只要获得核酸序列,则可通过本领域所熟知的技术在任何特定氨基 酸位置修饰或改变编码特定氨基酸的序列。例如,可设计PCR引物,该 引物跨越一个或多个氨基酸位置并且可将任一氨基酸置换为另一氨基 酸。或者,本领域的技术人员可通过点突变技术在具体核酸序列的任何 位点引入特定突变。常规方法叙述于Smith,M.″In vitro mutagenesis″ Ann.Rev.Gen.,19:423-462(1985)和Zoller,MJ.″New molecular biology methods for protein engineering″Curr.Opin.Struct.Biol., 1:605-610(1991),这两篇文献就其方法全文纳入本文。这些技术可用 来在不改变其编码的氨基酸序列的前提下改变编码序列。
本文考虑到的序列包括保留了具有起与病毒感染相关的细胞核酸或 蛋白质作用的能力的全长野生型(或天然)序列以及等位基因变体、变 体、片段、同系物或融合序列。在某些实例中,蛋白或核酸序列与表1 所述天然序列具有至少70%的序列同一性,例如具有至少75%、80%、85%、 90%、95%或98%的序列同一性。在其它一些实施例中,与病毒感染相关的 核酸序列具有可与表1所述序列杂交并保持表1所述序列的活性的序列。 例如,本发明考虑到了与表1所述ANXA1核酸序列(例如GeneBank编号 为NM_000700的核酸序列)杂交并编码保留ANXA1活性的蛋白质的核酸。 这类序列包括表1所述基因的基因组序列。上述ANXA1的实例仅为示例 性的,而不应将这些实例限定为ANXA1,因为这些实例可应用至表1所列 每种核酸和蛋白质。
除非另外指明,任何提及的核酸分子包括核酸的反向互补分子。除 本文要求为单链的(例如ssRNA分子)情况以外,仅书写表示为单链的 任何核酸包括相应双链核酸的两条链。例如,表示的dsDNA的正链还包 括该dsDNA的互补负链。另外,所提及的编码特定蛋白质或其片段的核 酸分子包括有义链及其反向互补链。还考虑了表1以及整个说明书中所 述的核酸片段。这些片段可用作引物和探针来扩增或检测表1所述任何 核酸或基因。
产生具体严格程度的杂交条件可根据杂交方法的性质以及杂交核酸 序列的组成和长度有所变化。一般而言,杂交温度以及杂交缓冲液的离 子强度(如Na+浓度)将决定杂交的严格性。关于获得具体严格程度的杂 交条件的计算方法叙述于Sambrook et al,(1989)Molecular Cloning, second edition,Cold Spring Harbor Laboratory,Plainview,NY(第 9和11章)。下面为一系列示例性而非限制性的杂交条件:
极高严格度(检测具有90%同一性的序列)
杂交:5x SSC,65℃,16小时
洗涤两次:2x SSC,室温(RT),每次15分钟
洗涤两次:0.5x SSC,65℃,每次20分钟
高严格度(检测具有80%或更高同一性的序列)
杂交:5x-6x SSC,65℃-70℃,16-20小时
洗涤两次:2x SSC,RT,每次5-20分钟
洗涤两次:Ix SSC,55℃-70℃,每次30分钟
低严格度(检测同一性高于50%的序列)
杂交:6x SSC,RT至55℃,16-20小时
洗涤至少两次:2x-3x SSC,RT至55℃,每次20-30分钟。
还提供了一种载体,它包含本发明的核酸。该载体可指导本文所描 述的任何蛋白质或多肽在体内或体外的合成。考虑了该载体具有指导和 调节插入核酸转录的必需功能元件。这些功能元件包括但不限于启动子、 启动子上游或下游区域如可调节启动子转录活性的增强子、复制起点、 有助于克隆与启动子相邻的插入物的合适限制性酶切位点、用来筛选含 有载体的细胞或含有插入物的载体的抗生素抗性基因或其它标记、RNA 剪接点、转录终止区域或可用来帮助插入基因或杂合基因表达的任何其 它区域。(通常参见Sambrook et al.)。载体例如可为质粒。载体可含有 具有潮霉素抗性、氨苄青霉素抗性、艮他霉素抗性、新霉素抗性的基因 或其它适合用作筛选标记的基因或表型,或者具有甲氨蝶呤抗性用以基 因扩增的基因或表型。
本领域普通技术人员已知有很多其它大肠埃希杆菌(Escherichia coli)表达载体可用于表达核酸插入物。其它适用的微生物宿主包括芽 胞杆菌例如枯草芽孢杆菌(Bacillus subtilis)以及其它肠杆菌科例如 沙氏菌种、沙雷氏菌种以及各种假单胞菌种。也可制备这些原核宿主 中的表达载体,这些载体通常含有与宿主细胞相容的表达调控序列(如 复制起点)。另外,可存在任何数目的多种熟知启动子,例如乳糖启动子 系统、色氨酸(Trp)启动子系统、β-内酰胺酶启动子系统或来自λ噬 菌体的启动子系统。启动子通常可控制表达,任选与操纵基因序列一起 控制表达,并且具有核糖体结合位点序列,用来例如启动和完成转录和 翻译。如若必要,可通过在5’端插入Met密码子并使其与下游核酸序列 插入物共同构成一个框架来提供氨基末端甲硫氨酸。另外,可使用标准 寡核苷酸突变法除去核酸插入物的羧基末端延伸部分。此外,还可制备 核酸修饰物来提高氨基末端的同质性。
另外可采用酵母表达。本发明提供了编码本发明多肽的核酸,其中 核酸可由酵母细胞表达。更具体而言,核酸可由毕赤酵母(Pichia pastoris)或酿酒酵母(S.cerevisiae)表达。包括例如酿酒酵母 (Saccharomyces cerevisiae)和毕赤酵母在内的酵母表达系统有几点优 点。首先,有证据表明由酵母分泌系统产生的蛋白质可呈现正确的二硫 键配对。其次,使用酵母表达系统可进行高效大规模生产。酿酒酵母前 体α交配因子原前导区(pre-pro-alpha mating factor leader region, 由MFα-1基因编码)可用来指导从酵母中分泌蛋白质(Brake,et al.)。 前体α交配因子原的前导区具有信号肽和前区段(pro-segment),所述 前区段包括由KEX2基因编码的酵母蛋白酶的识别序列,该酵母蛋白酶可 在Lys-Arg二肽切割信号序列的羧基端切割前体蛋白质。核酸编码序列 可与前体α交配因子原前导区融合成同一框架。该构建体受控于较强的 转录启动子,例如醇脱氢酶I启动子、醇氧化酶I启动子、糖酵解启动 子或半乳糖利用途径的启动子。核酸编码序列之后是翻译终止密码子, 翻译终止密码子之后是转录终止信号。或者,核酸编码序列可融合至另 一蛋白质编码序列例如Sj26或β-半乳糖苷酶,用于帮助通过亲和色谱 法对融合蛋白进行纯化。用来分离融合蛋白组分的蛋白酶切割位点的插 入可应用到用于在酵母中表达的构建体。在杆状病毒系统中还可实现重 组蛋白质的高效表达和翻译后糖基化。
哺乳动物细胞可使得蛋白质在有利于重要的翻译后修饰的环境中表 达,所述重要的翻译后修饰例如为折叠和半胱氨酸配对、复杂化合 物结构的引入以及活性蛋白质的分泌。用于在哺乳动物细胞中表达活性 蛋白质的载体的特征在于:在较强的病毒启动子和多腺苷酸化信号之间 插入了蛋白质编码序列。载体可含有具有潮霉素抗性、艮他霉素或G418 抗性的基因或其它适合用作筛选标记的基因或表型,或者具有甲氨蝶呤 抗性用以基因扩增的基因或表型。可使用甲氨喋呤抗性编码载体将嵌合 蛋白质编码序列引入中国仓鼠卵巢(CHO)细胞系,或者使用合适的选择 标记将其引入其它细胞系。转化细胞中是否存在载体DNA可通过 Southern印迹分析进行确证。对应插入物编码序列的RNA的产生可通过 Northern印迹分析进行确证。本领域中已经开发了很多能分泌完整人蛋 白质的其它合适的宿主细胞系,这些宿主细胞系包括CHO细胞系、Hela 细胞、骨髓瘤细胞系、Jurkat细胞等。这些细胞的表达载体可包括表达 调控序列如复制起点、启动子、增强子等,以及必需的信息加工位点如 核糖体结合位点、RNA剪接位点、多腺苷酸化位点等,以及转录终止子序 列。优选的表达调控序列为来源于免疫球蛋白基因、SV40、腺病毒、牛 乳头状瘤病毒等的启动子。
本文所述表达载体还包括受控于诱导型启动子如四环素诱导型启动 子或糖皮质激素诱导型启动子等的本发明核酸。本发明的核酸还可受控 于组织特异性启动子,以促进核酸在特定细胞、组织或器官中表达。还 考虑了任何可调节的启动子如金属硫蛋白启动子、热休克启动子和其它 可调节的启动子,其中很多实例为本领域熟知。另外,还使用了Cre-loxP 诱导性系统以及F1p重组酶诱导性启动子系统,两者均为本领域已知。
还可使用在哺乳动物细胞中表达基因或核酸的其它载体,它们与所 开发的用于表达人γ干扰素、组织纤维蛋白溶酶原激活剂、凝固因子VIII、 乙型肝炎病毒表面抗原、蛋白酶Nexinl和嗜酸性粒细胞主要性蛋白的 载体相似。另外,载体可包括可用于在哺乳动物细胞(如COS-7)中表达 插入核酸的CMV启动子序列和多腺苷酸化信号。
昆虫细胞也可表达哺乳动物蛋白质。用杆状病毒载体在昆虫细胞中 产生的重组蛋白质会经历翻译后修饰,该修饰与野生型蛋白质的修饰相 似。简而言之,用于在昆虫细胞中表达活性蛋白质的杆状病毒载体的特 征在于:在多体蛋白(主要包含体蛋白(occlusion protein))编码 基因的苜蓿纹夜蛾核型多角体病毒(Autographica californica nuclear polyhedrosis virus,AcNPV)启动子下游插入了蛋白质编码序 列。用病毒和质粒DNA的混合物转染培养后的昆虫细胞例如草地贪夜蛾 (Spodoptera frugiperda)细胞系,然后将病毒子代涂板。多角体蛋白 基因的缺失或插入失活可导致产生包含体阴性病毒,该病毒形成的噬斑 显著不同于野生型包含体阳性病毒所形成的噬斑。这些特征性噬斑形态 学使得可对重组病毒进行目测筛选,在所述重组病毒中,AcNPV基因已由 所选择的杂合基因所替换。
本发明还提供了含有所考虑的核酸的载体,所述载体在适于表达该 核酸的宿主中。宿主细胞可为原核细胞,包括例如细菌细胞。更具体而 言,细菌细胞可为大肠埃希氏菌细胞。或者,细胞可为真核细胞,包括 例如中国仓鼠卵巢(CHO)细胞、COS-7细胞、HELA细胞、禽类细胞、骨 髓瘤细胞、毕赤酵母细胞或昆虫细胞。例如使用甲氨喋呤抗性编码载体, 可以将本文所述任何多肽的编码序列引入中国仓鼠卵巢(CHO)细胞系, 或者使用合适的筛选标记将其引入其它细胞系。转化细胞中是否存在载 体DNA可通过Southern印迹分析进行确证。对应插入物编码序列的RNA 的产生可通过Northern印迹分析进行确证。已经开发了很多其它合适的 宿主细胞系,这些宿主细胞系包括骨髓瘤细胞系、成纤维细胞系和多种 肿瘤细胞系例如黑素瘤细胞系。用于这些细胞的表达载体可包含表达调 控序列例如复制起点、启动子、增强子,以及必需的信息加工位点如核 糖体结合位点、RNA剪接位点、多腺苷酸化位点,以及转录终止序列。优 选的表达调控序列为来源于免疫球蛋白基因、SV40、腺病毒、牛乳头状 瘤病毒等的启动子。含有目的核酸区段的载体可通过已知方法转入宿主 细胞,这些方法根据细胞宿主的类型有所变化。例如,氯化钙转化方法 通常用于原核细胞,而磷酸钙、DEAE葡聚糖、脂转染胺试剂或脂转染试 剂介导的转染、电穿孔或任何现在已知或待将来鉴定的方法可用于其它 真核细胞宿主。
多肽
本发明提供了分离的多肽,包括表1中以GeneBank编号述及的多肽 或蛋白质序列。本发明还提供了这些多肽的片段,例如膜联蛋白A1蛋白 质的片段、膜联蛋白A2蛋白质的片段、膜联蛋白A3蛋白质的片段等。 这些片段的长度足以用作抗原肽,以形成抗体。本发明还考虑到表1所 述蛋白质的功能性片段,该片段具有该蛋白质的至少一种活性,例如为 病毒感染所必需的、但并非细胞存活所必需的活性。本领域的技术人员 应知晓表1所述多肽具有其它性质。例如,ABCA4为ATP结合盒转运体超 家族的成员。因此,本领域的技术人员可对ABCA4片段用作ATP结合盒 转运体的能力进行评估。若具有ATP结合盒转运体活性,则本领域的技 术人员便可获知ABCA4为ABCA4的功能片段。表1所列多肽的片段及变 体与其各自的GeneBank编号所列的氨基酸序列相比可包括一个或多个保 守氨基酸残基。
“分离的多肽”或“纯化的多肽”指基本不含有在自然环境中或在 培养条件下通常伴随该多肽的物质的多肽。本发明的多肽例如可通过从 可获得的自然来源(例如哺乳动物细胞)来提取获得,通过表达编码多 肽的重组核酸获得(例如在细胞或不含细胞的翻译系统中),或者通过化 学合成多肽获得。另外,可通过切割全长多肽来获得多肽。多肽为天然 存在的较大多肽的片段时,分离的多肽比天然存在的全长多肽短,并且 不包括该天然存在的全长多肽,其中分离的多肽是天然存在的全长多肽 的片段。
使用任何一种本领域普通技术人员已知的多肽化学合成技术可制备 本发明多肽,这些多肽化学合成技术包括溶液法和固相法。生产本发明 多肽的一种方法是通过蛋白质化学技术将两个或多个肽或多肽连接在一 起。例如,可使用现有的实验室设备并应用Fmoc(9-芴甲氧羰基)或Boc (叔丁氧羰基)化学(Applied Biosystem,Inc.,Foster City,CA) 可化学合成肽或多肽。本领域的技术人员可容易理解对应于本发明抗体 的肽或多肽可通过例如标准化学反应合成。例如,可合成肽或多肽,且 不将其从其合成树脂上切割下来;可合成抗体的其它片段,但随后从树 脂上切割下来,由此暴露其它片段上被官能性封闭的末端基团。通过肽 缩合反应,这两个片段可通过肽键分别在羧基和氨基末端共价连接起来 形成抗体或其片段(Grant GA(1992)Synthetic Peptides:A User Guide. W.H.Freeman and Co.,N-Y.(1992);Bodansky M and Trost B.,Ed. (1993)Principles of Peptide Synthesis.Springer-Verlag Inc., NY)。或者,肽或多肽可按如上所述在体内独立合成。可以在分离后将这 些独立的肽或多肽通过类似的肽缩合反应连接起来形成抗体或其片段。
例如,可用克隆的或合成的肽区段的酶连接而使相对较短的肽片段 连接起来生成较大的肽片段、多肽或整个蛋白质结构域(Abrahmsen Let al.,Biochemistry,30:4151(1991))。或者,可用合成肽的天然化学 连接从较短的肽片段合成构建较大的肽或多肽。本方法由两步化学反应 组成(Dawson et al.  Syntlxesis of Proteins by Native Chemical Ligation.Science,266:776-779(1994))。第一步为未保护的合成肽- α-硫酯与另一含有氨基端Cys残基的未保护的肽区段进行化学选择性反 应,获得硫酯键连接的中间体作为初始共价产物。若不改变反应条件, 该中间体会自发进行快速的分子内反应,并在连接位点形成天然的肽键。 这种天然化学连接方法在蛋白质分子的总体合成中的应用可通过制备人 白细胞介素8(IL-8)得以阐述(Baggiolini Met al.(1992)FEBS Lett. 307:97-101;Clark-Lewis Iet al,J.Biol.Chem.,269:16075(1994); Clark-Lewis I et al.,Biochemistry,30:3128(1991);Rajarathnam K et al.,Biochemistry 33:6623-30(1994))。
或者,可化学连接未保护的肽区段,此时由于化学连接导致肽区段 之间形成的键为非天然(非肽)键(Schnolzer,M et al.Science,256:221 (1992))。该技术已被用来合成的蛋白质结构域的类似物以及大量相对较 纯的具有生物学活性蛋白质(deLisle Milton RC et al.,Techniques in Protein Chemistry IV.Academic Press,New York,pp.257-267 (1992))。
本发明多肽还可通过包括例如重组技术在内的其它方法制备得到。 合适的克隆和测序技术的实例以及足以指导本领域的技术人员完成多种 克隆实验的教导可见于Sambrook et al.(2001)Molecular Cloning- A Laboratory Manual(3rd ed.)Vol.1-3,Cold Spring Harbor Laboratory,Cold Spring Harbor Press,NY,(Sambrook)。
本发明还提供了一种多肽或该多肽序列的片段,所述多肽含有与表1 中以GeneBank编号给出的多肽序列有至少约70%、75%、80%、85%、 90%、95%、96%、97%、98%或99%同一性的氨基酸序列。
应理解的是,正如本文所述,使用的术语“同源性”和“同一性” 含义是相同的,都指的是相似性。因此,例如如果在提及两个非天然序 列时使用词语“同源性”,则应理解的是这不一定表示这两个序列之间有 进化关系,而应着眼于其核酸序列之间的相似性或相关性。为了测量序 列相似性,可将很多用于测定两种进化相关的分子同源性的方法常规地 应用至任何两种或两种以上核酸或蛋白质,而不用考虑它们是否进化相 关。
总而言之,应理解的是,确定本文所公开的核酸和多肽的任何已知 变体和衍生物或可能出现的变体和衍生物的一种方法是通过确定变体和 衍生物与特定已知序列之间的同源性而进行的。总的说来,本文所公开 的核酸和多肽的变体一般与所述序列或天然序列具有至少约70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%或99%的同源性。本领域的技术人员可容易理解如何确定两种多肽或 核酸的同源性。例如,可在对两个序列进行比对而使同源性水平最高之 后,计算得出同源性。
计算同源性的另一种方法可通过公开的算法进行。用于比较的最佳 比对可通过Smith and Waterman Adv.Appl.Math.2:482(1981)的 局部同源性算法进行,通过Needleman and Wunsch,J.MoI.Biol.48: 443(1970)的同源比对算法进行,通过Pearson and Lipman,Proc.Nat l. Acad.Sci U.S.A.85:2444(1988)的相似性检索方法进行,通过这些 算法的计算机执行(Wiscons in Genetics Software Package中的GAP、 BESTFIT、FASTA和TFASTA,Genetics Computer Group,575 Science Dr., Madison,WI;国立生物技术信息中心提供的Tatusova and Madden FEMS Microbiol.Lett.174:247-250(1999)的BLAST算法 (http://www.ncbi.nlm.nih.gov/blast/b12seq/b12.html))进行或通过 审查进行。
相同类型的核酸的同源性可通过例如Zuker,M.Science 244:48-52, 1989,Jaeger et al.Proc.Natl.Acad.SciUSA 86:7706-7710,1989, Jaeger et al.Methods Enzymol.183:281-306,1989所公开的算法获 得,这些文献至少将其与核酸比对相关的内容通过援引纳入本文。应理 解的是,通常可使用任何一种方法,并且在某些情况下这些不同方法得 到的结果有所不同,但是本领域的技术人员可以理解若用这其中的至少 一种方法获得了同一性,则称该序列具有所述同一性。
例如,本文所使用的与另一序列具有具体百分比同源性的所述序列 是指具有由上述一种或多种计算方法计算得到的所述同源性的序列。例 如,如果使用Zuker计算方法计算得到第一序列与第二序列具有80%的同 源性,则即便使用任何其它计算方法计算得到第一序列与第二序列没有 80%的同源性,第一序列与第二序列也具有本文所述的80%的同源性。作 为另一实例,如果使用Zuker计算方法和Pearson和Lipman计算方法计 算得到第一序列与第二序列具有80%的同源性,那么即便使用Smith和 Wateman计算方法、Needleman和Wunsch计算方法、Jaeger计算方法或 任何其它计算方法计算得到第一序列与第二序列没有80%的同源性,第一 序列与第二序列也具有本文所述的80%的同源性。作为又一实例,如果使 用每种计算方法计算得到第一序列和第二序列具有80%的同源性,则第一 序列与第二序列具有本文所述的80%的同源性(尽管实际上,不同的计算 方法通常会计算得到不同的同源性百分比)。
本发明还提供了将表1中以GeneBank编号形式述及的多肽进行一个 或多个保守氨基酸置换的多肽。这些保守置换即为将天然存在的氨基酸 置换为具有相似性质的氨基酸。这种保守置换并不改变多肽的功能。例 如,保守置换可依据下表进行:
  表1:氨基酸置换   原始残基     示例性置换   Arg   Asn   Asp   Cys   Gln   Glu   Gly   His   Ile   Leu   Lys   Met   Phe   Ser   Thr   Trp   Tyr   Val     Lys     Gln     Glu     Ser     Asn     Asp     Pro     Gln     leu;val     ile;val     arg;gln     leu;ile     met;leu;tyr     Thr     Ser     Tyr     trp;phe     ile;leu
因此,应理解的是,如若需要,可对编码本发明多肽的核酸和/或本 发明多肽的氨基酸序列进行修饰和改变,并仍能获得具有相似特征或其 它所需特征的多肽。这种改变可在天然分离物中进行,或者可利用位点 特异性诱变通过合成引入,所述通过位点特异性诱变引入的方法例如错 配聚合酶链反应(PCR)为本领域所熟知。例如,多肽中的某些氨基酸可 被置换成其它氨基酸,而不会显著丧失功能活性。因此考虑了可对本发 明多肽的氨基酸序列(或其核酸序列)作出多种改变,而不显著丧失生 物效用或活性,并且这种效用或活性还可能得到提高。因此,很清楚的 是,本发明考虑了本文所述多肽序列天然存在的变化形式以及本文所述 多肽序列通过基因工程得到的变化形式。通过提供与病毒感染相关的基 因的基因组位置,本发明还提供了这些基因的任何变体序列的基因组位 置。因此,基于本文提供的信息,对于本领域的技术人员而言,鉴定申 请人所鉴定的基因组位置并对其测序以及鉴定本文所述基因的变体序列 是常规的。对于本领域的技术人员而言,利用比较工具和生物信息技术 来鉴定来自其它物种的序列也是常规的,所述来自其它物种的序列是本 文所述基因的同系物并且也是感染所必需、但并非为细胞存活所必需的。
抗体
本发明还提供了特异性结合表1所述基因产物、多肽、蛋白质及其 片段的抗体。本发明抗体可为多克隆抗体或单克隆抗体。本发明抗体选 择性结合多肽。“选择性结合”或“特异性结合”指的是测定抗原是否存 在的抗体结合反应(在本文中是指测定在一群异源蛋白质中和其它生物 制品中是否存在表1所述多肽或其抗原性片段的反应)。因此,在特定的 免疫分析条件下,所述具体抗体优先结合特定的肽,而不是以显著的量 结合样本中其它蛋白质。优选地,选择性结合包括大约或大于1.5倍分 析背景的结合,小于1.5倍分析背景的结合为不存在显著结合。
本发明还考虑到了与表1所述蛋白质的天然相互作用因子或配体竞 争性结合的抗体。换而言之,本发明提供了干扰表1所述蛋白质和其结 合伴侣之间的相互作用的抗体。例如本发明抗体可与某种蛋白质竞争细 胞上的结合位点(如受体),或者该抗体可与某种蛋白质竞争结合另一种 蛋白质或生物分子,例如受表1所述转录因子转录调控的核酸。与抗原 相比,抗体任选具有拮抗作用或激动作用。
优选地,抗体可在体内或离体时结合多肽。任选地,本发明抗体用 可检测部分进行标记。例如,可检测部分可选自荧光部分、酶联部分、 生物素部分和放射标记部分。抗体可用于诸如诊断、筛选或成像等技术 或方法中。抗独特型抗体和亲和成熟抗体也被认为是本发明的一部分。
本文所使用的术语“抗体或其片段”包括具有两种或多种抗原或表 位特异性的嵌合抗体和杂合抗体,以及包括杂合片段在内的片段例如 F(ab’)2、Fab’、Fab等。因此提供了保留了与其特异性抗原进行结合的 能力的抗体片段。这类抗体和片段可由本领域已知的技术制备,并可根 据实施例所述方法和生产抗体和筛选抗体的特异性和活性的一般方法对 抗体的特异性和活性进行筛选(参见Harlow and Lane.Antibodies,A Laboratory Manual.Cold Spring Harbor Publications,New York, (1988))。
“抗体及其片段”的含义还包括例如美国专利4,704,692所述的抗 体片段和抗原结合蛋白的缀合物(单链抗体),所述文献的内容通过援引 纳入本文。
任选地,抗体在其它物种中形成并为了给人施用而被“人源化”。在 本发明的一个实施方案中,“人源化”抗体为由种系突变体动物产生的人 类抗体形式的抗体。非人类(如鼠类)抗体的人源化形式为嵌合的免疫 球蛋白、免疫球蛋白链或其片段(例如Fv、Fab、Fab’、F(ab’)2或抗体 的其它抗原结合子序列),它们含有最少的来源于非人类免疫球蛋白的序 列。人源化抗体包括人免疫球蛋白(受体抗体),其中受体CDR的残基被 来自人以外物种(供体抗体)如小鼠、大鼠或兔CDR的、具有所需特异 性、亲和力和容纳力的残基替换。在一个实施方案中,本发明提供了抗 体的人源化形式,包含特异性结合表1所述蛋白质的单克隆抗体的至少 一个、两个、三个、四个或最高至全部CDR。在某些情况下,人免疫球蛋 白的Fv框架残基由相应的除人外的残基所替换。人源化抗体还可包括既 不存在于受体抗体中也不存在于引进的CDR或框架序列中的残基。一般 而言,人源化抗体包括基本上所有的可变域,或者包括至少一个可变域, 一般包括两个可变域,其中所有的或基本上所有的CDR区域对应非人类 免疫球蛋白的CDR区域,并且所有的或基本上所有的FR区域为人免疫球 蛋白共有序列的FR区域。人源化抗体最好还包含至少一部分免疫球蛋白 恒定区(Fc),一般为人免疫球蛋白的恒定区(Jones et al.,Nature, 321:522-525(1986);Riechmann et al.,Nature,332:323-327(1988); and Presta,Curr.Op.Struct.Biol,2:593-596(1992))。
人源化非人类抗体的方法为本领域所熟知。一般而言,人源化抗体 具有从非人类来源引入其中的一个或多个氨基酸残基。这些非人类氨基 酸残基通常指“引进”的残基,它通常来自“引进”的可变域。依照Winter 和他的同事的方法(Jones et al.,Nature,321:522-525(1986); Riechmann et al.,Nature,332:323-327(1988);Verhoeyen et al., Science,239:1534-1536(1988)),通过将啮齿类CDR或CDR序列置换 为相应的人抗体的序列,可基本完成人源化。因此,这种“人源化”抗 体为嵌合抗体(美国专利4,816,567),其中基本上不到一个完整的人可 变域由来自非人类物种的相应序列所替换。实际上,人源化抗体一般为 人抗体,其中一些CDR残基和可能的一些FR残基被来自啮齿类抗体的类 似位点的残基所置换。
药剂的鉴定
一种鉴定抗病毒药剂的方法包括a)将所述药剂给予含有表1所列细 胞基因的细胞,b)检测由细胞基因产生的基因产物的水平和/或活性, 该基因产物和/或基因产物活性的减少或消失表明该化合物具有抗病毒 活性。
本发明还提供了一种鉴定抗病毒药剂的方法,包括:a)将所述药剂 给予含有表1所列细胞基因的细胞,b)使细胞和病毒接触;c)检测病 毒感染的水平;并d)将病毒感染水平与表1中基因的表达水平或表1 中基因编码的蛋白质的活性相关联,病毒感染的减轻或消失与基因表达 和/或活性的减少或消失相关就表明所述药剂为抗病毒药剂。例如,药剂 可干扰基因表达和/或基因的蛋白质或多肽产物的活性。在本发明的方法 中,本发明测试化合物或抗病毒药剂可在细胞与病毒接触之前或之后或 在细胞与病毒接触的同时送递。
上述方法可用来鉴定在经病原体感染之后具有减轻感染、预防感染 或提高细胞存活的活性的任何药剂。因此,在本发明的方法中,细胞与 病毒接触的步骤可替换为细胞与任何感染性病原体接触。感染包括引入 感染物,例如非重组病毒、重组病毒、质粒、细菌、朊病毒、真核微生 物或能感染宿主例如细胞培养物的细胞或受试者的细胞等的其它物质。 这种感染可为体外的、离体的或体内的。
用于本文所述方法的测试化合物可包括但不限于化学品、小分子、 药物、蛋白质、cDNA、抗体、morpholinos、三链螺旋分子、siRNA、shRNA、 反义RNA、核酶或任何其它已知的或今后将被鉴定的、会干扰本文所述细 胞基因的表达和/或功能的化合物。测试化合物还可调节本文所述细胞基 因的基因产物的活性。
小干扰RNA(siRNA)为双链RNA,它可诱导序列特异性转录后基因 沉默,由此减少甚或抑制基因表达。在一些实例中,siRNA分子长约19-23 个核苷酸,例如至少有21个核苷酸,例如至少有23个核苷酸。在一个 实例中,siRNA可触发siRNA和靶RNA之间序列同一性区域的同源RNA 分子如mRNA的特异性降解。例如,WO02/44321公开了在靶mRNA与3’ 突出端碱基配对时能序列特异性降解靶mRNA的siRNA。dsRNA加工的方 向决定了所产生的siRNA核酸内切酶复合物所切割的是有义靶RNA还是 反义靶RNA。因此,例如通过使基因例如表1所述一个或多个基因沉默, 可将siRNA用于调节转录。siRNA的作用已在来自包括果蝇 (Drosophila)、线虫(C.elegans)、昆虫、蛙、植物、真菌、小鼠和 人在内的多种生物体的细胞中得到证实(例如WO02/44321;Gitlin et al.,Nature 418:430-4,2002;Caplen et al.,Proc.Natl.Acad.Sci 98:9742-9747,2001和Elbashir et al.,Nature 411:494-8,2001)。 在某些实例中,设计针对某些靶基因的siRNA以验证针对相同核酸序列 所使用的基因捕获的结果。采用序列分析工具,本领域的技术人员可设 计siRNA来特异性打靶表1所述任何基因来减少基因表达。抑制表1所 述任何基因的基因表达或使其沉默的siRNA可从Ambion Inc.2130 Woodward Austin,Tx 78744-1832 USA获得。只要提供编码序列的 GeneBank编号或基因的Entrez基因编号,就可以容易地获得由Ambion 公司合成的siRNA,大鼠和人编码序列的GeneBank编号或Entrez基因编 号均已在表1中提供。
本文还提供了可用来减少表1所列基因的基因表达的序列的实例。 特别地,表3提供了表1所列基因的有义RNA序列和反义RNA序列。因 此,表3所述任何有义或反义序列可单独使用或与其它序列一起使用, 以抑制基因表达。这些序列可包含3’TT突出端和/或其它可有效克隆和 表达s iRNA序列的序列。这些序列可通过分析表3所列基因的可译框架 获得。因此,表3提供了所分析的每种基因的名称、基因的mRNA的 GeneBank编号、mRNA的长度、mRNA的ORF区域和每种基因的基因座编号。 每种基因的基因座编号与表1所列Entrez基因编号相同。表3还提供了 基因可译框架中的序列的起始位点,所述基因可通过表3所述有义RNA 序列和/或反义RNA序列对其进行打靶。靶序列的起始位点在名称栏和起 点栏标出。名称栏还提供了每个靶序列的GeneBank编号标识符。因此, 很清楚的是,表3中具有名称NM_000350_siRNA_458的行表明有义序列 和反义序列对应GeneBank编号NM_000350,靶序列的起始位点为458。 例如,ABCA4基因靶序列开始于458位。因此,含有SEQ ID NO:1的序 列和/或含有SEQ ID NO:2的序列为可用来靶向ABCA4并减少ABCA4基 因表达的两个序列。同样,含有SEQ ID NO:3的序列和/或含有SEQ ID NO: 4的序列可用来靶向ABCA4表达。这些实例并非意在限制,而是属于表3 所述每一个有义和反义RNA序列的一部分。包含本文所述有义和反义RNA 序列的序列可用来抑制任何细胞(真核细胞或原核细胞)、动物或任何其 它生物中的基因表达。这些序列可克隆至载体中并在体外、离体或体内 条件下用来减少基因表达。
shRNA(短发夹RNA)为DNA分子,它可被克隆至表达载体来表达用 于RNAi干扰研究的siRNA(19-21个核苷酸的RNA双链)。shRNA具有如 下结构特征:长约19-29个核苷酸、来源于靶基因的短核苷酸序列,其 后为约4-15个核苷酸的短间隔物(即环)以及约19-29个核苷酸的序列, 所述19-29个核苷酸的序列为起始靶序列的反向互补序列。例如,表3 所述任何基因的有义siRNA序列均可用来设计shRNA。作为一个实例, C10orf3(SEQ ID NO:292)的有义RNA序列可用来设计具有示例性接头 序列(CGAA)的shRNA。如下所示,有义序列通过接头(CGAA)与反义序 列连接而形成顶链(top strand)。顶链和底链(bottom strand)退火 形成可克隆至恰当表达载体的双链寡核苷酸。该双链寡核苷酸具有如下 所示有助于克隆的核苷酸突出端。这些序列可克隆至载体并离体、体外 或体内应用以减少基因表达。

因此,表3所述任何有义序列可用接头使其与相应的反义序列连接 起来形成shRNA的顶链。底链是顶链的反向互补序列。将表3所述序列 中的“U”由“T”置换从而形成DNA链。然后将顶链和底链退火形成双 链shRNA。如上所述,顶链和底链具有突出端或其它有助于克隆至表达载 体序列。
核酶是能催化特异性切割RNA的具有酶活性的RNA分子。核酶的作 用机制包括核酶分子特异性杂交至互补的靶RNA和随后进行核酸内切。 使用核酶来降低或抑制RNA表达的方法为本领域已知(例如参见 Kashani-Sabet,J Investig.Dermatol.Symp.Proc,7:76-78,2002)。
通常,术语“反义”指由于一定程度的序列互补性而能与RNA序列 (如mRNA)的一部分杂交的核酸分子。本文所公开的反义核酸可以是双 链或单链寡核苷酸,RNA或DNA或其修饰物或衍生物,可直接将它给予细 胞(例如通过将反义分子给予受试者),或者通过外源引入序列的转录在 细胞内产生(例如通过给予受试者含有受控于启动子的反义分子的载 体)。
反义核酸为多核苷酸,例如为至少长6个核苷酸、至少长10个核苷 酸、至少长15个核苷酸、至少长20个核苷酸、至少长100个核苷酸、 至少长200个核苷酸的核酸分子,例如为6至100个核苷酸的核酸分子。 然而反义分子也可以长得多。在具体的实例中,核苷酸在一个或多个碱 基部分、糖基部分或磷酸盐骨架(或其组合)上被修饰,并可包括其它 附加的基团例如肽或有助于跨细胞膜(Letsinger et al.,Proc.Natl. Acad.Sci.USA 1989,86:6553-6;Lemaitre et al,Proc.Natl.Acad. Sci.USA 1987,84:648-52;WO88/09810)或者血脑屏障(WO89/10134) 转运的药剂、杂交触发切割剂(Krol et al,BioTechniques 1988, 6:958-76)或插入试剂(Zon,Pharm.Res.5:539-49,1988)。
经修饰的碱基部分的实例包括但不限于:5-氟尿嘧啶、5-溴尿嘧啶、 5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、乙酰胞嘧啶、5-(羧基 羟甲基)尿嘧啶、5-羧甲基氨甲基-2-硫尿核苷、5-羧甲基氨甲基尿嘧啶、 二氢尿嘧啶、β-D-半乳糖基Q核苷(galactosylqueosine)、肌苷、N~ 6-异戊基腺嘌呤(sopentenyladenine)、1-甲基嘌呤、1-甲基肌苷、 2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5- 甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨甲基尿嘧啶、甲氧氨 甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷(mannosylqueosine)、5’-甲 氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊基腺嘌呤、尿 嘧啶-5-羟基乙酸、假尿嘧啶、Q核苷(queosine)、2-巯基胞嘧啶、5- 甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5- 羟基乙酸甲酯、尿嘧啶-S-羟基乙酸、5-甲基-2-硫尿嘧啶、3-(3-氨基 -3-N-2-羧丙基)尿嘧啶和2,6-二氨基嘌呤。
经修饰的糖基部分的实例包括但不限于阿拉伯糖、2-氟阿拉伯糖、 木糖和己糖,或者磷酸盐骨架的修饰组分例如硫代磷酸酯 (phosphorothioate)、二硫代磷酸酯、氨基硫代磷酸酯 (phosphoramidothioate)、氨基磷酸酯、二氨基磷酸酯 (phosphordiamidate)、磷酸甲酯、烷基磷酸三酯、或formacetal或其 类似物。
在一个具体实例中,反义分子为α-异头寡核苷酸。α-异头寡核苷 酸与互补RNA形成特异性双链杂合体,与通常的β单位不同,其中的链 彼此平行(Gautier et al,Nucl.Acids Res.15:6625-41,1987)。寡 核苷酸可与另一分子例如肽、杂交触发交联剂、转运剂或杂交触发切割 剂缀合。寡核苷酸可包括可增强宿主细胞摄入分子的寻靶部分。寻靶部 分可为特异性结合分子,例如识别存在于宿主细胞表面的分子的抗体或 其片段。
在一个具体实例中,识别本文所述核酸的反义分子包括催化性RNA 或核酶(例如参见WO90/11364;WO95/06764;和Sarver et al., Science 247:1222-5,1990)。反义分子与金属复合物如三联吡啶(II) 的缀合物描述于Bashkin et al.(Appl Biochem Biotechnol.54:43-56, 1995),该缀合物能介导mRNA水解。在一个实例中,反义核苷酸为2 ’-O- 甲基核糖核苷酸(Inoue et al,Nucl.Acids Res.15:6131-48,1987) 或嵌合的RNA-DNA类似物(Iroue et al,FEBS Lett.215:327-30,1987)。
使用这些方法鉴定的抗病毒药剂可用于离体、体外或体内抑制细胞 中的病毒感染。
本发明的方法中,可使用可被病毒或其它病原体例如细菌、寄生物 或真菌等感染的任何细胞。细胞可为原核细胞或真核细胞,例如来自昆 虫、鱼、甲壳动物、哺乳动物、鸟、爬行动物、酵母或细菌如大肠埃希 氏菌的细胞。细胞可为生物体的一部分或为细胞培养物例如哺乳动物细 胞的培养物或细菌培养物的一部分。
本发明的病毒包括所有RNA病毒(包括负链RNA病毒、正链RNA病 毒、双链RNA病毒和反转录病毒)和DNA病毒。病毒的实例包括但不限 于HIV(包括HIV-1和HIV-2)、微小病毒、乳头瘤病毒、麻疹病毒、纤 丝病毒(filovirus)(例如Marburg)、SARS(严重急性呼吸道综合征) 病毒、汉坦病毒、流感病毒(如A型、B型和C型流感病毒)、A至G型 肝炎病毒、杯状病毒、星状病毒、轮状病毒、冠状病毒(例如人呼吸道 冠状病毒)、微小RNA病毒(例如人鼻病毒和肠道病毒)、埃博拉病毒、 人疱疹病毒(例如HSV-1-9,包括带状疱疹病毒、Epstein-Barr病毒和 人巨细胞病毒)、疫病毒、人腺病毒、腺伴随病毒、天花病毒(痘疹 病毒)、牛痘病毒(cowpox)、猴痘病毒、痘苗病毒(vaccinia)、脊髓灰 质炎病毒、病毒性脑膜炎病毒和汉坦病毒。
对于动物,病毒包括但不限于任一上述人病毒的相应动物病毒、禽 流感病毒(例如毒株H5N1、H5N2、H7N1、H7N7和H9N2)和动物反转录病 毒例如猿猴免疫缺陷病毒、禽免疫缺陷病毒、假牛痘病毒、牛免疫缺陷 病毒、猫免疫缺陷病毒、马传染性贫血病病毒、羊关节炎脑炎病毒和绵 羊髓鞘脱落病毒。
本发明方法还可用于评价细菌感染和鉴定抗细菌药剂。具体而言, 可以使用相同的方法,只是将细胞与病毒接触替换为将细胞与细菌接触。 因此,本发明提供了一种鉴定抗细菌药剂的方法,包括a)将药剂给予含 有表1所列细胞基因的细胞,b)检测由细胞基因产生的基因产物的水平 和/或活性,基因产物和/或基因产物活性的减少或消失表明化合物具有 抗细菌活性。
本发明还提供了一种鉴定抗细菌药剂的方法,包括a)将药剂给予含 有表1所列细胞基因的细胞,b)使细胞与细菌相接触,c)检测细菌感 染的水平;并d)将细菌感染水平与表1中基因的表达水平或表1中基因 编码的蛋白质的活性相关联,细菌感染的减轻或消失与基因表达和/或活 性的减少或消失相关则表明药剂为抗菌剂
细菌的实例包括但不限于下列细菌:利斯特菌属(Listeria(sp.))、 结核分枝杆菌(Mycobacterium tuberculosis)、立克次氏体(Rickettsia (全部型))、埃里希氏体(Ehrlichia)、衣原体(Chylamida)。可由本发 明方法靶向的细菌的其它实例包括结核分枝杆菌(M.tuberculosis)、 牛分枝杆菌(M.bovis)、牛分枝杆菌BCG菌株、BCG亚株、鸟分枝杆菌 (M.avium)、胞内分枝杆菌(M.intracellular)、非洲分枝杆菌(M. africanum)、堪萨斯分枝杆菌(M.kansasii)、瘰疬分枝杆菌(M. marinum)、溃疡分枝杆菌(M.ulcerans)、鸟分枝杆菌副结核亚种(M. avium subspecies paratuberculosis)、星状诺卡氏菌(Nocardia asteroides)、其它诺卡氏菌种、侵军团菌(Legionella pneumophila)、 其它军团菌种、伤寒沙门氏菌(Salmonella typhi)、其它沙门氏菌种、 志贺氏菌种、鼠疫耶尔森氏菌(Yersinia pestis)、溶血巴斯德氏菌 (Pasteurella haemolytica)、多杀巴斯德氏菌(Pasteurella multocida)、其它巴斯德氏菌种、大叶性肺炎放线杆菌(Actinobacillus pleuropneumoniae)、单核细胞增生利斯特氏菌(Listeria monocytogenes)、伊氏利斯特氏菌(Listeria ivanovii)、流产布鲁氏 菌(Brucella abortus)、其它布鲁氏菌种、反刍类考德里氏体(Cowdria ruminantium)、肺炎衣原体(Chlamydia pneumoniae)、砂眼衣原体 (Chlamydia trachomatis)、鹦鹉热衣原体(Chlamydia psittaci)、伯 氏考克斯氏体(Coxiella burnetii)、其它立克次氏体种、埃里希氏体 (Ehrlichia)种、金黄色葡萄球菌(Staphylococcus aureus)、表皮葡 萄球菌(Staphylococcus epidermidis)、酿脓链球菌(Streptococcus pyogenes)、无乳链球菌(Streptococcus agalactiae)、炭疽芽孢杆菌 (Bacillus anthracis)、大肠埃希氏菌(Escherichia coli)、霍乱弧 菌(Vibrio cholerae)、弯曲杆菌属(Campylobacter)种、脑膜炎奈瑟 氏球菌(Neiserria meningitidis)、淋病奈瑟氏球菌(Neiserria gonorrhea)、铜绿假单胞菌(Pseudomonas aeruginosa)、其它假单胞菌 属(Pseudomonas)种、流感嗜血菌(Haemophilus influenzae)、杜氏 嗜血菌(Haemophilus ducreyi)、其它嗜血菌属(Hemophilus)种、破 伤梭菌(Clostridium tetani)、其它梭菌属(Clostridium)种、小 肠结肠炎耶尔森氏菌(Yersinia enterolitica)和其它耶尔森氏菌属种。
已发现的对一种细菌有效的抗菌剂对其它细菌特别是来自同一科的 细菌也可能有效。因此,可使用本发明的方法对针对某种细菌鉴定得到 的抗菌剂就其针对其它细菌的抗菌活性进行测试。
本发明的方法还可用于评价寄生物感染或鉴定抗寄生物药剂。具体 而言,可使用相同的方法,只是将细胞与病毒接触替换为将细胞与寄生 物接触。因此,本发明提供了一种鉴定抗寄生物药剂的方法,包括a)将 所述药剂给予含有表1所列细胞基因的细胞,b)检测由细胞基因产生的 基因产物的水平和/或活性,基因产物和/或基因产物活性的减少或消失 可表明化合物具有抗寄生物活性。
本发明还提供了一种鉴定抗寄生物药剂的方法,包括a)将药剂给 予含有表1所列细胞基因的细胞,b)使细胞与寄生物相接触,c)检测 寄生物感染的水平;并d)将寄生物感染水平与表1中基因的表达水平或 表1中基因编码的蛋白质的活性相关联,寄生物感染的减轻或消失与基 因表达和/或活性的减少或消失相关就表明所述药剂为抗寄生物药剂。
寄生物的实例包括但不限于下列寄生物:  隐孢子虫属 (Cryptosporidium)、疟原虫(Plasmodium)(所有种)、美洲锥虫 (American trypanosomes)(克氏锥虫,T cruzi)。另外,本发明方法 中考虑到的原生动物和真菌属种的实例包括但不限于镰状疟原虫 (Plasmodium falciparum)、其它疟原虫属(Plasmodium)种、鼠弓形 体(Toxoplasma gondii)、卡氏肺囊虫(Pneumocystis carinii),克 氏锥虫(Trypanosoma cruzi)、其它锥虫属(trypanosomal)种、杜氏 利什曼原虫(Leishmania tdonovani)、其它利氏曼原虫属(Leishmania) 种、环形泰勒虫(Theileria annulata)、其它泰勒虫属(Theileria) 种、柔嫩球虫(Eimeria tenella)、其它艾美耳球虫属种(Eimeria species)、荚膜组织胞浆菌(Histoplasma capsulatum)、新型隐球菌 (Cryptococcus neoformans)、皮炎芽生菌(Blastomyces dermatitidis)、粗球孢子菌(Coccidioides immitis)、巴西副球孢子 菌(Paracoccidioides brasiliensis)、马尔尼菲青霉(Penicillium marneffei)和念珠菌属种(Candida species)。
已发现的对一种寄生物有效的抗寄生物药剂对其它寄生物特别是来 自同一科的寄生物也可能有效。因此,可使用本发明的方法对针对一种 寄生物鉴定得到的抗寄生物药剂就其针对其它寄生物的抗寄生物活性进 行测试。
在上述方法中,在将含有表1所列细胞基因的细胞与药剂接触后, 就可将感染水平与基因表达和/或活性水平相关联,由此与基因表达和/ 或活性的减少或消失相关的感染的减弱或消失就表明了该药剂可有效对 抗病原体。这些方法可用来评价药剂对细菌感染的影响、抗病毒感染作 用、抗真菌感染作用、抗寄生物感染作用等。例如,可在给予抑制表1  所述基因的表达的siRNA后,测量细胞中的病毒感染水平。若病毒感染 减轻,则siRNA为有效的抗病毒药剂。病毒感染的水平可通过测量抗原 或与具体病毒感染相关的其它产物(例如针对HIV感染的p24)进行评价。 若给予针对表1所述基因的siRNA后,p24的水平降低,则靶向该基因的 siRNA为针对HIV的有效抗病毒药剂。病毒感染的水平还可通过实时定量 反转录聚合酶链式反应(RT-PCR)分析进行测量(参见例如Payungporn et al.″Single step multiplex real-time RT-PCR for H5N1 influenza A virus detection.″J Virol Methods.Sep 22,2005;Landolt et la. ″Use of real-time reverse transcr iptase polymerase chain reaction assay and cell culture methods for detection of swine influenza A viruses″Am J Vet Res.2005 Jan;66(1):119-24)。
同样,给予化学品、小分子、药物、蛋白质、cDNA、抗体、morpholino、 反义RNA、核酶或任何其它化合物后,细胞内的病毒感染水平还可使用上 述方法以及本领域已知的方法进行测量。若病毒感染减轻,则该化学品、 小分子、药物、蛋白质、cDNA、抗体、morpholino、反义RNA、核酶或任 何其它化合物是有效的抗病毒药剂。其它类型的感染如细菌感染、真菌 感染和寄生物感染的水平可用类似的方法来测量。
已发现的对一种病毒有效的抗病毒药剂对其它病毒特别是来至同一 科的病毒也可能是有效的。然而,还考虑到了已发现的对HIV有效的药 剂也对流感病毒或禽流感病毒或任何其它病毒也可能是有效的。因此, 可使用本发明的方法对针对一种病毒鉴定得到的抗病毒药剂就其针对其 它病毒的抗病毒活性进行测试。通过任何标准方法例如通过用特异性针 对该蛋白质的抗体进行检测可测量基因产物的水平。可将本文所述核酸 及其片段可用作引物,并通过常规扩增技术来扩增核酸序列例如表1所 述基因之一的基因转录物。例如,使用自细胞分离得到的RNA,通过RT-PCR 对基因转录物的表达进行定量。各种PCR技术为本领域的技术人员所熟 知。对PCR技术的综述,可参见White(1997)和名为“PCR Methods and Applications”(1991,Cold Spring Harbor Laboratory Press)的出版 物,就扩增方法通过援引将其全文纳入本文。在这其中的每种PCR方法 中,将有待扩增的核酸序列的任一侧PCR引物与dNTP和热稳定聚合酶例 如Taq聚合酶、Pfu聚合酶或Vent聚合酶一起加至恰当制备的核酸样本 中。将样本中的核酸变性,随后PCR引物特异地杂交至样本中的互补核 酸序列。使杂交的引物延伸。然后开始另一个变性、杂交和延伸的循环。 多次重复该循环以产生在引物位置之间含有核酸序列的扩增片段。PCR 在一些专利中已有进一步的描述,这些专利包括美国专利4,683,195、 4,683,202和4,965,188。上述每篇出版物均就PCR方法通过援引将其全 文纳入本文。本领域的技术人员应知道如何设计和合成可扩增表1所述 任意核酸序列或其片段的引物。
扩增反应中可含有检测标记。合适的标记包括荧光团如异硫氰酸荧 光素(FITC)、罗丹明、德克萨斯红、藻红蛋白、别藻蓝蛋白、6-羧基荧 光素(6-FAM)、2’,7’-二甲氧基-4’,5’-二氯-6-羧基荧光素(JOE)、6-羧基 -X-罗丹明(ROX),6-羧基-2’,4’,7’,4,7-六氯荧光素(HEX)、5-羧基荧光 素(5-FAM)或N,N,N’,N’-四甲基-6-羧基罗丹明(TAMRA);放射性标记如 32P、35S、3H等。标记可为两级系统,其中扩增得到的DNA与具有例如抗 生物素蛋白、特异性抗体等高亲和结合伴侣的生物素、半抗原等缀合, 其中结合伴侣与检测标记缀合。标记可与一种或两种引物缀合。或者, 对扩增中所使用的核苷酸混合物进行标记,以此将标记引入扩增产物中。
样本核酸例如扩增得到的片段可由本领域已知的多种方法之一进行 分析。核酸可通过双脱氧法或其它方法进行测序。还可使用通过Southern 印迹、点印迹等进行的序列杂交来测定序列是否存在。
本发明的基因和核酸还可用于多核苷酸阵列中。多核苷酸阵列提供 了一种高通量技术,这种高通量技术可分析单个样本中大量的多核苷酸 序列。例如,该技术可用于鉴定与对照样本相比表1所述核酸表达有所 减少的样本。该技术还可用于测定表1所述核酸表达减少的效果。通过 这种方式,本领域的技术人员可鉴定出表1所述核酸表达减少后得到上 调或下调的基因。同样,本领域的技术人员可鉴定出表1所述核酸表达 增加后得到上调或下调的基因。通过这种方式,可鉴定出作为治疗靶标 的其它基因,所述治疗例如抗病毒治疗、抗细菌治疗、抗寄生物治疗或 抗真菌治疗。
为制备阵列,可将单链多核苷酸探针点样至二维矩阵或阵列形式的 基质上。每个单链多核苷酸探针可包括选自表1以GeneBank编号形式述 及的核苷酸序列的至少6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、25或30或更多个连续核苷酸。
阵列还可为含有表1所述一种或多种基因的不同多态等位基因的探 针的微阵列。若一个受试者群体中存在一个核酸序列的两种或多种形式 则就存在多态性。例如,多态核酸可为其中最常见等位基因频率为99% 或少于99%的核酸。不同的等位基因可根据核酸序列中的差异进行鉴定, 在多于1%的群体中(这是定义多态性时通常接受的频率)出现的遗传变 异对于某些应用而言是有用的多态性。
等位基因频率(特定类型群体中所有等位基因核酸的比例)可通过 对群体中等位基因的直接计数或估计数目以及群体中等位基因的类型来 确定。多态性以及测定等位基因频率的方法叙述于Hartl,D.L.and Clark,A.G.,Principles of Population Genetics,Third Edition (Sinauer Associates,Inc.,Sunderland Massachusetts,1997),特 别是第一章和第二章。
这些微阵列可用于检测来自受试者的样本中的多态性等位基因。这 些等位基因可表明受试者对病毒感染是更易感还是对病毒感染不易感。 例如,由于本发明表明表1所述任何基因的破坏都可导致病毒感染减轻, 因此这种微阵列可用于检测使得基因表达减少和/或基因产物的活性减 弱的表1所述基因的多态形式,由此鉴定对病毒感染不易感的受试者。
基质可为多核苷酸探针可附着其上的任何基质,包括但不限于玻璃、 硝酸纤维素和尼龙。多核苷酸探针可通过共价键或通过非特异性相 互作用如疏水性相互作用结合到基质上。构建阵列的技术以及使用这些 阵列的方法描述于EP No.0 799 897、PCT No.WO97/29212、PCT No.WO 97/27317、EP No.0 785 280、PCT No.WO97/02357、U.S.Pat. No.5,593,839、5,578,832、EP No.0 728 520、U.S.Pat.No.5,599,695、 EP No.0 721 016、U.S.Pat.No.5,556,752、PCT No.WO95/22058和U.S. Pat.No.5,631,734。还可使用可商购的多核苷酸阵列例如Affymetrix GeneChip.TM.。使用GeneChip.TM来检测基因表达描述于例如Lockhart et al.,Nature Biotechnology 14:1675(1996);Chee et al.,Science 274:610(1996);Hacia et al.,Nature Genetics 14:441,1996;和 Kozal et al.,Nature Medicine 2:753,1996。
可将基因产物的水平与未与化合物接触的对照细胞中的基因产物的 水平相比较。可将基因产物的水平与加入化合物前相同细胞中的基因产 物的水平相比较。活性或功能可通过任何标准方法测量,所述任何标准 方法例如测量底物转化成产物的酶分析或者测量蛋白质与核酸结合的结 合分析。
另外,基因的调控区域可功能性连接至报告基因,并就对报告基因 的抑制作用对化合物进行筛选。这种调控区域可与基因组序列分离,并 可通过任何观察到的呈现物种的调控区域特征的特征,以及可通过它们 与基因编码区的起始密码子的关系得到鉴定。本文所使用的报告基因编 码报告蛋白质。报告蛋白质为表达时可被特异性检测的任何蛋白质。报 告蛋白质可用于检测或定量表达序列的表达情况。很多报告蛋白质为本 领域的技术人员已知。这些报告蛋白质包括但不限于产生特异性可检测 产物的β-半乳糖苷酶、萤光素酶和碱性磷酸酶。还可使用荧光报告蛋白 质例如绿色荧光蛋白(GFP)、蓝绿色荧光蛋白(CFP)、红色荧光蛋白(RFP) 和黄色荧光蛋白(YFP)。
病毒感染还可通过以细胞为基础的分析进行测量。简而言之,用所 需病原体感染细胞(20000至2500000个),然后连续培养3-7天。可以 在用病原体感染之前、期间或之后将抗病毒药剂施用至细胞。给予的病 毒和药剂的量可由本领域的技术人员确定。在某些实例中,可给予几种 不同剂量的潜在治疗剂来确定最佳剂量范围。转染之后进行分析来测定 不同药剂引起的细胞对感染的抗性。
例如,若分析病毒感染,病毒抗原是否存在可通过使用特异性针对 病毒蛋白质的抗体并随后检测该抗体来进行测量。在一个实例中,特异 性结合病毒蛋白质的抗体被例如可检测标记如荧光团标记。在另一实例 中,抗体可通过使用含有标记的二抗检测。然后使用例显微镜、流式 细胞术和ELISA检测是否存在结合抗体。
或者,另外,细胞经历病毒感染后存活的能力可例如通过进行细胞 活力分析例如台盼蓝排除试验测定。
细胞中的表1所列蛋白质的量可通过本领域对细胞中的蛋白质进行 定量的标准方法,以及现在已知的或随后将被开发用来对细胞中的蛋白 质或由细胞产生的蛋白质进行定量的任何其它方法测定,所述标准方法 例如Westerr印迹、ELISA、ELISPOT、免疫沉淀、免疫荧光(例如FACS)、 免疫组织化学、免疫细胞化学等。
细胞中的表1所列核酸的量可通过本领域用于对细胞中的核酸进行 定量的标准方法测定,以及通过现在已知的或随后将被开发用来对细胞 中的核酸进行定量的任何其它方法测定,所述标准方法例如为原位杂交、 定量PCR、RT-PCR、Taqman分析、Northern印迹、ELISPOT、点印迹等。
可在动物模型中对抗病毒药剂预防或减轻病毒例如HIV、Ebola、A 型流感病毒、SARS、天花病毒等感染的能力进行评价。几种用于病毒感 染的动物模型为本领域已知。例如,小鼠HIV模型公开于Sutton et al. (Res.Initiat Treat.Action,8:22-4,2003)和Pincus et al.(AIDS Res.Hum.Retroviruses 19:901-8,2003);Ebola感染的豚鼠模型公 开于Parren et al.(J.Virol.76:6408-12,2002)和Xu et al.(Nat. Med.4:37-42,1998);流感感染的食蟹猴(Macaca fascicularis)模 型公开于Kuiken et al.(Vet.Pathol.40:304-10,2003)。这些动物 模型还可用来测试药剂缓解与病毒感染相关症状的能力。另外,这些动 物模型可用来测定对受试动物的LD50和ED50,并且这些数据可用来确定 潜在药剂在体内的效力。动物模型还可用来评价抗细菌药剂、抗真菌药 剂和抗寄生物药剂。
如若需要,任何物种的动物包括但不限于鸟、小鼠、大鼠、兔、豚 鼠、猪、小型猪(micro-pig)、山羊以及除人外的灵长类例如狒狒、猴 和猩猩可用来形成病毒感染、细菌感染、真菌感染或寄生物感染的动物 模型。
例如,对于病毒感染模型,可用所需病毒在有或没有抗病毒药剂存 在下对合适的动物接种。给予的病毒和药剂的量可由本领域的技术人员 确定。在某些实施例中,可将几种不同剂量的潜在治疗剂(例如抗病毒 药剂)给予不同测试受试者来鉴定最佳剂量范围。治疗剂可在病毒感染 之前、期间或之后给予。治疗之后,就恰当的病毒感染的发展情况和与 之相关的症状对动物进行观察。若药剂存在时,恰当的病毒感染的发展 有所减缓或者与之相关的症状有所缓解,则可提供证据表明该药剂为可 用来减轻甚或抑制受试者体内病毒感染的治疗剂。
本发明还提供了一种制备减轻感染的化合物的方法,包括:a)合成 化合物;b)将化合物给予含有表1所述细胞基因的细胞;c)将细胞与 感染性病原体相接触;c)检测感染水平;d)将感染水平与表1中基因 的表达水平或表1中基因编码的蛋白质的活性相关联,感染的减轻或消 失与基因表达和/或活性的减少或消失相关就表明制备得到了减轻感染 的化合物。
还提供了一种制备减轻感染的化合物的方法,包括:a)将化合物给 予含表1所述细胞基因的细胞,b)将细胞与感染病原体相接触;c)检 测感染水平;d)将感染水平与表1中基因的表达水平或表1中基因编码 的蛋白质的活性相关联,感染的减轻或消失与基因表达和/或活性的减少 或消失相关就表明化合物为减轻感染的化合物;以及e)将化合物置于可 药用载体内。减轻感染的化合物可为抗病毒化合物、抗细菌化合物、抗 真菌化合物或抗寄生物化合物或任何减轻感染物感染的化合物。
转基因细胞和非人类哺乳动物
包括重组和基因敲除动物在内的转基因动物模型可用本文所述宿主 核酸产生。示例性非人类转基因哺乳动物包括但不限于小鼠、兔、大鼠、 鸡、牛和猪。本发明提供了这样一种转基因非人类哺乳动物,它具有表1 所列一种或多种基因的基因敲除,并且对病原体例如病毒、细菌、真菌 和寄生物感染的敏感性降低。这种基因敲除动物可用来减少病毒从动物 到人的传播。在本发明的转基因动物中,表1所述一种或多种基因的一 个或两个等位基因可被敲除。
“敏感性降低“表示,与表1中基因的一个或两个等位基因没有被 基因敲除或功能性缺失的动物相比,动物不易被感染或动物所经历的病 原体感染有所减轻。动物不必对病原体具有完全的抗性。例如,与表1 所述基因没有功能性缺失的动物相比较,动物对病原体感染的敏感性可 降低10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或其间任何 百分比。另外,感染减轻或感染敏感性降低包括减少进入、复制、发病、 插入、溶解或病毒或其它病原体进入细胞或受试者的复制过程中的其它 步骤,或它们的组合。
因此,本发明提供了一种功能性缺失了表1所述一种或多种基因的 非人类转基因哺乳动物,其中哺乳动物对病原体如病毒、细菌、寄生物 或真菌感染的敏感性降低。功能性缺失为突变、部分或完全缺失、插入 或对基因序列进行的其它改变,这些功能性缺失抑制基因产物的产生或 使得基因产物功能不完全或丧失功能。
用于基因敲除或功能性缺失目的基因的序列的表达可受到恰当启动 子序列的调节。例如,组成型启动子可用来确保动物不表达功能性缺失 基因。相反,诱导型启动子可用于在转基因动物表达或不表达目的基因 时进行调控。示例性诱导型启动子包括组织特异性启动子和对特定刺激 物(如光、氧、化学品浓度等,如四环素诱导型启动子)做出反应或不 做出反应的启动子。
例如,具有被破坏的表1所述基因的转基因小鼠或其它转基因动物 可在暴露于不同病原体期间被检查。从比较数据可对病原体的生命周期 有所了解。另外,可制备不进行基因敲除时会对感染(例如流感)敏感 的基因敲除动物(如猪)来对抗感染,这归功于基因的破坏。若转基因 动物中基因的破坏使得对抗感染的抗性增加,则可繁殖这些转基因动物 来建立不易感染的动物群。
转基因动物包括制备和使用转基因动物的方法描述于多个专利和公 布文本中,例如WO01/43540、WO02/19811、U.S.Pub.No:2001-0044937 和2002-0066117以及U.S.Pat.No:5,859,308、6,281,408和6,376,743, 以及文中引用的参考文献。
本发明的转基因动物还包括例如通过采用SIRIUS-Cre系统产生的 条件基因敲减的动物,所述SIRIUS-Cre系统可将特异性敲减基因的 s iRNA、组织特异性表达的Cre-loxP和诱导表达的四环素-on结合起来。 这些动物可通过在四环素控制的条件下用含有组织特异性重组酶和目的 基因的特异性SiRNA的两个亲本品系进行交配产生。参见Chang et al. “Using siRNA Technique to Generate Transgenic Animals with Spatiotemporal and Conditional Gene Knockdown.”American Journal of Pathology 165:1535-1541(2004),就条件性基因敲减动物的产生, 通过援引将其全文纳入本文。
本发明还提供了含有有所改变或被破坏的表1所列基因的细胞,这 些细胞对病原体感染有抗性。这些细胞可为体外、离体或体内的细胞, 并且其一个或两个等位基因可发生变化。因此这类细胞包括对HIV感染、 Ebola感染、禽流感、A型流感病毒或本文所描述的任何其它病原体包括 细菌、寄生物和真菌的敏感性有所降低的细胞。
就感染抗性进行筛选
本文还提供了就感染抗性对受试宿主进行筛选的方法,所述方法通 过表征宿主核酸的核苷酸序列或宿主多肽的氨基酸序列(例如表1所示 的核苷酸序列或氨基酸序列)而进行。例如,可分离受试者的ANXA1核 酸,对其测序并与ANXA1的野生型序列进行比较。受试者ANXA1核酸与 野生型ANXA1序列之间的相似性越大,则该受试者对感染就越敏感,而 受试者ANXA1核酸与野生型ANXA1序列之间的相似性越小,则该受试者 对感染的抵抗力就越强。这种筛选可针对任何物种中的表1所述任何宿 主核酸或宿主多肽的氨基酸序列进行。
对群体遗传特征的评价可提供关于该群体对病毒感染的敏感性或抗 性的信息。例如,在特定人群例如特定城市或地理位置的人群中等位基 因的多态性分析可表明该群体对感染的易感程度。与表1所列野生型序 列基本相似的等位基因百分比越高,就表明该群体对感染越敏感,而与 表1所述野生型序列基本不同的大量多态性等位基因表明该群体对感染 的抵抗力更强。这种信息可用于对例如关于对易感群体进行接种作出公 共卫生决定。
本发明还提供了一种就表1所列基因的变体形式对细胞进行筛选的 方法。变体可为具有使得基因产物的量或活性发生变化的功能性缺失、 突变或基因发生改变的基因。可将这些含有表1所列基因的变体形式的 细胞与病原体相接触,来测定含有表1所列基因的天然存在的变体的细 胞是否在其感染抗性方面有所不同。例如,可就表1所列基因的变体形 式对动物例如鸡等的细胞进行筛选。若发现有天然存在的变体,并且在 其基因组中具有基因变体形式的鸡不易感染,则可选择性繁殖这些鸡来 建立具有感染抗性的鸡群。通过使用这些方法,可建立对抗禽流感的鸡 群。同样,可就表1所列基因的变体形式对其它动物进行筛选。若发现 有天然存在的变体,并且在其基因组中具有基因变体形式的动物不易感 染,则可选择性繁殖这些动物来建立具有感染抗性的群体。这些动物包 括但不限于猫、狗、家畜(例如牛、马、猪、绵羊、山羊等)、实验动物 (例如小鼠、兔、大鼠、沙土鼠、豚鼠等)和禽类(例如鸡群、鹅群、 火鸡群、鸭群、雉群、家鸽群、野鸽群等)。因此,本申请提供了具有表 1所列基因的天然存在变体的动物群,所述天然存在变体可使得对病毒感 染敏感性降低,由此提供对不易感染病毒的动物群。同样,若发现有天 然存在的变体,并且在其基因组中具有基因变体形式的动物对细菌、寄 生物或真菌感染不易感,则可选择性繁殖这些动物来建立对细菌、寄生 物或真菌具有感染抗性的群体。
抑制感染的方法
本发明还提供了一种抑制细胞中的感染的方法,包括抑制表1所列 基因或基因产物的表达或活性。如全文所述,感染可为病毒感染、细菌 感染、真菌感染或寄生物感染等等。抑制可出现在体外、离体或体内的 细胞中。表1的一种或多种基因的表达可被抑制。同样,表1所列一种 或多种基因产物的活性也可被抑制。对表达的抑制或减少不必是完全的, 因为这可从表达略有降低到表达完全消失。例如,与其中表1所列基因 表达未被抑制的对照细胞相比较,表达可被抑制约5%、10%、20%、30%、 40%、50%、60%、70%、80%、90%、95%、99%、100%或其间任何百分比。 同样,对基因产物的活性的抑制或降低不必是完全的,因为这可从基因 产物的活性略有降低到活性完全消失。例如,与其中表1所述基因产物 的活性未被抑制的对照细胞相比较,基因产物的活性可被抑制约5%、10%、 20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或其间任 何百分比。
反义寡核苷酸、RNAi分子、核酶和siRNA分子可用来干扰表达和/ 或降低基因产物的活性。小分子、药物、抗体、蛋白质和化学品也可用 来抑制表达和/或基因产物的活性。可以减少表1所述基因的表达和/或 基因产物的活性的反义寡核苷酸、RNAi分子、核酶、siRNA、小分子、化 学品、抗体蛋白质、cDNA和任何其它现已知的或今后将会被鉴定的化合 物均可单独使用,或与其它治疗剂例如抗病毒化合物、抗细菌药剂、抗 真菌剂、抗寄生物药剂、抗炎剂、抗癌剂等一起使用。
抗病毒化合物的实例包括但不限于用于治疗流感及其相关症状的金 刚烷胺、金刚乙胺、扎那米韦和奥塞米韦(达菲)。用于治疗HIV的抗病 毒化合物包括双汰芝_(拉米夫定-齐多夫定)、佳息患_(茚地那韦)、 Emtriva_(恩曲他滨)、Epivir_(拉米夫定)、沙奎那韦软凝胶剂_(沙奎那 韦-sg)、Hivid_(扎西他滨)、Invirase_(沙奎那韦-hg)、Kaletra_(洛匹 那韦-利托那韦)、LexivaTM(福沙那韦)、诺韦_(利托那韦)、Retrovir_(齐 多夫定)、Sustiva_(依法韦仑)、惠妥滋EC_(去羟肌苷)、惠妥滋_(去羟 肌苷)、Viracept_(奈非那韦)、维乐命_(奈韦拉平)、赛瑞特_(司他夫定)、 赛进_(阿巴卡韦)、Fuzeon_(恩夫韦地)、Rescriptor_(地拉韦啶)、 Reyataz_(阿扎那韦)、三协唯_(阿巴卡韦-拉米夫定-齐多夫定)、 Viread_(替诺福韦延胡索酸双异丙酰氧基甲酯)和Agenerase_(安泼那 韦)。其它用于治疗Ebola和其它纤丝病毒的抗病毒化合物包括利巴韦林 和蓝藻菌病毒素-N(cyanovirin-N,CV-N)。对于疱疹病毒的治疗可用舒 维疗_(阿昔洛韦)。抗细菌药剂包括但不限于抗生素(例如青霉素和氨苄 青霉素)、磺胺药物和叶酸类似物、β-内酰胺、氨基糖苷类、四环素、 大环内酯、林可酰胺、链阳性菌素、氟喹诺类、利福平、莫匹罗星、 环丝氨酸、氨基环多醇和噁唑烷酮类。
抗真菌药剂包括但不限于两性霉素、制霉菌素、特比芬、伊曲康 唑、氟康唑、酮康唑、灰黄菌素。
抗寄生物药剂包括但不限于驱肠虫药、驱线虫药、驱扁虫药 (antiplatyhelmintic agent)、抗原生动物药、杀阿米巴药、抗疟药、 抗毛滴虫药、aoccidiostats和杀锥虫药。
本发明提供了一种减轻或抑制受试者感染的方法,包括给予受试者 一定量抑制表1的基因或基因产物的表达或活性的组合物。如全文所述, 感染可来自任何病原体,例如病毒、细菌、真菌或寄生物。对感染的减 轻或抑制不必是完全的,因为这可从感染略微减轻到感染完全消除。例 如,在本文所述方法中,感染可减轻10%、20%、30%、40%、50%、60%、 70%、80%、90%、95%、100%或其间的任何百分比。这种减轻可导致感染 引起症状的缓解至感染彻底消除。但是,对于减轻或抑制受试者的感染, 只要有效地减轻感染相关症状或有效地使得受试者对感染不易感就可以 了,并不一定要使感染彻底消除。
全文所使用的预防感染指的是抑制感染的发展。在提及治疗时,它 是指缓解与感染相关的疾病或病理状态的征候或症状,例如抑制或减轻 病毒感染,而并不需要完全缓解症状或感染。
本发明还提供了一种减轻或抑制受试者感染的方法,包括离体条件 下在所选定的来自受试者的细胞中,将表1所列基因突变成不能产生该 基因的功能性基因产物的突变基因,或将表1所列基因突变成产生的该 基因的功能性基因产物的量有所降低的突变基因,然后替换受试者体内 的细胞,由此减轻受试者体内的细胞感染。
任何可被病毒或其它病原体例如细菌、真菌或寄生物感染的细胞均 在本发明考虑范围之内。宿主细胞可为原核细胞或真核细胞如来自昆虫、 甲壳动物、哺乳动物、鸟、爬行动物、酵母或细菌如大肠埃希氏菌等的 细胞。示例性宿主细胞包括但不限于:哺乳动物的B淋巴细胞、造血细 胞、胚胎干细胞、胚胎生殖谱系细胞、多能干细胞和全能干细胞。
例如,易感染或遭受了感染的受试者可用治疗有效量的反义寡核苷 酸、RNAi分子、核酶或siRNA分子(或它们的组合)治疗。反义寡核苷 酸、RNAi分子、核酶或siRNA分子起效(观察到病毒感染水平降低,或 者病毒感染相关症状减轻)后,例如24-48小时后,可就病毒感染相关 症状对受试者进行监控。
同样,其它药剂例如可与表1的宿主蛋白质相互作用的抗体、多肽、 小分子或其它药物也可用于减轻病毒感染。这种相互作用可以是直接的, 例如与宿主蛋白质相结合,也可为间接的,例如与和表1所述宿主蛋白 质相互作用的蛋白质相结合或对其进行调节。抗体、多肽、小分子或其 它药物起效(观察到病毒感染水平降低,或者病毒感染相关症状减轻) 后,例如24-48小时后,可就病毒感染相关症状对受试者进行监控。还 可给予受试者治疗有效量的其它药剂例如肽和有机分子或无机分子。
本文所公开的治疗方法还可以预防方式用于例如抑制或预防感染例 如病毒感染、细菌感染、真菌感染或寄生物感染。在已表明治疗方法可 用于治疗或预防病变的情况下需要这种给药。在已知的或疑似的正发展 为感染相关病症中,需要这种预防应用。
在某些情况下,某些基因由于本发明方法的反转录病毒的插入而受 到破坏,会导致基因产物的过表达,并且这种过表达抑制了病毒复制。 例如,一旦破坏了含有CTCF的序列的基因组基因座,就会导致IGF2的 过表达,由此减少病毒复制。因此,本发明提供了一种通过使可减少病 毒复制的基因过表达来减少或抑制病毒复制的方法。本发明方法还提供 了一种增加基因表达的方法,所述基因的过表达可通过破坏一种基因或 抑制一种基因的基因产物来减少病毒复制,由此可增加基因表达,而该 基因的过表达使病毒复制减少。例如,可抑制CTCF来增加IGF2的表达。 这对任何已被发现的可增加另一种基因的表达的基因而言是相似的,并 且这会使得病毒复制减少。
一旦发现某种基因被破坏就会导致另一种基因的过表达,则该过表 达基因可直接被调节,即通过该过表达基因直接调节,或者也可间接被 调节,即通过最初被破坏的基因(或其基因产物)或通过另一种与过表 达基因相关的基因(或其基因产物)间接调节。
因此,本发明提供了一种鉴定出可增加基因的表达和/或基因产物的 活性的药剂的方法,包括将细胞与药剂相接触并测量基因表达和/或基因 产物的活性的增加。
本发明还提供了一种鉴定通过基因的过表达和/或基因产物活性的 增加来减轻或抑制感染的药剂的方法,包括将药剂给予细胞,使细胞与 病原体相接触,并将基因表达和/或该基因产物活性的增加与感染水平相 关联,这样与感染减轻相伴随的基因表达和/或基因产物活性的增加可表 明药剂是通过基因的过表达和/或基因产物的活性增加来抑制病原体感 染。
例如,本领域的技术人员可给予可引起IGF2过表达的化合物。该化 合物可与IGF2基因、IGF2 mRNA、IGF2蛋白质或其片段相互作用。人IGF2 基因及其相关序列的信息可参见Entrez基因编号3481。该化合物还可与 CTCF基因、CTCF mRNA、CTCF蛋白质或其片段相互作用来增加IGF2表达。 该化合物还可与参与IGF2途径的其它基因、mRNA或蛋白质相互作用,使 得IGF2表达增加。
因此,若基因X的破坏引起基因Y的过表达,则过表达的基因(Y) 可被直接调节,即通过过表达的基因(Y)直接调节,也可被间接调节, 即通过最初被破坏的基因(X)(或其基因产物)或通过另一种与过表达 基因(Y)相关的基因(或其基因产物)间接调节。例如,本领域的技术 人员可给予可引起Y过表达的化合物。该化合物可与Y基因、Y mRNA或 Y蛋白质相互作用。该化合物还可与X基因、X mRNA或X蛋白质相互作 用来增加Y表达。该化合物还可与参与Y基因途径(即基因Y参与的细 胞途径)的其它基因、mRNA或蛋白质相互作用,使得Y表达提高。
药物组合物和给药方式
已知有多种用于给予本文公开的治疗剂的送递系统,这些送递系统 包括以脂质体、微粒、微囊形式的胶囊化、由重组细胞表达、受体介导 的胞吞作用(Wu and Wu,J.Biol.Chem.1987,262:4429-32)以及将 治疗核酸构建为反转录病毒载体或其它载体的一部分。引入方法包括但 不限于粘膜、局部、真皮内、肌内、腹膜内、阴道、直肠、静脉内、皮 下、鼻内和口服途径。化合物可通过任何便利途径例如通过输注或推注 注射、通过上皮或粘膜被覆层(例如口腔粘膜、直肠、阴道或肠粘膜等) 吸收给药,并且可与其它具有生物活性的药剂一起给药。给药可为全身 给药或局部给药。药物组合物可例如通过局部施用或局部注射而局部送 递至需要治疗的区域。
公开的药物组合物可包括单独的治疗有效量的RNA、DNA、反义分子、 核酶、siRNA、分子、药物、蛋白质、抗体或其它治疗剂,或者还可包括 和可药用载体一起的上述物质。另外,药物组合物或治疗方法可与其它 治疗方法例如其它抗病毒药剂、抗细菌药剂、抗真菌药剂和抗寄生物药 剂一起(例如之前、期间或之后)给予或进行。
送递系统
本文所使用的可药用载体是常规的。Remington’s Pharmaceutical Sciences,by Martin,Mack Publishing Co.,Easton,PA,15th Edition (1975)中描述了适用于本文公开的治疗剂的药物送递的组合物和制剂。 通常,载体的性质要根据所采用的给药方式而定。例如,胃肠外制剂通 常包括可注射的流体,所述流体包括药学和生理学上可接受的、作为载 体的流体例如水、生理盐水、平衡盐溶液、葡萄糖水溶液、麻油、丙三 醇、乙醇、或它们的组合等。载体和组合物可为无菌的,并且制剂与给 药方式相适应。除了生物学上中性的载体外,待给药的药物组合物可含 有少量的无毒辅助性物质例如润湿剂或乳化剂、防腐剂和pH缓冲剂等, 例如醋酸钠或脱水山梨醇单月桂酸酯。
组合物可为液体溶液、悬浮剂、乳剂、片剂、丸剂、胶囊、缓释制 剂或粉剂。对于固体组合物(例如粉剂、丸剂、片剂或胶囊形式)而言, 常规无毒固体载体可包括例如药用级甘露醇、乳糖、淀粉、糖精钠、纤 维素、碳酸镁或硬脂酸镁。组合物可用常规粘合剂和载体如甘油三酯制 备成栓剂。
本领域的技术人员应知晓,所公开的包括药剂在内的实施方案可由 常规药用载体、佐剂和抗衡离子制备得到。
有效减轻或抑制感染的治疗剂的量取决于病原体的性质及其引起的 病变或病症,并且可用标准的临床技术确定。因此,这些量会随病毒、 细菌、真菌、寄生物或其它病原体的类型发生变化。另外,可采用体外 分析来确定最佳剂量范围。制剂中采用的精确剂量还取决于给药途径和 疾病或病变的严重程度,并应该根据技术人员的判断和每名受试者的情 况确定。有效剂量可从来源于体外测试系统或动物模型测试系统的剂量- 反应曲线推知。
本公开还提供了药包或药盒,它包括一个或多个装有药物组合物的 一种或多种成分的容器。任选地,该容器还配有一份公告,该公告的形 式是由管理药物或生物产品的制造、使用或销售的政府部门所规定的形 式,该公告表明该药物组合物得到了人类用药的制造、使用或销售的管 理部门的批准。还可包括组合物的使用说明。
在采用核酸例如反义或siRNA分子来减轻感染例如病毒感染的一个 实例中,核酸可通过如下方式送递:通过细胞内送递(例如通过核酸载 体的表达或通过受体介导机制);或通过给予至细胞内的恰当核酸表达载 体,例如通过使用反转录病毒载体(参见美国专利No.4,980,286);或 通过直接注射;或通过使用微粒轰击(例如基因枪;Biolistic,Dupont); 或用脂质或细胞表面受体或转染剂包被;或通过将其与同源框样肽 (homeobox-like peptide)相连接给予,已知该同源框样肽可进入细胞 核(例如Joliot et al,Proc.Natl.Acad.ScL USA 1991,88:1864-8)。 本公开包括所有形式的核酸送递,包括合成的Oligo、裸DNA、质粒和病 毒送递(不论是否整合至基因组)。
如上所述,载体送递可借助病毒系统例如可包装重组反转录病毒基 因组的反转录病毒载体系统(参见例如Pastan et al.,Proc.Natl.Acad. SciU.S.A.85:4486,1988;Miller et al.,MoI.Cell.Biol.6:2895, 1986)。然后重组反转录病毒可用来感染并由此将核酸例如反义分子或 siRNA送递至感染细胞。当然,将发生变化的核酸引入哺乳动物细胞的具 体方法并不限于使用反转录病毒载体。该方法可广泛采用其它技术,包 括如下载体的使用:腺病毒载体(Mitani et al.,Hum.Gene Ther.5:941 -948,1994)、腺伴随病毒(AAV)载体(Goodman et al.,Blood 84: 1492-1500,1994)、慢病毒载体(Naidini et al.,Science 272:263-267, 1996)和假型反转录病毒载体(Agrawal et al.,Exper.Hematol.24:7 38-747,1996)。还可使用其它非病原体载体系统例如泡沫病毒载体(Park et al.″Inhibition of simian immunodeficiency virus by foamy virus vectors expressing siRNAs.″Virology.2005 Sep 20)。还可通过载 体送递系统来送递短发夹RNA(shRNA),目的是抑制基因表达(参见 Pichler et al.″In vivo RNA interference-mediated ablation of MDR1 P-glycoprotein.″Clin Cancer Res.2005 Jun 15;11(12):4487-94;Lee et al.″Specific inhibition of HIV-I replication by short hairpin RNAs targeting human cyclin T1 without inducing apoptosis.″FEBS Lett.2005 Jun 6;579(14):3100-6.)。
还可使用物理转导技术例如脂质体送递和受体介导的胞吞机制以及 其它胞吞机制(参见例如Schwartzenberger et al.,Blood 87:472-478, 1996)等实例。本发明可与任意上述或其它常用基因转移方法一起使用。
本申请通篇引用了多篇出版物。这些出版物的公开内容通过援引全 文纳入本申请,目的是为了充分描述与本发明相关的现有技术
对于本领域的技术人员而言显而易见的是,在不背离本发明的范围 或精神的条件下,本发明可有多种修改和改变。通过考虑在此公开的本 发明的说明书及其实施,本发明的其它实施方案对于本领域的技术人员 是显而易见的。说明书和实施例仅旨在示例,而本发明的真实范围和精 神由下面的权利要求书指明。
实施例
病毒为在其生命周期中的不同阶段均依赖于宿主细胞专性细胞内寄 生物。病毒感染和/或细胞杀伤所需的细胞基因的特征对理解病毒生命周 期很重要,并且可为新的抗病毒治疗方法提供细胞靶标。
溶解性反转录病毒感染所需的候选基因可由标记序列诱变法鉴定, 这是一种可快速鉴定基因捕获所破坏的基因的方法。从含有2×105个独 立的被破坏基因的细胞文库中筛选出了一百五十一个反转录抗性克隆, 其中有111个克隆在先前表征的基因和功能未知的转录单位中含有突变。 总而言之,与反转录病毒抗性相关的基因不同于被随机基因捕获靶中的 基因,表现在已知突变热点未被充分表示出来,并且很多突变似乎集中 在特定细胞过程中,包括:IGF-II表达/信号传导、囊泡转运/细胞骨架 运输和细胞凋亡。
标记序列诱变法提供了一种在基因组范围内快速鉴定病毒感染所需 候选细胞基因的方法。
细胞基因可能参与病毒生命周期的全部阶段,包括附着至细胞受体、 内化、分解、mRNA的翻译、组装和脱离细胞[1]。不同细胞类型对病毒感 染的敏感性大不相同,并且感染后期经常会出现病毒抗性细胞[2-4]。这 表明遗传决定因子会影响对病毒生命周期有贡献的宿主细胞。尽管有影 响病毒感染的哺乳动物基因的实例,但是由于缺乏对培养细胞进行遗传 分析的实用方法,使得对这类基因的鉴定受到阻碍。本研究中,不论标 记序列诱变法——一种广泛用于对小鼠胚胎干细胞中的基因进行突变的 基因捕获方法[5-10]——是否被用来鉴定反转录病毒引起的溶解性感染 所必需的候选细胞基因,均对在细胞质中复制的小型溶细胞RNA病毒进 行测试。由于哺乳动物反转录病毒能够优先在增殖细胞和未分化细胞中 复制,它们可作为病毒-宿主细胞相互作用的有用模型[3]。
基因捕获为在小鼠的研究中评价得到的最初在胚胎干细胞中诱导突 变的有效突变剂。体细胞中,该方法假定基因捕获法引起的功能丧失突 变由于基因剂量效应(例如单剂量不足)、已有的杂合性或杂合性的丧失 可赋予反转录病毒抗性。在用U3NeoSV1反转录病毒基因捕获穿梭载体感 染后,分离经诱变得到的大鼠肠上皮(RIE)-1细胞克隆的文库,其中每 个克隆含有被原病毒整合所破坏的单个基因[6]。用1型反转录病毒感染 捕获文库,还可在针对不存在细胞突变时表现出病毒抗性的持续感染细 胞(PI)出现进行选择的条件下筛选抗病毒克隆[4]。通过对与捕获载体 毗邻的基因组DNA区域进行测序,鉴定了总共151种抗反转录病毒细胞 中的被破坏的基因[6];其中,有111种在之前表征的基因和未知转录单 位中含有突变。
抗反转录病毒的克隆从捕获文库中选出的频率较从未诱变细胞中选 出的频率要高,表明抗反转录病毒表型是由基因捕获诱变引起的。但是 在任何遗传筛选中,具有所选择表型的克隆都可能是由于自发突变产生 的,因此需要其它实验来证明基因捕获所破坏的个体基因实际上对抗反 转录病毒表型有贡献。例如,胰岛素生长因子II(IGF-II)的转录阻遏 物Ctcf的突变是与影响IGF-II表达和/或信号传导的反转录病毒抗性相 关的4种突变之一。随后的实验表明增强的IGF-II表达足以赋予高水平 的反转录病毒抗性[4]。简而言之,在一系列抗反转录病毒克隆中通过标 记序列诱变共同鉴定的基因为对参与病毒生命周期的细胞过程的机制研 究提供了候选物。由于被破坏的基因并不会对细胞存活有不利影响,因 此,抑制由这些基因编码的蛋白质的药物预计不会对细胞产生明显的毒 性。因此,候选基因还可包括新的抗病毒治疗的靶标。
RIE-1、L-细胞和病毒:
1型反转录病毒毒株Lang最初获自Bernard N.Fields。病毒在L- 细胞中传代,并在先前已有描述的CsC1梯度溶液中对第三代毒株进行纯 化并将其用于这些实验[59]。为开发PI细胞系,用1型反转录病毒感染 RIE-1细胞,感染复数(MOI)为5,存活细胞在达尔伯克(氏)改良伊格 尔(氏)培养基(DMEM)(Irvine Scientific,Santa Ana,CA,USA)中培 养。表达作为即刻早期基因的报告基因lacZ的单纯疱疹病毒(HSV)-1 克隆HSV-1 KOStk12由Patricia Spear,Northwestern University, USA馈赠。对于RIE-1和L-细胞,培养基中添加了10%胎牛血清、2mM/ml L-谷氨酰胺、100单位/ml青霉素和100μg/ml链霉素(Irvine Scientific, Santa Ana,CA,USA)[完全培养基]。在某些实验中,培养基中没有血 清。反转录病毒或HSV-1感染后的细胞单层的维持时间由甲紫染色测定。
标记序列诱变和反转录病毒抗性的筛选
在RIE-1细胞被U3neoSV1载体感染(MOI为0.1)后,在含有1mg/ml G418硫酸盐(Clontech,Palo Alto,CA,USA)的培养基中就新霉素抗 性筛选诱变细胞[6]。使二十个文库的突变体RIE-1细胞以及一个文库的 A549人腺癌细胞(每个文库由104基因捕获事件组成)增殖,直到约103 同胞细胞代表每个突变克隆。以亚汇合密度将这些细胞铺板并在无血清 培养基中培养3天,直至它们休眠,然后用血清型1型反转录病毒感染 (MOI为每个细胞35个噬斑形成单位(pfu))。感染18小时后,用胰蛋 白酶使细胞脱离,并在含有10%胎牛血清(FBS)(Hyclone Laboratories, Inc.,Logan,Utah,USA)的培养基铺板。6hr后,除去培养基,将细 胞在无血清培养基中培养,直至仅有少数细胞还贴附在培养瓶中。平均 而言,从含有107个突变细胞组成的文库中回收了一至十个克隆(所选择 细胞的富集度为六个数量级)。将在筛选中存活的细胞转移至装有培养基 (含有10%FBS)的细胞培养板,并将细胞分为用于DNA提取的和深低温 保藏的。
HSV-1即刻早期基因报告基因的转录和翻译
HSV-1即刻早期基因报告基因lacZ的转录和翻译分别由标准 Nor thern印迹技术和β-半乳糖苷酶分析测定。
诱变的RIE-1细胞文库的形成
将诱变细胞文库用血清型-1型反转录病毒毒株Lang感染来筛选抗 溶解性感染的克隆。在无血清培养基中进行抗病毒克隆的筛选,以遏制 持续性感染(PI)细胞的出现[4]。这是很重要的,因为在病毒和细胞基 因组中由包括适应性突变的过程产生的PI细胞提供了一种使RIE-1细胞 不进行细胞突变就可获得病毒抗性的手段。未感染RIE-1细胞发生生长 抑制,而PI RIE-1细胞在无血清培养基中被杀死。
DNA序列分析:
130个细胞系中的每个细胞系中紧邻原病毒插入物的5’端的基因组 DNA通过质粒拯救进行克隆[6]。对约300至600个碱基对的该侧翼DNA 进行测序并与非冗余(nr)的、表达的序列标记(dbEST)核酸数据库进 行比较[61]。数据库中具有正向同源序列的匹配概率根据种间变异、侧 翼DNA中外显子的量(在侧翼DNA与cDNA序列匹配的情况下)、交替剪 接和测序错误而有所不同。若概率得分<10-5并且序列为非重复的,则数 据库中的序列的匹配被认为有潜在意义的。大部分情况下,匹配基因与 原病毒位于相同的转录位置。并且,涉及cDNA序列的匹配在侧翼基因组 DNA中的外显子上为共线性,而在剪接位点趋异。如所叙述那样,实际上 鉴定的所有基因以p<10-10与鼠、大鼠或人基因序列匹配。
标记序列诱变和抗反转录病毒基因克隆的筛选
在二十个文库的诱变RIE-1细胞(每个文库代表约104独立基因捕获 事件)被U3NeoSV1基因捕获反转录病毒感染后对其进行分离。U3NeoSV1 在病毒长末端重复(LTR)的U3区域中含有新霉素抗性基因的编码序列。 就新霉素抗性所进行的筛选产生具有原病毒插入活性转录基因内的克 隆。从每个捕获文库中收集到的细胞分别以感染复数35用1型反转录病 毒感染,并在无血清培养基中筛选抗反转录病毒克隆以遏制持续性感染 (PI)细胞的出现(ref)。分离了总共151种抗反转录病毒克隆——约1 个突变体/103个基因捕获克隆或1个突变/107反转录病毒感染细胞。为进 行比较,从未进行基因捕获诱变的RIE-1细胞中回收抗性克隆的频率小 于10-8。这表明抗反转录病毒表型由基因捕获诱变所致。
无血清培养基中筛选的抗反转录病毒细胞不表达病毒抗原(图1), 也并不产生感染性病毒(由噬斑分析评估)。大部分克隆可抵抗高滴度反 转录病毒的感染并被进一步分析(图2)。而反转录病毒抗性最初并不是 由持续性感染的建立所致,很多克隆在随后的传代中被持续性感染,推 测这是由于呈现出病毒抗性的突变细胞对筛选中所使用的残留病毒的PI 状态[2]的建立敏感。
抗反转录病毒克隆中被破坏的基因的鉴定
U3NeoSV1基因捕获载体含有质粒复制起点和抗氨苄青霉素基因;因 此,毗邻寻靶载体的基因组DNA的区域很容易通过质粒拯救进行克隆并 测序[6]。将侧翼序列与核酸数据库相比较,以鉴定由于基因捕获而发生 改变时赋予了对反转录病毒引起的溶解性感染的抗性的候选细胞基因。 同时,这151个克隆得到的侧翼序列与公共DNA序列数据库[非冗余 9(nr)、高通量基因组序列(htgs)]和人、小鼠和大鼠基因组序列中的111 个已注释的基因和转录单位匹配[6]。40个侧翼序列没有信息,因为它们 与基因组DNA的重复元件或区域相匹配,而这些基因组DNA与任何已注 释的转录单位均不相关。
表1列出了抗反转录病毒克隆中被破坏的基因,从中可获知某些功 能信息。该表还包括编码已知可以物理方式相互的蛋白质的基因。与具 体代谢或信号传导途径相关的基因示于表2。这包括在病毒复制所有方面 有可能起作用的基因产物,所述病毒复制的所有方面为:进入、分解、 转录、翻译和重新组装(表1、2,图3)。编码钙周期蛋白、胰岛素生长 因子结合蛋白5蛋白酶(prssll)、C型样凝集素蛋白(Clr)-f和-C、 Dnafal-/Aprataxin+(Aprx)、GATA结合蛋白4(Gata4)、Bc12样 -1(Bc1211),和染色体10可译框架3(Chrl0orf3)和肌原纤维、fer-1样 蛋白3(Fer113)、S100a6(编码钙周期蛋白),和两种功能未知的cDNA的 十一种基因在独立细胞文库中分别被突变(表1)。在这些独立的突变克隆 内的原病毒位于彼此的7至1500多个核苷酸内。
HSV-1抗性
进行实验来确定基因对HSV-1感染是否有抗性。这些实验使用了 HSV-1(KOS)tk12,这是一种表达作为即刻早期基因的1acZ报告基因的 感染性病毒[46]。Eif3s10、AnxaI、Mgat1和Igf2r基因突变的四种克 隆对HSV-I感染有抗性,并且表达即刻早期1acZ报告基因的能力降低。 Eif3s10、Mgat1和Igf2r突变的克隆还可表现出病毒mRNA的转录和翻译 以及细胞死亡有所降低。已知Igf2r的突变可影响HSV复制[15,54,58]; 然而,HSV复制与由Eif3s10、AnxaI和Mga t1编码的蛋白质的关系是新 的。这些数据表明在反转录病毒感染中存活的克隆中发现的一些候选基 因可影响被其它病毒利用的常见细胞过程。
表1
         基因          定义          大鼠    CHR          人    CHR          大鼠    GenBank编号          人mRNA    GenBank编号          人蛋白质    GenBank编号            克隆命名      核酸    插入物    GenBank  编号      大鼠    基因的    Entrez  基因      人    基因的    Entrez  基因  Loc310836  (Abca4)  ATP-结合盒,  亚家族A  (ABC1),  成员4  2q41  1p22.1-p21  XP_241525  NM_000350  NP_000341  6BE65_T7  AR228076  BD069426  美国专利  NO.6448000  的SEQ ID  NO:69  310836  24  Anxal  膜联蛋白A1  1q51  9q12-q21.2  U25159  NM_000700  NP_000691  6B37H_T7  AR228072    BD069422  美国专利  NO.6448000  的SEQ ID  NO:65  25380  301  Anxa2  膜联蛋白A2  8q24  15q21-q22  NM_019905  NM_001002857  NM_0010028588  NM_004039  NP_001002857  NP_001002858  NP_004030  7A7_rE  AR228047  BD069397  美国专利  NO.6448000  的SEQ ID  NO:40  56611  302
     基因      定义      大鼠    CHR      人    CHR      大鼠    GenBank编号      人mRNA    GenBank编号      人蛋白质    GenBank编号        克隆命名    核酸  插入物    GenBank  编号    大鼠  基因的    Entrez  基因    人  基因的    Entrez  基因  BD078939  美国专利  NO.6777177  的SEQ ID  NO:19  Anx3  膜联蛋白A1  14p22  4q13-q22  NM_012823  NM_005139  NP_005130  70A-rE  BD079025  美国专利  NO.6777177  的SEQ ID  NO:105  25291  306  Aptx-/  dnajal  [Hsj2]  失用症蛋白  (aprataxin)/DnaJ  (HSP40)同系物,  亚家族A,  成员1  5q22  9p13.3  NW_07454  NM_017692  NM_175069  NM_175071  NM_175072/      NM_001539  NP_060162  NP_778239  NP_778241  NP_778242/      NP_001530  12_3b#7-rE            12_3B#8-rE          9B27_2_rE  BD078944  美国专利  NO.6777177  的SEQ ID    NO:24    BD078943  美国专利  NO.6777177  的SEQ ID  NO:23  259271  65028  54840  3301
     基因      定义      大鼠    CHR      人    CHR      大鼠    GenBank编号      人mRNA    GenBank编号      人蛋白质    GenBank编号        克隆命名    核酸  插入物    GenBank  编号    大鼠  基因的    Entrez  基因    人  基因的    Entrez  基因  BD078945  美国专利  NO.6777177  的SEQ ID  NO:25  Atp6vOc  ATP酶,H+  转运,  溶酶体16kDa,  V0亚基c  10q12  16p13.3  NC_000016  NM_001694  NP_001685  6BE3_lac  AR228008  BD069358  美国专利  NO.6448000  的SEQ ID  NO:1  170667  527  Bcl2ll  BcI2样1  3q41.2  20q11.21  NP_238186  NM_001191  NM_138578  NP_001182  NP_612815  L197B3E-rE  L245-3-rE  L24-4-4-rE  BD079008  美国专利  NO.6777177  的SEQ ID  NO:88  ,BD079032  美国专利  NO.6777177  的SEQ ID  NO:112  24888  598
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因   Brd2  含布罗莫结构域2  (bromodomain-  containing 2)  20p12  6p21.3  XP_238186  NM_005104  NP_005095  36_5_2_6-rE  BD078987  美国专利  NO.6777177  的SEQ ID  NO:67  294276  6046  Brd3/    Wdr5  含布罗莫结构域3  /WD重复域5  3p12  9q34  XP_342398    XP_342397  NM_007371/    NM_017588  NM_052821  NP_031397/    NP_060058  NP_438172  1A_rE  AR228036  BD069386  美国专利  NO.6448000  的SEQ ID  NO:29  362093  8019/    11091  C9orf119/        Golga2  功能未知的基因        高尔基体自身抗原  高尔基体蛋白    (golgin)亚家族a,2  3p11  9q34.13  NW_047652        NM_022596  XM_372143  BC029911      NM_004486  XP_372143  AAH29911      NP_004477  6_3_6_2E-rE  BD078967    美国专利  NO.6177177  的SEQ ID    NO:47  375757        64528  375757        2801
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  C10orf3  染色体10    可译框架3  1q54  10q23.33  XP_220034  NM_018131  NP_060601  14_24#6-rE              L245-3-rE          L192A3E-rE          6b52-rE  AR228054    BD069404  美国专利  NO.6448000  的SEQ ID  NO:47    BD078938  美国专利  NO.6777177  的SEQ ID  NO:88  BD078978  美国专利  NO.6777177  的SEQ ID    NO:58  AR228049  BD069399    美国专利  NO.6448000  的SEQ ID  NO:42  55165  55165
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  Cald1  钙调素结合蛋白  14q22  7q33  NM_013146  NM004342    NM033138  NM033139  NM033140  NM033157  NP004333    NP149129  NP149130  NP14t9131  NP149347  191E2E-rE  BD078958    美国专利  NO.6777177  的SEQ ID  NO:38  25687  800  Calm2    钙调蛋白2  (磷酸化酶激酶,δ)  6q11-    q12  2p21  NM_017326  NM001743  NP001734  32-3-2#1E/-rE  BD078921    美国专利  NO.6777177  的SEQ ID  NO:1  50663  805
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  Celsr2  钙粘蛋白,EGF  LAG七通道(pass)  G型受体2  4q11  1p21  NW_047687  NM001408  NP001399  12_4b_9-rE  AR228032.,    美国专利  NO.6448000  的SEQ ID  NO:25  AR228027  美国专利  NO.6448000  的SEQ ID  NO:20  BT069377;  BD069382  83465  1952  Clr-f  杀伤细胞凝集素  样受体F1  4q12  N/A  XM_232399  N/A  N/A  36_7_1a-rE          SCA9#14_rE  BD078982  美国专利  NO.67771777  的SEQ ID  NO:62  AR228038  美国专利  NO.6448000  的SEQ ID  NO:31  312745  N/A
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  Copg2/        Tsga13  外被体(coatomer  蛋白复合物亚基γ2      睾丸特异基因A13-  花斑单等位基因  表达1  4q22  7q32  NW_047355/        XP_231582  NM012133/        NM052933  NP036265        NP4431655  36_5_2-19b_lac    12cx#11-rE  AR228051  美国专利  NO.6448000  的SEQ ID  NO:44    BD078955  美国专利  NO.6777177  的SEQ ID  NO:35  BD078941  BD069401  BD078988  美国专利  NO.6777177  的SEQ ID  NO:68  301742        312203  26958        114960
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  Cstf2t  剪切刺激因子  3前-RNA  亚基2,64kDa  1q52  10q11  NW_047565  NM015235  NP056050  19_9BE_rE  BD078960  美国专利  NO.6777177  的SEQ ID  NO:40  BD078958  美国专利  NO.6777177  的SEQ ID  NO:38  309338  23283  Csmd2  CUB和sushi  多结构域2  5q36  1p35.1-p34.3  XP_232753  NM052896  NP443128  L24_9_1-rE  BD079033  美国专利  NO.6777177  的SEQ ID  NO:113  313040  114784  Ctcf  CCCTC结合因子  (锌指蛋白)  19q12  16q21-q22.3  NP_114012  NM006565  NP006556  6BE72_rE  AR228009  BD069366  美国专利  NO.6448000  的SEQ ID  NO:2  83726  10664
   基因    定义    大鼠  CHR    人  CHR    大鼠  GenBank编号    人mRNA  GenBank编号    人蛋白  GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  Cutll/          Mylc2pl+  Cut样1,  CCAAT  置换蛋白  (果蝇)      肌球蛋白轻链2,  前体淋巴细  胞特异  12q12  7q22.1  XP_341054          XP_344098  NM001913  NM181500  NM181552/      NM138403  NP001904  NP852477  NP853530/      NP612412  31_3_17_rE  BD079017  BD0/8994    美国专利  NO.6777177  的SEQ ID  NO:74  116639/          363900  1523          93408  Dlx2  与TES-1同源框  相似的distal-less  同源框2  3q21  2q32  XP_230986  NM004405  NP004396  L24_4_2BE_rE  BD079037  美国专利  NO.6777177  的SEQ ID  NO:117  296499  1746  Dnajal  DnaJ(Hsp40)  同系物,  亚家族A,成员  5q22    1  9p13-p12  NP_075223  NM001539  NP001530  10_46_4-Lac    12_3B#8-rE  BD078944  美国专利  NO.6777177  的SEQ ID  NO:24  65028  3301
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  Dre1  也称为    KLHL24  Dre1蛋白  11q23  3q27.1  NM_181473  NM017644  NP060114  10_4b_4-rE  AR228014,  美国专利  NO.6448000  的SEQ ID  NO:7  BD069364  BD078933  美国专利  NO.6777177  的SEQ ID  NO:13  303803  54800  E2ig2  雌激素诱导的    基因2  1q32  11q13.3  NP_57649  NM016565  NP057649    L197B3E-rE for  BD078972    美国专利  NO.6777177  的SEQ ID  NO:52  51287  Eif3s10  延伸起始因子3    亚基10  1q55  10q26  NW_047570  NM003750  NP003741  12PSA#6_rE  AR228011  BD069361    美国专利  NO.6448000  的SEQ ID  292148  8661
   基因    定义    大鼠  CHR    人  CHR    大鼠  GenBank编号    人mRNA  GenBank编号    人蛋白  GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  NO:4  Erbb2ip  Erbb2相互  作用蛋白  2q12  5q13.1  XP_345149  NM018695  NP061165  SCA9#14_rE    ScB2#19-rE  AR228015  BD069365    美国专利  NO.6448000  的SEQ ID  NO:8  55914  Fer1l3  fer-1-样蛋白3,    myoferlin  1q53  10q24  NW_047565  NM013451  NM133337  NP038479  NP579899  14_24#6-rE  6b52-re  AR228049  BD069399    美国专利  NO.6448000  的SEQ ID  NO.42  26509  Fkbp8  FK506结合蛋白8,    38kDa  16p14  19p12  XP_214316  NM012181  NP036313  31_3_15#1_Lac  31_3_15#1rE      31_3_6_2-rE.  BD079018  BD078996    美国专利    NO.6777177  的SEQ ID  NO:76  23770
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  BD079016.,  BD078993  美国专利  NO.6777177  的SEQ ID  NO:96  Fusip1  FUS相互作用蛋白  (富含丝氨酸    -精氨酸)1  5q36  1p36.11  XP_342949  NM006625  NM054016  NP006616  NP473357  L28ap-rE  BD079009  美国专利  NO.6777177  的SEQ ID  NO:89  362630  10772  Gas5  生长抑制  特异性5  13a21  1q23.3  U77829  AK025846  AL110141  BC038733  N/A  10_4A_8_rE  AR228010  BD069360  美国专利  NO.6448000  的SEQ ID  NO.3  81714  60674  Gata4  GATA结合蛋白4  15p12  8p23.1-p22  NW_047454  NM002052  NP002043  10_2A_3_12-rE  10_2A_3-rE  AR228023  美国专利  NO.6448000  的SEQ ID  NO.16  2626
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  BD069373  AR228024  美国专利  NO.6448000  的SEQ ID  NO:17  Grb2  生长因子受体  结合蛋白2  10q32.2  17q24-q25  NP_10473  NM002086  NM203506..  NP002077  NP987102.  36_5_2_19a    研究中  81504  2885  Gtf2el/          Rabl3  通用转录因子IIE  多肽1,α56kDa;        RAB,RAS癌基因  家族样成员3  11q22  3q21-q24  XP_221426          XP_340993  NM005513/          NM173825  NP005504/          NP776186    L195B1E  BD078975  美国专利  NO.6777177  的SEQ ID  NO:55            360720  2960          285282  HM13  组织相容(次要)13,  来自A549细胞库  的人基因  20q11.21  NM030789.  NP110416  RA3_A-rE  RA2#C_rE  81502
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  HNRPL  异源核  核糖核蛋白L-  来自A549细胞库的  人基因  1q21  19q13.2  NM001533  NP001524  RA2_A-rE  3191  Hoxc13    同源框C13  7q36  12q13.3  XP_345881  NM017410.  NP059106  L191B2E#3+_rE  BD078923    美国专利  NO.6777177  的SEQ ID  NO:3  366995  3229  Hpl-bp74  异染色质蛋白1,    结合蛋白74  5q36  1p36.13  NM_99108  NM016287  NP057371  10_3bE  AR228022    BD069372  美国专利  NO.6448000  的SEQ ID  NO:15  313647  50809  Hspc13S+/      Mox2r  HSPC135蛋白  同系物/    Cd200受体2  11q21  3q13.2  XP_340986      NP_076443  NM014170/      NM138806  NM138939  NP054889/      NP620161  NP620385  l4D#8  AR228059  BD069409  美国专利  NO.6448000  的SEQ ID  360714/  29083      131450
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  NM138940  NM170780  NP620386  NP740750    NO:52  Id3  DNA结合3的  抑制剂,显性  负螺旋-环-    螺旋蛋白  5q36  1p36.13-  p36.12  NP_037190  NM002167  NP002158  21_5_8E-rE  21_5_7E-rE  21_5_9E-rE  BD078974    美国专利  NO.6777177  的SEQ ID  NO:54  BD078924  SEOID  美国专利  NO.677177  的SEQ ID  NO:4  BD079042  美国专利  NO.677177  的SEQ ID  NO:122  25585  3399  Igf2r  胰岛素样  1q11  6q26  NW047553  NM000876  NP000867  L192B3E#13_rE  BD078980  25151  3482
   基因    定义    大鼠  CHR    人  CHR    大鼠  GenBank编号    人mRNA  GenBank编号    人蛋白  GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entre  基因  生长因子2  受体(IGF2R)  美国专利  NO.6777177  的SEQ ID  NO:60  Jakl  酪氨酸-蛋白激酶  JAK1  5q33  1p32.3-p31.3  XP_342873  NM002227  NP002218  18A_8_4F-rE  BD078969  BD079044  美国专利  NO.6777177  的SEQ ID  NO:49  362552  3716  Kif13b  鸟苷酸激酶  相关驱动蛋白  15p12  8p12  XP_224288  NM015254  NP056069.  194c4e-rE  BD078976    美国专利  NO.6777177  的SEQ ID  NO:56  305967  23303  Klhl6  KeIch样6  11q23  3q27.3  NW_047358  NM130446  NP569713  10_3b_2_rE  10_4b_4-rE  AR228020  BD069370  美国专利  NO.6448000  89857
   基因    定义    大鼠  CHR    人  CHR    大鼠  GenBank编号    人mRNA  GenBank编号    人蛋白  GenBank编      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrrez  基因  的SEQ ID  NO:13  BD078933  美国专利  NO.6777177  的SEQ ID  NO:13  AR228014  美国专利  NO.6448000  的SEQ ID  NO:7  Ki-67  增殖相关抗原  2q26  10q25  XP_227096  NM002417  NP002408  12_4b#11_rE  AR228033.  BD069383  美国专利  NO.6448000  的SEQ ID  NO:26  310382  4288
   基因    定义    大鼠  CHR    人  CHR    大鼠  GenBank编号    人mRNA  GenBank编号    人蛋白  GenBank编号      克隆命名  核酸  插入物    GenBank  编号    大鼠  基因的    Entrez  基因  人  基因    Entrez  基因  Lipc/  LOC363090    人Genbank  编号和  Entrez基因    对应Lipc基因    脂酶,成员H  甘油-3-磷酸  脱氢酶  (磷酸化)  8q24  15q21-q23  NM_012597XP_343422  NM000236/  NP000227/  6BSA12_rE  AR228018  BD069368    美国专利  NO.6448000  的SEQ ID  NO:11    AR228046  BD069396  美国专利  NO.6448000  的SEQ ID  NO:39  24538/        363090  3990  Madh7  MAD,针对果蝇  同系物7的母本    (果蝇属)  8q12.3  18q21.1  NW-047516  NM005904  NP005895  14A7re  BD078950  美国专利  NO.6777177  的SEQ ID  NO:30  4092
       基因        定义        大鼠  CHR        人  CHR        大鼠  GenBank编号        人mRNA  GenBank编号        人蛋白  GenBank编号          克隆命名      核酸  插入物    GenBank  编号      大鼠  基因的    Entrez  基因      人  基因的    Entrez  基因  IКBζ  (MAIL)  具有由脂多糖  诱导的锚蛋白  重复的分子  11q12  3p12-q12  NW_047355  NM031419  NM001005474  NP113607  NP001005474  31_3_9_rE  BD079015  BD078992  美国专利  NO.6777177  的SEQ ID  NO:95  64332  Map3k7ipl  促分裂原激活  蛋白激酶  激酶激酶7相互  作用蛋白1  7q34  22q13.1  NW_047780  NM006116  NM153497  NP006107  NP705717  34X24_126-rE  BD078985  美国专利  NO.6777177  的SEQ ID  NO:65  10454  Mapt  微管相关蛋白TAU  10q32.1  17q21.1  NM_017212  NM005910  NM016834  NM016835  NM016841  NP005901  NP058518  NP058519  NP058525  12_3B#7  AR228033,  BD069383    美国专利  NO.6448000  的SEQ ID  NO:26  360248  4137
     基因      定义      大鼠    CHR      人    CHR      大鼠    GenBank编号      人mRNA    GenBank编号      人蛋白    GenBank编号        克隆命名    核酸  插入物    GenBank  编号    大鼠  基因的    Entrez  基因    人  基因的    Entrez  基因  Mgat1  甘露糖基(α-1,3-  )-糖蛋白β-1,2-N-  乙酰基-葡萄糖  胺-转移酶  10q21  5q35  NW_047334  NM002406  NP002397  14_7#2E_rE  AR228012.  BD069362,  美国专利  NO.6448000  的SEQ ID  NO:5  BD079013  美国专利  NO.6777177  的SEQ ID  NO:93  BD078952  美国专利  NO.6777177  的SEQ ID  NO:32  81519  4245  Mical2  黄素蛋白  氧化还原酶  1q33  11p15.3  NP_872610  NM014632.  NP055447  12C#A_rE  AR228031,  BD069381  美国专利  365352  9645
     基因      定义      大鼠    CHR      人    CHR      大鼠    GenBank编号      人mRNA    GenBank编号      人蛋白    GenBank编号        克隆命名    核酸  插入物    GenBank  编号  大鼠    基因的    Entrez  基因  人    基因的    Entrez  基因  NO.6448000  的SEQ ID  NO:24  BD078931  美国专利  NO.6777177  的SEQ ID  NO:11  Ocil  C型破骨细胞    抑制性凝集素  4q32  12p13  XP_342770  NM001004419  NM001004420  NM013269  NP001004419  NP001004420  NP037401    14XD#12E-rE  191E9E-rE  AR228081.  美国专利  NO.6448000  的SEQ ID  NO:74  BD079024;  BD069431.;  BD078961    美国专利  NO.6777177  的SEQ ID  NO:41  113937  29121
   基因    定义    大鼠  CHR    人  CHR    大鼠  GenBank编号    人mRNA  GenBank编号    人蛋白  GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  BD07895 1  美国专利  NO.6777177  的SEQ ID  NO:31  OL16  脂肪细胞  特异蛋白5  和剪接变体OI-16  8q22  11q24.1  NM_173154  NM024769  NP079045  X236E1_T7  X236E1_T3    286939  79827  Numb  Notch信号传导    的推定抑制剂  6q31  14q24.3  XP_234394  NM003744  NP003735  SCA7#5_rE  AR228078  美国专利    NO.6448000  的SEQ ID  NO:71  29419  8650  Pde4b-/  磷酸二酯酶4B  cAMP-特异性(磷  酸二酯酶E4愚人  3同系物,果蝇)  5q32  1p31  NP_058727  NM002600  NP002591  34X25_23_Lac  BD078990  美国专利  NO.6777177  的SEQ ID  NO:70  24626  5142
   基因    定义    大鼠  CHR    人  CHR    大鼠  GenBank编号    人mRNA  GenBank编号    人蛋白  GenBank编号      克隆命名  核酸  插入物    GenBank  编号    大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  Pgyl-  (Abcb1)/  ATP结合盒,  亚家族B(MDR/TAP)  成员1  4q12  7q21.1  NM_012623  NM000927  NP000918  34X23_3-rE  BD078989  美国专利  NO.6777177  的SEQ ID  NO:69  24646  5243  Prssll  蛋白酶,丝氨酸,11  (IGF结合)  11q37  10q26.3  NP_113909  NM002775  NP002766  12CXY#7_rE  BD069425  AR228075  美国专利  NO.6448000  的SEQ ID  NO:68  65164  5654  Psa  氨肽酶  嘌呤霉素敏感  10q31  17q21  NW-047338  NM006310  NP006301  8C5_6_rE  BD069403;  AR228053  美国专利  NO.6448000  的SEQ ID  NO:46  50558  9520  Psma7  蛋白酶体  (前体,macropain)  亚基,α型,7  3q43  20q13.33  XP_342599  NM002792  NM152255  NP0027833  NP689468    12CX#11E_rE    35514a-rEI  BD078983  美国专利  NO.6777177  29674  5688
     基因      定义      大鼠  CHR      人  CHR      大鼠  GenBank编号      人mRNA  GenBank编号      人蛋白  GenBank编号        克隆命名    核酸  插入物    GenBank  编号  大鼠    基因的    Entrez  基因  人    基因的    Entrez  基因  的SEQID  NO:62  Pts  6-丙酮酰-四氢  蝶呤合成酶  8q23  11q22.3-    q23.3  NP_058916  NM000317  NP000308  19D5E_rE  BD078942  美国专利    NO.6777177  的SEQID  NO:22  29498  5805  Rfp2  RET指蛋白2    或Trim13  15p12  13q14  NM_005798  NM005798  NM052811    NM213590  NP005789  NP434698    NP998755  1A_A549_6_rE  10206  Rpsl8  S18核糖体蛋白,    胞质内,Ca2+/  钙调蛋白激活  蛋白激酶II  的底物  5q24  6p21.3  XP_232915  NM022551  NP072045  12_4b#11_rE    12_4b#7_rE  AR228028  BD069378  美国专利  NO.6448000  的SEQID  NO:21  298014  6222
     基因      定义      大鼠  CHR      人  CHR      大鼠  GenBank编号      人mRNA  GenBank编号      人蛋白  GenBank编号        克隆命名    核酸  插入物    GenBank  编号  大鼠    基因的    Entrez  基因  人    基因的    Entrez  基因  Rin2  含有ras相关(Ra16  GDS/AF-6)结构域的  蛋白JC265;  RAB5相互作用  蛋白2  3q41  20p11  XP_230647  NM018993  NP061866  12_3B#10-rE  AR228026  BD069376  美国专利  NO.6448000  的SEQ ID  NO:19  311494  54453  Rorl  受体酪氨酸激酶样  孤儿受体1  5q33  1p32-p31  XP_238402  NM005012  NP005003  12_6B#6_rE  AR228030  BD069380  美国专利  NO.644800  的SEQ ID  NO:23  117094  4919  Rraga  Ras-相关GTP  结合A  5q32  9p21.3  NP_446425  NM006570  NP006561  L193A1E#A_rE  BD078977  美国专利  NO.6777177  的SEQ ID  NO:57  117044  10670  Ryk  受体样酪氨酸激酶  8q32  3q22  XP_343459  NM002958  NP002949  19-7ae_rE  BD078959    美国专利  NO.6777177  的SEQ ID  NO:39  140585  6259
   基因    定义    大鼠  CHR    人  CHR    大鼠  GenBank编号    人mRNA  GenBank编号    人蛋白  GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  S100a6/            Sl00al  S100钙结合蛋白  (钙周期蛋白)/          S100蛋白,α链  A6q34  1q21  NP_445937            XP_215606  NM014624/            NM006271  NP055439/            NP006263  L25_10-Lac    18_3#3E-rE is  SEQ ID NO:6    and 3_2_4-rE is  61 and 110 from  U.S.patent No.  6,777,177    SEQ ID NO:111  is L25-10-rE    SEQ ID NO:114  is17-L25-27#7-  rE  SEQ ID NO:109    is 3_2_13-rE    SEQ ID NO:115  is L21C1E-rE  AR228013.,  美国专利  NO.6777177    的SEQ ID  NO:6  BD069363  BD079030    美国专利  NO.677717  的SEQ ID  NO:61和11    BD078981,  BD079031  美国专利  NO.6777177    的SEQ ID  NO:111  BD079034  85247            295214  6277            6271
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  美国专利  NO.6777177  的SEQ ID  NO:114  BD079029  美国专利  NO.6777177  的SEQ ID  NO:109  BD079035  美国专利  NO.6777177  的SEQ ID  NO:115  Scmhl  中足同系物1上的  性梳(果蝇)  5q36  1p34  XP_342901  NM012236  NP036368  38_17#2_rE  研究中  22955
     基因      定义      大鼠    CHR      人    CHR      大鼠    GenBank编号      人mRNA    GenBank编号      人蛋白    GenBank编        克隆命名    核酸  插入物    GenBank  编号  大鼠    基因的    Entrez  基因  人    基因的    Entrez  基因  Serpl  应激相关内质网  蛋白1  15q11  3q251  NM_030835  NM014445  NP055260  191E8E_rE  BD078962  美国专利  NO.6777177  的SEQ ID  NO:42  80881  27230  Srp19  信号识别颗粒,  19kDa  18p12  5q21-q22  NW_047510  NM003135.  NP003126  14C_2E_rE  BD078963  美国专利  NO.6777177  的SEQ ID  NO:43  291685  6728  Stmnl  Stathmin,  微管解聚蛋白  8q31  1p36.1-p35  XP_343442  NM005563  NM203399  NM203401  NP005554  NP981944  NP981946  SCA6#1_rE  AR228025  BD069375  美国专利  NO.6448000  的SEQ ID  NO:18  363108  3925  Tpml  原肌球蛋白1  (α)  8q24  15q22.1  NW_047799  NM000366  NP000357  6BE60_rE  BD078934  美国专利  24851  7168
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编号      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrez  基因  NO.677717  的SEQ ID  NO:14  Trim52  含三联基元52  15q22  5q35.3  XM_224468  NM032765  NP116154  L24_26_2A-rE  L24_3_2B-rE  L24_26_1-BL  BD079011  美国专利    NO.6777177  的SEQ ID  NO:91  BD079005  美国专利  NO.6777177  的SEQ ID  NO:85  BD079002  美国专利  NO.6448000  的SEQ ID  NO:82  290458  84851
   基因    定义    大鼠    CHR    人    CHR    大鼠    GenBank编号    人mRNA    GenBank编号    人蛋白    GenBank编      克隆命名  核酸  插入物    GenBank  编号  大鼠  基因的    Entrez  基因  人  基因的    Entrrez  基因  Tsec-2+/    Mthfd1  tsec-2+/CI-    四氢叶酸合成酶  6q24  14q24  NW_047761  NM_022508  NM005956  NP005947  36_5_2_196-rE  14D#18-rE  AR228055  BD069405    美国专利  NO.6448000  的SEQ ID  NO:48  299152  64300  4522  Ubelc  泛蛋白-激活酶E1C  4q34  3p24.3-p13  NP_476553  NM003968  NM198195  NM198197  NP303959  NP937838  NP937840  12_3B#2_rE  AR228029  BD069379  美国专利  NO.6448000  的SEQ ID  NO:22  117553  9039  Zfp207  锌指蛋白207  10q26  17q12  XP_221231  NM003457  NP03448  3135-rE  BD078995  美国专利  NO.6777177  的SEQ ID  NO:75  303763  7756  Znf7  锌指蛋白7  7q34  8q24  XP_235457  NM003416  NP003407  1bw_lac  315101  7553
表2基于功能对捕获到的基因的分类
捕获到的基因由官方HUGO基因命名委员会命名(若有的话)列出。 基因或其产物的功能位置由文献描述确定。一些基因有一种以上的细胞 功能,分类比较随意,而其它基因作用尚不确定。
    转录     Brd2     Brd3     Ctcf     E2f2     Gtf2el     Hnrpl     Hoxcl3     Hpl-bp74     Id3     Znf207     Zfp7   细胞骨架相关   Anx3   Caldl   Calm2   Mapt   Ppmla   Rpsl8   Stmnl   Tpml   Kifl3b     膜     Abca4     Csmd2     Celsr2     Erbb2ip     OLl6     Pgyi     Rabl3     Serpl   信号传导   E2ip2   Fusipl   Fkbp8   Gata4   Grb2   Jakl   Madh7   Map3k7ipl   Pde4b   Rraga   Ryk     囊泡/运输     Anxa1     Anxa2     Atp6v0c     Copg2     Golga2     Hml3     Igf2r     Psa     Rin2     Rabl3     S100a6     翻译     Cstf2     Eif3sl0     Srp19   细胞凋亡   Bcl2l   Cycs   IkB□     Mical2   Rfp2     细胞代谢     Gas5     Lipc     Mgatl     Pts   伴侣分子   Dnajal     遍在蛋白化/蛋白体     Ubelc   Psma7     未分配的     Apts     Hspc135     Ocil    Wdr5     Clr-f    Klhl6       Rorl     Drel     Mox2rScmhl     Dlx2     Numb        Trim52
表3
    基因名称     ABCA4   GenBank编号    NM 000350   GI:     4557875     生物     人   长度    7318   ORF区域     82-6903     基因座     24   Blast数据库    人   ORFGC%     52.58     定义     人ATP-结合盒,亚家族A(ABC1),成员4(ABCA4),mRNA。     名称     起点   有义RNA序列5′-3′    反义RNA序列5′-3′   区域     GC%     NM_000350_siRNA_458     458   GGACAGAGCUACACAUCUU(SEQ ID NO:1)    AAGAUGUGUAGCUCUGUCC(SEQ ID NO:2)   ORF     47.36842105     NM_000350_siRNA_869     869   GCCGUUCUCAAGGUAUCAA(SEQ ID NO:3)    UUGAUACCUUGAGAACGGC(SEQ ID NO:4)   ORF     47.36842105     NM_000350_siRNA_880     880   GGUAUCAAUCUGAGAUCUU(SEQ ID NO:5)    AAGAUCUCAGAUUGAUACC(SEQ ID NO:6)   ORF     36.84210526     NM_000350_siRNA_1734     1734   GGUAUUCCCUGACAUGUAU(SEQ ID NO:7)    AUACAUGUCAGGGAAUACC(SEQ ID NO:8)   ORF     42.10526316     NM_000350_siRNA_1864     1864   GCUGAUCCCGUGGAAGAUU(SEO ID NO:9)    AAUCUUCCACGGGAUCAGC(SEQ ID NO:10)   ORF     52.63157895     基因名称     AN×A1   GenBank编号    NM 000700   GI:     4502100     生物     人   长度    1399   ORF区域     75-1115     基因座     301   Blast数据库    人   ORFGC%     44.48     定义     人膜联蛋白A1(ANXA1),mRNA。     名称     起点   有义RNA序列5′-3′    反义RNA序列5′-3′   区域     GC%     NM_000700_siRNA_318     318   GCAGCAUAUCUCCAGGAAA(SEQ ID NO:11)    UUUCCUGGAGAUAUGCUGC(SEQ ID NO:12)   ORF     47.36842105     NM_000700_siRNA_609     609   GCUUUGCUUUCUCUUGCUA(SEQ ID NO:13)    UAGCAAGAGAAAGCAAAGC(SEQ ID NO:14)   ORF     42.10526316     NM_O00700_siRNA_775     775   GCAGAGUGUUUCAGAAAUA(SEQ ID NO:15)    UAUUUCUGAAACACUCUGC(SEQ ID NO:16)   ORF     36.84210526     NM_000700_siRNA_942     942   GGAACUCGCCAUAAGGCAU(SEQ ID NO:17)    AUGCCUUAUGGCGAGUUCC(SEQ ID NO:18)   ORF     52.63157895     NM_000700_siRNA_1058     1058   GGAUGAAACCAAAGGAGAU(SEQ ID NO:19)    AUCUCCUUUGGUUUCAUCC((SEQ ID NO:20)   ORF     42.10526316
基因名称     ANXA2     GenBank编号     NM001002857   GI:   50845385 生物     人     长度     1644   ORF区域   137-1156 基因座     302     Blast数据库     人   ORFGC%   48.14 定义 人膜联蛋白A2(ANXA2),转录物变体2,mRNA。 名称 起点     有义RNA序列5′-3′     反义RNA序列5′-3′   区域   GC% NM_001002857_siRNA844 844     CCCUUAUGACAUGUUGGAA(SEQ ID NO:21)     UUCCAACAUGUCAUAAGGG(SEQ ID NO:22)   ORF   42.10526316 NM_001002857_siRNA_845 845     CCUUAUGACAUGUUGGAAA(SEQ ID NO:23)     UUUCCAACAUGUCAUAAGG(SEO ID NO:24)   ORF   36.84210526 NM_001002857_siRNA_1071 1071     GCAAGUCCCUGUACUAUUA(SEQ ID NO:25)     UAAUAGUACAGGGACUUGC(SEQ ID NO:26)   ORF   42.10526316
  基因名称     ANXA2     GenBank编号     NM001002858   GI:   50845387   生物     人     长度     1635   ORF区域   74-1147   基因座     302     Blast数据库     人   ORFGC%   48.89   定义     人膜联蛋白A2(ANXA2),转录物变体1,mRNA。   名称     起点     有义RNA序列5′-3′     反义RNA序列5′-3′   区域   GC%   NM_01002858_siRNA_835     835     CCCUUAUGACAUGUUGGAA(SEQ ID NO:27)     UUCCAACAUGUCAUAAGGG(SEQ ID NO:28)   ORF   42.10526316   NM_001002858_siRNA_836     836     CCUUAUGACAUGUUGGAAA(SEQ ID NO:29)     UUUCCAACAUGUCAUAAGG(SEQ ID NO:30)   ORF   36.84210526   NM_001002858_siRNA_1062     1062     GCAAGUCCCUGUACUAUUA(SEQ ID NO:31)     UAAUAGUACAGGGACUUGC(SEQ ID NO:32)   ORF   42.10526316
    基因名称 ANXA2     GenBank编号     NM004039   GI     50845389     生物 人     长度     1563   ORF区域     561075     基因座 3D2     Blast数据库     人   ORFGC%     48.14     定义 人膜联蛋白A2(ANXA2),转录物变体3,mRNA。
    名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_004039_siRNA_763     763   CCCUUAUGACAUGUUGGAA(SEQ ID NO:33)   UUCCAACAUGUCAUAAGGG(SEQ ID NO:34)     ORF   42.10526316     NM_004039_siRNA_764     764   CCUUAUGACAUGUUGGAAA(SEQ ID NO:35)   UUUCCAACAUGUCAUAAGG(SEQ ID NO:36)     ORF   36.84210526     NM_004039_siRNA_990     990   GCAAGUCCCUGUACUAUUA(SEQ ID NO:37)   UAAUAGUACAGGGACUUGC(SEQ ID NO:38)     ORF   42.10526316
    基因名称     ANXA3     GenBank编号   NM005139   GI:   4826642     生物     人     长度   1339   ORF区域   47-1018     基因座     306     Blast数据库   人   ORFGC%   42.8     定义 人膜联蛋白A3(ANXA3),mRNA。     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_005139_siRNA_317     317     CCAGCAGUCUUUGAUGCAA(SEQ ID NO:39)   UUGCAUCAAAGACUGCUGG(SEQ ID NO:40)   ORF   47.36842105     NM_005139_siRNA_332     332     GCAAAGCAGCUAAAGAAAU(SEQ ID NO:41)   AUUUCUUUAGCUGCUUUGC(SEQ ID NO:42)   ORF   36.84210526     NM_005139_siRNA_405     405     GGACAAGCAGGCAAAUGAA(SEQ ID NO:43)   UUCAUUUGCCUGCUUGUCC(SEQ ID NO:44)   ORF   47.36842105     NM_005139_siRNA_411     411     GCAGGCAAAUGAAGGAUAU(SEQ ID NO:45)   AUAUCCUUCAUUUGCCUGC(SEQ ID NO:46)   ORF   42.10526316     NM_005139_siRNA_827     827     GCCUUGAAGGGUAUUGGAA(SEQ ID NO:47)   UUCCAAUACCCUUCAAGGC(SEQ ID NO:48)   ORF   47.36842105
    基因名称   APTX   GenBank编号   NM 017692 GI:   28329424     生物   人   长度   2016 ORF区域   605-1111     基因座   54840   Blast数据库   人 ORFGC%   47.93     定义 人失用症蛋白(APTX).转录物变体4.mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′ 区域   GC%     NM_017692_siRNA_956     956   GCUGUGAUCGAGAUGGUAC(SEQ ID NO:49)   GUACCAUCUCGAUCACAGC(SEQ ID NO:50) ORF   52.63157895     NM_017692_siRNA_983     983   GGUAGAGUAACUGUCCGAG(SEQ ID NO:51)   CUCGGACAGUUACUCUACC(SEQ ID NO:52) ORF   52.63157895     NM_017692_siRNA-1005     1005   GGAUGCCUGAGCUCUUGAA (SEQ ID NO:53)   UUCAAGAGCUCAGGCAUCC(SEQ ID NO:54) ORF   52.63157895
    基因名称     APTX     GenBank编号   NM 175069 Gl:   28329429     生物     人     长度   2036 ORF区域   25-945     基因座     54840     Blast数据库   人 ORFGC%   48.0     定义     人失用症蛋白(APTX).转录物变体2.mRNA。     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′ 区域   GC%     NM_175069_siRNA_105     105     GCACCAGCGAAUCAGACUU(SEQ ID NO:55)   AAGUCUGAUUCGCUGGUGC(SEQ ID NO:56) ORF   52.63157895     NM_175069_siRNA_266     266     GCAUUGACUCAGUCGUAAU(SEQ ID NO:57)   AUUACGACUGAGUCAAUGC(SEQ ID NO:58) ORF   42.10526316     NM_175069_siRNA_389     389     GCCUGGAAACACACAGGAA(SEQ ID NO:59)   UUCCUGUGUGUUUCCAGGC(SEQ ID NO:60) ORF   52.63157895     NM_175069_siRNA_652     652     CCAAAGGCCCGUUACCAUU(SEQ ID NO:61)   AAUGGUAACGGGCCUUUGG(SEQ ID NO:62) ORF   52.63157895     NM_175069_siRNA_720     720     GGAACACCUUGAACUCCUU(SEQ ID NO:63)   AAGGAGUUCAAGGUGUUCC(SEQ ID NO:64) ORF   47.36842105
    基因名称     APTX     GenBank编号   NM 175071   GI:   28329426     生物     人     长度   1836   ORF区域   425-931     基因座     54840     Blast数据库   人   ORFGC%   47.93     定义     人失用症蛋白(APTX),转录物变体5,mRNA。     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_175071_siRNA_799     799     GGCUGGUAGAGUAACUGUC(SEQ ID NO:65)   GACAGUUACUCUACCAGCC(SEQ ID NO:66)   ORF   52.63157895     NM_175071_siRNA_803     803     GGUAGAGUAACUGUCCGAG(SEO ID NO:67)   CUCGGACAGUUACUCUACC(SEO ID NO:68)   ORF   52.63157895     NM_175071_siRNA_825     825     GGAUGCCUGAGCUCUUGAA(SEQ ID NO:69)   UUCAAGAGCUCAGGCAUCC(SEQ ID NO:70)   ORF   52.63157895
    基因名称   APTX     GenBanK编号     NM 175072 GI:   28329432     生物   人     长度     2041 ORF区域   372-1136     基因座   54840     Blast数据库     人 ORFGC%   47.98     定义   人失用症蛋白(APTX),转录物变体3,mRNA。
    名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_175072_siRNA_981     96l   GCUGUGAUCGAGAUGGUAC(SEQ ID NO:71)   GUACCAUCUCGAUCACAGC(SEQ ID NO:72)     ORF   52.6315789     NM_175072_siRNA_1030     1030   GGAUGCCUGAGCUCUUGAA(SEO ID NO:73)   UUCAAGAGCUCAGGCAUCC(SEQ ID NO:74)     ORF   52.6315789S     NM_175072_siRNA_1094     1094   UCCUCAGCUGAAAGAACAU(SEQ ID NO:75)   AUGUUCUUUCAGCUGAGGA(SEQ ID NO:76)     ORF   42.10526316
    基因名称   DNAJAl     GenBanK编号   NM 001539   GI:   49472820     生物   人     长度   1538   ORF区域   184-1377     基因座   3301     引ast数据库   人   ORF GC%   43.22     定义   人DnaJ(HsD40)同系物。亚家族A,成员1(DNAJAl),mRNA。     名称   起点     有义RNA序列5′-3′   反义RMA序列5′-3′   区域   GC%     NM_001539_siRNA_642   642     CCGAGGUACUGGAAUGCAA(SEQ ID NO:77)   UUGCAUUCCAGUACCUCGG(SEO ID NO:78)   ORF   52.63157895     NM_001539_siRNA_646   646     GGUACUGGAAUGCAAAUM(SEQ ID NO:79)   UUAUUUGCAUUCCAGUACC(SEQ ID NO:80)   ORF   36.84210S26     NM_001539_siRNA_682   682     CCUGGAAUGGUUCAGCAAA(SEO ID NO:81)   UUGCUGAACCAUUCCAGG(SEQ ID NO:82)   ORF   47.36842105     NM_001539_siRNA-779   779     GGAAGAUAGUUCGAGAGAA(SEQ ID NO:83)   UUCUCU06AACUAUCUUCC(SEQ ID NO:84)   ORF   42.10526316     NM_001539_siRNA_840   840     CCAGMGAuMCAUUGCAU(SEO ID NO:85)   AUGGMUGUUAUCUUCUGG(SEO ID NO:86)   ORF   36.84210526     基因名称   ATP6VOC     GenBanK编号   NM 001694   G1:   19913436     生物   人     长度   1126   ORF区域   153-620     基因座   527     BIast数据库   人   ORFGC%   63.47     定义   人ATPase,H+转运,溶酶体     名称   起点     有义RNA序列5′-3′   区域   GC%     NM_001694_siRNA_388   388     CCCUGAAUGACGACAUCAG(SEQ ID NO:87)   CUGAUGUCGUCAUUCAGGG(SEQ ID NO:88)   ORF   52.63157895     NM_001694_siRNA_529   529     GACUAUUCGUGGGCAUGAU(SEQ ID NO:89)   AUCAUGCCCACGAAUAGUC(SEQ ID NO:90)   ORF   47.36842105     NM_001694_siRNA_535   535     UCGUGGGCAUGAUCCUGAU(SEQ ID NO:91)   AUCAGGAUCAUGCCCACGA(SEQ ID NO:92)   ORF   52.63157895
    基因名称     BCL2L1   GenBank编号   NM 001191   GI:   20336333     生物     人   长度   2386   ORF   Region:   367-879     基因座     598   Blast数据库   人   ORFGC%   57.12     定义     人BCL2样1(BCL2L1),编码线粒体蛋白质的核基因,转录物变体2,mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_001191_siRNA_753     753   GGAACUCUAUGGGAACAAU(SEQ ID NO:93)   AUUGUUCCCAUAGAGUUCC(SEQ ID NO:94)   ORF   42.10526316     NM_001191_siRNA_857     857   GCUCACUCUUCAGUCGGAA(SEQ ID NO:95)   UUCCGACUGAAGAGUGAGC(SEQ ID NO:96)   ORF   52.63157895     NM_001191_siRNA_859     859   UCACUCUUCAGUCGGAAAU(SEQ ID NO:97)   AUUUCCGACUGAAGAGUGA(SEQ ID NO:98)   ORF   42.10526316
    基因名称     BCL2L1   GenBank编号   NM 138578   GI:   20336334     生物     人   长度   2575   ORF区域   367-1068     基因座     598   Blast数据库   人   ORFGC%   56.84     定义     人BCL2样1(BCL2L1).编码线粒体蛋白质的核基因,转录物变体1,mRNA。     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_138578_siRNA_514     514     GCCAUCAAUGGCAACCCAU(5EQ ID NO:99)   AUGGGUUGCCAUUGAUGGC(SEQ ID NO:100)     ORF   52.63157895     NM_138578_siRNA_676     676     GCAUUCAGUGACCUGACAU(SEQ ID NO:101)   AUGUCAGGUCACUGAAUGC(SEQ ID NO:102)     ORF   47.36842105     NM_138578_siRNA_716     716     GGACAGCAUAUCAGAGCUU(SEQ ID NO:103)   AAGCUCUGAUAUGCUGUCC(SEQ ID NO:104)     ORF   47.36842105     NM_138578_siRNA_818     818     GCGUGGAAAGGGUAGACAA(SEQ ID NO:105)   UUGUCUACGCUUUCCACGC(SEQ ID NO:106)     ORF   52.63157895     NM_138578_siRNA_872     872     GGAUGGCCACUUACCUGAA(SEQ ID NO:107)   UUCAGGUAAGUGGCCAUCC(SEQ ID NO:108)     ORF   52.63157895
    基因名称     BRD2     GenBank编号   NM 005104   GI:          12408641     生物     人     长度   4693   ORF区域   1702-4107     基因座     6046     Blast数据库   人   ORFGC%   49.26     定义     人含布罗莫结构域2(BRD2),mRNA。     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_005104_siRNA_1851     1851     GGUGCCUGCUUUGCAACUU(SEQ ID NO:109)   AAGUUGCAAAGCAGGCACC(SEQ ID NO:110)     ORF   52.63157895       NM_005104_siRNA_2229     2229     GGUUGCAUCAAUGCCACAA(SEQ ID NO:111)   UUGUGGCAUUGAUGCAACC(SEQ ID NO:112)     ORF   47.36842105     NM_005104_siRNA_2694     2694     GCCUGACUCUCAGCAACAA(SEQ ID NO:113)   UUGUUGCUGAGAGUCAGGC(SEQ ID NO:114)     ORF   52.63157895     NM_005104_siRNA_2944     2944     GCUGCUGAUGUACGGCUUA(SEQ ID NO:115)   UAAGCCGUACAUCAGCAGC(SEQ ID NO:116)     ORF   52.63157895     NM_005104_siRNA_2969     2969     CCAACUGCUAUAAGUACAA(SEQ ID NO:117)   UUGUACUUAUAGCAGUUGG(SEQ ID NO118)     ORF   36.84210526
    基因名称     BRD3     GenBank编号   NM 007371   GI:   12408642     生物     人     长度   3085   ORF区域   140-2320     基因座     8019     Blast数据库   人   ORF   GC%   55.03     定义     人含布罗莫结构域3(BRD3),mRNA。     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_007371_siRNA_1098     1098     GGGAGAUGCUAUCCAAGAA(SEO ID NO:119)   UUCUUGGAUAGCAUCUCCC(SEQ ID NO:120)   ORF   47.36842105     NM_007371_siRNA_1279     1279     CCGGCUGAUGUUCUCGAAU(SEQ ID NO:121)   AUUCGAGAACAUCAGCCGG(SEQ ID NO:122)   ORF   52.63157895     NM_007371_siRNA_1921     1921     GGUAGUGCACAUCAUCCAA(SEQ ID NO:123)   UUGGAUGAUGUGCACUACC(SEQ ID NO:124)   ORF   47.36842105     NM_007371_siRNA_2017     2017     GCGGGAACUGGAGAGAUAU(SEQ ID NO:125)   AUAUCUCUCCAGUUCCCGC(SEQ ID NO:126)   ORF   52.63157895
    基因名称   WDR5   GenBank编号     NM 017588   GI:   61744459     生物   人   长度     3163   ORF区域   172-1176     基因座   11091   Blast数据库     人   ORFGC%   48.96     定义   人WD重复结构域5(WDR5),转录物变体1,mRNA。     名称   起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_017588_siRNA_424   424   GGUCACAAGCUGGGAAUAU(SEQ ID NO:127)   AUAUUCCCAGCUUGUGACC(SEQ ID NO:128)   ORF   47.36842105     NM_017588_siRNA_452   452   CCUGGUCGUCAGAUUCUAA(SEQ ID NO:129)   UUAGAAUCUGACGACCAGG(SEQ ID NO:130)   ORF   47.36842105     NM_017588_siRNA_1032   1032   CCUUCAGACGAAAGAGAUU(SEQ ID NO:131)   AAUCUCUUUCGUCUGAAGG(SEQ ID NO:132)   ORF   42.10526316     基因名称   C90rf119   GenBank编号     XM 372143   GI:   51467631     生物   人   长度     884   ORF区域   1-636     基因座   375757   Blast数据库     人   ORF   GC%   59.12     定义   预测:人染色体9可译框架119(C9orf119),mRNA。     名称   起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     XM_372143_siRNA_501   501   GGACCACAUUACCCAGCUU (SEQ ID NO:133)   AAGCUGGGUAAUGUGGUCC(SEQ ID NO:134)     ORF     52.63157895     XM_372143_siRNA_512   512   CCCAGCUUCACGAGUACAA(SEQ ID NO:135)   UUGUACUCGUGAAGCUGGG(SEQ ID NO:136)     ORF   52.63157895     XM_372143_siRNA_513   513   CCAGCUUCACGAGUACAAU(SEQ ID NO:137)   AUUGUACUCGUGAAGCUGG(SEQ ID NO:138)     ORF   47.36842105
    基因名称     GOUA2     GenBank编号     NM 004486  GI:     47078236     生物     人     长度     4304  ORF区域     50-3022     基因座     2801     Blast数据库     人  ORFGC%     55.84     定义 人高尔基体自身抗原,高尔基体蛋白亚家族a,2(GOLGA2),mRNA。
    名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′     区域   GC%     NM_004486_siRNA_406     406   CCAACAGCUCAAUGGUCUU(SEQ ID NO:139)   AAGACCAUUGAGCUGUUGG(SEQ ID NO:140)     ORF   47.36842105     NM_004486_siRNA_528     528   CCAGCUAUGUAACAAACAA(SEQ ID NO:141)   UUGUUUGUUACAUAGCUGG(SEQ ID NO:142)     ORF   36.84210526     NM_004486_siRNA_655     655   GCAGUUACAGGUUCACAUU(SEQ ID NO:143)   AAUGUGAACCUGUAACUGC(SEQ ID NO:144)     ORF   42.10526316
    基因名称  C10orf3   GenBank编号   NM 018131    GI:   34147683     生物  人   长度   2635    ORF区域   285-1679     基因座  55165   Blast数据库   人    ORF    GC%   40.72     定义  人染色体10可译框架3(C10orf3),mRNA。     名称  起点   有义RNA序列5′-3′   反义RNA序列5′-3′    区域   GC%     NM_018131_siRNA_292  292   CCAGAAGUACCAAAGAUUU(SEQ ID NO:145)   AAAUCUUUGGUACUUCUGG(SEQ ID NO:146)    ORF   36.84210526     NM_018131_siRNA_494  494   GGAGAAGAAUGCUUAUCAA(SEQ ID NO:147)   UUGAUAAGCAUUCUUCUCC(SEQ ID NO:148)    ORF   36.84210526     NM_018131_siRNA_551  551   CCAACUGAAGGCCAGAUAU(SEQ ID NO:149)   AUAUCUGGCCUUCAGUUGG(SEQ ID NO:150)    ORF   47.36842105     NM_D18131_siRNA_753  753   CCAAACUGCUUCAACUCAU(SEO ID NO:1S1)   AUGAGUUGAAGCAGUUUGG(SEQ ID NO:152)    ORF   42.10526316
    基因名称     CALD1   GenBank编号   NM 033138  GI:   44680104     生物     人   长度   5233  ORF区域   460-2841     基因座     800   Blast数据库   人  ORF  GC%   37.41     定义     人钙调素结合蛋白(CALD1),转录物变体1,mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM 033138_siRNA_695       695   CCAAGACAACCACCACAAA   UUUGUGGUGGUUGUCUUGG   ORF   47.36842105     NM_033138_siRNA_826          826   CCAACAAUAACAGAUGCAA(SEQ ID NO:153)   UUGCAUCUGUUAUUGUUGG(SEQ ID NO:154)   ORF   36.84210526     NM_033138_siRNA_926     926   GCCAAGAAAGAUACGAGAU(SEQ ID NO:155)   AUCUCGUAUCUUUCUUGGC(SEQ ID NO:156)   ORF   42.10526316     NM_033138_siRNA_2638     2638   GCAGCAGGCACACCAAAUA(SEQ ID NO:157)   UAUUUGGUGUGCCUGCUGC(SEQ ID NO:158)   ORF   52.63157895
    基因名称    CALM2   GenBank编号   NM 001743   GI:   20428653     生物    人   长度   1128   ORF区域   69-518     基因座    805   Blast数据库   人   ORFGC%   39.12     定义    人钙调蛋白2(磷酸酶激酶,δ)(CALM2)mRNA。     名称    起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_001743_siRNA_138    138   GGUGAUGGAACUAUAACAA(SEQ ID NO:159)   UUGUUAUAGUUCCAUCACC(SEQ ID NO:160)     ORF   36.84210526     NM_001743_siRNA_328    328   GAGAAGCAUUCCGUGUGUU(SEQ ID NO:161)   AACACACGGAAUGCUUCUC(SEQ ID NO:162)     ORF   47.36842105     NM_001743_siRNA_333    333   GCAUUCCGUGUGUUUGAUA(SEQ ID NO:163)   UAUCAAACACACGGAAUGC(SEQ ID NO:164)     ORF   42.10526316
    基因名称     CELSR2   GenBank编号   NM 001408   GI:   13325063     生物     人   长度   10531   ORF区域   63-8834     基因座     1952   Blast数据库   人   ORFGC%   60.9     定义     人钙粘蛋白,EGF LAG七通道G型受体2(红鹳同系物,果蝇)(CELSR2),mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_001408_siRNA_1997     1997   CCAGAUCACCAGUGGCAAU(SEQ ID NO:165)   AUUGCCACUGGUGAUCUGG(SEQ ID NO:166)     ORF   52.63157895     NM_001408_siRNA_2011     2011   GCAAUACUCGAAACCGCUU(SEQ ID NO:167)   AAGCGGUUUCGAGUAUUGC(SEQ ID NO:168)     ORF   47.36842105     NM_001408_siRNA_2950     2950   GCAACAUCCCUGAGGUCUU(SEQ ID NO:169)   AAGACCUCAGGGAUGUUGC(SEQ ID NO:170)     ORF   52.63157895     NM_001408_siRNA_4427     4427   GCAGCUGAAAUACUACAAU(SEQ ID NO:171)   AUUGUAGUAUUUCAGCUGC(SEQ ID NO:172)     ORF   36.84210526     NM_001408_siRNA_5512     5512   GCAGCUGUGAUCCAGGUUA(SEQ ID NO:173)   UAACCUGGAUCACAGCUGC(SEQ ID NO:174)     ORF   52.63157895
    基因名称     COPG2   GenBank编号   NM 012133     GI:   66348036     生物     人   长度   1703     ORF区域   618-28     基因座     26958   Blast数据库   人     ORFGC%   42.45     定义     人外被体蛋白复合物,亚基v2(COPG2),mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_012133_siRNA_97        97   GGUAGUGGCUCCAAUCCUU(SEQ ID NO:175)   AAGGAUUGGAGCCACUACC(SEQ ID NO:176)   ORF   52.63157895     NM_012133_siRNA_147     147   GGAGGCUCGUAUAUUCAAU(SEQ ID NO:177)   AUUGAAUAUACGAGCCUCC(SEQ ID NO:178)   ORF   42.10526316     NM_012133_siRNA_232     232   GGUGAACACUUUGGAACAA(SEQ ID NO:179)   UUGUUCCAAAGUGUUCACC(SEQ ID NO:180)   ORF   42.10526316     NM_012133_siRNA_380     380   GCAGUCUGACUAAAGACAU(SEQ ID NO:181)   AUGUCUUUAGUCAGACUGC(SEQ ID NO:182)   ORF   42.10526316     NM_012133_siRNA_548     548   CCCUGCACAUGAUGAAGAU(SEO ID NO:183)   AUCUUCAUCAUGUGCAGGG(SEQ ID NO:184)   ORF   47.36842105     基因名称     TSGA13   GenBank编号   NM 052933   GI:   31377632     生物     人   长度   1700   ORF区域   458-1285     基因座     114960   Blast数据库   人   ORF   GC%   46.02     定义     人睾丸特异性,13(TSGA113),mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_052933_siRNA_1130     1130   GCGAGUGAAAGGCCAAUUU(SEQ ID NO:185)   AAAUUGGCCUUUCACUCGC(SEQ ID NO:186)   ORF   47.36842105     NM_052933_siRNA_1140     1140   GGCCAAUUUCCAAAGUGAU(SEQ ID NO:187)   AUCACUUUGGAAAUUGGCC(SEQ ID NO:188)   ORF   42.10526316     NM_052933_siRNA_1141     1141   GCCAAUUUCCAAAGUGAUU(SEQ ID NO:189)   AAUCACUUUGGAAAUUGGC(5EQ ID NO:190)   ORF   36.84210526
    基因名称     CSTF2T   GenBank编号     NM 015235   GI:   46094083     生物     人   长度     4127   ORF区域   47-1897     基因座     23283   Blast数据库     人   ORFGC%   54.14     定义     人剪切刺激因子.3′前-RNA,亚基2,64kDa,tau变体(CSTF2T),  mRNA     名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′   区域   GC     NM_015235_siRNA_219     219   GCUAUGGCUUCUGCGAAUA(SEO ID NO:191)     UAUUCGCAGAAGCCAUAGC(SEQ ID NO:     192)   ORF   47.36842105     NM_015235_siRNA_340     340   GGAGGAGUUAAAGAGCCUU(SEQ ID NO:193)     AAGGCUCUUUAACUCCUCC(SEQ ID NO:194)   ORF   47.36842105     NM_015235_siRNA_641     641   CCACUGAUCCCAGGCAAAU(SEQ ID NO:195)     AUUUGCCUGGGAUCAGUGG(SEQ ID NO:     196)   ORF   52.63157895     NM_015235_siRNA_1138     1138   GCAUCAUGCCUCUGGUCAU(SEQ ID NO:197)     AUGACCAGAGGCAUGAUGC(SEQ ID NO:     198)   ORF   52.63157895     NM_015235_siRNA_1167     1167   GCCCUUCCUCACAUGAGAU(SEQ ID NO:199)     AUCUCAUGUGAGGAAGGGC(SEQ ID NO:     200)   ORF   52.63157895
    基因名称   CSMD2     GenBank编号     NM 052896   GI:   38045884     生物   人     长度     13113   ORF区域   30-10493     基因座   114784     Blast数据库     人   ORFGC%   57.15     定义   人CUB和Sushi多结构域2(CSMD2),  mRNA。
    名称     起点   有义RNA序列5′-3′    反义RNA序列5′-3′     区域   GC%     NM_052896_siRNA_224     224   GCUUGUGUUCCAGUCCUUU(SEQ ID NO:201)    AAAGGACUGGAACACAAGC(SEQ ID NO:202)     ORF   47.36842105     NM_052896_siRNA_520     520   GCUGCAACCUUGGCUUCUU(SEQ ID NO:203)    AAGAAGCCAAGGUUGCAGC(SEQ ID NO:    204)     ORF   52.63157895     NM_052896_siRNA_797     797   GGAAGUCACUGGGACAGAA(SEQ ID NO:205)    UUCUGUCCCAGUGACUUCC(SEQ ID NO:    206)     ORF   52.63157895     NM_052896_siRNA_931     931   CCCAAUACCAAGUCAAGAA(SEQ ID NO:207)    UUCUUGACUUGGUAUUGGG(SEQ ID NO:    208)     ORF   42.10526316     NM_052896_siRNA_938     938   CCAAGUCAAGAAGCAAAUU(SEQ ID NO:209)    AAUUUGCUUCUUGACUUGG(SEQ ID NO:    210)     ORF   36.84210526
    基因名称     CTCF   GenBanK编号   NM 006565     GI:   62952500     生物     人   长度   3797     ORF区域   291-2474     基因座     10664   Blast数据库   人     ORFGC%   48.81     定义     人CCCTC结合因子(锌指蛋白)(CTCF).mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3     区域   GC%            NM_006565_siRNA_812     812   GGUGGAGACACUAGAACAA(SEQ ID NO:211)   UUGUUCUAGUGUCUCCACC(SEQ ID NO:212)     ORF   47.36842105     NM_006565_siRNA_1211     1211   CCUCCUGAGGAAUCACCUU(SEQ ID NO:213)   AAGGUGAUUCCUCAGGAGG   (SEQID NO:214)     ORF   52.63157895     NM_006565_siRNA_1540     1540   CCCAAAGUGGUACCAUGAA(SEO ID NO:215)   UUCAUGGUACCACUUUGGG(SEO ID NO:216)     ORF   47.36842105     NM_006565_siRNA_1667     1667   GCAUUCCUAUAUUGAGCAA(SEQ ID NO:217)   UUGCUCAAUAUAGGAAUGC(SEQ ID NO:218)     ORF   36.84210526     NM_006565_siRNA_2285     2285   CCAGCCAACAGCUAUCAUU(SEQ ID NO:219)   AAUGAUAGCUGUUGGCUGG(SEQ ID NO:220)     ORF   47.36842105
    基因名称     CUTL1   GenBank编号   NM 001913   GI:   31652235     生物     人   长度   2942   ORF区域   20-2056     基因座     1523   Blast数据库   人   ORF   GC%   55.38     定义     人cut样1,CCAAT置换蛋白(果蝇)(CUTL1),转录物变体2,mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′       区域   GC%     NM_001913_siRNA_418     418   GGAAGAAUACAACAAGGAA(SEQ ID NO:221)   UUCCUUGUUGUAUUCUUCC(SEQ ID NO:222)       ORF   36.84210526     NM_001913_siRNA_1357     1357   GCAGGACCUGAGCAUCAUU(SEQ ID NO:223)   AAUGAUGCUCAGGUCCUGC(SEQ ID NO:224)       ORF   52.63157895     NM_001913_siRNA_1507     1507   CCAGGUGGAUUCACUGCUU(SEO ID NO:225)   AAGCAGUGAAUCCACCUGG(SEQ ID NO:226)       ORF   52.63157895     NM_001913_siRNA_1644     1644   CCGACAACAUCAAGCUCUU(SEQ ID NO:227)   AAGAGCUUGAUGUUGUCGG(SEQ ID NO:   228)       ORF   47.36842105     NM_001913_siRNA_2002     2002   GCACAAGUUCCACGAGAAU(SEQ ID NO:229)   AUUCUCGUGGAACUUGUGC(SEQ ID NO:230)       ORF   47.36842105
    基因名称   MYLC2PL   GenBank编号   NM 138403   GI:   40286635     生物   人   长度   681   ORF区域   1-681     基因座   93408   Blast数据库   人   ORFGC%   54.78        定义   人肌球蛋白轻链2,前体淋巴细胞特异(MYLC2PL),mRNA。     名称   起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_138403_siRNA_321   321   GGACUUGAGGGACACCUUU(SEQ ID NO:231)   AAAGGUGUCCCUCAAGUCC(SEQ ID NO:232)   ORF   52.63157895     NM_138403_siRNA_350   350   GCCGCAUCAAUGUCAAGAA(SEQ ID NO:233)   UUCUUGACAUUGAUGCGGC(SEQ ID NO:234)   ORF   47.36842105     NM_138403_siRNA_473   473   CCAUUCUCCACGCCUUCAA(SEQ ID NO:235)   UUGAAGGCGUGGAGAAUGG(SEQ ID NO:   236)   ORF   52.63157895     NM_138403_siRNA_588   588   GCAGAUGUUUGCAGCGUUU(SEQ ID NO:237)   AAACGCUGCAAACAUCUGC(SEQ ID NO:238)   ORF   47.36842105
    基因名称   DLX2   GenBank编号   NM 004405     GI:   6996003     生物   人   长度   2091     ORF区域   1-987     基因座   1746   Blast数据库   人     ORFGC%   61.81     定义                人distal-less同源框2 DLX2),mRNA。     名称   起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%       NM_004405_siRNA_676   676   GCUUCUCCACCUUGUGCUU(SEQ ID NO:239)   AAGCACAAGGUGGAGAAGC(SEQ ID NO:240)     ORF   52.63157895
    基因名称     KLHL24   GenBank编号   NM 017644   GI:   62865888     生物     人   长度   7331   ORF区域   296-2098     基因座     54800   Blast数据库   人   ORFGC%   42.55     定义     人kelch样24(果蝇)(KLHL24),mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_017644_siRNA_558     558   GCAGCUACUUCAGAGCUAU(SEQ ID NO:241)   AUAGCUCUGAAGUAGCUGC(SEQ ID NO:242)   ORF   47.36842105     NM_017644_siRNA_594     594   GGGAAAGCCGAGAAAUGUU(SEQ ID NO:243)   AACAUUUCUCGGCUUUCCC(SEQ ID NO:244)   ORF   47.36842105     NM_017644_siRNA_778     778   GCAACUUGAUCCUUGUAAU(SEQ ID NO:245)   AUUACAAGGAUCAAGUUGC(SEQ ID NO:246)   ORF   36.84210526     NM_017644_siRNA_811     811   GCGCUUUGCUGAUACCCAU(SEQ ID NO:247)   AUGGGUAUCAGCAAAGCGC(SEQ ID NO:248)   ORF   52.63157895     NM_017644_siRNA_913     913   GCUUGACAAAGAUGAACUU(SEQ ID NO:249)   AAGUUCAUCUUUGUCAAGC(SEQ ID NO:250)   ORF   36.84210526     NM_017644_siRNA_1679     1679   GGAOCUGAUGAUAAUACUU(SEQ ID NO:251)   AAGUAUUAUCAUCAGGUCC(SEQ ID NO:252)   ORF   36.84210526
    基因名称   CHCHD8 aka E2IG2   GenBank编号   NM 016565     GI:   46198303     生物   人   长度   833     ORF区域   106-369     基因座   51287   Blast数据库   人     ORFGC%   60.99     定义 人含有coiIed-coil-helix-coiled-coil-helix结构域的8(CICHD8),mRNA.     名称   起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%          NM_016565_siRNA_115   115   UCAGUCCCUCAAGGCCAUA(SEQ ID NO:256)   UAUGGCCUUGAGGGACUGA(SEQ ID NO:254)     ORF   52.63157895     NM_016565_siRNA_138   138   GACCCAACGGGUGAAGAAA(SEQ ID NO:255)   UUUCUUCACCCGUUGGGUC(SEQ ID NO:256)     ORF   52.63157895     NM_016565_siRNA_140   140   CCCAACGGGUGAAGAAAGA(SEQ ID NO:257)   UCUUUCUUCACCCGUUGGG(SEQ ID NO:258)     ORF   52.63157895
    基因名称   EIF3S10   GenBank编号   NM 003750   GI:   4503508     生物   人   长度   5256   ORF区域   114-4262     基因座   8661   Blast数据库   人   ORFGC%   46.81     定义   人真核细胞翻译启动因子3,亚基θ,150/170kDa(EIF3S10),mRNA。     名称   起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_003750_siRNA_298   298   GCAAGAGCCACUUGGCAAA(SEO ID NO:259)   UUUGCCAAGUGGCUCUUGC(SEQ ID NO:260)   ORF   52.63157895     NM_003750_siRNA_440   440   GCAGAUGGUCUUAGAUAUA(SEQ ID NO:261)   UAUAUCUAAGACCAUCUGC(SEQ ID NO:262)   ORF   36.84210526
    NM_003750_siRNA_626     626   GCGCCUGUACCAUGAUAUU(SEQ ID NO:263)   AAUAUCAUGGUACAGGCGC(SEQ ID NO:264)     ORF   47.36842105     NM_003750_siRNA_635     635   CCAUGAUAUUGCCCAGCAA(SEQ ID NO:265)   UUGCUGGGCAAUAUCAUGG(SEQ ID NO:266)     ORF   47.36842105     NM_003750_siRNA_1328     1328   GCGAGUCACAAAGGUUCUA(SEQ ID NO:267)   UAGAACCUUUGUGACUCGC(SEO ID NO:268)     ORF   47.36842105
    基因名称     ERBB2IP   GenBank编号   NM 018695   GI:   56237019     生物     人   长度   6916   ORF区域   309-4424     基因座     55914   Blast数据库   人   0RFGC%   38.63     定义                 人erbb2相互作用蛋白(ERBB2IP),转录物变体2,mRNA。                                                                                                                                名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域       GC%     NM_018695_siRNA_899         899   GGAAGUGCCUGAAGUACUU(SEQ ID NO:269)   AAGUACUUCAGGCACUUCC(SEQ ID NO:270)   ORF   47.36842105     NM_018695_siRNA_920            920   GCAACUAAGUGGAUUGAAA(SEQ ID NO:271)   UUUCAAUCCACUUAGUUGC(SEQ ID NO:272)   ORF   36.84210526     NM_018695_siRNA_1106     1106   GCAGCUUCCUGAGACUAUU(SEQ ID NO:273)   AAUAGUCUCAGGAAGCUGC(5EQ ID NO:274)   ORF   47.36842105     NM_018695_siRNA_1598     1598   GCCAAGGACUGAGGAUGUU(SEQ ID NO:275)   AACAUCCUCAGUCCUUGGC(SEQ ID NO:276)   ORF   52.63157895     NM_018695_siRNA_2568     2568   GCUGAUGACACUCACAAAU(SEO ID NO:277)   AUUUGUGAGUGUCAUCAGC(SEQ ID NO:278)   ORF   42.10526316     NM_018695_siRNA_3434     3434   CCAUUUACAUCAGAGACUU(SEQ ID NO:279)   AAGUCUCUGAUGUAAAUGG(SEQ ID NO:280)   ORF   36.84210526
    基因名称     FER1L3   GenBank编号   NM 013451   GI:   19718757     生物     人   长度   6829   ORF区域   89-6274     基因座     26509   Blast数据库   人   ORFGC%   47.63     定义                                      人fer-1样3,myofelin(线虫(C.elegans))(FER1L3),转录物变体1.mRNA。                                                                                                                              名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%               NM_013451_siRNA_1529     1529   GCUGCAUCAUAUACAGUAA(SEQ ID NO:281)   UUACUGUAUAUGAUGCAGC(SEQ ID NO:282)   ORF   36.84210526     NM_013451_siRNA_1589     1589   CCUUGUUACCUGAAUCUUU(SEQ ID NO:283)   AAAGAUUCAGGUAACAAGG(SEQ ID NO:284)   ORF   36.84210526     NM_013451_siRNA_1747     1747   GCUUGAGCCCAUUUCAAAU(SEQ ID NO:285)   AUUUGAAAUGGGCUCAAGC(SEQ ID NO:286)   ORF   42.10526316     NM_013451_siRNA_3081     3081   CCAUUCCUCCUGAUCAUAA(SEQ ID NO:287)   UUAUGAUCAGGAGGAAUGG(SEQ ID NO:288)   ORF   42.10526316     NM013451_siRNA_5017     5017   CCGAUUCCUUUCCCGCUUU(SEQ ID NO:289)   AAAGCGGGAAAGGAAUCGG(SEQ ID NO:290)   ORF   52.63157895
    基因名称   FER1L3     GenBank编号     NM 013337  GI: 19718758     生物   人     长度     6790  ORF区域 89-6235
    基因座     26509   blast数据库   人   ORFGC%   47.63     定义     人fer-1样3,mvoferlin(线虫)(FER1L3),转录物变体2,mRNA。     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_133337_siRNA_1501     1501   GGAAGUAAACACAGGAGAA(SEQ ID NO:291)   UUCUCCUGUGUUUACUUCC(SEQ ID NO:292)   ORF   42.10526316     NM_133337_siRNA_1550     1550   CCUUGUUACCUGAAUCUUU(SEQ ID NO:293)   AAAGAUUCAG6UAACAAGG(SEQ ID NO:294)   ORF   36.84210526     NM_133337_siRNA_1708     1708   GCUUGAGCCCAUUUCAAAU(SEO ID NO:295)   AUUUGAAAUGGGCUCAAGC(SEQ ID NO:296)   0RF   42.10526316     NM_133337_siRNA_3042     3042   CCAUUCCUCCUGAUCAUAA(SEQ ID N0:297)   UUAUGAUCAGGAGGAAUGG(SEQ ID NO:298)   ORF   42.10526316
    基因名称     FKBP8   GenBank编号     NM 012181     GI:   52630439     生物     人   长度     1787     ORF区域   114-1355     基因座     23770   Blast数据库     人     ORF GC%   62.08     定义     人FK506结合蛋白8.3kDa(FKBP8),mRNA。     名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′     NM_012181_siRNA_855     855   GCCAUCAAGGCUAUCACCU(SEQ ID NO:299)     AGGUGAUAGCCUUGAUGGC(SEQ ID NO:300)     ORF   52.63157895     NM_012181_siRNA_916     916   UGCUGCAGUUGAAGGUGAA(SEQ ID NO:301)     UUCACCUUCAAOUGCAGGA(SEQ ID NO:302)     ORF   47.36842105     NM_012181_siRNA_1019     1019   CCAGCCAGACAACAUCAAG(SEQ ID NO:303)     CUUGAUGUUGUCUGGCUGG(SEQ ID NO:     304)     ORF   52.63157895     NM_012181_siRNA_1022     1022   GCCAGACAACAUCAAGGCU(SEQ ID NO:305)     AGCCUUGAUGUUGUCUGGC(SEQ ID NO:     306)     ORF   52.63157895     NM_012181_siRNA_1141     1141   UCCACGCAGAGCUCUCAAA(SEQ ID NO:307)     UUUGAGAGCUCUGCGUGGA(SEQ ID NO:     308)     ORF   52.63157895
    基因名称     FUSIP1     GenBank编号   NM 006625   GI:   16905515     生物     人     长度   1842   ORF区域   77-628     基因座     10772     Blast数据库   人   ORFGC%   45.66     定义     人FUS相互作用蛋白(富含丝氨酸,精氨酸)1(FUSIP1),转录物变体1,mRNA。     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_06625_siRNA_157     157     GCGUGAAUUUGGUCGUUAU(SEQ ID NO:309)   AUAACGACCAAAUUCACGC(SEQ ID HO:310)   ORF   42.10526310     NM_006625_siRNA_567     567     GACCAAACUGCAGCUGGAA(SEQ ID NO:311)   UUCCAGCUGCAGUUUGGUC(SEQ ID NO:312)   ORF   52.63157895     NH一00662S—slRNA一569     569     CCAAACUGCAGCUGGAAUA(SEQ ID NO:313)   UAUUCCAGCUGCAGUUUGG(SEQ ID NO:314)   ORF   47.36842105
    其因名称   FUSIPl     GenBank编号     NM 054016   GI:     16905516     生物   人     长度     2924   ORF区域     77-865     基因座   10772     Blast数据库     人   ORFGC%     43.98     定义   人FUS相互作用蛋白(富含丝氨酸/精氨酸)1(FUSP1),转录物变体2,mRNA。     序列   NH_0S4016
    名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_054016_siRNA_157     157   GOGUGAAUUUGGUCGUUAU(SEQ ID N0:315)   AUAACGACCAAAUUCACGC(SEQ ID NO:316)     ORF   42.10526316     NM_054016_siRNA_169     169   UCGUUAUGGUCCUAUAGUU(SEO ID NO:317)   AACUAUAGGACCAUAACGA(SEQ ID NO:318)     ORF   36.84210526     NM_0S4016_siRNA_220     220   CCGUCCAAGAGGAUUUGCU(SEQ ID NO:319)   AGCAAAUCCUCUUGGACGG(SEO ID NO:320)     ORF   52.63157895
    基因名称   GenBank编号   AK 025846   GI:   10438485     生物     人   长度   2388   ORF区域     基因座   Blast数据库   人   ORFGC%     定义     人cDNA:FLJ22193fls,克降HRC01108.gas5 mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     AK025846_siRNA_246     246   GCAGAUGUGCUUCAUGCAU(SEQ ID NO:321)   AUGCAUGAAGCACAUCUGC(SEQ ID NO:322)   47.36842105     AK025846_siRNA_1968     1968   GCUAUACCUUUGCUUCUUU(SEQ ID NO:323)   AAAGAAGCAAAGGUAUAGC(SEQ ID NO:324)   36.84210526     AK025846_siRNA_2088     208B   CCCAACUACUGUUUCAGUU(SEQ ID NO:325)   AACUGAAACAGUAGUUGGG(SEQ ID NO:326)   42.10526316     AKOZ5846_siRNA_2287     2287   CCAGGAGCUGGAAUACAAA(SEQ ID NO:327)   UUUGUAUUCCAGCUCCUGG(SEQ ID NO:328)   47.36842105     AK025846_siRNA_2296     2296   GGAAUACAAAUGAGGACUU(SEQ ID NO:329)   AAGUCCUCAUUUGUAUUCC(SEQ ID NO:330)   36.84210526
    基因名称     GATA4     GenBank编号     NM 002052   GI:     33188460     生物     人     长度     3372   ORF区域     519.1847     基因座     2626     Blast数椐库     人   ORFGC%     68.78     定义 人GATA结合蛋白4(GATA4),mRNA
    名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   区域     NM_002052_siRNA_1158     1158   GGCAGAGAGUGUGUCAACU(SEQ ID NO:331)   AGUUGACACACUCUCUGCC(SEQ ID NO:332)     ORF   52.63157895     NM_002052_siRNA_1243     1243   GCCUCUACCACAAGAUGAA(SEQ ID NO:333)   UUCAUCUUGUGGUAGAGGC(SEQ ID NO:334)     ORF   47.36842105     NM_002052_siRNA_1477     1477   GGAAGCCCAAGAACCUGAA(SEQ ID NO:335)   UUCAGGUUCUUGGGCUUCC(SEQ ID NO:336)     ORF   52.63157895     NM_002052_siRNA_1482     1482   C(CAAGAACCUGAAUAAAU(SEQ ID NO:337)   AUUUAUUCAGGUUCUUGGG(SEQ ID NO:338)     ORF   36.84210526
    基因名称     GRB2     GenBank编号     NM 002086     GI:   45359857     生物     人     长度     3317     ORF区域   358-1011     基因座     2885     Blast数据库     人     ORFGC%   50.77     定义     人生长因子受体结合蛋白2(GRB2),转录物变体1,mRNA     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_002086_siRNA_365     365     CCAUCGCCAAAUAUGACUU(SEQ ID NO:339)   AAGUCAUAUUUGGCGAUGG(SEQ ID NO:340)     ORF   42.10526316     NM_002086_siRNA_464     464     GGUACAAGGCAGAGCUUAA(SEQ ID NO:341)   UUAAGCUCUGCCUUGUACC(SEQ ID NO:342)     ORF   47.36842105     NM_002086_siRNA_494     494     GCUUCAUUCCCAAGAACUA(SEQ ID NO:343)   UAGUUCUUGGGAAUGAAGC(SEQ ID NO:344)     ORF   42.10526316     NM_002086_siRNA_779     779     CCAGAAACCAGCAGAUAUU(SEQ ID NO:345)   AAUAUCUGCUGGUUUCUGG(SEQ ID NO:346)     ORF   42.10526316     NM_002086_siRNA_840     840     CCAGGCCCUCUUUGACUUU(SEQ ID NO:347)   AAAGUCAAAGAGGGCCUGG(SEQ ID NO:348)     ORF   52.63157895
    基因名称     GTF2E1   GenBank编号   NM 005513   GI:   5031726     生物     人   长度   2969   ORF区域   55-1374     基因座     2960   Blast数据库   人   ORFGC%   47.88     定义     人通用转录因子IIE,多肽1(α亚基,56kD)(GTF2E1),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_005513_siRNA_198     198   GCUGGAGCUGCUCAAGUUU(SEQ ID NO:349)   AAACUUGAGCAGCUCCAGC(SEQ ID NO:350)   ORF   52.63157895     NM_005513_siRNA_378     378   CCACAUGAGAAGAAGAAUU(SEQ ID NO:351)   AAUUCUUCUUCUCAUGUGG(SEQ ID NO:352)   ORF   36.84210526     NM_005513_siRNA_885     885   GCCUAUUUGGUUGAGAGAA(SEQ ID NO:353)   UUCUCUCAACCAAAUAGGC(SEQ ID NO:354)   ORF   42.10526316     NM_005513_siRNA_950     950   GCAUAGAUAUGGACGCAUU(SEQ ID NO:355)   AAUGCGUCCAUAUCUAUGC(SEQ ID NO:356)   ORF   42.10526316     NM_005513_siRNA_1349     1349   GCAUGUUUGAGGACCUCUU(SEQ ID NO:357)   AAGAGGUCCUCAAACAUGC(SEQ ID NO:358)   ORF   47.36842105
    基因名称     RABL3   GenBank编号   NM 173825   GI:   62751416     生物     人   长度   3449   ORF区域   31-741     基因座     285282   Blast数据库   人   ORFGC%   43.75     定义     人RAB,RAS癌基因家族成员样3(RABL3),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_173825_siRNA_47     47   GGGUGAAGGUACUGGUGUU(SEQ ID NO:359)   AACACCAGUACCUUCACCC(SEQ ID NO:360)   ORF   52.63157895     NM_173825_siRNA_266     266   GCACAAGAGCAGUAUUCUA(SEQ ID NO:361)   UAGAAUACUGCUCUUGUGC(SEQ ID NO:362)   ORF   42.10526316     NM_173825_siRNA_467     467   GGACUAAACUGGACCAGAU(SEQ ID NO:363)   AUCUGGUCCAGUUUAGUCC(SEQ ID NO:364)   ORF   47.36842105     NM_173825_siRNA_528     528   CCUGGCUGAGGAUUUCAAU(SEQ ID NO:365)   AUUGAAAUCCUCAGCCAGG(SEQ ID NO:366)   ORF   47.36842105
    基因名称     HM13   GenBank编号     NM 030789   GI:   30581114     生物     人   长度     1604   ORF区域   115-1248     基因座     81502   Blast数据库     人   ORFGC%   54.77              定义     人组织相容(次要)13(HM13),转录物变体1,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_030789_siRNA_293         293   GCAAGAAUGCUUCAGACAU(SEQ ID NO:367)   AUGUCUGAAGCAUUCUUGC(SEQ ID NO:368)   ORF   42.10526316     NM_030789_siRNA_420     420   CCUCCUGCUGUCCAUGUAU(SEQ ID NO:369)   AUACAUGGACAGCAGGAGG(SEQ ID NO:370)   ORF   52.63157895     NM_030789_siRNA_645     645   GCUGAGGAAGCACUGGAUU(SEQ ID NO:371)   AAUCCAGUGCUUCCUCAGC(SEQ ID NO:372)   ORF   52.63157895     NM_030789_siRNA_870     870   CCUCGAAGCAAACAACUUU(SEQ ID NO:373)   AAAGUUGUUUGCUUCGAGG(SEQ ID NO:374)   ORF   42.10526316     NM_030789_siRNA_1155     1155   GGAGUCAAAUCCUAAGGAU(SEQ ID NO:375)   AUCCUUAGGAUUUGACUCC(SEQ ID NO:376)   ORF   42.10526316
    基因名称     HNRPL   GenBank编号   NM 001533   GI:   52632382     生物     人   长度   2129   ORF区域   12-1781     基因座     3191   Blast数据库   人   ORFGC%   51.53     定义     人异源核核糖核蛋白L(HNRPL),转录物变体1,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_001533_siRNA_480     480   GCAGCCGACAACCAAAUAU(SEQ ID NO:377)   AUAUUUGGUUGUCGGCUGC(SEQ ID NO:   378)   ORF   47.36842105     NM_001533_siRNA_716     716   GGUGGAAUUUGACUCAGUU(SEQ ID NO:379)   AACUGAGUCAAAUUCCACC(SEQ ID NO:380)   ORF   42.10526316     NM_001533_siRNA_719     719   GGAAUUUGACUCAGUUCAA(SEQ ID NO:381)   UUGAACUGAGUCAAAUUCC(SEQ ID NO:382)   ORF   36.84210526     NM_001533_siRNA_793     793   GCACUCUGAAGAUCGAAUA(SEQ ID NO:383)   UAUUCGAUCUUCAGAGUGC(SEQ ID NO:384)   ORF   42.10526316
    基因名称     HOXC13   GenBank编号   NM 017410     GI:   24497535     生物     人   长度   2435     ORF区域   116-1108     基因座     3229   Blast数据库   人     ORFGC%   62.34     定义     人同源框(HOXC13),转录物变体1,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_017410_siRNA_154     154   GAGGCUUAUGUACGUCUAU(SEQ ID NO:385)   AUAGACGUACAUAAGGCUC(SEQ ID NO:386)     ORF   42.10526316        NM_017410_siRNA_912     912   CCUACACUAAGGUGCAGCU(SEQ ID NO:387)   AGCUGCACCUUAGUGUAGG(SEQ ID NO:388)     ORF   52.63157895
    NM_017410_siRNA_1066     1066   GGUGGUCAGCAAAUCGAAA(SEQ ID NO:389)   UUUCGAUUUGCUGACCACC(SEQ ID NO:390)     ORF   47.36842105     NM_017410_siRNA_1074     1074   GCAAAUCGAAAGCGCCUCA(SEQ ID NO:391)   UGAGGCGCUUUCGAUUUGC(SEQ ID NO:   392)     ORF   52.63157895
    基因名称     HP1BP3   GenBank编号   NM 016287   GI:   56676329     生物     人   长度   1855   ORF区域   101-1762     基因座     50809   Blast数据库   人   ORFGC%   47.24          定义     人异染色质蛋白1,结合蛋白3(HP1BP3),mRNA,也称为HP1-BP74     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_016287_siRNA_576     576   CCAAGAUGGAUGCAAUCUU(SEQ ID NO:393)   AAGAUUGCAUCCAUCUUGG(SEQ ID NO:394)   ORF   42.10526316     NM_016287_siRNA_990     990   GGCCUCAGCUGUUGAAGAA(SEQ ID NO:395)   UUCUUCAACAGCUGAGGCC(SEQ ID NO:396)   ORF   52.63157895     NM_016287_siRNA_1112     1112   GGUGGAAGCCUGAUGGAAU(SEQ ID NO:397)   AUUCCAUCAGGCUUCCACC(SEQ ID NO:398)   ORF   52.63157895   
    基因名称     HSPC135   GenBank编号   NM 014170     GI:   56549684     生物     人   长度   1364     ORF区域   48-902     基因座     29083   Blast数据库   人     ORFGC%   46.91     定义     人HSPC135蛋白(HSPC135),转录物变体1,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_014170_siRNA_533     533   GGUGGACAUGCCAGGUUAU(SEQ ID NO:399)   AUAACCUGGCAUGUCCACC(SEQ ID NO:400)     ORF   52.63157895     NM_014170_siRNA_638     638   GGAUAGCGUUGUUGGAAUU(SEQ ID NO:401)   AAUUCCAACAACGCUAUCC(SEQ ID NO:402)     ORF   42.10526316     NM_014170_siRNA_849     849   GGAAUCCACCUGUUGAGAU(SEQ ID NO:403)   AUCUCAACAGGUGGAUUCC(SEQ ID NO:404)     ORF   47.36842105     NM_014170_siRNA_854     854   CCACCUGUUGAGAUGCUUU(SEQ ID NO:405)   AAAGCAUCUCAACAGGUGG(SEQ ID NO:406)     ORF   47.36842105
    基因名称     CD200R1   GenBank编号   NM 138806   GI:   41327722     生物     人   长度   2272   ORF区域   234-1280     基因座     131450   Blast数据库   人   ORFGC%   43.18     定义     人CD200受体1(CD200R1),转录物变体1,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_138806_siRNA_341     341   GCAAACUAGCAAGGAGAAU(SEQ ID NO:407)   AUUCUCCUUGCUAGUUUGC(SEQ ID NO:408)   ORF   42.10526316     NM_138806_siRNA_429     429   GCAGAAGUUAACACUUCAU(SEQ ID NO:409)   AUGAAGUGUUAACUUCUGC(SEQ ID NO:410)   ORF   36.84210526     NM_138806_siRNA_462     462   GCUACAAAUGCUGUGCUUU(SEQ ID NO:411)   AAAGCACAGCAUUUGUAGC(SEQ ID NO:412)   ORF   42.10526316     NM_138806_siRNA_590     590   GGAAACCAACUGUACUGAU(SEQ ID NO:413)   AUCAGUACAGUUGGUUUCC(SEQ ID NO:414)   ORF   42.10526316     NM_138806_siRNA_869     869   GCAAGAAUACUGGAGCAAU(SEQ ID NO:415)   AUUGCUCCAGUAUUCUUGC(SEQ ID NO:416)   ORF   42.10526316     NM_138806_siRNA_1230     1230   GCAUCUGAGGCAUUACAAA(SEQ ID NO:417)   UUUGUAAUGCCUCAGAUGC(SEQ ID NO:418)   ORF   42.10526316
    基因名称     ID3   GenBank编号  NM 002167   GI:   32171181     生物     人   长度  1203   ORF区域   368-727     基因座     3399   Blast数据库 人   ORFGC%   64.17     定义     人DNA结合3的抑制剂,显性负螺旋-环-螺旋蛋白(ID3),mRNA     名称     起点   有义RNA序列5′-3′ 反义RNA序列5′-3′   区域   GC%     NM_002167_siRNA_561     561   GCCAGGUGGAAAUCCUACA(SEQ ID NO:419) UGUAGGAUUUCCACCUGGC(SEQ ID NO:420)   ORF   52.63157895     NM_002167_siRNA_580     580   GCGCGUCAUCGACUACAUU(SEQ ID NO:421) AAUGUAGUCGAUGACGCGC(SEQ ID NO:422)   ORF   52.63157895     NM_002167_siRNA_680     680   GCUCCGGAACUUGUCAUCU(SEQ ID NO:423) AGAUGACAAGUUCCGGAGC(SEQ ID NO:424)   ORF   52.63157895
    基因名称     IGF2R     GenBank编号     NM 000876   GI:     4504610     生物     人     长度     9090   ORF区域     148-7623     基因座     3482     Blast数据库     人   ORFGC%     52.23     定义     人胰岛素样生长因子2受体(IGF2R),mRNA
  名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%   NM_000876_siRNA_461         461   CCAGAUCUCUCCUGGAAUU(SEQ ID NO:425)   AAUUCCAGGAGAGAUCUGG(SEQ ID NO:426)     ORF   47.36842105   NM_000876_siRNA_558     558   CCUGGGAACUCCUGAAUUU(SEQ ID NO:427)   AAAUUCAGGAGUUCCCAGG(SEQ 1D NO:428)     ORF   47.36842105   NM_000876_siRNA_649     649   GCAAAUAAGGAGGUGCCAU(SEQ ID NO:429)   AUGGCACCUCCUUAUUUGC(SEQ ID NO:430)     ORF      47.36842105   NM_000876_siRNA_1146     1146   GCAGCAGGAUGUCUCCAUA(SEQ ID NO:431)   UAUGGAGACAUCCUGCUGC(SEQ ID NO:432)     ORF   52.63157895   NM_000876_siRNA_1927     1927   GCACCAGUGUUGAGAACUU(SEQ ID NO:433)   AAGUUCUCAACACUGGUGC(SEQ ID NO:434)     ORF   47.36842105   NM_000876_siRNA_2092     2092   GCCUAUAAAGUUGAGACAA(SEQ ID NO:435)   UUGUCUCAACUUUAUAGGC(SEQ ID NO:436)     ORF   36.84210526   NM_000876_siRNA_2735     2735   GCAGCCUCCUUCUGGAAUA(SEQ ID NO:437)   UAUUCCAGAAGGAGGCUGC(SEQ ID NO:438)     ORF   52.63157895   NM_000876_siRNA_3901     3901   GCUGGCGAAUACACUUAUU(SEQ ID NO:439)   AAUAAGUGUAUUCGCCAGC(SEQ ID NO:440)     ORF   42.10526316   NM_000876_siRNA_6587     6587   GCUUCAGCCUCGGAGAUAU(SEQ ID NO:441)   AUAUCUCCGAGGCUGAAGC(SEQ ID NO:442)     ORF   52.63157895   NM_000876_siRNA_6849     6849   GGAUAAGACCAAGUCUGUU(sEQ ID NO:443)   AACAGACUUGGUCUUAUCC(SEQ ID NO:444)     ORF   42.10526316
    基因名称     JAK1   GenBank编号   NM 002227     GI:   4504802     生物     人   长度   3541     ORF区域   76-3504     基因座     3716   BIast数据库   人     ORFGC%   47.54               定义     人Janus激酶1(蛋白酪氨酸激酶)(JAK1),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_002227_siRNA_297         297   GCUCUGGUAUGCUCCAAAU(SEQ ID NO:445)   AUUUGGAGCAUACCAGAGC(SEQ ID NO:446)     ORF   47.36842105     NM_002227_siRNA_320     320   CCAUCACCGUUGAUGACAA(SEQ ID NO:447)   UUGUCAUCAACGGUGAUGG(SEQ ID NO:448)     ORF   47.36842105     NM_002227_siRNA_380     380   CCAAUUGGCAUGGAACCAA(SEQ ID NO:449)   UUGGUUCCAUGCCAAUUGG(SEQ ID NO:450)     ORF   47.36842105     NM_002227_siRNA_387     387   GCAUGGAACCAACGACAAU(SEQ ID NO:451)   AUUGUCGUUGGUUCCAUGC(sEQ ID NO:452)     ORF   47.36842105     NM_002227_siRNA_621     621   CCUGGCCAUCUCACACUAU(SEQ ID NO:453)   AUAGUGUGAGAUGGCCAGG(SEQ ID NO:   454)     ORF   52.63157895     NM_002227_siRNA_626     626   CCAUCUCACACUAUGCCAU(SEQ ID NO:455)   AUGGCAUAGUGUGAGAUGG(SEQ ID NO:   456)     ORF   47.36842105     NM_002227_siRNA_1511     1511   CCCAGAAGCAGUUCAAGAA(SEQ ID NO:457)   UUCUUGAACUGCUUCUGGG(SEQ ID NO:458)     ORF   47.36842105     NM_002227_siRNA_1701     1701   GCUGGUGGCUACUAAGAAA(SEQ ID NO:459)   UUUCUUAGUAGCCACCAGC(SEQ ID NO:460)     ORF   47.36842105     NM_002227_siRNA_1814     1814   GCACGAGAACACACAUCUA(SEQ ID NO:461)   UAGAUGUGUGUUCUCGUGC(SEQ ID NO:   462)     ORF   47.36842105     NM_002227_siRNA_2022     2022   GGAGAAUAUCAUGGUGGAA(SEQ ID NO:463)   UUCCACCAUGAUAUUCUCC(SEQ ID NO:464)     ORF   42.10526316
    基因名称     KIF13B   GenBank编号   NM 015254   GI:   46852171     生物     人   长度   8796   ORF区域   91-5571     基因座     23303   Blast数据库   人   ORFGC%   52.64     定义     人驱动蛋白家族成员13B(KIF13B),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_015254_siRNA_141     141   GCGAGAGACUGACUUGCAU(SEQ ID NO:465)   AUGCAAGUCAGUCUCUCGC(SEQ ID NO:466)   ORF   52.63157895     NM_015254_siRNA_631     631   CCUUAUGUCGACGGACUUU(SEQ ID NO:467)   AAAGUCCGUCGACAUAAGG(SEQ ID NO:468)   ORF   47.36842105     NM_015254_siRNA_1374     1374   GCUUGAGAGUCUUGGAAUA(SEQ ID NO:469)   UAUUCCAAGACUCUCAAGC(SEQ ID NO:470)   ORF   42.10526316     NM_015254_siRNA_1473     1473   GCUUCUGGUGUACUAUUUA(SEQ ID NO:471)   UAAAUAGUACACCAGAAGC(SEQ ID NO:472)   ORF   36.84210526     NM_015254_siRNA_4479     4479   GCUCCUCAAGUCUCUCUUU(SEQ ID NO:473)   AAAGAGAGACUUGAGGAGC(SEQ ID NO:474)   ORF   47.36842105
    基因名称     MK167   GenBank编号   NM 002417   GI:   19923216     生物     人   长度   12515   ORF区域   197-9967     基因座     4288   Blast数据库   人   ORFGC%   47.35     定义     由单克隆抗体KI-67识别的人抗原(MKI67),mRNA     名称     起点   有义RN序列5′-3′   反义RNA序列5′-3′   区域   GC%         NM_002417_siRNA_727     727   GGGAACAACUAAUGUUCAU(SEQ ID NO:475)   AUGAACAUUAGUUGUUCCC(SEQ ID NO:476)   ORF   36.84210526     NM_002417_siRNA_1913     1913   GCACAAAGCUUGGUUAUAA(SEQ ID NO:477)   UUAUAACCAAGCUUUGUGC(SEQ ID NO:478)   ORF   36.84210526     NM_002417_siRNA_3621     3621   GCACAAAGCAAUGGCCUAA(SEQ ID NO:479)   UUAGGCCAUUGCUUUGUGC(SEQ ID NO:480)   ORF   47.36842105     NM_002417_siRNA_6317     6317   GCGUUUAAGGAAUCUGCAA(SEQ ID NO:481)   UUGCAGAUUCCUUAAACGC(SEQ ID NO:482)   ORF   42.10526316     NM_002417_siRNA_8846     8846   GCAUUUAAGCAACCUGCAA(SEQ ID NO:483)   UUGCAGGUUGCUUAAAUGC(SEQ ID NO:484)   ORF   42.10526316     NM_002417_siRNA_9505     9505   GCAAAUAACUGAGGUCUUU(SEQ ID NO:485)   AAAGACCUCAGUUAUUUGC(SEQ ID NO:486)   ORF   36.84210526
    基因名称     LIPC   GenBank编号   NM 000236   GI:   4557722     生物     人   长度   1603   ORF区域   58-1557     基因座     3990   Blast数据库   人   ORFGC%   52.34     定义     人脂酶,肝(LIPC),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_000236_siRNA_122         122   CCCUUGGACAAAGCCUGAA(SEQ ID NO:487)   UUCAGGCUUUGUCCAAGGG(SEQ ID NO:488)   ORF   52.63157895     NM_000236_siRNA_646     646   GGACCUUUGUUUGAGGGAA(SEQ ID NO:489)   UUCCCUCAAACAAAGGUCC(SEQ ID NO:490)   ORF   47.36842105     NM_000236_siRNA_767     767   CCAUAGGACACUAUGACUU(SEQ ID NO:491)   AAGUCAUAGUGUCCUAUGG(SEQ ID NO:492)   ORF   42.10526316     NM_000236_siRNA_1058     1058   GCAAGAGCAAGAGGCUCUU(SEQ ID NO:493)   AAGAGCCUCUUGCUCUUGC(SEQ ID NO:494)   ORF   52.63157895     NM_000236_siRNA_1229     1229   GCAAAGGAAUUGCUAGUAA(SEQ ID NO:495)   UUACUAGCAAUUCCUUUGC(SEQ ID NO:496)   ORF   36.84210526
    基因名称     NFKBIZ   GenBank编号   NM 031419   GI:   53832022     生物     人   长度   3938   ORF区域   116-2272     基因座     64332   Blast数据库   人   ORFGC%   53.0     定义     人B细胞K轻链多肽基因增强子核因子抑制因子,ζ(NFKBIZ),转录物变体1,mRNA(MAL)     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_031419_siRNA_490     490   GCACAUCCGAAGUCAUAAA(SEQ ID NO:497)   UUUAUGACUUCGGAUGUGC(SEQ ID NO:498)   ORF   42.10526316     NM_031419_siRNA_616     616   GCCCGAUUCGUUGUCUGAU(SEQ ID NO:499)   AUCAGACAACGAAUCGGGC(SEQ ID NO:500)   ORF   52.63157895     NM_031419_siRNA_965     965   GCUUCCCUGUACCAGUAUU(5EQ ID NO:501)   AAUACUGGUACAGGGAAGC(SEQ ID NO:502)   ORF   47.36842105     NM_0314l9_siRNA_1175     1175   GCUAAUCCCAUGCAGACUU(SEQ ID NO:503)   AAGUCUGCAUGGGAUUAGC(SEQ ID NO:504)   ORF   47.36842105     NM_031419_siRNA_1494     1494   CCUAUGUUCUUGCAAGAAA(SEQ ID NO:505)   UUUCUUGCAAGAACAUAGG(SEQ ID NO:506)   ORF   36.84210526     NM_031419_siRNA_1520     1520   GCACUUCACAUGCUGGAUA(SEQ ID NO:507)   UAUCCAGCAUGUGAAGUGC(SEQ ID NO:508)   ORF   47.36842105     NM_031419_siRNA_1801     1801   CCACAAUGCUGUGGUCCAU(SEQ ID NO:509)   AUGGACCACAGCAUUGUGG(SEQ ID NO:510)   ORF   52.63157895     NM_031419_siRNA_1816     1816   CCAUGAACUCCAGAGAAAU(SEQ ID NO:511)   AUUUCUCUGGAGUUCAUGG(SEQ ID NO:512)   ORF   42.10526316     NM_031419_siRNA_1840     1840   GCCUCAUUCACCUGAAGUU(SEQ ID NO:513)   AACUUCAGGUGAAUGAGGC(SEQ ID NO:514)   ORF   47.36842105     NM_031419_siRNA_2092     2092   GCAGUAUCGGUUGACACAA(SEQ ID NO:515)   UUGUGUCAACCGAUACUGC(SEQ ID NO:516)   ORF   47.36842105
      基因名称     NFKBIZ     GenBank编号     NM 0015474     GI:     53832023
    生物     人   长度   3782   ORF区域   260-2116     基因座     64332   Blast数据库   人   ORFGC%   49.49     定义     人B细胞K轻链多肽基因增强子核因子抑制因子,ζ(NFKBIZ),转录物变体2,mRNA.     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_001005474_siRNA_334     334   GCACAUCCGAAGUCAUAM(SEQ ID NO:517)   UUUAUGACUUCGGAUGUGC(SEQ ID NO:518)   ORF   42.10526316     NM_001005474_siRNA_460     460   GCCCGAUUCGUUGUCUGAU(SEQ ID NO:519)   AUCAGACAACGAAUCGGGC(SEQ ID NO:520)   ORF   52.63157895     NM_001001005474_siRNA_809     809   GCUUOCCUGUACCAGUAUU(SEQ ID NO:521)   AAUACUGGUACAGGGAAGC(SEQ ID NO:522)   ORF   47.36842105     NM_001005474_siRNA_1019     1019   GCUAAUCCCAUGCAGACUU(SEQ ID NO:523)   AAGUCUGCAUGGGAUUAGC(sEQ ID NO:524)   ORF   47.36842105     NM_001005474_siRNA_1338     1338   CCUAUGUUCUUGCAAGAAA(SEQ ID NO:525)   UUUCUUGCAAGAACAUAGG(SEQ ID NO:526)   ORF   36.84210526     NM_001005474_SiRNA_1364     1364   GCACUUCACAUGCUGGAUA(SEQ ID NO:527)   UAUOCAGCAUGUGAAGUGC(SEQ ID NO:528)   ORF   47.36842105     NM_001005474_siRNA_1645     1645   CCACAAU6CUGUGGUCCAU(SEQ ID NO:529)   AUGGACCACAGCAUUGUGG(SEQ ID NO:530)   ORF   52.63157895     NM_001005474_siRNA_1660     1660   CCAU6AACUCCAGAGAAAU(SEQ ID NO:531)   AUUUCUCUGGAGUUCAUGG(SEQ ID NO:532)   ORF   42.10S26316     NM_001005474_siRNA_1684     1684   GCCUCAUUCACCUGAAGUU(SE0 ID NO:533)   AACUUCAGGUGAAUGAGGC(SEQ ID NO:534)   ORF   47.36842105     NM_001005474_siRNA_1936     1936   GCAGUAUCGGUUGACACAA(SEQ ID NO:535)   UUGUGUCAACCGAUACUGC(SEQ ID NO:536)   ORF   47.36842105
    基因名称 MAP3K7IPl     GenBank编号     NM006116   GI:     47717114     生物 人     长度     3240   ORF区域     50-1564     基因座 10454     Blast数据库     人   ORFGC%     60.73     定义 人促分裂原激活蛋白激酶激酶激酶7相互作用蛋白1(MAP3K7中1),转录物变体d,mRNA     序列 NM_006116
    名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_006116_siRNA_219     219   GGAGUGAGAACAACUGCUU(SEQ ID NO:537)   AAGCAGUUGUUCUCACUCC(SEO ID NO:538)     ORF   47.36842105     NM_006116_siRNA_267     267   GCMCCGAGUGACCAACUU(SEQ ID NO:539)   AAGUUGGUCACUCGGUUGC(SEQ ID NO:540)     ORF   52.63157895     NM_006116_siRNA_685     685   GGAUGAGCUCUUCcGUCUU(SEQ ID NO:541)   AAGACGGAAGAGCUCAUOC(SEQ ID NO:542)     ORF   52.631S7895     NM_006116_siRNA_831     831   CCAAGUCCMACCAAUCAU(SEQ ID NO:543)   AUGAUUGGUUUGGACUUGG(SEQ ID NO:   544)     ORF   42.10526316
    基因名称     MAP3K7IPl     GenBank编号     NM153497     GI:     47717113
    生物     人   长度   1994     ORF区域   50-1438     基因座     10454   Blast数据库   人     ORFGC%   60.12     定义     人促分裂原激活蛋白激酶激酶激酶7相互作用蛋白1,转录物变体B,mRNA.     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_153497_siRNA_219     219   GGAGUGAGAACAACUGCUU(SEQ ID NO:545)   AAGCAGUUGUUCUCACUCC(SEQ ID NO:(SEQ   ID NO:546)     ORF   47.36842105     NM_153497_siRNA_267     267   GCAACCGAGUGACCAACUU(SEQ ID N0:547)   AAGUUGGUCACUCGGUUGC(SEQ ID N0:548)     0RF   52.63157895     NN_153497_siRNA_685     685   GGAUGAGCUCUUCCGUCUU(SEQ ID NO:549)   MGACGGAAGAGCUCAUCC(SEQ ID N0:550)     ORF   52.63157895     NH_153497_siRNA_831     831   CCAAGUCCAAACCAAUCAU(SEQ ID NO:551)   AUGAUUGGUUUGGACUUGG(SEQ ID NO:   5521     ORF   42.10526316
    基因名称     MAPT   GenBank编号   NM 005910   GI:   6754637     生物     人   长度   2796   ORF区域   237-1562     基因座     4137   Blast数据库   人   ORFGC%   58.68     定义     人微管相关蛋白T(MAPT),转录物变体2,n RNA.     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_005910_siRNA_1054     1054   GGAAGGUGCAGAUAAUUAA(SEQ ID NO:553)   UUAAUUAUCUGCACCUUCC(SEQ ID NO:554)   ORF   36.842105226     NM_005910_siRNA_1147     1147   GCAGUGUGCMAUAGUCUA(SEQ ID NO:555)   UAGACUAUUUGCACACUGC(SEQ ID NO:S56)   ORF   42.10526316     NM_005910_siRNA_1192     1192   CCUCCAAGUGUGGCUCAUU(SEQ ID NO:557)   AAUGAGCCACACUUGGAGG(SEQ ID NO:558)   ORF   S2.63157895
    基因名称     MAPT     GenBank编号     NM 016834   GI:   8400710     生物     人     长度     2622   ORF区域   237-1388     基因座     4137     Blast数据库     人   ORFGC%   58.43     定义     人微管相关蛋白T(MAPT),转录物变体3,mRNA.
    名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′     区域   GC%     NM_016834_siRNA_877       877   GCGGGAAGGUGCAGAUAAU(SEQ ID NO:559)   AUUAUCUGCACCUUCCCGC(SEQ ID NO:560)     ORF   52.63157895     NM_016834_siRNA_973     973   GCAGUGUGCAAAUAGUCUA(SEQ ID NO:561)   UAGACUAUUUGCACACUGC(SEQ ID NO:562)     ORF   42.10526316     NM_016834_siRNA_1018     1018   CCUCCAAGUGUGGCUCAUU(SEQ ID NO:563)   AAUGAGCCACACUUGGAGG(SEQ ID NO:564)     ORF   52.63157895
    基因名称     MAPT   GenBank编号   NM 016835    GI:   8400712     生物     人   长度   3747    ORF区域   237-2513     基因座     4137   Blast数据库   人    ORFGC%   60.52     定义     人微管相关蛋白T(MAPT),转录物变体1,mRNA     名称     起点   有义NA序列5′-3′   反义RNA序列5′-3′    区域   GC%       NM_016835_siRNA_250         250   GCCAGGAGUUCGAAGUGAU(SEQ ID NO:565)   AUCACUUCGAACUCCUGGC(SEQ ID NO:566)    ORF   52.63157895     NM_016835_siRNA_797     797   GCUCAAGCACCAGCUUCUA(SEQ ID NO:567)   UAGAAGCUGGUGCUUGAGC(SEQ ID NO:568)    ORF   52.63157895     NM_016835_siRNA_1413     1413   GCCAAGACAUCCACACGUU(SEQ ID NO:569)   AACGUGUGGAUGUCUUGGC(SEQ ID NO:   570)    ORF   52.63157895     NM_016835_siRNA_2098     2098   GCAGUGUGCAAAUAGUCUA(SEQ ID NO:571)   UAGACUAUUUGCACACUGC(SEQ ID NO:572)    ORF   42.10526316
    基因名称     MGAT1   GenBank编号   NM 002406     GI:   6031182     生物     人   长度   2937     ORF区域   497-1834     基因座     4245   Blast数据库   人     ORFGC%   65.1     定义                   人甘露糖(α1,3)糖蛋白β1,2-N 乙酰葡萄糖胺转移酶(MGAT1),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_002406_siRNA_541     541   CCUCUUUGUGGCCUGGAAU(SEQ ID NO:573)   AUUCCAGGCCACAAAGAGG(SEQ ID NO:574)     ORF   52.63157895     NM_002406_siRNA_1026     1026   GCAAGUUCCAGGGCUACUA(SEQ ID NO:575)   UAGUAGCCCUGGAACUUGC(SEQ ID NO:576)     ORF   52.63157895     NM_002406_siRNA_1668     1668   GGGACAGCUUCAAGGCUUU(SEQ ID NO:577)   AAAGCCUUGAAGCUGUCCC(SEQ ID NO:578)     ORF   52.63157895
    基因名称     MICAL2   GenBank编号   NM 014632     GI:    41281417     生物     人   长度   3934     ORF区域    289-3663     基因座     9645   Blast数据库   人     ORF GC%    53.75     定义     人微管相关一氧化物酶,含calponin和LIM结构域2(MICAL2),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域    GC%     NM_014632_siRNA_372     372   CCUCCAGGCCUUCAACAUU(SEQ ID NO:579)   AAUGUUGAAGGCCUGGAGG(SEQ ID NO:   580)     ORF    52.63157895     NM_014632_siRNA_473     473   CCAAAGCOCUGUGGUACAA(SEQ ID NO:581)   UUGUACCACAGGGCUUUGG(SEQ ID NO:582)     ORF    52.63157895     NM-014632_siRNA_585     585   GCGCACUGCCAUUGMCUU(SEQ ID NO:583)   AAGUUCAAUGGCAGUGCGC(SEQ ID NO:584)     ORF    52.63157895     NM_014632_siRNA_746     746   CCAUCGACCAUAUCAGUAU(SEQ ID NO:585)   AUACUGAUAUGGUCGAUGG(SEQ ID NO:586)     ORF    42.10526316     NM_014632_siRNA_753     753   CCAUAUCAGUAUUCGCCAA(SEO ID NO:587)   UUGGCGAAUACUGAUAUGG(SEQ ID NO:588)     ORF    42.10526316     NM_014632_siRNA_912     912   CCAUUCUCUGUCGGAGUUU(SEQ ID NO:589)   AAACUCCGACAGAGAAUGG(SEQ ID N0:590)     ORF    47.36842105     NM_014632_siRNA_1136     1136   GCAUAGAUCUUGAGAACAU(SEQ ID N0:591)   AUGUUCUCAAGAUCUAUGC(SEQ ID NO:592)     ORF    36.84210526     NM-014632_siRNA_1338     1338   GCUGCCAUCCUUAGACUUU(SEQ ID NO:593)   AAAGUCUAAGGAUGGCAGC(SEQ ID NO:594)     ORF    47.36842105     NM_014632_siRNA_2402     2402   GCAGUAAGGAAGGUGGAAA(SEQ ID NO:595)   UUUCCACCUUCCUUACUGC(SEQ ID NO:596)     ORF    47.36842105     NM_014632_siRNA_3111     3111   CCAUUUGAGMCAGUGCAU(SEQ ID NO:597)   AUGCACUGUUCUCAAAUGG(SEQ ID NO:598)     ORF    42.10526316
    墓闵危敢     CLEC2D   GenBank编号   NM 001004419     GI:   52426781     生物     人   长度   1821     ORE区域   23-607     其l夭I睡     29121   Blast数据库   人     ORF GC%   41.71   定义     人C型凝集素结构域家族2.成员D,转录物变体2.mRNA   名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%   NM_001004419_siRNA_506     506   GCCAACUUGUAUGUUGCAA(SEQ ID N0:599)   UUGCAACAUACAAGUUGGC(SEQ ID N0:600)     ORF   42.10526316   NM_001004419_siRNA_507     507   CCAACUUGUAUGUUGCAAA(SEQ ID N0:601)   UUUGCAACAUACAAGUUGG(SEQ ID NO:602)     ORF   36.84210526   NM_001004419_siRNA_551     551   CCAAGACCUGUCAUGGUUU(SEQ ID N0:603)   AAACCAUGACAGGUCUUGG(SEQ ID NO:604)     ORF   47.36842105   NM_001004419_siRNA_582     582   GCAGGAGAGUGUGCCUAUU(SEO ID N0:605)   AAUAGGCACACUCUCOUGC(SEQ ID NO:606)     ORF   52.63157895
     基因名称     CLEC2D     GenBank编号     NM 001004420     GI:     52425783
    生物     人   长度   1814   ORF区域   23-391     基因座     29121   Blast数据库   人   ORF GC%   41.71     定义     人C型凝集素结构域家族2,成员D,转录物变体3,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_001004420_siRNA_59     59   CCAUCUGAAUUGCCUGCAA(SEQ ID NO:607)   UUGCAGGCAAUUCAGAUGG(SEQ ID NO:608)   ORF   47.36842105     NM_001004420_siRNA_182     182   GCUGCUUUAAGCGCAAUAA(SEQ ID NO:609)   UUAUUGCGCUUAAAGCAGC(SEQ ID NO:610)   ORF   42.10526316     NM_001004420_siRNA_220     220   GCCAUCAGUAUGUCUUCAA(SEQ ID NO:611)   UUGAAGACAUACUGAUGGC(SEQ ID NO:612)   ORF   42.10526316
    基因名称     CLEC2D   GenBank编号   NM 013269   GI:   52426785     生物     人   长度   1739   ORF区域   23-598     基因座     29121   Blast数据库   人   ORF GC%   42.19     定义     人C型凝集素结构域家族2,成员D,转录物变体1,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_013269_siRNA_402     402   GCCCAUCUGAUCACUGGAU(SEQ ID NO:613)   AUCCAGUGAUCAGAUGGGC(SEQ ID NO:614)   ORF   52.63157895     NM_013269_siRNA_441     441   GCCAACCAUGGAAAUGGAU(SEQ ID NO:615)   AUCCAUUUCCAUGGUUGGC(SEQ ID NO:616)   ORF   47.36842105     NM_013269_siRNA_500     500   GCAGGAGAGUGUGCCUAUU(SEQ ID NO:617)   AAUAGGCACACUCUCCUGC(SEQ ID NO:618)   ORF   52.63157895     NM_013269_siRNA_561     561   GGAAGUGGAUUUGUUCCAA(SEQ ID NO:619)   UUGGAACAAAUCCACUUCC(SEQ ID NO:620)   ORF   42.10526316
    基因名称     ASAM   GenBank编号   NM 024769   GI:     41393588       生物     人   长度   2645   ORF区域     360-1481     基因座     79827   Blast数据库   人   ORF GC%     51.61     定义     人脂肪细胞特异黏附分子(ASAM),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域     GC%     NM_024769_siRNA_391     391   CCUACUAUGUUGGAACCUU(SEQ ID NO:621)   AAGGUUCCAACAUAGUAGG(SEQ ID NO:622)   ORF     42.10526316     NM_024769_siRNA_682     682   GGUACACCUGUAAGGUUAA(SEQ ID NO:623)   UUAACCUUACAGGUGUACC(SEQ ID NO:624)   ORF     42.10526316     NM_024769_siRNA_780     780   GGAGAGCUGACAGAAGGAA(SEQ ID NO:625)   UUCCUUCUGUCAGCUCUCC(SEQ ID NO:626)   ORF     52.63157895     NM_024769_siRNA_1022     1022   GCGAGUAACUGUACAGUAU(SEQ ID NO:627)   AUACUGUACAGUUACUCGC(SEQ ID NO:628)   ORF     42.10526316     NM_024769_siRNA_1406     1406   CCAUGCUAAUCUGACCAAA(SEQ ID NO:629)   UUUGGUCAGAUUAGCAUGG(SEQ ID NO:630)   ORF     42.10526316
    基因名称     NUMB   GenBank编号   NM 003744     GI:   54144623     生物     人   长度   3614     ORF区域   321-2243     基因座     8650   Blast数据库   人     ORF GC%   52.06     定义     人麻木同系物(果蝇)(NUMB),转录物变体3,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_003744_siRNA_700     700   GCUGGAUCUGUCACUGCUU(SEQ ID NO:631)   AAGCAGUGACAGAUCCAGC(SEQ ID NO:632)     ORF   52.63157895     NM_003744_siRNA_864     864   GGAUCAUUCCGUGUCACAA (SEQ ID NO:633   UUGUGACACGGAAUGAUCC(SEQ ID NO:634)     ORF   47.36842105     NM_003744_siRNA_1139     1139   CCAGAAGAUGUCACCCUUU(SEQ ID NO:635)   AAAGGGUGACAUCUUCUGG(SEQ ID NO:636)     ORF   47.36842105     NM_003744_siRNA_1402     1402   CCUUCCAUGUGCUUGCUAA(SEQ ID NO:637)   UUAGCAAGCACAUGGAAGG(SEQ ID NO:638)     ORF   47.36842105     NM_003744_siRNA_1615     1615   GGUUAGAAGAGGUGUCUAA(SEQ ID NO:639)   UUAGACACCUCUUCUAACC(SEQ ID NO:640)     ORF   42.10526316     NM_003744_siRNA_1999     1999   CCACCAGUCCCUUCUUUAA(SEQ ID NO:641)   UUAAAGAAGGGACUGGUGG(SEQ ID NO:642)     ORF   47.36842105
    基因名称     PDE4B   GenBank编号   NM 002600   GI:   32171240     生物     人   长度   3186   ORF区域     基因座     5142   Blast数据库   人   ORF GC%   46.32     定义     人磷酸二酯酶4B,cAMP特异(磷酸二酯酶E4愚人同系物,果蝇)(PDE4B),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_002600_siRNA_218     218   CCUACAGUUCUUCCAGUAA(SEQ ID NO:643)   UUACUGGAAGAACUGUAGG(SEQ ID NO:644)   ORF   41.39523496     NM_002600_siRNA_527     527   GCAGAGAGUCAUUUCUCUA(SEQ ID NO:645)   UAGAGAAAUGACUCUCUGC(SEQ ID NO:646)   ORF   42.10526316     NM_002600_siRNA_945     945   CCAGGUGUCUGAAUACAUU(SEO ID NO:647)   AAUGUAUUCAGACACCUGG(SEQ ID NO:648)   ORF   42.10526316     NM_002600_siRNA_1499     1499   CCAAUCAGUUUCUCAUCAA(SEQ ID NO:649)   UUGAUGAGAAACUGAUUGG(SEO ID NO:650)   ORF   36.84210526     NM_002600_siRNA_1763     1763   GCGUUCUUCUCCUAGACAA(SEQ ID NO:651)   UUGUCUAGGAGAAGAACGC(SEQ ID NO:652)   ORF   47.36842105     NM_002600_siRNA_2050     2050   GCUCAGGACAUUCUCGAUA(SEQ ID NO:653)   UAUCGAGAAUGUCCUGAGC(SEQ ID NO:654)   ORF   47.36842105
    基因名称     ABCB1     GenBank编号     NM 000927   GI:   42741658     生物     人     长度     4872   ORF区域   419-4261     基因座     5243     Blast数据库     人   ORF GC%   43.69     定义     人ATP结合盒,亚家族B(MDR/TAP),成员1(ABCB1),mRNA
    名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′     区域   GC%     NM_000927_siRNA_761     761   GCCUAUUAUUACAGUGGAA(SEQ ID NO:655)   UUCCACUGUAAUAAUAGGC(SEQ ID NO:656)     ORF   36.84210526     NM_000927_siRNA_1330     1330   GCUGAUCUAUGCAUCUUAU(SEQ ID NO:657)   AUAAGAUGCAUAGAUCAGC(SEQ ID NO:658)     ORF   36.84210526     NM_000927_siRNA_1470     1470   GCAUUGAAGCAUUUGCAAA(SEQ ID NO:659)   UUUGCAAAUGCUUCAAUGC(SEQ ID NO:660)     ORF   36.84210526     NM_000927_siRNA_1732     1732   GCUGAUGCAGAGGCUCUAU(SEQ ID NO:661)   AUAGAGCCUCUGCAUCAGC(SEQ ID NO:662)     ORF   52.63157895     NM_000927_siRNA_2309     2309   GCAGGAAAUGAAGUUGAAU(SEQ ID NO:663)   AUUCAACUUCAUUUCCUGC(SEQ ID NO:664)     ORF   36.84210526     NM_000927_siRNA_2815     2815   GGAUGUGAGUUGGUUUGAU(SEQ ID NO:665)   AUCAAACCAACUCACAUCC(SEQ ID NO:666)     ORF   42.10526316     NM_000927_siRNA_3915     3915   GCACUAAAGUAGGAGACAA(SEQ ID NO:667)   UUGUCUCCUACUUUAGUGC(SEQ ID NO:668)     ORF   42.10526316
    基因名称     HTRA1   GenBank编号   NM 002775   GI:   73747816     生物     人   长度   2133   ORF区域   113-1555     基因座     5654   Blast数据库   人   ORF GC%   59.26     定义     人HtrA丝氨酸肽酶1(HTRA1),mRNA,(PRSS11)     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_002775_siRNA_597          597   CCAACAGUUUGCGCCAUAA(SEQ ID NO:669)   UUAUGGCGCAAACUGUUGG(SEQ ID NO:670)   ORF   47.36842105     NM_002775_siRNA_716     716   GCUAGUGGGUCUGGGUUUA(SEQ ID NO:671)   UAAACCCAGACCCACUAGC(SEQ ID NO:672)   ORF   52.63157895     NM_002775_siRNA_1073     1073   GCCAUCAUCAACUAUGGAA(SEQ ID NO:673)   UUCCAUAGUUGAUGAUGGC(SEQ ID NO:674)   ORF   42.10526316     NM_002775_siRNA_1114     1114   CCUGGACGGUGAAGUGAUU(SEQ ID NO:675)   AAUCACUUCACCGUCCAGG(SEQ ID NO:676)   ORF   52.63157895     NM_002775_siRNA_1535     1535   CCCGAAGAAAUUGACCCAU(SEQ ID NO:677)   AUGGGUCAAUUUCUUCGGG(SEQ ID NO:678)   ORF   47.36842105
    基因名称  NPEPPS     GenRank编号     NM 006310   GI:     15451906     生物  人     长度     4177   ORF区域     196-2823     基因座  9520     BIast数据库     人   ORF GC%     44.79     定义  人氨肽酶嘌呤霉素敏感(NPEPPS).mRNA     序列  NM_006310
    名称     起点   有义RNA序5′-3′     反义RNA序列5′-3′     区域   GC%     NM_006310_siRNA_1939     1939   GCUCGAGCUGGAAUCAUUA(SEQ ID NO:679)   UAAUGAUUCCAGCUCGAGC(SEQ ID NO:680)     ORF   47.36842105     NM_006310_siRNA_2539     2539   GCUGCUUGGAAAUUCAUAA(SEQ ID NO:681)   UUAUGAAUUUCCAAGCAGC(SEO ID NO:682)     ORF   36.84210526     NM_006310_siRNA_2622     2622   GCUAUCAGUUGAGGGAUUU(SEQ ID NO:683)   AAAUCCCUCAACUGAUAGC(SEQ ID NO:684)     ORF   42.10526316
    基因名称     PSMA7   GenBanK编号   NM 002792   GI:   23110945     生物     人   长度   984   ORF区域   116-862     基因座     5688   Blast数据库   人   ORF GC%   50.47     定义     人蛋白酶体(蛋白酶体,巨蛋白因子)亚基,α型,7(DSA77),转录物变体1,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_002792_siRNA_266     266   GCCAAACUGCAGGAUGAAA(SEQ ID NO:685)   UUUCAUCCUGCAGUUUGGC(SEQ ID NO:686)   ORF   47.36842105     NM_D02792_siRNA_300     300   UCUGUGCUUUGGAUGACAA(SEQ ID NO:687)   UUGUCAUCCAAAGCACAGA(SEO ID NO:688)   ORF   42.10526316     NM_002792_siRNA_348     348   CCGAUGCAAGGAUAGUCAU(SEQ ID NO:689)   AUGACUAUCCUUGCAUCGG(SEQ ID NO:690)   ORF   47.36842105
    基因名称     PIS     GenBanK编号     NM 000317   GI:     4506330     生物     人     长度     921   ORF区域     69-506     基因座     5805     Blast数据库     人   ORF GC%     43.16     定义     人6-丙酮酰四氢蝶呤合成酶(PTS),mRNA
    名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′     区域   GC%     NM_000317_siRNA_137     137   CCACCGAUUGUACAGUAAA(SEQ ID NO:691)   UUUACUGUACAAUCGGUGG(SEQ ID NO:692)     ORF   42.10526316     NM_000317 siRNA_275     275   GGUUAUGAAUCUGGCUGAU(SEQ ID NO:693)   AUCAGCCAGAUUCAUAACC(SEQ ID NO:694)     ORF   42.10526316     NM_000317_siRNA_413     413   GGACAACCUCCAGAAAGUU(SEQ ID NO:695)   AACUUUCUGGAGGUUGUCC(SEQ ID NO:696)     ORF   47.36842105
    基因名称     RIN2   GenBank编号   NM 018993   GI:   35493905     生物     人   长度   4259   ORF区域   37-2724     基因座     54453   Blast数据库   人   ORF GC%   55.92     定义     人Ras和Rab结合因子2(RIN2),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_018993_siRNA_471     471   GGAAUUUGCCAUAAAGGAA(SEQ ID NO:697)   UUCCUUUAUGGCAAAUUCC(SEQ ID NO:698)   ORF   36.84210526     NM_018993_SiRNA_569     569   GCAGGGAUGUUCUACCAUU(SEQ ID NO:699)   AAUGGUAGAACAUCCCUGC(SEQ ID NO:700)   ORF   47.36842105     NM_018993_siRNA_1034     1034   GCAUGCCAGAAACAGUCAA(SEQ ID NO:701)   UUGACUGUUUCUGGCAUGC(SEO ID NO:702)   ORF   47.36842105     NM_018993_siRNA_1376     1376   GCAUGCCUCUGUUUGGCUA(SEQ ID NO:703)   UAGCCAAACAGAGGCAUGC(SEQ ID NO:704)   ORF   52.63157895     NM_018993_siRNA_2236     2236   GGAGGCUAUUACUUGACAA(SEQ ID NO:705)   UUGUCAAGUAAUAGCCUCC(SEQ ID NO:706)   ORF   42.10526316
    基因名称     ROR1   GenBank编号   NM 005012     GI:   4826867     生物     人   长度   3358     ORF区域   376-3189     基因座     4919   Blast数据库   人     ORF GC%   47.45     定义     人受体酪氨酸激酶样孤儿受体1(ROR1),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_005012_siRNA_932     932   CCGUCUAUAUGGAGUCUUU(SEQ ID NO:707)   AAAGACUCCAUAUAGACGG(SEQ ID NO:708)     ORF   42.10526316     NM_005012_siRNA_1543     1543   GCUUGCGAUUCAAAGGAUU(SEQ ID NO:709)   AAUCCUUUGAAUCGCAAGC(SEQ ID NO:710)     ORF   42.10526316     NM_005012_siRNA_1920     1920   GCAAUGGAUGGAAUUUCAA(SEQ ID NO:711)   UUGAAAUUCCAUCCAUUGC(SEQ ID NO:712)     ORF   36.84210526     NM_005012_siRNA_2817     2817   GCGAUUCAUUCCCAUCAAU(SEQ ID NO:713)   AUUGAUGGGAAUGAAUCGC(SEQ ID NO:714)     ORF   42.10526316     NM_005012_siRNA_3031     3031   CCACACAUGUCAAUUCCAA(SEQ ID NO:715)   UUGGAAUUGACAUGUGUGG(SEQ ID NO:   716)     ORF   42.10526316
    生物     人   长度   1657     ORF区域   287-1228     基因座     10670   Blast数据库   人     ORF GC%   51.39     定义     人Ras相关GTP结合A(RRAGA),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_006570_siRNA_351     351   GCAUGAGGUCGAUAAUCUU(SEQ ID NO:717)   AAGAUUAUCGACCUCAUGC(SEQ ID NO:718)     ORF   42.10526316     NM_006570_siRNA_510     510   CCAGCCAGGGAGACAAUAU(SEQ ID NO:719)   AUAUUGUCUCGCUGGCUGG(SEQ ID NO:   720)     ORF   52.63157895     NM_006570_siRNA_673     673   GGAUCUGGUUCAGGAGGAU(SEQ ID NO:721)   AUCCUCCUGAACCAGAUCC(SEQ ID NO:722)     ORF   52.63157895   NM_006570_siRNA_1056     1056   CCAACUUCGCUGCUUUCAU(SEQ ID NO:723)   AUGAAAGCAGCGAAGUUGG(SEQ ID NO:724)     ORF   47.36842105
    基因名称     RYK   GenBank编号   NM 002958     GI:   54607017     生物     人   长度   2951     ORF区域   97-1914     基因座     6259   Blast数据库   人     ORF GC%   42.38     定义     人RYK受体样酪氨酸激酶(RYK),转录物变体2,mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_002958_siRNA_558     558   GCUUUCCUGUACUGGCAAA(SEQ ID NO:725)   UUUGCCAGUACAGGAAAGC(SEQ ID NO:726)     ORF   47.36842105     NM_002958_siRNA_748     748   GCAGCUCCAACCACUUCUA(SEQ ID NO:727)   UAGAAGUGGUUGGAGCUGC(SEQ ID NO:728)     ORF   52.63157895     NM_002958_siRNA_1367     1367   GCAAGUUAGUAGAGGCCAA(SEQ ID NO:729)   UUGGCCUCUACUAACUUGC(SEQ ID NO:730)     ORF   47.36842105     NM_002958_siRNA_1413     1413   CCUGGUACACAUGGCUAUU(SEQ ID NO:731)   AAUAGCCAUGUGUACCAGG(SEQ ID NO:732)     ORF   47.36842105     NM_002958_siRNA_1779     1779   GCCAAUCAACUGUCCUGAU(SEQ ID NO:733)   AUCAGGACAGUUGAUUGGC(SEQ ID NO:734)     ORF   47.36842105
    基因名称     S100A6   GenBank编号   NM 014624     GI:   52352807     生物     人   长度   683     ORF区域   315-587     基因座     6277   Blast数据库   人     ORF GC%   56.05     定义     人S100钙结合蛋白A6(钙周期蛋白)(S100A6),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_014624_siRNA_455     455   GCUGCAGGAUGCUGAAAUU(SEQ ID NO:735)   AAUUUCAGCAUCCUGCAGC(SEO ID NO:736)     ORF   47.36842105     NM_014624_siRNA_474     474   GCAAGGCUGAUGGAAGACU(SEQ ID NO:737)   AGUCUUCCAUCAGCCUUGC(SEQ ID NO:738)     ORF   52.63157895     NM_014624_siRNA_479     479   GCUGAUGGAAGACUUGGAC(SEQ ID NO:739)   GUCCAAGUCUUCCAUCAGC(SEQ ID NO:740)     ORF   52.63157895
    基因名称     S100A1   GenBank编号   NM 06271   GI:   5454031     生物     人   长度   607   ORF区域   114-398     基因座     6271   Blast数据库   人   ORF GC%   55.44     定义     人S100钙结合蛋白A1(S100A1),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_006271_siRNA_136     136   CGAUGGAGACCCUCAUCAA(SEQ ID NO:741)   UUGAUGAGGGUCUCCAUCG(SEQ ID NO:742)   ORF   52.63157895     NM_06271_siRNA_137     137   GAUGGAGACCCUCAUCAAC(SEQ ID NO:743)   GUUGAUGAGGGUCUCCAUC(SEQ ID NO:744)   ORF   52.63157895
    基因名称     SCMH1   GenBank编号   NM 012236   GI:   6912641     生物     人   长度   3250   ORF区域   485-2260     基因座     22955   Blast数据库   人   ORF GC%   54.79     定义     人scmh1中足性梳同源物1(果蝇)(SCMH1),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_012236_siRNA_876     876   GGAAGAACCCUCAUUUCAU(SEQ ID NO:745)   AUGAAAUGAGGGUUCUUCC(SEQ ID NO:746)   ORF   42.10526316     NM_012236_siRNA_1632     1632   GGGAACAGCAUACCCUCAA(SEQ ID NO:747)   UUGAGGGUAUGCUGUUCCC(SEQ ID NO:748)   ORF   52.63157895     NM_012236_siRNA_1743     1743   CCUUUACACAGACUCACUU(SEQ ID NO:749)   AAGUGAGUCUGUGUAAAGG(SEQ ID NO:750)   ORF   42.10526316     NM_012236_siRNA_1804     1804   CCUACCAGGUGAAACCUUU(SEQ ID NO:751)   AAAGGUUUCACCUGGUAGG(SEQ ID NO:752)   ORF   47.36842105
    基因名称     SERP1   GenBank编号   NM 014445   GI:   19923408     生物     人   长度   2488   ORF区域   316-516     基因座     27230   Blast数据库   人   ORF GC%   50.25     定义     人应激相关内质网蛋白1(SERP1),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_014445_siRNA_323         323   CCAGCAAAGGAUCCGUAU(SEQ ID NO:753)   AUACGGAUCCUUUGCUUGG(SEQ ID NO:754)   ORF   47.36842105     NM_014445_siRNA_434     434   CCUGGUUAUUGGCUCUCUU(SEQ ID NO:755)   AAGAGAGCCAAUAACCAGG(SEQ ID NO:756)   ORF   47.36842105     NM_014445_siRNA_437     437   GGUUAUUGGCUCUCUUCAU(SEQ ID NO:757)   AUGAAGAGAGCCAAUAACC(SEQ ID NO:758)   ORF   42.10526316
    基因名称     SRP19     GenBank编号   NM 003135   GI:   4507212     生物     人     长度   894   ORF区域   82-516     基因座     6728     Blast数据库   人   ORF GC%   41.38     定义     人信号识别颗粒19kDa(SRP19),mRNA     名称     起点     有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_003135_siRNA_110     110     CCGACCAGGACAGGUUUAU(SEQ ID NO:759)   AUAAACCUGUCCUGGUCGG(SEQ ID NO:760)   ORF   52.63157895     NM_003135_siRNA_244     244     GCAGUUGGACUUAACGUAU(SEQ ID NO:761)   AUACGUUAAGUCCAACUGC(SEQ ID NO:762)   ORF   42.10526316     NM_003135_siRNA_454     454     GCUGACCAAAGUCUUCAAC(SEO ID NO:763)   GUUGAAGACUUUGGUCAGC(SEQ ID NO:764)   ORF   47.36842105
    基因名称     TPM1   GenBank编号   NM 000366   GI:   63252894     生物     人   长度   1294   ORF区域   192-1046     基因座     7168   Blast数据库   人   ORF GC%   50.77     定义     人原肌球蛋白1(TPM1),mRNA     名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′   区域   GC%     NM_000366_siRNA_688     688   CCCGUAAGCUGGUCAUCAU(SEQ ID NO:765)   AUGAUGACCAGCUUACGGG(SEQ ID NO:766)   ORF   52.63157895     NM_000366_siRNA_915     915   GCGGAGAGGUCAGUAACUA(SEQ ID NO:767)   UAGUUACUGACCUCUCCGC(SEQ ID NO:768)   ORF   52.63157895     NM_000366_siRNA_1020     1020   GCUCUCAACGAUAUGACUU(SEQ ID NO:769)   AAGUCAUAUCGUUGAGAGC(SEQ ID NO:770)   ORF   42.10526316
    基因名称     TRIM52   GenBank编号   NM 032765     GI:   34147443     生物     人   长度   2244     ORF区域   306-1199     基因座     84851   Blast数据库   人     ORF GC%   48.77     定义     人含三联基元52(TRIM52),mRNA     名称     起点   有义RNA5′-3′   反义RNA序列5′-3′     区域   GC%     NM_032765_siRNA_1115     1115   CCAGGAAAUAAAGUUGGAA(SEQ ID NO:771)   UUCCAACUUUAUUUCCUGG(SEQ ID NO:772)     ORF   36.84210526     NM_032765_siRNA_1142     1142   GGUGGGAAUACUUCAGAUA(SEQ ID NO:773)   UAUCUGAAGUAUUCCCACC(SEQ ID NO:774)     ORF   42.10526316     NM_032765_siRNA_1145     1145   GGGAAUACUUCAGAUAGAG(SEQ ID NO:775)   CUCUAUCUGAAGUAUUCCC(SEQ ID NO:776)     ORF   42.10526316     NM_032765_siRNA_1171     1171   GCAUUCACAGCAAGGCCUA(SEQ ID NO:777)   UAGGCCUUGCUGUGAAUGC(SEQ ID NO:778)     ORF   52.63157895
    基因名称   MTHFD1     GenBank编号     NM 005956   GI:     13699867     生物   人     长度     3110   ORF区域     54-2861     基因座   4522     Blast数据库     人   ORF GC%     49.11     定义   NM_005956
    名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′     区域   GC%     NM_005956_slRNA_184     184   GCAACAGAGAUGAUUCCAA(SEQ ID NO:779)   UUGGAAUCAUCUCUGUUGC(SEQ ID NO:780)     ORF   42.10526316     NM_005956_siRNA_696     696   GCAACUGGUCAGCCUGAAA(SEQ ID NO:781)   UUUCAGGCUGACCAGUUGC(SEQ ID NO:782)     ORF   52.63157895     NM_005956_siRNA_1429     1429   CCAUUGAUGCUCGGAUAUU(SEQ ID NO:783)   AAUAUCCGAGCAUCAAUGG(SEQ ID NO:784)     ORF   42.10526316     NM_005956_siRNA_1780     1780   CCACUUCUCUAGAAGACAU(SEQ ID NO:785)   AUGUCUUCUAGAGAAGUGG(SEQ ID NO:786)     ORF   42.10526316     NM_005956_siRNA_2482     2482   GCAGCUUCCAGCUCCUUUA(SEQ ID NO:787)   UAAAGGAGCUGGAAGCUGC(SEQ ID NO:788)     ORF   52.63157895
    基因名称     UBE1C     GenBank编号     NM 003968   GI: 38045941     生物     人     长度     2136   ORF区域 21-1412     基因座     9039     Blast数据库     人   ORF GC% 42.25     定义
NM_003968
    名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′     区域   GC%     NM_003968_siRNA_133     133   GGAACCAUGUAAAGAAGUU(SEQ ID NO:789)   AACUUCUUUACAUGGUUCC(SEQ ID NO:790)     ORF   36.84210526     NM_003968_siRNA_393     393   GCUGAAGUUGCUGCAGAAU(SEQ ID NO:791)   AUUCUGCAGCAACUUCAGC(SEQ ID NO:792)     ORF   47.36842105     NM_003968_siRNA_594     594   CCAAGCUCCAUUGUCCCUU(SEQ ID NO:793)   AAGGGACAAUGGAGCUUGG(SEQ ID NO:794)     ORF   52.63157895     NM_003968_siRNA_1023     1023   GCAUACAUUOCCUUGAAUA(SEO ID NO:795)   UAUUCAAGGGAAUGUAUGC(SEQ ID NO:796)     ORF   36.84210526     NM_003968_siRNA_1197     1197   GCUUCUCUGCAAAUGAAAU(SEQ ID NO:797)   AUUUCAUUUGCAGAGAAGC(SEQ ID NO:798)     ORF   36.84210526
    基因名称     UBE1C     GenBank编号     NM 198195   GI:   38045943     生物     人     长度     2094   ORF区域   21-1370     基因座     9039     Blast数据库     人   ORF GC%   42.08     定义     NM_198195     序列
    名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NM_198195_siRNA_35     35   GGAGCCAAUGGCUGUUGAU(SEQ ID NO:799)   AUCAACAGCCAUUGGCUCC(SEQ ID NO:800)     ORF   52.63157895     NM_198195_siRNA_91     91   GGAACCAUGUAAAGAAGUU(SEQ ID NO:801)   AACUUCUUUACAUGGUUCC(SEQ ID NO:802)     ORF   36.84210526     NM_198195_siRNA_351     351   GCUGAAGUUGCUGCAGAAU(SEQ ID NO:803   AUUCUGCAGCAACUUCAGC(SEQ ID NO:804)     ORF   47.36842105     NM_198195_siRNA_552     552   CCAAGCUCCAUUGUCCCUU(SEO ID NO:805)   AAGGGACAAUGGAGCUUGG(SEQ ID NO:806)     ORF   52.63157895     NM_198195_siRNA_981     981   GCAUACAUUCCCUUGAAUA(SEQ ID NO:807)   UAUUCAAGGGAAUGUAUGC(SEQ ID NO:808)     ORF   36.84210526     NM_198195_siRNA_1155     1155   GCUUCUCUGCAAAUGAAAU   AUUUCAUUUGCAGAGAAGC     ORF   36.84210526
    基因名称     UBE1C     GenBank编号     NM 198197   GI:   38045945     生物     人     长度     2015   ORF区域   200-1291     基因座     9039     Blast数据库     人   ORF GC%   40.39     定义     NM_198197     序列
    名称     起点   有义RNA序列5′-3′   反义RNA序列5′-3′     区域   GC%     NN_198197_siRNA_272     272   GCUGAAGUUGCUGCAGAAU(SEO ID NO:809)   AUUCUGCAGCAACUUCAGC(SEQ ID NO:810)     ORF   47.36842105     NM_198197_siRNA_473     473   CCAAGCUCCAUUGUCCCUU(SEQ ID NO:811)   AAGGGACAAUGGAGCUUGG(SEQ ID NO:812)     oRF   52.63157895     NM_198197_siRNA_902     902   GCAUACAUUCCCUUGAAUA(SEQ ID NO:813)   UAUUCAAGGGAAUGUAUGC(SEQ ID NO:814)     ORF   36.84210526     NM_198197_siRNA_1076     1076   GCUUCUCUGCAAAUGAAAU(SEQ ID NO:815)   AUUUCAUUUGCAGAGAAGC(SEQ ID NO:816)     ORF   36.84210526
    基因名称   ZNF207     GenBank编号     NM 003457   GI:   75750493     生物   人     长度     2348   ORF区域   204-1640     基因座   7756     Blast数据库     人   ORFGC%   48.3     定义   NM_003457     序列
    名称     起点   有义RNA序列5′-3′     反义RNA序列5′-3′     区域   GC%     NM_003457_siRNA_888     888   GCGCCAGGUAUUCUUAAUA(SEO ID NO:819)   UAUUAAGAAUACCUGGGGC(SEQ ID NO:820)     ORF   42.10526316     NM_003457_siRNA_1014     1014   GCUUCAUCCAAUUCAGAAA(SEQ ID NO:821)   UUUCUGAAUUGGAUGAAGC(SEQ ID NO:822)     ORF   36.84210526     NM_003457_siRNA_1230     1230   CCAGCGGCUUCAAUAACAA(SEQ ID NO:823)   UUGUUAUUGAAGCCGCUGG(SEO ID NO:824)     ORF   47.36842105     NM_003457_siRNA_1257     1257   GCUACACUUACAACAACUA(SEQ ID NO:825)   UAGUUGUUGUAAGUGUAGC(sEQ ID NO:   826)     ORF   36.84210526
    基因名称  ZNF7     GenBank编号     NM 003416   GI:     4508034     生物  人     长度     2351   ORF区域     239-2299     基因座  7553     Blast数据库     人   ORFGC%     48.62     定义  NM_003416     序列     名称  起点     有义RNA序列5′-3′   反义RNA序列5′-3′     区域     GC%     NM_003416_stealth_1839  1839     UCAGUAUGAGCACACAGCUUACAAU(SEQ ID     NO:827)   AUUGUAAGCUGUGUGCUCAUACUGA(SEQ ID NO:   828)     ORF     40     NM_003416_stealth_1843  1843     UAUGAGCACACAGCUUACAAUACAU(SEQ ID     NO:829)   AUGUAUUGUAAGCUGUGUGCUCAUA(SEQ ID NO:   830)     ORF     36     NM_003416_stealth_1848  1848     GCACACAGCUUACAAUACAUCAAAG(SEQ ID   CUUUGAUGUAUUGUAAGCUGUGUGC(SEO ID NO:     ORF     40
  No:831)   832)     NM_003416_steaith_2089     2089   AGGGUCCACCUUUGUGAGCCGUAAA(SEQ ID   NO:833)   UUUACGGCUCACAAAGGUGGACCCU(SEQ ID NO:   834)     ORF     52     NM_003416_steaith_2163     2163   UAUUUAGGUGGCGUUCACACCUAAU(SEQ ID   NO:835)   AUUAGGUGUGAACGCCACCUAAAUA(SEQ ID NO:   836     ORF     40
本申请要求以2004年10月27日提交的流水号为60/622,486美国 临时申请作为优先权基础,其全部内容通过援引纳入本文。
致谢
本发明是在政府支持下利用了公共健康服务基金R01CA68283完成 的。政府对本发明享有一定的权利。
参考文献
1.Op De Beeck A,CailletFauquet P:Viruses and the cell cycle.Prog Cell Cycle Res 1997,3:1-19.
2.Dermody TS,Nibert ML,Wetzel JD,Tong X,Fields BN:Cells and viruses with mutations affecting viral entry are selected during persistent infections of L cells with mammalian reoviruses.J Virol 1993,67(4):2055-2063.
3.Taterka J,Sutcliffe M,Rubin DH:Selective reovirus infection of murine hepatocarcinoma cells during cell division.A model of viral liver infection.J Clin Invest 1994,94(1):353-360.
4.Sheng J,Organ EL,Hao C,Wells KS,Ruley HE,Rubin DH:Mutations in the IGF-II pathway that confer resistance to lytic reovirus infection.BMC Cell Biol 2004,5(1):32.
5.Hansen J,Floss T,Van Sloun P,Fuchtbauer EM,Vauti F,Arnold HH, Schnutgen F,Wurst W,yon Melchner H,Ruiz P:A large-scale,gene-driven nutagenesis approach for the functional analysis of the rnouse genome.Proc Natl A cad Sci USA 2003,100(17):9918-9922.
6.Hicks GG,Shi EG,Li XM,Li CH,Pawlak M,Ruley HE:Functional genomics in mice by tagged sequence mutagenesis.Nat Genet 1997,16(4):338-344.
7.Salminen M,Meyer BI,Gruss P:Efficient poly A trap approach allows the capture of genes specifically active in differentiated embryonic stem cells and in mouse embryos.Dev Dyn 1998,212(2):326-333.
8.Stryke D,Kawamoto M,Huang CC,Johns SJ,King LA,Harper CA,Meng EC, Lee RE,Yee A,L′Italien L et al: BayGenomic s:a resource of insertional mutations in mouse embryoric stem cells.Nucleic Acids Res 2003,31(1):278- 281.
9.Wiles MV,Vauti F,Otte J,Fuchtbauer EM,Ruiz P,Fuchtbauer A,Arnold HH, Lebrach H,Metz T,yon Melchner H et al:Establishment of a gene-trap sequence tag library to generate mutant mice from embryonic stem cells.Nat Genet 2000,24(1):13-14.
10.Zambrowicz BP,Friedrich GA,Buxton EC,Lilleberg SI,Person C,Sands AT: Disruption and sequence identification of 2,000genes in mouse embryonic stem cells.Nature 1998,392(6676):608-611.
11.Osipovich AB,Whte-Grindley EK,Hicks GG,Roshon MJ,Shaffer C,Moore JH,H.E. R:Activation ofcryptic 3’splice sites within introns of cellular genes following gene entrapment.Nucleic Acids Res 2004,in press.
12.De Ceuninck F,Poiraudeau S,Pagano M,Tsagris L,Blanchard O,Willeput J, Corvol M:Inhibition of chondrocyte cathepsin B and L activities by insulin-like growth factor-II(IGF-II)and its Ser29 variant in vitro:possible role of the mannose 6-phosphate/IGF-II receptor.Mol Cell Endocrinol 1995,113(2):205- 213.
13.Martinez CG,Guinea R,Benavente J,Carrasco L:The entry of reovirus into L cells is dependent on vacuolar proton-ATPase acttvity.J Virol 1996,70(1):576- 579.
14.Guinea R,Carrasco L:Requirement for vacuolar proton-ATPase activity during entry of influenza virus into ceils.J Virol 1995,69(4):2306-2312.
15.Brunetti CR,Burke RL,Komfeld S,Gregory W,Masiarz FR,Dingwell KS, Johnson DC:Herpes simplex virus glycoprotein D acquires mannose 6- phosphate residues and binds to marnnose 6-phosphate receptors.J Biol Chem 1994,269(25):17067-17074.
16.Zeng FY,Gerke V,Gabius HJ:Identification of annexin II,annexin VI and glyceraldehyde-3-phosphate dehydrogenase as calcyclin-bindingproteins in bovine heart.Int J Biochem 1993,25(7):1019-1027.
17.Lee KH,Na DS,Kim JW:Calcium-dependent interaction of annexin I with annexin II and mapping of the interaction sites.FEBS Lett 1999,442(2-3):143- 146.
18.Filipek A,Wojda U,Lesniak W:Interaction of calcyclin and its cyanogen bromide fragments with annexin II and glyceraldehyde 3-phosphate dehydrogenase.Int J Biochem Cell Biol 1995,27(11):1123-1131.
19.Pietropaolo RI,Compton T:Direct interaction between human cytomegalovirus glycoprotein B and cellular annexin II.J Virol 1997, 71(12):9803-9807.
20.Golitsina NL,Kordowska J,Wang CL,Lehrer SS:Ca2+-dependent bindinug of calcyclin to muscle tropomyosin.Biochem Biophys Res Commun 1996, 220(2):360-365.
21.Hida K,Wada J,Zhang H,Hiragushi K,Tsuchiyarna Y,Shikata K,Makino H: Identification of genes specifically expressed in tie accumulated visceral adipose tissue of OLETF rais.J Lipid Res 2000,41(10):1615-1622.
22.Katoh M:IGSFll gene,frequently up-regulated in intestinal-type gastric cancer,encodes adhesion molecule homologous to CXADR,FLJ22415 and ESAM.Int J Oncol2003,23(2):525-531.
23.Barton ES,Forrest JC,Connolly JL,Chappell JD,Liu Y,Schnell FJ,Nusrat A, Parkos CA,Dermody TS:Junction adhesion molecule is a receptor for reovirus. Cell 2001,104(3):441-451.
24.Weiner HL,Powers ML,Fields BN:Absolute linkage of virlence and central nervous system cell tropism of reoviruses to viral hemagglutinin.J Infect Dis 1980,141(5):609-616.
25.Rubin DH,Wetzel JD,Williams WV,Cohen JA,Dworkin C,Dermody TS: Binding of type 3 reovirus by a domain of the sigrna 1 protein important for hemagglutination leads to infection of murine erythroleukemia cells.J Clin Invest 1992,90(6):2536-2542.
26.Sizova DV,Kolupaeva VG,Pestova TV,Shatsky IN,Hellen CU:Specific interaction of eukaryotic translation initiation factor 3 with the 5′nontranslated regions of hepatitis C virus and classical swine fever virus RNAs.J Virol 1998, 72(6):4775-4782.
27.McGregor F,Phelan A,Dunlop J,Clements JB:Regulation of herpes simplex virus poly(A)sete usage and the action of immedtiate-early protein IE63 in the early-late switch.J Viol 1996,70(3):1931-1940.
28.Pitha PM,Au WC,Lowther W,Juang YT,Schafer SL,Burysek L,Hiscott J, Moore PA:Role of the interferon regulatory factors(IRFs)in virus-mediated signaling and regulation of cell growth.Biochimie 1998,80(8-9):651-658.
29.Hawiger J:Innate immunity and inflammation:a transcriptional paradigm. Immunol Res 2001,23(2-3):99-109.
30.Lau JF,Horvath CM:Mechanisms of Type I interferon cell signaling and STAT-mediated transcriptional responses.Mt Sin ai J Med 2002,69(3):156-168.
31.Werner-Felmayer G,Wemer ER,Fuchs D,Hausen A,Reibnegger G,Schmidt K,Weiss G,Wachter H:Pteridine biosynthesis in hman endothelial cells. Impact on nitric oxide-mediated formation of cyclic GMP.J Biol Chem 1993, 268(3):1842-1846.
32.Reiss CS,Komatsu T:Does nitric oxide play a critical role in viral infecfions?J Virol 1998,72(6):4547-4551.
33.Pertile TL,Karaca K,Sharma JM,Walser MM:An antiviral effect of nitric oxide:inhibition of reovirus replication.Avian Dis 1996,40(2):342-348.
34.Takekawa M,Maeda T,Saito H:Protein phosphatase 2Calpha inhibits the human stress-responsive p38 and JNK MAPK pathways.Embo J 1998, 17(16):4744-4752.
35.Rousse S,Lallemand F,Montarras D,Piinset C,Mazars A,Prunier C,Atfi A, Dubois C:Transforming growth factor-beta inhibition of insulin-like growth factor-binding protein-5 synthesis in skeletal muscle cells involves a c-Jun N- tenninal kinle-dependent pathway.J Biol Chem 2001,276(50):46961-46967.
36.Uchida K,Suzuki H,Ohashi T,Nitta K,Yumnura W,Nihei H:Involvement of MAP kinase cascades in Smad7 transcriptional regulation.Biochem Biophys Res Commun 2001,289(2):376-381.
37.Arsura M,Panta GR,Bilyeu JD,Cavin LG,Sovak MA,Oliver AA,Factor V, Heuchel R,Mercurio F,Thorgeirsson SS et al:Transient activation of NF- kappaB through a TAK1/IKK kinase pathway by TGF-betal inhibits AP- 1/SMAD signaling and apoptosis:implications in liver tumor formation. Oncogene 2003,22(3):412425.
38.Amir RE,Iwai K,Ciechanover A:The NEDD8 pathway is essential for SCF(beta-TrCP)-mediated ubiquitination and processing of the NF-kappa B precursor p105.J Biol Chem 2002,277(26):23253-23259.
39.Tanaka K,Kawakami T,Tateishi K,Yashiroda H,Chiba T:Control of IkappaBalpha proteolysis by the ubiquitin-proteasome pathway.Biochimie 2001,83(3-4):351-356.
40.Sakurai H,Shigemori N,Hasegawa K,Sugita T:TGF-beta-activated kinase 1 stimulates NF-kappa B activation by an NF-kappa B-inducing kinase- independent mechanism.Bioehem Biophys Res Commum 1998,243(2):545-549.
41.Shibuya H,Yamaguehi K,Shirakabe K,Tonegawa A,Gotoh Y,Ueno N,Irie K, Nishida E,Matsumoto K:TAB1:an activator of the TAK1 MAPKKK in TGF- beta signal transduction.Science 1996,272(5265):1179-1182.
42.Bhat NR,Shen Q,Fan F:TAK1-mediated induction of nitric oxide synthase gene expression in glial cells.J Neurochem 2003,87(1):238-247.
43.Yanagisawa M,Nakashima K,Takeda K,Ochiai W,Takizawa T,Uero M, Takizawa M,Shibuya H,Taga T:Inhibition of BMP2-induced,TAK1 kinase- mediated neurite outgrowth by Smad6 and Smad7.Genes Cells 2001, 6(12):1091-1099.
44.Asano K,Vomlocher HP,Richter-Cook NJ,Merrick WC,Hinnebusch AG, Hershey JW:Structure of cDNAs encoding human eukaryotic initiation factor 3 subunits.Possible roles in RNA binding and macromolecular assembly.J Biol Chem 1997,272(43):27042-27052.
45.Higaki S,Gebhardt BM,Lukiw WJ,Thompson HW,Hill JM:Effect of immunosuppression on gene expression in the HSV-1 latently infected mouse uigeminal ganglion.Invest Ophthalmol Vis Sci 2002,43(6):1862-1869.
46.Spear BT,Longley T,Moulder S,Wang SL,Peterson ML:A sensitive lacZ- based expression vector for analyzing transcriptional control elements in eukaryotic cells.DNA Cell Biol 1995,14(7):635-642.
47.Pier GB,Grout M,Zaidi T,Meluleni G,Mueschenbom SS,Banting G,Ratcliff R,Evans MJ,Colledge WH:Salmonella typhi uses CFTR to enter intestinal epithelial cells.Nature 1998,393(6680):79-82.
48.Perkins ME,Wu TW,Le Blancq SM:Cyclosporin analogs inhibit in vitro growth of Cryptosporidium parvmn.Antimicrob Agents Chemother 1998, 42(4):843-848.
49.Clarke P,Tyler KL:Reovirus-induced apoptosis:A minireview.Apoptosis 2003,8(2):141-150.
50.Richardson-Bums SM,Tyler KL:Regional differences in viral growth and central nervous system injury correlate with aloptosis.J Virol2004, 78(10):5466-5475.
51.Clarke P,Meintzer SM,Widmann C,Johnson GL,Tyler KL:Reovirus infection activates JNK and the JNK-dependent transcription factor c-Jun.J Virol2001, 75(23):11275-11283.
52.Clarke P,Meintzer SM,Moffitt LA,Tyler KL:Two distinct phases of virus- induced nuclear factor kappa B regulation enhance tumor necrosis factor-related apoptosis-inducing ligand-mediated apoptosis in virus-infected cells.J Biol Chem 2003,278(20):18092-18100.
53.Bender FC,Whitbeck JC,Ponce de Leon M,Lou H,Eisenberg RJ,Cohen GH: Specific association of glycoprotein B with lipid rafts during herpes simplex virus entry.J Virol2003,77(17):9542-9552.
54.Zhou G,Avitabile E,Campadelli-Fiume G,Roizman B:The domains of glycoprotein D required to block apoptosis induced by herpes simplex virus 1 are largely distinct from those involved in cell cell fusion and binding to nectinl.J Virol2003,77(6):3759-3767.
55.Schelling JR,Gentry DJ,Dubyak GR:Annexin II inhibition or G protein- regulated inositol trisphosphate formation in rat aortic smooth muscle.Am J Physiol 1996,270(4 Pt 2):F682-690.
56.Babiychuk EB,Monastyrskaya K,Burkhard FC,Wray S,Draeger A: Modulating signaling events in smooth muscle:cleavage of anuexin 2 abolishes its binding to lipid rafts.Faseb J2002,16(10):1177-1184.
57.Pittis MG,Muzzolin L,Giulianini PG,Garcia RC:Mycobacteria-containing phagosomes associate less annexins I,VI,VII and XI,but not II,concomitantly with a diminished phagolysosomal fusion.Eur J Cell Biol2003,82(1):9-17.
58.Bnmetti CR,Dingwell KS,Wale C,Graham FL,Johnson DC:Herpes simplex virus gD and virions accmulate in endosomes by manose 6-phosphate- dependent and-independent mechanisms.J Virol 1998,72(4):3330-3339.
59.Rubin DH,Komstem MJ,Anderson AO:Reovirus serotype 1 intestinal infection:a novel replicative cycle with ileal disease J Virol 1985,53(2):391- 398.
60.Ahmed R,Canning WM,Kauffiman RS,Sharpe AH,Hallum JV,Fields BN: Role of the host cell in persistent viral infectiont:coevolution of L cells and reovoirus during persistent infection. Cell 1981,25(2):325-332.
61.Altschul SF,Madden TL,Schaffer AA,Zhang J,Zhang Z,Miller W,Lipman DJ:Gapped BLAST and PSI-BLAST:a new generation of protein database search programs.Nucleic Acids Res 1997,25(17):3389-3402.
62.Raynor CM,Wright JF,Waisman DM,Pryzdial EL:Annexin II enhances cytomegalovirus binding and fusion to phospholipid membranes.Biochemistry 1999,38(16):5089-5095.
63.Glomb-Reinmund S,Kielian M:The role of low pH and disulfide shuffling in the entry and fusion of Semliki Forest virus and Sindbis virus.Virology 1998, 248(2):372-381.
64.Roberts PC,Kipperman T,Compans RW:Vesicular stomatitis virus G protein acquires pH-independent fusion activity during transport in a polarized endometrial cell line.J Virol 1999,73(12):10447-10457.
65.Luo T,Douglas JL,Livingston RL,Garcia JV:In fectivity enhancement by HIV-1 Nef is dependent on the pathway of virus entry:implications for HIV- based gene transfer systems.Virology 1998,241(2):224-233.
66.Platt GM,Simpson GR,Mittnacht S,Schulz TF:Iatent nuclear antigen of Kaposi′s sarcoma-associated herpesvirus interacts with RING3,a homolog of the Drosophila female sterile homeotic(fsh)gene.J Virol 1999,73(12):9789- 9795.
67.Koffa MD,Graham SV,Takagaki Y,Manley JL,Clements JB:The human papillomavirus type 16 negative regulatory RNA element interacts with three proteins that act at different posttranscriptional levels.Proc Natl Acad Sci USA 2000,97(9):4677-4682.
68.Hirose Y,Manley JL:Creatine phosphate,not ATP,is required for 3′end cleavage of mammalian pre-mRNA in vitro.J Biol Chem 1997,272(47):29636- 29642.
69.Hansen J,Etchison D,Hershey JW,Ehrenfeld E:Association of cap-binding protein with eucaryotic initiation factor 3 in initiation factor preparations from uninfected and poliovirus-infected HeLa cells.J Virol 1982,42(1):200-207.
70.Kieft JS,Zhou K,Jubin R,Muray MG,Lau JY,Doudna JA:The hepatitis C virus intearnal ribosome entry site adopts an ion-dependent tertiary fold.J Mol Biol 1999,292(3):513-529.
71.Briggs CJ,Ott DE,Coren LV,Oroszlan S,Tozser J:Comparison of the effect of FK506 and cyclosporin A on virus production in H9 cells chronically and newly infected by HIV-1.Arch Virol 1999,144(11):2151-2160.
72.Kanopka A,Muhlemann O,Petersen-Mahrt S,Estmer C,Ohrmalm C, Akusjarvi G:Regulation of adenovirus altemative RNA splicing by dephosphorylation of SR proteins.Nature 1998,393(6681):185-187.
73.Tan SL,Nakao H,He Y,Vijaysri S,Neddermann P,Jacobs BL,Mayer BJ, Katze MG:NSSA,a nonstructural protein of hepatitis C virus,binds growth factor receptor-bound protein 2 adaptor protein in a Src homology 3 domain/ligand-dependent manner and perturbs mitogenic signaling.Proc Natl Acad Sci USA 1999,96(10):5533-5538.
74.Korkaya H,Jameel S,Gupta D,Tyagi S,Kumar R,Zafrullah M,Mazumdar M, Lal SK,Xiaofang L,Sehgal D et al:The ORF3 protein of hepatitis E virus binds to Src homology 3 domains and activates MAPK.J Biol Chem 2001, 276(45):42389-42400.
75.Scaplehom N,Holmstrom A,Moreau V,Frisch knecht F,Reckmann I,Way M: Grb2 and Nck act cooperatively to promote actin-based motility of vaceinia vims.Curr Biol 2002,12(9):740-745.
76.Finkelstein LD,Ney PA,Liu QP,Paulson RF,Correll PH:Sf-Stk kmase activity and the Grb2 binding site are required for Epo-independent growth of prinary erythroblasts infected with Friend virus.Oncogene 2002,21(22):3562- 3570.
77.Huh JR,Park JM,Kim M,Carlson BA,Hatfield DL,Lee BJ:Recruitment of TBP or TFIIB to a promoter proximal position leads to stimulation of RNA polymerase II transcription without activator proteins both in vivo and in vitro.Biochem Biophys Res Commun 1999, 256(1):45-51.
78.Zhou M,Kashanchi F,Jiang H,Ge H,Brady JN:Phosphorylation of the RAP74 subunit of TFIIF correlates with Tat-activated transcription of the HIV-1 long terminal repeat.Virology 2000,268(2):452-460.
79.Kim H,Lee YH,Won J,Yun Y:Though induction of juxtaposition and tyrosine kinase activity of Jak1,X-gene product of hepatitis B virus stimulates Ras and the transcriptional activation through AP-1,NF-kappaB,and SRE enhancers.Biochem Biophys Res Comunun 2001,286(5):886-894.
80.Breslin JJ,Mork I,Smith MK,Vogel LK,Hemmila EM,Bonavia A,Talbot PJ, Sjostrom H,Noreh O,Holmes KV:Human coronavirus 229E:receptor binding domain and neutralization by soluble receptor at 37 degrees C.J Virol2003, 77(7):4435-4438.
81.Li Y,Kang J,Horwitz MS:Interaction of an adenovirus 14.7-kilodalton protein inlubitor of tumor necrosis factor alpha cytolysis with a new member of the GTPase supeffamily of signal transducers.J Virol 1997,71(2):1576-1582.
82.Hugle T,Fehrmann F,Bieck E,Kohara M,Krausslich HG,Rice CM,Blum HE, Moradpour D:The hepatitis C virus nonstructural protein 4B is an integral endoplasmic reticulum membrane protein.Virology 2001,284(1):70-81.
83.Bonatti S,Migliaccio G,Blobel G,Walter P:Role of signal recognition particle in the membrane assembly of Sindbis viral glycoproteins.Eur J Biochem 1984, 140(3):499-502.
84.Melancon P,Garoff H:Reinitiation of translocation in the Semliki Forest vins structural polyprotein:identification of the signal for the El glycoprotein.Em bo J 1986,5(7):1551-1560.
85.Emans N,Gorvel JP,Walter C,Gerke V,Kellner R,Griffiths G,Gruenberg J: Annexin II is a major component of fusogenic endosomal vesicles.J Cell Biol 1993,120(6):1357-1369.
86.Fiedler K,Kellner R,Simons K:Mapping the protein composition of trans- Golgi network(TGN)-derived carrier vesicles from polarized MDCK cells. Electrophoresis 1997,18(14):2613-2619.
87.Nezu J,Motojima K,Tamura H,Ohkuma S:Molecular cloning of a rat liver cDNA encoding the 16kDa subunit of vacuolar H(+)-ATPases:organellar and tissue distribution of 16kDa proteolipids.J Biochem(Tokyo)1992,112(2):212- 219.
88.Orci L,Perrelet A,Rothman JE:Vesicles on strings:morphological evidence for processive transport within the Golgi stack.Proc Natl Acad Sci USA 1998, 95(5):2279-2283.
89.Nakamura N,Lowe M,Levine TP,Rabouille C,Warren G:The vesicle docking protein p115 binds GM130,a cis-Golgi matrix protein,in a mitotically regulated manner.Cell 1997,89(3):445-455.
90.Okutsu T,Kuroiwa Y,Kagitani F,Kai M,Aisaka K,Tsutsumi O,Kaneko Y, Yokomori K,Surani MA,Kohda T et al:Expression and imprinting status of human PEG8/IGF2AS,a paternally expressed antisense transcript from the IGF2 locus,in Wilms tumors.J Biochem(Tokyo)2000,127(3):475-483.
91.Kumar R,Yang J,Larsen RD,Stanley P:Cloning and expression of N- acetylglucosaminyltransferase I,the medial Golgi transferase that initiates complex N-linked carbohydrate formation.Proc Natl Acad Sci USA 1990, 87(24):9948-9952.
92.Nilsson T,Rabouille C,Hui N,Watson R,Warren G:The role of the membrane-spanning domain and stalk region of N- acetylglucosaminyltransferase I in retention,kin recognition and structural maintenance of the Golgi apparatus in HeLa cells.J Cell Sci 1996,109(Pt 7):1975-1989.
93.Nilsson T,Slusarewicz P,Hoe MH,Warren G:Kin recognition.A model for the retention of Golgi enzymes.FEBS Lett 1993,330(1):1-4.
94.Yang W,Pepperkok R,Bender P,Kreis TE,Storrie B:Modification of the cytoplasmic domain affects the subcellular localization of Golgi glycosyl- transferases.Eur J Cell Biol 1996,71(1):53-61.
95.Hirst J,Futter CE,Hopkins CR:The kinetics of mannose 6-phosphate receptor trafficking in the endocytic pathway in HEp-2 cells:the receptor enters and rapidly leaves multivesicular endosomes without accumulating in a prelysosomal compartment.Mol Biol Cell 1998,9(4):809-816.
96.Sheng Q,Denis D,Ratnofsky M,Roberts TM,DeCaprio JA,Schaffhausen B: The DnaJ domain of polyomavirus large T antigen is required to regulate Rb family tumor suppressor function.J Virol 1997,71(12):9410-9416.
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈