通过参照下面对本发明优选的实施方案以及本文中的
实施例所进行 的详细描述,可更容易地理解本发明。
在公开和描述本发明的化合物、组合物、物品、设备和/或方法前, 应该理解的是,本发明并不限于特定的核酸、特定的多肽,或者具体的 方法,因为它们理所当然地可有所改变。还应该理解的是,本文所使用 的术语仅仅是为了描述具体的实施方案,无意于限定。
除非上下文另外明确指明,
说明书和随后的
权利要求书中所使用的 单数形式“一种”、“一个”和“该”包括复数指代形式。除非上下文另 外明确指明,术语“或者”指所述备选元素中的单个元素或者两个或多 个元素的组合。本文所使用的“包括”意思是“包含”。因此,“包括A 或B”意思是“包含A、B或A和B”,且不排除其它元素。
范围在本文中表示为从“约”一个具体数值,和/或到“约”另一具 体数值。这样表示范围时,另一实施方案则包括从一个具体数值和/或到 另一具体数值。同样,当通过在前面使用“约”将数值表示为近似数时, 应理解的是具体数值形成了另一实施方案。还应理解的是,每个范围的 端点在与另一端点相关时以及独立于另一端点时都是有意义的。
“任选的”或“任选地”意味着随后描述的事件或情况可能出现, 也可能不出现,并且意味着该描述包括所述事件或情况出现的情形以及 不出现的情形。例如,短语“任选在处理前获得”意味着可在处理前、 也可处理后获得,或者根本不处理即获得。
全文所使用的“受试者”意味着个体。优选地,所述受试者为哺乳 动物例如灵长类,更优选为人类。术语“受试者”包括驯养动物例如猫、 狗等,
家畜(例如
牛、
马、猪、
绵羊、山羊等),实验动物(例如小鼠、 兔、大鼠、沙土鼠、豚鼠等)以及禽类(例如鸡、火鸡、鸭、雉、家鸽、 野鸽、鹦鹉、凤头鹦鹉、鹅等)。本发明的受试者还可包括但不限于鱼类、 两栖类和爬行类。
本发明提供了几种细胞基因,它们是病毒在细胞中生长所必需的, 但并不是细胞存活所必需的。本文所使用的“细胞存活非必需的”细胞 基因意味着这样一种基因,它的一个或一对等位基因被破坏后细胞还可 存活至少一段时间,而这种破坏使得细胞中的病毒复制被减少或抑制。 这种减少可用于
预防或
治疗用途或者用于研究。“病毒生长必需的”基因 意味着该基因的基因产物,不管是蛋白质还是RNA,无论分泌与否,均以 某种直接或间接方式成为病毒生长所必需的,因此,该基因产物(即功 能上可用的基因产物)不存在时,至少一些含有病毒的细胞会死亡。全 文所使用的“基因产物”为基因表达所得到的RNA或蛋白质。
与病毒感染相关的这些细胞基因或宿主核酸序列可使用基因捕获方 法鉴定。这些基因捕获方法在实施例以及美国
专利6,448,000和 6,777,177中得到阐述。美国专利6,448,000和6,777,177均通过援引全 文纳入本文。例如,本文所阐述的宿主核酸序列可通过鉴定细胞中病毒 生长所必需的、而细胞存活非必需的细胞基因的方法得到鉴定,所述方 法包括:(a)将编码缺乏功能性启动子的选择性标记基因的载体转入细 胞培养物中,(b)筛选出表达标记基因的细胞,(c)用病毒感染细胞培 养物,以及(d)从存活细胞中分离其中插入了标记基因的细胞基因,由 此鉴定细胞中病毒生长所必需的、而细胞存活非必需的基因。宿主核酸 序列还可通过鉴定细胞中病毒生长所必需的、而细胞存活非必需的细胞 基因的方法得到鉴定,所述方法包括(a)将编码缺乏功能性启动子的选 择性标记基因的载体转入在含血清培养基中的细胞培养物中,(b)筛选 出表达标记基因的细胞,(c)将血清从培养基中除去,(d)用病毒感染 细胞培养物,以及(e)从存活细胞中分离其中插入了标记基因的细胞基 因,由此鉴定细胞中病毒生长所必需的、而细胞存活非必需的基因。
对这些宿主序列及其编码的蛋白质进行鉴定,可鉴定出可被靶向而 用于调节(例如减少基因表达和/或减小基因产物的活性,或者增加基因 表达和/或增大基因产物的活性)和/或治疗性干预的序列。
表1给出了与病毒感染相关的或以其它方式与病毒的生命周期相关 的宿主核酸序列。例如,这些核酸及其编码的蛋白质可参与到病毒生命 周期的全部阶段,包括但不限于病毒附着至细胞受体、病毒感染、病毒 进入、内化、病毒分解、病毒复制、病毒序列的基因组整合、mRNA的翻 译、病毒颗粒的组装、细胞裂解以及病毒脱离细胞。
本文所使用的基因是在调节序列如启动子或操纵基因等的操控下编 码多肽的核酸序列。该基因的编码序列为在合适调节序列的操控下转录 并翻译成为多肽(体内、体外或原位)的部分。编码序列的边界可通过5’ (氨基)端的起始密码子和3’(羧基)端的终止密码子确定。若欲使该 编码序列在真核细胞中表达,则可在编码序列的3’加上多腺苷酸化
信号 和转录终止序列。
转录和翻译控制序列包括但不限于提供的用于表达编码序列(例如 在宿主细胞中表达)的DNA调节序列,例如启动子、增强子和终止子。 多腺苷酸化信号是示例性真核生物控制序列。启动子是能结合RNA聚合 酶并能启动下游(3’方向)编码序列转录的调节区域。另外,基因可包 括在分泌于或表达于细胞表面的蛋白质的编码序列起始处的信号序列。 该序列可
编码信号肽(在成熟多肽的N端),它可指导宿主细胞转移多肽。
表1(第2列)还提供了由表1所列基因编码的蛋白质。在几种情况 下,用于捕获基因的基因捕获载体破坏了两个基因,其中一个基因的破 坏是由于载体占据了转录(transcribe off)了负链的基因中的位置。 这种事件的一个实例是相同载体对编码aprataxin的基因和编码DnaJ (Hsp40)同系物亚家族A成员1的基因的破坏。
表1还提供了所述基因在大鼠和人基因组(分别为第3列和第4列) 染色体上的位置。因此,本发明鉴定了与病毒感染相关的基因的基因组 基因座。通过鉴定基因及其在基因组中的位置,本发明提供了作为治疗 例如
抗病毒治疗、抗细菌治疗、抗真菌治疗和抗寄生物治疗等等的靶标 的基因及其产物。
表1还提供了大鼠mRNA序列的GeneBank编号(第5列)、人mRNA序 列的GeneBank编号(第6列)以及人蛋白质序列的GeneBank编号(第7 列)。本文提及的以GeneBank编号提供的核酸序列和蛋白质序列全部通 过援引纳入本文。本领域的技术人员应知晓本文所述以GeneBank编号提 供的核苷酸序列可容易从美国国立医学图书馆的国立生物技术信息中心 (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=nucleotide) 获得。同样,本文所述蛋白质序列可容易从美国国立医学图书馆的国立 生物技术信息中心
(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=protein)获 得。本文提及的以GeneBank编号提供的核酸序列和蛋白质序列可通过援 引将其全部内容纳入本文。
表1还提供了插入基因捕获载体后获得的大鼠基因部分序列的 GeneBank编号(第9列)。简而言之,通过形成基因捕获文库可以分离这 些基因,基因捕获文库可通过以下方法形成:用反转录病毒基因捕获载 体感染细胞,然后选出其中发生基因捕获事件的细胞(即其中插入了载 体,藉此插入没有启动子的标记基因,由此细胞启动子启动标记基因的 转录,即插入至功能基因)。然后,使用特异性针对反转录病毒基因捕获 载体的探针可将其中插入反转录病毒基因捕获载体的基因从集落中分 离。因此,通过这种方法分离得到的核酸为分离的基因部分。然后,通 过序列比较和其它生物信息学方法,将这些部分用于识别每个基因的完 整序列。
还提供了大鼠基因和人基因(分别为第10列和第11列)的Entrez 基因编号。以表1所列Entrez基因编号提供的信息也通过援引将其全部 内容纳入本文。本领域的技术人员可容易地从美国国立医学图书馆的国 立生物技术信息中心
(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=gene)获得该 信息。通过进入Entfez基因系统,本领域的技术人员可容易获得表1 所列每个基因的其它信息,例如基因的基因组位置、基因编码蛋白质的 性质概述、基因的同系物信息以及多个参比序列例如每种基因的基因组 序列、mRNA序列和蛋白质序列等。因此,除了表1中以GeneBank编号所 列出的序列外,本领域的技术人员还可容易通过获取以Entrez基因编号 提供的每种基因的其它信息来获得其它序列例如基因组序列、mRNA序列 和蛋白质序列。因此,可以从本文所阐述的Entrez基因编号容易地获得 的所有信息也通过援引将其全部内容纳入本文。
表2提供了根据基因在细胞中的作用对表1所述多种基因的分类。 调节序列(如转录因子)的几个实例提供于表2(例如Brd2、Brd3、Ctcf、 E2f2、Gtf2el、Hnrpl、Hoxcl3、Hpl-bp74、Id3、Znf207和Zfp7)。因 此,这些转录因子可控制多基因途径。在某些情况下,转录因子的破坏 对病毒生长有着直接影响。其它一些情况下,转录因子的破坏可通过影 响受其调控的一种或多种基因的转录或翻译来影响病毒生长。因此,本 发明还提供了受控于表1和表2所述转录因子的基因以作为治疗例如抗 病毒治疗、抗细菌治疗、抗寄生物治疗和抗真菌治疗的靶标。表2还提 供了参与其它途径例如膜泡运输、遍在蛋白化、细胞凋亡、代谢等的基 因的实例。因此,本申请还提供了这些途径中的其它基因作为治疗性干 预(治疗方法)的靶标,所述其它基因在表2所述这些途径的基因上游 或下游。例如,产生与遍在蛋白化途径中的上游或下游Ubel C相互作用 的基因产物的基因被认为是针对细胞内病原体的治疗靶标。例如,它可 为调控Ubelc表达的或与Ubelc结合的另一种蛋白质的表达的转录因子。 这些实例仅为示例性的,因为这可应用至本文所述全部基因以及这些基 因所参与的细胞途径。
提及表1中的一种或多种基因时,所述基因包括可起表1所列基因 或核酸作用的来自任何生物的任何基因、核酸、cDNA或RNA。提及表1 中的一种或多种蛋白质时,所述蛋白质包括可起表1所列蛋白质作用的 来自任何生物的任何蛋白质或其
片段。例如,术语ANXA1(膜联蛋白1) 包括可起ANXA1基因或ANXA1核酸作用的来自任何生物的任何ANXA1基 因、核酸、cDNA或RNA。术语ANXA1还包括可起ANXA1蛋白质作用的来 自任何生物的任何蛋白质。
本文所使用的术语“核酸”指单链或多链分子,它可为DNA或RNA 或其任意组合,包括这些核酸的修饰物在内。核酸可代表编码链或其互 补链,或其任意组合。核酸序列可与本文所讨论的任何部分的天然存在 序列相同,或者包含编码与存在于天然存在序列中的相同氨基酸的备选 密码子。还可对这些核酸的典型结构进行修饰。所述修饰包括但不限于 核酸甲基化,用硫(产生硫代
磷酸脱
氧核苷酸)、硒(产生硒代磷酸脱氧 核苷酸(phosphorselenoate deoxynucleotide))或甲基(产生膦酸甲 酯脱氧核苷酸)取代
磷酸盐残基的非桥连氧,AT富含区域的AT含量减少, 或者表达系统利用非偏好密码子的用法替换为表达系统利用偏好密码子 的用法。核酸可直接克隆至合适的载体内,或者如若需要,可对核酸进 行修饰以促进随后的克隆步骤。这种修饰步骤是常规的,其中的一个实 例是将含有限制酶切位点的寡核苷酸接头加至核酸末端。常规方法叙述 于Sambrook et a1.(2001)Molecular Cloning-A Laboratory Manua1 (3rd ed.)Vol.1-3,Cold Spring Harbor Laboratory,Cold Spring Harbor Press,NY,(Sambrook)。
只要获得核酸序列,则可通过本领域所熟知的技术在任何特定氨基 酸位置修饰或改变编码特定氨基酸的序列。例如,可设计PCR引物,该 引物跨越一个或多个氨基酸位置并且可将任一氨基酸置换为另一氨基 酸。或者,本领域的技术人员可通过点突变技术在具体核酸序列的任何 位点引入特定突变。常规方法叙述于Smith,M.″In vitro mutagenesis″ Ann.Rev.Gen.,19:423-462(1985)和Zoller,MJ.″New molecular biology methods for protein engineering″Curr.Opin.Struct.Biol., 1:605-610(1991),这两篇文献就其方法全文纳入本文。这些技术可用 来在不改变其编码的氨基酸序列的前提下改变编码序列。
本文考虑到的序列包括保留了具有起与病毒感染相关的细胞核酸或 蛋白质作用的能力的全长野生型(或天然)序列以及等位基因变体、变 体、片段、同系物或融合序列。在某些实例中,蛋白或核酸序列与表1 所述天然序列具有至少70%的序列同一性,例如具有至少75%、80%、85%、 90%、95%或98%的序列同一性。在其它一些实施例中,与病毒感染相关的 核酸序列具有可与表1所述序列杂交并保持表1所述序列的活性的序列。 例如,本发明考虑到了与表1所述ANXA1核酸序列(例如GeneBank编号 为NM_000700的核酸序列)杂交并编码保留ANXA1活性的蛋白质的核酸。 这类序列包括表1所述基因的基因组序列。上述ANXA1的实例仅为示例 性的,而不应将这些实例限定为ANXA1,因为这些实例可应用至表1所列 每种核酸和蛋白质。
除非另外指明,任何提及的核酸分子包括核酸的反向互补分子。除 本文要求为单链的(例如ssRNA分子)情况以外,仅书写表示为单链的 任何核酸包括相应双链核酸的两条链。例如,表示的dsDNA的正链还包 括该dsDNA的互补负链。另外,所提及的编码特定蛋白质或其片段的核 酸分子包括有义链及其反向互补链。还考虑了表1以及整个说明书中所 述的核酸片段。这些片段可用作引物和探针来扩增或检测表1所述任何 核酸或基因。
产生具体严格程度的杂交条件可根据杂交方法的性质以及杂交核酸 序列的组成和长度有所变化。一般而言,杂交
温度以及杂交缓冲液的离 子强度(如Na+浓度)将决定杂交的严格性。关于获得具体严格程度的杂 交条件的计算方法叙述于Sambrook et al,(1989)Molecular Cloning, second edition,Cold Spring Harbor Laboratory,Plainview,NY(第 9和11章)。下面为一系列示例性而非限制性的杂交条件:
极高严格度(检测具有90%同一性的序列)
杂交:5x SSC,65℃,16小时
洗涤两次:2x SSC,室温(RT),每次15分钟
洗涤两次:0.5x SSC,65℃,每次20分钟
高严格度(检测具有80%或更高同一性的序列)
杂交:5x-6x SSC,65℃-70℃,16-20小时
洗涤两次:2x SSC,RT,每次5-20分钟
洗涤两次:Ix SSC,55℃-70℃,每次30分钟
低严格度(检测同一性高于50%的序列)
杂交:6x SSC,RT至55℃,16-20小时
洗涤至少两次:2x-3x SSC,RT至55℃,每次20-30分钟。
还提供了一种载体,它包含本发明的核酸。该载体可指导本文所描 述的任何蛋白质或多肽在体内或体外的合成。考虑了该载体具有指导和 调节插入核酸转录的必需功能元件。这些功能元件包括但不限于启动子、 启动子上游或下游区域如可调节启动子转录活性的增强子、复制起点、 有助于克隆与启动子相邻的插入物的合适限制性酶切位点、用来筛选含 有载体的细胞或含有插入物的载体的抗生素抗性基因或其它标记、RNA 剪接点、转录终止区域或可用来帮助插入基因或杂合基因表达的任何其 它区域。(通常参见Sambrook et al.)。载体例如可为质粒。载体可含有 具有潮霉素抗性、氨苄青霉素抗性、艮他霉素抗性、新霉素抗性的基因 或其它适合用作筛选标记的基因或表型,或者具有甲氨蝶呤抗性用以基 因扩增的基因或表型。
本领域普通技术人员已知有很多其它大肠埃希杆菌(Escherichia coli)表达载体可用于表达核酸插入物。其它适用的
微生物宿主包括芽 胞杆菌例如枯草芽孢杆菌(Bacillus subtilis)以及其它肠杆菌科例如 沙
门氏菌种、沙雷氏菌种以及各种假单胞菌种。也可制备这些原核宿主 中的表达载体,这些载体通常含有与宿主细胞相容的表达
调控序列(如 复制起点)。另外,可存在任何数目的多种熟知启动子,例如乳糖启动子 系统、
色氨酸(Trp)启动子系统、β-内酰胺酶启动子系统或来自λ噬 菌体的启动子系统。启动子通常可控制表达,任选与操纵基因序列一起 控制表达,并且具有核糖体结合位点序列,用来例如启动和完成转录和 翻译。如若必要,可通过在5’端插入Met密码子并使其与下游核酸序列 插入物共同构成一个
框架来提供氨基末端甲硫氨酸。另外,可使用标准 寡核苷酸突变法除去核酸插入物的羧基末端延伸部分。此外,还可制备 核酸修饰物来提高氨基末端的同质性。
另外可采用
酵母表达。本发明提供了编码本发明多肽的核酸,其中 核酸可由酵母细胞表达。更具体而言,核酸可由毕赤酵母(Pichia pastoris)或
酿酒酵母(S.cerevisiae)表达。包括例如酿酒酵母 (Saccharomyces cerevisiae)和毕赤酵母在内的酵母表达系统有几点优 点。首先,有证据表明由酵母分泌系统产生的蛋白质可呈现正确的二硫 键
配对。其次,使用酵母表达系统可进行高效大规模生产。酿酒酵母前 体α交配因子原前导区(pre-pro-alpha mating factor leader region, 由MFα-1基因编码)可用来指导从酵母中分泌蛋白质(Brake,et al.)。 前体α交配因子原的前导区具有信号肽和前区段(pro-segment),所述 前区段包括由KEX2基因编码的酵母蛋白酶的识别序列,该酵母蛋白酶可 在Lys-Arg二肽切割信号序列的羧基端切割前体蛋白质。核酸编码序列 可与前体α交配因子原前导区融合成同一框架。该构建体受控于较强的 转录启动子,例如醇脱氢酶I启动子、醇
氧化酶I启动子、糖酵解启动 子或半乳糖利用途径的启动子。核酸编码序列之后是翻译终止密码子, 翻译终止密码子之后是转录终止信号。或者,核酸编码序列可融合至另 一蛋白质编码序列例如Sj26或β-半乳糖苷酶,用于帮助通过亲和色谱 法对融合蛋白进行纯化。用来分离融合蛋白组分的蛋白酶切割位点的插 入可应用到用于在酵母中表达的构建体。在杆状病毒系统中还可实现重 组蛋白质的高效表达和翻译后糖基化。
哺乳动物细胞可使得蛋白质在有利于重要的翻译后修饰的环境中表 达,所述重要的翻译后修饰例如为折叠和半胱氨酸配对、复杂
碳水化合 物结构的引入以及活性蛋白质的分泌。用于在哺乳动物细胞中表达活性 蛋白质的载体的特征在于:在较强的病毒启动子和多腺苷酸化信号之间 插入了蛋白质编码序列。载体可含有具有潮霉素抗性、艮他霉素或G418 抗性的基因或其它适合用作筛选标记的基因或表型,或者具有甲氨蝶呤 抗性用以基因扩增的基因或表型。可使用甲氨喋呤抗性编码载体将嵌合 蛋白质编码序列引入中国仓鼠卵巢(CHO)细胞系,或者使用合适的选择 标记将其引入其它细胞系。转化细胞中是否存在载体DNA可通过 Southern印迹分析进行确证。对应插入物编码序列的RNA的产生可通过 Northern印迹分析进行确证。本领域中已经开发了很多能分泌完整人蛋 白质的其它合适的宿主细胞系,这些宿主细胞系包括CHO细胞系、Hela 细胞、骨髓瘤细胞系、Jurkat细胞等。这些细胞的表达载体可包括表达 调控序列如复制起点、启动子、增强子等,以及必需的信息加工位点如 核糖体结合位点、RNA剪接位点、多腺苷酸化位点等,以及转录终止子序 列。优选的表达调控序列为来源于免疫球蛋白基因、SV40、腺病毒、牛
乳头状瘤病毒等的启动子。
本文所述表达载体还包括受控于诱导型启动子如
四环素诱导型启动 子或糖皮质
激素诱导型启动子等的本发明核酸。本发明的核酸还可受控 于组织特异性启动子,以促进核酸在特定细胞、组织或器官中表达。还 考虑了任何可调节的启动子如金属硫蛋白启动子、热休克启动子和其它 可调节的启动子,其中很多实例为本领域熟知。另外,还使用了Cre-loxP 诱导性系统以及F1p重组酶诱导性启动子系统,两者均为本领域已知。
还可使用在哺乳动物细胞中表达基因或核酸的其它载体,它们与所 开发的用于表达人γ干扰素、组织
纤维蛋白溶酶原激活剂、
凝固因子VIII、 乙型
肝炎病毒表面抗原、蛋白酶Nexinl和嗜酸性粒细胞主要
碱性蛋白的 载体相似。另外,载体可包括可用于在哺乳动物细胞(如COS-7)中表达 插入核酸的CMV启动子序列和多腺苷酸化信号。
昆虫细胞也可表达哺乳动物蛋白质。用杆状病毒载体在昆虫细胞中 产生的重组蛋白质会经历翻译后修饰,该修饰与野生型蛋白质的修饰相 似。简而言之,用于在昆虫细胞中表达活性蛋白质的杆状病毒载体的特 征在于:在多
角体蛋白(主要包含体蛋白(occlusion protein))编码 基因的苜蓿
银纹夜蛾核型多角体病毒(Autographica californica nuclear polyhedrosis virus,AcNPV)启动子下游插入了蛋白质编码序 列。用病毒和质粒DNA的混合物
转染培养后的昆虫细胞例如草地贪夜蛾 (Spodoptera frugiperda)细胞系,然后将病毒子代涂板。多角体蛋白 基因的缺失或插入失活可导致产生包含体阴性病毒,该病毒形成的噬斑 显著不同于野生型包含体阳性病毒所形成的噬斑。这些特征性噬斑形态 学使得可对重组病毒进行目测筛选,在所述重组病毒中,AcNPV基因已由 所选择的杂合基因所替换。
本发明还提供了含有所考虑的核酸的载体,所述载体在适于表达该 核酸的宿主中。宿主细胞可为原核细胞,包括例如细菌细胞。更具体而 言,细菌细胞可为大肠埃希氏菌细胞。或者,细胞可为真核细胞,包括 例如中国仓鼠卵巢(CHO)细胞、COS-7细胞、HELA细胞、禽类细胞、骨 髓瘤细胞、毕赤酵母细胞或昆虫细胞。例如使用甲氨喋呤抗性编码载体, 可以将本文所述任何多肽的编码序列引入中国仓鼠卵巢(CHO)细胞系, 或者使用合适的筛选标记将其引入其它细胞系。转化细胞中是否存在载 体DNA可通过Southern印迹分析进行确证。对应插入物编码序列的RNA 的产生可通过Northern印迹分析进行确证。已经开发了很多其它合适的 宿主细胞系,这些宿主细胞系包括骨髓瘤细胞系、
成纤维细胞系和多种
肿瘤细胞系例如黑素瘤细胞系。用于这些细胞的表达载体可包含表达调 控序列例如复制起点、启动子、增强子,以及必需的信息加工位点如核 糖体结合位点、RNA剪接位点、多腺苷酸化位点,以及转录终止序列。优 选的表达调控序列为来源于免疫球蛋白基因、SV40、腺病毒、牛乳头状 瘤病毒等的启动子。含有目的核酸区段的载体可通过已知方法转入宿主 细胞,这些方法根据细胞宿主的类型有所变化。例如,
氯化钙转化方法 通常用于原核细胞,而磷酸钙、DEAE葡聚糖、脂转染胺
试剂或脂转染试 剂介导的转染、电穿孔或任何现在已知或待将来鉴定的方法可用于其它 真核细胞宿主。
多肽
本发明提供了分离的多肽,包括表1中以GeneBank编号述及的多肽 或蛋白质序列。本发明还提供了这些多肽的片段,例如膜联蛋白A1蛋白 质的片段、膜联蛋白A2蛋白质的片段、膜联蛋白A3蛋白质的片段等。 这些片段的长度足以用作抗原肽,以形成
抗体。本发明还考虑到表1所 述蛋白质的功能性片段,该片段具有该蛋白质的至少一种活性,例如为 病毒感染所必需的、但并非细胞存活所必需的活性。本领域的技术人员 应知晓表1所述多肽具有其它性质。例如,ABCA4为ATP结合盒转运体超 家族的成员。因此,本领域的技术人员可对ABCA4片段用作ATP结合盒 转运体的能力进行评估。若具有ATP结合盒转运体活性,则本领域的技 术人员便可获知ABCA4为ABCA4的功能片段。表1所列多肽的片段及变 体与其各自的GeneBank编号所列的氨基酸序列相比可包括一个或多个保 守氨基酸残基。
“分离的多肽”或“纯化的多肽”指基本不含有在自然环境中或在 培养条件下通常伴随该多肽的物质的多肽。本发明的多肽例如可通过从 可获得的自然来源(例如哺乳动物细胞)来提取获得,通过表达编码多 肽的重组核酸获得(例如在细胞或不含细胞的翻译系统中),或者通过化 学合成多肽获得。另外,可通过切割全长多肽来获得多肽。多肽为天然 存在的较大多肽的片段时,分离的多肽比天然存在的全长多肽短,并且 不包括该天然存在的全长多肽,其中分离的多肽是天然存在的全长多肽 的片段。
使用任何一种本领域普通技术人员已知的多肽化学合成技术可制备 本发明多肽,这些多肽化学合成技术包括溶液法和固相法。生产本发明 多肽的一种方法是通过蛋白质化学技术将两个或多个肽或多肽连接在一 起。例如,可使用现有的实验室设备并应用Fmoc(9-芴甲氧羰基)或Boc (叔丁氧羰基)化学(Applied Biosystem,Inc.,Foster City,CA) 可化学合成肽或多肽。本领域的技术人员可容易理解对应于本发明抗体 的肽或多肽可通过例如标准化学反应合成。例如,可合成肽或多肽,且 不将其从其
合成树脂上切割下来;可合成抗体的其它片段,但随后从树 脂上切割下来,由此暴露其它片段上被官能性封闭的末端基团。通过肽 缩合反应,这两个片段可通过肽键分别在羧基和氨基末端共价连接起来 形成抗体或其片段(Grant GA(1992)Synthetic Peptides:A User Guide. W.H.Freeman and Co.,N-Y.(1992);Bodansky M and Trost B.,Ed. (1993)Principles of Peptide Synthesis.Springer-Verlag Inc., NY)。或者,肽或多肽可按如上所述在体内独立合成。可以在分离后将这 些独立的肽或多肽通过类似的肽缩合反应连接起来形成抗体或其片段。
例如,可用克隆的或合成的肽区段的酶连接而使相对较短的肽片段 连接起来生成较大的肽片段、多肽或整个蛋白质结构域(Abrahmsen Let al.,Biochemistry,30:4151(1991))。或者,可用合成肽的天然化学 连接从较短的肽片段合成构建较大的肽或多肽。本方法由两步化学反应 组成(Dawson et al. Syntlxesis of Proteins by Native Chemical Ligation.Science,266:776-779(1994))。第一步为未保护的合成肽- α-硫酯与另一含有氨基端Cys残基的未保护的肽区段进行化学选择性反 应,获得硫酯键连接的中间体作为初始共价产物。若不改变反应条件, 该中间体会自发进行快速的分子内反应,并在连接位点形成天然的肽键。 这种天然化学连接方法在蛋白质分子的总体合成中的应用可通过制备人 白细胞介素8(IL-8)得以阐述(Baggiolini Met al.(1992)FEBS Lett. 307:97-101;Clark-Lewis Iet al,J.Biol.Chem.,269:16075(1994); Clark-Lewis I et al.,Biochemistry,30:3128(1991);Rajarathnam K et al.,Biochemistry 33:6623-30(1994))。
或者,可化学连接未保护的肽区段,此时由于化学连接导致肽区段 之间形成的键为非天然(非肽)键(Schnolzer,M et al.Science,256:221 (1992))。该技术已被用来合成的蛋白质结构域的类似物以及大量相对较 纯的具有生物学活性蛋白质(deLisle Milton RC et al.,Techniques in Protein Chemistry IV.Academic Press,New York,pp.257-267 (1992))。
本发明多肽还可通过包括例如重组技术在内的其它方法制备得到。 合适的克隆和测序技术的实例以及足以指导本领域的技术人员完成多种 克隆实验的教导可见于Sambrook et al.(2001)Molecular Cloning- A Laboratory Manual(3rd ed.)Vol.1-3,Cold Spring Harbor Laboratory,Cold Spring Harbor Press,NY,(Sambrook)。
本发明还提供了一种多肽或该多肽序列的片段,所述多肽含有与表1 中以GeneBank编号给出的多肽序列有至少约70%、75%、80%、85%、 90%、95%、96%、97%、98%或99%同一性的氨基酸序列。
应理解的是,正如本文所述,使用的术语“同源性”和“同一性” 含义是相同的,都指的是相似性。因此,例如如果在提及两个非天然序 列时使用词语“同源性”,则应理解的是这不一定表示这两个序列之间有 进化关系,而应着眼于其核酸序列之间的相似性或相关性。为了测量序 列相似性,可将很多用于测定两种进化相关的分子同源性的方法常规地 应用至任何两种或两种以上核酸或蛋白质,而不用考虑它们是否进化相 关。
总而言之,应理解的是,确定本文所公开的核酸和多肽的任何已知 变体和衍生物或可能出现的变体和衍生物的一种方法是通过确定变体和 衍生物与特定已知序列之间的同源性而进行的。总的说来,本文所公开 的核酸和多肽的变体一般与所述序列或天然序列具有至少约70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%或99%的同源性。本领域的技术人员可容易理解如何确定两种多肽或 核酸的同源性。例如,可在对两个序列进行比对而使同源性水平最高之 后,计算得出同源性。
计算同源性的另一种方法可通过公开的
算法进行。用于比较的最佳 比对可通过Smith and Waterman Adv.Appl.Math.2:482(1981)的 局部同源性算法进行,通过Needleman and Wunsch,J.MoI.Biol.48: 443(1970)的同源比对算法进行,通过Pearson and Lipman,Proc.Nat l. Acad.Sci U.S.A.85:2444(1988)的相似性检索方法进行,通过这些 算法的计算机执行(Wiscons in Genetics Software Package中的GAP、 BESTFIT、FASTA和TFASTA,Genetics Computer Group,575 Science Dr., Madison,WI;国立生物技术信息中心提供的Tatusova and Madden FEMS Microbiol.Lett.174:247-250(1999)的BLAST算法 (http://www.ncbi.nlm.nih.gov/blast/b12seq/b12.html))进行或通过 审查进行。
相同类型的核酸的同源性可通过例如Zuker,M.Science 244:48-52, 1989,Jaeger et al.Proc.Natl.Acad.SciUSA 86:7706-7710,1989, Jaeger et al.Methods Enzymol.183:281-306,1989所公开的算法获 得,这些文献至少将其与核酸比对相关的内容通过援引纳入本文。应理 解的是,通常可使用任何一种方法,并且在某些情况下这些不同方法得 到的结果有所不同,但是本领域的技术人员可以理解若用这其中的至少 一种方法获得了同一性,则称该序列具有所述同一性。
例如,本文所使用的与另一序列具有具体百分比同源性的所述序列 是指具有由上述一种或多种计算方法计算得到的所述同源性的序列。例 如,如果使用Zuker计算方法计算得到第一序列与第二序列具有80%的同 源性,则即便使用任何其它计算方法计算得到第一序列与第二序列没有 80%的同源性,第一序列与第二序列也具有本文所述的80%的同源性。作 为另一实例,如果使用Zuker计算方法和Pearson和Lipman计算方法计 算得到第一序列与第二序列具有80%的同源性,那么即便使用Smith和 Wateman计算方法、Needleman和Wunsch计算方法、Jaeger计算方法或 任何其它计算方法计算得到第一序列与第二序列没有80%的同源性,第一 序列与第二序列也具有本文所述的80%的同源性。作为又一实例,如果使 用每种计算方法计算得到第一序列和第二序列具有80%的同源性,则第一 序列与第二序列具有本文所述的80%的同源性(尽管实际上,不同的计算 方法通常会计算得到不同的同源性百分比)。
本发明还提供了将表1中以GeneBank编号形式述及的多肽进行一个 或多个保守氨基酸置换的多肽。这些保守置换即为将天然存在的氨基酸 置换为具有相似性质的氨基酸。这种保守置换并不改变多肽的功能。例 如,保守置换可依据下表进行:
表1:氨基酸置换 原始残基 示例性置换 Arg Asn Asp Cys Gln Glu Gly His Ile Leu Lys Met Phe Ser Thr Trp Tyr Val Lys Gln Glu Ser Asn Asp Pro Gln leu;val ile;val arg;gln leu;ile met;leu;tyr Thr Ser Tyr trp;phe ile;leu
因此,应理解的是,如若需要,可对编码本发明多肽的核酸和/或本 发明多肽的氨基酸序列进行修饰和改变,并仍能获得具有相似特征或其 它所需特征的多肽。这种改变可在天然分离物中进行,或者可利用位点 特异性诱变通过合成引入,所述通过位点特异性诱变引入的方法例如错 配
聚合酶链反应(PCR)为本领域所熟知。例如,多肽中的某些氨基酸可 被置换成其它氨基酸,而不会显著丧失功能活性。因此考虑了可对本发 明多肽的氨基酸序列(或其核酸序列)作出多种改变,而不显著丧失生 物效用或活性,并且这种效用或活性还可能得到提高。因此,很清楚的 是,本发明考虑了本文所述多肽序列天然存在的变化形式以及本文所述 多肽序列通过基因工程得到的变化形式。通过提供与病毒感染相关的基 因的基因组位置,本发明还提供了这些基因的任何变体序列的基因组位 置。因此,基于本文提供的信息,对于本领域的技术人员而言,鉴定申 请人所鉴定的基因组位置并对其测序以及鉴定本文所述基因的变体序列 是常规的。对于本领域的技术人员而言,利用比较工具和生物信息技术 来鉴定来自其它物种的序列也是常规的,所述来自其它物种的序列是本 文所述基因的同系物并且也是感染所必需、但并非为细胞存活所必需的。
抗体
本发明还提供了特异性结合表1所述基因产物、多肽、蛋白质及其 片段的抗体。本发明抗体可为多克隆抗体或单克隆抗体。本发明抗体选 择性结合多肽。“选择性结合”或“特异性结合”指的是测定抗原是否存 在的抗体结合反应(在本文中是指测定在一群异源蛋白质中和其它生物 制品中是否存在表1所述多肽或其抗原性片段的反应)。因此,在特定的 免疫分析条件下,所述具体抗体优先结合特定的肽,而不是以显著的量 结合样本中其它蛋白质。优选地,选择性结合包括大约或大于1.5倍分 析背景的结合,小于1.5倍分析背景的结合为不存在显著结合。
本发明还考虑到了与表1所述蛋白质的天然相互作用因子或配体竞 争性结合的抗体。换而言之,本发明提供了干扰表1所述蛋白质和其结 合伴侣之间的相互作用的抗体。例如本发明抗体可与某种蛋白质竞争细 胞上的结合位点(如受体),或者该抗体可与某种蛋白质竞争结合另一种 蛋白质或生物分子,例如受表1所述转录因子转录调控的核酸。与抗原 相比,抗体任选具有拮抗作用或激动作用。
优选地,抗体可在体内或离体时结合多肽。任选地,本发明抗体用 可检测部分进行标记。例如,可检测部分可选自
荧光部分、酶联部分、 生物素部分和放射标记部分。抗体可用于诸如诊断、筛选或成像等技术 或方法中。抗独特型抗体和亲和成熟抗体也被认为是本发明的一部分。
本文所使用的术语“抗体或其片段”包括具有两种或多种抗原或表 位特异性的
嵌合抗体和杂合抗体,以及包括杂合片段在内的片段例如 F(ab’)2、Fab’、Fab等。因此提供了保留了与其特异性抗原进行结合的 能力的抗体片段。这类抗体和片段可由本领域已知的技术制备,并可根 据实施例所述方法和生产抗体和筛选抗体的特异性和活性的一般方法对 抗体的特异性和活性进行筛选(参见Harlow and Lane.Antibodies,A Laboratory Manual.Cold Spring Harbor Publications,New York, (1988))。
“抗体及其片段”的含义还包括例如美国专利4,704,692所述的抗 体片段和抗原结合蛋白的缀合物(单链抗体),所述文献的内容通过援引 纳入本文。
任选地,抗体在其它物种中形成并为了给人施用而被“人源化”。在 本发明的一个实施方案中,“人源化”抗体为由种系突变体动物产生的人 类抗体形式的抗体。非人类(如鼠类)抗体的人源化形式为嵌合的免疫 球蛋白、免疫球蛋白链或其片段(例如Fv、Fab、Fab’、F(ab’)2或抗体 的其它抗原结合子序列),它们含有最少的来源于非人类免疫球蛋白的序 列。人源化抗体包括人免疫球蛋白(受体抗体),其中受体CDR的残基被 来自人以外物种(供体抗体)如小鼠、大鼠或兔CDR的、具有所需特异 性、亲和力和容纳力的残基替换。在一个实施方案中,本发明提供了抗 体的人源化形式,包含特异性结合表1所述蛋白质的单克隆抗体的至少 一个、两个、三个、四个或最高至全部CDR。在某些情况下,人免疫球蛋 白的Fv框架残基由相应的除人外的残基所替换。人源化抗体还可包括既 不存在于受体抗体中也不存在于引进的CDR或框架序列中的残基。一般 而言,人源化抗体包括基本上所有的可变域,或者包括至少一个可变域, 一般包括两个可变域,其中所有的或基本上所有的CDR区域对应非人类 免疫球蛋白的CDR区域,并且所有的或基本上所有的FR区域为人免疫球 蛋白共有序列的FR区域。人源化抗体最好还包含至少一部分免疫球蛋白 恒定区(Fc),一般为人免疫球蛋白的恒定区(Jones et al.,Nature, 321:522-525(1986);Riechmann et al.,Nature,332:323-327(1988); and Presta,Curr.Op.Struct.Biol,2:593-596(1992))。
人源化非人类抗体的方法为本领域所熟知。一般而言,人源化抗体 具有从非人类来源引入其中的一个或多个氨基酸残基。这些非人类氨基 酸残基通常指“引进”的残基,它通常来自“引进”的可变域。依照Winter 和他的同事的方法(Jones et al.,Nature,321:522-525(1986); Riechmann et al.,Nature,332:323-327(1988);Verhoeyen et al., Science,239:1534-1536(1988)),通过将啮齿类CDR或CDR序列置换 为相应的人抗体的序列,可基本完成人源化。因此,这种“人源化”抗 体为嵌合抗体(美国专利4,816,567),其中基本上不到一个完整的人可 变域由来自非人类物种的相应序列所替换。实际上,人源化抗体一般为 人抗体,其中一些CDR残基和可能的一些FR残基被来自啮齿类抗体的类 似位点的残基所置换。
药剂的鉴定
一种鉴定抗病毒药剂的方法包括a)将所述药剂给予含有表1所列细 胞基因的细胞,b)检测由细胞基因产生的基因产物的水平和/或活性, 该基因产物和/或基因产物活性的减少或消失表明该化合物具有抗病毒 活性。
本发明还提供了一种鉴定抗病毒药剂的方法,包括:a)将所述药剂 给予含有表1所列细胞基因的细胞,b)使细胞和病毒
接触;c)检测病 毒感染的水平;并d)将病毒感染水平与表1中基因的表达水平或表1 中基因编码的蛋白质的活性相关联,病毒感染的减轻或消失与基因表达 和/或活性的减少或消失相关就表明所述药剂为抗病毒药剂。例如,药剂 可干扰基因表达和/或基因的蛋白质或多肽产物的活性。在本发明的方法 中,本发明测试化合物或抗病毒药剂可在细胞与病毒接触之前或之后或 在细胞与病毒接触的同时送递。
上述方法可用来鉴定在经病原体感染之后具有减轻感染、预防感染 或提高细胞存活的活性的任何药剂。因此,在本发明的方法中,细胞与 病毒接触的步骤可替换为细胞与任何感染性病原体接触。感染包括引入 感染物,例如非重组病毒、重组病毒、质粒、细菌、
朊病毒、真核微生 物或能感染宿主例如细胞培养物的细胞或受试者的细胞等的其它物质。 这种感染可为体外的、离体的或体内的。
用于本文所述方法的测试化合物可包括但不限于化学品、小分子、 药物、蛋白质、cDNA、抗体、morpholinos、三链螺旋分子、siRNA、shRNA、 反义RNA、核酶或任何其它已知的或今后将被鉴定的、会干扰本文所述细 胞基因的表达和/或功能的化合物。测试化合物还可调节本文所述细胞基 因的基因产物的活性。
小干扰RNA(siRNA)为双链RNA,它可诱导序列特异性转录后基因 沉默,由此减少甚或抑制基因表达。在一些实例中,siRNA分子长约19-23 个核苷酸,例如至少有21个核苷酸,例如至少有23个核苷酸。在一个 实例中,siRNA可触发siRNA和靶RNA之间序列同一性区域的同源RNA 分子如mRNA的特异性降解。例如,WO02/44321公开了在靶mRNA与3’ 突出端碱基配对时能序列特异性降解靶mRNA的siRNA。dsRNA加工的方 向决定了所产生的siRNA核酸内切酶复合物所切割的是有义靶RNA还是 反义靶RNA。因此,例如通过使基因例如表1所述一个或多个基因沉默, 可将siRNA用于调节转录。siRNA的作用已在来自包括果蝇 (Drosophila)、
线虫(C.elegans)、昆虫、蛙、
植物、真菌、小鼠和 人在内的多种生物体的细胞中得到证实(例如WO02/44321;Gitlin et al.,Nature 418:430-4,2002;Caplen et al.,Proc.Natl.Acad.Sci 98:9742-9747,2001和Elbashir et al.,Nature 411:494-8,2001)。 在某些实例中,设计针对某些靶基因的siRNA以验证针对相同核酸序列 所使用的基因捕获的结果。采用序列分析工具,本领域的技术人员可设 计siRNA来特异性打靶表1所述任何基因来减少基因表达。抑制表1所 述任何基因的基因表达或使其沉默的siRNA可从Ambion Inc.2130 Woodward Austin,Tx 78744-1832 USA获得。只要提供编码序列的 GeneBank编号或基因的Entrez基因编号,就可以容易地获得由Ambion 公司合成的siRNA,大鼠和人编码序列的GeneBank编号或Entrez基因编 号均已在表1中提供。
本文还提供了可用来减少表1所列基因的基因表达的序列的实例。 特别地,表3提供了表1所列基因的有义RNA序列和反义RNA序列。因 此,表3所述任何有义或反义序列可单独使用或与其它序列一起使用, 以抑制基因表达。这些序列可包含3’TT突出端和/或其它可有效克隆和 表达s iRNA序列的序列。这些序列可通过分析表3所列基因的可译框架 获得。因此,表3提供了所分析的每种基因的名称、基因的mRNA的 GeneBank编号、mRNA的长度、mRNA的ORF区域和每种基因的基因座编号。 每种基因的基因座编号与表1所列Entrez基因编号相同。表3还提供了 基因可译框架中的序列的起始位点,所述基因可通过表3所述有义RNA 序列和/或反义RNA序列对其进行打靶。靶序列的起始位点在名称栏和起 点栏标出。名称栏还提供了每个靶序列的GeneBank编号标识符。因此, 很清楚的是,表3中具有名称NM_000350_siRNA_458的行表明有义序列 和反义序列对应GeneBank编号NM_000350,靶序列的起始位点为458。 例如,ABCA4基因靶序列开始于458位。因此,含有SEQ ID NO:1的序 列和/或含有SEQ ID NO:2的序列为可用来靶向ABCA4并减少ABCA4基 因表达的两个序列。同样,含有SEQ ID NO:3的序列和/或含有SEQ ID NO: 4的序列可用来靶向ABCA4表达。这些实例并非意在限制,而是属于表3 所述每一个有义和反义RNA序列的一部分。包含本文所述有义和反义RNA 序列的序列可用来抑制任何细胞(真核细胞或原核细胞)、动物或任何其 它生物中的基因表达。这些序列可克隆至载体中并在体外、离体或体内 条件下用来减少基因表达。
shRNA(短发夹RNA)为DNA分子,它可被克隆至表达载体来表达用 于RNAi干扰研究的siRNA(19-21个核苷酸的RNA双链)。shRNA具有如 下结构特征:长约19-29个核苷酸、来源于靶基因的短核苷酸序列,其 后为约4-15个核苷酸的短间隔物(即环)以及约19-29个核苷酸的序列, 所述19-29个核苷酸的序列为起始靶序列的反向互补序列。例如,表3 所述任何基因的有义siRNA序列均可用来设计shRNA。作为一个实例, C10orf3(SEQ ID NO:292)的有义RNA序列可用来设计具有示例性接头 序列(CGAA)的shRNA。如下所示,有义序列通过接头(CGAA)与反义序 列连接而形成顶链(top strand)。顶链和底链(bottom strand)
退火 形成可克隆至恰当表达载体的双链寡核苷酸。该双链寡核苷酸具有如下 所示有助于克隆的核苷酸突出端。这些序列可克隆至载体并离体、体外 或体内应用以减少基因表达。
因此,表3所述任何有义序列可用接头使其与相应的反义序列连接 起来形成shRNA的顶链。底链是顶链的反向互补序列。将表3所述序列 中的“U”由“T”置换从而形成DNA链。然后将顶链和底链退火形成双 链shRNA。如上所述,顶链和底链具有突出端或其它有助于克隆至表达载 体序列。
核酶是能催化特异性切割RNA的具有酶活性的RNA分子。核酶的作 用机制包括核酶分子特异性杂交至互补的靶RNA和随后进行核酸内切。 使用核酶来降低或抑制RNA表达的方法为本领域已知(例如参见 Kashani-Sabet,J Investig.Dermatol.Symp.Proc,7:76-78,2002)。
通常,术语“反义”指由于一定程度的序列互补性而能与RNA序列 (如mRNA)的一部分杂交的核酸分子。本文所公开的反义核酸可以是双 链或单链寡核苷酸,RNA或DNA或其修饰物或衍生物,可直接将它给予细 胞(例如通过将反义分子给予受试者),或者通过外源引入序列的转录在 细胞内产生(例如通过给予受试者含有受控于启动子的反义分子的载 体)。
反义核酸为多核苷酸,例如为至少长6个核苷酸、至少长10个核苷 酸、至少长15个核苷酸、至少长20个核苷酸、至少长100个核苷酸、 至少长200个核苷酸的核酸分子,例如为6至100个核苷酸的核酸分子。 然而反义分子也可以长得多。在具体的实例中,核苷酸在一个或多个碱 基部分、糖基部分或磷酸盐骨架(或其组合)上被修饰,并可包括其它 附加的基团例如肽或有助于跨细胞膜(Letsinger et al.,Proc.Natl. Acad.Sci.USA 1989,86:6553-6;Lemaitre et al,Proc.Natl.Acad. Sci.USA 1987,84:648-52;WO88/09810)或者血脑屏障(WO89/10134) 转运的药剂、杂交触发切割剂(Krol et al,BioTechniques 1988, 6:958-76)或插入试剂(Zon,Pharm.Res.5:539-49,1988)。
经修饰的碱基部分的实例包括但不限于:5-氟尿嘧啶、5-溴尿嘧啶、 5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、乙酰胞嘧啶、5-(羧基 羟甲基)尿嘧啶、5-羧甲基氨甲基-2-硫尿核苷、5-羧甲基氨甲基尿嘧啶、 二氢尿嘧啶、β-D-半乳糖基Q核苷(galactosylqueosine)、肌苷、N~ 6-异戊基腺嘌呤(sopentenyladenine)、1-甲基
鸟嘌呤、1-甲基肌苷、 2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5- 甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨甲基尿嘧啶、甲氧氨 甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷(mannosylqueosine)、5’-甲 氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊基腺嘌呤、尿 嘧啶-5-羟基乙酸、假尿嘧啶、Q核苷(queosine)、2-巯基胞嘧啶、5- 甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5- 羟基乙酸甲酯、尿嘧啶-S-羟基乙酸、5-甲基-2-硫尿嘧啶、3-(3-氨基 -3-N-2-羧丙基)尿嘧啶和2,6-二氨基嘌呤。
经修饰的糖基部分的实例包括但不限于阿拉伯糖、2-氟阿拉伯糖、 木糖和己糖,或者磷酸盐骨架的修饰组分例如硫代磷酸酯 (phosphorothioate)、二硫代磷酸酯、氨基硫代磷酸酯 (phosphoramidothioate)、氨基磷酸酯、二氨基磷酸酯 (phosphordiamidate)、磷酸甲酯、烷基磷酸三酯、或formacetal或其 类似物。
在一个具体实例中,反义分子为α-异头寡核苷酸。α-异头寡核苷 酸与互补RNA形成特异性双链杂合体,与通常的β单位不同,其中的链 彼此平行(Gautier et al,Nucl.Acids Res.15:6625-41,1987)。寡 核苷酸可与另一分子例如肽、杂交触发交联剂、转运剂或杂交触发切割 剂缀合。寡核苷酸可包括可增强宿主细胞摄入分子的寻靶部分。寻靶部 分可为特异性结合分子,例如识别存在于宿主细胞表面的分子的抗体或 其片段。
在一个具体实例中,识别本文所述核酸的反义分子包括催化性RNA 或核酶(例如参见WO90/11364;WO95/06764;和Sarver et al., Science 247:1222-5,1990)。反义分子与金属复合物如三联吡啶
铜(II) 的缀合物描述于Bashkin et al.(Appl Biochem Biotechnol.54:43-56, 1995),该缀合物能介导mRNA
水解。在一个实例中,反义核苷酸为2 ’-O- 甲基核糖核苷酸(Inoue et al,Nucl.Acids Res.15:6131-48,1987) 或嵌合的RNA-DNA类似物(Iroue et al,FEBS Lett.215:327-30,1987)。
使用这些方法鉴定的抗病毒药剂可用于离体、体外或体内抑制细胞 中的病毒感染。
本发明的方法中,可使用可被病毒或其它病原体例如细菌、寄生物 或真菌等感染的任何细胞。细胞可为原核细胞或真核细胞,例如来自昆 虫、鱼、甲壳动物、哺乳动物、鸟、爬行动物、酵母或细菌如大肠埃希 氏菌的细胞。细胞可为生物体的一部分或为细胞培养物例如哺乳动物细 胞的培养物或细菌培养物的一部分。
本发明的病毒包括所有RNA病毒(包括负链RNA病毒、正链RNA病 毒、双链RNA病毒和反转录病毒)和DNA病毒。病毒的实例包括但不限 于HIV(包括HIV-1和HIV-2)、微小病毒、乳头瘤病毒、麻疹病毒、纤 丝病毒(filovirus)(例如Marburg)、SARS(严重急性
呼吸道综合征) 病毒、汉坦病毒、流感病毒(如A型、B型和C型流感病毒)、A至G型 肝炎病毒、杯状病毒、星状病毒、轮状病毒、冠状病毒(例如人呼吸道 冠状病毒)、微小RNA病毒(例如人鼻病毒和肠道病毒)、埃博拉病毒、 人疱疹病毒(例如HSV-1-9,包括带状疱疹病毒、Epstein-Barr病毒和 人巨细胞病毒)、
口蹄疫病毒、人腺病毒、腺伴随病毒、
天花病毒(痘疹 病毒)、牛痘病毒(cowpox)、猴痘病毒、痘苗病毒(vaccinia)、脊髓灰 质炎病毒、病毒性脑膜炎病毒和汉坦病毒。
对于动物,病毒包括但不限于任一上述人病毒的相应动物病毒、禽 流感病毒(例如毒株H5N1、H5N2、H7N1、H7N7和H9N2)和动物反转录病 毒例如猿猴免疫
缺陷病毒、禽免疫缺陷病毒、假牛痘病毒、牛免疫缺陷 病毒、猫免疫缺陷病毒、马传染性贫血病病毒、羊关节炎脑炎病毒和绵 羊髓鞘脱落病毒。
本发明方法还可用于评价细菌感染和鉴定抗细菌药剂。具体而言, 可以使用相同的方法,只是将细胞与病毒接触替换为将细胞与细菌接触。 因此,本发明提供了一种鉴定抗细菌药剂的方法,包括a)将药剂给予含 有表1所列细胞基因的细胞,b)检测由细胞基因产生的基因产物的水平 和/或活性,基因产物和/或基因产物活性的减少或消失表明化合物具有 抗细菌活性。
本发明还提供了一种鉴定抗细菌药剂的方法,包括a)将药剂给予含 有表1所列细胞基因的细胞,b)使细胞与细菌相接触,c)检测细菌感 染的水平;并d)将细菌感染水平与表1中基因的表达水平或表1中基因 编码的蛋白质的活性相关联,细菌感染的减轻或消失与基因表达和/或活 性的减少或消失相关则表明药剂为
抗菌剂。
细菌的实例包括但不限于下列细菌:利斯特菌属(Listeria(sp.))、 结核分枝杆菌(Mycobacterium tuberculosis)、立克次氏体(Rickettsia (全部型))、埃里希氏体(Ehrlichia)、衣原体(Chylamida)。可由本发 明方法靶向的细菌的其它实例包括结核分枝杆菌(M.tuberculosis)、 牛分枝杆菌(M.bovis)、牛分枝杆菌BCG菌株、BCG亚株、鸟分枝杆菌 (M.avium)、胞内分枝杆菌(M.intracellular)、非洲分枝杆菌(M. africanum)、堪萨斯分枝杆菌(M.kansasii)、瘰疬分枝杆菌(M. marinum)、溃疡分枝杆菌(M.ulcerans)、鸟分枝杆菌副结核亚种(M. avium subspecies paratuberculosis)、星状诺卡氏菌(Nocardia asteroides)、其它诺卡氏菌种、侵
肺军团菌(Legionella pneumophila)、 其它军团菌种、伤寒沙门氏菌(Salmonella typhi)、其它沙门氏菌种、 志贺氏菌种、鼠疫耶尔森氏菌(Yersinia pestis)、溶血巴斯德氏菌 (Pasteurella haemolytica)、多杀巴斯德氏菌(Pasteurella multocida)、其它巴斯德氏菌种、大叶性肺炎放线杆菌(Actinobacillus pleuropneumoniae)、单核细胞增生利斯特氏菌(Listeria monocytogenes)、伊氏利斯特氏菌(Listeria ivanovii)、流产布鲁氏 菌(Brucella abortus)、其它布鲁氏菌种、反刍类考德里氏体(Cowdria ruminantium)、肺炎衣原体(Chlamydia pneumoniae)、砂眼衣原体 (Chlamydia trachomatis)、鹦鹉热衣原体(Chlamydia psittaci)、伯 氏考克斯氏体(Coxiella burnetii)、其它立克次氏体种、埃里希氏体 (Ehrlichia)种、金黄色葡萄球菌(Staphylococcus aureus)、表皮葡 萄球菌(Staphylococcus epidermidis)、酿脓链球菌(Streptococcus pyogenes)、无乳链球菌(Streptococcus agalactiae)、炭疽芽孢杆菌 (Bacillus anthracis)、大肠埃希氏菌(Escherichia coli)、霍乱弧 菌(Vibrio cholerae)、弯曲杆菌属(Campylobacter)种、脑膜炎奈瑟 氏球菌(Neiserria meningitidis)、淋病奈瑟氏球菌(Neiserria gonorrhea)、铜绿假单胞菌(Pseudomonas aeruginosa)、其它假单胞菌 属(Pseudomonas)种、流感嗜血菌(Haemophilus influenzae)、杜氏 嗜血菌(Haemophilus ducreyi)、其它嗜血菌属(Hemophilus)种、破 伤
风梭菌(Clostridium tetani)、其它梭菌属(Clostridium)种、小 肠结肠炎耶尔森氏菌(Yersinia enterolitica)和其它耶尔森氏菌属种。
已发现的对一种细菌有效的抗菌剂对其它细菌特别是来自同一科的 细菌也可能有效。因此,可使用本发明的方法对针对某种细菌鉴定得到 的抗菌剂就其针对其它细菌的抗菌活性进行测试。
本发明的方法还可用于评价寄生物感染或鉴定抗寄生物药剂。具体 而言,可使用相同的方法,只是将细胞与病毒接触替换为将细胞与寄生 物接触。因此,本发明提供了一种鉴定抗寄生物药剂的方法,包括a)将 所述药剂给予含有表1所列细胞基因的细胞,b)检测由细胞基因产生的 基因产物的水平和/或活性,基因产物和/或基因产物活性的减少或消失 可表明化合物具有抗寄生物活性。
本发明还提供了一种鉴定抗寄生物药剂的方法,包括a)将药剂给 予含有表1所列细胞基因的细胞,b)使细胞与寄生物相接触,c)检测 寄生物感染的水平;并d)将寄生物感染水平与表1中基因的表达水平或 表1中基因编码的蛋白质的活性相关联,寄生物感染的减轻或消失与基 因表达和/或活性的减少或消失相关就表明所述药剂为抗寄生物药剂。
寄生物的实例包括但不限于下列寄生物: 隐孢子虫属 (Cryptosporidium)、疟原虫(Plasmodium)(所有种)、美洲锥虫 (American trypanosomes)(克氏锥虫,T cruzi)。另外,本发明方法 中考虑到的
原生动物和真菌属种的实例包括但不限于镰状疟原虫 (Plasmodium falciparum)、其它疟原虫属(Plasmodium)种、鼠弓形 体(Toxoplasma gondii)、卡氏肺囊虫(Pneumocystis carinii),克 氏锥虫(Trypanosoma cruzi)、其它锥虫属(trypanosomal)种、杜氏 利什曼原虫(Leishmania tdonovani)、其它利氏曼原虫属(Leishmania) 种、环形泰勒虫(Theileria annulata)、其它泰勒虫属(Theileria) 种、柔嫩
艾美
耳球虫(Eimeria tenella)、其它艾美耳球虫属种(Eimeria species)、荚膜组织胞浆菌(Histoplasma capsulatum)、新型隐球菌 (Cryptococcus neoformans)、皮炎芽生菌(Blastomyces dermatitidis)、粗球孢子菌(Coccidioides immitis)、巴西副球孢子 菌(Paracoccidioides brasiliensis)、马尔尼菲青霉(Penicillium marneffei)和念珠菌属种(Candida species)。
已发现的对一种寄生物有效的抗寄生物药剂对其它寄生物特别是来 自同一科的寄生物也可能有效。因此,可使用本发明的方法对针对一种 寄生物鉴定得到的抗寄生物药剂就其针对其它寄生物的抗寄生物活性进 行测试。
在上述方法中,在将含有表1所列细胞基因的细胞与药剂接触后, 就可将感染水平与基因表达和/或活性水平相关联,由此与基因表达和/ 或活性的减少或消失相关的感染的减弱或消失就表明了该药剂可有效对 抗病原体。这些方法可用来评价药剂对细菌感染的影响、抗病毒感染作 用、抗真菌感染作用、抗寄生物感染作用等。例如,可在给予抑制表1 所述基因的表达的siRNA后,测量细胞中的病毒感染水平。若病毒感染 减轻,则siRNA为有效的抗病毒药剂。病毒感染的水平可通过测量抗原 或与具体病毒感染相关的其它产物(例如针对HIV感染的p24)进行评价。 若给予针对表1所述基因的siRNA后,p24的水平降低,则靶向该基因的 siRNA为针对HIV的有效抗病毒药剂。病毒感染的水平还可通过实时定量 反转录聚合酶链式反应(RT-PCR)分析进行测量(参见例如Payungporn et al.″Single step multiplex real-time RT-PCR for H5N1 influenza A virus detection.″J Virol Methods.Sep 22,2005;Landolt et la. ″Use of real-time reverse transcr iptase polymerase chain reaction assay and cell culture methods for detection of swine influenza A viruses″Am J Vet Res.2005 Jan;66(1):119-24)。
同样,给予化学品、小分子、药物、蛋白质、cDNA、抗体、morpholino、 反义RNA、核酶或任何其它化合物后,细胞内的病毒感染水平还可使用上 述方法以及本领域已知的方法进行测量。若病毒感染减轻,则该化学品、 小分子、药物、蛋白质、cDNA、抗体、morpholino、反义RNA、核酶或任 何其它化合物是有效的抗病毒药剂。其它类型的感染如细菌感染、真菌 感染和寄生物感染的水平可用类似的方法来测量。
已发现的对一种病毒有效的抗病毒药剂对其它病毒特别是来至同一 科的病毒也可能是有效的。然而,还考虑到了已发现的对HIV有效的药 剂也
对流感病毒或禽流感病毒或任何其它病毒也可能是有效的。因此, 可使用本发明的方法对针对一种病毒鉴定得到的抗病毒药剂就其针对其 它病毒的抗病毒活性进行测试。通过任何标准方法例如通过用特异性针 对该蛋白质的抗体进行检测可测量基因产物的水平。可将本文所述核酸 及其片段可用作引物,并通过常规扩增技术来扩增核酸序列例如表1所 述基因之一的基因转录物。例如,使用自细胞分离得到的RNA,通过RT-PCR 对基因转录物的表达进行定量。各种PCR技术为本领域的技术人员所熟 知。对PCR技术的综述,可参见White(1997)和名为“PCR Methods and Applications”(1991,Cold Spring Harbor Laboratory Press)的出版 物,就扩增方法通过援引将其全文纳入本文。在这其中的每种PCR方法 中,将有待扩增的核酸序列的任一侧PCR引物与dNTP和热稳定聚合酶例 如Taq聚合酶、Pfu聚合酶或Vent聚合酶一起加至恰当制备的核酸样本 中。将样本中的核酸变性,随后PCR引物特异地杂交至样本中的互补核 酸序列。使杂交的引物延伸。然后开始另一个变性、杂交和延伸的循环。 多次重复该循环以产生在引物位置之间含有核酸序列的扩增片段。PCR 在一些专利中已有进一步的描述,这些专利包括美国专利4,683,195、 4,683,202和4,965,188。上述每篇出版物均就PCR方法通过援引将其全 文纳入本文。本领域的技术人员应知道如何设计和合成可扩增表1所述 任意核酸序列或其片段的引物。
扩增反应中可含有检测标记。合适的标记包括荧光团如异硫氰酸荧 光素(FITC)、罗丹明、德克萨斯红、藻红蛋白、别藻蓝蛋白、6-羧基荧 光素(6-FAM)、2’,7’-二甲氧基-4’,5’-二氯-6-羧基荧光素(JOE)、6-羧基 -X-罗丹明(ROX),6-羧基-2’,4’,7’,4,7-六氯荧光素(HEX)、5-羧基荧光 素(5-FAM)或N,N,N’,N’-四甲基-6-羧基罗丹明(TAMRA);
放射性标记如 32P、35S、3H等。标记可为两级系统,其中扩增得到的DNA与具有例如抗 生物素蛋白、特异性抗体等高亲和结合伴侣的生物素、半抗原等缀合, 其中结合伴侣与检测标记缀合。标记可与一种或两种引物缀合。或者, 对扩增中所使用的核苷酸混合物进行标记,以此将标记引入扩增产物中。
样本核酸例如扩增得到的片段可由本领域已知的多种方法之一进行 分析。核酸可通过双脱氧法或其它方法进行测序。还可使用通过Southern 印迹、点印迹等进行的序列杂交来测定序列是否存在。
本发明的基因和核酸还可用于多核苷酸阵列中。多核苷酸阵列提供 了一种高通量技术,这种高通量技术可分析单个样本中大量的多核苷酸 序列。例如,该技术可用于鉴定与对照样本相比表1所述核酸表达有所 减少的样本。该技术还可用于测定表1所述核酸表达减少的效果。通过 这种方式,本领域的技术人员可鉴定出表1所述核酸表达减少后得到上 调或下调的基因。同样,本领域的技术人员可鉴定出表1所述核酸表达 增加后得到上调或下调的基因。通过这种方式,可鉴定出作为治疗靶标 的其它基因,所述治疗例如抗病毒治疗、抗细菌治疗、抗寄生物治疗或 抗真菌治疗。
为制备阵列,可将单链多核苷酸探针点样至二维矩阵或阵列形式的 基质上。每个单链多核苷酸探针可包括选自表1以GeneBank编号形式述 及的核苷酸序列的至少6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、25或30或更多个连续核苷酸。
阵列还可为含有表1所述一种或多种基因的不同多态等位基因的探 针的微阵列。若一个受试者群体中存在一个核酸序列的两种或多种形式 则就存在多态性。例如,多态核酸可为其中最常见等位基因
频率为99% 或少于99%的核酸。不同的等位基因可根据核酸序列中的差异进行鉴定, 在多于1%的群体中(这是定义多态性时通常接受的频率)出现的遗传变 异对于某些应用而言是有用的多态性。
等位基因频率(特定类型群体中所有等位基因核酸的比例)可通过 对群体中等位基因的直接计数或估计数目以及群体中等位基因的类型来 确定。多态性以及测定等位基因频率的方法叙述于Hartl,D.L.and Clark,A.G.,Principles of Population Genetics,Third Edition (Sinauer Associates,Inc.,Sunderland Massachusetts,1997),特 别是第一章和第二章。
这些微阵列可用于检测来自受试者的样本中的多态性等位基因。这 些等位基因可表明受试者对病毒感染是更易感还是对病毒感染不易感。 例如,由于本发明表明表1所述任何基因的破坏都可导致病毒感染减轻, 因此这种微阵列可用于检测使得基因表达减少和/或基因产物的活性减 弱的表1所述基因的多态形式,由此鉴定对病毒感染不易感的受试者。
基质可为多核苷酸探针可附着其上的任何基质,包括但不限于玻璃、
硝酸纤维素、
硅和尼龙。多核苷酸探针可通过共价键或通过非特异性相 互作用如疏水性相互作用结合到基质上。构建阵列的技术以及使用这些 阵列的方法描述于EP No.0 799 897、PCT No.WO97/29212、PCT No.WO 97/27317、EP No.0 785 280、PCT No.WO97/02357、U.S.Pat. No.5,593,839、5,578,832、EP No.0 728 520、U.S.Pat.No.5,599,695、 EP No.0 721 016、U.S.Pat.No.5,556,752、PCT No.WO95/22058和U.S. Pat.No.5,631,734。还可使用可商购的多核苷酸阵列例如Affymetrix GeneChip.TM.。使用GeneChip.TM来检测基因表达描述于例如Lockhart et al.,Nature Biotechnology 14:1675(1996);Chee et al.,Science 274:610(1996);Hacia et al.,Nature Genetics 14:441,1996;和 Kozal et al.,Nature Medicine 2:753,1996。
可将基因产物的水平与未与化合物接触的对照细胞中的基因产物的 水平相比较。可将基因产物的水平与加入化合物前相同细胞中的基因产 物的水平相比较。活性或功能可通过任何标准方法测量,所述任何标准 方法例如测量底物转
化成产物的酶分析或者测量蛋白质与核酸结合的结 合分析。
另外,基因的调控区域可功能性连接至报告基因,并就对报告基因 的抑制作用对化合物进行筛选。这种调控区域可与基因组序列分离,并 可通过任何观察到的呈现物种的调控区域特征的特征,以及可通过它们 与基因编码区的起始密码子的关系得到鉴定。本文所使用的报告基因编 码报告蛋白质。报告蛋白质为表达时可被特异性检测的任何蛋白质。报 告蛋白质可用于检测或定量表达序列的表达情况。很多报告蛋白质为本 领域的技术人员已知。这些报告蛋白质包括但不限于产生特异性可检测 产物的β-半乳糖苷酶、萤光素酶和碱性磷酸酶。还可使用荧光报告蛋白 质例如绿色荧光蛋白(GFP)、蓝绿色荧光蛋白(CFP)、红色荧光蛋白(RFP) 和黄色荧光蛋白(YFP)。
病毒感染还可通过以细胞为
基础的分析进行测量。简而言之,用所 需病原体感染细胞(20000至2500000个),然后连续培养3-7天。可以 在用病原体感染之前、期间或之后将抗病毒药剂施用至细胞。给予的病 毒和药剂的量可由本领域的技术人员确定。在某些实例中,可给予几种 不同剂量的潜在治疗剂来确定最佳剂量范围。转染之后进行分析来测定 不同药剂引起的细胞对感染的抗性。
例如,若分析病毒感染,病毒抗原是否存在可通过使用特异性针对 病毒蛋白质的抗体并随后检测该抗体来进行测量。在一个实例中,特异 性结合病毒蛋白质的抗体被例如可检测标记如荧光团标记。在另一实例 中,抗体可通过使用含有标记的二抗检测。然后使
用例如
显微镜、流式 细胞术和ELISA检测是否存在结合抗体。
或者,另外,细胞经历病毒感染后存活的能力可例如通过进行细胞 活力分析例如台盼蓝排除试验测定。
细胞中的表1所列蛋白质的量可通过本领域对细胞中的蛋白质进行 定量的标准方法,以及现在已知的或随后将被开发用来对细胞中的蛋白 质或由细胞产生的蛋白质进行定量的任何其它方法测定,所述标准方法 例如Westerr印迹、ELISA、ELISPOT、免疫沉淀、免疫荧光(例如FACS)、 免疫组织化学、免疫细胞化学等。
细胞中的表1所列核酸的量可通过本领域用于对细胞中的核酸进行 定量的标准方法测定,以及通过现在已知的或随后将被开发用来对细胞 中的核酸进行定量的任何其它方法测定,所述标准方法例如为原位杂交、 定量PCR、RT-PCR、Taqman分析、Northern印迹、ELISPOT、点印迹等。
可在动物模型中对抗病毒药剂预防或减轻病毒例如HIV、Ebola、A 型流感病毒、SARS、天花病毒等感染的能力进行评价。几种用于病毒感 染的动物模型为本领域已知。例如,小鼠HIV模型公开于Sutton et al. (Res.Initiat Treat.Action,8:22-4,2003)和Pincus et al.(AIDS Res.Hum.Retroviruses 19:901-8,2003);Ebola感染的豚鼠模型公 开于Parren et al.(J.Virol.76:6408-12,2002)和Xu et al.(Nat. Med.4:37-42,1998);流感感染的食蟹猴(Macaca fascicularis)模 型公开于Kuiken et al.(Vet.Pathol.40:304-10,2003)。这些动物 模型还可用来测试药剂缓解与病毒感染相关症状的能力。另外,这些动 物模型可用来测定对受试动物的LD50和ED50,并且这些数据可用来确定 潜在药剂在体内的效力。动物模型还可用来评价抗细菌药剂、抗真菌药 剂和抗寄生物药剂。
如若需要,任何物种的动物包括但不限于鸟、小鼠、大鼠、兔、豚 鼠、猪、小型猪(micro-pig)、山羊以及除人外的灵长类例如狒狒、猴 和猩猩可用来形成病毒感染、细菌感染、真菌感染或寄生物感染的动物 模型。
例如,对于病毒感染模型,可用所需病毒在有或没有抗病毒药剂存 在下对合适的动物接种。给予的病毒和药剂的量可由本领域的技术人员 确定。在某些实施例中,可将几种不同剂量的潜在治疗剂(例如抗病毒 药剂)给予不同测试受试者来鉴定最佳剂量范围。治疗剂可在病毒感染 之前、期间或之后给予。治疗之后,就恰当的病毒感染的发展情况和与 之相关的症状对动物进行观察。若药剂存在时,恰当的病毒感染的发展 有所减缓或者与之相关的症状有所缓解,则可提供证据表明该药剂为可 用来减轻甚或抑制受试者体内病毒感染的治疗剂。
本发明还提供了一种制备减轻感染的化合物的方法,包括:a)合成 化合物;b)将化合物给予含有表1所述细胞基因的细胞;c)将细胞与 感染性病原体相接触;c)检测感染水平;d)将感染水平与表1中基因 的表达水平或表1中基因编码的蛋白质的活性相关联,感染的减轻或消 失与基因表达和/或活性的减少或消失相关就表明制备得到了减轻感染 的化合物。
还提供了一种制备减轻感染的化合物的方法,包括:a)将化合物给 予含表1所述细胞基因的细胞,b)将细胞与感染病原体相接触;c)检 测感染水平;d)将感染水平与表1中基因的表达水平或表1中基因编码 的蛋白质的活性相关联,感染的减轻或消失与基因表达和/或活性的减少 或消失相关就表明化合物为减轻感染的化合物;以及e)将化合物置于可 药用载体内。减轻感染的化合物可为抗病毒化合物、抗细菌化合物、抗 真菌化合物或抗寄生物化合物或任何减轻感染物感染的化合物。
转基因细胞和非人类哺乳动物
包括重组和基因敲除动物在内的转基因动物模型可用本文所述宿主 核酸产生。示例性非人类转基因哺乳动物包括但不限于小鼠、兔、大鼠、 鸡、牛和猪。本发明提供了这样一种转基因非人类哺乳动物,它具有表1 所列一种或多种基因的基因敲除,并且对病原体例如病毒、细菌、真菌 和寄生物感染的敏感性降低。这种基因敲除动物可用来减少病毒从动物 到人的传播。在本发明的转基因动物中,表1所述一种或多种基因的一 个或两个等位基因可被敲除。
“敏感性降低“表示,与表1中基因的一个或两个等位基因没有被 基因敲除或功能性缺失的动物相比,动物不易被感染或动物所经历的病 原体感染有所减轻。动物不必对病原体具有完全的抗性。例如,与表1 所述基因没有功能性缺失的动物相比较,动物对病原体感染的敏感性可 降低10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或其间任何 百分比。另外,感染减轻或感染敏感性降低包括减少进入、复制、发病、 插入、溶解或病毒或其它病原体进入细胞或受试者的复制过程中的其它 步骤,或它们的组合。
因此,本发明提供了一种功能性缺失了表1所述一种或多种基因的 非人类转基因哺乳动物,其中哺乳动物对病原体如病毒、细菌、寄生物 或真菌感染的敏感性降低。功能性缺失为突变、部分或完全缺失、插入 或对基因序列进行的其它改变,这些功能性缺失抑制基因产物的产生或 使得基因产物功能不完全或丧失功能。
用于基因敲除或功能性缺失目的基因的序列的表达可受到恰当启动 子序列的调节。例如,组成型启动子可用来确保动物不表达功能性缺失 基因。相反,诱导型启动子可用于在转基因动物表达或不表达目的基因 时进行调控。示例性诱导型启动子包括组织特异性启动子和对特定刺激 物(如光、氧、化学品浓度等,如四环素诱导型启动子)做出反应或不 做出反应的启动子。
例如,具有被破坏的表1所述基因的转基因小鼠或其它转基因动物 可在暴露于不同病原体期间被检查。从比较数据可对病原体的生命周期 有所了解。另外,可制备不进行基因敲除时会对感染(例如流感)敏感 的基因敲除动物(如猪)来对抗感染,这归功于基因的破坏。若转基因 动物中基因的破坏使得对抗感染的抗性增加,则可繁殖这些转基因动物 来建立不易感染的动物群。
转基因动物包括制备和使用转基因动物的方法描述于多个专利和公 布文本中,例如WO01/43540、WO02/19811、U.S.Pub.No:2001-0044937 和2002-0066117以及U.S.Pat.No:5,859,308、6,281,408和6,376,743, 以及文中引用的参考文献。
本发明的转基因动物还包括例如通过采用SIRIUS-Cre系统产生的 条件基因敲减的动物,所述SIRIUS-Cre系统可将特异性敲减基因的 s iRNA、组织特异性表达的Cre-loxP和诱导表达的四环素-on结合起来。 这些动物可通过在四环素控制的条件下用含有组织特异性重组酶和目的 基因的特异性SiRNA的两个亲本品系进行交配产生。参见Chang et al. “Using siRNA Technique to Generate Transgenic Animals with Spatiotemporal and Conditional Gene Knockdown.”American Journal of Pathology 165:1535-1541(2004),就条件性基因敲减动物的产生, 通过援引将其全文纳入本文。
本发明还提供了含有有所改变或被破坏的表1所列基因的细胞,这 些细胞对病原体感染有抗性。这些细胞可为体外、离体或体内的细胞, 并且其一个或两个等位基因可发生变化。因此这类细胞包括对HIV感染、 Ebola感染、禽流感、A型流感病毒或本文所描述的任何其它病原体包括 细菌、寄生物和真菌的敏感性有所降低的细胞。
就感染抗性进行筛选
本文还提供了就感染抗性对受试宿主进行筛选的方法,所述方法通 过表征宿主核酸的核苷酸序列或宿主多肽的氨基酸序列(例如表1所示 的核苷酸序列或氨基酸序列)而进行。例如,可分离受试者的ANXA1核 酸,对其测序并与ANXA1的野生型序列进行比较。受试者ANXA1核酸与 野生型ANXA1序列之间的相似性越大,则该受试者对感染就越敏感,而 受试者ANXA1核酸与野生型ANXA1序列之间的相似性越小,则该受试者 对感染的抵抗力就越强。这种筛选可针对任何物种中的表1所述任何宿 主核酸或宿主多肽的氨基酸序列进行。
对群体遗传特征的评价可提供关于该群体对病毒感染的敏感性或抗 性的信息。例如,在特定人群例如特定城市或地理位置的人群中等位基 因的多态性分析可表明该群体对感染的易感程度。与表1所列野生型序 列基本相似的等位基因百分比越高,就表明该群体对感染越敏感,而与 表1所述野生型序列基本不同的大量多态性等位基因表明该群体对感染 的抵抗力更强。这种信息可用于对例如关于对易感群体进行接种作出公 共卫生决定。
本发明还提供了一种就表1所列基因的变体形式对细胞进行筛选的 方法。变体可为具有使得基因产物的量或活性发生变化的功能性缺失、 突变或基因发生改变的基因。可将这些含有表1所列基因的变体形式的 细胞与病原体相接触,来测定含有表1所列基因的天然存在的变体的细 胞是否在其感染抗性方面有所不同。例如,可就表1所列基因的变体形 式对动物例如鸡等的细胞进行筛选。若发现有天然存在的变体,并且在 其基因组中具有基因变体形式的鸡不易感染,则可选择性繁殖这些鸡来 建立具有感染抗性的鸡群。通过使用这些方法,可建立对抗禽流感的鸡 群。同样,可就表1所列基因的变体形式对其它动物进行筛选。若发现 有天然存在的变体,并且在其基因组中具有基因变体形式的动物不易感 染,则可选择性繁殖这些动物来建立具有感染抗性的群体。这些动物包 括但不限于猫、狗、家畜(例如牛、马、猪、绵羊、山羊等)、实验动物 (例如小鼠、兔、大鼠、沙土鼠、豚鼠等)和禽类(例如鸡群、鹅群、 火鸡群、鸭群、雉群、家鸽群、野鸽群等)。因此,本申请提供了具有表 1所列基因的天然存在变体的动物群,所述天然存在变体可使得对病毒感 染敏感性降低,由此提供对不易感染病毒的动物群。同样,若发现有天 然存在的变体,并且在其基因组中具有基因变体形式的动物对细菌、寄 生物或真菌感染不易感,则可选择性繁殖这些动物来建立对细菌、寄生 物或真菌具有感染抗性的群体。
抑制感染的方法
本发明还提供了一种抑制细胞中的感染的方法,包括抑制表1所列 基因或基因产物的表达或活性。如全文所述,感染可为病毒感染、细菌 感染、真菌感染或寄生物感染等等。抑制可出现在体外、离体或体内的 细胞中。表1的一种或多种基因的表达可被抑制。同样,表1所列一种 或多种基因产物的活性也可被抑制。对表达的抑制或减少不必是完全的, 因为这可从表达略有降低到表达完全消失。例如,与其中表1所列基因 表达未被抑制的对照细胞相比较,表达可被抑制约5%、10%、20%、30%、 40%、50%、60%、70%、80%、90%、95%、99%、100%或其间任何百分比。 同样,对基因产物的活性的抑制或降低不必是完全的,因为这可从基因 产物的活性略有降低到活性完全消失。例如,与其中表1所述基因产物 的活性未被抑制的对照细胞相比较,基因产物的活性可被抑制约5%、10%、 20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或其间任 何百分比。
反义寡核苷酸、RNAi分子、核酶和siRNA分子可用来干扰表达和/ 或降低基因产物的活性。小分子、药物、抗体、蛋白质和化学品也可用 来抑制表达和/或基因产物的活性。可以减少表1所述基因的表达和/或 基因产物的活性的反义寡核苷酸、RNAi分子、核酶、siRNA、小分子、化 学品、抗体蛋白质、cDNA和任何其它现已知的或今后将会被鉴定的化合 物均可单独使用,或与其它治疗剂例如抗病毒化合物、抗细菌药剂、抗 真菌剂、抗寄生物药剂、抗炎剂、抗癌剂等一起使用。
抗病毒化合物的实例包括但不限于用于治疗流感及其相关症状的金 刚烷胺、金刚乙胺、扎那米韦和奥塞米韦(达菲)。用于治疗HIV的抗病 毒化合物包括双汰芝_(拉米夫定-齐多夫定)、佳息患_(茚地那韦)、 Emtriva_(恩曲他滨)、Epivir_(拉米夫定)、沙奎那韦软凝胶剂_(沙奎那 韦-sg)、Hivid_(扎西他滨)、Invirase_(沙奎那韦-hg)、Kaletra_(洛匹 那韦-利托那韦)、LexivaTM(福沙那韦)、诺韦_(利托那韦)、Retrovir_(齐 多夫定)、Sustiva_(依法韦仑)、惠妥滋EC_(去羟肌苷)、惠妥滋_(去羟 肌苷)、Viracept_(奈非那韦)、维乐命_(奈韦拉平)、赛瑞特_(司他夫定)、 赛进_(阿巴卡韦)、Fuzeon_(恩夫韦地)、Rescriptor_(地拉韦啶)、 Reyataz_(阿扎那韦)、三协唯_(阿巴卡韦-拉米夫定-齐多夫定)、 Viread_(替诺福韦延胡索酸双异丙酰氧基甲酯)和Agenerase_(安泼那 韦)。其它用于治疗Ebola和其它纤丝病毒的抗病毒化合物包括利巴韦林 和蓝藻菌病毒素-N(cyanovirin-N,CV-N)。对于疱疹病毒的治疗可用舒 维疗_(阿昔洛韦)。抗细菌药剂包括但不限于抗生素(例如青霉素和氨苄 青霉素)、磺胺药物和叶酸类似物、β-内酰胺、氨基糖苷类、四环素、 大环内酯、林可酰胺、链阳性菌素、氟喹诺
酮类、利福平、莫匹罗星、 环丝氨酸、氨基环多醇和噁唑烷酮类。
抗真菌药剂包括但不限于两性霉素、制霉菌素、特比
萘芬、伊曲康 唑、氟康唑、酮康唑、灰黄菌素。
抗寄生物药剂包括但不限于驱肠虫药、驱线虫药、驱扁虫药 (antiplatyhelmintic agent)、抗原生动物药、杀阿米巴药、抗疟药、 抗毛滴虫药、aoccidiostats和杀锥虫药。
本发明提供了一种减轻或抑制受试者感染的方法,包括给予受试者 一定量抑制表1的基因或基因产物的表达或活性的组合物。如全文所述, 感染可来自任何病原体,例如病毒、细菌、真菌或寄生物。对感染的减 轻或抑制不必是完全的,因为这可从感染略微减轻到感染完全消除。例 如,在本文所述方法中,感染可减轻10%、20%、30%、40%、50%、60%、 70%、80%、90%、95%、100%或其间的任何百分比。这种减轻可导致感染 引起症状的缓解至感染彻底消除。但是,对于减轻或抑制受试者的感染, 只要有效地减轻感染相关症状或有效地使得受试者对感染不易感就可以 了,并不一定要使感染彻底消除。
全文所使用的预防感染指的是抑制感染的发展。在提及治疗时,它 是指缓解与感染相关的
疾病或病理状态的征候或症状,例如抑制或减轻 病毒感染,而并不需要
完全缓解症状或感染。
本发明还提供了一种减轻或抑制受试者感染的方法,包括离体条件 下在所
选定的来自受试者的细胞中,将表1所列基因突变成不能产生该 基因的功能性基因产物的突变基因,或将表1所列基因突变成产生的该 基因的功能性基因产物的量有所降低的突变基因,然后替换受试者体内 的细胞,由此减轻受试者体内的细胞感染。
任何可被病毒或其它病原体例如细菌、真菌或寄生物感染的细胞均 在本发明考虑范围之内。宿主细胞可为原核细胞或真核细胞如来自昆虫、 甲壳动物、哺乳动物、鸟、爬行动物、酵母或细菌如大肠埃希氏菌等的 细胞。示例性宿主细胞包括但不限于:哺乳动物的B淋巴细胞、造血细 胞、胚胎干细胞、胚胎生殖谱系细胞、多能干细胞和全能干细胞。
例如,易感染或遭受了感染的受试者可用
治疗有效量的反义寡核苷 酸、RNAi分子、核酶或siRNA分子(或它们的组合)治疗。反义寡核苷 酸、RNAi分子、核酶或siRNA分子起效(观察到病毒感染水平降低,或 者病毒感染相关症状减轻)后,例如24-48小时后,可就病毒感染相关 症状对受试者进行监控。
同样,其它药剂例如可与表1的宿主蛋白质相互作用的抗体、多肽、 小分子或其它药物也可用于减轻病毒感染。这种相互作用可以是直接的, 例如与宿主蛋白质相结合,也可为间接的,例如与和表1所述宿主蛋白 质相互作用的蛋白质相结合或对其进行调节。抗体、多肽、小分子或其 它药物起效(观察到病毒感染水平降低,或者病毒感染相关症状减轻) 后,例如24-48小时后,可就病毒感染相关症状对受试者进行监控。还 可给予受试者治疗有效量的其它药剂例如肽和有机分子或无机分子。
本文所公开的治疗方法还可以预防方式用于例如抑制或预防感染例 如病毒感染、细菌感染、真菌感染或寄生物感染。在已表明治疗方法可 用于治疗或预防病变的情况下需要这种
给药。在已知的或疑似的正发展 为感染相关病症中,需要这种预防应用。
在某些情况下,某些基因由于本发明方法的反转录病毒的插入而受 到破坏,会导致基因产物的过表达,并且这种过表达抑制了病毒复制。 例如,一旦破坏了含有CTCF的序列的基因组基因座,就会导致IGF2的 过表达,由此减少病毒复制。因此,本发明提供了一种通过使可减少病 毒复制的基因过表达来减少或抑制病毒复制的方法。本发明方法还提供 了一种增加基因表达的方法,所述基因的过表达可通过破坏一种基因或 抑制一种基因的基因产物来减少病毒复制,由此可增加基因表达,而该 基因的过表达使病毒复制减少。例如,可抑制CTCF来增加IGF2的表达。 这对任何已被发现的可增加另一种基因的表达的基因而言是相似的,并 且这会使得病毒复制减少。
一旦发现某种基因被破坏就会导致另一种基因的过表达,则该过表 达基因可直接被调节,即通过该过表达基因直接调节,或者也可间接被 调节,即通过最初被破坏的基因(或其基因产物)或通过另一种与过表 达基因相关的基因(或其基因产物)间接调节。
因此,本发明提供了一种鉴定出可增加基因的表达和/或基因产物的 活性的药剂的方法,包括将细胞与药剂相接触并测量基因表达和/或基因 产物的活性的增加。
本发明还提供了一种鉴定通过基因的过表达和/或基因产物活性的 增加来减轻或抑制感染的药剂的方法,包括将药剂给予细胞,使细胞与 病原体相接触,并将基因表达和/或该基因产物活性的增加与感染水平相 关联,这样与感染减轻相伴随的基因表达和/或基因产物活性的增加可表 明药剂是通过基因的过表达和/或基因产物的活性增加来抑制病原体感 染。
例如,本领域的技术人员可给予可引起IGF2过表达的化合物。该化 合物可与IGF2基因、IGF2 mRNA、IGF2蛋白质或其片段相互作用。人IGF2 基因及其相关序列的信息可参见Entrez基因编号3481。该化合物还可与 CTCF基因、CTCF mRNA、CTCF蛋白质或其片段相互作用来增加IGF2表达。 该化合物还可与参与IGF2途径的其它基因、mRNA或蛋白质相互作用,使 得IGF2表达增加。
因此,若基因X的破坏引起基因Y的过表达,则过表达的基因(Y) 可被直接调节,即通过过表达的基因(Y)直接调节,也可被间接调节, 即通过最初被破坏的基因(X)(或其基因产物)或通过另一种与过表达 基因(Y)相关的基因(或其基因产物)间接调节。例如,本领域的技术 人员可给予可引起Y过表达的化合物。该化合物可与Y基因、Y mRNA或 Y蛋白质相互作用。该化合物还可与X基因、X mRNA或X蛋白质相互作 用来增加Y表达。该化合物还可与参与Y基因途径(即基因Y参与的细 胞途径)的其它基因、mRNA或蛋白质相互作用,使得Y表达提高。
药物组合物和给药方式
已知有多种用于给予本文公开的治疗剂的送递系统,这些送递系统 包括以脂质体、微粒、微囊形式的胶囊化、由重组细胞表达、受体介导 的胞吞作用(Wu and Wu,J.Biol.Chem.1987,262:4429-32)以及将 治疗核酸构建为反转录病毒载体或其它载体的一部分。引入方法包括但 不限于粘膜、局部、真皮内、肌内、腹膜内、
阴道、直肠、静脉内、皮 下、鼻内和口服途径。化合物可通过任何便利途径例如通过输注或推注 注射、通过上皮或粘膜被覆层(例如
口腔粘膜、直肠、阴道或肠粘膜等) 吸收给药,并且可与其它具有生物活性的药剂一起给药。给药可为全身 给药或局部给药。药物组合物可例如通过局部施用或局部注射而局部送 递至需要治疗的区域。
公开的药物组合物可包括单独的治疗有效量的RNA、DNA、反义分子、 核酶、siRNA、分子、药物、蛋白质、抗体或其它治疗剂,或者还可包括 和可药用载体一起的上述物质。另外,药物组合物或治疗方法可与其它 治疗方法例如其它抗病毒药剂、抗细菌药剂、抗真菌药剂和抗寄生物药 剂一起(例如之前、期间或之后)给予或进行。
送递系统
本文所使用的可药用载体是常规的。Remington’s Pharmaceutical Sciences,by Martin,Mack Publishing Co.,Easton,PA,15th Edition (1975)中描述了适用于本文公开的治疗剂的药物送递的组合物和制剂。 通常,载体的性质要根据所采用的给药方式而定。例如,胃肠外制剂通 常包括可注射的
流体,所述流体包括药学和生理学上可接受的、作为载 体的流体例如水、生理盐水、平衡盐溶液、
葡萄糖水溶液、麻油、丙三 醇、
乙醇、或它们的组合等。载体和组合物可为无菌的,并且制剂与给 药方式相适应。除了生物学上中性的载体外,待给药的药物组合物可含 有少量的无毒辅助性物质例如润湿剂或乳化剂、
防腐剂和pH缓冲剂等, 例如
醋酸钠或脱水山梨醇单月桂酸酯。
组合物可为液体溶液、悬浮剂、乳剂、片剂、丸剂、胶囊、缓释制 剂或粉剂。对于固体组合物(例如粉剂、丸剂、片剂或胶囊形式)而言, 常规无毒固体载体可包括例如药用级甘露醇、乳糖、
淀粉、糖精钠、纤 维素、碳酸镁或
硬脂酸镁。组合物可用常规
粘合剂和载体如甘油三酯制 备成栓剂。
本领域的技术人员应知晓,所公开的包括药剂在内的实施方案可由 常规药用载体、佐剂和抗衡离子制备得到。
有效减轻或抑制感染的治疗剂的量取决于病原体的性质及其引起的 病变或病症,并且可用标准的临床技术确定。因此,这些量会随病毒、 细菌、真菌、寄生物或其它病原体的类型发生变化。另外,可采用体外 分析来确定最佳剂量范围。制剂中采用的精确剂量还取决于给药途径和 疾病或病变的严重程度,并应该根据技术人员的判断和每名受试者的情 况确定。有效剂量可从来源于体外测试系统或动物模型测试系统的剂量- 反应曲线推知。
本公开还提供了药包或药盒,它包括一个或多个装有药物组合物的 一种或多种成分的容器。任选地,该容器还配有一份公告,该公告的形 式是由管理药物或生物产品的制造、使用或销售的政府部门所规定的形 式,该公告表明该药物组合物得到了人类用药的制造、使用或销售的管 理部门的批准。还可包括组合物的使用说明。
在采用核酸例如反义或siRNA分子来减轻感染例如病毒感染的一个 实例中,核酸可通过如下方式送递:通过细胞内送递(例如通过核酸载 体的表达或通过受体介导机制);或通过给予至细胞内的恰当核酸表达载 体,例如通过使用反转录病毒载体(参见美国专利No.4,980,286);或 通过直接注射;或通过使用微粒轰击(例如基因枪;Biolistic,Dupont); 或用脂质或细胞表面受体或转染剂包被;或通过将其与同源框样肽 (homeobox-like peptide)相连接给予,已知该同源框样肽可进入细胞 核(例如Joliot et al,Proc.Natl.Acad.ScL USA 1991,88:1864-8)。 本公开包括所有形式的核酸送递,包括合成的Oligo、裸DNA、质粒和病 毒送递(不论是否整合至基因组)。
如上所述,载体送递可借助病毒系统例如可
包装重组反转录病毒基 因组的反转录病毒载体系统(参见例如Pastan et al.,Proc.Natl.Acad. SciU.S.A.85:4486,1988;Miller et al.,MoI.Cell.Biol.6:2895, 1986)。然后重组反转录病毒可用来感染并由此将核酸例如反义分子或 siRNA送递至感染细胞。当然,将发生变化的核酸引入哺乳动物细胞的具 体方法并不限于使用反转录病毒载体。该方法可广泛采用其它技术,包 括如下载体的使用:腺病毒载体(Mitani et al.,Hum.Gene Ther.5:941 -948,1994)、腺伴随病毒(AAV)载体(Goodman et al.,Blood 84: 1492-1500,1994)、慢病毒载体(Naidini et al.,Science 272:263-267, 1996)和假型反转录病毒载体(Agrawal et al.,Exper.Hematol.24:7 38-747,1996)。还可使用其它非病原体载体系统例如
泡沫病毒载体(Park et al.″Inhibition of simian immunodeficiency virus by foamy virus vectors expressing siRNAs.″Virology.2005 Sep 20)。还可通过载 体送递系统来送递短发夹RNA(shRNA),目的是抑制基因表达(参见 Pichler et al.″In vivo RNA interference-mediated ablation of MDR1 P-glycoprotein.″Clin Cancer Res.2005 Jun 15;11(12):4487-94;Lee et al.″Specific inhibition of HIV-I replication by short hairpin RNAs targeting human cyclin T1 without inducing apoptosis.″FEBS Lett.2005 Jun 6;579(14):3100-6.)。
还可使用物理转导技术例如脂质体送递和受体介导的胞吞机制以及 其它胞吞机制(参见例如Schwartzenberger et al.,Blood 87:472-478, 1996)等实例。本发明可与任意上述或其它常用基因转移方法一起使用。
本申请通篇引用了多篇出版物。这些出版物的公开内容通过援引全 文纳入本申请,目的是为了充分描述与本发明相关的
现有技术。
对于本领域的技术人员而言显而易见的是,在不背离本发明的范围 或精神的条件下,本发明可有多种
修改和改变。通过考虑在此公开的本 发明的说明书及其实施,本发明的其它实施方案对于本领域的技术人员 是显而易见的。说明书和实施例仅旨在示例,而本发明的真实范围和精 神由下面的权利要求书指明。
实施例
病毒为在其生命周期中的不同阶段均依赖于宿主细胞专性细胞内寄 生物。病毒感染和/或细胞杀伤所需的细胞基因的特征对理解病毒生命周 期很重要,并且可为新的抗病毒治疗方法提供细胞靶标。
溶解性反转录病毒感染所需的候选基因可由标记序列诱变法鉴定, 这是一种可快速鉴定基因捕获所破坏的基因的方法。从含有2×105个独 立的被破坏基因的细胞文库中筛选出了一百五十一个反转录抗性克隆, 其中有111个克隆在先前表征的基因和功能未知的转录单位中含有突变。 总而言之,与反转录病毒抗性相关的基因不同于被随机基因捕获靶中的 基因,表现在已知突变热点未被充分表示出来,并且很多突变似乎集中 在特定细胞过程中,包括:IGF-II表达/信号传导、囊泡转运/细胞骨架 运输和细胞凋亡。
标记序列诱变法提供了一种在基因组范围内快速鉴定病毒感染所需 候选细胞基因的方法。
细胞基因可能参与病毒生命周期的全部阶段,包括附着至细胞受体、 内化、分解、mRNA的翻译、组装和脱离细胞[1]。不同细胞类型对病毒感 染的敏感性大不相同,并且感染后期经常会出现病毒抗性细胞[2-4]。这 表明遗传决定因子会影响对病毒生命周期有贡献的宿主细胞。尽管有影 响病毒感染的
哺乳动物基因的实例,但是由于缺乏对培养细胞进行遗传 分析的实用方法,使得对这类基因的鉴定受到阻碍。本研究中,不论标 记序列诱变法——一种广泛用于对小鼠胚胎干细胞中的基因进行突变的 基因捕获方法[5-10]——是否被用来鉴定反转录病毒引起的溶解性感染 所必需的候选细胞基因,均对在
细胞质中复制的小型溶细胞RNA病毒进 行测试。由于哺乳动物反转录病毒能够优先在增殖细胞和未分化细胞中 复制,它们可作为病毒-宿主细胞相互作用的有用模型[3]。
基因捕获为在小鼠的研究中评价得到的最初在胚胎干细胞中诱导突 变的有效突变剂。
体细胞中,该方法假定基因捕获法引起的功能丧失突 变由于基因剂量效应(例如单剂量不足)、已有的杂合性或杂合性的丧失 可赋予反转录病毒抗性。在用U3NeoSV1反转录病毒基因捕获穿梭载体感 染后,分离经诱变得到的大鼠肠上皮(RIE)-1细胞克隆的文库,其中每 个克隆含有被原病毒整合所破坏的单个基因[6]。用1型反转录病毒感染 捕获文库,还可在针对不存在细胞突变时表现出病毒抗性的持续感染细 胞(PI)出现进行选择的条件下筛选抗病毒克隆[4]。通过对与捕获载体 毗邻的基因组DNA区域进行测序,鉴定了总共151种抗反转录病毒细胞 中的被破坏的基因[6];其中,有111种在之前表征的基因和未知转录单 位中含有突变。
抗反转录病毒的克隆从捕获文库中选出的频率较从未诱变细胞中选 出的频率要高,表明抗反转录病毒表型是由基因捕获诱变引起的。但是 在任何
遗传筛选中,具有所选择表型的克隆都可能是由于自发突变产生 的,因此需要其它实验来证明基因捕获所破坏的个体基因实际上对抗反 转录病毒表型有贡献。例如,胰岛素生长因子II(IGF-II)的转录阻遏 物Ctcf的突变是与影响IGF-II表达和/或信号传导的反转录病毒抗性相 关的4种突变之一。随后的实验表明增强的IGF-II表达足以赋予高水平 的反转录病毒抗性[4]。简而言之,在一系列抗反转录病毒克隆中通过标 记序列诱变共同鉴定的基因为对参与病毒生命周期的细胞过程的机制研 究提供了候选物。由于被破坏的基因并不会对细胞存活有不利影响,因 此,抑制由这些基因编码的蛋白质的药物预计不会对细胞产生明显的毒 性。因此,候选基因还可包括新的抗病毒治疗的靶标。
RIE-1、L-细胞和病毒:
1型反转录病毒毒株Lang最初获自Bernard N.Fields。病毒在L- 细胞中传代,并在先前已有描述的CsC1梯度溶液中对第三代毒株进行纯 化并将其用于这些实验[59]。为开发PI细胞系,用1型反转录病毒感染 RIE-1细胞,感染复数(MOI)为5,存活细胞在达尔伯克(氏)改良伊格 尔(氏)培养基(DMEM)(Irvine Scientific,Santa Ana,CA,USA)中培 养。表达作为即刻早期基因的报告基因lacZ的单纯疱疹病毒(HSV)-1 克隆HSV-1 KOStk12由Patricia Spear,Northwestern University, USA馈赠。对于RIE-1和L-细胞,培养基中添加了10%胎牛血清、2mM/ml L-谷氨酰胺、100单位/ml青霉素和100μg/ml
链霉素(Irvine Scientific, Santa Ana,CA,USA)[完全培养基]。在某些实验中,培养基中没有血 清。反转录病毒或HSV-1感染后的细胞单层的维持时间由甲紫染色测定。
标记序列诱变和反转录病毒抗性的筛选
在RIE-1细胞被U3neoSV1载体感染(MOI为0.1)后,在含有1mg/ml G418
硫酸盐(Clontech,Palo Alto,CA,USA)的培养基中就新霉素抗 性筛选诱变细胞[6]。使二十个文库的突变体RIE-1细胞以及一个文库的 A549人腺癌细胞(每个文库由104基因捕获事件组成)增殖,直到约103 同胞细胞代表每个突变克隆。以亚汇合
密度将这些细胞铺板并在无血清 培养基中培养3天,直至它们休眠,然后用血清型1型反转录病毒感染 (MOI为每个细胞35个噬斑形成单位(pfu))。感染18小时后,用胰蛋 白酶使细胞脱离,并在含有10%胎牛血清(FBS)(Hyclone Laboratories, Inc.,Logan,Utah,USA)的培养基铺板。6hr后,除去培养基,将细 胞在无血清培养基中培养,直至仅有少数细胞还贴附在培养瓶中。平均 而言,从含有107个突变细胞组成的文库中回收了一至十个克隆(所选择 细胞的富集度为六个数量级)。将在筛选中存活的细胞转移至装有培养基 (含有10%FBS)的细胞培养板,并将细胞分为用于DNA提取的和深低温 保藏的。
HSV-1即刻早期基因报告基因的转录和翻译
HSV-1即刻早期基因报告基因lacZ的转录和翻译分别由标准 Nor thern印迹技术和β-半乳糖苷酶分析测定。
诱变的RIE-1细胞文库的形成
将诱变细胞文库用血清型-1型反转录病毒毒株Lang感染来筛选抗 溶解性感染的克隆。在无血清培养基中进行抗病毒克隆的筛选,以遏制 持续性感染(PI)细胞的出现[4]。这是很重要的,因为在病毒和细胞基 因组中由包括适应性突变的过程产生的PI细胞提供了一种使RIE-1细胞 不进行细胞突变就可获得病毒抗性的手段。未感染RIE-1细胞发生生长 抑制,而PI RIE-1细胞在无血清培养基中被杀死。
DNA序列分析:
130个细胞系中的每个细胞系中紧邻原病毒插入物的5’端的基因组 DNA通过质粒拯救进行克隆[6]。对约300至600个碱基对的该侧翼DNA 进行测序并与非冗余(nr)的、表达的序列标记(dbEST)核酸
数据库进 行比较[61]。数据库中具有正向同源序列的匹配概率根据种间变异、侧 翼DNA中外显子的量(在侧翼DNA与cDNA序列匹配的情况下)、交替剪 接和测序错误而有所不同。若概率得分<10-5并且序列为非重复的,则数 据库中的序列的匹配被认为有潜在意义的。大部分情况下,匹配基因与 原病毒位于相同的转录位置。并且,涉及cDNA序列的匹配在侧翼基因组 DNA中的外显子上为共线性,而在剪接位点趋异。如所叙述那样,实际上 鉴定的所有基因以p<10-10与鼠、大鼠或人基因序列匹配。
标记序列诱变和抗反转录病毒基因克隆的筛选
在二十个文库的诱变RIE-1细胞(每个文库代表约104独立基因捕获 事件)被U3NeoSV1基因捕获反转录病毒感染后对其进行分离。U3NeoSV1 在病毒长末端重复(LTR)的U3区域中含有新霉素抗性基因的编码序列。 就新霉素抗性所进行的筛选产生具有原病毒插入活性转录基因内的克 隆。从每个捕获文库中收集到的细胞分别以感染复数35用1型反转录病 毒感染,并在无血清培养基中筛选抗反转录病毒克隆以遏制持续性感染 (PI)细胞的出现(ref)。分离了总共151种抗反转录病毒克隆——约1 个突变体/103个基因捕获克隆或1个突变/107反转录病毒感染细胞。为进 行比较,从未进行基因捕获诱变的RIE-1细胞中回收抗性克隆的频率小 于10-8。这表明抗反转录病毒表型由基因捕获诱变所致。
无血清培养基中筛选的抗反转录病毒细胞不表达病毒抗原(图1), 也并不产生感染性病毒(由噬斑分析评估)。大部分克隆可抵抗高滴度反 转录病毒的感染并被进一步分析(图2)。而反转录病毒抗性最初并不是 由持续性感染的建立所致,很多克隆在随后的传代中被持续性感染,推 测这是由于呈现出病毒抗性的突变细胞对筛选中所使用的残留病毒的PI 状态[2]的建立敏感。
抗反转录病毒克隆中被破坏的基因的鉴定
U3NeoSV1基因捕获载体含有质粒复制起点和抗氨苄青霉素基因;因 此,毗邻寻靶载体的基因组DNA的区域很容易通过质粒拯救进行克隆并 测序[6]。将侧翼序列与核酸数据库相比较,以鉴定由于基因捕获而发生 改变时赋予了对反转录病毒引起的溶解性感染的抗性的候选细胞基因。 同时,这151个克隆得到的侧翼序列与公共DNA序列数据库[非冗余 9(nr)、高通量基因组序列(htgs)]和人、小鼠和大鼠基因组序列中的111 个已注释的基因和转录单位匹配[6]。40个侧翼序列没有信息,因为它们 与基因组DNA的重复元件或区域相匹配,而这些基因组DNA与任何已注 释的转录单位均不相关。
表1列出了抗反转录病毒克隆中被破坏的基因,从中可获知某些功 能信息。该表还包括编码已知可以物理方式相互的蛋白质的基因。与具 体代谢或信号传导途径相关的基因示于表2。这包括在病毒复制所有方面 有可能起作用的基因产物,所述病毒复制的所有方面为:进入、分解、 转录、翻译和重新组装(表1、2,图3)。编码钙周期蛋白、胰岛素生长 因子结合蛋白5蛋白酶(prssll)、C型样凝集素蛋白(Clr)-f和-C、 Dnafal-/Aprataxin+(Aprx)、GATA结合蛋白4(Gata4)、Bc12样 -1(Bc1211),和染色体10可译框架3(Chrl0orf3)和肌原纤维、fer-1样 蛋白3(Fer113)、S100a6(编码钙周期蛋白),和两种功能未知的cDNA的 十一种基因在独立细胞文库中分别被突变(表1)。在这些独立的突变克隆 内的原病毒位于彼此的7至1500多个核苷酸内。
HSV-1抗性
进行实验来确定基因对HSV-1感染是否有抗性。这些实验使用了 HSV-1(KOS)tk12,这是一种表达作为即刻早期基因的1acZ报告基因的 感染性病毒[46]。Eif3s10、AnxaI、Mgat1和Igf2r基因突变的四种克 隆对HSV-I感染有抗性,并且表达即刻早期1acZ报告基因的能力降低。 Eif3s10、Mgat1和Igf2r突变的克隆还可表现出病毒mRNA的转录和翻译 以及细胞死亡有所降低。已知Igf2r的突变可影响HSV复制[15,54,58]; 然而,HSV复制与由Eif3s10、AnxaI和Mga t1编码的蛋白质的关系是新 的。这些数据表明在反转录病毒感染中存活的克隆中发现的一些候选基 因可影响被其它病毒利用的常见细胞过程。
表1
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白质 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Loc310836 (Abca4) ATP-结合盒, 亚家族A (ABC1), 成员4 2q41 1p22.1-p21 XP_241525 NM_000350 NP_000341 6BE65_T7 AR228076 BD069426 美国专利 NO.6448000 的SEQ ID NO:69 310836 24 Anxal 膜联蛋白A1 1q51 9q12-q21.2 U25159 NM_000700 NP_000691 6B37H_T7 AR228072 BD069422 美国专利 NO.6448000 的SEQ ID NO:65 25380 301 Anxa2 膜联蛋白A2 8q24 15q21-q22 NM_019905 NM_001002857 NM_0010028588 NM_004039 NP_001002857 NP_001002858 NP_004030 7A7_rE AR228047 BD069397 美国专利 NO.6448000 的SEQ ID NO:40 56611 302
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白质 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 BD078939 美国专利 NO.6777177 的SEQ ID NO:19 Anx3 膜联蛋白A1 14p22 4q13-q22 NM_012823 NM_005139 NP_005130 70A-rE BD079025 美国专利 NO.6777177 的SEQ ID NO:105 25291 306 Aptx-/ dnajal [Hsj2] 失用症蛋白 (aprataxin)/DnaJ (HSP40)同系物, 亚家族A, 成员1 5q22 9p13.3 NW_07454 NM_017692 NM_175069 NM_175071 NM_175072/ NM_001539 NP_060162 NP_778239 NP_778241 NP_778242/ NP_001530 12_3b#7-rE 12_3B#8-rE 9B27_2_rE BD078944 美国专利 NO.6777177 的SEQ ID NO:24 BD078943 美国专利 NO.6777177 的SEQ ID NO:23 259271 65028 54840 3301
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白质 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 BD078945 美国专利 NO.6777177 的SEQ ID NO:25 Atp6vOc ATP酶,H+ 转运, 溶酶体16kDa, V0亚基c 10q12 16p13.3 NC_000016 NM_001694 NP_001685 6BE3_lac AR228008 BD069358 美国专利 NO.6448000 的SEQ ID NO:1 170667 527 Bcl2ll BcI2样1 3q41.2 20q11.21 NP_238186 NM_001191 NM_138578 NP_001182 NP_612815 L197B3E-rE L245-3-rE L24-4-4-rE BD079008 美国专利 NO.6777177 的SEQ ID NO:88 ,BD079032 美国专利 NO.6777177 的SEQ ID NO:112 24888 598
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Brd2 含布罗莫结构域2 (bromodomain- containing 2) 20p12 6p21.3 XP_238186 NM_005104 NP_005095 36_5_2_6-rE BD078987 美国专利 NO.6777177 的SEQ ID NO:67 294276 6046 Brd3/ Wdr5 含布罗莫结构域3 /WD重复域5 3p12 9q34 XP_342398 XP_342397 NM_007371/ NM_017588 NM_052821 NP_031397/ NP_060058 NP_438172 1A_rE AR228036 BD069386 美国专利 NO.6448000 的SEQ ID NO:29 362093 8019/ 11091 C9orf119/ Golga2 功能未知的基因 高尔基体自身抗原 高尔基体蛋白 (golgin)亚家族a,2 3p11 9q34.13 NW_047652 NM_022596 XM_372143 BC029911 NM_004486 XP_372143 AAH29911 NP_004477 6_3_6_2E-rE BD078967 美国专利 NO.6177177 的SEQ ID NO:47 375757 64528 375757 2801
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 C10orf3 染色体10 可译框架3 1q54 10q23.33 XP_220034 NM_018131 NP_060601 14_24#6-rE L245-3-rE L192A3E-rE 6b52-rE AR228054 BD069404 美国专利 NO.6448000 的SEQ ID NO:47 BD078938 美国专利 NO.6777177 的SEQ ID NO:88 BD078978 美国专利 NO.6777177 的SEQ ID NO:58 AR228049 BD069399 美国专利 NO.6448000 的SEQ ID NO:42 55165 55165
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Cald1 钙调素结合蛋白 14q22 7q33 NM_013146 NM004342 NM033138 NM033139 NM033140 NM033157 NP004333 NP149129 NP149130 NP14t9131 NP149347 191E2E-rE BD078958 美国专利 NO.6777177 的SEQ ID NO:38 25687 800 Calm2 钙调蛋白2 (磷酸化酶激酶,δ) 6q11- q12 2p21 NM_017326 NM001743 NP001734 32-3-2#1E/-rE BD078921 美国专利 NO.6777177 的SEQ ID NO:1 50663 805
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Celsr2 钙粘蛋白,EGF LAG七通道(pass) G型受体2 4q11 1p21 NW_047687 NM001408 NP001399 12_4b_9-rE AR228032., 美国专利 NO.6448000 的SEQ ID NO:25 AR228027 美国专利 NO.6448000 的SEQ ID NO:20 BT069377; BD069382 83465 1952 Clr-f 杀伤细胞凝集素 样受体F1 4q12 N/A XM_232399 N/A N/A 36_7_1a-rE SCA9#14_rE BD078982 美国专利 NO.67771777 的SEQ ID NO:62 AR228038 美国专利 NO.6448000 的SEQ ID NO:31 312745 N/A
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Copg2/ Tsga13 外被体(coatomer 蛋白复合物亚基γ2 睾丸特异基因A13- 花斑单等位基因 表达1 4q22 7q32 NW_047355/ XP_231582 NM012133/ NM052933 NP036265 NP4431655 36_5_2-19b_lac 12cx#11-rE AR228051 美国专利 NO.6448000 的SEQ ID NO:44 BD078955 美国专利 NO.6777177 的SEQ ID NO:35 BD078941 BD069401 BD078988 美国专利 NO.6777177 的SEQ ID NO:68 301742 312203 26958 114960
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Cstf2t 剪切刺激因子 3前-RNA 亚基2,64kDa 1q52 10q11 NW_047565 NM015235 NP056050 19_9BE_rE BD078960 美国专利 NO.6777177 的SEQ ID NO:40 BD078958 美国专利 NO.6777177 的SEQ ID NO:38 309338 23283 Csmd2 CUB和sushi 多结构域2 5q36 1p35.1-p34.3 XP_232753 NM052896 NP443128 L24_9_1-rE BD079033 美国专利 NO.6777177 的SEQ ID NO:113 313040 114784 Ctcf CCCTC结合因子 (锌指蛋白) 19q12 16q21-q22.3 NP_114012 NM006565 NP006556 6BE72_rE AR228009 BD069366 美国专利 NO.6448000 的SEQ ID NO:2 83726 10664
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Cutll/ Mylc2pl+ Cut样1, CCAAT 置换蛋白 (果蝇) 肌球蛋白轻链2, 前体淋巴细 胞特异 12q12 7q22.1 XP_341054 XP_344098 NM001913 NM181500 NM181552/ NM138403 NP001904 NP852477 NP853530/ NP612412 31_3_17_rE BD079017 BD0/8994 美国专利 NO.6777177 的SEQ ID NO:74 116639/ 363900 1523 93408 Dlx2 与TES-1同源框 相似的distal-less 同源框2 3q21 2q32 XP_230986 NM004405 NP004396 L24_4_2BE_rE BD079037 美国专利 NO.6777177 的SEQ ID NO:117 296499 1746 Dnajal DnaJ(Hsp40) 同系物, 亚家族A,成员 5q22 1 9p13-p12 NP_075223 NM001539 NP001530 10_46_4-Lac 12_3B#8-rE BD078944 美国专利 NO.6777177 的SEQ ID NO:24 65028 3301
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Dre1 也称为 KLHL24 Dre1蛋白 11q23 3q27.1 NM_181473 NM017644 NP060114 10_4b_4-rE AR228014, 美国专利 NO.6448000 的SEQ ID NO:7 BD069364 BD078933 美国专利 NO.6777177 的SEQ ID NO:13 303803 54800 E2ig2 雌激素诱导的 基因2 1q32 11q13.3 NP_57649 NM016565 NP057649 L197B3E-rE for BD078972 美国专利 NO.6777177 的SEQ ID NO:52 51287 Eif3s10 延伸起始因子3 亚基10 1q55 10q26 NW_047570 NM003750 NP003741 12PSA#6_rE AR228011 BD069361 美国专利 NO.6448000 的SEQ ID 292148 8661
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 NO:4 Erbb2ip Erbb2相互 作用蛋白 2q12 5q13.1 XP_345149 NM018695 NP061165 SCA9#14_rE ScB2#19-rE AR228015 BD069365 美国专利 NO.6448000 的SEQ ID NO:8 55914 Fer1l3 fer-1-样蛋白3, myoferlin 1q53 10q24 NW_047565 NM013451 NM133337 NP038479 NP579899 14_24#6-rE 6b52-re AR228049 BD069399 美国专利 NO.6448000 的SEQ ID NO.42 26509 Fkbp8 FK506结合蛋白8, 38kDa 16p14 19p12 XP_214316 NM012181 NP036313 31_3_15#1_Lac 31_3_15#1rE 31_3_6_2-rE. BD079018 BD078996 美国专利 NO.6777177 的SEQ ID NO:76 23770
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 BD079016., BD078993 美国专利 NO.6777177 的SEQ ID NO:96 Fusip1 FUS相互作用蛋白 (富含丝氨酸 -精氨酸)1 5q36 1p36.11 XP_342949 NM006625 NM054016 NP006616 NP473357 L28ap-rE BD079009 美国专利 NO.6777177 的SEQ ID NO:89 362630 10772 Gas5 生长抑制 特异性5 13a21 1q23.3 U77829 AK025846 AL110141 BC038733 N/A 10_4A_8_rE AR228010 BD069360 美国专利 NO.6448000 的SEQ ID NO.3 81714 60674 Gata4 GATA结合蛋白4 15p12 8p23.1-p22 NW_047454 NM002052 NP002043 10_2A_3_12-rE 10_2A_3-rE AR228023 美国专利 NO.6448000 的SEQ ID NO.16 2626
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 BD069373 AR228024 美国专利 NO.6448000 的SEQ ID NO:17 Grb2 生长因子受体 结合蛋白2 10q32.2 17q24-q25 NP_10473 NM002086 NM203506.. NP002077 NP987102. 36_5_2_19a 研究中 81504 2885 Gtf2el/ Rabl3 通用转录因子IIE 多肽1,α56kDa; RAB,RAS癌基因 家族样成员3 11q22 3q21-q24 XP_221426 XP_340993 NM005513/ NM173825 NP005504/ NP776186 L195B1E BD078975 美国专利 NO.6777177 的SEQ ID NO:55 360720 2960 285282 HM13 组织相容(次要)13, 来自A549细胞库 的人基因 20q11.21 NM030789. NP110416 RA3_A-rE RA2#C_rE 81502
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 HNRPL 异源核 核糖核蛋白L- 来自A549细胞库的 人基因 1q21 19q13.2 NM001533 NP001524 RA2_A-rE 3191 Hoxc13 同源框C13 7q36 12q13.3 XP_345881 NM017410. NP059106 L191B2E#3+_rE BD078923 美国专利 NO.6777177 的SEQ ID NO:3 366995 3229 Hpl-bp74 异染色质蛋白1, 结合蛋白74 5q36 1p36.13 NM_99108 NM016287 NP057371 10_3bE AR228022 BD069372 美国专利 NO.6448000 的SEQ ID NO:15 313647 50809 Hspc13S+/ Mox2r HSPC135蛋白 同系物/ Cd200受体2 11q21 3q13.2 XP_340986 NP_076443 NM014170/ NM138806 NM138939 NP054889/ NP620161 NP620385 l4D#8 AR228059 BD069409 美国专利 NO.6448000 的SEQ ID 360714/ 29083 131450
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 NM138940 NM170780 NP620386 NP740750 NO:52 Id3 DNA结合3的
抑制剂,显性 负螺旋-环- 螺旋蛋白 5q36 1p36.13- p36.12 NP_037190 NM002167 NP002158 21_5_8E-rE 21_5_7E-rE 21_5_9E-rE BD078974 美国专利 NO.6777177 的SEQ ID NO:54 BD078924 SEOID 美国专利 NO.677177 的SEQ ID NO:4 BD079042 美国专利 NO.677177 的SEQ ID NO:122 25585 3399 Igf2r 胰岛素样 1q11 6q26 NW047553 NM000876 NP000867 L192B3E#13_rE BD078980 25151 3482
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entre 基因 生长因子2 受体(IGF2R) 美国专利 NO.6777177 的SEQ ID NO:60 Jakl 酪氨酸-蛋白激酶 JAK1 5q33 1p32.3-p31.3 XP_342873 NM002227 NP002218 18A_8_4F-rE BD078969 BD079044 美国专利 NO.6777177 的SEQ ID NO:49 362552 3716 Kif13b 鸟苷酸激酶 相关驱动蛋白 15p12 8p12 XP_224288 NM015254 NP056069. 194c4e-rE BD078976 美国专利 NO.6777177 的SEQ ID NO:56 305967 23303 Klhl6 KeIch样6 11q23 3q27.3 NW_047358 NM130446 NP569713 10_3b_2_rE 10_4b_4-rE AR228020 BD069370 美国专利 NO.6448000 89857
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrrez 基因 的SEQ ID NO:13 BD078933 美国专利 NO.6777177 的SEQ ID NO:13 AR228014 美国专利 NO.6448000 的SEQ ID NO:7 Ki-67 增殖相关抗原 2q26 10q25 XP_227096 NM002417 NP002408 12_4b#11_rE AR228033. BD069383 美国专利 NO.6448000 的SEQ ID NO:26 310382 4288
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因 Entrez 基因 Lipc/ LOC363090 人Genbank 编号和 Entrez基因 对应Lipc基因 脂酶,成员H 甘油
醛-3-磷酸 脱氢酶 (磷酸化) 8q24 15q21-q23 NM_012597XP_343422 NM000236/ NP000227/ 6BSA12_rE AR228018 BD069368 美国专利 NO.6448000 的SEQ ID NO:11 AR228046 BD069396 美国专利 NO.6448000 的SEQ ID NO:39 24538/ 363090 3990 Madh7 MAD,针对果蝇 同系物7的母本 (果蝇属) 8q12.3 18q21.1 NW-047516 NM005904 NP005895 14A7re BD078950 美国专利 NO.6777177 的SEQ ID NO:30 4092
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 IКBζ (MAIL) 具有由脂多糖 诱导的锚蛋白 重复的分子 11q12 3p12-q12 NW_047355 NM031419 NM001005474 NP113607 NP001005474 31_3_9_rE BD079015 BD078992 美国专利 NO.6777177 的SEQ ID NO:95 64332 Map3k7ipl 促分裂原激活 蛋白激酶 激酶激酶7相互 作用蛋白1 7q34 22q13.1 NW_047780 NM006116 NM153497 NP006107 NP705717 34X24_126-rE BD078985 美国专利 NO.6777177 的SEQ ID NO:65 10454 Mapt 微管相关蛋白TAU 10q32.1 17q21.1 NM_017212 NM005910 NM016834 NM016835 NM016841 NP005901 NP058518 NP058519 NP058525 12_3B#7 AR228033, BD069383 美国专利 NO.6448000 的SEQ ID NO:26 360248 4137
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Mgat1 甘露糖基(α-1,3- )-糖蛋白β-1,2-N- 乙酰基-葡萄糖 胺-转移酶 10q21 5q35 NW_047334 NM002406 NP002397 14_7#2E_rE AR228012. BD069362, 美国专利 NO.6448000 的SEQ ID NO:5 BD079013 美国专利 NO.6777177 的SEQ ID NO:93 BD078952 美国专利 NO.6777177 的SEQ ID NO:32 81519 4245 Mical2 黄素蛋白 氧化还原酶 1q33 11p15.3 NP_872610 NM014632. NP055447 12C#A_rE AR228031, BD069381 美国专利 365352 9645
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 NO.6448000 的SEQ ID NO:24 BD078931 美国专利 NO.6777177 的SEQ ID NO:11 Ocil C型破骨细胞 抑制性凝集素 4q32 12p13 XP_342770 NM001004419 NM001004420 NM013269 NP001004419 NP001004420 NP037401 14XD#12E-rE 191E9E-rE AR228081. 美国专利 NO.6448000 的SEQ ID NO:74 BD079024; BD069431.; BD078961 美国专利 NO.6777177 的SEQ ID NO:41 113937 29121
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 BD07895 1 美国专利 NO.6777177 的SEQ ID NO:31 OL16 脂肪细胞 特异蛋白5 和剪接变体OI-16 8q22 11q24.1 NM_173154 NM024769 NP079045 X236E1_T7 X236E1_T3 286939 79827 Numb Notch信号传导 的推定抑制剂 6q31 14q24.3 XP_234394 NM003744 NP003735 SCA7#5_rE AR228078 美国专利 NO.6448000 的SEQ ID NO:71 29419 8650 Pde4b-/ 磷酸二酯酶4B cAMP-特异性(磷 酸二酯酶E4愚人 3同系物,果蝇) 5q32 1p31 NP_058727 NM002600 NP002591 34X25_23_Lac BD078990 美国专利 NO.6777177 的SEQ ID NO:70 24626 5142
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Pgyl- (Abcb1)/ ATP结合盒, 亚家族B(MDR/TAP) 成员1 4q12 7q21.1 NM_012623 NM000927 NP000918 34X23_3-rE BD078989 美国专利 NO.6777177 的SEQ ID NO:69 24646 5243 Prssll 蛋白酶,丝氨酸,11 (IGF结合) 11q37 10q26.3 NP_113909 NM002775 NP002766 12CXY#7_rE BD069425 AR228075 美国专利 NO.6448000 的SEQ ID NO:68 65164 5654 Psa 氨肽酶 嘌呤霉素敏感 10q31 17q21 NW-047338 NM006310 NP006301 8C5_6_rE BD069403; AR228053 美国专利 NO.6448000 的SEQ ID NO:46 50558 9520 Psma7 蛋白酶体 (前体,macropain) 亚基,α型,7 3q43 20q13.33 XP_342599 NM002792 NM152255 NP0027833 NP689468 12CX#11E_rE 35514a-rEI BD078983 美国专利 NO.6777177 29674 5688
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 的SEQID NO:62 Pts 6-丙酮酰-四氢 蝶呤合成酶 8q23 11q22.3- q23.3 NP_058916 NM000317 NP000308 19D5E_rE BD078942 美国专利 NO.6777177 的SEQID NO:22 29498 5805 Rfp2 RET指蛋白2 或Trim13 15p12 13q14 NM_005798 NM005798 NM052811 NM213590 NP005789 NP434698 NP998755 1A_A549_6_rE 10206 Rpsl8 S18核糖体蛋白, 胞质内,Ca2+/ 钙调蛋白激活 蛋白激酶II 的底物 5q24 6p21.3 XP_232915 NM022551 NP072045 12_4b#11_rE 12_4b#7_rE AR228028 BD069378 美国专利 NO.6448000 的SEQID NO:21 298014 6222
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Rin2 含有ras相关(Ra16 GDS/AF-6)结构域的 蛋白JC265; RAB5相互作用 蛋白2 3q41 20p11 XP_230647 NM018993 NP061866 12_3B#10-rE AR228026 BD069376 美国专利 NO.6448000 的SEQ ID NO:19 311494 54453 Rorl 受体酪氨酸激酶样 孤儿受体1 5q33 1p32-p31 XP_238402 NM005012 NP005003 12_6B#6_rE AR228030 BD069380 美国专利 NO.644800 的SEQ ID NO:23 117094 4919 Rraga Ras-相关GTP 结合A 5q32 9p21.3 NP_446425 NM006570 NP006561 L193A1E#A_rE BD078977 美国专利 NO.6777177 的SEQ ID NO:57 117044 10670 Ryk 受体样酪氨酸激酶 8q32 3q22 XP_343459 NM002958 NP002949 19-7ae_rE BD078959 美国专利 NO.6777177 的SEQ ID NO:39 140585 6259
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 S100a6/ Sl00al S100钙结合蛋白 (钙周期蛋白)/ S100蛋白,α链 A6q34 1q21 NP_445937 XP_215606 NM014624/ NM006271 NP055439/ NP006263 L25_10-Lac 18_3#3E-rE is SEQ ID NO:6 and 3_2_4-rE is 61 and 110 from U.S.patent No. 6,777,177 SEQ ID NO:111 is L25-10-rE SEQ ID NO:114 is17-L25-27#7- rE SEQ ID NO:109 is 3_2_13-rE SEQ ID NO:115 is L21C1E-rE AR228013., 美国专利 NO.6777177 的SEQ ID NO:6 BD069363 BD079030 美国专利 NO.677717 的SEQ ID NO:61和11 BD078981, BD079031 美国专利 NO.6777177 的SEQ ID NO:111 BD079034 85247 295214 6277 6271
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 美国专利 NO.6777177 的SEQ ID NO:114 BD079029 美国专利 NO.6777177 的SEQ ID NO:109 BD079035 美国专利 NO.6777177 的SEQ ID NO:115 Scmhl 中足同系物1上的 性梳(果蝇) 5q36 1p34 XP_342901 NM012236 NP036368 38_17#2_rE 研究中 22955
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 Serpl 应激相关内质网 蛋白1 15q11 3q251 NM_030835 NM014445 NP055260 191E8E_rE BD078962 美国专利 NO.6777177 的SEQ ID NO:42 80881 27230 Srp19 信号识别颗粒, 19kDa 18p12 5q21-q22 NW_047510 NM003135. NP003126 14C_2E_rE BD078963 美国专利 NO.6777177 的SEQ ID NO:43 291685 6728 Stmnl Stathmin, 微管解聚蛋白 8q31 1p36.1-p35 XP_343442 NM005563 NM203399 NM203401 NP005554 NP981944 NP981946 SCA6#1_rE AR228025 BD069375 美国专利 NO.6448000 的SEQ ID NO:18 363108 3925 Tpml 原肌球蛋白1 (α) 8q24 15q22.1 NW_047799 NM000366 NP000357 6BE60_rE BD078934 美国专利 24851 7168
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编号 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrez 基因 NO.677717 的SEQ ID NO:14 Trim52 含三联基元52 15q22 5q35.3 XM_224468 NM032765 NP116154 L24_26_2A-rE L24_3_2B-rE L24_26_1-BL BD079011 美国专利 NO.6777177 的SEQ ID NO:91 BD079005 美国专利 NO.6777177 的SEQ ID NO:85 BD079002 美国专利 NO.6448000 的SEQ ID NO:82 290458 84851
基因 定义 大鼠 CHR 人 CHR 大鼠 GenBank编号 人mRNA GenBank编号 人蛋白 GenBank编 克隆命名 核酸 插入物 GenBank 编号 大鼠 基因的 Entrez 基因 人 基因的 Entrrez 基因 Tsec-2+/ Mthfd1 tsec-2+/CI- 四氢叶酸合成酶 6q24 14q24 NW_047761 NM_022508 NM005956 NP005947 36_5_2_196-rE 14D#18-rE AR228055 BD069405 美国专利 NO.6448000 的SEQ ID NO:48 299152 64300 4522 Ubelc 泛蛋白-激活酶E1C 4q34 3p24.3-p13 NP_476553 NM003968 NM198195 NM198197 NP303959 NP937838 NP937840 12_3B#2_rE AR228029 BD069379 美国专利 NO.6448000 的SEQ ID NO:22 117553 9039 Zfp207 锌指蛋白207 10q26 17q12 XP_221231 NM003457 NP03448 3135-rE BD078995 美国专利 NO.6777177 的SEQ ID NO:75 303763 7756 Znf7 锌指蛋白7 7q34 8q24 XP_235457 NM003416 NP003407 1bw_lac 315101 7553
表2基于功能对捕获到的基因的分类
捕获到的基因由官方HUGO基因命名委员会命名(若有的话)列出。 基因或其产物的功能位置由文献描述确定。一些基因有一种以上的细胞 功能,分类比较随意,而其它基因作用尚不确定。
转录 Brd2 Brd3 Ctcf E2f2 Gtf2el Hnrpl Hoxcl3 Hpl-bp74 Id3 Znf207 Zfp7 细胞骨架相关 Anx3 Caldl Calm2 Mapt Ppmla Rpsl8 Stmnl Tpml Kifl3b 膜 Abca4 Csmd2 Celsr2 Erbb2ip OLl6 Pgyi Rabl3 Serpl 信号传导 E2ip2 Fusipl Fkbp8 Gata4 Grb2 Jakl Madh7 Map3k7ipl Pde4b Rraga Ryk 囊泡/运输 Anxa1 Anxa2 Atp6v0c Copg2 Golga2 Hml3 Igf2r Psa Rin2 Rabl3 S100a6 翻译 Cstf2 Eif3sl0 Srp19 细胞凋亡 Bcl2l Cycs IkB□ Mical2 Rfp2 细胞代谢 Gas5 Lipc Mgatl Pts 伴侣分子 Dnajal 遍在蛋白化/蛋白体 Ubelc Psma7 未分配的 Apts Hspc135 Ocil Wdr5 Clr-f Klhl6 Rorl Drel Mox2rScmhl Dlx2 Numb Trim52
表3
基因名称 ABCA4 GenBank编号 NM 000350 GI: 4557875 生物 人 长度 7318 ORF区域 82-6903 基因座 24 Blast数据库 人 ORFGC% 52.58 定义 人ATP-结合盒,亚家族A(ABC1),成员4(ABCA4),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_000350_siRNA_458 458 GGACAGAGCUACACAUCUU(SEQ ID NO:1) AAGAUGUGUAGCUCUGUCC(SEQ ID NO:2) ORF 47.36842105 NM_000350_siRNA_869 869 GCCGUUCUCAAGGUAUCAA(SEQ ID NO:3) UUGAUACCUUGAGAACGGC(SEQ ID NO:4) ORF 47.36842105 NM_000350_siRNA_880 880 GGUAUCAAUCUGAGAUCUU(SEQ ID NO:5) AAGAUCUCAGAUUGAUACC(SEQ ID NO:6) ORF 36.84210526 NM_000350_siRNA_1734 1734 GGUAUUCCCUGACAUGUAU(SEQ ID NO:7) AUACAUGUCAGGGAAUACC(SEQ ID NO:8) ORF 42.10526316 NM_000350_siRNA_1864 1864 GCUGAUCCCGUGGAAGAUU(SEO ID NO:9) AAUCUUCCACGGGAUCAGC(SEQ ID NO:10) ORF 52.63157895 基因名称 AN×A1 GenBank编号 NM 000700 GI: 4502100 生物 人 长度 1399 ORF区域 75-1115 基因座 301 Blast数据库 人 ORFGC% 44.48 定义 人膜联蛋白A1(ANXA1),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_000700_siRNA_318 318 GCAGCAUAUCUCCAGGAAA(SEQ ID NO:11) UUUCCUGGAGAUAUGCUGC(SEQ ID NO:12) ORF 47.36842105 NM_000700_siRNA_609 609 GCUUUGCUUUCUCUUGCUA(SEQ ID NO:13) UAGCAAGAGAAAGCAAAGC(SEQ ID NO:14) ORF 42.10526316 NM_O00700_siRNA_775 775 GCAGAGUGUUUCAGAAAUA(SEQ ID NO:15) UAUUUCUGAAACACUCUGC(SEQ ID NO:16) ORF 36.84210526 NM_000700_siRNA_942 942 GGAACUCGCCAUAAGGCAU(SEQ ID NO:17) AUGCCUUAUGGCGAGUUCC(SEQ ID NO:18) ORF 52.63157895 NM_000700_siRNA_1058 1058 GGAUGAAACCAAAGGAGAU(SEQ ID NO:19) AUCUCCUUUGGUUUCAUCC((SEQ ID NO:20) ORF 42.10526316
基因名称 ANXA2 GenBank编号 NM001002857 GI: 50845385 生物 人 长度 1644 ORF区域 137-1156 基因座 302 Blast数据库 人 ORFGC% 48.14 定义 人膜联蛋白A2(ANXA2),转录物变体2,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001002857_siRNA844 844 CCCUUAUGACAUGUUGGAA(SEQ ID NO:21) UUCCAACAUGUCAUAAGGG(SEQ ID NO:22) ORF 42.10526316 NM_001002857_siRNA_845 845 CCUUAUGACAUGUUGGAAA(SEQ ID NO:23) UUUCCAACAUGUCAUAAGG(SEO ID NO:24) ORF 36.84210526 NM_001002857_siRNA_1071 1071 GCAAGUCCCUGUACUAUUA(SEQ ID NO:25) UAAUAGUACAGGGACUUGC(SEQ ID NO:26) ORF 42.10526316
基因名称 ANXA2 GenBank编号 NM001002858 GI: 50845387 生物 人 长度 1635 ORF区域 74-1147 基因座 302 Blast数据库 人 ORFGC% 48.89 定义 人膜联蛋白A2(ANXA2),转录物变体1,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_01002858_siRNA_835 835 CCCUUAUGACAUGUUGGAA(SEQ ID NO:27) UUCCAACAUGUCAUAAGGG(SEQ ID NO:28) ORF 42.10526316 NM_001002858_siRNA_836 836 CCUUAUGACAUGUUGGAAA(SEQ ID NO:29) UUUCCAACAUGUCAUAAGG(SEQ ID NO:30) ORF 36.84210526 NM_001002858_siRNA_1062 1062 GCAAGUCCCUGUACUAUUA(SEQ ID NO:31) UAAUAGUACAGGGACUUGC(SEQ ID NO:32) ORF 42.10526316
基因名称 ANXA2 GenBank编号 NM004039 GI 50845389 生物 人 长度 1563 ORF区域 561075 基因座 3D2 Blast数据库 人 ORFGC% 48.14 定义 人膜联蛋白A2(ANXA2),转录物变体3,mRNA。
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_004039_siRNA_763 763 CCCUUAUGACAUGUUGGAA(SEQ ID NO:33) UUCCAACAUGUCAUAAGGG(SEQ ID NO:34) ORF 42.10526316 NM_004039_siRNA_764 764 CCUUAUGACAUGUUGGAAA(SEQ ID NO:35) UUUCCAACAUGUCAUAAGG(SEQ ID NO:36) ORF 36.84210526 NM_004039_siRNA_990 990 GCAAGUCCCUGUACUAUUA(SEQ ID NO:37) UAAUAGUACAGGGACUUGC(SEQ ID NO:38) ORF 42.10526316
基因名称 ANXA3 GenBank编号 NM005139 GI: 4826642 生物 人 长度 1339 ORF区域 47-1018 基因座 306 Blast数据库 人 ORFGC% 42.8 定义 人膜联蛋白A3(ANXA3),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_005139_siRNA_317 317 CCAGCAGUCUUUGAUGCAA(SEQ ID NO:39) UUGCAUCAAAGACUGCUGG(SEQ ID NO:40) ORF 47.36842105 NM_005139_siRNA_332 332 GCAAAGCAGCUAAAGAAAU(SEQ ID NO:41) AUUUCUUUAGCUGCUUUGC(SEQ ID NO:42) ORF 36.84210526 NM_005139_siRNA_405 405 GGACAAGCAGGCAAAUGAA(SEQ ID NO:43) UUCAUUUGCCUGCUUGUCC(SEQ ID NO:44) ORF 47.36842105 NM_005139_siRNA_411 411 GCAGGCAAAUGAAGGAUAU(SEQ ID NO:45) AUAUCCUUCAUUUGCCUGC(SEQ ID NO:46) ORF 42.10526316 NM_005139_siRNA_827 827 GCCUUGAAGGGUAUUGGAA(SEQ ID NO:47) UUCCAAUACCCUUCAAGGC(SEQ ID NO:48) ORF 47.36842105
基因名称 APTX GenBank编号 NM 017692 GI: 28329424 生物 人 长度 2016 ORF区域 605-1111 基因座 54840 Blast数据库 人 ORFGC% 47.93 定义 人失用症蛋白(APTX).转录物变体4.mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_017692_siRNA_956 956 GCUGUGAUCGAGAUGGUAC(SEQ ID NO:49) GUACCAUCUCGAUCACAGC(SEQ ID NO:50) ORF 52.63157895 NM_017692_siRNA_983 983 GGUAGAGUAACUGUCCGAG(SEQ ID NO:51) CUCGGACAGUUACUCUACC(SEQ ID NO:52) ORF 52.63157895 NM_017692_siRNA-1005 1005 GGAUGCCUGAGCUCUUGAA (SEQ ID NO:53) UUCAAGAGCUCAGGCAUCC(SEQ ID NO:54) ORF 52.63157895
基因名称 APTX GenBank编号 NM 175069 Gl: 28329429 生物 人 长度 2036 ORF区域 25-945 基因座 54840 Blast数据库 人 ORFGC% 48.0 定义 人失用症蛋白(APTX).转录物变体2.mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_175069_siRNA_105 105 GCACCAGCGAAUCAGACUU(SEQ ID NO:55) AAGUCUGAUUCGCUGGUGC(SEQ ID NO:56) ORF 52.63157895 NM_175069_siRNA_266 266 GCAUUGACUCAGUCGUAAU(SEQ ID NO:57) AUUACGACUGAGUCAAUGC(SEQ ID NO:58) ORF 42.10526316 NM_175069_siRNA_389 389 GCCUGGAAACACACAGGAA(SEQ ID NO:59) UUCCUGUGUGUUUCCAGGC(SEQ ID NO:60) ORF 52.63157895 NM_175069_siRNA_652 652 CCAAAGGCCCGUUACCAUU(SEQ ID NO:61) AAUGGUAACGGGCCUUUGG(SEQ ID NO:62) ORF 52.63157895 NM_175069_siRNA_720 720 GGAACACCUUGAACUCCUU(SEQ ID NO:63) AAGGAGUUCAAGGUGUUCC(SEQ ID NO:64) ORF 47.36842105
基因名称 APTX GenBank编号 NM 175071 GI: 28329426 生物 人 长度 1836 ORF区域 425-931 基因座 54840 Blast数据库 人 ORFGC% 47.93 定义 人失用症蛋白(APTX),转录物变体5,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_175071_siRNA_799 799 GGCUGGUAGAGUAACUGUC(SEQ ID NO:65) GACAGUUACUCUACCAGCC(SEQ ID NO:66) ORF 52.63157895 NM_175071_siRNA_803 803 GGUAGAGUAACUGUCCGAG(SEO ID NO:67) CUCGGACAGUUACUCUACC(SEO ID NO:68) ORF 52.63157895 NM_175071_siRNA_825 825 GGAUGCCUGAGCUCUUGAA(SEQ ID NO:69) UUCAAGAGCUCAGGCAUCC(SEQ ID NO:70) ORF 52.63157895
基因名称 APTX GenBanK编号 NM 175072 GI: 28329432 生物 人 长度 2041 ORF区域 372-1136 基因座 54840 Blast数据库 人 ORFGC% 47.98 定义 人失用症蛋白(APTX),转录物变体3,mRNA。
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_175072_siRNA_981 96l GCUGUGAUCGAGAUGGUAC(SEQ ID NO:71) GUACCAUCUCGAUCACAGC(SEQ ID NO:72) ORF 52.6315789 NM_175072_siRNA_1030 1030 GGAUGCCUGAGCUCUUGAA(SEO ID NO:73) UUCAAGAGCUCAGGCAUCC(SEQ ID NO:74) ORF 52.6315789S NM_175072_siRNA_1094 1094 UCCUCAGCUGAAAGAACAU(SEQ ID NO:75) AUGUUCUUUCAGCUGAGGA(SEQ ID NO:76) ORF 42.10526316
基因名称 DNAJAl GenBanK编号 NM 001539 GI: 49472820 生物 人 长度 1538 ORF区域 184-1377 基因座 3301 引ast数据库 人 ORF GC% 43.22 定义 人DnaJ(HsD40)同系物。亚家族A,成员1(DNAJAl),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RMA序列5′-3′ 区域 GC% NM_001539_siRNA_642 642 CCGAGGUACUGGAAUGCAA(SEQ ID NO:77) UUGCAUUCCAGUACCUCGG(SEO ID NO:78) ORF 52.63157895 NM_001539_siRNA_646 646 GGUACUGGAAUGCAAAUM(SEQ ID NO:79) UUAUUUGCAUUCCAGUACC(SEQ ID NO:80) ORF 36.84210S26 NM_001539_siRNA_682 682 CCUGGAAUGGUUCAGCAAA(SEO ID NO:81) UUGCUGAACCAUUCCAGG(SEQ ID NO:82) ORF 47.36842105 NM_001539_siRNA-779 779 GGAAGAUAGUUCGAGAGAA(SEQ ID NO:83) UUCUCU06AACUAUCUUCC(SEQ ID NO:84) ORF 42.10526316 NM_001539_siRNA_840 840 CCAGMGAuMCAUUGCAU(SEO ID NO:85) AUGGMUGUUAUCUUCUGG(SEO ID NO:86) ORF 36.84210526 基因名称 ATP6VOC GenBanK编号 NM 001694 G1: 19913436 生物 人 长度 1126 ORF区域 153-620 基因座 527 BIast数据库 人 ORFGC% 63.47 定义 人ATPase,H+转运,溶酶体 名称 起点 有义RNA序列5′-3′ 区域 GC% NM_001694_siRNA_388 388 CCCUGAAUGACGACAUCAG(SEQ ID NO:87) CUGAUGUCGUCAUUCAGGG(SEQ ID NO:88) ORF 52.63157895 NM_001694_siRNA_529 529 GACUAUUCGUGGGCAUGAU(SEQ ID NO:89) AUCAUGCCCACGAAUAGUC(SEQ ID NO:90) ORF 47.36842105 NM_001694_siRNA_535 535 UCGUGGGCAUGAUCCUGAU(SEQ ID NO:91) AUCAGGAUCAUGCCCACGA(SEQ ID NO:92) ORF 52.63157895
基因名称 BCL2L1 GenBank编号 NM 001191 GI: 20336333 生物 人 长度 2386 ORF Region: 367-879 基因座 598 Blast数据库 人 ORFGC% 57.12 定义 人BCL2样1(BCL2L1),编码线粒体蛋白质的核基因,转录物变体2,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001191_siRNA_753 753 GGAACUCUAUGGGAACAAU(SEQ ID NO:93) AUUGUUCCCAUAGAGUUCC(SEQ ID NO:94) ORF 42.10526316 NM_001191_siRNA_857 857 GCUCACUCUUCAGUCGGAA(SEQ ID NO:95) UUCCGACUGAAGAGUGAGC(SEQ ID NO:96) ORF 52.63157895 NM_001191_siRNA_859 859 UCACUCUUCAGUCGGAAAU(SEQ ID NO:97) AUUUCCGACUGAAGAGUGA(SEQ ID NO:98) ORF 42.10526316
基因名称 BCL2L1 GenBank编号 NM 138578 GI: 20336334 生物 人 长度 2575 ORF区域 367-1068 基因座 598 Blast数据库 人 ORFGC% 56.84 定义 人BCL2样1(BCL2L1).编码线粒体蛋白质的核基因,转录物变体1,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_138578_siRNA_514 514 GCCAUCAAUGGCAACCCAU(5EQ ID NO:99) AUGGGUUGCCAUUGAUGGC(SEQ ID NO:100) ORF 52.63157895 NM_138578_siRNA_676 676 GCAUUCAGUGACCUGACAU(SEQ ID NO:101) AUGUCAGGUCACUGAAUGC(SEQ ID NO:102) ORF 47.36842105 NM_138578_siRNA_716 716 GGACAGCAUAUCAGAGCUU(SEQ ID NO:103) AAGCUCUGAUAUGCUGUCC(SEQ ID NO:104) ORF 47.36842105 NM_138578_siRNA_818 818 GCGUGGAAAGGGUAGACAA(SEQ ID NO:105) UUGUCUACGCUUUCCACGC(SEQ ID NO:106) ORF 52.63157895 NM_138578_siRNA_872 872 GGAUGGCCACUUACCUGAA(SEQ ID NO:107) UUCAGGUAAGUGGCCAUCC(SEQ ID NO:108) ORF 52.63157895
基因名称 BRD2 GenBank编号 NM 005104 GI: 12408641 生物 人 长度 4693 ORF区域 1702-4107 基因座 6046 Blast数据库 人 ORFGC% 49.26 定义 人含布罗莫结构域2(BRD2),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_005104_siRNA_1851 1851 GGUGCCUGCUUUGCAACUU(SEQ ID NO:109) AAGUUGCAAAGCAGGCACC(SEQ ID NO:110) ORF 52.63157895 NM_005104_siRNA_2229 2229 GGUUGCAUCAAUGCCACAA(SEQ ID NO:111) UUGUGGCAUUGAUGCAACC(SEQ ID NO:112) ORF 47.36842105 NM_005104_siRNA_2694 2694 GCCUGACUCUCAGCAACAA(SEQ ID NO:113) UUGUUGCUGAGAGUCAGGC(SEQ ID NO:114) ORF 52.63157895 NM_005104_siRNA_2944 2944 GCUGCUGAUGUACGGCUUA(SEQ ID NO:115) UAAGCCGUACAUCAGCAGC(SEQ ID NO:116) ORF 52.63157895 NM_005104_siRNA_2969 2969 CCAACUGCUAUAAGUACAA(SEQ ID NO:117) UUGUACUUAUAGCAGUUGG(SEQ ID NO118) ORF 36.84210526
基因名称 BRD3 GenBank编号 NM 007371 GI: 12408642 生物 人 长度 3085 ORF区域 140-2320 基因座 8019 Blast数据库 人 ORF GC% 55.03 定义 人含布罗莫结构域3(BRD3),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_007371_siRNA_1098 1098 GGGAGAUGCUAUCCAAGAA(SEO ID NO:119) UUCUUGGAUAGCAUCUCCC(SEQ ID NO:120) ORF 47.36842105 NM_007371_siRNA_1279 1279 CCGGCUGAUGUUCUCGAAU(SEQ ID NO:121) AUUCGAGAACAUCAGCCGG(SEQ ID NO:122) ORF 52.63157895 NM_007371_siRNA_1921 1921 GGUAGUGCACAUCAUCCAA(SEQ ID NO:123) UUGGAUGAUGUGCACUACC(SEQ ID NO:124) ORF 47.36842105 NM_007371_siRNA_2017 2017 GCGGGAACUGGAGAGAUAU(SEQ ID NO:125) AUAUCUCUCCAGUUCCCGC(SEQ ID NO:126) ORF 52.63157895
基因名称 WDR5 GenBank编号 NM 017588 GI: 61744459 生物 人 长度 3163 ORF区域 172-1176 基因座 11091 Blast数据库 人 ORFGC% 48.96 定义 人WD重复结构域5(WDR5),转录物变体1,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_017588_siRNA_424 424 GGUCACAAGCUGGGAAUAU(SEQ ID NO:127) AUAUUCCCAGCUUGUGACC(SEQ ID NO:128) ORF 47.36842105 NM_017588_siRNA_452 452 CCUGGUCGUCAGAUUCUAA(SEQ ID NO:129) UUAGAAUCUGACGACCAGG(SEQ ID NO:130) ORF 47.36842105 NM_017588_siRNA_1032 1032 CCUUCAGACGAAAGAGAUU(SEQ ID NO:131) AAUCUCUUUCGUCUGAAGG(SEQ ID NO:132) ORF 42.10526316 基因名称 C90rf119 GenBank编号 XM 372143 GI: 51467631 生物 人 长度 884 ORF区域 1-636 基因座 375757 Blast数据库 人 ORF GC% 59.12 定义 预测:人染色体9可译框架119(C9orf119),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% XM_372143_siRNA_501 501 GGACCACAUUACCCAGCUU (SEQ ID NO:133) AAGCUGGGUAAUGUGGUCC(SEQ ID NO:134) ORF 52.63157895 XM_372143_siRNA_512 512 CCCAGCUUCACGAGUACAA(SEQ ID NO:135) UUGUACUCGUGAAGCUGGG(SEQ ID NO:136) ORF 52.63157895 XM_372143_siRNA_513 513 CCAGCUUCACGAGUACAAU(SEQ ID NO:137) AUUGUACUCGUGAAGCUGG(SEQ ID NO:138) ORF 47.36842105
基因名称 GOUA2 GenBank编号 NM 004486 GI: 47078236 生物 人 长度 4304 ORF区域 50-3022 基因座 2801 Blast数据库 人 ORFGC% 55.84 定义 人高尔基体自身抗原,高尔基体蛋白亚家族a,2(GOLGA2),mRNA。
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_004486_siRNA_406 406 CCAACAGCUCAAUGGUCUU(SEQ ID NO:139) AAGACCAUUGAGCUGUUGG(SEQ ID NO:140) ORF 47.36842105 NM_004486_siRNA_528 528 CCAGCUAUGUAACAAACAA(SEQ ID NO:141) UUGUUUGUUACAUAGCUGG(SEQ ID NO:142) ORF 36.84210526 NM_004486_siRNA_655 655 GCAGUUACAGGUUCACAUU(SEQ ID NO:143) AAUGUGAACCUGUAACUGC(SEQ ID NO:144) ORF 42.10526316
基因名称 C10orf3 GenBank编号 NM 018131 GI: 34147683 生物 人 长度 2635 ORF区域 285-1679 基因座 55165 Blast数据库 人 ORF GC% 40.72 定义 人染色体10可译框架3(C10orf3),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_018131_siRNA_292 292 CCAGAAGUACCAAAGAUUU(SEQ ID NO:145) AAAUCUUUGGUACUUCUGG(SEQ ID NO:146) ORF 36.84210526 NM_018131_siRNA_494 494 GGAGAAGAAUGCUUAUCAA(SEQ ID NO:147) UUGAUAAGCAUUCUUCUCC(SEQ ID NO:148) ORF 36.84210526 NM_018131_siRNA_551 551 CCAACUGAAGGCCAGAUAU(SEQ ID NO:149) AUAUCUGGCCUUCAGUUGG(SEQ ID NO:150) ORF 47.36842105 NM_D18131_siRNA_753 753 CCAAACUGCUUCAACUCAU(SEO ID NO:1S1) AUGAGUUGAAGCAGUUUGG(SEQ ID NO:152) ORF 42.10526316
基因名称 CALD1 GenBank编号 NM 033138 GI: 44680104 生物 人 长度 5233 ORF区域 460-2841 基因座 800 Blast数据库 人 ORF GC% 37.41 定义 人钙调素结合蛋白(CALD1),转录物变体1,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM 033138_siRNA_695 695 CCAAGACAACCACCACAAA UUUGUGGUGGUUGUCUUGG ORF 47.36842105 NM_033138_siRNA_826 826 CCAACAAUAACAGAUGCAA(SEQ ID NO:153) UUGCAUCUGUUAUUGUUGG(SEQ ID NO:154) ORF 36.84210526 NM_033138_siRNA_926 926 GCCAAGAAAGAUACGAGAU(SEQ ID NO:155) AUCUCGUAUCUUUCUUGGC(SEQ ID NO:156) ORF 42.10526316 NM_033138_siRNA_2638 2638 GCAGCAGGCACACCAAAUA(SEQ ID NO:157) UAUUUGGUGUGCCUGCUGC(SEQ ID NO:158) ORF 52.63157895
基因名称 CALM2 GenBank编号 NM 001743 GI: 20428653 生物 人 长度 1128 ORF区域 69-518 基因座 805 Blast数据库 人 ORFGC% 39.12 定义 人钙调蛋白2(磷酸酶激酶,δ)(CALM2)mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001743_siRNA_138 138 GGUGAUGGAACUAUAACAA(SEQ ID NO:159) UUGUUAUAGUUCCAUCACC(SEQ ID NO:160) ORF 36.84210526 NM_001743_siRNA_328 328 GAGAAGCAUUCCGUGUGUU(SEQ ID NO:161) AACACACGGAAUGCUUCUC(SEQ ID NO:162) ORF 47.36842105 NM_001743_siRNA_333 333 GCAUUCCGUGUGUUUGAUA(SEQ ID NO:163) UAUCAAACACACGGAAUGC(SEQ ID NO:164) ORF 42.10526316
基因名称 CELSR2 GenBank编号 NM 001408 GI: 13325063 生物 人 长度 10531 ORF区域 63-8834 基因座 1952 Blast数据库 人 ORFGC% 60.9 定义 人钙粘蛋白,EGF LAG七通道G型受体2(红鹳同系物,果蝇)(CELSR2),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001408_siRNA_1997 1997 CCAGAUCACCAGUGGCAAU(SEQ ID NO:165) AUUGCCACUGGUGAUCUGG(SEQ ID NO:166) ORF 52.63157895 NM_001408_siRNA_2011 2011 GCAAUACUCGAAACCGCUU(SEQ ID NO:167) AAGCGGUUUCGAGUAUUGC(SEQ ID NO:168) ORF 47.36842105 NM_001408_siRNA_2950 2950 GCAACAUCCCUGAGGUCUU(SEQ ID NO:169) AAGACCUCAGGGAUGUUGC(SEQ ID NO:170) ORF 52.63157895 NM_001408_siRNA_4427 4427 GCAGCUGAAAUACUACAAU(SEQ ID NO:171) AUUGUAGUAUUUCAGCUGC(SEQ ID NO:172) ORF 36.84210526 NM_001408_siRNA_5512 5512 GCAGCUGUGAUCCAGGUUA(SEQ ID NO:173) UAACCUGGAUCACAGCUGC(SEQ ID NO:174) ORF 52.63157895
基因名称 COPG2 GenBank编号 NM 012133 GI: 66348036 生物 人 长度 1703 ORF区域 618-28 基因座 26958 Blast数据库 人 ORFGC% 42.45 定义 人外被体蛋白复合物,亚基v2(COPG2),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_012133_siRNA_97 97 GGUAGUGGCUCCAAUCCUU(SEQ ID NO:175) AAGGAUUGGAGCCACUACC(SEQ ID NO:176) ORF 52.63157895 NM_012133_siRNA_147 147 GGAGGCUCGUAUAUUCAAU(SEQ ID NO:177) AUUGAAUAUACGAGCCUCC(SEQ ID NO:178) ORF 42.10526316 NM_012133_siRNA_232 232 GGUGAACACUUUGGAACAA(SEQ ID NO:179) UUGUUCCAAAGUGUUCACC(SEQ ID NO:180) ORF 42.10526316 NM_012133_siRNA_380 380 GCAGUCUGACUAAAGACAU(SEQ ID NO:181) AUGUCUUUAGUCAGACUGC(SEQ ID NO:182) ORF 42.10526316 NM_012133_siRNA_548 548 CCCUGCACAUGAUGAAGAU(SEO ID NO:183) AUCUUCAUCAUGUGCAGGG(SEQ ID NO:184) ORF 47.36842105 基因名称 TSGA13 GenBank编号 NM 052933 GI: 31377632 生物 人 长度 1700 ORF区域 458-1285 基因座 114960 Blast数据库 人 ORF GC% 46.02 定义 人睾丸特异性,13(TSGA113),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_052933_siRNA_1130 1130 GCGAGUGAAAGGCCAAUUU(SEQ ID NO:185) AAAUUGGCCUUUCACUCGC(SEQ ID NO:186) ORF 47.36842105 NM_052933_siRNA_1140 1140 GGCCAAUUUCCAAAGUGAU(SEQ ID NO:187) AUCACUUUGGAAAUUGGCC(SEQ ID NO:188) ORF 42.10526316 NM_052933_siRNA_1141 1141 GCCAAUUUCCAAAGUGAUU(SEQ ID NO:189) AAUCACUUUGGAAAUUGGC(5EQ ID NO:190) ORF 36.84210526
基因名称 CSTF2T GenBank编号 NM 015235 GI: 46094083 生物 人 长度 4127 ORF区域 47-1897 基因座 23283 Blast数据库 人 ORFGC% 54.14 定义 人剪切刺激因子.3′前-RNA,亚基2,64kDa,tau变体(CSTF2T), mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC NM_015235_siRNA_219 219 GCUAUGGCUUCUGCGAAUA(SEO ID NO:191) UAUUCGCAGAAGCCAUAGC(SEQ ID NO: 192) ORF 47.36842105 NM_015235_siRNA_340 340 GGAGGAGUUAAAGAGCCUU(SEQ ID NO:193) AAGGCUCUUUAACUCCUCC(SEQ ID NO:194) ORF 47.36842105 NM_015235_siRNA_641 641 CCACUGAUCCCAGGCAAAU(SEQ ID NO:195) AUUUGCCUGGGAUCAGUGG(SEQ ID NO: 196) ORF 52.63157895 NM_015235_siRNA_1138 1138 GCAUCAUGCCUCUGGUCAU(SEQ ID NO:197) AUGACCAGAGGCAUGAUGC(SEQ ID NO: 198) ORF 52.63157895 NM_015235_siRNA_1167 1167 GCCCUUCCUCACAUGAGAU(SEQ ID NO:199) AUCUCAUGUGAGGAAGGGC(SEQ ID NO: 200) ORF 52.63157895
基因名称 CSMD2 GenBank编号 NM 052896 GI: 38045884 生物 人 长度 13113 ORF区域 30-10493 基因座 114784 Blast数据库 人 ORFGC% 57.15 定义 人CUB和Sushi多结构域2(CSMD2), mRNA。
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_052896_siRNA_224 224 GCUUGUGUUCCAGUCCUUU(SEQ ID NO:201) AAAGGACUGGAACACAAGC(SEQ ID NO:202) ORF 47.36842105 NM_052896_siRNA_520 520 GCUGCAACCUUGGCUUCUU(SEQ ID NO:203) AAGAAGCCAAGGUUGCAGC(SEQ ID NO: 204) ORF 52.63157895 NM_052896_siRNA_797 797 GGAAGUCACUGGGACAGAA(SEQ ID NO:205) UUCUGUCCCAGUGACUUCC(SEQ ID NO: 206) ORF 52.63157895 NM_052896_siRNA_931 931 CCCAAUACCAAGUCAAGAA(SEQ ID NO:207) UUCUUGACUUGGUAUUGGG(SEQ ID NO: 208) ORF 42.10526316 NM_052896_siRNA_938 938 CCAAGUCAAGAAGCAAAUU(SEQ ID NO:209) AAUUUGCUUCUUGACUUGG(SEQ ID NO: 210) ORF 36.84210526
基因名称 CTCF GenBanK编号 NM 006565 GI: 62952500 生物 人 长度 3797 ORF区域 291-2474 基因座 10664 Blast数据库 人 ORFGC% 48.81 定义 人CCCTC结合因子(锌指蛋白)(CTCF).mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3 区域 GC% NM_006565_siRNA_812 812 GGUGGAGACACUAGAACAA(SEQ ID NO:211) UUGUUCUAGUGUCUCCACC(SEQ ID NO:212) ORF 47.36842105 NM_006565_siRNA_1211 1211 CCUCCUGAGGAAUCACCUU(SEQ ID NO:213) AAGGUGAUUCCUCAGGAGG (SEQID NO:214) ORF 52.63157895 NM_006565_siRNA_1540 1540 CCCAAAGUGGUACCAUGAA(SEO ID NO:215) UUCAUGGUACCACUUUGGG(SEO ID NO:216) ORF 47.36842105 NM_006565_siRNA_1667 1667 GCAUUCCUAUAUUGAGCAA(SEQ ID NO:217) UUGCUCAAUAUAGGAAUGC(SEQ ID NO:218) ORF 36.84210526 NM_006565_siRNA_2285 2285 CCAGCCAACAGCUAUCAUU(SEQ ID NO:219) AAUGAUAGCUGUUGGCUGG(SEQ ID NO:220) ORF 47.36842105
基因名称 CUTL1 GenBank编号 NM 001913 GI: 31652235 生物 人 长度 2942 ORF区域 20-2056 基因座 1523 Blast数据库 人 ORF GC% 55.38 定义 人cut样1,CCAAT置换蛋白(果蝇)(CUTL1),转录物变体2,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001913_siRNA_418 418 GGAAGAAUACAACAAGGAA(SEQ ID NO:221) UUCCUUGUUGUAUUCUUCC(SEQ ID NO:222) ORF 36.84210526 NM_001913_siRNA_1357 1357 GCAGGACCUGAGCAUCAUU(SEQ ID NO:223) AAUGAUGCUCAGGUCCUGC(SEQ ID NO:224) ORF 52.63157895 NM_001913_siRNA_1507 1507 CCAGGUGGAUUCACUGCUU(SEO ID NO:225) AAGCAGUGAAUCCACCUGG(SEQ ID NO:226) ORF 52.63157895 NM_001913_siRNA_1644 1644 CCGACAACAUCAAGCUCUU(SEQ ID NO:227) AAGAGCUUGAUGUUGUCGG(SEQ ID NO: 228) ORF 47.36842105 NM_001913_siRNA_2002 2002 GCACAAGUUCCACGAGAAU(SEQ ID NO:229) AUUCUCGUGGAACUUGUGC(SEQ ID NO:230) ORF 47.36842105
基因名称 MYLC2PL GenBank编号 NM 138403 GI: 40286635 生物 人 长度 681 ORF区域 1-681 基因座 93408 Blast数据库 人 ORFGC% 54.78 定义 人肌球蛋白轻链2,前体淋巴细胞特异(MYLC2PL),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_138403_siRNA_321 321 GGACUUGAGGGACACCUUU(SEQ ID NO:231) AAAGGUGUCCCUCAAGUCC(SEQ ID NO:232) ORF 52.63157895 NM_138403_siRNA_350 350 GCCGCAUCAAUGUCAAGAA(SEQ ID NO:233) UUCUUGACAUUGAUGCGGC(SEQ ID NO:234) ORF 47.36842105 NM_138403_siRNA_473 473 CCAUUCUCCACGCCUUCAA(SEQ ID NO:235) UUGAAGGCGUGGAGAAUGG(SEQ ID NO: 236) ORF 52.63157895 NM_138403_siRNA_588 588 GCAGAUGUUUGCAGCGUUU(SEQ ID NO:237) AAACGCUGCAAACAUCUGC(SEQ ID NO:238) ORF 47.36842105
基因名称 DLX2 GenBank编号 NM 004405 GI: 6996003 生物 人 长度 2091 ORF区域 1-987 基因座 1746 Blast数据库 人 ORFGC% 61.81 定义 人distal-less同源框2 DLX2),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_004405_siRNA_676 676 GCUUCUCCACCUUGUGCUU(SEQ ID NO:239) AAGCACAAGGUGGAGAAGC(SEQ ID NO:240) ORF 52.63157895
基因名称 KLHL24 GenBank编号 NM 017644 GI: 62865888 生物 人 长度 7331 ORF区域 296-2098 基因座 54800 Blast数据库 人 ORFGC% 42.55 定义 人kelch样24(果蝇)(KLHL24),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_017644_siRNA_558 558 GCAGCUACUUCAGAGCUAU(SEQ ID NO:241) AUAGCUCUGAAGUAGCUGC(SEQ ID NO:242) ORF 47.36842105 NM_017644_siRNA_594 594 GGGAAAGCCGAGAAAUGUU(SEQ ID NO:243) AACAUUUCUCGGCUUUCCC(SEQ ID NO:244) ORF 47.36842105 NM_017644_siRNA_778 778 GCAACUUGAUCCUUGUAAU(SEQ ID NO:245) AUUACAAGGAUCAAGUUGC(SEQ ID NO:246) ORF 36.84210526 NM_017644_siRNA_811 811 GCGCUUUGCUGAUACCCAU(SEQ ID NO:247) AUGGGUAUCAGCAAAGCGC(SEQ ID NO:248) ORF 52.63157895 NM_017644_siRNA_913 913 GCUUGACAAAGAUGAACUU(SEQ ID NO:249) AAGUUCAUCUUUGUCAAGC(SEQ ID NO:250) ORF 36.84210526 NM_017644_siRNA_1679 1679 GGAOCUGAUGAUAAUACUU(SEQ ID NO:251) AAGUAUUAUCAUCAGGUCC(SEQ ID NO:252) ORF 36.84210526
基因名称 CHCHD8 aka E2IG2 GenBank编号 NM 016565 GI: 46198303 生物 人 长度 833 ORF区域 106-369 基因座 51287 Blast数据库 人 ORFGC% 60.99 定义 人含有coiIed-coil-helix-coiled-coil-helix结构域的8(CICHD8),mRNA. 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_016565_siRNA_115 115 UCAGUCCCUCAAGGCCAUA(SEQ ID NO:256) UAUGGCCUUGAGGGACUGA(SEQ ID NO:254) ORF 52.63157895 NM_016565_siRNA_138 138 GACCCAACGGGUGAAGAAA(SEQ ID NO:255) UUUCUUCACCCGUUGGGUC(SEQ ID NO:256) ORF 52.63157895 NM_016565_siRNA_140 140 CCCAACGGGUGAAGAAAGA(SEQ ID NO:257) UCUUUCUUCACCCGUUGGG(SEQ ID NO:258) ORF 52.63157895
基因名称 EIF3S10 GenBank编号 NM 003750 GI: 4503508 生物 人 长度 5256 ORF区域 114-4262 基因座 8661 Blast数据库 人 ORFGC% 46.81 定义 人真核细胞翻译启动因子3,亚基θ,150/170kDa(EIF3S10),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_003750_siRNA_298 298 GCAAGAGCCACUUGGCAAA(SEO ID NO:259) UUUGCCAAGUGGCUCUUGC(SEQ ID NO:260) ORF 52.63157895 NM_003750_siRNA_440 440 GCAGAUGGUCUUAGAUAUA(SEQ ID NO:261) UAUAUCUAAGACCAUCUGC(SEQ ID NO:262) ORF 36.84210526
NM_003750_siRNA_626 626 GCGCCUGUACCAUGAUAUU(SEQ ID NO:263) AAUAUCAUGGUACAGGCGC(SEQ ID NO:264) ORF 47.36842105 NM_003750_siRNA_635 635 CCAUGAUAUUGCCCAGCAA(SEQ ID NO:265) UUGCUGGGCAAUAUCAUGG(SEQ ID NO:266) ORF 47.36842105 NM_003750_siRNA_1328 1328 GCGAGUCACAAAGGUUCUA(SEQ ID NO:267) UAGAACCUUUGUGACUCGC(SEO ID NO:268) ORF 47.36842105
基因名称 ERBB2IP GenBank编号 NM 018695 GI: 56237019 生物 人 长度 6916 ORF区域 309-4424 基因座 55914 Blast数据库 人 0RFGC% 38.63 定义 人erbb2相互作用蛋白(ERBB2IP),转录物变体2,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_018695_siRNA_899 899 GGAAGUGCCUGAAGUACUU(SEQ ID NO:269) AAGUACUUCAGGCACUUCC(SEQ ID NO:270) ORF 47.36842105 NM_018695_siRNA_920 920 GCAACUAAGUGGAUUGAAA(SEQ ID NO:271) UUUCAAUCCACUUAGUUGC(SEQ ID NO:272) ORF 36.84210526 NM_018695_siRNA_1106 1106 GCAGCUUCCUGAGACUAUU(SEQ ID NO:273) AAUAGUCUCAGGAAGCUGC(5EQ ID NO:274) ORF 47.36842105 NM_018695_siRNA_1598 1598 GCCAAGGACUGAGGAUGUU(SEQ ID NO:275) AACAUCCUCAGUCCUUGGC(SEQ ID NO:276) ORF 52.63157895 NM_018695_siRNA_2568 2568 GCUGAUGACACUCACAAAU(SEO ID NO:277) AUUUGUGAGUGUCAUCAGC(SEQ ID NO:278) ORF 42.10526316 NM_018695_siRNA_3434 3434 CCAUUUACAUCAGAGACUU(SEQ ID NO:279) AAGUCUCUGAUGUAAAUGG(SEQ ID NO:280) ORF 36.84210526
基因名称 FER1L3 GenBank编号 NM 013451 GI: 19718757 生物 人 长度 6829 ORF区域 89-6274 基因座 26509 Blast数据库 人 ORFGC% 47.63 定义 人fer-1样3,myofelin(线虫(C.elegans))(FER1L3),转录物变体1.mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_013451_siRNA_1529 1529 GCUGCAUCAUAUACAGUAA(SEQ ID NO:281) UUACUGUAUAUGAUGCAGC(SEQ ID NO:282) ORF 36.84210526 NM_013451_siRNA_1589 1589 CCUUGUUACCUGAAUCUUU(SEQ ID NO:283) AAAGAUUCAGGUAACAAGG(SEQ ID NO:284) ORF 36.84210526 NM_013451_siRNA_1747 1747 GCUUGAGCCCAUUUCAAAU(SEQ ID NO:285) AUUUGAAAUGGGCUCAAGC(SEQ ID NO:286) ORF 42.10526316 NM_013451_siRNA_3081 3081 CCAUUCCUCCUGAUCAUAA(SEQ ID NO:287) UUAUGAUCAGGAGGAAUGG(SEQ ID NO:288) ORF 42.10526316 NM013451_siRNA_5017 5017 CCGAUUCCUUUCCCGCUUU(SEQ ID NO:289) AAAGCGGGAAAGGAAUCGG(SEQ ID NO:290) ORF 52.63157895
基因名称 FER1L3 GenBank编号 NM 013337 GI: 19718758 生物 人 长度 6790 ORF区域 89-6235
基因座 26509 blast数据库 人 ORFGC% 47.63 定义 人fer-1样3,mvoferlin(线虫)(FER1L3),转录物变体2,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_133337_siRNA_1501 1501 GGAAGUAAACACAGGAGAA(SEQ ID NO:291) UUCUCCUGUGUUUACUUCC(SEQ ID NO:292) ORF 42.10526316 NM_133337_siRNA_1550 1550 CCUUGUUACCUGAAUCUUU(SEQ ID NO:293) AAAGAUUCAG6UAACAAGG(SEQ ID NO:294) ORF 36.84210526 NM_133337_siRNA_1708 1708 GCUUGAGCCCAUUUCAAAU(SEO ID NO:295) AUUUGAAAUGGGCUCAAGC(SEQ ID NO:296) 0RF 42.10526316 NM_133337_siRNA_3042 3042 CCAUUCCUCCUGAUCAUAA(SEQ ID N0:297) UUAUGAUCAGGAGGAAUGG(SEQ ID NO:298) ORF 42.10526316
基因名称 FKBP8 GenBank编号 NM 012181 GI: 52630439 生物 人 长度 1787 ORF区域 114-1355 基因座 23770 Blast数据库 人 ORF GC% 62.08 定义 人FK506结合蛋白8.3kDa(FKBP8),mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ NM_012181_siRNA_855 855 GCCAUCAAGGCUAUCACCU(SEQ ID NO:299) AGGUGAUAGCCUUGAUGGC(SEQ ID NO:300) ORF 52.63157895 NM_012181_siRNA_916 916 UGCUGCAGUUGAAGGUGAA(SEQ ID NO:301) UUCACCUUCAAOUGCAGGA(SEQ ID NO:302) ORF 47.36842105 NM_012181_siRNA_1019 1019 CCAGCCAGACAACAUCAAG(SEQ ID NO:303) CUUGAUGUUGUCUGGCUGG(SEQ ID NO: 304) ORF 52.63157895 NM_012181_siRNA_1022 1022 GCCAGACAACAUCAAGGCU(SEQ ID NO:305) AGCCUUGAUGUUGUCUGGC(SEQ ID NO: 306) ORF 52.63157895 NM_012181_siRNA_1141 1141 UCCACGCAGAGCUCUCAAA(SEQ ID NO:307) UUUGAGAGCUCUGCGUGGA(SEQ ID NO: 308) ORF 52.63157895
基因名称 FUSIP1 GenBank编号 NM 006625 GI: 16905515 生物 人 长度 1842 ORF区域 77-628 基因座 10772 Blast数据库 人 ORFGC% 45.66 定义 人FUS相互作用蛋白(富含丝氨酸,精氨酸)1(FUSIP1),转录物变体1,mRNA。 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_06625_siRNA_157 157 GCGUGAAUUUGGUCGUUAU(SEQ ID NO:309) AUAACGACCAAAUUCACGC(SEQ ID HO:310) ORF 42.10526310 NM_006625_siRNA_567 567 GACCAAACUGCAGCUGGAA(SEQ ID NO:311) UUCCAGCUGCAGUUUGGUC(SEQ ID NO:312) ORF 52.63157895 NH一00662S—slRNA一569 569 CCAAACUGCAGCUGGAAUA(SEQ ID NO:313) UAUUCCAGCUGCAGUUUGG(SEQ ID NO:314) ORF 47.36842105
其因名称 FUSIPl GenBank编号 NM 054016 GI: 16905516 生物 人 长度 2924 ORF区域 77-865 基因座 10772 Blast数据库 人 ORFGC% 43.98 定义 人FUS相互作用蛋白(富含丝氨酸/精氨酸)1(FUSP1),转录物变体2,mRNA。 序列 NH_0S4016
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_054016_siRNA_157 157 GOGUGAAUUUGGUCGUUAU(SEQ ID N0:315) AUAACGACCAAAUUCACGC(SEQ ID NO:316) ORF 42.10526316 NM_054016_siRNA_169 169 UCGUUAUGGUCCUAUAGUU(SEO ID NO:317) AACUAUAGGACCAUAACGA(SEQ ID NO:318) ORF 36.84210526 NM_0S4016_siRNA_220 220 CCGUCCAAGAGGAUUUGCU(SEQ ID NO:319) AGCAAAUCCUCUUGGACGG(SEO ID NO:320) ORF 52.63157895
基因名称 GenBank编号 AK 025846 GI: 10438485 生物 人 长度 2388 ORF区域 基因座 Blast数据库 人 ORFGC% 定义 人cDNA:FLJ22193fls,克降HRC01108.gas5 mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% AK025846_siRNA_246 246 GCAGAUGUGCUUCAUGCAU(SEQ ID NO:321) AUGCAUGAAGCACAUCUGC(SEQ ID NO:322) 47.36842105 AK025846_siRNA_1968 1968 GCUAUACCUUUGCUUCUUU(SEQ ID NO:323) AAAGAAGCAAAGGUAUAGC(SEQ ID NO:324) 36.84210526 AK025846_siRNA_2088 208B CCCAACUACUGUUUCAGUU(SEQ ID NO:325) AACUGAAACAGUAGUUGGG(SEQ ID NO:326) 42.10526316 AKOZ5846_siRNA_2287 2287 CCAGGAGCUGGAAUACAAA(SEQ ID NO:327) UUUGUAUUCCAGCUCCUGG(SEQ ID NO:328) 47.36842105 AK025846_siRNA_2296 2296 GGAAUACAAAUGAGGACUU(SEQ ID NO:329) AAGUCCUCAUUUGUAUUCC(SEQ ID NO:330) 36.84210526
基因名称 GATA4 GenBank编号 NM 002052 GI: 33188460 生物 人 长度 3372 ORF区域 519.1847 基因座 2626 Blast数椐库 人 ORFGC% 68.78 定义 人GATA结合蛋白4(GATA4),mRNA
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 区域 NM_002052_siRNA_1158 1158 GGCAGAGAGUGUGUCAACU(SEQ ID NO:331) AGUUGACACACUCUCUGCC(SEQ ID NO:332) ORF 52.63157895 NM_002052_siRNA_1243 1243 GCCUCUACCACAAGAUGAA(SEQ ID NO:333) UUCAUCUUGUGGUAGAGGC(SEQ ID NO:334) ORF 47.36842105 NM_002052_siRNA_1477 1477 GGAAGCCCAAGAACCUGAA(SEQ ID NO:335) UUCAGGUUCUUGGGCUUCC(SEQ ID NO:336) ORF 52.63157895 NM_002052_siRNA_1482 1482 C(CAAGAACCUGAAUAAAU(SEQ ID NO:337) AUUUAUUCAGGUUCUUGGG(SEQ ID NO:338) ORF 36.84210526
基因名称 GRB2 GenBank编号 NM 002086 GI: 45359857 生物 人 长度 3317 ORF区域 358-1011 基因座 2885 Blast数据库 人 ORFGC% 50.77 定义 人生长因子受体结合蛋白2(GRB2),转录物变体1,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002086_siRNA_365 365 CCAUCGCCAAAUAUGACUU(SEQ ID NO:339) AAGUCAUAUUUGGCGAUGG(SEQ ID NO:340) ORF 42.10526316 NM_002086_siRNA_464 464 GGUACAAGGCAGAGCUUAA(SEQ ID NO:341) UUAAGCUCUGCCUUGUACC(SEQ ID NO:342) ORF 47.36842105 NM_002086_siRNA_494 494 GCUUCAUUCCCAAGAACUA(SEQ ID NO:343) UAGUUCUUGGGAAUGAAGC(SEQ ID NO:344) ORF 42.10526316 NM_002086_siRNA_779 779 CCAGAAACCAGCAGAUAUU(SEQ ID NO:345) AAUAUCUGCUGGUUUCUGG(SEQ ID NO:346) ORF 42.10526316 NM_002086_siRNA_840 840 CCAGGCCCUCUUUGACUUU(SEQ ID NO:347) AAAGUCAAAGAGGGCCUGG(SEQ ID NO:348) ORF 52.63157895
基因名称 GTF2E1 GenBank编号 NM 005513 GI: 5031726 生物 人 长度 2969 ORF区域 55-1374 基因座 2960 Blast数据库 人 ORFGC% 47.88 定义 人通用转录因子IIE,多肽1(α亚基,56kD)(GTF2E1),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_005513_siRNA_198 198 GCUGGAGCUGCUCAAGUUU(SEQ ID NO:349) AAACUUGAGCAGCUCCAGC(SEQ ID NO:350) ORF 52.63157895 NM_005513_siRNA_378 378 CCACAUGAGAAGAAGAAUU(SEQ ID NO:351) AAUUCUUCUUCUCAUGUGG(SEQ ID NO:352) ORF 36.84210526 NM_005513_siRNA_885 885 GCCUAUUUGGUUGAGAGAA(SEQ ID NO:353) UUCUCUCAACCAAAUAGGC(SEQ ID NO:354) ORF 42.10526316 NM_005513_siRNA_950 950 GCAUAGAUAUGGACGCAUU(SEQ ID NO:355) AAUGCGUCCAUAUCUAUGC(SEQ ID NO:356) ORF 42.10526316 NM_005513_siRNA_1349 1349 GCAUGUUUGAGGACCUCUU(SEQ ID NO:357) AAGAGGUCCUCAAACAUGC(SEQ ID NO:358) ORF 47.36842105
基因名称 RABL3 GenBank编号 NM 173825 GI: 62751416 生物 人 长度 3449 ORF区域 31-741 基因座 285282 Blast数据库 人 ORFGC% 43.75 定义 人RAB,RAS癌基因家族成员样3(RABL3),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_173825_siRNA_47 47 GGGUGAAGGUACUGGUGUU(SEQ ID NO:359) AACACCAGUACCUUCACCC(SEQ ID NO:360) ORF 52.63157895 NM_173825_siRNA_266 266 GCACAAGAGCAGUAUUCUA(SEQ ID NO:361) UAGAAUACUGCUCUUGUGC(SEQ ID NO:362) ORF 42.10526316 NM_173825_siRNA_467 467 GGACUAAACUGGACCAGAU(SEQ ID NO:363) AUCUGGUCCAGUUUAGUCC(SEQ ID NO:364) ORF 47.36842105 NM_173825_siRNA_528 528 CCUGGCUGAGGAUUUCAAU(SEQ ID NO:365) AUUGAAAUCCUCAGCCAGG(SEQ ID NO:366) ORF 47.36842105
基因名称 HM13 GenBank编号 NM 030789 GI: 30581114 生物 人 长度 1604 ORF区域 115-1248 基因座 81502 Blast数据库 人 ORFGC% 54.77 定义 人组织相容(次要)13(HM13),转录物变体1,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_030789_siRNA_293 293 GCAAGAAUGCUUCAGACAU(SEQ ID NO:367) AUGUCUGAAGCAUUCUUGC(SEQ ID NO:368) ORF 42.10526316 NM_030789_siRNA_420 420 CCUCCUGCUGUCCAUGUAU(SEQ ID NO:369) AUACAUGGACAGCAGGAGG(SEQ ID NO:370) ORF 52.63157895 NM_030789_siRNA_645 645 GCUGAGGAAGCACUGGAUU(SEQ ID NO:371) AAUCCAGUGCUUCCUCAGC(SEQ ID NO:372) ORF 52.63157895 NM_030789_siRNA_870 870 CCUCGAAGCAAACAACUUU(SEQ ID NO:373) AAAGUUGUUUGCUUCGAGG(SEQ ID NO:374) ORF 42.10526316 NM_030789_siRNA_1155 1155 GGAGUCAAAUCCUAAGGAU(SEQ ID NO:375) AUCCUUAGGAUUUGACUCC(SEQ ID NO:376) ORF 42.10526316
基因名称 HNRPL GenBank编号 NM 001533 GI: 52632382 生物 人 长度 2129 ORF区域 12-1781 基因座 3191 Blast数据库 人 ORFGC% 51.53 定义 人异源核核糖核蛋白L(HNRPL),转录物变体1,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001533_siRNA_480 480 GCAGCCGACAACCAAAUAU(SEQ ID NO:377) AUAUUUGGUUGUCGGCUGC(SEQ ID NO: 378) ORF 47.36842105 NM_001533_siRNA_716 716 GGUGGAAUUUGACUCAGUU(SEQ ID NO:379) AACUGAGUCAAAUUCCACC(SEQ ID NO:380) ORF 42.10526316 NM_001533_siRNA_719 719 GGAAUUUGACUCAGUUCAA(SEQ ID NO:381) UUGAACUGAGUCAAAUUCC(SEQ ID NO:382) ORF 36.84210526 NM_001533_siRNA_793 793 GCACUCUGAAGAUCGAAUA(SEQ ID NO:383) UAUUCGAUCUUCAGAGUGC(SEQ ID NO:384) ORF 42.10526316
基因名称 HOXC13 GenBank编号 NM 017410 GI: 24497535 生物 人 长度 2435 ORF区域 116-1108 基因座 3229 Blast数据库 人 ORFGC% 62.34 定义 人同源框(HOXC13),转录物变体1,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_017410_siRNA_154 154 GAGGCUUAUGUACGUCUAU(SEQ ID NO:385) AUAGACGUACAUAAGGCUC(SEQ ID NO:386) ORF 42.10526316 NM_017410_siRNA_912 912 CCUACACUAAGGUGCAGCU(SEQ ID NO:387) AGCUGCACCUUAGUGUAGG(SEQ ID NO:388) ORF 52.63157895
NM_017410_siRNA_1066 1066 GGUGGUCAGCAAAUCGAAA(SEQ ID NO:389) UUUCGAUUUGCUGACCACC(SEQ ID NO:390) ORF 47.36842105 NM_017410_siRNA_1074 1074 GCAAAUCGAAAGCGCCUCA(SEQ ID NO:391) UGAGGCGCUUUCGAUUUGC(SEQ ID NO: 392) ORF 52.63157895
基因名称 HP1BP3 GenBank编号 NM 016287 GI: 56676329 生物 人 长度 1855 ORF区域 101-1762 基因座 50809 Blast数据库 人 ORFGC% 47.24 定义 人异染色质蛋白1,结合蛋白3(HP1BP3),mRNA,也称为HP1-BP74 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_016287_siRNA_576 576 CCAAGAUGGAUGCAAUCUU(SEQ ID NO:393) AAGAUUGCAUCCAUCUUGG(SEQ ID NO:394) ORF 42.10526316 NM_016287_siRNA_990 990 GGCCUCAGCUGUUGAAGAA(SEQ ID NO:395) UUCUUCAACAGCUGAGGCC(SEQ ID NO:396) ORF 52.63157895 NM_016287_siRNA_1112 1112 GGUGGAAGCCUGAUGGAAU(SEQ ID NO:397) AUUCCAUCAGGCUUCCACC(SEQ ID NO:398) ORF 52.63157895
基因名称 HSPC135 GenBank编号 NM 014170 GI: 56549684 生物 人 长度 1364 ORF区域 48-902 基因座 29083 Blast数据库 人 ORFGC% 46.91 定义 人HSPC135蛋白(HSPC135),转录物变体1,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_014170_siRNA_533 533 GGUGGACAUGCCAGGUUAU(SEQ ID NO:399) AUAACCUGGCAUGUCCACC(SEQ ID NO:400) ORF 52.63157895 NM_014170_siRNA_638 638 GGAUAGCGUUGUUGGAAUU(SEQ ID NO:401) AAUUCCAACAACGCUAUCC(SEQ ID NO:402) ORF 42.10526316 NM_014170_siRNA_849 849 GGAAUCCACCUGUUGAGAU(SEQ ID NO:403) AUCUCAACAGGUGGAUUCC(SEQ ID NO:404) ORF 47.36842105 NM_014170_siRNA_854 854 CCACCUGUUGAGAUGCUUU(SEQ ID NO:405) AAAGCAUCUCAACAGGUGG(SEQ ID NO:406) ORF 47.36842105
基因名称 CD200R1 GenBank编号 NM 138806 GI: 41327722 生物 人 长度 2272 ORF区域 234-1280 基因座 131450 Blast数据库 人 ORFGC% 43.18 定义 人CD200受体1(CD200R1),转录物变体1,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_138806_siRNA_341 341 GCAAACUAGCAAGGAGAAU(SEQ ID NO:407) AUUCUCCUUGCUAGUUUGC(SEQ ID NO:408) ORF 42.10526316 NM_138806_siRNA_429 429 GCAGAAGUUAACACUUCAU(SEQ ID NO:409) AUGAAGUGUUAACUUCUGC(SEQ ID NO:410) ORF 36.84210526 NM_138806_siRNA_462 462 GCUACAAAUGCUGUGCUUU(SEQ ID NO:411) AAAGCACAGCAUUUGUAGC(SEQ ID NO:412) ORF 42.10526316 NM_138806_siRNA_590 590 GGAAACCAACUGUACUGAU(SEQ ID NO:413) AUCAGUACAGUUGGUUUCC(SEQ ID NO:414) ORF 42.10526316 NM_138806_siRNA_869 869 GCAAGAAUACUGGAGCAAU(SEQ ID NO:415) AUUGCUCCAGUAUUCUUGC(SEQ ID NO:416) ORF 42.10526316 NM_138806_siRNA_1230 1230 GCAUCUGAGGCAUUACAAA(SEQ ID NO:417) UUUGUAAUGCCUCAGAUGC(SEQ ID NO:418) ORF 42.10526316
基因名称 ID3 GenBank编号 NM 002167 GI: 32171181 生物 人 长度 1203 ORF区域 368-727 基因座 3399 Blast数据库 人 ORFGC% 64.17 定义 人DNA结合3的抑制剂,显性负螺旋-环-螺旋蛋白(ID3),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002167_siRNA_561 561 GCCAGGUGGAAAUCCUACA(SEQ ID NO:419) UGUAGGAUUUCCACCUGGC(SEQ ID NO:420) ORF 52.63157895 NM_002167_siRNA_580 580 GCGCGUCAUCGACUACAUU(SEQ ID NO:421) AAUGUAGUCGAUGACGCGC(SEQ ID NO:422) ORF 52.63157895 NM_002167_siRNA_680 680 GCUCCGGAACUUGUCAUCU(SEQ ID NO:423) AGAUGACAAGUUCCGGAGC(SEQ ID NO:424) ORF 52.63157895
基因名称 IGF2R GenBank编号 NM 000876 GI: 4504610 生物 人 长度 9090 ORF区域 148-7623 基因座 3482 Blast数据库 人 ORFGC% 52.23 定义 人胰岛素样生长因子2受体(IGF2R),mRNA
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_000876_siRNA_461 461 CCAGAUCUCUCCUGGAAUU(SEQ ID NO:425) AAUUCCAGGAGAGAUCUGG(SEQ ID NO:426) ORF 47.36842105 NM_000876_siRNA_558 558 CCUGGGAACUCCUGAAUUU(SEQ ID NO:427) AAAUUCAGGAGUUCCCAGG(SEQ 1D NO:428) ORF 47.36842105 NM_000876_siRNA_649 649 GCAAAUAAGGAGGUGCCAU(SEQ ID NO:429) AUGGCACCUCCUUAUUUGC(SEQ ID NO:430) ORF 47.36842105 NM_000876_siRNA_1146 1146 GCAGCAGGAUGUCUCCAUA(SEQ ID NO:431) UAUGGAGACAUCCUGCUGC(SEQ ID NO:432) ORF 52.63157895 NM_000876_siRNA_1927 1927 GCACCAGUGUUGAGAACUU(SEQ ID NO:433) AAGUUCUCAACACUGGUGC(SEQ ID NO:434) ORF 47.36842105 NM_000876_siRNA_2092 2092 GCCUAUAAAGUUGAGACAA(SEQ ID NO:435) UUGUCUCAACUUUAUAGGC(SEQ ID NO:436) ORF 36.84210526 NM_000876_siRNA_2735 2735 GCAGCCUCCUUCUGGAAUA(SEQ ID NO:437) UAUUCCAGAAGGAGGCUGC(SEQ ID NO:438) ORF 52.63157895 NM_000876_siRNA_3901 3901 GCUGGCGAAUACACUUAUU(SEQ ID NO:439) AAUAAGUGUAUUCGCCAGC(SEQ ID NO:440) ORF 42.10526316 NM_000876_siRNA_6587 6587 GCUUCAGCCUCGGAGAUAU(SEQ ID NO:441) AUAUCUCCGAGGCUGAAGC(SEQ ID NO:442) ORF 52.63157895 NM_000876_siRNA_6849 6849 GGAUAAGACCAAGUCUGUU(sEQ ID NO:443) AACAGACUUGGUCUUAUCC(SEQ ID NO:444) ORF 42.10526316
基因名称 JAK1 GenBank编号 NM 002227 GI: 4504802 生物 人 长度 3541 ORF区域 76-3504 基因座 3716 BIast数据库 人 ORFGC% 47.54 定义 人Janus激酶1(蛋白酪氨酸激酶)(JAK1),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002227_siRNA_297 297 GCUCUGGUAUGCUCCAAAU(SEQ ID NO:445) AUUUGGAGCAUACCAGAGC(SEQ ID NO:446) ORF 47.36842105 NM_002227_siRNA_320 320 CCAUCACCGUUGAUGACAA(SEQ ID NO:447) UUGUCAUCAACGGUGAUGG(SEQ ID NO:448) ORF 47.36842105 NM_002227_siRNA_380 380 CCAAUUGGCAUGGAACCAA(SEQ ID NO:449) UUGGUUCCAUGCCAAUUGG(SEQ ID NO:450) ORF 47.36842105 NM_002227_siRNA_387 387 GCAUGGAACCAACGACAAU(SEQ ID NO:451) AUUGUCGUUGGUUCCAUGC(sEQ ID NO:452) ORF 47.36842105 NM_002227_siRNA_621 621 CCUGGCCAUCUCACACUAU(SEQ ID NO:453) AUAGUGUGAGAUGGCCAGG(SEQ ID NO: 454) ORF 52.63157895 NM_002227_siRNA_626 626 CCAUCUCACACUAUGCCAU(SEQ ID NO:455) AUGGCAUAGUGUGAGAUGG(SEQ ID NO: 456) ORF 47.36842105 NM_002227_siRNA_1511 1511 CCCAGAAGCAGUUCAAGAA(SEQ ID NO:457) UUCUUGAACUGCUUCUGGG(SEQ ID NO:458) ORF 47.36842105 NM_002227_siRNA_1701 1701 GCUGGUGGCUACUAAGAAA(SEQ ID NO:459) UUUCUUAGUAGCCACCAGC(SEQ ID NO:460) ORF 47.36842105 NM_002227_siRNA_1814 1814 GCACGAGAACACACAUCUA(SEQ ID NO:461) UAGAUGUGUGUUCUCGUGC(SEQ ID NO: 462) ORF 47.36842105 NM_002227_siRNA_2022 2022 GGAGAAUAUCAUGGUGGAA(SEQ ID NO:463) UUCCACCAUGAUAUUCUCC(SEQ ID NO:464) ORF 42.10526316
基因名称 KIF13B GenBank编号 NM 015254 GI: 46852171 生物 人 长度 8796 ORF区域 91-5571 基因座 23303 Blast数据库 人 ORFGC% 52.64 定义 人驱动蛋白家族成员13B(KIF13B),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_015254_siRNA_141 141 GCGAGAGACUGACUUGCAU(SEQ ID NO:465) AUGCAAGUCAGUCUCUCGC(SEQ ID NO:466) ORF 52.63157895 NM_015254_siRNA_631 631 CCUUAUGUCGACGGACUUU(SEQ ID NO:467) AAAGUCCGUCGACAUAAGG(SEQ ID NO:468) ORF 47.36842105 NM_015254_siRNA_1374 1374 GCUUGAGAGUCUUGGAAUA(SEQ ID NO:469) UAUUCCAAGACUCUCAAGC(SEQ ID NO:470) ORF 42.10526316 NM_015254_siRNA_1473 1473 GCUUCUGGUGUACUAUUUA(SEQ ID NO:471) UAAAUAGUACACCAGAAGC(SEQ ID NO:472) ORF 36.84210526 NM_015254_siRNA_4479 4479 GCUCCUCAAGUCUCUCUUU(SEQ ID NO:473) AAAGAGAGACUUGAGGAGC(SEQ ID NO:474) ORF 47.36842105
基因名称 MK167 GenBank编号 NM 002417 GI: 19923216 生物 人 长度 12515 ORF区域 197-9967 基因座 4288 Blast数据库 人 ORFGC% 47.35 定义 由单克隆抗体KI-67识别的人抗原(MKI67),mRNA 名称 起点 有义RN序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002417_siRNA_727 727 GGGAACAACUAAUGUUCAU(SEQ ID NO:475) AUGAACAUUAGUUGUUCCC(SEQ ID NO:476) ORF 36.84210526 NM_002417_siRNA_1913 1913 GCACAAAGCUUGGUUAUAA(SEQ ID NO:477) UUAUAACCAAGCUUUGUGC(SEQ ID NO:478) ORF 36.84210526 NM_002417_siRNA_3621 3621 GCACAAAGCAAUGGCCUAA(SEQ ID NO:479) UUAGGCCAUUGCUUUGUGC(SEQ ID NO:480) ORF 47.36842105 NM_002417_siRNA_6317 6317 GCGUUUAAGGAAUCUGCAA(SEQ ID NO:481) UUGCAGAUUCCUUAAACGC(SEQ ID NO:482) ORF 42.10526316 NM_002417_siRNA_8846 8846 GCAUUUAAGCAACCUGCAA(SEQ ID NO:483) UUGCAGGUUGCUUAAAUGC(SEQ ID NO:484) ORF 42.10526316 NM_002417_siRNA_9505 9505 GCAAAUAACUGAGGUCUUU(SEQ ID NO:485) AAAGACCUCAGUUAUUUGC(SEQ ID NO:486) ORF 36.84210526
基因名称 LIPC GenBank编号 NM 000236 GI: 4557722 生物 人 长度 1603 ORF区域 58-1557 基因座 3990 Blast数据库 人 ORFGC% 52.34 定义 人脂酶,肝(LIPC),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_000236_siRNA_122 122 CCCUUGGACAAAGCCUGAA(SEQ ID NO:487) UUCAGGCUUUGUCCAAGGG(SEQ ID NO:488) ORF 52.63157895 NM_000236_siRNA_646 646 GGACCUUUGUUUGAGGGAA(SEQ ID NO:489) UUCCCUCAAACAAAGGUCC(SEQ ID NO:490) ORF 47.36842105 NM_000236_siRNA_767 767 CCAUAGGACACUAUGACUU(SEQ ID NO:491) AAGUCAUAGUGUCCUAUGG(SEQ ID NO:492) ORF 42.10526316 NM_000236_siRNA_1058 1058 GCAAGAGCAAGAGGCUCUU(SEQ ID NO:493) AAGAGCCUCUUGCUCUUGC(SEQ ID NO:494) ORF 52.63157895 NM_000236_siRNA_1229 1229 GCAAAGGAAUUGCUAGUAA(SEQ ID NO:495) UUACUAGCAAUUCCUUUGC(SEQ ID NO:496) ORF 36.84210526
基因名称 NFKBIZ GenBank编号 NM 031419 GI: 53832022 生物 人 长度 3938 ORF区域 116-2272 基因座 64332 Blast数据库 人 ORFGC% 53.0 定义 人B细胞K轻链多肽基因增强子核因子抑制因子,ζ(NFKBIZ),转录物变体1,mRNA(MAL) 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_031419_siRNA_490 490 GCACAUCCGAAGUCAUAAA(SEQ ID NO:497) UUUAUGACUUCGGAUGUGC(SEQ ID NO:498) ORF 42.10526316 NM_031419_siRNA_616 616 GCCCGAUUCGUUGUCUGAU(SEQ ID NO:499) AUCAGACAACGAAUCGGGC(SEQ ID NO:500) ORF 52.63157895 NM_031419_siRNA_965 965 GCUUCCCUGUACCAGUAUU(5EQ ID NO:501) AAUACUGGUACAGGGAAGC(SEQ ID NO:502) ORF 47.36842105 NM_0314l9_siRNA_1175 1175 GCUAAUCCCAUGCAGACUU(SEQ ID NO:503) AAGUCUGCAUGGGAUUAGC(SEQ ID NO:504) ORF 47.36842105 NM_031419_siRNA_1494 1494 CCUAUGUUCUUGCAAGAAA(SEQ ID NO:505) UUUCUUGCAAGAACAUAGG(SEQ ID NO:506) ORF 36.84210526 NM_031419_siRNA_1520 1520 GCACUUCACAUGCUGGAUA(SEQ ID NO:507) UAUCCAGCAUGUGAAGUGC(SEQ ID NO:508) ORF 47.36842105 NM_031419_siRNA_1801 1801 CCACAAUGCUGUGGUCCAU(SEQ ID NO:509) AUGGACCACAGCAUUGUGG(SEQ ID NO:510) ORF 52.63157895 NM_031419_siRNA_1816 1816 CCAUGAACUCCAGAGAAAU(SEQ ID NO:511) AUUUCUCUGGAGUUCAUGG(SEQ ID NO:512) ORF 42.10526316 NM_031419_siRNA_1840 1840 GCCUCAUUCACCUGAAGUU(SEQ ID NO:513) AACUUCAGGUGAAUGAGGC(SEQ ID NO:514) ORF 47.36842105 NM_031419_siRNA_2092 2092 GCAGUAUCGGUUGACACAA(SEQ ID NO:515) UUGUGUCAACCGAUACUGC(SEQ ID NO:516) ORF 47.36842105
基因名称 NFKBIZ GenBank编号 NM 0015474 GI: 53832023
生物 人 长度 3782 ORF区域 260-2116 基因座 64332 Blast数据库 人 ORFGC% 49.49 定义 人B细胞K轻链多肽基因增强子核因子抑制因子,ζ(NFKBIZ),转录物变体2,mRNA. 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001005474_siRNA_334 334 GCACAUCCGAAGUCAUAM(SEQ ID NO:517) UUUAUGACUUCGGAUGUGC(SEQ ID NO:518) ORF 42.10526316 NM_001005474_siRNA_460 460 GCCCGAUUCGUUGUCUGAU(SEQ ID NO:519) AUCAGACAACGAAUCGGGC(SEQ ID NO:520) ORF 52.63157895 NM_001001005474_siRNA_809 809 GCUUOCCUGUACCAGUAUU(SEQ ID NO:521) AAUACUGGUACAGGGAAGC(SEQ ID NO:522) ORF 47.36842105 NM_001005474_siRNA_1019 1019 GCUAAUCCCAUGCAGACUU(SEQ ID NO:523) AAGUCUGCAUGGGAUUAGC(sEQ ID NO:524) ORF 47.36842105 NM_001005474_siRNA_1338 1338 CCUAUGUUCUUGCAAGAAA(SEQ ID NO:525) UUUCUUGCAAGAACAUAGG(SEQ ID NO:526) ORF 36.84210526 NM_001005474_SiRNA_1364 1364 GCACUUCACAUGCUGGAUA(SEQ ID NO:527) UAUOCAGCAUGUGAAGUGC(SEQ ID NO:528) ORF 47.36842105 NM_001005474_siRNA_1645 1645 CCACAAU6CUGUGGUCCAU(SEQ ID NO:529) AUGGACCACAGCAUUGUGG(SEQ ID NO:530) ORF 52.63157895 NM_001005474_siRNA_1660 1660 CCAU6AACUCCAGAGAAAU(SEQ ID NO:531) AUUUCUCUGGAGUUCAUGG(SEQ ID NO:532) ORF 42.10S26316 NM_001005474_siRNA_1684 1684 GCCUCAUUCACCUGAAGUU(SE0 ID NO:533) AACUUCAGGUGAAUGAGGC(SEQ ID NO:534) ORF 47.36842105 NM_001005474_siRNA_1936 1936 GCAGUAUCGGUUGACACAA(SEQ ID NO:535) UUGUGUCAACCGAUACUGC(SEQ ID NO:536) ORF 47.36842105
基因名称 MAP3K7IPl GenBank编号 NM006116 GI: 47717114 生物 人 长度 3240 ORF区域 50-1564 基因座 10454 Blast数据库 人 ORFGC% 60.73 定义 人促分裂原激活蛋白激酶激酶激酶7相互作用蛋白1(MAP3K7中1),转录物变体d,mRNA 序列 NM_006116
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_006116_siRNA_219 219 GGAGUGAGAACAACUGCUU(SEQ ID NO:537) AAGCAGUUGUUCUCACUCC(SEO ID NO:538) ORF 47.36842105 NM_006116_siRNA_267 267 GCMCCGAGUGACCAACUU(SEQ ID NO:539) AAGUUGGUCACUCGGUUGC(SEQ ID NO:540) ORF 52.63157895 NM_006116_siRNA_685 685 GGAUGAGCUCUUCcGUCUU(SEQ ID NO:541) AAGACGGAAGAGCUCAUOC(SEQ ID NO:542) ORF 52.631S7895 NM_006116_siRNA_831 831 CCAAGUCCMACCAAUCAU(SEQ ID NO:543) AUGAUUGGUUUGGACUUGG(SEQ ID NO: 544) ORF 42.10526316
基因名称 MAP3K7IPl GenBank编号 NM153497 GI: 47717113
生物 人 长度 1994 ORF区域 50-1438 基因座 10454 Blast数据库 人 ORFGC% 60.12 定义 人促分裂原激活蛋白激酶激酶激酶7相互作用蛋白1,转录物变体B,mRNA. 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_153497_siRNA_219 219 GGAGUGAGAACAACUGCUU(SEQ ID NO:545) AAGCAGUUGUUCUCACUCC(SEQ ID NO:(SEQ ID NO:546) ORF 47.36842105 NM_153497_siRNA_267 267 GCAACCGAGUGACCAACUU(SEQ ID N0:547) AAGUUGGUCACUCGGUUGC(SEQ ID N0:548) 0RF 52.63157895 NN_153497_siRNA_685 685 GGAUGAGCUCUUCCGUCUU(SEQ ID NO:549) MGACGGAAGAGCUCAUCC(SEQ ID N0:550) ORF 52.63157895 NH_153497_siRNA_831 831 CCAAGUCCAAACCAAUCAU(SEQ ID NO:551) AUGAUUGGUUUGGACUUGG(SEQ ID NO: 5521 ORF 42.10526316
基因名称 MAPT GenBank编号 NM 005910 GI: 6754637 生物 人 长度 2796 ORF区域 237-1562 基因座 4137 Blast数据库 人 ORFGC% 58.68 定义 人微管相关蛋白T(MAPT),转录物变体2,n RNA. 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_005910_siRNA_1054 1054 GGAAGGUGCAGAUAAUUAA(SEQ ID NO:553) UUAAUUAUCUGCACCUUCC(SEQ ID NO:554) ORF 36.842105226 NM_005910_siRNA_1147 1147 GCAGUGUGCMAUAGUCUA(SEQ ID NO:555) UAGACUAUUUGCACACUGC(SEQ ID NO:S56) ORF 42.10526316 NM_005910_siRNA_1192 1192 CCUCCAAGUGUGGCUCAUU(SEQ ID NO:557) AAUGAGCCACACUUGGAGG(SEQ ID NO:558) ORF S2.63157895
基因名称 MAPT GenBank编号 NM 016834 GI: 8400710 生物 人 长度 2622 ORF区域 237-1388 基因座 4137 Blast数据库 人 ORFGC% 58.43 定义 人微管相关蛋白T(MAPT),转录物变体3,mRNA.
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_016834_siRNA_877 877 GCGGGAAGGUGCAGAUAAU(SEQ ID NO:559) AUUAUCUGCACCUUCCCGC(SEQ ID NO:560) ORF 52.63157895 NM_016834_siRNA_973 973 GCAGUGUGCAAAUAGUCUA(SEQ ID NO:561) UAGACUAUUUGCACACUGC(SEQ ID NO:562) ORF 42.10526316 NM_016834_siRNA_1018 1018 CCUCCAAGUGUGGCUCAUU(SEQ ID NO:563) AAUGAGCCACACUUGGAGG(SEQ ID NO:564) ORF 52.63157895
基因名称 MAPT GenBank编号 NM 016835 GI: 8400712 生物 人 长度 3747 ORF区域 237-2513 基因座 4137 Blast数据库 人 ORFGC% 60.52 定义 人微管相关蛋白T(MAPT),转录物变体1,mRNA 名称 起点 有义NA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_016835_siRNA_250 250 GCCAGGAGUUCGAAGUGAU(SEQ ID NO:565) AUCACUUCGAACUCCUGGC(SEQ ID NO:566) ORF 52.63157895 NM_016835_siRNA_797 797 GCUCAAGCACCAGCUUCUA(SEQ ID NO:567) UAGAAGCUGGUGCUUGAGC(SEQ ID NO:568) ORF 52.63157895 NM_016835_siRNA_1413 1413 GCCAAGACAUCCACACGUU(SEQ ID NO:569) AACGUGUGGAUGUCUUGGC(SEQ ID NO: 570) ORF 52.63157895 NM_016835_siRNA_2098 2098 GCAGUGUGCAAAUAGUCUA(SEQ ID NO:571) UAGACUAUUUGCACACUGC(SEQ ID NO:572) ORF 42.10526316
基因名称 MGAT1 GenBank编号 NM 002406 GI: 6031182 生物 人 长度 2937 ORF区域 497-1834 基因座 4245 Blast数据库 人 ORFGC% 65.1 定义 人甘露糖(α1,3)糖蛋白β1,2-N 乙酰葡萄糖胺转移酶(MGAT1),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002406_siRNA_541 541 CCUCUUUGUGGCCUGGAAU(SEQ ID NO:573) AUUCCAGGCCACAAAGAGG(SEQ ID NO:574) ORF 52.63157895 NM_002406_siRNA_1026 1026 GCAAGUUCCAGGGCUACUA(SEQ ID NO:575) UAGUAGCCCUGGAACUUGC(SEQ ID NO:576) ORF 52.63157895 NM_002406_siRNA_1668 1668 GGGACAGCUUCAAGGCUUU(SEQ ID NO:577) AAAGCCUUGAAGCUGUCCC(SEQ ID NO:578) ORF 52.63157895
基因名称 MICAL2 GenBank编号 NM 014632 GI: 41281417 生物 人 长度 3934 ORF区域 289-3663 基因座 9645 Blast数据库 人 ORF GC% 53.75 定义 人微管相关一氧化物酶,含calponin和LIM结构域2(MICAL2),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_014632_siRNA_372 372 CCUCCAGGCCUUCAACAUU(SEQ ID NO:579) AAUGUUGAAGGCCUGGAGG(SEQ ID NO: 580) ORF 52.63157895 NM_014632_siRNA_473 473 CCAAAGCOCUGUGGUACAA(SEQ ID NO:581) UUGUACCACAGGGCUUUGG(SEQ ID NO:582) ORF 52.63157895 NM-014632_siRNA_585 585 GCGCACUGCCAUUGMCUU(SEQ ID NO:583) AAGUUCAAUGGCAGUGCGC(SEQ ID NO:584) ORF 52.63157895 NM_014632_siRNA_746 746 CCAUCGACCAUAUCAGUAU(SEQ ID NO:585) AUACUGAUAUGGUCGAUGG(SEQ ID NO:586) ORF 42.10526316 NM_014632_siRNA_753 753 CCAUAUCAGUAUUCGCCAA(SEO ID NO:587) UUGGCGAAUACUGAUAUGG(SEQ ID NO:588) ORF 42.10526316 NM_014632_siRNA_912 912 CCAUUCUCUGUCGGAGUUU(SEQ ID NO:589) AAACUCCGACAGAGAAUGG(SEQ ID N0:590) ORF 47.36842105 NM_014632_siRNA_1136 1136 GCAUAGAUCUUGAGAACAU(SEQ ID N0:591) AUGUUCUCAAGAUCUAUGC(SEQ ID NO:592) ORF 36.84210526 NM-014632_siRNA_1338 1338 GCUGCCAUCCUUAGACUUU(SEQ ID NO:593) AAAGUCUAAGGAUGGCAGC(SEQ ID NO:594) ORF 47.36842105 NM_014632_siRNA_2402 2402 GCAGUAAGGAAGGUGGAAA(SEQ ID NO:595) UUUCCACCUUCCUUACUGC(SEQ ID NO:596) ORF 47.36842105 NM_014632_siRNA_3111 3111 CCAUUUGAGMCAGUGCAU(SEQ ID NO:597) AUGCACUGUUCUCAAAUGG(SEQ ID NO:598) ORF 42.10526316
墓闵危敢 CLEC2D GenBank编号 NM 001004419 GI: 52426781 生物 人 长度 1821 ORE区域 23-607 其l夭I睡 29121 Blast数据库 人 ORF GC% 41.71 定义 人C型凝集素结构域家族2.成员D,转录物变体2.mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001004419_siRNA_506 506 GCCAACUUGUAUGUUGCAA(SEQ ID N0:599) UUGCAACAUACAAGUUGGC(SEQ ID N0:600) ORF 42.10526316 NM_001004419_siRNA_507 507 CCAACUUGUAUGUUGCAAA(SEQ ID N0:601) UUUGCAACAUACAAGUUGG(SEQ ID NO:602) ORF 36.84210526 NM_001004419_siRNA_551 551 CCAAGACCUGUCAUGGUUU(SEQ ID N0:603) AAACCAUGACAGGUCUUGG(SEQ ID NO:604) ORF 47.36842105 NM_001004419_siRNA_582 582 GCAGGAGAGUGUGCCUAUU(SEO ID N0:605) AAUAGGCACACUCUCOUGC(SEQ ID NO:606) ORF 52.63157895
基因名称 CLEC2D GenBank编号 NM 001004420 GI: 52425783
生物 人 长度 1814 ORF区域 23-391 基因座 29121 Blast数据库 人 ORF GC% 41.71 定义 人C型凝集素结构域家族2,成员D,转录物变体3,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_001004420_siRNA_59 59 CCAUCUGAAUUGCCUGCAA(SEQ ID NO:607) UUGCAGGCAAUUCAGAUGG(SEQ ID NO:608) ORF 47.36842105 NM_001004420_siRNA_182 182 GCUGCUUUAAGCGCAAUAA(SEQ ID NO:609) UUAUUGCGCUUAAAGCAGC(SEQ ID NO:610) ORF 42.10526316 NM_001004420_siRNA_220 220 GCCAUCAGUAUGUCUUCAA(SEQ ID NO:611) UUGAAGACAUACUGAUGGC(SEQ ID NO:612) ORF 42.10526316
基因名称 CLEC2D GenBank编号 NM 013269 GI: 52426785 生物 人 长度 1739 ORF区域 23-598 基因座 29121 Blast数据库 人 ORF GC% 42.19 定义 人C型凝集素结构域家族2,成员D,转录物变体1,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_013269_siRNA_402 402 GCCCAUCUGAUCACUGGAU(SEQ ID NO:613) AUCCAGUGAUCAGAUGGGC(SEQ ID NO:614) ORF 52.63157895 NM_013269_siRNA_441 441 GCCAACCAUGGAAAUGGAU(SEQ ID NO:615) AUCCAUUUCCAUGGUUGGC(SEQ ID NO:616) ORF 47.36842105 NM_013269_siRNA_500 500 GCAGGAGAGUGUGCCUAUU(SEQ ID NO:617) AAUAGGCACACUCUCCUGC(SEQ ID NO:618) ORF 52.63157895 NM_013269_siRNA_561 561 GGAAGUGGAUUUGUUCCAA(SEQ ID NO:619) UUGGAACAAAUCCACUUCC(SEQ ID NO:620) ORF 42.10526316
基因名称 ASAM GenBank编号 NM 024769 GI: 41393588 生物 人 长度 2645 ORF区域 360-1481 基因座 79827 Blast数据库 人 ORF GC% 51.61 定义 人脂肪细胞特异黏附分子(ASAM),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_024769_siRNA_391 391 CCUACUAUGUUGGAACCUU(SEQ ID NO:621) AAGGUUCCAACAUAGUAGG(SEQ ID NO:622) ORF 42.10526316 NM_024769_siRNA_682 682 GGUACACCUGUAAGGUUAA(SEQ ID NO:623) UUAACCUUACAGGUGUACC(SEQ ID NO:624) ORF 42.10526316 NM_024769_siRNA_780 780 GGAGAGCUGACAGAAGGAA(SEQ ID NO:625) UUCCUUCUGUCAGCUCUCC(SEQ ID NO:626) ORF 52.63157895 NM_024769_siRNA_1022 1022 GCGAGUAACUGUACAGUAU(SEQ ID NO:627) AUACUGUACAGUUACUCGC(SEQ ID NO:628) ORF 42.10526316 NM_024769_siRNA_1406 1406 CCAUGCUAAUCUGACCAAA(SEQ ID NO:629) UUUGGUCAGAUUAGCAUGG(SEQ ID NO:630) ORF 42.10526316
基因名称 NUMB GenBank编号 NM 003744 GI: 54144623 生物 人 长度 3614 ORF区域 321-2243 基因座 8650 Blast数据库 人 ORF GC% 52.06 定义 人麻木同系物(果蝇)(NUMB),转录物变体3,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_003744_siRNA_700 700 GCUGGAUCUGUCACUGCUU(SEQ ID NO:631) AAGCAGUGACAGAUCCAGC(SEQ ID NO:632) ORF 52.63157895 NM_003744_siRNA_864 864 GGAUCAUUCCGUGUCACAA (SEQ ID NO:633 UUGUGACACGGAAUGAUCC(SEQ ID NO:634) ORF 47.36842105 NM_003744_siRNA_1139 1139 CCAGAAGAUGUCACCCUUU(SEQ ID NO:635) AAAGGGUGACAUCUUCUGG(SEQ ID NO:636) ORF 47.36842105 NM_003744_siRNA_1402 1402 CCUUCCAUGUGCUUGCUAA(SEQ ID NO:637) UUAGCAAGCACAUGGAAGG(SEQ ID NO:638) ORF 47.36842105 NM_003744_siRNA_1615 1615 GGUUAGAAGAGGUGUCUAA(SEQ ID NO:639) UUAGACACCUCUUCUAACC(SEQ ID NO:640) ORF 42.10526316 NM_003744_siRNA_1999 1999 CCACCAGUCCCUUCUUUAA(SEQ ID NO:641) UUAAAGAAGGGACUGGUGG(SEQ ID NO:642) ORF 47.36842105
基因名称 PDE4B GenBank编号 NM 002600 GI: 32171240 生物 人 长度 3186 ORF区域 基因座 5142 Blast数据库 人 ORF GC% 46.32 定义 人磷酸二酯酶4B,cAMP特异(磷酸二酯酶E4愚人同系物,果蝇)(PDE4B),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002600_siRNA_218 218 CCUACAGUUCUUCCAGUAA(SEQ ID NO:643) UUACUGGAAGAACUGUAGG(SEQ ID NO:644) ORF 41.39523496 NM_002600_siRNA_527 527 GCAGAGAGUCAUUUCUCUA(SEQ ID NO:645) UAGAGAAAUGACUCUCUGC(SEQ ID NO:646) ORF 42.10526316 NM_002600_siRNA_945 945 CCAGGUGUCUGAAUACAUU(SEO ID NO:647) AAUGUAUUCAGACACCUGG(SEQ ID NO:648) ORF 42.10526316 NM_002600_siRNA_1499 1499 CCAAUCAGUUUCUCAUCAA(SEQ ID NO:649) UUGAUGAGAAACUGAUUGG(SEO ID NO:650) ORF 36.84210526 NM_002600_siRNA_1763 1763 GCGUUCUUCUCCUAGACAA(SEQ ID NO:651) UUGUCUAGGAGAAGAACGC(SEQ ID NO:652) ORF 47.36842105 NM_002600_siRNA_2050 2050 GCUCAGGACAUUCUCGAUA(SEQ ID NO:653) UAUCGAGAAUGUCCUGAGC(SEQ ID NO:654) ORF 47.36842105
基因名称 ABCB1 GenBank编号 NM 000927 GI: 42741658 生物 人 长度 4872 ORF区域 419-4261 基因座 5243 Blast数据库 人 ORF GC% 43.69 定义 人ATP结合盒,亚家族B(MDR/TAP),成员1(ABCB1),mRNA
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_000927_siRNA_761 761 GCCUAUUAUUACAGUGGAA(SEQ ID NO:655) UUCCACUGUAAUAAUAGGC(SEQ ID NO:656) ORF 36.84210526 NM_000927_siRNA_1330 1330 GCUGAUCUAUGCAUCUUAU(SEQ ID NO:657) AUAAGAUGCAUAGAUCAGC(SEQ ID NO:658) ORF 36.84210526 NM_000927_siRNA_1470 1470 GCAUUGAAGCAUUUGCAAA(SEQ ID NO:659) UUUGCAAAUGCUUCAAUGC(SEQ ID NO:660) ORF 36.84210526 NM_000927_siRNA_1732 1732 GCUGAUGCAGAGGCUCUAU(SEQ ID NO:661) AUAGAGCCUCUGCAUCAGC(SEQ ID NO:662) ORF 52.63157895 NM_000927_siRNA_2309 2309 GCAGGAAAUGAAGUUGAAU(SEQ ID NO:663) AUUCAACUUCAUUUCCUGC(SEQ ID NO:664) ORF 36.84210526 NM_000927_siRNA_2815 2815 GGAUGUGAGUUGGUUUGAU(SEQ ID NO:665) AUCAAACCAACUCACAUCC(SEQ ID NO:666) ORF 42.10526316 NM_000927_siRNA_3915 3915 GCACUAAAGUAGGAGACAA(SEQ ID NO:667) UUGUCUCCUACUUUAGUGC(SEQ ID NO:668) ORF 42.10526316
基因名称 HTRA1 GenBank编号 NM 002775 GI: 73747816 生物 人 长度 2133 ORF区域 113-1555 基因座 5654 Blast数据库 人 ORF GC% 59.26 定义 人HtrA丝氨酸肽酶1(HTRA1),mRNA,(PRSS11) 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002775_siRNA_597 597 CCAACAGUUUGCGCCAUAA(SEQ ID NO:669) UUAUGGCGCAAACUGUUGG(SEQ ID NO:670) ORF 47.36842105 NM_002775_siRNA_716 716 GCUAGUGGGUCUGGGUUUA(SEQ ID NO:671) UAAACCCAGACCCACUAGC(SEQ ID NO:672) ORF 52.63157895 NM_002775_siRNA_1073 1073 GCCAUCAUCAACUAUGGAA(SEQ ID NO:673) UUCCAUAGUUGAUGAUGGC(SEQ ID NO:674) ORF 42.10526316 NM_002775_siRNA_1114 1114 CCUGGACGGUGAAGUGAUU(SEQ ID NO:675) AAUCACUUCACCGUCCAGG(SEQ ID NO:676) ORF 52.63157895 NM_002775_siRNA_1535 1535 CCCGAAGAAAUUGACCCAU(SEQ ID NO:677) AUGGGUCAAUUUCUUCGGG(SEQ ID NO:678) ORF 47.36842105
基因名称 NPEPPS GenRank编号 NM 006310 GI: 15451906 生物 人 长度 4177 ORF区域 196-2823 基因座 9520 BIast数据库 人 ORF GC% 44.79 定义 人氨肽酶嘌呤霉素敏感(NPEPPS).mRNA 序列 NM_006310
名称 起点 有义RNA序5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_006310_siRNA_1939 1939 GCUCGAGCUGGAAUCAUUA(SEQ ID NO:679) UAAUGAUUCCAGCUCGAGC(SEQ ID NO:680) ORF 47.36842105 NM_006310_siRNA_2539 2539 GCUGCUUGGAAAUUCAUAA(SEQ ID NO:681) UUAUGAAUUUCCAAGCAGC(SEO ID NO:682) ORF 36.84210526 NM_006310_siRNA_2622 2622 GCUAUCAGUUGAGGGAUUU(SEQ ID NO:683) AAAUCCCUCAACUGAUAGC(SEQ ID NO:684) ORF 42.10526316
基因名称 PSMA7 GenBanK编号 NM 002792 GI: 23110945 生物 人 长度 984 ORF区域 116-862 基因座 5688 Blast数据库 人 ORF GC% 50.47 定义 人蛋白酶体(蛋白酶体,巨蛋白因子)亚基,α型,7(DSA77),转录物变体1,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002792_siRNA_266 266 GCCAAACUGCAGGAUGAAA(SEQ ID NO:685) UUUCAUCCUGCAGUUUGGC(SEQ ID NO:686) ORF 47.36842105 NM_D02792_siRNA_300 300 UCUGUGCUUUGGAUGACAA(SEQ ID NO:687) UUGUCAUCCAAAGCACAGA(SEO ID NO:688) ORF 42.10526316 NM_002792_siRNA_348 348 CCGAUGCAAGGAUAGUCAU(SEQ ID NO:689) AUGACUAUCCUUGCAUCGG(SEQ ID NO:690) ORF 47.36842105
基因名称 PIS GenBanK编号 NM 000317 GI: 4506330 生物 人 长度 921 ORF区域 69-506 基因座 5805 Blast数据库 人 ORF GC% 43.16 定义 人6-丙酮酰四氢蝶呤合成酶(PTS),mRNA
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_000317_siRNA_137 137 CCACCGAUUGUACAGUAAA(SEQ ID NO:691) UUUACUGUACAAUCGGUGG(SEQ ID NO:692) ORF 42.10526316 NM_000317 siRNA_275 275 GGUUAUGAAUCUGGCUGAU(SEQ ID NO:693) AUCAGCCAGAUUCAUAACC(SEQ ID NO:694) ORF 42.10526316 NM_000317_siRNA_413 413 GGACAACCUCCAGAAAGUU(SEQ ID NO:695) AACUUUCUGGAGGUUGUCC(SEQ ID NO:696) ORF 47.36842105
基因名称 RIN2 GenBank编号 NM 018993 GI: 35493905 生物 人 长度 4259 ORF区域 37-2724 基因座 54453 Blast数据库 人 ORF GC% 55.92 定义 人Ras和Rab结合因子2(RIN2),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_018993_siRNA_471 471 GGAAUUUGCCAUAAAGGAA(SEQ ID NO:697) UUCCUUUAUGGCAAAUUCC(SEQ ID NO:698) ORF 36.84210526 NM_018993_SiRNA_569 569 GCAGGGAUGUUCUACCAUU(SEQ ID NO:699) AAUGGUAGAACAUCCCUGC(SEQ ID NO:700) ORF 47.36842105 NM_018993_siRNA_1034 1034 GCAUGCCAGAAACAGUCAA(SEQ ID NO:701) UUGACUGUUUCUGGCAUGC(SEO ID NO:702) ORF 47.36842105 NM_018993_siRNA_1376 1376 GCAUGCCUCUGUUUGGCUA(SEQ ID NO:703) UAGCCAAACAGAGGCAUGC(SEQ ID NO:704) ORF 52.63157895 NM_018993_siRNA_2236 2236 GGAGGCUAUUACUUGACAA(SEQ ID NO:705) UUGUCAAGUAAUAGCCUCC(SEQ ID NO:706) ORF 42.10526316
基因名称 ROR1 GenBank编号 NM 005012 GI: 4826867 生物 人 长度 3358 ORF区域 376-3189 基因座 4919 Blast数据库 人 ORF GC% 47.45 定义 人受体酪氨酸激酶样孤儿受体1(ROR1),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_005012_siRNA_932 932 CCGUCUAUAUGGAGUCUUU(SEQ ID NO:707) AAAGACUCCAUAUAGACGG(SEQ ID NO:708) ORF 42.10526316 NM_005012_siRNA_1543 1543 GCUUGCGAUUCAAAGGAUU(SEQ ID NO:709) AAUCCUUUGAAUCGCAAGC(SEQ ID NO:710) ORF 42.10526316 NM_005012_siRNA_1920 1920 GCAAUGGAUGGAAUUUCAA(SEQ ID NO:711) UUGAAAUUCCAUCCAUUGC(SEQ ID NO:712) ORF 36.84210526 NM_005012_siRNA_2817 2817 GCGAUUCAUUCCCAUCAAU(SEQ ID NO:713) AUUGAUGGGAAUGAAUCGC(SEQ ID NO:714) ORF 42.10526316 NM_005012_siRNA_3031 3031 CCACACAUGUCAAUUCCAA(SEQ ID NO:715) UUGGAAUUGACAUGUGUGG(SEQ ID NO: 716) ORF 42.10526316
生物 人 长度 1657 ORF区域 287-1228 基因座 10670 Blast数据库 人 ORF GC% 51.39 定义 人Ras相关GTP结合A(RRAGA),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_006570_siRNA_351 351 GCAUGAGGUCGAUAAUCUU(SEQ ID NO:717) AAGAUUAUCGACCUCAUGC(SEQ ID NO:718) ORF 42.10526316 NM_006570_siRNA_510 510 CCAGCCAGGGAGACAAUAU(SEQ ID NO:719) AUAUUGUCUCGCUGGCUGG(SEQ ID NO: 720) ORF 52.63157895 NM_006570_siRNA_673 673 GGAUCUGGUUCAGGAGGAU(SEQ ID NO:721) AUCCUCCUGAACCAGAUCC(SEQ ID NO:722) ORF 52.63157895 NM_006570_siRNA_1056 1056 CCAACUUCGCUGCUUUCAU(SEQ ID NO:723) AUGAAAGCAGCGAAGUUGG(SEQ ID NO:724) ORF 47.36842105
基因名称 RYK GenBank编号 NM 002958 GI: 54607017 生物 人 长度 2951 ORF区域 97-1914 基因座 6259 Blast数据库 人 ORF GC% 42.38 定义 人RYK受体样酪氨酸激酶(RYK),转录物变体2,mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_002958_siRNA_558 558 GCUUUCCUGUACUGGCAAA(SEQ ID NO:725) UUUGCCAGUACAGGAAAGC(SEQ ID NO:726) ORF 47.36842105 NM_002958_siRNA_748 748 GCAGCUCCAACCACUUCUA(SEQ ID NO:727) UAGAAGUGGUUGGAGCUGC(SEQ ID NO:728) ORF 52.63157895 NM_002958_siRNA_1367 1367 GCAAGUUAGUAGAGGCCAA(SEQ ID NO:729) UUGGCCUCUACUAACUUGC(SEQ ID NO:730) ORF 47.36842105 NM_002958_siRNA_1413 1413 CCUGGUACACAUGGCUAUU(SEQ ID NO:731) AAUAGCCAUGUGUACCAGG(SEQ ID NO:732) ORF 47.36842105 NM_002958_siRNA_1779 1779 GCCAAUCAACUGUCCUGAU(SEQ ID NO:733) AUCAGGACAGUUGAUUGGC(SEQ ID NO:734) ORF 47.36842105
基因名称 S100A6 GenBank编号 NM 014624 GI: 52352807 生物 人 长度 683 ORF区域 315-587 基因座 6277 Blast数据库 人 ORF GC% 56.05 定义 人S100钙结合蛋白A6(钙周期蛋白)(S100A6),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_014624_siRNA_455 455 GCUGCAGGAUGCUGAAAUU(SEQ ID NO:735) AAUUUCAGCAUCCUGCAGC(SEO ID NO:736) ORF 47.36842105 NM_014624_siRNA_474 474 GCAAGGCUGAUGGAAGACU(SEQ ID NO:737) AGUCUUCCAUCAGCCUUGC(SEQ ID NO:738) ORF 52.63157895 NM_014624_siRNA_479 479 GCUGAUGGAAGACUUGGAC(SEQ ID NO:739) GUCCAAGUCUUCCAUCAGC(SEQ ID NO:740) ORF 52.63157895
基因名称 S100A1 GenBank编号 NM 06271 GI: 5454031 生物 人 长度 607 ORF区域 114-398 基因座 6271 Blast数据库 人 ORF GC% 55.44 定义 人S100钙结合蛋白A1(S100A1),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_006271_siRNA_136 136 CGAUGGAGACCCUCAUCAA(SEQ ID NO:741) UUGAUGAGGGUCUCCAUCG(SEQ ID NO:742) ORF 52.63157895 NM_06271_siRNA_137 137 GAUGGAGACCCUCAUCAAC(SEQ ID NO:743) GUUGAUGAGGGUCUCCAUC(SEQ ID NO:744) ORF 52.63157895
基因名称 SCMH1 GenBank编号 NM 012236 GI: 6912641 生物 人 长度 3250 ORF区域 485-2260 基因座 22955 Blast数据库 人 ORF GC% 54.79 定义 人scmh1中足性梳同源物1(果蝇)(SCMH1),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_012236_siRNA_876 876 GGAAGAACCCUCAUUUCAU(SEQ ID NO:745) AUGAAAUGAGGGUUCUUCC(SEQ ID NO:746) ORF 42.10526316 NM_012236_siRNA_1632 1632 GGGAACAGCAUACCCUCAA(SEQ ID NO:747) UUGAGGGUAUGCUGUUCCC(SEQ ID NO:748) ORF 52.63157895 NM_012236_siRNA_1743 1743 CCUUUACACAGACUCACUU(SEQ ID NO:749) AAGUGAGUCUGUGUAAAGG(SEQ ID NO:750) ORF 42.10526316 NM_012236_siRNA_1804 1804 CCUACCAGGUGAAACCUUU(SEQ ID NO:751) AAAGGUUUCACCUGGUAGG(SEQ ID NO:752) ORF 47.36842105
基因名称 SERP1 GenBank编号 NM 014445 GI: 19923408 生物 人 长度 2488 ORF区域 316-516 基因座 27230 Blast数据库 人 ORF GC% 50.25 定义 人应激相关内质网蛋白1(SERP1),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_014445_siRNA_323 323 CCAGCAAAGGAUCCGUAU(SEQ ID NO:753) AUACGGAUCCUUUGCUUGG(SEQ ID NO:754) ORF 47.36842105 NM_014445_siRNA_434 434 CCUGGUUAUUGGCUCUCUU(SEQ ID NO:755) AAGAGAGCCAAUAACCAGG(SEQ ID NO:756) ORF 47.36842105 NM_014445_siRNA_437 437 GGUUAUUGGCUCUCUUCAU(SEQ ID NO:757) AUGAAGAGAGCCAAUAACC(SEQ ID NO:758) ORF 42.10526316
基因名称 SRP19 GenBank编号 NM 003135 GI: 4507212 生物 人 长度 894 ORF区域 82-516 基因座 6728 Blast数据库 人 ORF GC% 41.38 定义 人信号识别颗粒19kDa(SRP19),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_003135_siRNA_110 110 CCGACCAGGACAGGUUUAU(SEQ ID NO:759) AUAAACCUGUCCUGGUCGG(SEQ ID NO:760) ORF 52.63157895 NM_003135_siRNA_244 244 GCAGUUGGACUUAACGUAU(SEQ ID NO:761) AUACGUUAAGUCCAACUGC(SEQ ID NO:762) ORF 42.10526316 NM_003135_siRNA_454 454 GCUGACCAAAGUCUUCAAC(SEO ID NO:763) GUUGAAGACUUUGGUCAGC(SEQ ID NO:764) ORF 47.36842105
基因名称 TPM1 GenBank编号 NM 000366 GI: 63252894 生物 人 长度 1294 ORF区域 192-1046 基因座 7168 Blast数据库 人 ORF GC% 50.77 定义 人原肌球蛋白1(TPM1),mRNA 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_000366_siRNA_688 688 CCCGUAAGCUGGUCAUCAU(SEQ ID NO:765) AUGAUGACCAGCUUACGGG(SEQ ID NO:766) ORF 52.63157895 NM_000366_siRNA_915 915 GCGGAGAGGUCAGUAACUA(SEQ ID NO:767) UAGUUACUGACCUCUCCGC(SEQ ID NO:768) ORF 52.63157895 NM_000366_siRNA_1020 1020 GCUCUCAACGAUAUGACUU(SEQ ID NO:769) AAGUCAUAUCGUUGAGAGC(SEQ ID NO:770) ORF 42.10526316
基因名称 TRIM52 GenBank编号 NM 032765 GI: 34147443 生物 人 长度 2244 ORF区域 306-1199 基因座 84851 Blast数据库 人 ORF GC% 48.77 定义 人含三联基元52(TRIM52),mRNA 名称 起点 有义RNA5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_032765_siRNA_1115 1115 CCAGGAAAUAAAGUUGGAA(SEQ ID NO:771) UUCCAACUUUAUUUCCUGG(SEQ ID NO:772) ORF 36.84210526 NM_032765_siRNA_1142 1142 GGUGGGAAUACUUCAGAUA(SEQ ID NO:773) UAUCUGAAGUAUUCCCACC(SEQ ID NO:774) ORF 42.10526316 NM_032765_siRNA_1145 1145 GGGAAUACUUCAGAUAGAG(SEQ ID NO:775) CUCUAUCUGAAGUAUUCCC(SEQ ID NO:776) ORF 42.10526316 NM_032765_siRNA_1171 1171 GCAUUCACAGCAAGGCCUA(SEQ ID NO:777) UAGGCCUUGCUGUGAAUGC(SEQ ID NO:778) ORF 52.63157895
基因名称 MTHFD1 GenBank编号 NM 005956 GI: 13699867 生物 人 长度 3110 ORF区域 54-2861 基因座 4522 Blast数据库 人 ORF GC% 49.11 定义 NM_005956
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_005956_slRNA_184 184 GCAACAGAGAUGAUUCCAA(SEQ ID NO:779) UUGGAAUCAUCUCUGUUGC(SEQ ID NO:780) ORF 42.10526316 NM_005956_siRNA_696 696 GCAACUGGUCAGCCUGAAA(SEQ ID NO:781) UUUCAGGCUGACCAGUUGC(SEQ ID NO:782) ORF 52.63157895 NM_005956_siRNA_1429 1429 CCAUUGAUGCUCGGAUAUU(SEQ ID NO:783) AAUAUCCGAGCAUCAAUGG(SEQ ID NO:784) ORF 42.10526316 NM_005956_siRNA_1780 1780 CCACUUCUCUAGAAGACAU(SEQ ID NO:785) AUGUCUUCUAGAGAAGUGG(SEQ ID NO:786) ORF 42.10526316 NM_005956_siRNA_2482 2482 GCAGCUUCCAGCUCCUUUA(SEQ ID NO:787) UAAAGGAGCUGGAAGCUGC(SEQ ID NO:788) ORF 52.63157895
基因名称 UBE1C GenBank编号 NM 003968 GI: 38045941 生物 人 长度 2136 ORF区域 21-1412 基因座 9039 Blast数据库 人 ORF GC% 42.25 定义
NM_003968
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_003968_siRNA_133 133 GGAACCAUGUAAAGAAGUU(SEQ ID NO:789) AACUUCUUUACAUGGUUCC(SEQ ID NO:790) ORF 36.84210526 NM_003968_siRNA_393 393 GCUGAAGUUGCUGCAGAAU(SEQ ID NO:791) AUUCUGCAGCAACUUCAGC(SEQ ID NO:792) ORF 47.36842105 NM_003968_siRNA_594 594 CCAAGCUCCAUUGUCCCUU(SEQ ID NO:793) AAGGGACAAUGGAGCUUGG(SEQ ID NO:794) ORF 52.63157895 NM_003968_siRNA_1023 1023 GCAUACAUUOCCUUGAAUA(SEO ID NO:795) UAUUCAAGGGAAUGUAUGC(SEQ ID NO:796) ORF 36.84210526 NM_003968_siRNA_1197 1197 GCUUCUCUGCAAAUGAAAU(SEQ ID NO:797) AUUUCAUUUGCAGAGAAGC(SEQ ID NO:798) ORF 36.84210526
基因名称 UBE1C GenBank编号 NM 198195 GI: 38045943 生物 人 长度 2094 ORF区域 21-1370 基因座 9039 Blast数据库 人 ORF GC% 42.08 定义 NM_198195 序列
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_198195_siRNA_35 35 GGAGCCAAUGGCUGUUGAU(SEQ ID NO:799) AUCAACAGCCAUUGGCUCC(SEQ ID NO:800) ORF 52.63157895 NM_198195_siRNA_91 91 GGAACCAUGUAAAGAAGUU(SEQ ID NO:801) AACUUCUUUACAUGGUUCC(SEQ ID NO:802) ORF 36.84210526 NM_198195_siRNA_351 351 GCUGAAGUUGCUGCAGAAU(SEQ ID NO:803 AUUCUGCAGCAACUUCAGC(SEQ ID NO:804) ORF 47.36842105 NM_198195_siRNA_552 552 CCAAGCUCCAUUGUCCCUU(SEO ID NO:805) AAGGGACAAUGGAGCUUGG(SEQ ID NO:806) ORF 52.63157895 NM_198195_siRNA_981 981 GCAUACAUUCCCUUGAAUA(SEQ ID NO:807) UAUUCAAGGGAAUGUAUGC(SEQ ID NO:808) ORF 36.84210526 NM_198195_siRNA_1155 1155 GCUUCUCUGCAAAUGAAAU AUUUCAUUUGCAGAGAAGC ORF 36.84210526
基因名称 UBE1C GenBank编号 NM 198197 GI: 38045945 生物 人 长度 2015 ORF区域 200-1291 基因座 9039 Blast数据库 人 ORF GC% 40.39 定义 NM_198197 序列
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NN_198197_siRNA_272 272 GCUGAAGUUGCUGCAGAAU(SEO ID NO:809) AUUCUGCAGCAACUUCAGC(SEQ ID NO:810) ORF 47.36842105 NM_198197_siRNA_473 473 CCAAGCUCCAUUGUCCCUU(SEQ ID NO:811) AAGGGACAAUGGAGCUUGG(SEQ ID NO:812) oRF 52.63157895 NM_198197_siRNA_902 902 GCAUACAUUCCCUUGAAUA(SEQ ID NO:813) UAUUCAAGGGAAUGUAUGC(SEQ ID NO:814) ORF 36.84210526 NM_198197_siRNA_1076 1076 GCUUCUCUGCAAAUGAAAU(SEQ ID NO:815) AUUUCAUUUGCAGAGAAGC(SEQ ID NO:816) ORF 36.84210526
基因名称 ZNF207 GenBank编号 NM 003457 GI: 75750493 生物 人 长度 2348 ORF区域 204-1640 基因座 7756 Blast数据库 人 ORFGC% 48.3 定义 NM_003457 序列
名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_003457_siRNA_888 888 GCGCCAGGUAUUCUUAAUA(SEO ID NO:819) UAUUAAGAAUACCUGGGGC(SEQ ID NO:820) ORF 42.10526316 NM_003457_siRNA_1014 1014 GCUUCAUCCAAUUCAGAAA(SEQ ID NO:821) UUUCUGAAUUGGAUGAAGC(SEQ ID NO:822) ORF 36.84210526 NM_003457_siRNA_1230 1230 CCAGCGGCUUCAAUAACAA(SEQ ID NO:823) UUGUUAUUGAAGCCGCUGG(SEO ID NO:824) ORF 47.36842105 NM_003457_siRNA_1257 1257 GCUACACUUACAACAACUA(SEQ ID NO:825) UAGUUGUUGUAAGUGUAGC(sEQ ID NO: 826) ORF 36.84210526
基因名称 ZNF7 GenBank编号 NM 003416 GI: 4508034 生物 人 长度 2351 ORF区域 239-2299 基因座 7553 Blast数据库 人 ORFGC% 48.62 定义 NM_003416 序列 名称 起点 有义RNA序列5′-3′ 反义RNA序列5′-3′ 区域 GC% NM_003416_stealth_1839 1839 UCAGUAUGAGCACACAGCUUACAAU(SEQ ID NO:827) AUUGUAAGCUGUGUGCUCAUACUGA(SEQ ID NO: 828) ORF 40 NM_003416_stealth_1843 1843 UAUGAGCACACAGCUUACAAUACAU(SEQ ID NO:829) AUGUAUUGUAAGCUGUGUGCUCAUA(SEQ ID NO: 830) ORF 36 NM_003416_stealth_1848 1848 GCACACAGCUUACAAUACAUCAAAG(SEQ ID CUUUGAUGUAUUGUAAGCUGUGUGC(SEO ID NO: ORF 40
No:831) 832) NM_003416_steaith_2089 2089 AGGGUCCACCUUUGUGAGCCGUAAA(SEQ ID NO:833) UUUACGGCUCACAAAGGUGGACCCU(SEQ ID NO: 834) ORF 52 NM_003416_steaith_2163 2163 UAUUUAGGUGGCGUUCACACCUAAU(SEQ ID NO:835) AUUAGGUGUGAACGCCACCUAAAUA(SEQ ID NO: 836 ORF 40
本申请要求以2004年10月27日提交的流水号为60/622,486美国 临时申请作为优先权基础,其全部内容通过援引纳入本文。
致谢
本发明是在政府支持下利用了公共健康服务基金R01CA68283完成 的。政府对本发明享有一定的权利。
参考文献
1.Op De Beeck A,CailletFauquet P:Viruses and the cell cycle.Prog Cell Cycle Res 1997,3:1-19.
2.Dermody TS,Nibert ML,Wetzel JD,Tong X,Fields BN:Cells and viruses with mutations affecting viral entry are selected during persistent infections of L cells with mammalian reoviruses.J Virol 1993,67(4):2055-2063.
3.Taterka J,Sutcliffe M,Rubin DH:Selective reovirus infection of murine hepatocarcinoma cells during cell division.A model of viral liver infection.J Clin Invest 1994,94(1):353-360.
4.Sheng J,Organ EL,Hao C,Wells KS,Ruley HE,Rubin DH:Mutations in the IGF-II pathway that confer resistance to lytic reovirus infection.BMC Cell Biol 2004,5(1):32.
5.Hansen J,Floss T,Van Sloun P,Fuchtbauer EM,Vauti F,Arnold HH, Schnutgen F,Wurst W,yon Melchner H,Ruiz P:A large-scale,gene-driven nutagenesis approach for the functional analysis of the rnouse genome.Proc Natl A cad Sci USA 2003,100(17):9918-9922.
6.Hicks GG,Shi EG,Li XM,Li CH,Pawlak M,Ruley HE:Functional genomics in mice by tagged sequence mutagenesis.Nat Genet 1997,16(4):338-344.
7.Salminen M,Meyer BI,Gruss P:Efficient poly A trap approach allows the capture of genes specifically active in differentiated embryonic stem cells and in mouse embryos.Dev Dyn 1998,212(2):326-333.
8.Stryke D,Kawamoto M,Huang CC,Johns SJ,King LA,Harper CA,Meng EC, Lee RE,Yee A,L′Italien L et al: BayGenomic s:a resource of insertional mutations in mouse embryoric stem cells.Nucleic Acids Res 2003,31(1):278- 281.
9.Wiles MV,Vauti F,Otte J,Fuchtbauer EM,Ruiz P,Fuchtbauer A,Arnold HH, Lebrach H,Metz T,yon Melchner H et al:Establishment of a gene-trap sequence tag library to generate mutant mice from embryonic stem cells.Nat Genet 2000,24(1):13-14.
10.Zambrowicz BP,Friedrich GA,Buxton EC,Lilleberg SI,Person C,Sands AT: Disruption and sequence identification of 2,000genes in mouse embryonic stem cells.Nature 1998,392(6676):608-611.
11.Osipovich AB,Whte-Grindley EK,Hicks GG,Roshon MJ,Shaffer C,Moore JH,H.E. R:Activation ofcryptic 3’splice sites within introns of cellular genes following gene entrapment.Nucleic Acids Res 2004,in press.
12.De Ceuninck F,Poiraudeau S,Pagano M,Tsagris L,Blanchard O,Willeput J, Corvol M:Inhibition of chondrocyte cathepsin B and L activities by insulin-like growth factor-II(IGF-II)and its Ser29 variant in vitro:possible role of the mannose 6-phosphate/IGF-II receptor.Mol Cell Endocrinol 1995,113(2):205- 213.
13.Martinez CG,Guinea R,Benavente J,Carrasco L:The entry of reovirus into L cells is dependent on vacuolar proton-ATPase acttvity.J Virol 1996,70(1):576- 579.
14.Guinea R,Carrasco L:Requirement for vacuolar proton-ATPase activity during entry of influenza virus into ceils.J Virol 1995,69(4):2306-2312.
15.Brunetti CR,Burke RL,Komfeld S,Gregory W,Masiarz FR,Dingwell KS, Johnson DC:Herpes simplex virus glycoprotein D acquires mannose 6- phosphate residues and binds to marnnose 6-phosphate receptors.J Biol Chem 1994,269(25):17067-17074.
16.Zeng FY,Gerke V,Gabius HJ:Identification of annexin II,annexin VI and glyceraldehyde-3-phosphate dehydrogenase as calcyclin-bindingproteins in bovine heart.Int J Biochem 1993,25(7):1019-1027.
17.Lee KH,Na DS,Kim JW:Calcium-dependent interaction of annexin I with annexin II and mapping of the interaction sites.FEBS Lett 1999,442(2-3):143- 146.
18.Filipek A,Wojda U,Lesniak W:Interaction of calcyclin and its cyanogen bromide fragments with annexin II and glyceraldehyde 3-phosphate dehydrogenase.Int J Biochem Cell Biol 1995,27(11):1123-1131.
19.Pietropaolo RI,Compton T:Direct interaction between human cytomegalovirus glycoprotein B and cellular annexin II.J Virol 1997, 71(12):9803-9807.
20.Golitsina NL,Kordowska J,Wang CL,Lehrer SS:Ca2+-dependent bindinug of calcyclin to muscle tropomyosin.Biochem Biophys Res Commun 1996, 220(2):360-365.
21.Hida K,Wada J,Zhang H,Hiragushi K,Tsuchiyarna Y,Shikata K,Makino H: Identification of genes specifically expressed in tie accumulated visceral adipose tissue of OLETF rais.J Lipid Res 2000,41(10):1615-1622.
22.Katoh M:IGSFll gene,frequently up-regulated in intestinal-type gastric cancer,encodes adhesion molecule homologous to CXADR,FLJ22415 and ESAM.Int J Oncol2003,23(2):525-531.
23.Barton ES,Forrest JC,Connolly JL,Chappell JD,Liu Y,Schnell FJ,Nusrat A, Parkos CA,Dermody TS:Junction adhesion molecule is a receptor for reovirus. Cell 2001,104(3):441-451.
24.Weiner HL,Powers ML,Fields BN:Absolute linkage of virlence and central nervous system cell tropism of reoviruses to viral hemagglutinin.J Infect Dis 1980,141(5):609-616.
25.Rubin DH,Wetzel JD,Williams WV,Cohen JA,Dworkin C,Dermody TS: Binding of type 3 reovirus by a domain of the sigrna 1 protein important for hemagglutination leads to infection of murine erythroleukemia cells.J Clin Invest 1992,90(6):2536-2542.
26.Sizova DV,Kolupaeva VG,Pestova TV,Shatsky IN,Hellen CU:Specific interaction of eukaryotic translation initiation factor 3 with the 5′nontranslated regions of hepatitis C virus and classical swine fever virus RNAs.J Virol 1998, 72(6):4775-4782.
27.McGregor F,Phelan A,Dunlop J,Clements JB:Regulation of herpes simplex virus poly(A)sete usage and the action of immedtiate-early protein IE63 in the early-late switch.J Viol 1996,70(3):1931-1940.
28.Pitha PM,Au WC,Lowther W,Juang YT,Schafer SL,Burysek L,Hiscott J, Moore PA:Role of the interferon regulatory factors(IRFs)in virus-mediated signaling and regulation of cell growth.Biochimie 1998,80(8-9):651-658.
29.Hawiger J:Innate immunity and inflammation:a transcriptional paradigm. Immunol Res 2001,23(2-3):99-109.
30.Lau JF,Horvath CM:Mechanisms of Type I interferon cell signaling and STAT-mediated transcriptional responses.Mt Sin ai J Med 2002,69(3):156-168.
31.Werner-Felmayer G,Wemer ER,Fuchs D,Hausen A,Reibnegger G,Schmidt K,Weiss G,Wachter H:Pteridine biosynthesis in hman endothelial cells. Impact on nitric oxide-mediated formation of cyclic GMP.J Biol Chem 1993, 268(3):1842-1846.
32.Reiss CS,Komatsu T:Does nitric oxide play a critical role in viral infecfions?J Virol 1998,72(6):4547-4551.
33.Pertile TL,Karaca K,Sharma JM,Walser MM:An antiviral effect of nitric oxide:inhibition of reovirus replication.Avian Dis 1996,40(2):342-348.
34.Takekawa M,Maeda T,Saito H:Protein phosphatase 2Calpha inhibits the human stress-responsive p38 and JNK MAPK pathways.Embo J 1998, 17(16):4744-4752.
35.Rousse S,Lallemand F,Montarras D,Piinset C,Mazars A,Prunier C,Atfi A, Dubois C:Transforming growth factor-beta inhibition of insulin-like growth factor-binding protein-5 synthesis in skeletal muscle cells involves a c-Jun N- tenninal kinle-dependent pathway.J Biol Chem 2001,276(50):46961-46967.
36.Uchida K,Suzuki H,Ohashi T,Nitta K,Yumnura W,Nihei H:Involvement of MAP kinase cascades in Smad7 transcriptional regulation.Biochem Biophys Res Commun 2001,289(2):376-381.
37.Arsura M,Panta GR,Bilyeu JD,Cavin LG,Sovak MA,Oliver AA,Factor V, Heuchel R,Mercurio F,Thorgeirsson SS et al:Transient activation of NF- kappaB through a TAK1/IKK kinase pathway by TGF-betal inhibits AP- 1/SMAD signaling and apoptosis:implications in liver tumor formation. Oncogene 2003,22(3):412425.
38.Amir RE,Iwai K,Ciechanover A:The NEDD8 pathway is essential for SCF(beta-TrCP)-mediated ubiquitination and processing of the NF-kappa B precursor p105.J Biol Chem 2002,277(26):23253-23259.
39.Tanaka K,Kawakami T,Tateishi K,Yashiroda H,Chiba T:Control of IkappaBalpha proteolysis by the ubiquitin-proteasome pathway.Biochimie 2001,83(3-4):351-356.
40.Sakurai H,Shigemori N,Hasegawa K,Sugita T:TGF-beta-activated kinase 1 stimulates NF-kappa B activation by an NF-kappa B-inducing kinase- independent mechanism.Bioehem Biophys Res Commum 1998,243(2):545-549.
41.Shibuya H,Yamaguehi K,Shirakabe K,Tonegawa A,Gotoh Y,Ueno N,Irie K, Nishida E,Matsumoto K:TAB1:an activator of the TAK1 MAPKKK in TGF- beta signal transduction.Science 1996,272(5265):1179-1182.
42.Bhat NR,Shen Q,Fan F:TAK1-mediated induction of nitric oxide synthase gene expression in glial cells.J Neurochem 2003,87(1):238-247.
43.Yanagisawa M,Nakashima K,Takeda K,Ochiai W,Takizawa T,Uero M, Takizawa M,Shibuya H,Taga T:Inhibition of BMP2-induced,TAK1 kinase- mediated neurite outgrowth by Smad6 and Smad7.Genes Cells 2001, 6(12):1091-1099.
44.Asano K,Vomlocher HP,Richter-Cook NJ,Merrick WC,Hinnebusch AG, Hershey JW:Structure of cDNAs encoding human eukaryotic initiation factor 3 subunits.Possible roles in RNA binding and macromolecular assembly.J Biol Chem 1997,272(43):27042-27052.
45.Higaki S,Gebhardt BM,Lukiw WJ,Thompson HW,Hill JM:Effect of immunosuppression on gene expression in the HSV-1 latently infected mouse uigeminal ganglion.Invest Ophthalmol Vis Sci 2002,43(6):1862-1869.
46.Spear BT,Longley T,Moulder S,Wang SL,Peterson ML:A sensitive lacZ- based expression vector for analyzing transcriptional control elements in eukaryotic cells.DNA Cell Biol 1995,14(7):635-642.
47.Pier GB,Grout M,Zaidi T,Meluleni G,Mueschenbom SS,Banting G,Ratcliff R,Evans MJ,Colledge WH:Salmonella typhi uses CFTR to enter intestinal epithelial cells.Nature 1998,393(6680):79-82.
48.Perkins ME,Wu TW,Le Blancq SM:Cyclosporin analogs inhibit in vitro growth of Cryptosporidium parvmn.Antimicrob Agents Chemother 1998, 42(4):843-848.
49.Clarke P,Tyler KL:Reovirus-induced apoptosis:A minireview.Apoptosis 2003,8(2):141-150.
50.Richardson-Bums SM,Tyler KL:Regional differences in viral growth and central nervous system injury correlate with aloptosis.J Virol2004, 78(10):5466-5475.
51.Clarke P,Meintzer SM,Widmann C,Johnson GL,Tyler KL:Reovirus infection activates JNK and the JNK-dependent transcription factor c-Jun.J Virol2001, 75(23):11275-11283.
52.Clarke P,Meintzer SM,Moffitt LA,Tyler KL:Two distinct phases of virus- induced nuclear factor kappa B regulation enhance tumor necrosis factor-related apoptosis-inducing ligand-mediated apoptosis in virus-infected cells.J Biol Chem 2003,278(20):18092-18100.
53.Bender FC,Whitbeck JC,Ponce de Leon M,Lou H,Eisenberg RJ,Cohen GH: Specific association of glycoprotein B with lipid rafts during herpes simplex virus entry.J Virol2003,77(17):9542-9552.
54.Zhou G,Avitabile E,Campadelli-Fiume G,Roizman B:The domains of glycoprotein D required to block apoptosis induced by herpes simplex virus 1 are largely distinct from those involved in cell cell fusion and binding to nectinl.J Virol2003,77(6):3759-3767.
55.Schelling JR,Gentry DJ,Dubyak GR:Annexin II inhibition or G protein- regulated inositol trisphosphate formation in rat aortic smooth muscle.Am J Physiol 1996,270(4 Pt 2):F682-690.
56.Babiychuk EB,Monastyrskaya K,Burkhard FC,Wray S,Draeger A: Modulating signaling events in smooth muscle:cleavage of anuexin 2 abolishes its binding to lipid rafts.Faseb J2002,16(10):1177-1184.
57.Pittis MG,Muzzolin L,Giulianini PG,Garcia RC:Mycobacteria-containing phagosomes associate less annexins I,VI,VII and XI,but not II,concomitantly with a diminished phagolysosomal fusion.Eur J Cell Biol2003,82(1):9-17.
58.Bnmetti CR,Dingwell KS,Wale C,Graham FL,Johnson DC:Herpes simplex virus gD and virions accmulate in endosomes by manose 6-phosphate- dependent and-independent mechanisms.J Virol 1998,72(4):3330-3339.
59.Rubin DH,Komstem MJ,Anderson AO:Reovirus serotype 1 intestinal infection:a novel replicative cycle with ileal disease J Virol 1985,53(2):391- 398.
60.Ahmed R,Canning WM,Kauffiman RS,Sharpe AH,Hallum JV,Fields BN: Role of the host cell in persistent viral infectiont:coevolution of L cells and reovoirus during persistent infection. Cell 1981,25(2):325-332.
61.Altschul SF,Madden TL,Schaffer AA,Zhang J,Zhang Z,Miller W,Lipman DJ:Gapped BLAST and PSI-BLAST:a new generation of protein database search programs.Nucleic Acids Res 1997,25(17):3389-3402.
62.Raynor CM,Wright JF,Waisman DM,Pryzdial EL:Annexin II enhances cytomegalovirus binding and fusion to phospholipid membranes.Biochemistry 1999,38(16):5089-5095.
63.Glomb-Reinmund S,Kielian M:The role of low pH and disulfide shuffling in the entry and fusion of Semliki Forest virus and Sindbis virus.Virology 1998, 248(2):372-381.
64.Roberts PC,Kipperman T,Compans RW:Vesicular stomatitis virus G protein acquires pH-independent fusion activity during transport in a polarized endometrial cell line.J Virol 1999,73(12):10447-10457.
65.Luo T,Douglas JL,Livingston RL,Garcia JV:In fectivity enhancement by HIV-1 Nef is dependent on the pathway of virus entry:implications for HIV- based gene transfer systems.Virology 1998,241(2):224-233.
66.Platt GM,Simpson GR,Mittnacht S,Schulz TF:Iatent nuclear antigen of Kaposi′s sarcoma-associated herpesvirus interacts with RING3,a homolog of the Drosophila female sterile homeotic(fsh)gene.J Virol 1999,73(12):9789- 9795.
67.Koffa MD,Graham SV,Takagaki Y,Manley JL,Clements JB:The human papillomavirus type 16 negative regulatory RNA element interacts with three proteins that act at different posttranscriptional levels.Proc Natl Acad Sci USA 2000,97(9):4677-4682.
68.Hirose Y,Manley JL:Creatine phosphate,not ATP,is required for 3′end cleavage of mammalian pre-mRNA in vitro.J Biol Chem 1997,272(47):29636- 29642.
69.Hansen J,Etchison D,Hershey JW,Ehrenfeld E:Association of cap-binding protein with eucaryotic initiation factor 3 in initiation factor preparations from uninfected and poliovirus-infected HeLa cells.J Virol 1982,42(1):200-207.
70.Kieft JS,Zhou K,Jubin R,Muray MG,Lau JY,Doudna JA:The hepatitis C virus intearnal ribosome entry site adopts an ion-dependent tertiary fold.J Mol Biol 1999,292(3):513-529.
71.Briggs CJ,Ott DE,Coren LV,Oroszlan S,Tozser J:Comparison of the effect of FK506 and cyclosporin A on virus production in H9 cells chronically and newly infected by HIV-1.Arch Virol 1999,144(11):2151-2160.
72.Kanopka A,Muhlemann O,Petersen-Mahrt S,Estmer C,Ohrmalm C, Akusjarvi G:Regulation of adenovirus altemative RNA splicing by dephosphorylation of SR proteins.Nature 1998,393(6681):185-187.
73.Tan SL,Nakao H,He Y,Vijaysri S,Neddermann P,Jacobs BL,Mayer BJ, Katze MG:NSSA,a nonstructural protein of hepatitis C virus,binds growth factor receptor-bound protein 2 adaptor protein in a Src homology 3 domain/ligand-dependent manner and perturbs mitogenic signaling.Proc Natl Acad Sci USA 1999,96(10):5533-5538.
74.Korkaya H,Jameel S,Gupta D,Tyagi S,Kumar R,Zafrullah M,Mazumdar M, Lal SK,Xiaofang L,Sehgal D et al:The ORF3 protein of hepatitis E virus binds to Src homology 3 domains and activates MAPK.J Biol Chem 2001, 276(45):42389-42400.
75.Scaplehom N,Holmstrom A,Moreau V,Frisch knecht F,Reckmann I,Way M: Grb2 and Nck act cooperatively to promote actin-based motility of vaceinia vims.Curr Biol 2002,12(9):740-745.
76.Finkelstein LD,Ney PA,Liu QP,Paulson RF,Correll PH:Sf-Stk kmase activity and the Grb2 binding site are required for Epo-independent growth of prinary erythroblasts infected with Friend virus.Oncogene 2002,21(22):3562- 3570.
77.Huh JR,Park JM,Kim M,Carlson BA,Hatfield DL,Lee BJ:Recruitment of TBP or TFIIB to a promoter proximal position leads to stimulation of RNA polymerase II transcription without activator proteins both in vivo and in vitro.Biochem Biophys Res Commun 1999, 256(1):45-51.
78.Zhou M,Kashanchi F,Jiang H,Ge H,Brady JN:Phosphorylation of the RAP74 subunit of TFIIF correlates with Tat-activated transcription of the HIV-1 long terminal repeat.Virology 2000,268(2):452-460.
79.Kim H,Lee YH,Won J,Yun Y:Though induction of juxtaposition and tyrosine kinase activity of Jak1,X-gene product of hepatitis B virus stimulates Ras and the transcriptional activation through AP-1,NF-kappaB,and SRE enhancers.Biochem Biophys Res Comunun 2001,286(5):886-894.
80.Breslin JJ,Mork I,Smith MK,Vogel LK,Hemmila EM,Bonavia A,Talbot PJ, Sjostrom H,Noreh O,Holmes KV:Human coronavirus 229E:receptor binding domain and neutralization by soluble receptor at 37 degrees C.J Virol2003, 77(7):4435-4438.
81.Li Y,Kang J,Horwitz MS:Interaction of an adenovirus 14.7-kilodalton protein inlubitor of tumor necrosis factor alpha cytolysis with a new member of the GTPase supeffamily of signal transducers.J Virol 1997,71(2):1576-1582.
82.Hugle T,Fehrmann F,Bieck E,Kohara M,Krausslich HG,Rice CM,Blum HE, Moradpour D:The hepatitis C virus nonstructural protein 4B is an integral endoplasmic reticulum membrane protein.Virology 2001,284(1):70-81.
83.Bonatti S,Migliaccio G,Blobel G,Walter P:Role of signal recognition particle in the membrane assembly of Sindbis viral glycoproteins.Eur J Biochem 1984, 140(3):499-502.
84.Melancon P,Garoff H:Reinitiation of translocation in the Semliki Forest vins structural polyprotein:identification of the signal for the El glycoprotein.Em bo J 1986,5(7):1551-1560.
85.Emans N,Gorvel JP,Walter C,Gerke V,Kellner R,Griffiths G,Gruenberg J: Annexin II is a major component of fusogenic endosomal vesicles.J Cell Biol 1993,120(6):1357-1369.
86.Fiedler K,Kellner R,Simons K:Mapping the protein composition of trans- Golgi network(TGN)-derived carrier vesicles from polarized MDCK cells. Electrophoresis 1997,18(14):2613-2619.
87.Nezu J,Motojima K,Tamura H,Ohkuma S:Molecular cloning of a rat liver cDNA encoding the 16kDa subunit of vacuolar H(+)-ATPases:organellar and tissue distribution of 16kDa proteolipids.J Biochem(Tokyo)1992,112(2):212- 219.
88.Orci L,Perrelet A,Rothman JE:Vesicles on strings:morphological evidence for processive transport within the Golgi stack.Proc Natl Acad Sci USA 1998, 95(5):2279-2283.
89.Nakamura N,Lowe M,Levine TP,Rabouille C,Warren G:The vesicle docking protein p115 binds GM130,a cis-Golgi matrix protein,in a mitotically regulated manner.Cell 1997,89(3):445-455.
90.Okutsu T,Kuroiwa Y,Kagitani F,Kai M,Aisaka K,Tsutsumi O,Kaneko Y, Yokomori K,Surani MA,Kohda T et al:Expression and imprinting status of human PEG8/IGF2AS,a paternally expressed antisense transcript from the IGF2 locus,in Wilms tumors.J Biochem(Tokyo)2000,127(3):475-483.
91.Kumar R,Yang J,Larsen RD,Stanley P:Cloning and expression of N- acetylglucosaminyltransferase I,the medial Golgi transferase that initiates complex N-linked carbohydrate formation.Proc Natl Acad Sci USA 1990, 87(24):9948-9952.
92.Nilsson T,Rabouille C,Hui N,Watson R,Warren G:The role of the membrane-spanning domain and stalk region of N- acetylglucosaminyltransferase I in retention,kin recognition and structural maintenance of the Golgi apparatus in HeLa cells.J Cell Sci 1996,109(Pt 7):1975-1989.
93.Nilsson T,Slusarewicz P,Hoe MH,Warren G:Kin recognition.A model for the retention of Golgi enzymes.FEBS Lett 1993,330(1):1-4.
94.Yang W,Pepperkok R,Bender P,Kreis TE,Storrie B:Modification of the cytoplasmic domain affects the subcellular localization of Golgi glycosyl- transferases.Eur J Cell Biol 1996,71(1):53-61.
95.Hirst J,Futter CE,Hopkins CR:The kinetics of mannose 6-phosphate receptor trafficking in the endocytic pathway in HEp-2 cells:the receptor enters and rapidly leaves multivesicular endosomes without accumulating in a prelysosomal compartment.Mol Biol Cell 1998,9(4):809-816.
96.Sheng Q,Denis D,Ratnofsky M,Roberts TM,DeCaprio JA,Schaffhausen B: The DnaJ domain of polyomavirus large T antigen is required to regulate Rb family tumor suppressor function.J Virol 1997,71(12):9410-9416.