首页 / 专利库 / 动物学 / 哺乳动物 / 用于治疗或预防肝脏疾病的RNA

用于治疗预防肝脏疾病的RNA

阅读:2发布:2020-05-29

专利汇可以提供用于治疗预防肝脏疾病的RNA专利检索,专利查询,专利分析的服务。并且本 发明 涉及适用于 治疗 或 预防 肝脏 疾病 的RNA。具体地,本发明提供了编码选自下列的至少一种肽或 蛋白质 的RNA:胞外基质蛋白酶、CCAAT/增强子结合蛋白α(CEBPA)、TNF相关凋亡诱导配体(TRAIL)、 肝细胞 生长因子(HGF)、肝细胞核因子4α(HNF4A)、 成 纤维 细胞 生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3),或这些肽或蛋白质中任意者的 片段 或变体。本发明涉及所述RNA以及包含该RNA的组合物和 试剂 盒 。此外,本发明涉及用作药物,具体地用于治疗或预防肝脏疾病的如本文所公开的RNA、组合物或试剂盒。本发明还提供了本文公开的RNA、组合物或试剂盒用于增加所述被编码蛋白质的表达的用途,具体地在 基因治疗 中的用途。,下面是用于治疗预防肝脏疾病的RNA专利的具体信息内容。

1.用于治疗预防肝脏疾病用途的RNA,其包含至少一个编码序列,其中所述编码序列
编码选自下列的至少一种肽或蛋白质
人胶原酶MMP1、肝细胞生长因子(HGF)、CCAAT/增强子结合蛋白α(CEBPA)、TNF相关凋亡诱导配体(TRAIL)、胞外基质蛋白酶、肝细胞核因子4α(HNF4A)、纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)、或这些肽或蛋白质中任意者的片段或变体。
2.根据权利要求1所述用途的RNA,其中所述RNA是mRNA、病毒RNA或复制子RNA。
3.根据权利要求1或2所述用途的RNA,其中所述RNA,优选地所述编码序列,不包含化学
修饰的糖、化学修饰的骨架或化学修饰的核基。
4.根据权利要求3所述用途的RNA,其中所述RNA不包含化学修饰的核苷或核苷酸。
5.根据权利要求3或4所述用途的RNA,其中所述RNA不被化学修饰。
6.根据前述权利要求中任一项所述用途的RNA,其中所述肝脏疾病选自肝纤维化、肝硬
化和肝癌。
7.根据前述权利要求中任一项所述用途的RNA,其中所述肽或蛋白质包含胞外基质蛋
白酶或其片段或变体。
8.根据权利要求7所述用途的RNA,其中所述胞外基质蛋白酶选自细菌胶原酶和哺乳动
物基质金属蛋白酶。
9.根据权利要求7或8所述用途的RNA,其中所述胞外基质蛋白酶选自基质金属蛋白酶-
1,优选地人基质金属蛋白酶-1,梭菌胶原酶ColG和梭菌胶原酶ColH。
10.根据权利要求7至9中任一项所述用途的RNA,其中所述肽或蛋白质包含选自SEQ ID 
NO:20至28的基酸序列,或任一所述氨基酸序列的片段或变体。
11.根据权利要求1至6中任一项所述用途的RNA,其中所述肽或蛋白质包含CCAAT/增强
子结合蛋白α(CEBPA),优选地人CEBPA,或其片段或变体。
12.根据权利要求11所述用途的RNA,其中所述肽或蛋白质包含选自SEQ ID NO:8至13
的氨基酸序列,或任一所述氨基酸序列的片段或变体。
13.根据权利要求1至6中任一项所述用途的RNA,其中所述肽或蛋白质包含TNF相关凋
亡诱导配体(TRAIL)或其片段或变体。
14.根据权利要求13所述用途的RNA,其中所述肽或蛋白质包含选自SEQ ID NO:4至7的
氨基酸序列,或任一所述氨基酸序列的片段或变体。
15.根据权利要求1至6中任一项所述用途的RNA,其中所述肽或蛋白质选自肝细胞核因
子4α(HNF4A)、肝细胞生长因子(HGF)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3),并且其中所述肽或蛋白质优选包含选自SEQ ID NO:14至19的氨基酸序列,或任一所述氨基酸序列的片段或变体。
16.根据权利要求1-15中任一项所述用途的RNA,其中所述RNA的所述至少一个编码序
列包含选自SEQ ID NO:32至71的核酸序列,或任一所述核酸序列的片段或变体。
17.根据权利要求1-16中任一项所述用途的RNA,其中所述RNA是单顺反子、双顺反子或
多顺反子的。
18.根据权利要求1-17中任一项所述用途的RNA,其中所述RNA是mRNA。
19.根据权利要求1-18中任一项所述用途的RNA,其中所述RNA是修饰的RNA,优选是稳
定化的RNA。
20.根据权利要求1-19中任一项所述用途的RNA,其中
所述RNA的所述至少一个编码序列的G/C含量与相应野生型RNA的相应编码序列的G/C
含量相比增加,
所述RNA的所述至少一个编码序列的C含量与相应野生型RNA的相应编码序列的C含量
相比增加,和/或其中
所述RNA的所述至少一个编码序列中的至少一个密码子适应人密码子使用,其中优选
地所述RNA的所述至少一个编码序列中密码子适应指数(CAI)增加或最大化,
其中所述RNA编码的氨基酸序列优选地与相应野生型RNA编码的氨基酸序列相比不改
变。
21.根据权利要求20所述用途的RNA,其中所述至少一个编码序列包含选自下列的核酸
序列:SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、
95、96、97、98、99、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、
118、119、120、121、122、123、124、125、126、127、131、132、133、134、135、136、137、138、139、
140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、159、160、161、
162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、
181、182、183、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、
203、204、205、206、207、208、209、210、211、215、216、217、218、219、220、221、222、223、224、
225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、243、244、245、246、
247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、
266、267、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、
288、289、290、291、292、293、294、295、299、300、301、302、303、304、305、306、307、308、309、
310、311、312、313、314、315、316、317、318、319、320、321、322、323、327、328、329、330、331、
332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、
351、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、
373、374、375、376、377、378、379、383、384、385、386、387、388、389、390、391、392、393、394、
395、396、397、398、399、400、401、402、403、404、405、406和407,或任一所述核酸序列的片段或变体。
22.根据权利要求1至21中任一项所述用途的RNA,其中所述RNA包含5′帽结构。
23.根据权利要求1至22中任一项所述用途的RNA,其中所述RNA包含多(A)序列,优选包
含10至200个、10至100个、40至80个或50至70个腺苷核苷酸;和/或多(C)序列,优选包含10至200个、10至100个、20至70个、20至60个或10至40个胞苷核苷酸。
24.根据权利要求1至23中任一项所述用途的RNA,其中所述RNA包含至少一个组蛋白茎
环。
25.根据权利要求24所述用途的RNA,其中所述至少一个组蛋白茎环包含根据下式(I)
或(II)的核酸序列:
式(I)(无茎边界元件的茎环序列):
式(II)(有茎边界元件的茎环序列):
其中:
茎1或茎2边界元件N1-6 是1至6个,优选2至6个,更优选2至5个,甚至更优选3至5个,最优选4至5个或5个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
茎1[N0-2GN3-5] 与元件茎2反向互补或部分反向互补,并且是5至7个核苷酸的连续序
列;
其中N0-2是0至2个,优选0至1个,更优选1个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
其中N3-5是3至5个,优选4至5个,更优选4个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物,并且
其中G是苷或其类似物,并且可以任选地被胞苷或其类似物替代,条件是茎2中其互
补核苷酸胞苷被鸟苷替代;
环序列[N0-4(U/T)N0-4] 位于元件茎1和茎2之间,并且是3至5个核苷酸,更优选4个核苷酸的连续序列;
其中各N0-4彼此独立地是0至4个,优选1至3个,更优选1至2个N的连续序列,其中各N彼
此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;和
其中U/T表示尿苷或任选地胸苷;
茎2[N3-5CN0-2] 与元件茎1反向互补或部分反向互补,并且是5至7个核苷酸的连续序
列;
其中N3-5是3至5个,优选4至5个,更优选4个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
其中N0-2是0至2个,优选0至1个,更优选1个N的连续序列,其中各N彼此独立地选自选自A、U、T、G或C的核苷酸或其核苷酸类似物;和
其中C是胞苷或其类似物,并且可以任选地被鸟苷或其类似物取代,条件是茎1中其互
补核苷酸鸟苷被胞苷替代;
其中
茎1和茎2能够彼此碱基配对
形成反向互补序列,其中在茎1和茎2之间可以发生碱基配对,

形成部分反向互补序列,其中茎1和茎2之间可以发生不完全碱基配对。
26.根据权利要求24或25所述用途的RNA,其中所述至少一个组蛋白茎环包含根据下式
(Ia)或(IIa)的核酸序列:
式(Ia)(无茎边界元件的茎环序列):
式(IIa)(有茎边界元件的茎环序列):
27.根据权利要求24-26中任一项所述用途的RNA,其中所述至少一个组蛋白茎环包含
根据SEQ ID NO:1451的核酸序列,并且最优选根据SEQ ID NO:1452的RNA序列。
28.根据权利要求1至27中任一项所述用途的RNA,其中所述RNA包含至少一个3′-非翻
译区元件(3′-UTR元件)。
29.根据权利要求28所述用途的RNA,其中所述3′-UTR元件包含衍生自基因的3′-UTR或
衍生自所述基因的同源物、片段或变体的核酸序列,所述基因优选编码稳定的mRNA。
30.根据权利要求29所述用途的RNA,其中所述3′-UTR元件包含衍生自选自下列的基因
的3′-UTR的核酸序列:白蛋白基因、α-珠蛋白基因、β-珠蛋白基因、酪氨酸羟化酶基因、脂合酶基因和胶原α基因,或其同源物、片段或变体。
31.根据权利要求29或30所述用途的RNA,其中所述3′-UTR元件包含衍生自α-珠蛋白基
因的3′-UTR的核酸序列,优选包含根据SEQ ID NO:1444的核酸序列,其同源物、片段或变体。
32.根据权利要求1至31中任一项所述用途的RNA,其中所述RNA包含以下元件,优选5′
至3′方向:
a)5′-帽结构,优选m7GpppN,
b)权利要求21中所限定的至少一个编码序列,
c)3′-UTR元件,包含衍生自α-珠蛋白基因的核酸序列,优选地包含根据SEQ ID NO:
1444的核酸序列,或其同源物、片段或变体,
d)多(A)尾,优选地由10至200个、10至100个、40至80个或50至70个腺苷核苷酸组成,
e)多(C)尾,优选地由10至200个、10至100个、20至70个、20至60个或10至40个胞苷核苷酸组成,和
f)组蛋白茎环,优选地包含根据SEQ ID NO:1452的核酸序列。
33.根据权利要求1至32中任一项所述用途的RNA,其中所述RNA包含选自SEQ ID NO:
408至750的核酸序列,或任一所述核酸序列的片段或变体。
34.根据权利要求29或30中任一项所述用途的RNA,其中所述至少一个3′-UTR元件包含
衍生自脊椎动物白蛋白基因的3′-UTR或衍生自其变体,优选地衍生自哺乳动物白蛋白基因的3′-UTR或其变体,更优选地衍生自人白蛋白基因的3′-UTR或其变体,甚至更优选地衍生自根据GenBank登录号N_000477.5的人白蛋白基因的3′-UTR或其片段或变体的核酸序列。
35.根据权利要求34所述用途的RNA,其中所述3′-UTR元件包含根据SEQ ID NO:1448或
1450的核酸序列,或其同源物、片段或变体。
36.根据权利要求1至35中任一项所述用途的RNA,其中所述RNA包含5′-UTR元件。
37.根据权利要求36所述用途的RNA,其中所述5′-UTR元件包含衍生自TOP基因的5′-
UTR,优选地衍生自相应RNA序列,或其同源物、片段或变体的核酸序列,优选地缺少5′TOP基序。
38.根据权利要求37所述用途的RNA,其中所述5′-UTR元件包含衍生自编码核糖体蛋白
的TOP基因的5′-UTR,优选地衍生自相应RNA序列,或者衍生自其同源物、片段或变体的核酸序列,优选地缺少5′TOP基序。
39.根据权利要求37或38所述用途的RNA,其中所述5′-UTR元件包含衍生自编码核糖体
大蛋白(RPL)的TOP基因的5′-UTR或衍生自其同源物、片段或变体的核酸序列,优选地缺少
5′TOP基序。
40.根据权利要求37至39中任一项所述用途的RNA,其中所述5′-UTR元件包含根据SEQ 
ID NO:1432的核酸序列,或其同源物、片段或变体。
41.根据权利要求1至40中任一项所述用途的RNA,其包含以下元件,优选5′至3′方向:
a)5′-帽结构,优选m7GpppN,
b)5′-UTR元件,其包含下列核酸序列或由下列核酸序列组成:衍生自TOP基因的5′-UTR的核酸序列,优选包含根据SEQ ID NO:1432的核酸序列,或其同源物、片段或变体,
c)权利要求21中所限定的至少一个编码序列,
d)3′-UTR元件,包含衍生自α-珠蛋白基因的核酸序列,优选地包含根据SEQ ID NO:
1444的核酸序列,或其同源物、片段或变体;和/或
3′-UTR元件,包含衍生自白蛋白基因的核酸序列,优选包含根据SEQ ID NO:1448或
1450的核酸序列,或其同源物、片段或变体,
e)多(A)尾,优选地由10至200个、10至100个、40至80个或50至70个腺苷核苷酸组成,
f)多(C)尾,优选地由10至200个、10至100个、20至70个、20至60个或10至40个胞苷核苷酸组成,和
g)组蛋白茎环,优选地包含根据SEQ ID NO:1452的核酸序列。
42.根据权利要求1至40中任一项所述用途的RNA,其中所述RNA包含选自SEQ ID NO:
751至1090或SEQ ID NO:2134的核酸序列,或任一所述核酸序列的片段或变体。
43.根据权利要求36所述用途的RNA,其中所述5′-UTR元件包含衍生自HSD17B4基因,优
选地衍生自相应RNA序列,或其同源物、片段或变体的核酸序列。
44.根据权利要求43所述用途的RNA,其中所述5′-UTR元件包含根据SEQ ID NO:1436的
核酸序列,或其同源物、片段或变体。
45.根据权利要求1至44中任一项所述用途的RNA,其包含以下元件,优选5′至3′方向:
a)5′-帽结构,优选m7GpppN,
b)5′-UTR元件,其包含下列核酸序列或由下列核酸序列组成:衍生自HSD17B4基因的
5′-UTR的核酸序列,优选地包含根据SEQ ID NO:1436的核酸序列,或其同源物、片段或变体,
c)权利要求21中所限定的至少一个编码序列,
d)3′-UTR元件,包含衍生自α-珠蛋白基因的核酸序列,优选地包含根据SEQ ID NO:
1444的核酸序列,或其同源物、片段或变体;和/或
3′-UTR元件,包含衍生自白蛋白基因的核酸序列,优选地包含根据SEQ ID NO:1448或
1450的核酸序列,或其同源物、片段或变体。
e)多(A)尾,优选地由10至200个、10至100个、40至80个或50至70个腺苷核苷酸组成。
46.根据权利要求1至45中任一项所述用途的RNA,其中所述RNA包含选自SEQ ID NO:
1091至1430的核酸序列,或任一所述核酸序列的片段或变体。
47.根据权利要求1至46中任一项所述用途的RNA,其中所述RNA包含选自SEQ ID NO:
408至1430的核酸序列,或任一所述核酸序列的片段或变体。
48.根据权利要求1至47中任一项所述用途的RNA,其中所述RNA与至少一种药学上可接
受的运载体一起配制。
49.根据权利要求48所述用途的RNA,其中所述RNA与一种或多种阳离子或聚阳离子化
合物复合,优选地与阳离子或聚阳离子聚合物、阳离子或聚阳离子肽或蛋白质,例如鱼精蛋白、阳离子或聚阳离子多糖和/或阳离子或聚阳离子脂质复合。
50.根据权利要求49所述用途的RNA,其中所述RNA与所述一种或多种阳离子或聚阳离
子肽或蛋白质的N/P比在约0.1至10的范围内,包括约0.3至约4、0.5至2,约0.7至2,约0.7至
1.5的范围。
51.根据权利要求49或50中任一项所述用途的RNA,其中至少一种RNA与一种或多种阳
离子或聚阳离子化合物复合,并且至少一种RNA处于游离状态。
52.根据权利要求51所述用途的RNA,其中复合的所述至少一种RNA与游离的所述至少
一种RNA相同。
53.根据权利要求51或52所述用途的RNA,其中复合的RNA与游离的RNA的摩尔比选自约
0.001∶1至约1∶0.001的摩尔比,包括约1∶1的比例。
54.根据权利要求48-53中任一项所述用途的RNA,其中所述RNA与一种或多种脂质复
合,从而形成脂质体、脂质纳米颗粒和/或脂质复合物。
55.根据权利要求1至54中任一项所述用途的RNA,其中所述RNA或与所述RNA一起配制
的药物运载体与靶向基团形成缀合物。
56.根据权利要求55所述用途的RNA,其中所述靶向基团提供所述缀合物向肝脏的递
送,优选向肝巨噬细胞、肝星状细胞、肝细胞和/或肝窦内皮细胞(LSEC)。
57.根据权利要求55或56所述用途的RNA,其中所述靶向基团选自叶酸基、GalNAc、半乳
糖、甘露糖、甘露糖-6P、适配体、整联蛋白受体配体、趋化因子受体配体、转蛋白、生物素、血清素受体配体、PSMA、内皮素、GCPII、生长抑素、LDL配体和HDL配体。
58.根据权利要求1至57中任一项所述用途的RNA,其中所述RNA通过肠胃外给予,优选
通过注射,被给予有此需要的对象。
59.根据权利要求1至58中任一项所述用途的RNA,其中所述治疗或预防包括给予其他
药物活性成分。
60.组合物,其包含至少一种根据权利要求1至59中任一项所限定的RNA,和任选地另外
的药学上可接受的运载体。
61.试剂盒,优选多部分试剂盒,其包含至少一种根据权利要求1至59中任一项所限定
的RNA或根据权利要求60所述的组合物;任选地用于溶解的液体媒介物;和任选地技术说明书,具有关于所述RNA或组合物的给予和剂量的信息。
62.根据权利要求61所述的试剂盒,其中所述试剂盒包含林格乳酸盐溶液作为一部分。
63.根据权利要求1至59中任一项所限定的RNA、根据权利要求60所述的组合物,或根据
权利要求61或62所述的试剂盒,其用于基因治疗用途
64.根据权利要求1至59中任一项所限定的RNA、根据权利要求60所述的组合物、或根据
权利要求61或62所述的试剂盒,其用于肝脏疾病的基因治疗用途。
65.治疗或预防障碍的方法,其中所述方法包括向有此需要的对象给予有效量的根据
权利要求1至59中任一项所限定的RNA、根据权利要求60所述的组合物或根据权利要求61或
62所述的试剂盒。
66.根据权利要求65所述的方法,其中所述障碍是肝脏疾病,优选地选自肝纤维化、肝
硬化和肝癌。

说明书全文

用于治疗预防肝脏疾病的RNA

[0001] 引言
[0002] 本发明涉及适于治疗或预防肝脏疾病的RNA。具体地,本发明提供了编码选自下列的至少一种肽或蛋白质的RNA:胞外基质蛋白酶、CCAAT/增强子结合蛋白α(CEBPA)、TNF相关凋亡诱导配体(TRAIL)、肝细胞核因子4α(HNF4A)、纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、肝细胞生长因子(HGF)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)、或这些肽或蛋白质中任意者的片段或变体。本发明涉及所述RNA以及包含该RNA的组合物和试剂盒。此外,本发明涉及用作药物,特别是用于治疗或预防肝脏疾病的本文所公开的RNA、组合物或试剂盒。本发明还提供了本文公开的RNA、组合物或试剂盒用于增加所述编码蛋白质的表达的用途——特别是在基因治疗中。
[0003] 肝脏疾病是全世界的主要健康问题。肝损伤的主要原因涉及从病毒性疾病和自身免疫性疾病,到代谢障碍,到营养不良和醇药物滥用,并且在不同人群中差异很大。然而,无论其原因如何,持续的肝损伤导致特征性伤口愈合响应,其中胞外基质(ECM)通过肝内间充质细胞群的激活和增殖而重塑。肝组织的慢性损伤导致沉积的胞外基质蛋白逐渐累积,其
包围受损组织,导致严重的结构和功能改变。该过程(也称为纤维化)可最终导致或促进肝
硬化、肝衰竭和肝癌。
[0004] 几种治疗方法被设计以阻止或减少纤维化响应(回顾参见Wallace K.等:Liver fibrosis.Biochem.J.(2008),411:1-18)。然而,目前没有治疗剂被提出和许可用于肝纤维化的初级治疗,并且目前还没有针对性的抗纤维化治疗。对于其他肝脏疾病,例如肝硬化,也迫切需要有效的治愈。
[0005] 从现有技术中已知,全身性给予例如TRAIL或胶原酶可导致不利影响,例如全身性毒性。重组TRAIL具有短半衰期和低效,TRAIL的极短半衰期需要大量和频繁的给药(参见Forero-Torres等:Phase I Trial of Weekly Tigatuzumab,an Agonistic Humanized 
Monoclonal Antibody Targeting Death Receptor 5(DR5).Cancer Biotherapy&
Radiopharmaceuticals 25.1(2010):13-19.PMC)。因此,其未在癌症临床试验中显示功效。
[0006] 同样地,WO2014158795A1涉及利用化学修饰的血管内皮生长因子(VEGF)mRNA治疗纤维化进行纤维化的诊断和治疗。
[0007] 因此,本发明的一个目的是提供一种适用于治疗或预防肝脏疾病如肝纤维化、肝硬化或肝癌的系统。具体地,本发明的一个目的是提供一种用于表达如本文所述的能够减
轻、改善或治愈肝脏疾病的肽或蛋白质的系统。本发明的另一个目的是提供这样的系统:能够以安全并且有效的方式治疗和/或预防肝脏疾病,具体地如本文限定。
[0008] 本发明基于的目的通过本申请请求保护的主题得以解决。
[0009] 本申请连同电子格式的序列表一起提交。连同本申请一起提交的电子格式的序列表中包含的信息是本申请的说明书的一部分,并且其全部内容通过引用合并于此。当在本
文中提及“SEQ ID NO:”时,除非另有说明,指代序列表中具有对应标识符的相应核酸序列或基酸序列。
[0010] 定义
[0011] 为了清楚和可读,提供以下定义。可以在本发明的每个实施方式上读到以这些定义提及的任何技术特征。可在这些实施方式的环境中具体提供另外的定义和解释。
[0012] 人工核酸分子:人工核酸分子可以一般理解为核酸分子,例如非天然存在的DNA或RNA。换句话说,人工核酸分子可以理解为非天然核酸分子。这种核酸分子,由于其个体序列(不是天然存在的)和/或由于其他修饰(例如,非天然存在的核苷酸结构修饰),可以是非天然的。人工核酸分子可以是DNA分子、RNA分子或包含DNA和RNA部分的杂交分子。一般,可以通过基因工程方法设计和/或生成人工核酸分子,以相应于期望的人工核苷酸序列(异源序
列)。在此环境下,人工序列通常是可不天然存在的序列,即其至少一个核苷酸区别于野生型序列。术语“野生型”可以被理解为天然存在的序列。此外,术语“人工核酸分子”不限于表示“一个分子”,而是一般被理解为包含相同分子的总体。因此,其可以涉及等份中包含的多个相同分子。
[0013] 双顺反子RNA,多顺反子RNA:双顺反子或多顺反子RNA一般是一般可具有两个(双顺反子)或更多个(多顺反子)开放阅读框(ORF)的RNA,优选mRNA。在此环境中的开放阅读框是可翻译成肽或蛋白质的密码子序列。
[0014] 运载体(carrier)/聚合物运载体:本发明环境中的运载体一般可以是促进另一种化合物(货物)的运输和/或复合的化合物。聚合物运载体一般是由聚合物形成的运载体。运载体可通过共价或非共价相互作用与其货物缔合(结合,associated)。运载体可以运输核
酸,例如RNA或DNA,至靶细胞。对于一些实施方式,运载体可以是阳离子组分。
[0015] 阳离子组分:术语“阳离子组分”一般是指带电分子,其在一般1至9的pH值下带正电荷(阳离子),优选9或9以下(例如5至9)、8或8以下(例如5至8)、7或7以下(例如5至7)的pH值,最优选生理pH(例如7.3到7.4)。因此,阳离子组分可以是任何带正电荷的化合物或聚合物,优选在生理条件下,特别是在体内生理条件下带正电的阳离子肽或蛋白质。“阳离子肽或蛋白质”可含有至少一个带正电荷的氨基酸、或多于一个带正电荷的氨基酸,例如,选自Arg、His、Lys或Orn。因此,“聚阳离子”组分也在给出条件下呈现多于一个正电荷的范围内。
[0016] 5′-帽:5′-帽是总体上“封端”成熟mRNA的5′端的实体,一般是修饰的核苷酸实体。5′-帽一般可以由修饰的核苷酸形成,具体地由嘌呤核苷酸衍生物形成。优选地,5′-帽通过′-5′-三磷酸连接体与5′-末端连接。5′-帽可以是甲基化的,例如m7GpppN,其中N是携带
5′-帽的核酸的末端5′核苷酸,一般是RNA的5′端。5′-帽结构的其他实例包括甘油基、反向脱基残基(部分)、4′,5′亚甲基核苷酸、1-(β-D-赤呋喃糖基)核苷酸、4′-硫代核苷酸、环核苷酸、1,5-脱己糖醇核苷酸、L-核苷酸、α-核苷酸、修饰碱基核苷酸、苏戊呋喃糖基核苷酸、非环3′,4′-开环核苷酸、非环3,4-二羟基丁基核苷酸、非环3,5二羟基戊基核苷酸、3′-3′-反向核苷酸部分、3′-3′-反向无碱基部分、3′-2′-反向核苷酸部分、3′-2′-反向无碱基部分、1,4-丁二醇磷酸基、3′-氨基磷酸基、己基磷酸基、氨基己基磷酸基、3′-磷酸基、3′硫代磷酸基、二硫代磷酸基、或桥接或非桥接甲基膦酸基部分。
[0017] DNA:DNA是脱氧核糖核酸的常用缩写。其是核酸分子,即由核苷酸组成的聚合物。这些核苷酸通常是脱氧腺苷一磷酸、脱氧胸苷一磷酸、脱氧鸟苷一磷酸和脱氧胞苷一磷酸
单体——其本身由糖部分(脱氧核糖)、碱基部分和磷酸部分组成,并且通过特征性骨架结
构聚合。该骨架结构一般通过第一个相邻单体的核苷酸(即脱氧核糖)的糖部分和第二个相
邻单体的磷酸部分之间的磷酸二酯键形成。单体的具体顺序,即与糖/磷酸骨架连接的碱基的顺序,称为DNA序列。DNA可以是单链或双链的。在双链形式中,第一链的核苷酸一般与第二链的核苷酸杂交,例如通过A/T碱基配对和G/C碱基配对。
[0018] 序列的片段:序列的片段一般可以是全长序列的较短部分,例如核酸分子或氨基酸序列的全长序列的较短部分。因此,片段一般由与全长序列内的相应段相同的序列组成。
在本发明的环境中,优选的序列片段由连续一段实体如核苷酸或氨基酸组成,该段实体其
相应于该片段所来自的分子中的连续一段实体——代表该片段所来自的总(即,全长)分子
的至少20%,优选至少30%,更优选至少40%,更优选至少50%,甚至更优选至少60%,甚至更优选至少70%,最优选至少80%。
[0019] G/C修饰:G/C修饰的核酸一般可以是核酸,优选本文限定的人工核酸分子——基于修饰的野生型序列,其包含与野生型序列相比优选增加数量的鸟苷和/或胞嘧啶核苷酸。
这种增加数量的鸟苷或胞嘧啶核苷酸可以通过用含有鸟苷或胞嘧啶核苷酸的密码子取代
含有腺苷或胸苷核苷酸的密码子而产生。如果富集的G/C含量出现在DNA或RNA的编码区中,则其利用了遗传密码的简并性。因此,密码子取代优选不改变编码的氨基酸残基,而是仅增加核酸分子的G/C含量。如本文所用,术语“G/C修饰”具体地包括对根据本发明的RNA中鸟苷和/或胞嘧啶核苷酸的数量的修饰,例如序列的GC优化,序列对人密码子使用的适应性、密码子优化或序列的C优化。
[0020] 基因治疗:基因治疗一般可理解为意指通过编码肽或蛋白质的核酸治疗患者身体或分离的患者体内元件,例如分离的组织/细胞。其一般可以包括以下步骤中的至少一个:
a)将核酸(优选本文所定义的RNA)直接给予患者——通过任何给予途径——或在体外给予
分离的患者细胞/组织,导致体内/离体或体外患者细胞转染;b)引入的核酸分子转录和/或翻译;和任选地c)如果核酸被未直接给予患者,则将分离的转染细胞再给予患者。如本文所用的术语“基因疗法”一般包括治疗以及防止或预防疾病。
[0021] 异源序列:如果两个序列不是衍生自相同基因的,则其一般被理解为是“异源的”。即,尽管异源序列可以是衍生自相同生物体的,但其天然地(在自然界中)不存在于相同的
核酸分子中,例如在相同的mRNA中。
[0022] 克隆位点:克隆位点一般被理解为核酸分子的区段,该区段适于插入核酸序列,例如包含开放阅读框的核酸序列。插入可以通过本领域技术人员已知的任何分子生物学方法进行,例如,通过限制和连接。克隆位点一般包含一个或多个限制酶识别位点(限制位点)。
这些一个或多个限制位点可以被限制酶识别,所述限制酶在这些位点处切割DNA。包含多于一个限制位点的克隆位点也可称为多克隆位点(MCS)或聚连接体(polylinker)。
[0023] 核酸分子:核酸分子是包含核酸组分(优选由核酸组分组成)的分子。术语“核酸分子”优选指DNA或RNA分子。其优选与术语“多核苷酸”同义使用。优选地,核酸分子是包含核苷酸单体或由核苷酸单体组成的聚合物,该核苷酸单体通过糖/磷酸骨架的磷酸二酯键彼此共价连接。术语“核酸分子”还包括修饰的核酸分子,例如碱基修饰、糖修饰或骨架修饰等等的DNA或RNA分子。
[0024] 开放阅读框:本发明环境中的开放阅读框(ORF)一般可以是几个核苷酸三联体的序列,其可以翻译成肽或蛋白质。开放阅读框优选含有起始密码子——即通常编码氨基酸
甲硫氨酸(ATG)的在其5’端的三个后续核苷酸的组合,和后续区域(其通常呈现的长度为3
个核苷酸的倍数)。ORF优选通过终止密码子(例如,TAA、TAG、TGA)终止。一般,这是开放阅读框架的唯一终止密码子。因此,在本发明环境中的开放阅读框优选是这样的核苷酸序列:其由可被3整除的数量的核苷酸组成,以起始密码子(例如,ATG)开始,并且优选终止于终止密码子(例如,TAA、TGA或TAG)。开放阅读框可以被分离,或者其可被掺入较长的核酸序列中,例如载体或mRNA中。开放阅读框也可以称为“(蛋白质)编码区”,或优选地“编码序列”。
[0025] 肽:肽或多肽一般是通过肽键连接的氨基酸单体的聚合物。其一般含有少于50个单体单元。然而,术语“肽”不是放弃具有多于50个单体单元的分子。长肽也称为多肽,一般具有50至600个单体单元。
[0026] 药学有效量:本发明环境中的药学有效量一般被理解为足以引起药物作用如免疫应答、改变被表达肽或蛋白质的病理水平、或取代缺乏的基因产物(例如,在病理情况下)的量。
[0027] 蛋白质:蛋白质一般包含一种或多种肽或多肽。蛋白质一般折叠成三维形式,这可能是蛋白质发挥其生物学功能所需的。
[0028] 多(A)序列:多(A)序列,也称为多(A)尾或3′-多(A)尾,一般被理解为多个腺苷核苷酸的序列,例如,上至约400个腺苷核苷酸,例如约20至约400,优选约50至约400,更优选约50至约300,甚至更优选约50至约250,最优选约60至约250个腺苷核苷酸。如本文所用,多(A)序列还可包含约10至200个腺苷核苷酸,优选约10至100个腺苷核苷酸,更优选约40至80个腺苷核苷酸,或甚至更优选约50至70个腺苷核苷酸。多(A)序列一般位于mRNA的3’端。在本发明的环境中,多(A)序列可以位于mRNA或任何其他核酸分子内,例如,在载体中,例如,在充当模板的载体中——用于产生RNA,优选mRNA,例如通过载体的转录。
[0029] 多腺苷酸化:多腺苷酸化一般被理解为向核酸分子(例如RNA分子,例如成熟前(premature)mRNA)添加多(A)序列。多腺苷酸化可以被所谓的多腺苷酸化信号引起。该信号优选位于将要多腺苷酸化的核酸分子(例如RNA分子)的3’端的一段核苷酸内。多腺苷酸化
信号一般包含由腺嘌呤和尿嘧啶/胸腺嘧啶核苷酸组成的六聚体,优选六聚体序列AAUAAA。
其他序列,优选六聚体序列,也是可想到的。多腺苷酸化一般在前mRNA(也称为成熟前mRNA)的加工过程中发生。一般,RNA成熟(从前mRNA到成熟mRNA)包括多腺苷酸化步骤。
[0030] 限制位点:限制位点,也称为限制酶识别位点,是限制酶识别的核苷酸序列。限制位点一般是短的,优选回文的,核苷酸序列,例如,包含4至8个核苷酸的序列。限制位点优选被限制酶特异性识别。限制酶一般切割包含限制位点的核苷酸序列,在此位点处。在双链核苷酸序列如双链DNA序列中,限制酶一般切割核苷酸序列的两条链。
[0031] RNA,mRNA:RNA是核糖核酸的常用缩写。其是核酸分子,即由核苷酸组成的聚合物。这些核苷酸一般是腺苷一磷酸、尿苷一磷酸、鸟苷一磷酸和胞苷一磷酸单体,其沿着所谓的骨架相互连接。骨架通过第一相邻单体的糖(即核糖)与第二相邻单体的磷酸部分之间的磷
酸二酯键形成。单体的特定顺序性(succession)被称为RNA序列。通常,RNA可以通过DNA序列的转录获得,例如在细胞内。在真核细胞中,转录一般在细胞核或线粒体内进行。在体内,DNA的转录通常产生所谓的成熟前RNA,其必须被加工成所谓的信使RNA,通常缩写为mRNA。
成熟前RNA的加工——例如,在真核生物中——包括多种不同的转录后修饰,例如剪接、5′-封端、多腺苷酸化、从细胞核或线粒体输出等。这些过程的总和也称为RNA的成熟。成熟信使RNA通常提供可以翻译成具体肽或蛋白质的氨基酸序列的核苷酸序列。一般,成熟mRNA包含
5′-帽、5′-UTR、开放阅读框、3′-UTR和多(A)序列。除了信使RNA之外,还存在几种非编码类型的RNA,其可能涉及转录和/或翻译的调控。
[0032] 核酸分子序列:核酸分子序列一般被理解为具体的和个体的顺序,即其核苷酸的顺序性。蛋白质或肽的序列一般被理解为顺序,即其氨基酸的顺序性。
[0033] 序列同一性:如果两个或更多个序列呈现相同的核苷酸或氨基酸长度和顺序,则其是相同的(同一的,identical)。同一性百分比一般描述两个序列的相同程度,即其一般描述核苷酸其序列位置对应于参考序列的相同核苷酸的百分比。对于确定同一性程度,考
虑被比较的序列呈现相同的长度,即被比较序列的最长序列的长度。这意味着由8个核苷酸组成的第一序列与由包含第一序列的由10个核苷酸组成的第二序列的同一性是80%。换句
话说,在本发明的环境中,序列的同一性优选涉及在具有相同长度的两个或更多个序列中
具有相同位置的序列核苷酸的百分比。间隙(gaps)通常被视为不相同的位置——不论其在
比对中的实际位置。
[0034] 稳定化的核酸分子:稳定化的核酸分子是这样的核酸分子,优选DNA或RNA分子:经修饰使得其对于崩解或降解(例如通过环境因素或酶促消化,如通过外切核酸酶或内切核酸酶降解)比没有修饰的核酸分子更稳定。优选地,在本发明环境中稳定化的核酸分子在细胞(例如原核或真核细胞,优选在哺乳动物细胞中,例如人细胞中)中稳定化。稳定化效果也可以在胞外发挥,例如在缓冲溶液等中,例如在包含稳定化核酸分子的药物组合物的制备
过程中。
[0035] 转染:术语“转染”是指将核酸分子(例如DNA或RNA(例如mRNA))分子引入细胞,优选引入真核细胞。在本发明的环境中,术语“转染”包括本领域技术人员已知的用于将核酸分子引入细胞,优选引入真核细胞,例如引入哺乳动物细胞的任何方法。这种方法包括,例如,电穿孔、脂质转染——例如、基于阳离子脂质和/或脂质体、磷酸沉淀、基于纳米颗粒的转染、基于病毒的转染、或基于阳离子聚合物的转染——如DEAE-葡聚糖或聚乙烯亚胺等。优选地,引入是非病毒的。
[0036] 载体(vector):术语“载体”是指核酸分子,优选人工核酸分子。本发明环境中的载体适于掺入或含有期望的核酸序列,例如包含开放阅读框的核酸序列。这种载体可以是储存载体、表达载体、克隆载体、转移载体等。储存载体是允许方便地储存核酸分子,例如mRNA分子的载体。因此,载体可以包含例如相应于期望的mRNA序列或其部分的序列,如相应于
mRNA的编码序列和3′-UTR的序列。表达载体可用于产生表达产物,如RNA,例如mRNA,或者肽、多肽或蛋白质。例如,表达载体可以包含载体的序列段(如启动子序列,例如RNA聚合酶启动子序列)转录所需的序列。克隆载体一般是含有克隆位点的载体,该克隆位点可用于将核酸序列掺入载体中。克隆载体可以是例如质粒载体或噬菌体载体。转移载体可以是适于
将核酸分子转移到细胞或生物体中的载体,例如病毒载体。在本发明环境中的载体可以是
例如RNA载体或DNA载体。优选地,载体是DNA分子。优选地,本申请意义上的载体包含克隆位点、选择标记如抗生素抗性因子、和适于载体增殖的序列如复制起点。优选地,本申请环境中的载体是质粒载体。
[0037] 媒介物(vehicle):媒介物一般被理解为适于储存、运输和/或给予化合物(例如药物活性化合物)的材料。例如,其可以是适于储存、运输和/或给予药物活性化合物的生理学上可接受的液体。
[0038] 3′-非翻译区(3′-UTR):总体上,术语“3′-UTR”是指人工核酸分子的一部分,其位于开放阅读框架的3′(即“下游”),并且不被翻译成蛋白质。一般,3′-UTR是位于mRNA的蛋白质编码区(开放阅读框(ORF)或编码序列(CDS))和多(A)序列之间的mRNA一部分。在本发明的环境中,术语“3′-UTR”还可以包含在RNA转录模板中不被编码,但在成熟过程中在转录后添加的元件,例如,多(A)序列。mRNA的3′-UTR不被翻译成氨基酸序列。3′-UTR序列总体上由在基因表达过程中转录成对应mRNA的基因编码。基因组序列首先转录成成熟前mRNA,其包
含任选的内含子。然后成熟前mRNA在成熟过程中进一步被加工成成熟mRNA。该成熟过程包
括以下步骤:5′-封端、剪接成熟前mRNA以切除任选的内含子和3’端的修饰,例如成熟前mRNA的3’端的多腺苷酸化和任选的核酸内切/外切酶切割等。在本发明的环境中,3′-UTR相应于成熟mRNA的如下序列:位于mRNA的蛋白质编码区终止密码子(优选紧邻蛋白质终止密
码子的3′端)与多(A)序列之间。术语“相应于”意指3′-UTR序列可以是用于限定3′-UTR序列的RNA序列(如在mRNA序列中)或相应于这种RNA序列的DNA序列。在本发明的环境中,术语
“基因的3′-UTR”,例如“核糖体蛋白基因的3′-UTR”,是相应于衍生自该基因的成熟mRNA(即通过基因的转录和成熟前mRNA的成熟获得的mRNA)的3′-UTR的序列。术语“基因的3′-UTR”包括3′-UTR的DNA序列和RNA序列(正义链和反义链以及成熟和未成熟的)。
[0039] 5′-非翻译区(5′-UTR):5′-UTR一般被理解为信使RNA(mRNA)的特定部分。其位于mRNA的开放阅读框的5′。一般,5′-UTR始于转录起始位点并在终止于开放阅读框的起始密码子之前的一个核苷酸。5′-UTR可包含用于控制基因表达的元件,也称为调控元件。这种调控元件可以是例如核糖体结合位点。5′-UTR可以是转录后修饰的,例如通过添加5′-帽。在本发明的环境中,5′-UTR相应于成熟mRNA的位于5′-帽和起始密码子之间的序列。优选地,5′-UTR相应于如下序列:从5′-帽的3′位置的核苷酸,优选地从5′-帽的3′紧邻位置的核苷酸,延伸至蛋白质编码区起始密码子5′位置的核苷酸,优选延伸至蛋白质编码区起始密码子的5′紧邻位置的核苷酸。成熟mRNA的5′-帽的3′紧邻位置的核苷酸一般相应于转录起始位点。术语“相应于”意为5′-UTR序列可以是用于限定5′-UTR序列的RNA序列(如在mRNA序列中)或相应于这种RNA序列的DNA序列。在本发明的环境中,术语“基因的5′-UTR”是相应于衍生自该基因的成熟mRNA(即通过基因的转录和成熟前mRNA的成熟获得的mRNA)的5′-UTR的
序列。术语“基因的5′-UTR”包括5′-UTR的DNA序列和RNA序列。通过本发明的实施方式,可以在编码序列的5’端提供这样的5′-UTR。其长度一般小于500、400、300、250或小于200个核苷酸。在其他实施方式中,其长度可以在至少10、20、30或40,优选上至100或150个核苷酸的范围内。
[0040] 5′-端寡嘧啶束(TOP):5’端寡嘧啶束(TOP)一般是位于核酸分子的5’端区域的一段嘧啶核苷酸,例如某些mRNA分子的5’-端区域或功能实体的5’端区域,例如某些基因的转录区。该序列始于胞苷——其通常相应于转录起始位点,然后是一段通常约3至30个嘧啶核苷酸。例如,TOP可包括3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或甚至更多个核苷酸。嘧啶段以及因此5′TOP终止于位于TOP下游的第一个嘌呤核苷酸的5’的一个核苷酸。含有5’端寡嘧啶束的信使RNA通常被称为TOP mRNA。
因此,提供这种信使RNA的基因被称为TOP基因。TOP序列例如已被发现于编码肽延长因子和核糖体蛋白的基因和mRNA中。
[0041] TOP基序:在本发明的环境中,TOP基序是相应于如上限定的5′TOP的核酸序列。因此,本发明环境中的TOP基序优选是长度为3-30个核苷酸的一段嘧啶核苷酸。优选地,TOP-基序由至少3个嘧啶核苷酸,优选至少4个嘧啶核苷酸,优选至少5个嘧啶核苷酸,更优选至少6个核苷酸,更优选至少7个核苷酸,最优选至少8个嘧啶核苷酸组成,其中该段嘧啶核苷酸优选其5’端始于胞嘧啶核苷酸。在TOP基因和TOP mRNA中,TOP-基序优选其5′端始于转录起始位点,并且终于所述基因或mRNA中的第一个嘌呤残基的5′的一个核苷酸。本发明意义上的TOP基序优选位于序列的5’端——表示5′-UTR,或位于序列的5’端——编码5′-UTR。因此,优选地,一段3个或更多个嘧啶核苷酸在本发明意义上被称为“TOP基序”——如果该段位于对应序列(如人工核酸分子、人工核酸分子的5′-UTR元件、或衍生自如本文所述的TOP基因的5′-UTR的核酸序列)的5’端。换句话说,不位于5′-UTR或5′-UTR元件的5′端而是位于5′-UTR或5′-UTR元件内的任何位置的一段3个或更多个嘧啶核苷酸优选不被称为“TOP基
序”。
[0042] TOP基因:TOP基因一般以存在5’端寡嘧啶束为特征。此外,大多数TOP基因的特征在于与生长相关的翻译调控。然而,还已知具有组织特异性翻译调控的TOP基因。如上所定义,TOP基因的5′-UTR相应于衍生自TOP基因的成熟mRNA的5′-UTR序列,其优选从位于5’-帽的3′的核苷酸延伸至位于起始密码子的5′的核苷酸。TOP基因的5′-UTR一般不包含任何起始密码子,优选不包含上游AUG(uAUG)或上游开放阅读框(uORF)。其中,上游AUG和上游开放阅读框一般被理解为存在于将被翻译的开放阅读框的起始密码子(AUG)的5′的AUG和开放阅读框。TOP基因的5′-UTR总体上相当短。TOP基因的5′-UTR的长度可以在20个核苷酸上至
500个核苷酸之间变化,并且一般小于约200个核苷酸,优选小于约150个核苷酸,更优选小于约100个核苷酸。本发明意义上的TOP基因的示例性5′-UTR是从根据专利申请WO2013/
143700的SEQ ID NO:1-1363的序列中的第5位核苷酸延伸至起始密码子(例如ATG)的5′紧
邻位置的核苷酸的核酸序列,该专利申请的公开内容通过引用并入本文。在此环境中,TOP基因的5′-UTR的特别优选片段是不具有5′TOP基序的TOP基因的5′-UTR。术语“TOP基因的
5′-UTR”或“5′TOP-UTR”优选是指天然存在的TOP基因的5′-UTR。
[0043] 发明的详细描述
[0044] 本发明涉及新型RNA以及包含该RNA的组合物和试剂盒。此外,提供了根据本发明的RNA以及组合物和试剂盒的几种用途,具体地医学用途。
[0045] 第一方面,本发明涉及包含编码至少一种肽或蛋白质的编码序列的至少一种RNA,所述肽或蛋白质包含下列或由下列组成:选自由胞外基质蛋白酶或人胶原酶MMP1、肝细胞
生长因子(HGF)、CCAAT/增强子结合蛋白α(CEBPA)、TNF相关凋亡诱导配体(TRAIL)、肝细胞核因子4α(HNF4A)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、梭菌II型胶原酶、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)、或这些肽或蛋白质的中任意者的片段或变体。
[0046] 根据本发明的RNA优选适用于治疗或预防本文所述的肝脏疾病或肝脏障碍,优选选自肝纤维化和肝硬化。更优选地,根据本发明的RNA优选适用于安全有效治疗或预防哺乳动物中的,优选人体中的,本文所述的肝脏疾病。
[0047] 因此,在第二方面,本发明提供如本文所述的RNA,其用于治疗或预防肝脏疾病。此外,优选提供如本文所述的RNA用于基因治疗。
[0048] 在下文中,描述了根据本发明的RNA。关于本发明RNA的公开内容本身也适用于如本文所述的(医学)用途的RNA以及包含根据本发明的RNA的(药物)组合物环境中的RNA或试
剂盒(部件的试剂盒)环境中的RNA。具体地,当提及“根据本发明的RNA”时,本公开还涉及“根据本发明的用途的RNA”,反之亦然。
[0049] 发明人惊奇地发现,根据本发明的RNA能够提供至少一个编码区中编码的肽或蛋白质的充分表达,例如,在将RNA给予哺乳动物对象,具体地肝脏组织时。通过使用本发明的RNA可以惊人地获得增加的肽或蛋白质的表达水平——与通过使用本领域已知的编码对应
肽或蛋白质的参考构建体获得的表达水平相比。有利地,由该RNA编码的肽或蛋白质可以因此发挥其作用,其优选用于治疗或预防肝脏疾病——具体地在哺乳动物对象的肝脏中,优
选没有副作用或具有可接受的副作用。在优选的实施方式中,被编码的肽或蛋白质的表达
水平在肝脏中足够高以在肝脏中发挥其作用,并在其他器官中较低以减少副作用。
[0050] 在本发明的环境中,根据本发明的RNA的至少一个编码序列优选包含编码肽或蛋白质的核酸序列,所述肽或蛋白质包含本文限定的肽或蛋白质或由本文限定的肽或蛋白质
组成。在一些实施方式中,肽或蛋白质基本上包含参考肽或蛋白质(例如天然存在的肽或蛋白质(例如基质金属蛋白酶-1或TNF相关凋亡诱导配体(TRAIL)))的完整氨基酸序列。如本
文所用的术语“全长肽或蛋白质”可以指天然存在的肽或蛋白质,例如包含下列氨基酸序列或由下列氨基酸序列组成的肽或蛋白质:选自通过数据库登录号NP_003801.1、P50591、NP_
036656.1、P05554、NP_031704.2、P53566、NP_004355.2、P49715、NP_000448.3、P41235、NP_
061986.1、Q9NSA1、NP_078852.3、Q5TC84、NP_008842.1、P04808、NP_604390.1、P04090、NP_
543140.1、Q8WXF3、NP_002412.1、P03956、BAA77453.1、BAA34542.1和BAA34542.1或者通过SEQ ID NO:4、8、10、12、14-19、20、22、25和26限定的氨基酸序列中任意者。此外,该术语还可以指包含选自SEQ ID NO:5-7、9、11、13、21、23、24、27和28的氨基酸序列或由其组成的肽或蛋白质。此外,该术语还可以指通过数据库登录号NM_003810.3、CCDS3219.1、
ENSG00000121858、NM_012524.3、NM_007678.3、CCDS21145.1、NM_004364.4、CCDS54243、M37197、ENSG00000245848、NM_000457.4、CCDS13330.1、X76930、ENSG00000101076、NM_
019113.3、CCDS12734.1、AB021975、ENSG00000105550、NM_024576.4、CCDS34482.1、
ENSG00000119900、NM_006911.3、CCDS6462.、ENSG00000107018、NM_134441.2、CCDS6460.1、ENSG00000107014、NM_080864.3、NM_001311197、CCDS12302.1、AF447451、
ENSG00000171136、NM_002421.3、CCDS8322.1、X54925、ENSG00000196611、D87215.1、
AB014075.1和AB014075限定的核酸序列中任意者编码的氨基酸序列。
[0051] 根据优选的实施方式,根据本发明的RNA的至少一个编码序列编码肽或蛋白质,该肽或蛋白质包含下列氨基酸序列或由下列氨基酸序列组成:选自通过数据库登录号NP_
003801.1、P50591、NP_036656.1、P05554、NP_031704.2、P53566、NP_004355.2、P49715、NP_
000448.3、P41235、NP_061986.1、Q9NSA1、NP_078852.3、Q5TC84、NP_008842.1、P04808、NP_
604390.1、P04090、NP_543140.1、Q8WXF3、NP_002412.1、P03956、BAA77453.1、BAA34542.1和BAA34542.1限定的氨基酸序列中任意者、或这些氨基酸序列中任意者的片段或变体。更优
选地,被编码的肽或蛋白质包含下列由下列组成:通过数据库登录号NM_003810.3、
CCDS3219.1、ENSG00000121858、NM_012524.3、NM_007678.3、CCDS21145.1、NM_004364.4、CCDS54243、M37197、ENSG00000245848、NM_000457.4、CCDS13330.1、X76930、
ENSG00000101076、NM_019113.3、CCDS12734.1、AB021975、ENSG00000105550、NM_024576.4、CCDS34482.1、ENSG00000119900、NM_006911.3、CCDS6462.、ENSG00000107018、NM_
134441.2、CCDS6460.1、ENSG00000107014、NM_080864.3、NM_001311197、CCDS12302.1、AF447451、ENSG00000171136、NM_002421.3、CCDS8322.1、X54925、ENSG00000196611、
D87215.1、AB014075.1和AB014075限定的核酸序列中任意者编码的氨基酸序列。甚至更优
选地,被编码的肽或蛋白质包含选自SEQ ID NO:4至SEQ ID NO:28的氨基酸序列或这些氨基酸序列中任意者的片段或变体、或由其组成。
[0052] 可选地,根据本发明的RNA的至少一个编码序列还可以包含编码肽或蛋白质的核酸序列,所述肽或蛋白质包含本文限定的肽或蛋白质的片段或肽或蛋白质变体的片段或由
其组成。
[0053] 在本发明的环境中,肽或蛋白质或其变体的“片段”可包含如上限定的肽或蛋白质或其变体的序列,该“片段”就其氨基酸序列(或其编码核酸序列)而言,与参考氨基酸序列如天然存在的蛋白质的氨基酸序列或其变体(或其编码核酸序列)相比,N端、C端和/或序列中(intrasequentially)截短。这种截短可分别在氨基酸水平或核酸水平上发生。因此,关于本文限定的这种片段的序列同一性优选是指本文限定的完整肽或蛋白质或其变体、或这种肽或蛋白质或其变体的完整(编码)核酸序列。
[0054] 根据本发明的一些实施方式,RNA包含编码肽或蛋白质的至少一个编码序列,所述肽或蛋白质包含本文限定的肽或蛋白质的变体或肽或蛋白质的变体的片段、或由其组成。
[0055] 在本发明的某些实施方式中,本文限定的肽或蛋白质或其片段的“变体”可由包含本文限定的至少一个编码序列的RNA编码,其中由至少一个编码序列编码的氨基酸序列与参考氨基酸序列如天然存在的氨基酸序列存在至少一个氨基酸残基的区别。在此环境中,
至少一个氨基酸残基的“变化”可以包括,例如,氨基酸残基突变为另一个氨基酸、删除或插入。更优选地,在由根据本发明的RNA的至少一个编码序列编码的氨基酸序列的环境中使用的术语“变体”包括本文限定的肽或蛋白质的任何同源物、同种型或转录物变体或其片段,其中同源物、同种型或转录物变体优选分别以同一性或同源性程度为特征,如本文限定。
[0056] 在本发明的环境中,蛋白质或肽的“片段”或“变体”可与这种蛋白质或肽的一段至少10、至少20、至少30、至少50、至少75或至少100个氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、
69%、70%、71%、72%、73%、74%,75%、76%、77%、78%、79%、80%、81%、82%、83%、
84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或
99%的氨基酸同一性。更优选地,如本文所用的蛋白质或肽的“片段”或“变体”与该变体的来源蛋白质或肽具有至少40%,优选至少50%,更优选至少60%,更优选至少70%,甚至更优选至少80%,甚至更优选至少90%,最优选至少95%同一性。
[0057] 优选地,肽或蛋白质的变体或其片段可以由本文限定的包含至少一个编码序列的RNA编码,其中由至少一个编码序列编码的氨基酸序列的至少一个氨基酸残基被取代。其中衍生自相同类别的氨基酸彼此交换的取代称为保守取代。具体地,这些是具有脂族侧链、带正电荷或带负电荷的侧链、侧链中具有芳族基团的氨基酸或其侧链可以形成氢桥(例如,具有羟基官能的侧链)的氨基酸。通过保守构成,例如具有极性侧链的氨基酸可以被具有相应极性侧链的另一种氨基酸取代,或者,例如,具有疏水侧链特征的氨基酸可以被具有相应疏水侧链的另一种氨基酸取代(例如,通过丝氨酸(苏氨酸)苏氨酸被(丝氨酸)取代,或亮氨酸(异亮氨酸)被异亮氨酸(亮氨酸)取代)。在优选的实施方式中,肽或蛋白质的变体或其片段可以由根据本发明的RNA编码,其中由至少一个编码序列编码的氨基酸序列的至少一个氨
基酸残基与参考序列如对应的天然存在序列相比包含至少一个保守取代。本文限定的术语
“变体”具体地包括这些氨基酸序列以及其编码核酸序列。
[0058] 插入、删除和/或非保守取代也是可能的,具体地在优选不引起三维结构显著变动(修饰,modification)的那些序列位置。通过插入(一个或多个)或删除(一个或多个)对三
维结构的修饰可以容易地确定,例如利用CD光谱(圆二色谱)(Urry,1985,Absorption,
Circular Dichroism and ORD of Polypeptides,in:Modern Physical Methods in 
Biochemistry,Neuberger等(ed.),Elsevier,Amsterdam)。
[0059] 为了确定两个序列(核酸序列,例如本文限定的RNA或mRNA序列,或氨基酸序列,优选由根据本发明的RNA编码的氨基酸序列)的同一性百分比,可以比对(对齐,aligned)该序列以便随后相互比较。为此目的,例如可以将间隙插入第一序列的序列中,并且可以比较第二序列的相应位置处的组分。如果第一序列中的一个位置被与第二序列中的相应位置处相同的组分占据,则这两个序列在该位置处是相同的。两个序列的同一性百分比是相同位置
数除以总位置数的函数。两个序列的同一性百分比可以利用数学算法确定。可以使用的数
学算法的优选但非限制性的示例是Karlin等(1993),PNAS USA,90:5873-5877或Altschul等(1997),NucleicAcids Res.,25:3389-3402的算法。这种算法例如在BLAST程序中集成。
通过该程序可以鉴定与本发明的序列在一定程度上相同的序列。
[0060] 在本发明的环境中,由根据本发明的RNA的至少一个编码序列编码的肽或蛋白质或其变体的片段可以一般包含与参考氨基酸序列(优选与对应的天然存在的全长肽或蛋白
质或其变体的氨基酸序列)具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少
95%或甚至97%序列同一性的氨基酸序列。
[0061] 更优选地,由根据本发明的RNA的至少一个编码序列编码的肽或蛋白质或其变体的片段一般包含下列或由下列组成:与通过数据库登录号NP_003801.1、P50591、NP_
036656.1、P05554、NP_031704.2、P53566、NP_004355.2、P49715、NP_000448.3、P41235、NP_
061986.1、Q9NSA1、NP_078852.3、Q5TC84、NP_008842.1、P04808、NP_604390.1、P04090、NP_
543140.1、Q8WXF3、NP_002412.1、P03956、BAA77453.1、BAA34542.1和BAA34542.1限定的参考氨基酸序列中的任意者具有至少80%序列同一性的氨基酸序列,或这些肽或蛋白质中任
意者的片段或变体。最优选地,被编码的肽或蛋白质包含下列或由下列组成:与选自SEQ ID NO:4至SEQ ID NO:28的参考氨基酸序列中的任意者具有至少80%序列同一性的氨基酸序
列、或这些序列中任意者的片段或变体。
[0062] 优选地,编码本文限定的至少一种肽或蛋白质的RNA的至少一个编码序列包含下列或由下列组成:选自SEQ ID NO:32-71、75、76、77、78、79、80、81、82、83、84、85、86、87、88、
89、90、91、92、93、94、95、96、97、98、99、103、104、105、106、107、108、109、110、111、112、113、
114、115、116、117、118、119、120、121、122、123、124、125、126、127、131、132、133、134、135、
136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、
155、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、
177、178、179、180、181、182、183、187、188、189、190、191、192、193、194、195、196、197、198、
199、200、201、202、203、204、205、206、207、208、209、210、211、215、216、217、218、219、220、
221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、
243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、
262、263、264、265、266、267、271、272、273、274、275、276、277、278、279、280、281、282、283、
284、285、286、287、288、289、290、291、292、293、294、295、299、300、301、302、303、304、305、
306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、327、
328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、
347、348、349、350、351、355、356、357、358、359、360、361、362、363、364、365、366、367、368、
369、370、371、372、373、374、375、376、377、378、379、383、384、385、386、387、388、389、390、
391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406和407的核酸序列,或这些核酸序列中任意者的片段或变体。如本文所用,包含下列或由下列组成的核酸序列也可以被称为“全长核酸(序列)”:选自SEQ ID NO:32-71、75、76、77、78、79、80、81、82、
83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、103、104、105、106、107、108、
109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、
131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、
150、151、152、153、154、155、159、160、161、162、163、164、165、166、167、168、169、170、171、
172、173、174、175、176、177、178、179、180、181、182、183、187、188、189、190、191、192、193、
194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、215、
216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、
235、236、237、238、239、243、244、245、246、247、248、249、250、251、252、253、254、255、256、
257、258、259、260、261、262、263、264、265、266、267、271、272、273、274、275、276、277、278、
279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、299、300、
301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、
320、321、322、323、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、
342、343、344、345、346、347、348、349、350、351、355、356、357、358、359、360、361、362、363、
364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、383、384、385、
386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、
405、406和407的核酸序列。
[0063] 在某些实施方式中,根据本发明的RNA,优选根据本发明的RNA的至少一个编码序列,可以包含编码本文限定的肽或蛋白质或其片段或变体的核酸序列的片段或由其组成。
优选地,根据本发明的RNA的至少一个编码序列包含下列或由下列组成:根据SEQ ID NO:
32-71、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、
98、99、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、
120、121、122、123、124、125、126、127、131、132、133、134、135、136、137、138、139、140、141、
142、143、144、145、146、147、148、149、150、151、152、153、154、155、159、160、161、162、163、
164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、
183、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、
205、206、207、208、209、210、211、215、216、217、218、219、220、221、222、223、224、225、226、
227、228、229、230、231、232、233、234、235、236、237、238、239、243、244、245、246、247、248、
249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、
271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、
290、291、292、293、294、295、299、300、301、302、303、304、305、306、307、308、309、310、311、
312、313、314、315、316、317、318、319、320、321、322、323、327、328、329、330、331、332、333、
334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、355、
356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、
375、376、377、378、379、383、384、385、386、387、388、389、390、391、392、393、394、395、396、
397、398、399、400、401、402、403、404、405、406和407的核酸序列中任意者的片段,优选如本文限定的片段,或这些序列中任意者的变体。
[0064] 在此环境中,“核酸(序列)的片段”优选是编码如本文所述的肽或蛋白质或其变体的片段的核酸序列。更优选地,表述“核酸序列的片段”是指与对应的全长核酸序列,优选与选自SEQ ID NO:32-71、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、103、104、105、106、107、108、109、110、111、112、113、114、115、116、
117、118、119、120、121、122、123、124、125、126、127、131、132、133、134、135、136、137、138、
139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、159、160、
161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、
180、181、182、183、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、
202、203、204、205、206、207、208、209、210、211、215、216、217、218、219、220、221、222、223、
224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、243、244、245、
246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、
265、266、267、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、
287、288、289、290、291、292、293、294、295、299、300、301、302、303、304、305、306、307、308、
309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、327、328、329、330、
331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、
350、351、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、
372、373、374、375、376、377、378、379、383、384、385、386、387、388、389、390、391、392、393、
394、395、396、397、398、399、400、401、402、403、404、405、406和407的核酸序列或这些核酸序列中任意者的变体具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列。
[0065] 在另一个优选的实施方式中,根据本发明的RNA,优选根据本发明的RNA的至少一个编码序列,可以包含下列或由下列组成:本文限定的核酸序列的变体,优选编码本文限定的肽或蛋白质或其片段的核酸序列的变体。
[0066] 本文在编码如本文所述的肽或蛋白质或其片段的核酸序列的环境中使用的表述“核酸序列的变体”一般是指这样的核酸序列:与对应的参考核酸序列,例如与对应的天然存在的核酸序列或与本文限定的全长核酸序列,或与其片段存在至少一个核酸残基的区
别。更优选地,在本发明的环境中使用的表述“核酸序列的变体”是指与其来源核酸序列具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%,98%或99%,优选至少70%,更优选至少
80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列。
[0067] 优选地,根据本发明的RNA,更优选根据本发明的RNA的至少一个编码序列,编码肽或蛋白质的变体或其片段,优选如本文限定。
[0068] 在一个优选的实施方式中,根据本发明的RNA,更优选根据本发明的RNA的至少一个编码序列,包含编码如本文限定的肽或蛋白质或其片段的核酸序列的变体、或由其组成,其中核酸序列的变体编码包含氨基酸残基的至少一个保守取代的氨基酸序列。
[0069] 在另一个实施方式中,根据本发明的RNA,更优选根据本发明的RNA的至少一个编码序列,包含编码本文限定的肽或蛋白质或其片段的核酸序列的变体、或由其组成,其中所述变体的核酸序列与参考核酸序列,优选与对应的天然存在的核酸序列的区别在于至少一
个核酸残基,更优选不因简并的遗传密码而导致被编码的氨基酸序列改变,即由变体或其
至少部分编码的氨基酸序列可以优选与天然存在的氨基酸序列不存在上述含义内的一个
或多个突变的区别。
[0070] 此外,编码本文限定的肽或蛋白质或其片段或变体的核酸序列的“变体”还可以包含相应于本文限定的RNA序列的DNA序列,并且还可以包含相应于本文限定的DNA序列的其他RNA序列。本领域技术人员熟知将RNA序列翻译成DNA序列(或反之)或与产生互补链序列
(即通过用T残基取代U残基和/或关于给定序列构建互补链)。
[0071] 根据优选的实施方式,根据本发明的RNA的至少一个编码序列包含下列或由下列组成:与参考核酸序列,优选与编码天然存在的全长肽或蛋白质或其变体的核酸序列,或与本文限定的全长肽或蛋白质或其变体,具有至少5%、10%、20%、30%、40%、50%、60%、
70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少
90%,最优选至少95%或甚至97%的序列同一性的核酸序列。
[0072] 在进一步优选的实施方式中,根据本发明的RNA的至少一个编码序列包含下列或由下列组成:与选自SEQ ID NO:SEQ ID NO:32-71、75、76、77、78、79、80、81、82、83、84、85、
86、87、88、89、90、91、92、93、94、95、96、97、98、99、103、104、105、106、107、108、109、110、
111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、131、132、
133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、
152、153、154、155、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、
174、175、176、177、178、179、180、181、182、183、187、188、189、190、191、192、193、194、195、
196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、215、216、217、
218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、
237、238、239、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、
259、260、261、262、263、264、265、266、267、271、272、273、274、275、276、277、278、279、280、
281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、299、300、301、302、
303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、
322、323、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、
344、345、346、347、348、349、350、351、355、356、357、358、359、360、361、362、363、364、365、
366、367、368、369、370、371、372、373、374、375、376、377、378、379、383、384、385、386、387、
388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406和
407的核酸序列具有5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%的同一性或序列同一性的核酸序列,或这些核酸序列中任意者的片段或变体。
[0073] 根据进一步优选的实施方式,根据本发明的RNA的至少一个编码序列包含下列或由下列组成:与选自SEQ ID NO:36、37、75、77、78、91-95和97-99的核酸序列相同或至少
80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0074] 在另一个实施方式中,根据本发明的RNA的至少一个编码序列包含下列或由下列组成:与选自SEQ ID NO:75、77、78、91-95和97-99的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0075] 根据优选的实施方式,本发明提供了包含至少一个编码序列的RNA,其中所述RNA的至少一个编码序列编码包含胞外基质(ECM)蛋白酶或由胞外基质(ECM)蛋白酶组成的至
少一种肽或蛋白质、或其片段或变体。本发明进一步提供了包含至少一个编码序列的RNA,其中编码序列编码包含胞外基质(ECM)蛋白酶或由胞外基质(ECM)蛋白酶组成的至少一种
肽或蛋白质、或其片段或变体,如本文所述用于治疗或预防肝脏疾病,其中肝脏疾病优选选自肝纤维化和肝硬化。
[0076] 在本发明的环境中,术语“胞外基质蛋白酶”是指能够催化胞外基质蛋白降解的酶,优选在肝组织中。如本文所用,“胞外基质蛋白”优选是肝组织中的任何类型的胞外基质蛋白,更优选是胶原,甚至更优选选自间质胶原和基底膜胶原,最优选选自I型、III型和IV型胶原。如本文所用的术语“胞外基质蛋白酶”优选指胶原酶,更优选指本文所述的细菌胶原酶或哺乳动物基质金属蛋白酶(本文中也称为“哺乳动物胶原酶”)。细菌胶原酶的实例包括梭菌胶原酶,更优选梭菌II型胶原酶,最优选来自溶组织梭菌(Clostridium 
histolyticum)的II型胶原酶(例如ColG或ColH)。示例性哺乳动物基质金属蛋白酶是例如
人基质金属蛋白酶-1。
[0077] 胞外基质蛋白酶,例如细菌或哺乳动物胶原酶,一般被表达为前体蛋白,其通常是无活性的。所述前体蛋白可以被细胞酶活化,所述细胞酶除去调控结构域——例如通过在确定的切割位点处蛋白水解切割。根据本发明的优选实施方式,RNA的至少一个编码序列编码包含下列或由下列组成的至少一种肽或蛋白质:缺少所述调控结构域的胶原酶,优选细
菌胶原酶或哺乳动物基质金属蛋白酶,或其片段或变体。缺少调控结构域的胶原酶优选在
表达后是具有活性的,即使没有事先激活。
[0078] 在一个实施方式中,根据本发明的RNA的至少一个编码序列编码包含下列与由下列组成的至少一种肽或蛋白质:与选自SEQ ID NO:20-28的氨基酸序列相同或至少80%相
同的氨基酸序列,或所述氨基酸序列中任意者的片段或变体。
[0079] 在优选的实施方式中,根据本发明的RNA的至少一个编码序列编码包含下列与由下列组成的至少一种肽或蛋白质:哺乳动物基质金属蛋白酶,优选基质金属蛋白酶-1,更优选人基质金属蛋白酶-1,或其片段或变体。
[0080] 如本文所用,术语“人基质金属蛋白酶-1”可以缩写为例如“MMP1”,并且一般是指包含下列与由下列组成的肽或蛋白质:与数据库登录号NP_002412.1或P03956限定的氨基酸序列中的任意者相同或至少80%相同的氨基酸序列,或这些序列中任意者的同源物、片
段或变体。优选地,该术语还可以指与数据库登录号NM_002421.3、CCDS8322.1、X54925或ENSG00000196611限定的或核酸序列中的任意者相同或至少80%相同的核酸序列所编码的
氨基酸序列,或这些序列中任意者的同源物、片段或变体。此外,该术语如本文使用还可以指包含下列或由下列组成的肽或蛋白质:与选自SEQ ID NO:20或21的氨基酸序列相同或至少80%相同的氨基酸序列,或所述氨基酸序列中任意者的同源物、片段或变体。
[0081] 在某些实施方式中,根据本发明的RNA的至少一个编码序列编码包含哺乳动物基质金属蛋白酶或由哺乳动物基质金属蛋白酶组成的至少一种肽或蛋白质,其中所述肽或蛋
白质包含下列或由下列组成:与SEQ ID NO:20或21相同或至少80%相同的氨基酸序列,或这些氨基酸序列中任意者的片段或变体。根据优选的实施方式,被编码的肽或蛋白质包含
与SEQ ID NO:21相同或至少80%相同的氨基酸序列或其片段或变体,或由此组成。其中,RNA的至少一个编码序列优选包含下列或由下列组成:与选自SEQ ID NO:55、56、57、91、92、
119、120、147、148、175、176、203、204、231、232、259、260、287、288、315、316、343、344、371、
372、399和400的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0082] 在可选实施方式中,根据本发明的RNA的至少一个编码序列编码包含下列或由下列组成的至少一种肽或蛋白质:细菌胶原酶,优选梭菌胶原酶,更优选梭菌II型胶原酶,最优选来自溶组织梭菌的II型胶原酶,或其片段或变体。特别优选编码的肽或蛋白质包含来
自溶组织梭菌的ColG或ColH,或由其组成。
[0083] 如本文所用,术语“ColG”一般是指包含下列或由下列组成的肽或蛋白质:与数据库登录号BAA77453.1限定的氨基酸序列相同或至少80%相同的氨基酸序列,或其同源物、片段或变体。优选地,该术语还可以指与数据库登录号D87215.1限定的核酸序列相同或至
少80%相同的核酸序列所编码的氨基酸序列,或其同源物、片段或变体。此外,该术语如本文使用还可以指包含下列或由下列组成的肽或蛋白质:与选自SEQ ID NO:22-24的氨基酸
序列相同或至少80%相同的氨基酸序列,或所述氨基酸序列中任意者的同源物、片段或变
体。
[0084] 在本发明的环境中,术语“ColH”一般是指包含下列或由下列组成的肽或蛋白质:与数据库登录号BAA34542.1限定的氨基酸序列相同或至少80%相同的氨基酸序列,或其同
源物、片段或变体。优选地,该术语还可以指与数据库登录号AB014075.1限定的核酸序列相同或至少80%相同的核酸序列所编码的氨基酸序列,或其同源物、片段或变体。此外,该术语如本文使用还可以指包含下列或由下列组成的肽或蛋白质:与选自SEQ ID NO:25-28的
氨基酸序列相同或至少80%相同的氨基酸序列,或所述氨基酸序列中任意者的同源物、片
段或变体。
[0085] 如上所述,胶原酶一般被表达为前体蛋白。通常,胶原酶前体蛋白被细胞蛋白酶切割。然而,由于细菌胶原酶(例如ColG和ColH)中的切割位点是细菌来源的,因此真核蛋白酶在某些情况下可能不能有效切割前体蛋白。此外,当重组胶原酶以高水平表达时,切割可能是低效的。在优选的实施方式中,RNA的至少一个编码序列编码包含本文所述的细菌胶原酶或由其组成的至少一种肽或蛋白质,其中细菌胶原酶包含切割位点,优选furin切割位点。更优选地,RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含与根据
SEQ ID NO:3的氨基酸序列相同或至少80%相同的氨基酸序列;或其片段或变体。在优选的实施方式中,RNA的至少一个编码序列包含与选自SEQ ID NO:31、74、102、130、158、186、
214、242、270、298、326、354和382的核酸序列相同或至少80%相同的核酸序列,或其片段或变体。在优选的实施方式中,所述切割位点的存在有利地增强了真核细胞中细菌胶原酶如
ColG和ColH的成熟过程。
[0086] 在一些实施方式中,根据本发明的RNA的至少一个编码序列编码包含ColG或由ColG组成的至少一种肽或蛋白质,其中所述肽或蛋白质包含下列或由下列组成:与选自SEQ ID NO:22-24的氨基酸序列相同或至少80的氨基酸序列,或这些氨基酸序列中任意者的片
段或变体。其中,RNA的至少一个编码序列优选包含下列或由下列组成:与选自SEQ ID NO:
58、59、60、61、62、63、93、94、95、121、122、123、149、150、151、177、178、179、205、206、207、
233、234、235、261、262、263、289、290、291、317、318、319、345、346、347、373、374、375、401、
402和403的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或
变体。
[0087] 根据进一步的实施方式,根据本发明的RNA的至少一个编码序列编码包含ColH或由ColH组成的至少一种肽或蛋白质,其中所述肽或蛋白质包含下列或由下列组成:与选自
SEQ ID NO:25-28的氨基酸序列相同或至少80%相同其的氨基酸序列,或这些氨基酸序列
中任意者的片段或变体。其中,RNA的至少一个编码序列优选包含下列或由下列组成:与选自SEQ ID NO:64、65、66、67、68、69、70、71、96、97、98、99、124、125、126、127、152、153、154、
155、180、181、182、183、208、209、210、211、236、237、238、239、264、265、266、267、292、293、
294、295、320、321、322、323、348、349、350、351、376、377、378、379、404、405、406和407的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0088] 在一些实施方式中,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含本文限定的细菌胶原酶,优选ColG或ColH,其中所述肽或蛋白质包含信号肽,优选异源信号肽。如本文所用,术语“异源”是指衍生自另一基因的核酸序列或氨基酸序列。因此,异源信号肽优选不来自胶原酶基因,更优选不来自细菌胶原酶基因,甚至更优选不来自梭菌胶原酶基因。
[0089] 优选地,如本文所述的信号肽与细菌胶原酶基因的N端融合。在一些实施方式中,可以修饰细菌胶原酶基因,以用如本文所述的异源信号肽替代原始(野生型)信号肽。在另
一个实施方式中,如本文所述的furin切割位点被引入信号肽的3′(C端),以允许通过切割去除信号肽。
[0090] 在优选的实施方式中,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含与选自SEQ ID NO:1和1455-1468的氨基酸序列相同或至少80%相同的氨基酸序列,或这些氨基酸序列中任意者的片段或变体。优选地,根据本发明的RNA的至少一个编码序列优选包含与选自SEQ ID NO:29、72、100、128、156、184、212、240、268、
296、324、352、380、489和1469-1650的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0091] 更优选地,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含与选自SEQ ID NO:1651-1654的氨基酸序列相同或至少80%相同的氨基酸序
列,或这些氨基酸序列中任意者的片段或变体,并且还包含与选自SEQ ID NO:1和1455-
1468的氨基酸序列相同或至少80%相同的氨基酸序列,或这些氨基酸序列中任意者的片段
或变体。
[0092] 根据优选的实施方式,根据本发明的RNA的至少一个编码序列优选包含与选自SEQ ID NO:1655-1710的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者
的片段或变体,并且还包含与选自SEQ ID NO:29、72、100、128、156、184、212,240、268、296、
324、352、380、489和1469-1650的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0093] 根据优选的实施方式,本发明提供如本文所述的RNA,其用于治疗或预防肝脏疾病,其中所述治疗或预防包括ColG和ColH或其中任意者的片段或变体两者的表达。在该实
施方式中,通过提供(和给予,优选如本文所述)编码两者ColG和ColH或其中任意者的片段
或变体的根据本发明的RNA的实施方式,实现了在靶组织中表达ColG和ColH或其中任意者
的片段或变体。
[0094] 在一些实施方式中,治疗或预防肝脏疾病包括给予编码ColG或其片段或变体的本文所述RNA,和给予编码ColH或其片段或变体的另一本文所述RNA,其中优选同步给予这两
种RNA。
[0095] 可选地,治疗或预防肝脏疾病可包括给予本文所述RNA,其中该RNA编码两者ColG和ColH或其中任意者的片段或变体。在优选的实施方式中,根据本发明的RNA是双顺反子或多顺反子RNA,其中单独的编码序列分别编码ColG和ColH或其中任意者的片段或变体。作为可选方式,根据本发明的RNA可以包含编码多肽或蛋白质的编码序列,所述多肽或蛋白质包含两者ColG和ColH或其中任意者的片段或变体。其中,分别衍生自ColG和ColH的氨基酸序
列可以被连接体和/或加工位点隔开,该连接体和/或加工位点任选地允许衍生自ColG和
ColH的氨基酸序列分别被切割以及因此分离。
[0096] 在优选的实施方式中,治疗或预防肝脏疾病包括给予两者ColG和ColH或其中任意者的片段或变体,如本文所述,其中表达的ColG或其片段或变体与表达的ColH或其片段或
变体的摩尔比为约为1。可选地,表达的ColG或其片段或变体与表达的ColH或其片段或变体的摩尔比优选在约0.1至约10范围内,优选约0.2至约5,更优选约0.3至约5,甚至更优选约
0.5至约2,最优选约1。在优选的实施方式中,表达的ColG或其片段或变体与表达的ColH或其片段或变体的摩尔比在约1至约10范围内,优选约2至约10,约2至约5,或约2至约4。可选地,表达的ColH或其片段或变体与表达的ColG或其片段或变体的摩尔比在约1至约10范围
内,优选约2至约10,约2至约5,或约2至约4。其中,所述比例与ColG和ColH或其中任意者的片段或变体分别是由一个还是多个RNA或是由相同的编码序列还是由单独的编码序列表达
无关。
[0097] 根据特别优选的实施方式,治疗或预防肝脏疾病包括给予两者ColG和ColH或其中任意者的片段或变体,如本文所述,其中所给予的编码ColG或其片段或变体的编码序列与
所给予的编码的ColH或其片段或变体的编码序列的摩尔比约为1。可选地,治疗或预防肝脏疾病包括给予两者ColG和ColH或其中任意者的片段或变体,如本文所述,其中所给予的编
码ColG或其片段或变体的编码序列与所给予的编码ColH或其片段或变体的编码序列的摩
尔比优选在约0.1至约10范围内,优选约0.2至约5,更优选约0.3至约3,甚至更优选约0.5至约2,最优选约1。在优选的实施方式中,治疗或预防肝脏疾病包括给予两者ColG和ColH或其中任意者的片段或变体,如本文所述,其中所给予的编码ColG或其片段或变体的编码序列
与所给予的编码ColH或其片段或变体的编码序列的摩尔比在约1至约10范围内,优选约2至
约10,约2至约5,或约2至约4。可选地,治疗或预防肝脏疾病包括给予两者ColG和ColH,或其中任意者的片段或变体,如本文所述,其中所给予的编码ColH或其片段或变体的编码序列
与所给予的编码ColG或其片段或变体的编码序列的摩尔比在约1至约10范围内,优选约2至
约10,约2至约5,或约2至约4。其中,所述比例与所给予的分别编码ColG和ColH或其中任意者的片段或变体的编码序列由一个(例如在双顺反子或多顺反子RNA的情况下)还是多个
RNA表达无关。
[0098] 根据进一步的实施方式,本发明涉及包含至少一个编码序列的RNA,其中所述RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含由下列或由下列组成:
CCAAT/增强子结合蛋白α(CEBPA)或其片段或变体。如本文所用,术语“CCAAT/增强子结合蛋白α”可以缩写为例如“CEBPA”,并且一般是指包含下列或由下列组成的肽或蛋白质:与数据库登录号NP_036656.1、P05554、NP_031704.2、P53566、NP_004355.2或P49715限定的任一氨基酸序列相同或至少80%相同的氨基酸序列,或这些序列中任意者的同源物、片段或变体。
优选地,该术语还可以指由与数据库登录号NM_012524.3、NM_007678.3、CCDS21145、NM_
004364.4、CCDS54243、M37197或ENSG00000245848限定的任一核酸序列相同或至少80%相
同的核酸序列所编码的氨基酸序列,或这些序列中任意者的同源物、片段或变体。此外,本文使用的该术语还可以指包含下列或由下列组成的肽或蛋白质:与选自SEQ ID NO:8-13的氨基酸序列相同或至少80%相同的氨基酸序列,或任一所述氨基酸序列的同源物、片段或
变体。
[0099] 此外,本发明还提供了包含至少一个编码序列的RNA,其中编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含下列或由下列组成:CCAAT/增强子结合蛋白α(CEBPA)或肝细胞核因子4α(HNF4A),或其片段或变体;该RNA用于治疗或预防本文所述的肝脏疾病,其中肝脏疾病优选选自肝纤维化、肝硬化和肝细胞癌(HCC)。
[0100] 在一个实施方式中,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含下列或由下列组成:与选自SEQ ID NO:8-13的氨基酸序列相同或至少80%相同的氨基酸序列,或任一所述氨基酸序列的片段或变体。
[0101] 在优选的实施方式中,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含下列由下列组成:人CCAAT/增强子结合蛋白α(CEBPA)或其片段或变体,其中所述肽或蛋白质优选包含下列由下列组成:与根据SEQ ID NO:12或13的氨基酸序列相同或至少80%相同的氨基酸序列,或由这些氨基酸序列中任意者的片段或变体。
其中,RNA的至少一个编码序列优选包含下列由下列组成:与选自SEQ ID NO:40、41、42、43、
83、84、111、112、139、140、167、168、195、196、223、224、251、252、279、280、307、308、335、
336、363、364、391和392的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0102] 在另一个实施方式中,本发明提供了包含至少一个编码序列的RNA,其中所述RNA的至少一个编码序列编码至少一种包含肽或蛋白质,该肽或蛋白质包含下列由下列组成:
TNF相关凋亡诱导配体(TRAIL),或其片段或变体。如本文所用,术语“TNF相关凋亡诱导配体”可以缩写为“TRAIL”或“TNFSF10”,并且一般是指包含下列由下列组成的蛋白质:与数据库登录号NP_003801.1或P50591限定的氨基酸序列相同或至少80%相同的氨基酸序列,或
这些序列中任意者的同源物、片段或变体。优选地,该术语还可以指与数据库登录号NM_
003810.3、CCDS3219.1或ENSG00000121858限定的核酸序列相同或至少80%相同的核酸序
列所编码的氨基酸序列,或这些序列中任意者的同源物、片段或变体。此外,本文使用的该术语还可以指包含下列由下列组成的肽或蛋白质:与选自SEQ ID NO:4-7的氨基酸序列相
同或至少80%相同的氨基酸序列,或任一所述氨基酸序列的同源物、片段或变体。
[0103] 此外,本发明还提供了包含至少一个编码序列的RNA,其中编码序列编码至少一种肽或蛋白质,该包含下列由下列组成:TNF相关凋亡诱导配体(TRAIL)或其片段或变体;该
RNA用于治疗或预防如本文所述的肝脏疾病,其中肝脏疾病优选选自肝纤维化和肝硬化。
[0104] 在一个实施方式中,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,所述肽或蛋白质包含下列或由下列组成:与选自SEQ ID NO:4-7的氨基酸序列相同或至少80%相同的氨基酸序列,或任一所述氨基酸序列的片段或变体。其中,RNA的至少一个编码序列优选包含下列或由下列组成:与选自SEQ ID NO:32、33、34、35、75、76、77、78、103、
104、105、106、131、132、133、134、159、160、161、162、187、188、189、190、215、216、217、218、
243、244、245、246、271、272、273、274、299、300、301、302、327、328、329、330、355、356、357、
358、383、384、385和386的核酸序列相同或至少80%相同的核酸序列,或片段或这些核酸序列中任意者的变体。
[0105] 在一些实施方式中,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含TNF相关凋亡诱导配体(TRAIL)或其片段或变体,优选如本文限定,其中编码的肽或蛋白质还包含异亮氨酸拉链(zipper),优选异源异亮氨酸拉链。优选地,如本文所用的异亮氨酸拉链包含下列或由下列组成:与根据SEQ ID NO:3的氨基酸序列相同
或至少80%相同的氨基酸序列或其片段或变体。
[0106] 在优选的实施方式中,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含TNF相关凋亡诱导配体(TRAIL)或其片段或变体,优选如本文限
定,其中编码序列包含与选自SEQ ID NO:30、73、101、129、157、185、213、241、269、297、325、
353、381和499的核酸序列相同或至少80%相同的核酸序列,或其片段或变体。
[0107] 在另一个实施方式中,本发明涉及包含至少一个编码序列的RNA,其中所述至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质选自肝细胞核因子4α(HNF4A)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、肝细胞生长因子(HGF)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)、或这些肽或蛋白质中任意者的片段或变体。
此外,包含至少一个编码序列的RNA——其中所述至少一个编码序列编码选自肝细胞核因
子4α(HNF4A)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、肝细胞生长因子(HGF)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)、或任何这些肽或蛋白质的片段或变体的至少一种肽或蛋白质——被提供用于治疗或预防肝脏疾病,其中肝脏疾病
优选选自肝纤维化和肝硬化。
[0108] 在优选的实施方式中,根据本发明的RNA的至少一个编码序列编码至少一种肽或蛋白质,该肽或蛋白质包含下列或由下列组成:与选自SEQ ID NO:14-19的氨基酸序列相同或至少80%相同的氨基酸序列,或任一所述氨基酸序列的片段或变体。其中,RNA的至少一个编码序列优选包含下列或由下列组成:与选自SEQ ID NO:44、45、46、47、48、49、50、51、
52、53、54、85、86、87、88、89、90、113、114、115、116、117、118、141、142、143、144、145、146、
169、170、171、172、173、174、197、198、199、200、201、202、225、226、227、228、229、230、253、
254、255、256、257、258、281、282、283、284、285、286、309、310、311、312、313、314、337、338、
339、340、341、342、365、366、367、368、369、370、393、394、395、396、397和398的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0109] 在优选的实施方式中,根据本发明的RNA的至少一个编码序列不编码血管内皮生长因子(VEGF)或其片段或变体。更优选地,至少一个编码序列不编码VEGF-A。根据一个实施方式,根据本发明的RNA不包含根据WO2014/158795的SEQ ID NO:3的核酸序列。
[0110] 在一些实施方式中,根据本发明的RNA的至少一个编码序列不编码细胞信号传导分子、细胞因子或抗体。根据另一个实施方式,根据本发明的RNA的至少一个编码序列不编码IL-1、IL-2、IL-11、干扰素-α、肿瘤坏死因子、凋亡诱导因子、CBX家族蛋白、Bcl-x、Rituxan、赫赛汀(Herceptin)、Ocrelizumab、奥法木单抗(Ofatumumab)、吉妥珠单抗
(Gemtuzumab)、阿仑单抗(Alemtuzumab)、曲妥珠单抗、尼妥珠单抗(Nimotuzumab)、西妥昔单抗(Cetuximab)、贝伐单抗(Bavaeizumab)、帕利珠单抗(Palivizumab)、Efungumab、
Exbivirumab、Foravirumab、利比维单抗(Libivirumab)、Rafiviumab、瑞加韦单抗
(Regavirumab)、司韦单抗(Sevirumab)、妥韦单抗(Tuvirumab)、非维珠单抗(Felvizumab)、Motavizumab、索维单抗(Suvizumab)、奈巴库单抗(Nebacumab)、Panobacumab、
Raxibacumab、埃巴单抗(Edobacomab)、Pagibaimab、特非珠单抗(Tefibazumab)或
Urtoxazumab、或其组合。
[0111] 根据某些实施方式,根据本发明的RNA是单顺反子、双顺反子或多顺反子的,优选如本文限定。双顺反子或多顺反子RNA中的编码序列优选编码本文限定的不同肽或蛋白质
或其片段或变体。优选地,编码两种或更多种肽或蛋白质的编码序列可以在双顺反子或多
顺反子RNA中被至少一个IRES(内部核糖体进入位点)序列隔开,如下文所限定。因此,术语“编码两种或更多种肽或蛋白质”可以意指(但不限于此)双顺反子或甚至多顺反子RNA可以编码例如至少两种、三种、四种、五种、六种或更多种(优选不同的)本文所述的肽或蛋白质或在本文提供的定义内的其片段或变体。更优选地,在不限于此的情况下,双顺反子或甚至多顺反子mRNA可以编码例如至少两种、三种、五种、六种或更多种(优选不同的)本文限定的肽或蛋白质或本文限定的其片段或变体。在此环境下,如上限定的所谓IRES(内部核糖体进入位点)序列可以充当唯一的核糖体结合位点,但是其也可以用于提供如上限定的双顺反
子或甚至多顺反子mRNA,其编码由核糖体彼此独立地翻译的几种肽或蛋白质。可根据本发
明使用的IRES序列的实例是来自小核糖核酸病毒的那些(例如,FMDV)、瘟病毒(CFFV)、脊髓灰质炎病毒(PV)、脑心肌炎病毒(ECMV)、疫病毒(FMDV)、丙型肝炎病毒(HCV)、经典猪瘟病毒(CSFV)、小鼠白血病病毒(MLV)、猿猴免疫缺陷病毒(SIV)或蟋蟀麻痹病毒(CrPV)。
[0112] 根据进一步的实施方式,根据本发明的RNA的至少一个编码序列可以编码至少两种、三种、四种、五种、六种、七种、八种、九种和更多种本文限定的肽或蛋白质(或其片段或变体),该肽或蛋白质连接或不连接氨基酸连接体序列,其中所述连接体序列可包含刚性连接体、柔性连接体、可切割连接体(例如,自切割肽)或其组合。其中,所述肽或蛋白质(或其片段或变体)可以相同或不同或其组合。
[0113] 优选地,根据本发明的RNA的至少一个编码序列包含至少两个、三个、四个、五个、六个、七个、八个、九个或更多个这样的核酸序列:与选自SEQ ID NO:32-71、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、103、104、105、
106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、
125、126、127、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、
147、148、149、150、151、152、153、154、155、159、160、161、162、163、164、165、166、167、168、
169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、187、188、189、190、
191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、
210、211、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、
232、233、234、235、236、237、238、239、243、244、245、246、247、248、249、250、251、252、253、
254、255、256、257、258、259、260、261、262、263、264、265、266、267、271、272、273、274、275、
276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、
295、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、
317、318、319、320、321、322、323、327、328、329、330、331、332、333、334、335、336、337、338、
339、340、341、342、343、344、345、346、347、348、349、350、351、355、356、357、358、359、360、
361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、
383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、
402、403、404、405、406和407的核酸序列具有至少5%、10%、20%、30%、40%、50%、60%、
70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%同一性或序列同一性的核酸序列,或这些核酸序列中任意者的
片段或变体。
[0114] 优选地,本文限定的包含至少一个编码序列的RNA一般包含如下长度:约50至约20000个,或100至约20000个核苷酸,优选约250至约20000个核苷酸,更优选约500至约
10000个,甚至更优选约500至约5000个。
[0115] 根据本发明的RNA还可以是单链或双链的。当作为双链RNA提供时,根据本发明的RNA优选包含正义链和相应的反义链。
[0116] 在优选的实施方式中,本文限定的包含至少一个编码序列的RNA是mRNA、病毒RNA或复制子RNA。优选地,RNA是人工核酸,更优选如本文所述。
[0117] 根据进一步的实施方式,根据本发明的RNA,优选mRNA,是修饰的RNA,优选如本文所述修饰的RNA。如本文所用的修饰的RNA优选不包含化学修饰的糖、化学修饰的骨架或化学修饰的核碱基。更优选地,如本文所用的修饰的RNA不包含化学修饰的核苷或化学修饰的核苷酸。进一步优选如本文所用的修饰的RNA不包含如国际专利申请WO2014/158795中所述
的化学修饰。
[0118] 在本发明的环境中,本文限定的修饰优选导致根据本发明的RNA稳定化。更优选地,本发明因此提供了稳定化的RNA,其包含本文限定的至少一个编码序列。
[0119] 根据一个实施方式,本发明的RNA因此可以作为“稳定化的mRNA”提供,即作为基本上抵抗体内降解(例如通过外切或内切核酸酶)的RNA。
[0120] RNA的稳定化可以例如通过本发明的RNA的修饰磷酸骨架实现。与本发明结合的骨架修饰是这样的修饰:其中RNA中包含的核苷酸骨架的磷酸基被化学修饰。在这方面可以优选使用的核苷酸包含例如硫代磷酸基修饰的磷酸骨架,优选磷酸骨架中包含的至少一个磷
酸氧被硫原子替代。稳定化的RNA可以进一步包括例如:非离子型磷酸基类似物,例如烷基和芳基膦酸酯——其中带电荷的膦酸氧被烷基或芳基取代、或磷酸二酯和烷基磷酸基——
其中带电荷的氧残基以烷基化形式存在。这种骨架修饰一般包括(不表示任何限制)选自甲
基膦酸酯、氨基磷酸基和硫代磷酸基的修饰(例如胞苷-5′-O-(1-硫代磷酸基))。
[0121] 在下文中,描述了具体的修饰,其优选能够“稳定”本文限定的RNA。
[0122] 修饰
[0123] 化学修饰
[0124] 如本文所用的术语“RNA修饰”可以指包括骨架修饰以及糖修饰或碱基修饰的化学修饰。
[0125] 在此环境中,本文限定的修饰RNA可含有核苷酸类似物/修饰,例如,骨架修饰、糖修饰或碱基修饰。与本发明有关的骨架修饰是其中本文限定的RNA中包含的核苷酸骨架的磷酸基被化学修饰的修饰。与本发明有关的糖修饰是本文限定的RNA的核苷酸的糖的化学
修饰。此外,与本发明有关的碱基修饰是RNA核苷酸的碱基部分的化学修饰。在此环境中,核苷酸类似物或修饰优选选自适用于转录和/或翻译的核苷酸类似物。
[0126] 糖修饰:
[0127] 可以掺入如本文所述的修饰RNA中的修饰核苷和核苷酸可以被在糖部分中修饰。例如,2’羟基(OH)可以被多种不同的“氧”或“脱氧”取代基修饰或取代。“氧”-2’羟基修饰的实例包括但不限于烷氧基或芳氧基(-OR,例如R=H、烷基、环烷基、芳基、芳烷基、杂芳基或糖);聚乙二醇(PEG)、-O(CH2CH2O)nCH2CH2OR;“”核酸(LNA),其中2′羟基例如通过亚甲基桥连接到相同核糖糖的4′碳;和氨基(-O-氨基,其中氨基,例如NRR,可以是烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺、聚氨基)或氨基烷氧基。
[0128] “脱氧”修饰包括氢、氨基(例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸);或者氨基可以通过连接体与糖连接,其中连接体包含原子C、N和O中的一种或多种。
[0129] 糖基团还可以含有具有与核糖中的对应碳相反的立体化学构型的一个或多个碳。因此,修饰RNA可包括含有例如阿拉伯糖作为糖的核苷酸。
[0130] 骨架修饰:
[0131] 磷酸基骨架可以被进一步在可以掺入本文所述修饰RNA中的修饰核苷和核苷酸中修饰。骨架的磷酸基团可以通过用不同的取代基取代一个或多个氧原子来修饰。此外,修饰的核苷和核苷酸可包括未修饰的磷酸基部分被本文所述的修饰的磷酸基完全取代。修饰的
磷酸基团的实例包括但不限于硫代磷酸基、硒代磷酸基(phosphoroselenates)、代酸磷
酸基(borano phosphates)、硼代磷酸酯、氢膦酸基(hydrogen phosphonates)、氨基磷酸
基、烷基或芳基膦酸基和磷酸三酯。二硫代磷酸基的两个非连接氧均被硫取代。也可以通过用氮(桥连的氨基磷酸基)、硫(桥连的硫代磷酸基)和碳(桥连的亚甲基-膦酸基)取代连接
氧来修饰磷酸基连接体。
[0132] 碱基修饰
[0133] 可以掺入本文所述的修饰RNA中的修饰核苷和核苷酸可以被进一步在核碱基部分中修饰。在RNA中发现的核碱基的实例包括但不限于腺嘌呤、鸟嘌呤、胞嘧啶和尿嘧啶。例如,本文所述的核苷和核苷酸可在主沟面(major groove face)上被化学修饰。在一些实施方式中,主沟化学修饰可包括氨基、硫醇基、烷基或卤素基团。
[0134] 在本发明特别优选的实施方式中,核苷酸类似物/修饰选自碱基修饰,其优选选自2-氨基-6-氯嘌呤核苷-5′-三磷酸、2-氨基嘌呤-核糖-5′-三磷酸;2-氨基腺苷-5′-三磷酸、
2′-氨基-2′-脱氧胞苷-三磷酸、2-硫胞苷-5′-三磷酸、2-硫尿苷-5′-三磷酸、2-氟胸苷-5′-三磷酸、2′-O-甲基-肌苷-5′-三磷、4-硫尿苷-5′-三磷酸、5-氨基烯丙基胞苷-5′-三磷酸、
5-氨基烯丙基尿苷-5′-三磷酸、5-溴胞苷-5′-三磷酸、5-溴尿苷-5′-三磷酸、5-溴-2′-脱氧胞苷-5′-三磷酸、5-溴-2-脱氧尿苷-5′-三磷酸、5-碘胞苷-5′-三磷酸、5-碘-2′-脱氧胞苷-
5′-三磷酸、5-碘尿苷-5′-三磷酸、5-碘-2’-脱氧尿苷-5′-三磷酸、5-甲基胞苷-5′-三磷酸、
5-甲基尿苷-5′-三磷酸、5-丙炔基-2’-脱氧胞苷-5′-三磷酸、5-丙炔基-2′-脱氧尿苷-5′-三磷酸、6-氮杂胞苷-5′-三磷酸、6-氮杂尿苷-5′-三磷酸、6-氯嘌呤核苷-5′-三磷酸、7-脱氮腺苷-5′-三磷酸、7-脱氮鸟苷-5’-三磷酸、8-氮杂腺苷-5′-三磷酸、8-叠氮基腺苷-5′-三磷酸、苯并咪唑-核苷-5′-三磷酸、N1-甲基腺苷-5′-三磷酸、N1-甲基鸟苷-5′-三磷酸、N6-甲基腺苷-5′-三磷酸、06-甲基鸟苷-5′-三磷酸、假尿苷-5′-三磷酸、或嘌呤霉素-5′-三磷酸、黄苷-5′-三磷酸。特别优选选自下列碱基修饰核苷酸的核苷酸用于碱基修饰:5-甲基胞苷-5′-三磷酸、7-脱氮鸟苷-5′-三磷酸、5-溴胞苷-5′-三磷酸和假尿苷-5′-三磷酸。
[0135] 在一些实施方式中、修饰的核苷包括吡啶-4-核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-磺酰甲基尿苷、1-牛磺酰甲基-假尿苷、5-牛磺酰甲基-2-硫代-尿苷、1-牛磺酰甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷、和4-甲氧基-2-硫代-假尿苷。
[0136] 在一些实施方式中、修饰的核苷包括5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟甲基胞苷、1-甲基-假异胞苷、吡咯-胞苷、吡咯-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、泽布拉林(zebularine)、5-氮杂-泽布拉林、5-甲基-泽布拉林、5-氮杂-2-硫代-泽布拉林、2-硫代-泽布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。
[0137] 在其他实施方式中,修饰的核苷包括2-氨基嘌呤、2,6-二氨基嘌呤、7-脱氮-腺苷、7-脱氮-8-氮杂腺苷、7-脱氮-2-氨基嘌呤、7-脱氮-8-氮杂-2-氨基嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺-羟基异戊烯基)腺苷、2-甲基硫-N6-(顺-羟基异戊烯基)腺苷、N6-甘氨酰基氨基甲
酰基腺苷、N6-苏氨酰基氨基甲酰基腺苷、2-甲基硫-N6-苏氨酰基氨基甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺苷、2-甲基硫-腺苷和2-甲氧基-腺苷。
[0138] 在其他实施方式中,修饰的核苷包括肌苷、1-甲基-肌苷、丫苷、怀丁苷(wybutosine)、7-脱氮-鸟苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、和N2,N2-二甲基-6-硫代-鸟嘌呤。
[0139] 在一些实施方式中,核苷酸可以被在主沟面上修饰,并且可以包括用甲基或卤素基团取代尿嘧啶的C-5上的氢。在具体的实施方式中,修饰的核苷是5′-O-(1-硫代磷酸基)-腺苷、5′-O-(1-硫代磷酸基)-胞苷、5′-O-(1-硫代磷酸基)-鸟苷、5′-O-(1-硫代磷酸基)-尿苷或5′-O-(1-硫代磷酸基)-假尿苷。
[0140] 在进一步的具体实施方式中,修饰的RNA可包含选自下列的核苷修饰:6-氮杂-胞苷、2-硫代-胞苷、α-硫代胞苷、假-异-胞苷、5-氨基烯丙基-尿苷、5-碘-尿苷、N1-甲基-假尿苷、5,6-二氢尿苷、α-硫代-尿苷、4-硫代-尿苷、6-氮杂-尿苷、5-羟基-尿苷、脱氧-胸苷、5-甲基-尿苷、吡咯-胞苷、肌苷、α-硫代-鸟苷、6-甲基-鸟苷、5-甲基-胞苷、8-氧代-鸟苷、7-脱氮-鸟苷、N1-甲基-腺苷、2-氨基-6-氯-嘌呤、N6-甲基-2-氨基-嘌呤、假-异-胞苷、6-氯-嘌呤、N6-甲基-腺苷、α-硫代-腺苷、8-叠氮基-腺苷、7-脱氮-腺苷。
[0141] 脂质修饰
[0142] 根据进一步的实施方式,本文限定的修饰RNA可含有脂质修饰。这种脂质修饰的RNA一般包含本文限定的RNA。本文限定的这种脂质修饰的RNA一般还包含与该RNA共价连接
的至少一个连接体、和与对应连接体共价连接的至少一个脂质。可选地,脂质修饰的RNA包含至少一个本文限定的RNA和与该RNA共价连接(在没有连接体的情况下)的至少一个(双功
能)脂质。根据第三种可选方式,脂质修饰的RNA包含本文限定的RNA分子、与该RNA共价连接的至少一个连接体、和与对应连接体共价连接的至少一个脂质、以及与该RNA共价连接(在
没有连接体的情况下)的至少一个(双功能)脂质。在此环境中,特别优选脂质修饰存在于线性RNA序列的末端。
[0143] G/C含量修饰
[0144] 根据另一个实施方式,本发明的RNA,优选mRNA,可以通过以下被修饰并因此稳定化:通过修饰RNA的鸟苷/胞嘧啶(G/C)含量,优选本发明RNA的至少一个编码序列的G/C含
量。
[0145] 在本发明特别优选的实施方式中,本发明的RNA的编码序列(编码区)的G/C含量与对应的野生型RNA(即未修饰的RNA)的编码区的G/C含量相比被改变,具体地被增加。由该
RNA编码的氨基酸序列优选与由对应野生型RNA编码的氨基酸序列相比不改变。本发明的
RNA的这种修饰基于以下事实:任何待翻译RNA区域的序列对于该RNA的有效翻译是重要的。
因此,RNA的组成和各种核苷酸的序列是重要的。具体地,具有增加的G(鸟苷)/C(胞嘧啶)含量的序列比具有增加的A(腺苷)/U(尿嘧啶)含量的序列更稳定。根据本发明,RNA的密码子
因此与对应的野生型RNA相比是变化的,同时保留翻译的氨基酸序列,使得其包括增加量的G/C核苷酸。关于若干密码子编码同一个氨基酸(所谓的遗传密码简并性)的事实,可以确定稳定性的最有利密码子(所谓的可选性密码子使用)。取决于RNA编码的氨基酸,RNA序列修
饰与其野生型序列相比存在多种可能性。在由仅含有G或C核苷酸的密码子编码的氨基酸的
情况下,不需要密码子修饰。因此,Pro(CCC或CCG)、Arg(CGC或CGG)、Ala(GCC或GCG)和Gly(GGC或GGG)的密码子不需要修饰,因为不存在A或U。相比之下,含有A和/或U核苷酸的密码子可以通过编码相同氨基酸但不含A和/或U的其他密码子的替代而被修饰。这些的实例是:
Pro的密码子可以从CCU或CCA修饰为CCC或CCG;Arg的密码子可以从CGU或CGA或AGA或AGG修
饰为CGC或CGG;Ala的密码子可以从GCU或GCA修饰为GCC或GCG;Gly的密码子可以从GGU或
GGA修饰为GGC或GGG。在其他情况下,尽管不能从密码子中除去A或U核苷酸,但是可以通过使用含有较低含量的A和/或U核苷酸的密码子来降低A和U含量。这些的实例是:Phe的密码
子可以从UUU修饰为UUC;Leu的密码子可以从UUA、UUG、CUU或CUA修饰为CUC或CUG;Ser的密码子可以从UCU或UCA或AGU修饰为UCC、UCG或AGC;Tyr的密码子可以从UAU修饰为UAC;Cys的密码子可以从UGU修饰为UGC;His的密码子可以从CAU修饰为CAC;Gln的密码子可以从CAA修饰为CAG;Ile的密码子可以从AUU或AUA修饰为AUC;Thr的密码子可以从ACU或ACA修饰为ACC或ACG;Asn的密码子可以从AAU修饰为AAC;Lys的密码子可以从AAA修饰为AAG;Val的密码子可以从GUU或GUA修饰为GUC或GUG;Asp的密码子可以从GAU修饰为GAC;Glu的密码子可以从
GAA修饰为GAG;终止密码子UAA可以修饰为UAG或UGA。另一方面,在Met(AUG)和Trp(UGG)的密码子的情况下,不存在序列修饰的可能性。上面列出的取代可以单独应用或以所有可能
的组合应用,以使本发明组合物的至少一种mRNA的G/C含量与其具体野生型mRNA(即原始序
列)相比增加。因此,例如,野生型序列中存在的所有Thr密码子可以被修饰为ACC(或ACG)。
然而,优选地采用例如上述替代可能性的组合:
[0146] 原始序列中编码Thr的所有密码子(野生型mRNA)替代为ACC(或ACG),和原始编码Ser的所有密码子替代为UCC(或UCG或AGC);原始序列中编码Ile的所有密码子替代为AUC,

[0147] 原始编码Lys的所有密码子替代为AAG,和
[0148] 原始编码Tyr的所有密码子替代为UAC;将原始序列中编码Val的所有密码子替代为GUC(或GUG),和
[0149] 原始编码Glu的所有密码子替代为GAG,和
[0150] 原始编码Ala的所有密码子替代为GCC(或GCG),和
[0151] 原始编码Arg的所有密码子替代为CGC(或CGG);原始序列中编码Val的所有密码子替代为GUC(或GUG),和
[0152] 原始编码Glu的所有密码子替代为GAG,和
[0153] 原始编码Ala的所有密码子替代为GCC(或GCG),和
[0154] 原始编码Gly的所有密码子替代为GGC(或GGG),和
[0155] 原始编码Asn的所有密码子替代为AAC;原始序列中编码Val的所有密码子替代为GUC(或GUG),和
[0156] 原始编码Phe的所有密码子替代为UUC,和
[0157] 原始编码Cys的所有密码子替代为UGC,和
[0158] 原始编码Leu的所有密码子替代为CUG(或CUC),和
[0159] 原始编码Gln的所有密码子替代为CAG,和
[0160] 原始编码Pro的所有密码子替代为CCC(或CCG);等等。
[0161] 优选地,本发明的RNA的编码区的G/C含量与编码本文限定的肽或蛋白质或其片段或变体的野生型RNA的编码区的G/C含量相比增加至少7%,更优选至少15%,特别优选至少
20%。根据一个具体实施方式,编码本文限定的肽或蛋白质或其片段或变体的区域中至少
5%、10%、20%、30%、40%、50%、60%,更优选至少70%,甚至更优选至少80%,最优选至少90%、95%或甚至100%的可取代密码子或野生型RNA序列的完整序列被取代,从而增加
所述序列的GC/含量。在此环境中,特别优选使本发明RNA的G/C含量,优选根据本发明的RNA的至少一个编码区的G/C含量,与野生型序列相比增加至最大值(即可取代密码子的
100%)。根据本发明,本发明的RNA的进一步优选的修饰是基于以下发现:翻译效率还由细胞中tRNA的不同出现频率决定。因此,如果所谓的“稀少密码子”在本发明的RNA中的存在程度增加,则相应的修饰RNA序列的翻译程度显著不如编码相对“频繁”的tRNA的密码子存在时的情况。根据本发明,在本发明的修饰RNA中,编码本文限定的肽或蛋白质或其片段或变体的区域与野生型RNA的相应区域相比被修饰,使得编码细胞中相对稀少的tRNA的野生型
序列的至少一个密码子被换成编码细胞中相对频繁的并且与相对稀少的tRNA携带相同氨
基酸的tRNA的密码子。通过这种修饰,本发明的RNA的序列被修饰,使得频繁存在的tRNA可用的密码子被插入。换句话说,根据本发明,通过这种修饰,编码细胞中相对稀少的tRNA的野生型序列的所有密码子可以在各情况下被换成编码细胞中相对频繁的并且在各情况下
与相对稀少的tRNA携带相同氨基酸的tRNA的密码子。哪种tRNA在细胞中相对频繁地存在以
及相比之下哪种相对稀少出现是本领域技术人员已知的;参见例如Akashi,
Curr.Opin.Genet.Dev.2001,11(6):660-666。特别优选对于具体氨基酸使用最频繁出现的tRNA的密码子,例如,使用(人)细胞中最频繁出现的tRNA的Gly密码子。根据本发明,特别优选将在本发明的修饰RNA中增加(具体地,最大化的)的连续G/C含量与“频繁”的密码子联系起来,而不修饰由该RNA的编码区编码的肽或蛋白质的氨基酸序列。这种优选的实施方式允许提供特别有效翻译的和稳定化的本发明的(修饰的)RNA。如上所述的本发明的修饰RNA
(增加的G/C含量;tRNA的更换)的确定可以利用WO 02/098443(其公开内容全部被包括在本
发明中)中说明的计算机程序进行。在本发明中。利用该计算机程序,任何期望的RNA的核苷酸序列可以借助于其遗传密码或简并性(使得产生最大G/C含量)结合使用编码细胞中尽可
能频繁存在的tRNA的密码子被修饰,由修饰RNA编码的氨基酸序列优选与未修饰的序列相
比没有被修饰。可选地,也可以仅修饰G/C含量或仅修饰与原始序列相比的密码子使用。
Visual Basic 6.0(所用开发环境:Microsoft Visual Studio Enterprise 6.0,
Servicepack 3)中的源代码也在WO 02/098443中被描述。在本发明的进一步优选实施方式
中,本发明的RNA的核糖体结合位点环境中的A/U含量与其对应的野生型mRNA的核糖体结合
位点环境中的A/U含量相比增加。这种修饰(核糖体结合位点周围的A/U含量增加)提高了核
糖体与RNA结合的效率。核糖体与核糖体结合位点(Kozak序列:SEQ ID NO:1454;AUG形成起始密码子)的有效结合进而具有RNA有效翻译的效果。根据本发明的进一步实施方式,可以
关于潜在的去稳定序列元件(destabilizing sequence elements)修饰本发明的RNA。具体
地,这种RNA的编码区和/或5′和/或3′非翻译区可以与对应的野生型RNA相比被修饰,使得其不包含去稳定序列元件,该修饰RNA编码的氨基酸序列优选与其对应的野生型RNA相比没
有被修饰。已知例如在真核生物RNA的序列中,存在去稳定序列元件(DSE),信号蛋白在体内与其结合并调控RNA的酶促降解。为了修饰RNA的进一步稳定,任选地,在编码本文限定的肽或蛋白质或其片段或变体的区域中,因此可以进行相对于野生型RNA的相应区域的一个或
多个这种修饰,使得其中不包含或基本上不包含去稳定序列元件。根据本发明,通过这种修饰,还可以从本发明的RNA除去存在于非翻译区(3′-和/或5′-UTR)中的DSE。这种去稳定序列例如是富AU序列(AURES),其存在于很多不稳定RNA的3′-UTR区段中(Caput等,
Proc.Natl.Acad.Sci.USA,1986,83:1670-1674)。本发明的RNA因此优选与对应的野生型RNA相比被修饰,使得本发明的RNA不包含这种去稳定序列。这也适用于那些被可能的内切
核酸酶识别的序列基序,例如,序列GAACAAG,其被包含在编码转蛋白受体的基因的3′-UTR区段中(Binder等,EMBO J.1994,13:1969-1980)。这些序列基序也优选在本发明的RNA中被除去。
[0162] 根据优选的实施方式,本发明提供本文限定的RNA,其包含至少一个编码序列,其中所述至少一个编码序列优选包含下列或由下列组成:与选自SEQ ID NO:75、76、77、78、
79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、187、188、189、
190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、
209、210、211、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、
231、232、233、234、235、236、237、238、239、243、244、245、246、247、248、249、250、251、252、
253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、271、272、273、274、
275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、
294、295、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、
316、317、318、319、320、321、322、323、327、328、329、330、331、332、333、334、335、336、337、
338、339、340、341、342、343、344、345、346、347、348、349、350、351、355、356、357、358、359、
360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、
379、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、
401、402、403、404、405、406和407的核酸序列相同或至少80%相同的核酸序列,或这些核酸序列中任意者的片段或变体。
[0163] 在进一步优选的实施方式中,根据本发明的RNA的所述至少一个编码序列包含下列或由下列组成:与选自SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、
90、91、92、93、94、95、96、97、98、99、187、188、189、190、191、192、193、194、195、196、197、
198、199、200、201、202、203、204、205、206、207、208、209、210、211、215、216、217、218、219、
220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、
239、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、
261、262、263、264、265、266、267、271、272、273、274、275、276、277、278、279、280、281、282、
283、284、285、286、287、288、289、290、291、292、293、294、295、299、300、301、302、303、304、
305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、
327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、
346、347、348、349、350、351、355、356、357、358、359、360、361、362、363、364、365、366、367、
368、369、370、371、372、373、374、375、376、377、378、379、383、384、385、386、387、388、389、
390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406和407的核酸序列相同或具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,优选至少
70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列,或这些核酸序列中任意者的片段或变体。
[0164] 适应人密码子使用的序列
[0165] 根据本发明,本发明RNA的进一步优选的修饰基于以下发现:编码相同氨基酸的密码子一般以不同频率存在。根据本发明,在本发明的修饰RNA中,本文限定的编码序列(编码区)优选与对应野生型RNA的相应区域相比被修饰,使得编码相同氨基酸的密码子的频率相
应于按照人密码子使用的该密码子的天然存在频率,例如如表1所示。
[0166] 例如,在由根据本发明的RNA的所述至少一个编码序列编码的氨基酸序列中存在的氨基酸丙氨酸(Ala)的情况下,野生型编码序列优选以如下方式调整:密码子“GCC”的使用频率为0.40,密码子“GCT”的使用频率为0.28,密码子“GCA”的使用频率为0.22,并且密码子“GCG”的使用频率为0.10等。(见表1)。
[0167] 表1:人密码子使用表
[0168]
[0169]
[0170] *:最频繁的密码子
[0171] 在优选的实施方式中,本发明提供了包含至少一个编码序列的RNA,其中编码序列包含与选自SEQ ID NO:131、132、133、134、135、136、137、138、139、140、141、142、143、144、
145、146、147、148、149、150、151、152、153、154和155的核酸序列相同或至少80%相同的核酸序列,或任一所述核酸序列的片段或变体。
[0172] 根据进一步的实施方式,根据本发明的RNA的所述至少一个编码序列包含下列或由下列组成:与选自SEQ ID NO:131、132、133、134、135、136、137、138、139、140、141、142、
143、144、145、146、147、148、149、150、151、152、153、154和155的核酸序列具有至少5%、
10%、20%、30%、40%、50或50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸
序列,或任一所述核酸序列的片段或变体。
[0173] 密码子优化的序列
[0174] 如上所述,根据本发明优选编码tRNA(其在细胞中相对稀少)的野生型序列的所有密码子都被交换为编码细胞中相对频繁并且在各情况下携带与相对稀少的tRNA相同的氨
基酸的tRNA的密码子。因此,特别优选将最频繁的密码子用于各编码氨基酸(参见表1,最频繁的密码子用星号标记)。这种优化程序增加了密码子适应指数(CAI)并最终使CAI最大化。
在本发明的环境中,具有增加的或最大化的CAI的序列一般被称为“密码子优化的”序列和/或CAI增加和/或最大化的序列。根据优选的实施方式,本发明的RNA包含至少一个编码序
列,其中编码序列如本文所述进行了密码子优化。更优选地,所述至少一个编码序列的密码子适应指数(CAI)为至少0.5,至少0.8,至少0.9或至少0.95。最优选地,所述至少一个编码序列的密码子适应指数(CAI)是1。
[0175] 例如,在根据本发明的RNA的至少一个编码序列编码的氨基酸序列中存在的氨基酸丙氨酸(Ala)的情况下,野生型编码序列的调整方式是最频繁的人密码子“GCC”始终用于所述氨基酸,或者对于氨基酸半胱氨酸(Cys)而言,野生型序列的调整方式是最频繁的人密码子“TGC”始终用于所述氨基酸等。
[0176] 在优选的实施方式中,本发明提供了包含至少一个编码序列的RNA,其中编码序列包含与选自SEQ ID NO:159、160、161、162、163、164、165、166、167、168、169、170、171、172、
173、174、175、176、177、178、179、180、181、182和183的核酸序列相同或至少80%相同的核酸序列,或任一所述核酸序列的片段或变体。
[0177] 根据进一步的实施方式,根据本发明的RNA的所述至少一个编码序列包含下列或由下列组成:与选自SEQ ID NO:159、160、161、162、163、164、165、166、167、168、169、170、
171、172、173、174、175、176、177、178、179、180、181、182和183的核酸序列具有至少5%、
10%、20%、30%、40%、50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列,或任一所述核酸序列的片段或变体。
[0178] C优化的序列
[0179] 根据另一个实施方式,可以通过改变,优选增加,RNA的胞嘧啶(C)含量,优选RNA的编码区的胞嘧啶(C)含量,来修饰本发明的RNA。
[0180] 在本发明的特别优选的实施方式中,与对应的野生型RNA(即未修饰的RNA)的编码区的C含量相比,本发明的RNA编码区的C含量被改变,优选增加。由本发明的RNA的至少一个编码序列编码的氨基酸序列与由对应的野生型mRNA编码的氨基酸序列相比,优选不变。
[0181] 在本发明的优选实施方式中,修饰的RNA被修饰(被改变,modified),使得达到理论上可能的最大胞嘧啶含量或甚至最大的胞嘧啶含量的至少10%、20%、30%、40%、50%、
60%、70%或80%、或至少90%。
[0182] 在进一步优选的实施方式中,靶RNA野生型序列的密码子的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或甚至100%(其为“胞嘧啶含量可优化的”)被胞嘧啶含量高于野生型序列中存在的胞嘧啶含量的密码子取代。
[0183] 在进一步优选的实施方式中,可以另外修饰野生型编码序列的一些密码子,使得细胞中相对稀少的tRNA的密码子换为细胞中相对频繁的tRNA的密码子,条件是取代后的相
对频繁tRNA的密码子携带与原始野生型密码子的相对稀少tRNA相同的氨基酸。优选地,相
对稀少的tRNA的所有密码子均被细胞中相对频繁的tRNA的密码子替代,除了编码仅由不含
任何胞嘧啶的密码子编码的氨基酸的密码子,或除了谷氨酰胺(Gln)——其由两个密码子
编码,每个密码子含有相同数量的胞嘧啶。
[0184] 在本发明的进一步优选的实施方式中,修饰的靶RNA被修饰,使得通过编码细胞中相对频繁的tRNA的密码子达到理论上可能的最大胞嘧啶含量或甚至最大胞嘧啶含量的至
少80%、或至少90%,其中氨基酸序列保持不变。
[0185] 由于遗传密码的天然存在的简并性,多于一个密码子可编码特定的氨基酸。因此,20个天然存在的氨基酸中的18个由多于一个密码子编码(Tryp和Met除外),例如,由2个密
码子(例如Cys、Asp、Glu),由3个密码子(例如Ile),由4个密码子(例如Al、Gly、Pro)或6个密码子(例如Leu、Arg、Ser)编码。然而,并非所有编码相同氨基酸的密码子都在体内条件下以相同的频率使用。根据每一种生物,建立典型的密码子使用概况。
[0186] 在本发明的环境中使用的术语“胞嘧啶含量可优化的密码子”是指呈现胞嘧啶含量低于编码相同氨基酸的其他密码子的密码子。因此,可以被编码相同氨基酸并且呈现该
密码子内更高胞嘧啶量的另一个密码子替代的任何野生型密码子被认为是胞嘧啶可优化
的(C可优化的)。任何这种野生型编码区内C可优化的野生型密码子被特定C优化型密码子
取代增加了其总C含量并反映了富C修饰mRNA序列。根据优选的实施方式,本发明的RNA,优选本发明的RNA的所述至少一个编码序列,包含C最大化RNA序列或由其组成,所述C最大化
RNA序列含有所有可能C优化密码子的C优化型密码子。因此,编码区全长的100%或全部理
论上可替代的C可优化密码子优选被C优化型密码子替代。
[0187] 在该环境中,胞嘧啶含量可优化的密码子是含有的胞嘧啶数量低于编码相同氨基酸的其他密码子的密码子。
[0188] 密码子GCG、GCA、GCU中的任一种编码氨基酸Ala,其可以换成编码相同氨基酸的密码子GCC,和/或
[0189] 编码Cys的密码子UGU可以换成编码相同氨基酸的密码子UGC,和/或编码Asp的密码子GAU可以换成编码相同氨基酸的密码子GAC,和/或编码Phe的密码子UUU可以换成编码
相同氨基酸的密码子UUC,和/或
[0190] 编码Gly的密码子GGG、GGA、GGU任一种可以换成编码相同氨基酸的密码子GGC,和/或
[0191] 编码His的密码子CAU可以换成编码相同氨基酸的密码子CAC,和/或编码Ile的密码子AUA、AUU任一种可以换成密码子AUC,和/或
[0192] 编码Leu的密码子UUG、UUA、CUG、CUA、CUU任一种可以换成编码相同氨基酸的密码子CUC,和/或
[0193] 编码Asn的密码子AAU可以换成编码相同氨基酸的密码子AAC,和/或编码Pro的密码子CCG、CCA、CCU任一种可以换成编码相同氨基酸的密码子CCC,和/或
[0194] 编码Arg的密码子AGG、AGA、CGG、CGA、CGU任一种可以换成编码相同氨基酸的密码子CGC,和/或
[0195] 编码Ser的密码子AGU、AGC、UCG、UCA、UCU任一种可以换成编码相同氨基酸的密码子UCC,和/或
[0196] 编码Thr的密码子ACG、ACA、ACU任一种可以换成编码相同氨基酸的密码子ACC,和/或
[0197] 编码Val的密码子GUG、GUA、GUU任一种可以换成编码相同氨基酸的密码子GUC,和/或
[0198] 编码Tyr的密码子UAU可以换成编码相同氨基酸的密码子UAC。
[0199] 在任何上述情况中,每个交换后的密码子的胞嘧啶数量增加1个。编码区的所有非C优化型密码子(相应于C可优化的密码子)的交换产生C最大化编码序列。在本发明的环境
中,根据本发明的RNA的所述至少一个编码区内的非C优化型密码子的至少70%,优选至少
80%,更优选至少90%的被C优化型密码子替代。
[0200] 可优选,对于一些氨基酸,C可优化密码子被C优化型密码子替代的百分比小于70%,而对于其他氨基酸,替代密码子的百分比高于70%,以满足编码区的所有C可优化野生型密码子的C优化总百分比为至少70%。
[0201] 优选地,在本发明的C优化型RNA中,任何给定氨基酸的C可优化野生型密码子的至少50%被C优化型密码子替代,例如,任何修饰的富C的RNA优选在C可优化野生型密码子位
置处含有至少50%C优化型密码子——编码上述氨基酸Ala、Cys、Asp、Phe、Gly、His、Ile、Leu、Asn、Pro、Arg、Ser、Thr、Val和Tyr,优选至少60%。
[0202] 在此环境中,可以使用编码非胞嘧啶含量可优化的但由至少两个密码子编码的氨基酸的密码子,而无需任何进一步的选择过程。然而,编码细胞(例如人细胞)中相对稀少的tRNA的野生型序列的密码子可以换为编码细胞中相对频繁的tRNA的密码子,其中两者都编
码相同的氨基酸。因此,编码Glu的相对稀少的密码子GAA可以换为编码相同氨基酸的相对
频繁的密码子GAG,和/或
[0203] 编码Lys的相对稀少的密码子AAA可以换为编码相同氨基酸的相对频繁的密码子AAG,和/或
[0204] 编码Gln的相对稀少的密码子CAA可以换为编码相同氨基酸的相对频繁的密码子CAG。
[0205] 在此环境中,各仅由一个密码子编码的氨基酸Met(AUG)和Trp(UGG)保持不变。终止密码子不是胞嘧啶含量优化型,然而,相对稀少的终止密码子amber、ochre(UAA、UAG)可以换为相对频繁的终止密码子opal(UGA)。
[0206] 上面列出的单个取代可以单独使用以及以所有可能的组合使用,以便与野生型mRNA序列相比优化修饰RNA的胞嘧啶含量。
[0207] 因此,与对应野生型RNA的编码区相比,本文所限定的至少一个编码序列可以改变,使得氨基酸由至少两个或更多个密码子编码,其中一个密码子包含一个额外的胞嘧啶,这种密码子可以换为包含一个额外胞嘧啶的C优化型密码子,其中氨基酸优选与野生型序
列相比不变。
[0208] 在优选的实施方式中,本发明提供了包含至少一个编码序列的RNA,其中编码序列包含与选自SEQ ID NO:103、104、105、106、107、108、109、110、111、112、113、114、115、116、
117、118、119、120、121、122、123、124、125、126和127的核酸序列相同或至少80%相同的核酸序列,或任一所述核酸序列的片段或变体。
[0209] 根据进一步的实施方式,根据本发明的RNA的至少一个编码序列包含下列或由下列组成:与选自SEQ ID NO:103、104、105、106、107、108、109、110、111、112、113、114、115、
116、117、118、119、120、121、122、123、124、125、126和127的核酸序列具有至少5%、10%、
20%、30%、40%、50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列,或任一所述核酸序列的片段或变体。
[0210] 根据特别优选的实施方式,本发明提供RNA,优选mRNA,其包含本文限定的至少一种编码序列,其中RNA的所述至少一个编码序列的G/C含量与相应野生型RNA的相应编码序
列的G/C含量相比增加,和/或
[0211] 其中,该RNA的所述至少一个编码序列的C含量与相应野生型RNA的相应编码序列的C含量相比增加,和/或
[0212] 其中该RNA的所述至少一个编码序列中的密码子适应人密码子使用,其中该RNA的至少一个编码序列中的密码子适应指数(CAI)优选增加或最大化,
[0213] 并且其中该RNA编码的氨基酸序列优选与相应野生型RNA编码的氨基酸序列相比不变。
[0214] 在优选的实施方式中,本发明提供了包含至少一个编码序列的RNA,其中编码序列包含与选自SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、
94、95、96、97、98、99、103、104、105、106、107、108、109、110、111、112、113、114、115、116、
117、118、119、120、121、122、123、124、125、126、127、131、132、133、134、135、136、137、138、
139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、159、160、
161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、
180、181、182、183、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、
202、203、204、205、206、207、208、209、210、211、215、216、217、218、219、220、221、222、223、
224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、243、244、245、
246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、
265、266、267、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、
287、288、289、290、291、292、293、294、295、299、300、301、302、303、304、305、306、307、308、
309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、327、328、329、330、
331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、
350、351、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、
372、373、374、375、376、377、378、379、383、384、385、386、387、388、389、390、391、392、393、
394、395、396、397、398、399、400、401、402、403、404、405、406和407的核酸序列相同或至少
80%相同的核酸序列,或任一所述核酸序列的片段或变体。
[0215] 根据进一步的实施方式,根据本发明的RNA的所述至少一个编码序列包含下列或由下列组成:与选自SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、
91、92、93、94、95、96、97、98、99、103、104、105、106、107、108、109、110、111、112、113、114、
115、116、117、118、119、120、121、122、123、124、125、126、127、131、132、133、134、135、136、
137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、
159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、
178、179、180、181、182、183、187、188、189、190、191、192、193、194、195、196、197、198、199、
200、201、202、203、204、205、206、207、208、209、210、211、215、216、217、218、219、220、221、
222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、243、
244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、
263、264、265、266、267、271、272、273、274、275、276、277、278、279、280、281、282、283、284、
285、286、287、288、289、290、291、292、293、294、295、299、300、301、302、303、304、305、306、
307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、327、328、
329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、
348、349、350、351、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、
370、371、372、373、374、375、376、377、378、379、383、384、385、386、387、388、389、390、391、
392、393、394、395、396、397、398、399、400、401、402、403、404、405、406和407的核酸序列具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%,优选至少70%,更优选至少
80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列,或任一所述核酸序列的片段或变体。
[0216] 5′-帽
[0217] 根据本发明的另一个优选实施方式,可以通过添加所谓的“5′-帽”结构来修饰本文限定的修饰RNA,所述“5′-帽”结构优选稳定化如本文所述的RNA。5′-帽是总体上“封端”成熟mRNA的5′端的实体,一般是修饰的核苷酸实体。5′-帽一般可以由修饰的核苷酸形成,具体地由鸟嘌呤核苷酸衍生物形成。优选地,5′-帽通过5′-5′-三磷酸连接体与5′-末端连接。5′-帽可以是甲基化的,例如m7GpppN,其中N是携带5′-帽的核酸的末端5′核苷酸,一般是mRNA的5′端。m7GpppN是5′-帽结构,其天然存在于通过聚合酶II转录的mRNA中,并且因此在此环境中优选不被认为是修饰mRNA中包含的修饰。
[0218] 5′-帽结构的其他实例包括甘油基、反向脱氧无碱基残基(部分)、4′,5′亚甲基核苷酸、1-(β-D-赤呋喃糖基)核苷酸、4′-硫代核苷酸、碳环核苷酸、1,5-脱水己糖醇核苷酸、L-核苷酸、α-核苷酸、修饰碱基核苷酸、苏戊呋喃糖基核苷酸、非环3′,4′-开环核苷酸、非环3,4-二羟基丁基核苷酸、非环3,5二羟基戊基核苷酸、3′-3′-反向核苷酸部分、3′-3′-反向无碱基部分、3′-2′-反向核苷酸部分、3′-2′-反向无碱基部分、1,4-丁二醇磷酸基、3′-氨基磷酸基、己基磷酸基、氨基己基磷酸基、3′-磷酸基、3′硫代磷酸基、二硫代磷酸基、或桥接或非桥接甲基膦酸基部分。这些修饰的5′-帽结构在此环境中被认为是至少一种修饰。
[0219] 特别优选的修饰的5′-帽结构是帽1(m7G相邻核苷酸的核糖甲基化)、帽2(m7G下游第二核苷酸的核糖另外甲基化)、帽3(m7G下游的第3个核苷酸的核糖另外甲基化)、帽4(m7G下游第4个核苷酸的核糖甲基化)、ARCA(抗反向帽类似物,修饰的ARCA(例如硫代磷酸基修
饰的ARCA)、肌苷、N1-甲基鸟苷、2’-氟-鸟苷、7-脱氮-鸟苷、8-氧代-鸟苷、2-氨基-鸟苷、LNA-鸟苷和2-叠氮基-鸟苷。因此,根据本发明的RNA优选包含5′-帽结构。
[0220] 在优选的实施方式中,根据本发明的RNA包含至少一个5′-或3′-UTR元件。在此环境中,UTR元件包含下列或由下列组成:衍生自任何天然存在的基因的5′-或3′-UTR或衍生自基因的5′-或3′-UTR的片段、同源物或变体的核酸序列。优选地,根据本发明使用的5′-或3′-UTR元件与本发明的RNA的所述至少一个编码序列是异源的。即使优选衍生自天然存在
的基因的5′或3′-UTR元件,在本发明的环境中也可以使用合成法改造的UTR元件。
[0221] 术语“3′-UTR元件”一般是指包含衍生自3′-UTR或3′-UTR变体的核酸序列或由其组成的核酸序列。本发明意义上的3′-UTR元件可以表示RNA(优选mRNA)的3′-UTR。因此,在本发明的意义上,优选地,3′-UTR元件可以是RNA的3′-UTR,优选mRNA的3′-UTR,或者其可以是RNA的3′-UTR的转录模板。因此,3′-UTR元件优选是相应于RNA的3′-UTR的核酸序列,优选相应于mRNA(例如通过基因工程载体构建体转录获得的mRNA)的3′-UTR。优选地,3′-UTR元件满足3′-UTR的功能或编码满足3′-UTR功能的序列。
[0222] 根据优选的实施方式,根据本发明的RNA,优选mRNA,包含5′-帽结构和/或至少一个3′-非翻译区元件(3′-UTR元件),优选如本文限定。更优选地,RNA还包含本文限定的5′-UTR元件。
[0223] 多(A)尾
[0224] 根据进一步优选的实施方式,本发明的RNA可以含有3’端上一般约10至200个腺苷核苷酸的多(A)尾,优选约10至100个腺苷核苷酸,更优选约40个至80个腺苷核苷酸,或甚至更优选约50至70个腺苷核苷酸。
[0225] 优选地,本发明的RNA中的多(A)序列在体外转录中通过RNA由DNA模板获得。可选地,多(A)序列也可以在体外通过常规的化学合成方法获得,而不必从DNA祖(progenitor)
转录。此外,多(A)序列或多(A)尾可以使用市售的多腺苷酸化试剂盒和本领域已知的相应
方案,通过根据本发明的RNA的酶促多腺苷酸化而生成。
[0226] 可选地,如本文所述的RNA任选地包含多腺苷酸化信号,其在本文中限定为信号,其通过特定蛋白质因子(例如切割和多腺苷酸化特异性因子(CPSF)、切割刺激因子(CstF)、裂解因子I和II(CF I和CF II)、多(A)聚合酶(PAP))将多腺苷酸化运送至(转录的)RNA。在
此环境中,优选包含NN(U/T)ANA共有序列的共有多腺苷酸化信号。在特别优选的方面,多腺苷酸化信号包括以下序列之一:AA(U/T)AAA或A(U/T)(U/T)AAA(其中尿苷通常存在于RNA
中,并且胸苷一般存在于DNA中)。
[0227] 多(C)尾
[0228] 根据进一步优选的实施方式,本发明的RNA可以含有3’端上一般约10至200个胞苷核苷酸的多(C)尾,优选约10至100个胞苷核苷酸,更优选约20至70个胞苷核苷酸,或甚至更优选约20至60或甚至10至40个胞苷核苷酸。
[0229] 3′-UTR
[0230] 在进一步优选的实施方式中,根据本发明的RNA还包含至少一个3′-UTR元件。优选地,所述至少一个3′-UTR元件包含下列或由下列组成:衍生自脊索动物基因(优选脊椎动物基因,更优选哺乳动物基因,最优选人基因)的3′-UTR或衍生自脊索动物基因(优选脊椎动物基因,更优选哺乳动物基因,最优选人基因)的3′-UTR的变体的核酸序列。
[0231] 优选地,本发明的RNA包含3′-UTR元件,其可以衍生自与半衰期提高(提供稳定化的mRNA)的mRNA相关的基因,例如如下限定和描述的3′-UTR元件。优选地,3′-UTR元件是衍生自基因(其优选编码稳定的mRNA)的3′-UTR或衍生自所述基因的同源物、片段或变体的核酸序列。
[0232] 在特别优选的实施方式中,3′-UTR元件包含下列或由下列组成:衍生自选自白蛋白基因、α-珠蛋白基因、β-珠蛋白基因、酪氨酸羟化酶基因、脂氧合酶基因和胶原α基因如胶原α1(I)基因的基因的3′-UTR的核酸序列,或衍生自选自白蛋白基因、α-珠蛋白基因、β-珠蛋白基因、酪氨酸羟化酶基因、脂氧合酶基因和胶原α基因如根据专利申请WO2013/143700(其公开内容通过引用并入本文)的SEQ ID NO:1369-1390的胶原α1(I)基因的基因的3′-
UTR的变体的核酸序列,或者衍生自其同源物、片段或变体的核酸序列。在特别优选的实施方式中,3′-UTR元件包含下列或由下列组成:衍生自白蛋白基因(优选脊椎动物白蛋白基
因,更优选哺乳动物白蛋白基因,最优选根据SEQ ID NO:1445的人白蛋白基因或相应RNA序列SEQ ID NO:1446)3′-UTR或其片段或变体的核酸序列。
[0233] 在此环境中,特别优选根据本发明的RNA包含3′-UTR元件,该3′-UTR元件包含衍生自根据专利申请WO2013/143700的SEQ ID NO:1369-1390的核酸的相应RNA序列,或其片段、同源物或变体。
[0234] 最优选地,3′-UTR元件包含衍生自根据SEQ ID NO:1447(相应于专利申请WO2013/143700的SEQ ID NO:1376)或1449的人白蛋白基因片段的核酸序列。
[0235] 在此环境中,特别优选根据本发明的RNA的3′-UTR元件包含下列或由下列组成:根据SEQ ID NO:1447或1449的核酸序列的相应RNA序列,如SEQ ID NO:1448或1450所示。
[0236] 在另一个特别优选的实施方式中,3′-UTR元件包含下列或由下列组成:核酸序列衍生自α-珠蛋白基因的3′-UTR,优选脊椎动物α-或β-珠蛋白基因,更优选哺乳动物α-或β-珠蛋白基因,最优选根据SEQ ID NO:1437、1439或1441的人α-或β-珠蛋白基因或相应RNA序列SEQ ID NO:1438、1440或1442:
[0237] 智人(Homo sapiens)血红蛋白α1(HBA1)的3’-UTR
[0238] GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTITGAATAAAGTCTGAGTGGGCGGC(SEQ ID NO:1437,相应于专利申请
WO2013/143700的SEQ ID NO:1370)
[0239] 智人血红蛋白α2(HBA2)的3’-UTR
[0240] GCTGGAGCCTCGGTAGCCGTTCCTCCTGCCCGCTGGGCCTCCCAACGGGCCCTCCTCCCCTCCTTGCACCGGCCCTTCCTGGTCTTTGAATAAAGTCTGAGTGGGCAG(SEQ ID NO:1439,相应于专利申请WO2013/
143700的SEQ ID NO:1371)
[0241] 智人血红蛋白β(HBB)的3’-UTR
[0242] GCTCGCTTTCTTGCTGTCCAATTTCTATTAAAGGTTCCTTTGTTCCCTAAGTCCAACTACTAAACTGGGGGATATTATGAAGGGCCTTGAGCATCTGGATTCTGCCTAATAAAAAACATTTATTTTCATTGC(SEQ ID NO:
1441,相应于专利申请WO2013/143700的SEQ ID NO:1372)
[0243] 例如,3′-UTR元件可包含下列或由下列组成:α-珠蛋白基因(如人α-珠蛋白基因)的3′-UTR的中心α-复合物结合部分,或α-珠蛋白基因的同源物、片段或变体,优选根据SEQ ID NO:1443:
[0244] α-珠蛋白基因的3′-UTR的中心α-复合物结合部分(在此也称为“muag”,)GCCCGATGGGCCTCCCAACGGGCCCTCCTCCCCTCCTTGCACCG(SEQ ID NO:1443,相应于专利申请WO2013/143700的SEQ ID NO:1393)。
[0245] 在此环境中,特别优选根据本发明的RNA的3′-UTR元件包含下列或由下列组成:根据SEQ ID NO:1443的核酸序列的相应RNA序列,如SEQ ID NO:1444所示,或其同源物、片段或变体。
[0246] 术语“衍生自[...]基因的3′-UTR的核酸序列”优选是指基于[...]基因的3′-UTR序列或其部分的核酸序列,如基于白蛋白基因、α-珠蛋白基因、β-珠蛋白基因、酪氨酸羟化酶基因、脂氧合酶基因或胶原α基因如胶原α1(I)基因(优选白蛋白基因)的3′-UTR或其部分。此术语包括相应于整个3′-UTR序列(即基因全长3′-UTR序列)的序列,和相应于基因(如白蛋白基因、α-珠蛋白基因、β-珠蛋白基因、酪氨酸羟化酶基因、脂氧合酶基因或胶原α基因如胶原α1(I)基因,优选白蛋白基因)3′-UTR序列的片段的序列。
[0247] 术语“衍生自[...]基因的3′-UTR的变体的核酸序列”优选是指如上所述基于基因如基于白蛋白基因、α-珠蛋白基因、β-珠蛋白基因、酪氨酸羟化酶基因、脂氧合酶基因或胶原α基因如胶原α1(I)基因或基于其部分的3′-UTR序列的变体的核酸序列。该术语包括相应于基因的3′-UTR的变体的整个序列的序列,即基因的全长变体3′-UTR序列,以及相应于基因的变体3′-UTR序列的片段的序列。在此环境中的片段优选由相应于全长变体3′-UTR中连续一段核苷酸的连续一段核苷酸组成,其表示全长变体3′-UTR的至少20%,优选至少30%,更优选至少40%,更优选至少50%,甚至更优选至少60%,甚至更优选至少70%,甚至更优选至少80%,最优选至少90%。在本发明的意义上,这种变体片段优选是如本文所述的变体的功能片段。
[0248] 5′-UTR
[0249] 在特别优选的实施方式中,本发明组合物的至少一种mRNA包含至少一个5′-非翻译区元件(5′-UTR元件)。优选地,所述至少一个5′-UTR元件包含下列或由下列组成:衍生自TOP基因的5′-UTR或衍生自TOP基因的5′-UTR的片段、同源物或变体的核酸序列。
[0250] 特别优选5′-UTR元件不包含如上限定的TOP-基序或5′TOP。
[0251] 在一些实施方式中,衍生自TOP基因的5′-UTR的5′-UTR元件的核酸序列其3’端终止于位于其来源基因或mRNA的起始密码子(例如A(U/T)G)上游第1、2、3、4、5、6、7、8、9或10位的核苷酸。因此,5′-UTR元件不包含蛋白质编码区的任何部分。因此,优选地,本发明组合物的所述至少一种mRNA的唯一蛋白质编码部分由编码区提供。
[0252] 衍生自TOP基因的5′-UTR的核酸序列优选衍生自真核TOP基因,优选植物或动物TOP基因,更优选脊索动物TOP基因,甚至更优选脊椎动物TOP基因,最优选哺乳动物TOP基
因,例如人TOP基因。
[0253] 例如,5′-UTR元件优选选自包含下列或由下列组成5′-UTR元件:衍生自选自专利申请WO2013/143700(其公开内容通过引用并入本文)的SEQ ID NO:1-1363、SEQ ID NO:1395、SEQ ID NO:1421和SEQ ID NO:1422的核酸序列的;衍生自专利申请WO2013/143700的SEQ ID NO:1-1363、SEQ ID NO:1395、SEQ ID NO:1421和SEQ ID NO:1422的同源物的;衍生自其变体的;或优选衍生自相应RNA序列的核酸序列。术语“专利申请WO2013/143700的SEQ ID NO:1-1363、SEQ ID NO:1395、SEQ ID NO:1421和SEQ ID NO:1422的同源物”是指智人之外的物种的与根据专利申请WO2013/143700的SEQ ID NO:1-1363、SEQ ID NO:1395、SEQ ID NO:1421和SEQ ID NO:1422的序列同源的序列。
[0254] 在优选的实施方式中,根据本发明的RNA的5′-UTR元件包含下列核酸序列或由下列核酸序列组成:衍生自选自专利申请WO2013/143700的SEQ ID NO:1-1363、SEQ ID NO:
1395、SEQ ID NO:1421和SEQ ID NO:1422的核酸序列的从核苷酸位置5(即位于序列第5位的核苷酸)至起始密码子(位于该序列的3’端)5′紧邻核苷酸位置(例如ATAG序列5′紧邻的核苷酸位置)延伸的核酸序列的核酸序列,衍生自专利申请WO2013/143700的SEQ ID NO:1-
1363、SEQ ID NO:1395、SEQ ID NO:1421和SEQ ID NO:1422的同源物的、衍生自其变体或相应的RNA序列的核酸序列。特别优选5′-UTR元件衍生自选自专利申请WO2013/143700的SEQ ID NO:1-1363、SEQ ID NO:1395、SEQ ID NO:1421和SEQ ID NO:1422的核酸序列的从5′TOP的3′紧邻核苷酸位置至起始密码子(位于该序列的3’端)的5′紧邻核苷酸位置延伸的核酸序列的核酸序列,衍生自专利申请WO2013/143700的SEQ ID NO:1-1363、SEQ ID NO:1395、SEQ ID NO:1421和SEQ ID NO:1422的同源物的、衍生自其变体或相应的RNA序列的核酸序列。
[0255] 在特别优选的实施方式中,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:衍生自编码核糖体蛋白的TOP基因的5′-UTR或衍生自编码核糖体蛋白的TOP基因的5′-UTR的变体的核酸序列。例如,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:衍生自如本文所述根据专利申请WO2013/143700的SEQ ID NO:67、170、193、244、259、554、650、
675、700、721、913、1016、1063、1120、1138和1284-1360中任一项的核酸序列的5′-UTR、其相应RNA序列、同源物或其变体的核酸序列,优选缺少5′TOP基序。如上所述,从位置5至ATG(位于该序列的3’端)的5′紧邻核苷酸延伸的序列相应于所述序列的5′-UTR。
[0256] 优选地,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:衍生自编码核糖体大蛋白(RPL)的TOP基因的5′-UTR或衍生自编码核糖体大蛋白(RPL)的TOP基因的5′-UTR
的同源物或变体的核酸序列。例如,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:
如本文所述衍生自专利申请WO2013/143700的SEQ ID NO:67、259、1284-1318、1344、1346、
1348-1354、1357、1358、1421和1422中任一项的核酸序列的5′-UTR、其相应RNA序列、同源物或变体的核酸序列,优选缺少5′TOP基序。
[0257] 在特别优选的实施方式中,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:衍生自核糖体蛋白大32基因的5′-UTR的,优选衍生自脊椎动物核糖体蛋白大32(L32)基因的,更优选衍生自哺乳动物核糖体蛋白大32(L32)基因的,最优选衍生自人核糖体蛋白大
32(L32)基因的核酸序列,或衍生自核糖体蛋白大32基因的5′-UTR的变体的,优选衍生自脊椎动物核糖体蛋白大32(L32)基因的,更优选衍生自哺乳动物核糖体蛋白大32(L32)基因
的,最优选衍生自人核糖体蛋白大32(L32)基因的核酸序列,其中优选5′-UTR元件不包含所述基因的5′TOP。
[0258] 因此,在特别优选的实施方式中,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:与根据SEQ ID NO:1431的核酸序列(缺少5’端寡嘧啶束GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC的人核糖体蛋白大32的5′-UTR;相应于专利申请WO2013/143700的
SEQ ID NO:1368)或优选地相应RNA序列(SEQ ID NO:1432)具有至少约40%,优选至少约
50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%同一性的核酸序列,或其中至少一个5′-UTR元件包含下列核酸序列的片段或由下列核酸序列的片段组成:与根据SEQ ID NO:1431的核酸序列或优选地相应RNA序列(SEQ ID NO:1432)具有至少约40%,优选至少约50%,优选至少约
60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%同一性的核酸序列,其中,优选地,该片段如上所述,即为连续一段核苷酸——表示全长5′-UTR的至少20%等。优选地,该片段呈现如下长度:至少约20个核苷酸或更多,优选至少约30个核苷酸或更多,更优选至少约40个核苷酸或更多。优选地,该片段是如本文所述的功能片段。
[0259] 在一些实施方式中,根据本发明的RNA包含5′-UTR元件,该5′-UTR元件包含下列核酸序列或由下列核酸序列组成:衍生自选自RPSA、RPS2、RPS3、RPS3A、RPS4、RPS5、RPS6、RPS7、RPS8、RPS9、RPS10、RPS11、RPS12、RPS13、RPS14、RPS15、RPS15A、RPS16、RPS17、RPS18、RPS19、RPS20、RPS21、RPS23、RPS24、RPS25、RPS26、RPS27、RPS27A、RPS28、RPS29、RPS30、RPL3、RPL4、RPL5、RPL6、RPL7、RPL7A、RPL8、RPL9、RPL10、RPL10A、RPL11、RPL12、RPL13、RPL13A、RPL14、RPL15、RPL17、RPL18、RPL18A、RPL19、RPL21、RPL22、RPL23、RPL23A、RPL24、RPL26、RPL27、RPL27A、RPL28、RPL29、RPL30、RPL31、RPL32、RPL34、RPL35、RPL35A、RPL36、RPL36A、RPL37、RPL37A、RPL38、RPL39、RPL40、RPIA1、RPLP0、RPLP1、RPLP2、RPLP3、RPLP0、RPLP1、RPLP2、EEF1A1、EEF1B2、EEF1D、EEF1G、EEF2、EIF3E、EIF3F、EIF3H、EIF2S3、EIF3C、EIF3K、EIF3EIP、EIF4A2、PABPCI、HNRNPA1、TPT1、TUBB 1、UBA52、NPM1、ATP5G2、GNB2L1、NME2、UQCRB的脊椎动物TOP基因(如哺乳动物,例如人TOP基因)的5′-UTR或来自其同源物或变体的核酸序列,其中优选5′-UTR元件不包含TOP-基序或所述基因的5′TOP,并且其中任选地5′-UTR元件其5’端始于位于5’端寡嘧啶束(TOP)下游第1、2、3、4、5、6、7、8、9或10位的核苷酸,并且其中进一步,任选地,衍生自TOP基因的5′-UTR的5′-UTR元件其3’端终止于位于其来源基因的起始密码子(A(U/T)G)上游第1、2、3、4、5、6、7、8、9或10位的核苷酸。
[0260] 在进一步特别优选的实施方式中,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:衍生自核糖体蛋白大32基因(RPL32)、核糖体蛋白大35基因(RPL35)、核糖体蛋白大
21基因(RPL21)、ATP合成酶、H+转运、线粒体F1复合物、α亚基1、心肌(ATP5A1)基因、羟基类固醇(17-β)脱氢酶4基因(HSD17B4)、雄激素引起的1基因(AIG1)、细胞色素c氧化酶亚基VIc基因(COX6C)、或N-酰基鞘氨醇酰胺水解酶(酸性神经酰胺酶)1基因(ASAH1)的5′-UTR或衍
生自其变体的核酸序列,优选衍生自脊椎动物核糖体蛋白大32基因(RPL32)、脊椎动物核糖体蛋白大35基因(RPL35)、脊椎动物核糖体蛋白大21基因(RPL21)、脊椎动物ATP合成酶、H+转运、线粒体F1复合物、α亚基1、心肌(ATP5A1)基因、脊椎动物羟基类固醇(17-β)脱氢酶4基因(HSD17B4)、脊椎动物雄激素引起的1基因(AIG1)、脊椎动物细胞色素c氧化酶亚基VIc基
因(COX6C)、或脊椎动物N-酰基鞘氨醇酰胺水解酶(酸性神经酰胺酶)1基因(ASAH1)或衍生
自其变体,更优选衍生自哺乳动物核糖体蛋白质大32基因(RPL32)、核糖体蛋白大35基因
(RPL35)、核糖体蛋白大21基因(RPL21)、哺乳动物ATP合成酶、H+转运、线粒体F1复合物、α亚基1、心肌(ATP5A1)基因、哺乳动物羟基类固醇(17-β)脱氢酶4基因(HSD17B4)、哺乳动物雄激素引起的1基因(AIG1)、哺乳动物细胞色素c氧化酶亚基VIc基因(COX6C)、或哺乳动物N-
酰基鞘氨醇酰胺水解酶(酸性神经酰胺酶)1基因(ASAH1)或衍生自其变体,最优选衍生自人
核糖体蛋白大32基因(RPL32)、人核糖体蛋白大35基因(RPL35)、人核糖体蛋白大21基因
(RPL21)、人ATP合成酶、H+转运、线粒体F1复合物、α亚基1、心肌(ATP5A1)基因、人羟基类固醇(17-β)脱氢酶4基因(HSD17B4)、人雄激素引起的1基因(AIG1)、人细胞色素c氧化酶亚基VIc基因(COX6C)、或人N-酰基鞘氨醇酰胺水解酶(酸性神经酰胺酶)1基因(ASAH1)或衍生自
其变体,其中优选5′-UTR元件不包含所述基因的5′TOP。
[0261] 在进一步特别优选的实施方式中,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:衍生自脊椎动物羟基类固醇(17-β)脱氢酶4基因(HSD17B4)的核酸序列,优选衍生自哺乳动物羟基类固醇(17-β)脱氢酶4基因(HSD17B4)。更优选地,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:与根据SEQ ID NO:1435的核酸序列或优选根据SEQ ID NO:
1436的相应RNA序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%同一性的核酸序列,或其中所述至少一个5′-UTR元件包含下列核酸序列的片段或由下列核酸序列的片段组成:所述核酸序列与根据SEQ ID NO:1435的核酸序列或更优选与相应RNA序
列(SEQ ID NO:1436)至少具有至少约40%,优选至少约50%,优选至少约60%,优选至少约
70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约
99%同一性,其中,优选地,该片段如上所述,即为连续一段核苷酸——表示全长5′-UTR的至少20%等。优选地,该片段呈现如下长度:至少约20个核苷酸或更多,优选至少约30个核苷酸或更多,更优选至少约40个核苷酸或更多。优选地,该片段是如本文所述的功能片段。
[0262] 因此,在特别优选的实施方式中,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:与根据专利申请WO2013/143700的SEQ ID NO:1368或SEQ ID NO:1412-1420的核酸序列或相应RNA序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%同一性的核酸序列,或其中至少一个5′-UTR元件包含核酸序列的片段或由核酸序列的片段组成,所述核酸序与根据专利申请WO2013/143700的SEQ ID NO:1368或SEQ ID NO:1412-1420的核酸序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一
性,其中,优选地,该片段如上所述,即为连续一段核苷酸——表示全长5′-UTR的至少20%等。优选地,该片段呈现如下长度:至少约20个核苷酸或更多,优选至少约30个核苷酸或更多,更优选至少约40个核苷酸或更多。优选地,该片段是如本文所述的功能片段。
[0263] 因此,在特别优选的实施方式中,5′-UTR元件包含下列核酸序列或由下列核酸序列组成:与根据SEQ ID NO:1433的核酸序列(ATP5A1的5′-UTR,缺少5’端寡嘧啶束:GCGGCTCGGCCATTTTGTCCCAGTCAGTCCGGAGGCTGCGGCTGCAGAAGTACCGCCTGCG-GAGTAACTGCAAAG;相应于
专利申请WO2013/143700的SEQ ID NO:1414)或优选相应RNA序列(SEQ ID NO:1434)具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%同一性的核酸序列,或其中至少一个5′-UTR元件包含核酸序列的片段或由核酸序列的片段组成,所述核酸序列与根据
SEQ ID NO:1433的核酸序列或更优选与相应RNA序列(SEQ ID NO:1434)具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约
90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性,其中,优选地,该片段如上所述,即为连续一段核苷酸——表示全长5′-UTR的至少20%等。优选地,该片段呈现如下长度:至少约20个核苷酸或更多,优选至少约30个核苷酸或更多,更优选至少约40个核苷酸或更多。优选地,该片段是如本文所述的功能片段。
[0264] 优选地,至少一个5′-UTR元件和至少一个3′-UTR元件协同作用以增加具有如上所述的本发明组合物的至少一种mRNA的蛋白质生产。
[0265] 组蛋白茎环(stem-loop)
[0266] 在特别优选的实施方式中,根据本发明的RNA包含组蛋白茎环序列/结构。这种组蛋白茎环序列优选选自WO2012/019780中所公开的组蛋白茎环序列,其公开内容通过引用
并入本文。
[0267] 适合在本发明中使用的组蛋白茎环序列优选选自下式(I)或(II)中的至少一种:
[0268] 式(I)(无茎边界元件(stem bordering elements)的茎环序列):
[0269]
[0270] 式(II)(有茎边界元件的茎环序列):
[0271]
[0272] 其中:
[0273] 茎1或茎2边界元件N1-6是1至6个,优选2至6个,更优选2至5个,甚至更优选3至5个,最优选4至5个或5个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
[0274] 茎1[N0-2GN3-5]与元件茎2反向互补或部分反向互补,并且是5至7个核苷酸的连续序列;
[0275] 其中N0-2是0至2个,优选0至1个,更优选1个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
[0276] 其中N3-5是3至5个,优选4至5个,更优选4个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物,并且
[0277] 其中G是鸟苷或其类似物,并且可以任选地被胞苷或其类似物替代,条件是茎2中其互补核苷酸胞苷被鸟苷替代;
[0278] 环序列[N0-4(U/T)N0-4]位于元件茎1和茎2之间,并且是3至5个核苷酸,更优选4个核苷酸的连续序列;
[0279] 其中各N0-4彼此独立地是0至4个,优选1至3个,更优选1至2个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;和其中U/T表示尿苷或任选地胸苷;
[0280] 茎2[N3-5CN0-2]与元件茎1反向互补或部分反向互补,并且是5至7个核苷酸的连续序列;
[0281] 其中N3-5是3至5个,优选4至5个,更优选4个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
[0282] 其中N0-2是0至2个,优选0至1个,更优选1个N的连续序列,其中各N彼此独立地选自选自A、U、T、G或C的核苷酸或其核苷酸类似物;和
[0283] 其中C是胞苷或其类似物,并且可以任选地被鸟苷或其类似物取代,条件是茎1中其互补核苷鸟苷被胞苷替代;
[0284] 其中
[0285] 茎1和茎2能够彼此碱基配对形成反向互补序列,其中在茎1和茎2之间可以发生碱基配对,例如,通过核苷酸A和U/T或G和C的Watson-Crick碱基配对或通过非Watson-Crick
碱基配对,例如Wobble碱基配对、反向Watson-Crick碱基配对、Hoogsteen碱基配对、反向Hoogsteen碱基配对;或能够彼此碱基配对形成部分反向互补序列,其中茎1和茎2之间可以发生不完全碱基配对——基于在一个茎中的一个或多个碱基不具有另一个茎的反向互补
序列中的互补碱基。
[0286] 根据进一步优选的实施方式,根据本发明的RNA可以包含根据以下具体式(Ia)或(IIa)中的至少一种的至少一种组蛋白茎环序列:
[0287] 式(Ia)(无茎边界元件的茎环序列):
[0288]
[0289] 式(IIa)(有茎边界元件的茎环序列):
[0290]
[0291] 其中:
[0292] N、C、G、T和U如上限定。
[0293] 根据进一步更特别优选的实施方式,根据本发明的RNA可以包含根据以下具体式(Ib)或(IIb)中的至少一种的至少一种组蛋白茎环序列:
[0294] 式(Ib)(无茎边界元件的茎环序列):
[0295]
[0296] 式(IIb)(有茎边界元件的茎环序列):
[0297]
[0298] 其中:
[0299] N、C、G、T和U如上限定。
[0300] 特别优选的组蛋白茎环序列是序列CAAAGGCTCTTTTCAGAGCCACCA(根据SEQ ID NO:1451)或更优选相应RNA序列CAAAGGCUCUUUUCAGAGCCACCA(根据SEQ ID NO:1452)。
[0301] 信号肽
[0302] 根据另一个特别优选的实施方式,根据本发明的RNA可以另外地或可选地编码分泌信号肽。这种信号肽是一般呈现约15至30个氨基酸的长度并且优选位于被编码肽的N末
端的序列,但不限于此。本文限定的信号肽优选地允许将由组合物的至少一种mRNA编码的
肽或蛋白质转运到限定的细胞区室中,优选细胞表面、内质网(ER)或内含体-溶酶体区室。
本文限定的分泌信号肽序列的实例包括但不限于经典或非经典MHC分子的信号序列(例如
MHC I和II分子的信号序列,例如MHC I类分子HLA-A*0201的信号序列)、本文限定的细胞因子或免疫球蛋白的信号序列、本文限定的免疫球蛋白或抗体的恒定链的信号序列、Lampl、Tapasin、Erp57、Calretikulin、Calnexin和其他膜相关蛋白质或内质网(ER)或内含体-溶酶体区室相关蛋白质的信号序列。最优选地,根据本发明可以使用MHC I类分子HLA-A*0201的信号序列。例如,优选使用衍生自HLA-A的信号肽以促进本文限定的被编码肽或蛋白质或其片段或变体的分泌。更优选地,HLA-A信号肽与本文限定的被编码肽或蛋白质或其片段或变体融合:
[0303] 任何上述修饰可以应用于本发明的RNA,和进一步应用于本发明环境中使用的任何RNA,并且如果合适或必要可以以任何组合彼此组合,只要在对应的至少一种mRNA中这些修饰组合不相互干扰。本领域技术人员将能够相应地做出其选择。
[0304] RNA构建体
[0305] 根据本发明的包含至少一个本文限定的编码序列的RNA,优选mRNA,可优选包含5′-UTR和/或3′-UTR,优选含有至少一个组蛋白茎环。在除了本文限定的肽或蛋白质或其片段或变体之外还有其他肽或蛋白质由根据本发明的RNA的至少一个编码序列编码的情况
下,被编码的肽或蛋白质优选不是组蛋白,不是报告蛋白质,和/或不是标记或选择蛋白,如本文限定。根据本发明的RNA的3′-UTR优选还包含本文限定的多(A)和/或多(C)序列。3′-UTR的单个元件可以沿着本发明的RNA序列从5′到3′以任何顺序存在。此外,还可以包含如本文所述的其他元件,如本文限定的稳定序列(例如衍生自珠蛋白基因的UTR)、IRES序列
等。各元件也可以在根据本发明的RNA中重复至少一次(具体地在双顺反子或多顺反子构建
体中),优选两次或更多次。例如,单个元件可以按照以下顺序存在于根据本发明的RNA中
(其中RNA可以任选地包含编码区5′的如本文所述的5′-UTR元件):
[0306] 5′-编码区-组蛋白茎环-多(A)/(C)序列-3′;或
[0307] 5′-编码区-多(A)/(C)序列-组蛋白茎环-3′;或
[0308] 5′-编码区-组蛋白茎环-多腺苷酸化信号-3′;或
[0309] 5′-编码区-多腺苷酸化信号-组蛋白茎环-3′;或
[0310] 5′-编码区-组蛋白茎环-组蛋白茎环-多(A)/(C)序列-3′;或
[0311] 5′-编码区-组蛋白茎环-组蛋白茎环-多腺苷酸化信号-3′;或
[0312] 5′-编码区-稳定序列-多(A)/(C)序列-组蛋白茎环-3′;或
[0313] 5′-编码区-稳定序列-多(A)/(C)序列-多(A)/(C)序列-组蛋白茎环-3′;或
[0314] 5′-编码区-稳定序列-多(A)/(C)序列-组蛋白茎环-3′;等等。
[0315] 根据进一步的实施方式,本发明的RNA,优选mRNA,优选包含下列结构元件中的至少一种:5′-和/或3′-非翻译区元件(UTR元件),具体地5′-UTR元件——其优选包含下列核酸序列或由下列核酸序列组成:衍生自TOP基因的5′-UTR或其片段、同源物或变体的核酸序列,或5′-和/或3′-UTR元件——其可优选地衍生自提供稳定mRNA的基因或其同源物、片段或变体;组蛋白茎环结构,优选在其3′非翻译区中的组蛋白茎环;5′-帽结构;多A尾;或多(C)序列。
[0316] 根据一些实施方式,特别优选的是,如果除了本文限定的肽或蛋白质或其片段或变体之外还有另外的肽或蛋白质由本文限定的至少一个编码序列编码,被编码的肽或蛋白
质优选不是组蛋白,不是报告蛋白(例如荧光素酶、GFP、EGFP、β-半乳糖苷酶,具体地EGFP)和/或不是标记或选择蛋白(例如α-球蛋白、半乳糖激酶和黄嘌呤:鸟嘌呤磷酸核糖基转移酶(GPT))。在优选的实施方式中,根据本发明的RNA不包含报告基因或标记基因。优选地,根据本发明的RNA不编码例如荧光素酶;绿色荧光蛋白(GFP)及其变体(如eGFP、RFP或BFP);α-珠蛋白;次黄嘌呤-鸟嘌呤磷酸核糖转移酶(HGPRT);β-半乳糖苷酶;半乳糖激酶;碱性磷酸酶;分泌胚胎碱性磷酸酶(SEAP))或抗性基因(如抗新霉素、嘌呤霉素、潮霉素和zeocin的抗性基因)。在优选的实施方式中,根据本发明的RNA不编码荧光素酶。在另一个实施方式中,根据本发明的RNA不编码GFP或其变体。
[0317] 根据优选的实施方式,根据本发明的RNA包含以下元素——优选5′至3′方向:
[0318] a)5′-帽结构,优选m7GpppN,
[0319] b)本文限定的至少一个编码序列,
[0320] c)3′-UTR元件,包含衍生自α-珠蛋白基因的核酸序列,优选包含根据SEQ ID NO:1444的核酸序列,或其同源物、片段或变体,
[0321] d)多(A)尾,优选由10至200、10至100、40至80或50至70个腺苷核苷酸组成,
[0322] e)多(C)尾,优选由10至200、10至100、20至70、20至60或10至40个胞苷核苷酸组成,和
[0323] f)组蛋白茎环,优选包含根据SEQ ID NO:1452的核酸序列。
[0324] 在优选的实施方式中,本发明提供包含下列核酸序列或由下列核酸序列组成的RNA:与选自SEQ ID NO:408至750的核酸序列相同或至少80%相同的核酸序列、或任一所述核酸序列的片段或变体。
[0325] 根据进一步的实施方式,根据本发明的RNA包含下列核酸序列或由下列核酸序列组成:与选自SEQ ID NO:408至750核酸序列具有至少5%、10%、20%、30%、40%、50%、
60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少
90%,最优选至少95%或甚至97%序列同一性的核酸序列、或任一所述核酸序列的片段或
变体。
[0326] 在另一个实施方式中,根据本发明的RNA包含以下元素——优选5′至3′方向:
[0327] a)5′-帽结构,优选m7GpppN,
[0328] b)5′-UTR元件,其包含下列核酸序列或由下列核酸序列组成:衍生自TOP基因的5′-UTR的核酸序列,优选包含根据SEQ ID NO:1432的核酸序列,或其同源物、片段或变体,[0329] c)本文限定的至少一个编码序列,
[0330] d)3′-UTR元件,包含衍生自α-珠蛋白基因的核酸序列,优选包含根据SEQ ID NO:1444的核酸序列,或其同源物、片段或变体;和/或
[0331] 3′-UTR元件,包含衍生自白蛋白基因的核酸序列,优选包含根据SEQ ID NO:1448或1450的核酸序列,或其同源物、片段或变体,
[0332] e)多(A)尾,优选由10至200、10至100、40至80或50至70个腺苷核苷酸组成,
[0333] f)多(C)尾,优选由10至200、10至100、20至70、20至60或10至40个胞苷核苷酸组成,和
[0334] g)组蛋白茎环,优选包含根据SEQ ID NO:1452的核酸序列。
[0335] 优选地,本发明提供包含下列核酸序列或由下列核酸序列组成的RNA:与选自SEQ ID NO:751至1090的核酸序列相同或至少80%相同的核酸序列,或任一所述核酸序列的片
段或变体。
[0336] 在进一步的实施方式中,根据本发明的RNA包含下列核酸序列或由下列核酸序列组成:与选自SEQ ID NO:751至1090的核酸序列具有至少5%、10%、20%、30%、40%、50%、
60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少
90%,最优选至少95%或甚至97%序列同一性的核酸序列,或任一所述核酸序列的片段或
变体。
[0337] 在进一步的实施方式中,根据本发明的RNA包含以下元素,优选5′至3′方向:
[0338] a)5′-帽结构,优选m7GpppN,
[0339] b)5′-UTR元件,其包含下列核酸序列或由下列核酸序列组成:衍生自HSD17B4基因的5′-UTR的核酸序列,优选包含根据SEQ ID NO:1436的核酸序列,或其同源物、片段或变体,
[0340] c)本文限定的至少一个编码序列,
[0341] d)3′-UTR元件,包含衍生自α-珠蛋白基因的核酸序列,优选包含根据SEQ ID NO:1444的核酸序列,或其同源物、片段或变体;和/或
[0342] 3′-UTR元件,包含衍生自白蛋白基因的核酸序列,优选包含根据SEQ ID NO:1448或1450的核酸序列,或其同源物、片段或变体,
[0343] e)多(A)尾,优选由10至200、10至100、40至80或50至70个腺苷核苷酸组成。
[0344] 优选地,本发明提供包含下列核酸序列或由下列核酸序列组成的RNA:与选自SEQ ID NO:1091至1430的核酸序列相同或至少80%相同的核酸序列,或任一所述核酸序列的片段或变体。
[0345] 在进一步的实施方式中,根据本发明的RNA包含下列核酸序列或由下列核酸序列组成:与选自SEQ ID NO:1091至1430的核酸序列具有至少5%、10%、20%、30%、40%、
50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列,或任一所述核酸序列的
片段或变体。
[0346] 在可选实施方式中,本发明提供了包含下列核酸序列或由下列核酸序列组成的RNA:与选自SEQ ID NO:408至1430的核酸序列相同或至少80%相同的核酸序列,或任一所述核酸序列的片段或变体。
[0347] 在优选的实施方式中,根据本发明的RNA包含下列核酸序列或由下列核酸序列组成:与选自SEQ ID NO:408至1430的核酸序列具有至少5%、10%、20%、30%、40%、50%、
60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少
90%,最优选至少95%或甚至97%序列同一性的核酸序列,或任一所述核酸序列的片段或
变体。
[0348] 根据特别优选的实施方式,本发明提供了包含下列核酸序列或由下列核酸序列组成的RNA:与选自SEQ ID NO:36、37、75、77、78、91、92、93、94、95、97、98、99、807、808、809、
810、811、813、814、815、1095、1096、1131、1133、1134、1187和1188的核酸序列相同或至少
80%相同的核酸序列,或任一所述核酸序列的片段或变体。
[0349] 优选地,根据本发明的RNA包含下列核酸序列或由下列核酸序列组成:与选自SEQ ID NO:36、37、75、77、78、91、92、93、94、95、97、98、99、807、808、809、810、811、813、814、815、
1095、1096、1131、1133、1134、1187和1188的核酸序列具有至少5%、10%、20%、30%、40%、
50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列,或任一所述核酸序列的
片段或变体。
[0350] 在另一个实施方式中,本发明提供了包含下列核酸序列或由下列核酸序列组成的RNA:与选自SEQ ID NO:75、77、78、91、92、93、94、95、97、98、99、807、808、809、810、811、813、
814、815、1131、1133和1134的核酸序列相同或至少80%相同的核酸序列,或任一所述核酸序列的片段或变体。
[0351] 优选地,根据本发明的RNA包含下列核酸序列或由下列核酸序列组成:与选自SEQ ID NO:75、77、78、91、92、93、94、95、97、98、99、807、808、809、810、811、813、814、815、1131、
1133和1134的核酸序列具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,优选至少70%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%或甚至97%序列同一性的核酸序列,或任一所述核酸序列的片段或变体。
[0352] 根据本发明的RNA可以使用本领域已知的任何方法制备,包括合成方法,如例如固相RNA合成,以及体外方法如RNA体外转录反应。
[0353] 优选的构建体在下文表A中显示。
[0354] 表A.本发明的优选构建体。
[0355]
[0356]
[0357] 从序列表中的数字标识符<223>可以明显看出,应用了不同的构建设计。表B中公开了本说明书和序列表中所示的本发明构建体的设计。序列表中所示的各构建体类似于本
发明的优选构建体。
[0358] 表B.构建体设计的描述。
[0359]
[0360]
[0361] 在优选的实施方式中,HsFGF21(L126R、P199G、A208E)、HsHGF、MmHGF、HsGFER、HsTNFSF10、HsTNFSF10(95-281)、HsALB(1-18)_HsTNFSF10(95-281)、HsALB(1-18)_ILZ_HsTNFSF10(95-281)、RnCebpa、RnCebpa(15-344)、MmCebpa、MmCebpa(15-359)、HsCEBPA、HsCEBPA(15-358)、HsHNF4A、HsFGF21、HsOGFRL1、HsRLN1、HsRLN2、HsRLN3、HsMMP1、HsMMP1(1-19、100-469)、ColG、HsALB(1-18)、ColG(111-1118)、HsALB(1-18)、ColG(1-110)、CS-F、ColG(111-1118)、ColH、ColH、HsALB(1-18)、ColH(41-1021)、HsALB(1-18)、ColH(1-40)、或CS-F_ColH(41-1021)包含选自表B中提到的设计1、设计2、设计3、设计4、设计5、设计G、设计
7、设计8、设计9和设计10的构建体设计,并且由序列表中的数字标识符<223>显见。
[0362] 在另一个实施方式中,HsMMP1的优选构建体显示于2073、2100、2101、2133、2158、2183、2208、2233、2258、2283、2308、2333、2358、2383和2408,由数字标识符<223>显见。
[0363] 在另一个实施方式中,HsMMP1(1-19、100-469)的优选构建体显示于SEQ ID NO:2102、2134、2159、2184、2209、2234、2259、2284、2309、2334、2359、2384和2409,由数字标识符<223>显见。
[0364] 在另一个实施方式中,HsHGF的优选构建体显示于SEQ ID NO:1947、1948、1954、1958、1962、1966、1970、1974、1978、1982、1986、1990、1994、1998和2075,由数字标识符<223>显见。
[0365] 在另一个实施方式中,HsCEBPA、HsCEBPA(15-358)、RnCebpa、RnCebpa(15-344)、MmCebpa或MmCebpa(15-359)的优选构建体显示于SEQ ID NO:2065、2066、2081、2082、2083、2084、2085、2086、2087、2088、2121、2122、2123、2124、2125、2126、2146、2147、2148、2149、
2150、2151、2171、2172、2175、2176、2196、2197、2198、2199,2200、2201、2221、2222、2223、
2224、2225、2226、2246、2247、2248、2249、2250、2251、2271、2272、2273、2274、2275、2276、
2296、2297、2298、2299、2300,2301、2321、2322、2323、2324、2325、2326、2346、2347、2348、
2349、2350、2351、2371、2372、2373、2374、2375、2376、2396、2397、2398、2399、2400和2401,由数字标识符<223>显见。
[0366] 在另一个实施方式中,HsTNFSF10、HsTNFSF10(95-281)、HsALB(1-18)_HsTNFSF10(95-281)或HsALB(1-18)_ILZ_HsTNFSF10(95-281)的优选构建体显示于SEQ ID NO:2063、
2064、2077、2078、2079、2080、2117、2118、2119、2120、2142、2143、2144、2145、2167、2168、
2169、2170、2192、2193、2194、2195、2217、2218、2219、2220、2242、2243、2244、2245、2267、
2268、2269、2270、2292、2293、2294、2295、2317、2318、2319、2320、2342、2343、2344、2345、
2367、2368、2369、2370、2392、2393、2394和2395,由数字标识符<223>显见。
[0367] 在另一个实施方式中,ColG、ColH、HsALB(1-18)_ColG(111-1118)、HsALB(1-18)_ColG(1-110)_CS-F_ColG(111-1118)、HsALB(1-18)_ColH(41-1021)、HsALB(1-18)_ColH(1-40)_CS-F_ColH(41-1021)的优选构建体显示于SEQ ID NO:2074、2103、2104、2105、2106、
2107、2108、2109、2110、2111、2112、2113、2114、2115、2116、2135、2136、2137、2138、2139、
2140、2141、2160、2161、2162、2163、2164、2165、2166、2185、2186、2187、2188、2189、2190、
2191、2210、2211、2212、2213、2214、2215、2216、2235、2236、2237、2238、2239、2240、2241、
2260、2261、2262、2263、2264、2265、2266、2285、2286、2287、2288、2289、2290、2291、2310、
2311、2312、2313、2314、2315、2316、2335、2336、2337、2338、2339、2340、2341、2360、2361、
2362、2363、2364、2365、2366、2385、2386、2387、2388、2389、2390、2391、2410、2411、2412、
2413、2414、2415和2416,由数字标识符<223>显见。
[0368] 在另一个实施方式中,HsFGF21(L126R、P199G、A208E)的优选构建体显示于SEQ ID NO:1945、1946、1953、1957、1961、1965、1969、1973、1977、1981、1985、1989、1993和1997,由数字标识符<223>显见。
[0369] 在另一个实施方式中,HsFGF21的优选构建体显示于SEQ ID NO:2068、2091、2092、2128、2153、2178、2203、2228、2253、2278、2303、2328、2353、2378和2403,由数字标识符<223>显见。
[0370] 药物组合物
[0371] 在另一方面,本发明涉及(药物)组合物,其包含如本文所述的根据本发明的RNA。因此,根据本发明的(药物)组合物包含RNA,该RNA包含至少一个编码序列,其中该编码序列编码如本文所述的至少一种肽或蛋白质,优选选自胞外基质蛋白酶、CCAAT/增强子结合蛋
白α(CEBPA)、TNF相关凋亡诱导配体(TRAIL)、肝细胞核因子4α(HNF4A)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、肝细胞生长因子(HGF)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)的肽或蛋白质,或本文限定的这些肽或蛋白质中任意种的
片段或变体;和药学上可接受的运载体。根据本发明的组合物优选作为药物组合物提供。
[0372] 关于(药物)组合物中包含的RNA,参考对根据本发明的RNA的描述,其适用于(药物)组合物。
[0373] 根据本发明的(药物)组合物优选包含如本文所述的至少一种根据本发明的RNA。在可选实施方式中,(药物)组合物包含至少两种根据本发明的RNA。
[0374] 在本发明的环境中,(药物)组合物可以编码本文限定的肽或蛋白质中的一种或多种,或其片段或变体。根据优选的实施方式,(药物)组合物编码如本文所述的肽或蛋白质或其片段或变体的组合。优选地,(药物)组合物编码至少两种、三种、四种、五种、六种、七种、八种、九种或更多种如本文所述的肽或蛋白质或其片段或变体,其优选选自胞外基质蛋白
酶,优选如本文所述,CCAAT/增强子结合蛋白α(CEBPA)、TNF相关凋亡诱导配体(TRAIL)、肝细胞核因子4α(HNF4A)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1
(OGFRL1)、肝细胞生长因子(HGF)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)、或其片段或变体。
[0375] 在优选的实施方式中,本发明的(药物)组合物可包含至少一种根据本发明的RNA,其中所述至少一种RNA编码至少两种、三种、四种、五种、六种、七种、八种、九种或更多种不同的本文限定的肽或蛋白质或其片段或变体。优选地,(药物)组合物包含根据若干物种,更优选至少两个、三个、四个、五个、六个、七个、八个、九个或更多个物种的本发明的RNA,其中每个RNA物种编码本文限定的肽或蛋白质或其片段或变体中的一种。在另一个实施方式中,(药物)组合物中包含的RNA是本文限定的双顺反子或多顺反子RNA,其编码至少两种、三种、四种、五种、六种、七种、八种、九种或更多种不同的肽或蛋白质。还设想这些实施方式之间的混合物,例如包含多于一个RNA种类的组合物,其中至少一个RNA种类可以是单顺反子的,而至少一种其他RNA种类可以是双顺反子或多顺反子的。
[0376] 因此,根据本发明的(药物)组合物,优选其中包含的RNA的至少一个编码序列,可以包含本文限定的核酸序列的任何组合。
[0377] 在根据本发明的组合物的优选实施方式中,如本文所述的RNA与一种或多种阳离子或聚阳离子化合物复合,优选阳离子或聚阳离子聚合物、阳离子或聚阳离子肽或蛋白质,例如鱼精蛋白、阳离子或聚阳离子多糖和/或阳离子或聚阳离子脂质。
[0378] 在一些实施方式中,RNA可以配制为盐水或脂质制剂。根据优选的实施方式,根据本发明的RNA可以与脂质复合以形成一种或多种脂质体、脂质复合物或脂质纳米颗粒。因
此,在一个实施方式中,本发明的组合物包含脂质体、脂质复合物和/或脂质纳米颗粒,其包含根据本发明的RNA。在一个实施方式中,根据本发明的RNA与阳离子脂质和/或中性脂质复合,从而形成脂质体、脂质纳米颗粒、脂质复合物或中性脂质系纳米脂质体。
[0379] 在优选的实施方式中,脂质制剂因此选自脂质体、脂质复合物、共聚物如PLGA和脂质纳米颗粒。
[0380] 在一个优选的实施方式中,脂质纳米颗粒(LNP)包含:
[0381] a)本文限定的包含至少一个编码序列的RNA,
[0382] b)阳离子脂质,
[0383] c)聚集减少剂(例如聚乙二醇(PEG)脂质或PEG修饰的脂质),
[0384] d)任选地,非阳离子脂质(例如中性脂质),和
[0385] e)任选地,甾醇。
[0386] 在一个实施方式中,脂质纳米颗粒制剂由下列组成:(i)至少一种阳离子脂质;(ii)中性脂质;(iii)甾醇,例如,胆固醇;(iv)PEG-脂质,摩尔比为约20-60%阳离子脂质:
5-25%中性脂质:25-55%甾醇;0.5-15%PEG-脂质。
[0387] 在一个实施方式中,核酸可以配制在氨基醇类脂质中。可用于本发明的氨基醇类脂质可通过美国专利号8,450,298中描述的方法制备,该专利其整体通过引用并入本文。
[0388] 阳离子脂质
[0389] 脂质纳米颗粒可包括适于形成脂质纳米颗粒的任何阳离子脂质。优选地,阳离子脂质在约生理pH下带有净正电荷。
[0390] 阳离子脂质优选为氨基脂质。如本文所用,术语“氨基脂质”意指包括具有一个或两个脂肪酸或脂肪烷基链和氨基头部基团(head group)(包括烷基氨基或二烷基氨基)的可在生理pH下被质子化以形成阳离子脂质的那些脂质。
[0391] 阳离子脂质可以是,例如,N,N-二油基(dioleyl)-N,N-二甲基氯化铵(DODAC)、N,N-二硬脂基-N,N-二甲基溴化铵(DDAB)、1,2-二油酰基三甲基丙烷氯化铵(DOTAP)(也称为N-(2,3-二油酰氧基)丙基)-N,N,N-三甲基氯化铵和1,2-二油基氧基(dioleyloxy)-3-三甲基氨基丙烷氯化物盐)、N-(1-(2,3-二油基氧基)丙基)-N,N,N-三甲基氯化铵(DOTMA)、N,N-二甲基-2,3-二油基氧基)丙胺(DODMA)、1,2-二亚油烯基氧基(DiLinoleyloxy)-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚麻基氧基(Dilinolenyloxy)-N,N-二甲基氨基丙烷(DLenDMA)、1,2-二-γ-亚麻基氧基-N,N-二甲基氨基丙烷(γ-DLenDMA)、1,2-二亚油烯基氨基甲酰氧基-3-二甲基氨基丙烷(DLin-C-DAP)、1,2-二亚油烯基氧基(dilinoleyoxy)-3-(二甲基氨基)乙酰氧基丙烷(DLin-DAC)、1,2-二亚油烯基氧基-3-吗啉代丙烷(DLin-MA)、
1,2-二亚油酰基-3-二甲基氨基丙烷(DLinDAP)、1,2-二亚油烯基硫-3-二甲基氨基丙烷
(DLin-S-DMA)、1-亚油酰基-2-亚油烯基氧基-3-二甲基氨基丙烷(DLin-2-DMAP)、1,2-二亚油烯基氧基-3-三甲基氨基丙烷氯化物盐(DLin-TMA.Cl)、1,2-二亚油酰基-3-三甲基氨基
丙烷氯化物盐(DLin-TAP.Cl)、1,2-二亚油烯基氧基-3-(N-甲基哌嗪基)丙烷(DLin-MPZ)、或3-(N,N-二亚油烯基氨基)-1,2-丙二醇(DLinAP)、3-(N,N-二亚油烯基氨基)-1,2-丙二醇(DOAP)、1,2-二亚油烯基氧基-3-(2-N,N-二甲基氨基)乙氧基丙烷(DLin-EG-DMA)、2,2-二亚油烯基-4-二甲基氨基甲基-[1,3]-二氧戊环(DLin-K-DMA)或其类似物、(3aR,5s,6aS)-N,N-二甲基-2,2-二((9Z,12Z)-十八碳-9,12-二烯基)四氢-3αH-环戊[d][1,3]二氧戊环-
5-胺、(6Z,9Z,28Z,31Z)-三十七碳-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯(MC3)、
1,1’-(2-(4-(2-((2-(双(2-羟基十二烷基)氨基)乙基)(2-羟基十二烷基)氨基)乙基)哌
嗪-1-基)乙基氮烷二基)-二十二烷-2-醇(C12-200)、2,2-二亚油烯基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLin-K-C2-DMA)、2,2-二亚油烯基-4-二甲基氨基甲基-[1,3]-二氧戊环(DLin-K-DMA)、(6Z,9Z,28Z,31Z)-三十七碳-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯(DLin-M-C3-DMA)、3-((6Z,9Z,28Z,31Z)-三十七碳-6,9,28,31-四烯-19-基氧)-N,N-二甲基丙-1-胺(MC3醚)、4-((6Z,9Z,28Z,31Z)-三十七碳-6,9,28,31-四烯-19-基氧)-N,N-二甲基丁-1-胺(MC4醚)、或前述任意者的任何组合。
[0392] 其他阳离子脂质包括但不限于N,N-二硬脂基-N,N-二甲基溴化铵(DDAB)、3P-(N-(N′,N′-二甲基氨基乙烷)-氨基甲酰基)胆固醇(DC-Choi)、N-(1-(2,3-二油基氧基)丙基)-N-2-(精胺甲酰胺基)乙基)-N,N-二甲基三氟乙酸铵(DOSPA)、双十八烷基酰胺基甘氨酰基
羧基精胺(DOGS)、1,2-二油酰基-sn-3-磷酸乙醇胺(DOPE)、1,2-二油酰基-3-二甲基丙烷铵(DODAP)、N-(1,2-二肉豆蔻氧基丙-3-基)-N,N-二甲基-N-羟基乙基溴化铵(D RIE)和2,2-二亚油烯基-4-二甲基氨基乙基-[1,3]-二氧戊环(XTC)。另外、可以使用阳离子脂质的商业制剂,例如LIPOFECTIN(包括DOTMA和DOPE,可从GIBCO/BRL获得)和LIPOFECTAMINE(包括
DOSPA和DOPE,可从GIBCO/BRL获得)。
[0393] 其他合适的阳离子脂质被公开于国际公开号WO09/086558、WO09/127060、WO10/048536、WO10/054406、WO10/088537、WO10/129709和WO2011/153493;美国专利公开号2011/
0256175、2012/0128760和2012/0027803;美国专利号8,158,601;和Love等,PNAS,107(5),
1864-69,2010.[51]。其他合适的氨基脂质包括具有替代脂肪酸基团和其他二烷基氨基的
那些,包括其中烷基取代基不同的那些(例如N-乙基-N-甲基氨基-和N-丙基-N-乙基氨
基-)。一般,具有较少饱和酰基链的氨基脂质更容易设定尺寸,特别是当复合物必须被设定尺寸小于约0.3微米时——基于过滤器灭菌的目的。可以使用含有碳链长度在C14至C22范
围内的不饱和脂肪酸的氨基脂质。其他支架也可用于分离氨基脂质的氨基和脂肪酸或脂肪
烷基部分。
[0394] 在某些实施方式中,本发明的氨基或阳离子脂质具有至少一个可质子化或可去质子化的基团,使得脂质在生理pH(例如pH7.4)或以下的pH时带正电荷,并且在第二pH(优选
在生理pH或生理pH以上时)时为中性。当然,应该理解,质子的添加或去除,作为pH的函数,是平衡过程,并且带电或中性脂质的提及是指主要种类的性质,而不要求所有脂质以带电
或中性形式存在。具有多于一个可质子化或可去质子化的基团的脂质或两性离子型脂质不
被排除在本发明的使用之外。
[0395] 在某些实施方式中,可质子化脂质的可质子化基团的pKa在约4至约11范围内,例如pKa为约5至约7。
[0396] 脂质颗粒优选包含两种或更多种阳离子脂质。优选选择阳离子脂质以提供不同的有利性质。例如,可以在脂质纳米颗粒中使用性质如胺pKa、化学稳定性、循环半衰期、组织中的半衰期、组织中的净累积或毒性不同的阳离子脂质。具体地,可以选择阳离子脂质,使得混合脂质颗粒的性质比个体脂质的单脂质颗粒的性质更理想。
[0397] 阳离子脂质优选占颗粒中存在的总脂质的约20mol%至约70mol%或75mol%或约45mol%至约65mol%或约20、25、30、35、40、45、50、55、60、65或约70mol%。在另一个实施方式中,脂质纳米颗粒包含按摩尔计约25%至约75%的阳离子脂质,例如按摩尔计约20%至
约70%、约35%至约65%、约45%至约65%、约60%、约57.5%、约57.1%、约50%或约40%(基于脂质纳米颗粒中的100%脂质总摩尔数)。在一个实施方式中,阳离子脂质与核酸的比例为约3至约15,例如约5至约13或约7至约11。
[0398] 非阳离子脂质
[0399] 非阳离子脂质优选为中性脂质、阴离子脂质或两亲性脂质。中性脂质在存在时可以是在生理pH下以不带电或中性两性离子形式存在的多种脂质种类中的任意者。这种脂质
包括,例如,二酰基磷脂酰胆碱、二酰基磷脂酰乙醇胺、神经酰胺、鞘磷脂、二氢鞘磷脂、脑磷脂和脑苷脂。用于本文所述颗粒的中性脂质的选择一般通过考虑例如脂质颗粒大小和脂质
颗粒在血液中的稳定性来指导。优选地,中性脂质是具有两个酰基的脂质(例如,二酰基磷脂酰胆碱和二酰基磷脂酰乙醇胺)。在一个实施方式中,中性脂质含有碳链长度在C10至C20范围内的饱和脂肪酸。在另一个实施方式中,使用具有碳链长度在C10至C20范围内的单不
饱和或双不饱和脂肪酸的中性脂质。另外,可以使用具有饱和和不饱和脂肪酸链混合物的
中性脂质。
[0400] 合适的中性脂质包括但不限于,二硬脂酰胆碱(DSPC)、二油酰磷脂酰胆碱(DOPC)、二棕榈酰基磷脂酰胆碱(DPPC)、二油酰磷脂酰甘油(DOPG)、二棕榈酰磷脂酰甘油(DPPG)、二油酰磷脂酰乙醇胺(DOPE)、棕榈酰油酰磷脂酰胆碱(POPC)、棕榈酰油酰磷脂酰乙醇胺(POPE)、二油酰磷脂酰乙醇胺4-(N-来酰亚胺甲基)-环己烷-1-羧酸酯(DOPE-mal)、二棕
榈酰磷脂酰乙醇胺(DPPE)、二肉豆蔻酰磷酸乙醇胺(DMPE)、二肉豆蔻酰磷脂酰胆碱(DMPC)、二硬脂酰磷脂酰乙醇胺(DSPE)、SM、16-O-单甲基PE、16-O-二甲基PE、18-1-反式PE、1-硬脂酰基-2-油酰基-磷脂酰乙醇胺(SOPE)、胆固醇或其混合物。适用于本发明的脂质颗粒的阴
离子脂质包括但不限于磷脂酰甘油、心脂质、二酰基磷脂酰丝氨酸、二酰基磷脂酸、N-十二烷酰基磷脂酰乙醇胺、N-琥珀酰基磷脂酰乙醇胺、N-戊二酰基磷脂酰乙醇胺、赖氨酰磷脂酰甘油和加入中性脂质的其他阴离子修饰基团。
[0401] 术语“两亲性脂质”是指任何合适的材料,其中脂质材料的疏水部分定向到疏水相,而亲水部分定向到水相。这种化合物包括但不限于磷脂、氨基脂质和鞘类脂质。代表性的磷脂包括鞘磷脂、磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷脂酸、棕榈酰油酰磷脂酰胆碱、溶血磷脂酰胆碱、溶血磷脂酰乙醇胺、二棕榈酰磷脂酰胆碱、二油酰磷脂酰胆碱、二硬脂酰磷脂酰胆碱、或二油酰磷脂酰胆碱。也可以使用其他无磷化合物,例如鞘类脂质、鞘糖脂家族、二酰基甘油和β-酰氧基酸。
[0402] 非阳离子脂质优选为颗粒中存在的总脂质的约5mol%至约90mol%、约5mol%至约10mol%、约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85或约90mol%。在一个实施方式中,脂质纳米颗粒包含按摩尔计约0%至约15%或45%的中性脂质,例如约3%
至约12%或约5%至约10%。例如,脂质纳米颗粒可以包括按摩尔计约15%、约10%、约
7.5%或约7.1%的中性脂质(基于脂质纳米颗粒中100%脂质总摩尔数)。
[0403] 甾醇
[0404] 优选的甾醇是胆固醇。进一步设想本领域已知的其他甾醇用于本发明的环境中。
[0405] 甾醇优选占脂质颗粒的约10mol%至约60mol%或约25mol%至约40mol%。在一个实施方式中,甾醇是脂质颗粒中存在的总脂质的约10、15、20、25、30、35、40、45、50、55或约
60mol%。在另一个实施方式中,脂质纳米颗粒包含按摩尔计约5%至约50%的甾醇,例如按摩尔计约15%至约45%、约20%至约40%、约48%、约40%、约38.5%、约35%、约34.4%、约
31.5%或约31%(基于脂质纳米颗粒中100%脂质总摩尔数)。
[0406] 聚集减少剂
[0407] 聚集减少剂优选是能够减少聚集的脂质。这种脂质的实例包括但不限于聚乙二醇(PEG)修饰的脂质、单唾液酸神经节苷脂Gml和聚酰胺寡聚物(PAO),例如美国专利号6,320,
017中描述的那些,其整体通过引用并入。在配制过程中防止聚集的具有不带电的、亲水的、空间阻隔部分的其他化合物,如PEG、Gml或ATTA,也可以与脂质偶联。ATTA-脂质被描述于例如美国专利号6,320,017中,并且PEG-脂质缀合物被描述于例如美国专利号5,820,873、5,
534,499和5,885,613中,其均整体通过引用并入。
[0408] 聚集减少剂可以是例如聚乙二醇(PEG)-脂质,包括但不限于PEG-二酰基甘油(DAG)、PEG-二烷基甘油、PEG-二烷氧基丙基(DAA)、PEG-磷脂、PEG-神经酰胺(Cer)或其混合物(例如PEG-Cerl4或PEG-Cer20)。PEG-DAA缀合物可以是例如PEG-二月桂氧基丙基(C12)、
PEG-二肉豆蔻氧基丙基(C14)、PEG-二棕榈氧基丙基(C16)、或PEG-二硬脂氧基丙基(C18)。
其他聚乙二醇化脂质包括但不限于聚乙二醇-二肉豆蔻酰基甘油(C14-PEG或PEG-C14,其中
PEG具有2000Da的平均分子量)(PEG-DMG);(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基氨基甲酸酯)(PEG-DSG);PEG-氨基甲酰基-1,2-二肉豆蔻氧基丙胺,其中
PEG的平均分子量为2000Da(PEG-cDMA);N-乙酰基半乳糖胺-((R)-2,3-双(十八烷氧基)丙
基-1-(甲氧基聚(乙二醇)2000)丙基氨基甲酸酯))(GalNAc-PEG-DSG);mPEG(mw2000)-二硬
脂酰磷脂酰乙醇胺(PEG-DSPE);和聚乙二醇-二棕榈酰甘油(PEG-DPG)。在一个实施方式中,聚集减少剂是PEG-DMG。在另一个实施方式中,聚集减少剂是PEG-c-DMA。
[0409] 脂质体制剂可受以下影响,但不限此:阳离子脂质组分的选择、阳离子脂质饱和度、PEG化的性质、所有组分的比例和生物物理参数如大小。在Semple等(Semple等Nature Biotech.2010 28:172-176;其整体通过引用并入本文)的一个实例中,脂质体制剂由
57.1%阳离子脂质、7.1%二棕榈酰磷脂酰胆碱、34.3%胆固醇和1.4%PEG-c-DMA构成。作为另一个实例,改变阳离子脂质的组成可以更有效地将siRNA递送至各种抗原呈递细胞
(Basha等Mol Ther.2011 19:2186-2200;其整体通过引用并入本文)。在一些实施方式中,脂质体制剂可包含约35至约45%的阳离子脂质、约40%至约50%的阳离子脂质、约50%至
约60%的阳离子脂质和/或约55%至约65%的阳离子脂质。在一些实施方式中,脂质体中脂质与mRNA的比例可以为约5∶1至约20∶1、约10∶1至约25∶1、约15∶1至约30∶1和/或至少30∶1。
[0410] PEG修饰的脂质中PEG部分的平均分子量优选在约500至约8,000道尔顿范围内(例如,约1,000至约4,000道尔顿)。在一个优选的实施方式中,PEG部分的平均分子量为约2,
000道尔顿。
[0411] 聚集减少剂的浓度优选为基于脂质颗粒中的100%脂质总摩尔数,约0.1mol%至约15mol%。在一个实施方式中,制剂包含基于脂质颗粒中的脂质总摩尔数少于约3、2或1摩尔%的PEG或PEG修饰脂质。
[0412] 在另一个实施方式中,脂质纳米颗粒包含按摩尔计约0.1%至约20%的PEG修饰脂质,例如按摩尔计约0.5至约10%、约0.5至约5%、约10%、约5%、约3.5%、约1.5%、约
0.5%或约0.3%(基于脂质纳米颗粒中100%脂质总摩尔数)。
[0413] 脂质纳米颗粒(LNP)
[0414] 如本文所用的脂质纳米颗粒优选具有脂质体的结构。脂质体是含脂质膜包封水性内部的结构。脂质体优选具有一个或多个脂质膜。脂质体优选是单层的——称为单层型,或多层的——称为多层型。当与核酸复合时,脂质颗粒还可以是脂质复合物,其由夹在DNA层之间的阳离子脂质双层构成。脂质体可以进一步具有不同的尺寸,例如但不限于多层囊泡
(MLV)——其可以直径为数百纳米并且可以包含被狭窄水性隔室分隔的一系列同心双层、
小单细胞囊泡(SUV)——其可以直径小于50nm、和大单层囊泡(LUV)——其可以直径在50nm
和500nm之间。脂质体设计优选包括但不限于调理素或配体,以提高脂质体对不健康组织的附着或激活事件如但不限于内吞作用。脂质体可含有低pH或高pH,以提高药物制剂的递送。
[0415] 作为非限制性实例,脂质体,如合成膜囊泡,可以通过美国专利公开号US20130177638、US20130177637、US20130177636、US20130177635、US20130177634、
US20130177633、US20130183375、US20130183373和US20130183372中描述的方法、设备和装置来制备,其全部内容通过引用并入本文。核酸可以被脂质体包封,和/或其可以被包含在含水性核中,该水性核可以然后被脂质体包封(参见国际公开号WO2012/031046、WO2012/
031043、WO2012/030901和WO2012/006378以及美国专利公开号US20130189351、
US20130195969和US20130202684;其全部内容均通过引用并入本文中。
[0416] 在另一个实施方式中,RNA优选被配制在阳离子水包油乳液中,其中乳液颗粒包含油核和阳离子脂质,该阳离子脂质可以与多核苷酸相互作用,将该分子锚定至乳液颗粒(参见国际公开号WO2012/006380;其整体通过引用并入本文)。在一个实施方式中,RNA可以被配制在油包水乳液中,所述油包水乳液包含连续疏水相,其中分散着亲水相。
[0417] 在一个实施方式中,RNA(药物)组合物被配制在脂质体中,例如但不限于DiLa2脂质体(Marina Biotech,Bothell,WA)、 (Marina Biotech,Bothell,WA)、中
性DOPC(1,2-二油酰基-sn-甘油-3-磷酸胆碱)系脂质体(例如,用于卵巢癌的siRNA递送
(Landen等Cancer Biology&Therapy 2006 5(12)1708-1713);其整体通过引用并入本文)
和透明质酸涂覆型脂质体(Quiet Therapeutics,Israel)。
[0418] 在另一个实施方式中,脂质纳米颗粒的中值直径尺寸为约50nm至约300nm,例如约50nm至约250nm,例如约50nm至约200nm。
[0419] 在一些实施方式中,使用较小的LNP递送RNA。这种颗粒可以包括从0.1pm以下上至100nm的直径,例如但不限于,小于0.1μm、小于1.0μm、小于5μm、小于10μm、小于15μm、小于20μm、小于25μm、小于30μm、小于35μm、小于40μm、小于50μm、小于55μm、小于60μm、小于65μm、小于70μm、小于75μm、小于80μm、小于85μm、小于90μm、小于95μm、小于100μm、小于125μm、小于
150μm、小于175μm、小于200μm、小于225μm、小于250μm、小于275μm、小于300μm、小于325μm、小于350μm、小于375μm、小于400μm、小于425μm、小于450μm、小于475μm、小于500μm、小于525μm、小于550μm、小于575μm、小于600μm、小于625μm、小于650μm、小于675μm、小于700μm、小于
725μm、小于750μm、小于775μm、小于800μm、小于825μm、小于850μm、小于875μm、小于900μm、小于925μm、小于950μm、小于975μm。在另一个实施方式中,使用较小的LNP递送RNA,该LNP可包括如下直径:约1nm至约100nm、约1nm至约10nm、约1nm至约20nm、约1nm至约30nm、约1nm至约40nm、约1nm至约50nm、约1nm至约60nm、约1nm至约70nm、约1nm至约80nm、约1nm至约90nm、约5nm至约from 100nm、约5nm至约10nm、约5nm至约20nm、约5nm至约30nm、约5nm至约40nm、约5nm至约50nm、约5nm至约60nm、约5nm至约70nm、约5nm至约80nm、约5nm至约90nm、约10nm至约50nm、约20nm至约50nm、约30nm至约50nm、约40nm至约50nm、约20nm至约60nm、约30nm至约60nm、约40nm至约60nm、约20nm至约70nm、约30nm至约70nm、约40nm至约70nm、约50nm至约
70nm、约60nm至约70nm、约20nm至约80nm、约30nm至约80nm、约40nm至约80nm、约50nm至约
80nm、约60nm至约80nm、约20nm至约90nm、约30nm至约90nm、约40nm至约90nm、约50nm至约
90nm、约60nm至约90nm和/或约70nm至约90nm。
[0420] 在一个实施方式中,脂质纳米颗粒的直径大于100nm、大于150nm、大于200nm、大于250nm、大于300nm、大于350nm、大于400nm、大于450nm、大于500nm、大于550nm、大于600nm、大于650nm、大于700nm、大于750nm、大于800nm、大于850nm、大于900nm、大于950nm或大于
1000nm。
[0421] 在另一个实施方式中,本发明制剂中的脂质纳米颗粒具有单峰粒度分布(single mode particle size distribution)(即,其不是双峰或多峰型)。
[0422] 脂质纳米颗粒优选还包含除上述那些之外的一种或多种脂质和/或其他组分。脂质体组合物中可包含其他脂质,用于各种目的,例如防止脂质氧化或将配体连接到脂质体
表面上。脂质颗粒中可存在多种脂质中的任意者,包括两亲性、中性、阳离子型和阴离子型脂质。这些脂质可以单独或组合使用。
[0423] 可存在于脂质颗粒中的其他组分包括双层稳定化组分,例如聚酰胺寡聚物(参见,例如,美国专利号6,320,017,其整体通过引用并入)、肽、蛋白质和洗涤剂
[0424] 具有按摩尔计(基于脂质纳米颗粒中的脂质总摩尔数)不同摩尔比的阳离子脂质、非阳离子(或中性)脂质、甾醇(例如胆固醇)和聚集还原剂(例如PEG修饰的脂质)的不同脂
质纳米颗粒被提供于下表2中。
[0425] 表2:示例性脂质纳米颗粒组合物
[0426]
[0427]
[0428] 在一个实施方式中,脂质与RNA的重量比为至少约0.5∶1、至少约1∶1、至少约2∶1、至少约3∶1、至少约4∶1、至少约5∶1、至少约6∶1、至少约7∶1、至少约11∶1、至少约20∶1、至少约25∶1、至少约27∶1、至少约30∶1、或至少约33∶1。在一个实施方式中,脂质与RNA的重量比为约1∶1至约35∶1、约3∶1至约15∶1、约4∶1至约15∶1、或约5∶1至约13∶1或约25∶1至约33∶1。在一个实施方式中,脂质与RNA的重量比为约0.5∶1至约12∶1。
[0429] 在一个实施方式中,本发明的RNA可以被包封在治疗性纳米颗粒中,其在本文中称为“治疗性纳米颗粒核酸”。治疗性纳米颗粒可通过本文所述和本领域已知的方法配制,例如但不限于国际公开号WO2010/005740、WO2010/030763、WO2010/005721、WO2010/005723、WO2012/054923、美国专利号US20110262491、US20100104645、US20100087337、
US20100068285、US20110274759、US20100068286、US20120288541、US20130123351和
US20130230567以及美国专利号8,206,747、8,293,276、8,318,208和8,318,211;其全部内容通过引用并入本文。在另一个实施方式中,治疗性聚合物纳米颗粒可通过美国公开号
US20120140790中描述的方法鉴定,其内容整体通过引用并入本文。
[0430] 在一个实施方式中,根据本发明的RNA可以被包封在合成纳米运载体中,与合成纳米运载体连接和/或缔合。合成纳米运载体包括但不限于国际公开号WO2010/005740、
WO2010/030763、WO2012/135010、WO2012/149252、WO2012/149255、WO2012/149259、WO2012/
149265、WO2012/149268、WO2012/149282、WO2012/149301、WO2012/149393、WO2012/149405、WO2012/149411、WO2012/149454和WO2013/019669以及美国公开号US20110262491、
US20100104645、US20100087337和US2012244222中描述的那些,其均整体通过引用并入本
文。可以使用本领域已知和/或本文描述的方法配制合成纳米运载体。作为非限制性实例,合成纳米运载体可以通过国际公开号WO2010/005740、WO2010/030763和WO2012/135010以
及美国公开号US20110262491、US20100104645、US20100087337和US2012244222中描述的方法配制,其均整体通过引用并入本文。在另一个实施方式中,合成纳米运载体制剂可以通过国际公开号WO2011/072218和美国专利号8,211,473的方法冻干;其全部内容通过引用并入
本文。在另一个实施方式中,本发明的制剂——其包括但不限于合成纳米运载体——可以
通过美国专利公开号US20130230568中描述的方法冻干或重构,其内容整体通过引用并入
本文。
[0431] 在一个实施方式中,利用国际专利公开号WO2013/063468或美国专利号8,440,614(其整体通过引用并入本文)中描述的药物包封微球,本发明的RNA被配制用于递送。
[0432] 根据优选的实施方式,根据本发明的RNA可以被配制以靶向特定组织或器官。具体地,根据本发明的RNA或与该RNA一起配制的药物运载体优选与靶向基团形成缀合物。所述
靶向基团优选将缀合物,优选包含RNA的缀合物,靶向特定组织或器官。换句话说,通过将根据本发明的RNA与靶向基团缀合(直接缀合,通过形成RNA-靶向基团缀合物;或间接缀合,通过形成存在于复合物中的药物运载体的靶向基团与根据本发明的RNA的缀合物),由于所述
靶向基团靶向特定组织或器官,RNA被递送至该特定组织或器官。最优选地,靶向基团提供向肝组织,优选向肝巨噬细胞、肝细胞和/或肝窦内皮细胞(LSEC)的递送。在此环境中,靶向基团优选选自叶酸基、GalNAe、半乳糖、甘露糖、甘露糖-6P、适配体(aptamers)、整联蛋白受体配体、趋化因子受体配体、转铁蛋白、生物素、血清素受体配体、PSMA、内皮素、GCPII、生长抑素、LDL配体和HDL配体。可以应用于本发明RNA的适于靶向递送至肝脏的方法还被描述于Bartneck等(Bartneck等:Therapeutic targeting of liver inflammation and 
fibrosis by nanomedicine.Hepatobiliary Surgery and Nutrition 2014;3(6):364-
376),其公开内容以其整体并入本文。
[0433] 在另一个实施方式中,可以配制脂质体或LNP用于靶向递送。优选地,配制脂质体或LNP用于靶向递送根据本发明的RNA至肝脏,优选肝脏巨噬细胞、肝细胞和/或肝窦内皮细胞(LSEC)。用于靶向递送的脂质体或LNP可包括但不限于本文所述的脂质体或LNP。
[0434] 本发明的RNA优选形成缀合物,例如RNA与运载体或靶向基团共价连接,优选如本文所述,以提供靶向递送。可选地,根据本发明的RNA可以编码融合蛋白,例如具有与本文所述的肽或蛋白质融合的靶向基团,然后将该肽或蛋白质靶向至特定组织或器官,优选肝脏。
[0435] 缀合物优选包括靶向基团,例如细胞或组织靶向剂,例如凝集素、糖蛋白、脂质或蛋白质,例如抗体,其结合指定细胞类型如肝细胞。靶向基团可以是促甲状腺激素、促黑素细胞激素、凝集素、糖蛋白、表面活性蛋白A、粘蛋白碳水化合物、多价乳糖、多价半乳糖、N-乙酰基-半乳糖胺、N-乙酰基-葡糖胺、多价甘露糖、多价岩藻糖、糖基化聚氨基酸、多价半乳糖、转铁蛋白、二膦酸基、聚谷氨酸基、聚天冬氨酸基、脂质、胆固醇、类固醇、胆汁酸、叶酸基、维生素B12、生物素、RGD肽、RGD肽模拟物或适配体。
[0436] 靶向基团还可以是蛋白质,例如糖蛋白;或肽,例如对共配体(co-ligand)具有特异性亲和力的分子;或抗体,例如与指定细胞类型如肝细胞结合的抗体。靶向基团还可包括激素和激素受体。其还可以包括非肽种类,例如脂质、凝集素、碳水化合物、维生素、辅因子、多价乳糖、多价半乳糖、N-乙酰基-半乳糖胺、N-乙酰基-葡糖胺、多价甘露糖、多价岩藻糖或适配体。配体可以是,例如,脂多糖、或p38 MAP激酶激活剂。
[0437] 靶向基团优选是能够靶向特定受体的配体。实例包括但不限于叶酸基、GalNAc、半乳糖、甘露糖、甘露糖-6P、适配体、整联蛋白受体配体、趋化因子受体配体、转铁蛋白、生物素、血清素受体配体、PSMA、内皮素、GCPII、生长抑素、LDL和HDL配体。在具体实施方式中,靶向基团是适配体。优选地,适配体是未修饰的或具有本文公开的任何修饰组合。
[0438] 在优选的实施方式中,根据本发明的组合物包含根据本发明的RNA,该RNA与阳离子或聚阳离子化合物和/或与聚合物运载体一起配制。因此,在本发明的进一步实施方式
中,优选本文限定的RNA或本发明(药物)组合物中包含的任何其他核酸与阳离子或聚阳离
子化合物或聚合物运载体缔合或复合,任选地核酸与阳离子或聚阳离子化合物和/或聚合
物运载体的重量比选自下列范围:约6∶1(w/w)至约0.25∶1(w/w),更优选约5∶1(w/w)至约
0.5∶1(w/w),甚至更优选约4∶1(w/w)至约1∶1(w/w)或约3∶1(w/w)至约1∶1(w/w),最优选mRNA或约3∶1(w/w)至约2∶1(w/w)的比例;或任选地,mRNA或核酸与阳离子或聚阳离子化合物和/或聚合物运载体的氮/磷酸基(N/P)比为约0.1-10,优选在约0.3-4或0.3-1的范围内,最优选在约0.5-1或0.7-1的范围内,甚至最优选在约0.3-0.9或0.5-0.9的范围内。更优选
地,RNA与一种或多种聚阳离子的N/P比例在约0.1至10的范围内,包括约0.3至4、约0.5至2、约0.7至2和约0.7到1.5的范围。
[0439] 其中,本文限定的RNA或包含在根据本发明的(药物)组合物中的任何其他核酸还可以与媒介物、转染或复合剂缔合,以增加根据本发明的RNA或任选地包含的进一步包括的核酸的转染效率和/或表达。
[0440] 在此环境中作为特别优选试剂的阳离子或聚阳离子化合物包括鱼精蛋白、核仁素(nucleoline)、精胺或亚精胺、或其他阳离子肽或蛋白质如聚-L-赖氨酸(PLL)、聚精氨酸、碱性多肽、细胞穿透肽(CPPs)——包括HIV结合肽、HIV-1Tat(HIV)、Tat衍生肽、穿透素、VP22衍生或类似肽、HSV VP22(单纯疱疹)、MAP、KALA或蛋白转导结构域(PTD)、PpT620、富脯氨酸肽、富精氨酸肽、富赖氨酸肽、MPG-肽(一种或多种)、Pep-1、L-寡聚体、降钙素肽(一种或多种)、触足基因(Antennapedia)衍生肽(具体地来自果蝇触角科(Drosophila 
antennapedia))、pAntp、pIsl、FGF、乳铁蛋白、Transportan、Buforin-2、Bac715-24、SynB、SynB(1)、pVEC、hCT衍生肽、SAP或组蛋白。更优选地,根据本发明的RNA与一种或多种聚阳离子复合,优选与鱼精蛋白或oligofectamine,最优选与鱼精蛋白复合。在此环境下,鱼精蛋白是特别优选的。
[0441] 另外,优选的阳离子或聚阳离子蛋白质或肽可选自具有以下总式(III)的以下蛋白质或肽:
[0442] (Arg)1;(Lys)m;(His)n;(Orn)o;(Xaa)x,(式(III))
[0443] 其中l+m+n+o+x=8-15,和l、m、n或o彼此独立地可以是选自0、1、2、3、4、5、6、7、8、9、10、11、12、13、14或15的任何数字,条件是Arg、Lys、His和Orn的总含量是寡肽所有氨基酸的至少50%;并且Xaa可以是选自Arg、Lys、His或Orn之外的天然(=天然存在的)或非天然氨基酸的任何氨基酸;并且x可以是选自0、1、2、3或4的任何数字,条件是Xaa的总含量不超过寡肽所有氨基酸的50%。在此环境中特别优选的阳离子肽是例如Arg7、Arg8、Arg9、H3R9、R9H3、H3R9H3、YSSR9SSY、(RKH)4、Y(RKH)2R等。在此环境中,WO2009/030481的公开内容通过引用并入本文。
[0444] 可用作转染或复合剂的进一步优选的阳离子或聚阳离子化合物可包括阳离子多糖,例如壳聚糖、聚凝胺、阳离子聚合物例如聚乙烯亚胺(PEI)、阳离子脂质例如DOTMA:[1-(2,3-二油基氧基)丙基)]-N,N,N-三甲基氯化铵、DMRIE、二-C14-脒、DOTIM、SAINT、DC-Chol、BGTC、CTAP、DOPC、DODAP、DOPE:二油基磷脂酰乙醇胺、DOSPA、DODAB、DOIC、DMEPC、DOGS:双十八烷基酰胺基甘氨酰基精胺、DIMRI:二肉豆蔻酰氧基丙基二甲基羟乙基溴化铵、DOTAP:二油酰氧基-3-(三甲基氨基(ammonio))丙烷、DC-6-14:O,O-双十四烷酰N-(α-三甲基氨基乙酰基)二乙醇胺氯、CLIP1:rac-[(2,3-双十八烷氧基丙基)(2-羟乙基)]-二甲基氯化铵、CLIP6:rac-[2(2,3-双十六烷氧基丙氧基甲氧基)乙基]三甲基铵、CLIP9:rac-[2(2,
3-双十六烷氧基丙氧基琥珀酰氧基)乙基]-三甲基铵、oligofectamine、或阳离子或聚阳离子聚合物,例如修饰聚氨基酸如β-氨基酸-聚合物或反向聚酰胺等、修饰聚乙烯如PVP(聚
(N-乙基-4-乙烯基溴化吡啶鎓))等、修饰丙烯酸酯如pDMAEMA(聚(二甲基氨基乙基甲基丙
烯酸酯))等、修饰酰氨基胺如pAMAM(聚(酰氨基胺))等、修饰聚β氨基酯(PBAE)如二胺末端修饰的1,4-丁二醇二丙烯酸-共-5-氨基-1-戊醇聚合物等、树枝状聚合物如聚丙胺树枝状
聚合物或pAMAM系树枝状聚合物等、聚亚胺如PEI:聚(乙烯亚胺)、聚(丙烯亚胺)等、聚烯丙胺、糖骨架系聚合物如环糊精系聚合物、葡聚糖系聚合物、壳聚糖等,烷骨架系聚合物如PMOXA-PDMS共聚物等、由一个或多个阳离子嵌段(例如选自如上所述的阳离子聚合物)的和
一个或多个亲水或疏水嵌段(例如聚乙二醇)的组合组成的嵌段聚合物;等等。
[0445] 根据优选的实施方式,本发明的组合物包含本文限定的RNA和聚合物运载体。根据本发明使用的聚合物运载体可以是由二硫交联的阳离子组分形成的聚合物运载体。二硫化
物交联的阳离子组分可以彼此相同或不同。聚合物运载体还可含有其他组分。还特别优选
的是,根据本发明使用的聚合物运载体包含阳离子肽、蛋白质或聚合物和任选地本文限定
的其他组分的混合物,其如本文所述通过二硫键交联。在此环境中,WO2012/013326的公开内容通过引用并入本文。
[0446] 在此环境中,通过二硫交联形成聚合物运载体基础的阳离子组分一般选自适合于此目的的任何合适的阳离子或聚阳离子肽、蛋白质或聚合物,具体地能够复合本文限定的
RNA或包含在组合物中的另外的核酸从而优选缩合该RNA或核酸的任何阳离子或聚阳离子
肽、蛋白质或聚合物。阳离子或聚阳离子肽、蛋白质或聚合物优选是线性分子,然而,也可以使用分支的阳离子或聚阳离子肽、蛋白质或聚合物。
[0447] 可用于复合根据本发明的RNA或包含在本发明的(药物)组合物中的任何其他核酸的聚合物运载体的各二硫交联的阳离子或聚阳离子蛋白质、肽或聚合物含有至少一个-SH-
部分,最优选至少一个半胱氨酸残基或任何其他呈现-SH-部分的化学基团,其能够在与如
本文所述作为聚合物运载体的阳离子组分的至少一个另外的阳离子或聚阳离子蛋白质、肽
或聚合物缩合时形成二硫连接。
[0448] 如上所限定,可以用于复合本发明的RNA或包含在根据本发明的(药物)组合物中的任何其他核酸的聚合物运载体可以由二硫交联阳离子(或聚阳离子)组分形成。优选地,
包含或经另经修饰包含至少一个-SH-部分的聚合物运载体的这种阳离子或聚阳离子肽或
蛋白质或聚合物选自如本文关于复合剂限定的蛋白质、肽和聚合物。
[0449] 在进一步具体实施方式中,可用于复合本文所限定的RNA或包含在根据本发明的(药物)组合物中的任何其他核酸的聚合物运载体可选自根据通式(IV)的聚合物运载体分
子:
[0450] L-P1-S-[S-P2-S]n-S-P3-L  通式(IV)
[0451] 其中,
[0452] P1和P3彼此不同或相同,并且表示线性或分支亲水聚合物链、各P1和P3呈现至少一个-SH-部分,能够在与组分P2或可选地与(AA)、(AA)x或[(AA)x]z(如果这种组分用作P1和P2或P3和P2之间的连接体)和/或与其他组分(例如,(AA)、(AA)x、[(AA)x]z或L)缩合时形成二硫连接,线性或分支亲水聚合物链彼此独立地选自聚乙二醇(PEG)、聚-N-(2-羟丙基)甲基丙烯酰胺、聚-2-(甲基丙烯酰氧基)乙基磷酰胆碱、聚(羟烷基L-天冬酰胺)、聚(2-(甲基丙烯酰氧基)乙基磷酰胆碱)、羟乙基淀粉或聚(羟烷基L-谷氨酰胺),其中亲水聚合物链呈现分
子量为约1kDa至约100kDa,优选约2kDa至约25kDa;或者更优选约2kDa至约10kDa,例如约约
5kDa至约25kDa或5kDa至约10kDa;
[0453] P2是阳离子或聚阳离子肽或蛋白质,例如,如上关于由二硫交联阳离子组分形成的聚合物运载体所定义,并且优选具有约3至约100个氨基酸的长度,更优选具有约3至约50个氨基酸的长度,甚至更优选具有约3至约25个氨基酸的长度,例如约3至10、5至15、10至20或15至25个氨基酸的长度,更优选约5至约20的长度,甚至更优选约10至约20的长度;或
[0454] 是阳离子或聚阳离子聚合物,例如,如上关于由二硫交联阳离子组分形成的聚合物运载体所定义,一般具有约0.5kDa至约30kDa的分子量,包括约1kDa至约20kDa的分子量,甚至更优选约1.5kDa至约10kDa,或者具有约0.5kDa至约100kDa的分子量,包括约10kDa至
约50kDa的分子量,甚至更优选约10kDa至约30kDa的分子量;
[0455] 各P2呈现至少两个-SH-部分,能够在与其他组分P2或组分P1和/或P3或可选地与其他组分(例如,(AA)、(AA)x或[(AA)x]z)缩合时形成二硫连接;
[0456] -S-S-使(可逆的)二硫键(括号被省略以便更易读),其中S优选表示已形成(可逆的)二硫键的硫或带有-SH的部分。(可逆的)二硫键优选通过任一组分P1和P2、P2和P2或P2和P3或任选地本文限定的其他组分(例如L、(AA)、(AA)x、[(AA)x]z等)的-SH-部分的缩合而形成;-SH-部分可以是这些组分的结构一部分,或如下定义通过修饰被添加;
[0457] L是可选的配体,其可以存在或不存在,并且可以彼此独立地选自RGD、转铁蛋白、叶酸基、信号肽或信号序列、定位信号或序列、核定位信号或序列(NLS)、抗体、细胞穿透肽(例如TAT或KALA)、受体配体(例如细胞因子、激素、生长因子等)、小分子(例如碳水化合物,如甘露糖或半乳糖或合成配体)、小分子激动剂、受体抑制剂或拮抗剂(例如RGD肽模拟物类似物)、或本文定义的任何其他蛋白质等;
[0458] n是整数,一般选自约1至50的范围,优选约1、2或3至30的范围,更优选约1、2、3、4或5至25的范围,或约1、2、3、4或5至20的范围,或约1、2、3、4或5至15的范围,或约1、2、3、4或5至10的范围,包括例如约4至9、4至10、3至20、4至20、5至20或10至20的范围,或约3至15、4至15、5至15或10至15的范围,或约6至11或7至10的范围。最优选地,n在约1、2、3、4或5至10的范围内,更优选在约1、2、3或4至9的范围内,在约1、2、3或4至8的范围内,或在约1、2或3至
7的范围内。
[0459] 在此环境中,WO2011/026641的公开内容通过引用并入本文。各亲水性聚合物P1和P3一般呈现至少一个-SH-部分,其中至少一个-SH-部分能够在与组分P2或与组分(AA)或
(AA)x(如果用作如下定义的P1和P2或P3和P2之间的连接体)以及任选地与其他组分例如L和/或(AA)或(AA)x(例如如果含有两个或更多个-SH-部分)反应时形成二硫连接。上文通式
1 2 2 3 1 3
(IV)中的下列子式“P-S-S-P”和“P-S-S-P”(括号被省略以便更易读)——其中S、P 和P
中的任意者如不本文限定——一般表示这样的情况:其中亲水性聚合物P1和P3的一个-SH-
部分与上文通式(IV)中的组分P2的一个-SH-部分缩合,其中这些-SH-部分的两个硫形成式
(IV)中如本文所定义的二硫键-S-S-。这些-SH-部分一般由各亲水性聚合物P1和P3提供,例如通过内部半胱氨酸或带有-SH-部分的任何其他(修饰的)氨基酸或化合物。因此,子式
“P1-S-S-P2”和“P2-S-S-P3”也可以写成“P1-Cys-Cys-P2”,和“P2-Cys-Cys-P3”——如果-SH-部分由半胱氨酸提供,其中术语Cys-Cys表示通过二硫键而不是通过肽键偶联的两个半胱
氨酸。在此环境中,这些式中的术语“-S-S-”也可以写成“-S-Cys”、“-Cys-S”或“-Cys-Cys-”。在此环境中,术语“-Cys-Cys-”不表示肽键,而是表示两个半胱氨酸通过其-SH-部分连接以形成二硫键。因此,术语“-Cys-Cys-”总体上也可理解为“-(Cys-S)-(S-Cys)-”,其中在此具体情况下,S表示半胱氨酸的-SH-部分的硫。同样,术语“-S-Cys”和“-Cys-S”表示含-SH-部分和半胱氨酸之间的二硫键,其也可以写成“-S-(S-Cys)”和“-(Cys-S)-S-”。或者,亲水性聚合物P1和P3可以用-SH-部分修饰,优选通过与带有-SH-部分的化合物化学反应,使得各亲水性聚合物P1和P3带有至少一个这样的-SH-部分。这种带有-SH-部分的化合物可以是
例如(另外的)半胱氨酸或携带-SH-部分的任何进一步(修饰的)氨基酸。这种化合物也可以
是任何非氨基化合物或部分,其含有-SH-部分或允许将-SH-部分引入本文限定的亲水性聚
合物P1和P3。这种非氨基化合物可被附接根据本发明的聚合物运载体的式(IV)的亲水性聚
合物P1和P3——通过化学反应或化合物结合,例如通过3-硫代丙酸或thioimolane结合,通过酰胺形成(例如羧酸、磺酸、胺等),通过迈克尔(Micheal)加成(例如马来酰亚胺部分、α,β-不饱和羰基等),通过点击化学(通过叠氮化物或炔),通过烯烃/炔烃易位(例如烯烃或炔烃)、亚胺或腙形成(或酮、肼、羟胺、胺)、复合反应(卵白素、生物素、蛋白G)或允许Sn型取代反应的组分(例如卤代烷、硫醇、醇、胺、肼、酰肼、磺酸酯、氧鏻盐(oxyphosphonium salts))或可用于附接其他组分的其他化学部分。在此环境中特别优选的PEG衍生物是α-甲氧基-ω-巯基聚(乙二醇)。在各情况下,-SH-部分,例如半胱氨酸或任何其他(修饰的)氨基酸或化合物的-SH-部分,可以存在于亲水性聚合物P1和P3的末端或内部任何位置。本文限
定,各亲水性聚合物P1和P3一般呈现至少一个-SH-部分。优选在一个末端处,但也可以含有两个甚至更多个-SH-部分,其可以用于另外附接本文限定的其他组分,优选其他功能肽或
蛋白质,例如,配体、氨基酸组分(AA)或(AA)x、抗体、细胞穿透肽或增强肽(例如,TAT、KALA)等。
[0460] 优选地,本发明的组合物包含与一种或多种聚阳离子复合的至少一种本文限定的RNA、和至少一种游离RNA,其中所述至少一种复合的RNA优选与所述至少一种游离RNA相同。
在此环境中,特别优选本发明的组合物包含根据本发明的RNA,该RNA至少部分与阳离子或
聚阳离子化合物和/或聚合物运载体,优选阳离子蛋白质或肽复合。在此环境中,WO2010/
037539和WO2012/113513的公开内容通过引用并入本文。部分意指仅部分本文限定的RNA在
本发明的组合物中与阳离子化合物复合,并且本文限定的RNA的其余部分(被包含在本发明
的(药物)组合物中)为非复合形式(“游离”)。优选地,复合RNA与游离RNA的摩尔比选自约
0.001∶1至约1∶0.001的摩尔比,包括约1∶1的比例。更优选地,复合RNA与游离RNA的比例(在本发明的(药物)组合物中)选自约5∶1(w/w)至约1∶10(w/w)的范围,更优选约4∶1(w/w)至约
1∶8(w/w)的范围,甚至更优选约3∶1(w/w)至约1∶5(w/w)的范围或1∶3(w/w),最优选本发明药物组合物中复合mRNA与游离mRNA的比例选自约1∶1(w/w)的比例。
[0461] 根据本发明的(药物)组合物中的复合RNA优选按照第一步通过如下来制备:将根据本发明的RNA与阳离子或聚阳离子化合物和/或与聚合物运载体(优选如本文限定)以形
成稳定复合物的特定比例复合。在此环境中,高度优选的是,在复合RNA后,没有游离的阳离子或聚阳离子化合物或聚合物运载体或仅有其可忽略少量残留在复合RNA的组分中。因此,RNA和阳离子或聚阳离子化合物和/或聚合物运载体在复合RNA组分中的比例一般选择在一
定范围内,使得RNA完全复合并且没有游离的阳离子或聚阳离子化合物或聚合物运载体或
只有其可忽略少量残留在组合物中。
[0462] 优选地,本文限定的RNA与阳离子或聚阳离子化合物和/或聚合物运载体(优选如本文限定)的比例选自以下范围:约6∶1(w/w)至约0.25∶1(w/w),更优选约5∶1(w/w)至约0.5∶1(w/w),甚至更优选约4∶1(w/w)至约1∶1(w)/w)或约3∶1(w/w)至约1∶1(w/w),最优选约3∶1(w/w)至约2∶1(w/w)的比例。或者,关于复合物中RNA:阳离子或聚阳离子化合物和/或聚合物运载体(优选如本文限定)的比例,复合mRNA组分中本文所限定的RNA与阳离子或聚阳离
子化合物和/或聚合物运载体(优选如本文限定)的比例也可以基于整个复合体的氮/磷酸
基比例(N/P比例)计算。在本发明的环境中,N/P比优选在约0.1至10的范围内,优选在约0.3至4的范围内,最优选在约0.5至2或0.7至2的范围内,最优选在约0.7至1.5、0.5至1或0.7至
1的范围内,甚至最优选在约0.3至0.9或0.5至0.9的范围内,优选条件是复合物中的阳离子或聚阳离子化合物是如上限定的阳离子或聚阳离子蛋白质或肽和/或聚合物运载体。
[0463] 在其他实施方式中,包含本文限定的RNA的根据本发明的组合物可以被裸露给予而不与任何其他媒介物、转染或复合剂结合。
[0464] 必须理解和认识到,根据本发明,本发明的组合物可包含至少一种裸露的本文限定的RNA,优选mRNA,和/或至少一种本文限定的配制/复合的RNA,优选mRNA,其中可以采用如上公开的各配制/和/或复合。
[0465] 在其中(药物)组合物包含多于一个RNA种类的实施方式中,这些RNA种类可被提供,使得例如两种、三种、四种、五种、六种、七种、八种、九种或更多种单独的组合物(该组合物每种可以含有至少一个RNA种类(例如三个不同的mRNA种类),每个RNA种类编码不同的本
文限定的肽或蛋白质或其片段或变体)被提供,该组合物可以组合或可以不组合。此外,(药物)组合物可以是至少两种不同组合物的组合,每种组合物包含编码至少一种本文限定的
肽或蛋白质的至少一种mRNA。或者,(药物)组合物可以作为至少一种mRNA,优选至少两种、三种、四种、五种、六种、七种、八种、九种或更多种mRNA的组合被提供,每种mRNA编码本文限定的肽或蛋白质中的一种。(药物)组合物可以在其使用之前被组合以提供一种单一的组合
物,或者其可以被使用使得需要多于一次给予来给予编码本文限定的蛋白质的某种组合的
不同mRNA种类。如果(药物)组合物含有至少一种mRNA分子(一般至少两种mRNA分子)编码本
文限定的肽或蛋白质的组合,则其可以例如通过通过一次单一给予(组合所有mRNA种类),
通过至少两次单独给予而被给予。因此,编码本文限定的肽或蛋白质或者肽或蛋白质任何
组合(和任选的其他蛋白质)的单顺反子、双顺反子或多顺反子mRNA的任何组合——作为单
独的实体(含有一个mRNA种类)或作为组合的实体提供(含有多于一个mRNA种类)被提
供——被理解为根据本发明的(药物)组合物。根据(药物)组合物的特别优选的实施方式,
被所述(药物)组合物作为整体编码的所述至少一种肽或蛋白质,优选至少两种、三种、四
种、五种、六种、七种、八种、九种或更多种肽或蛋白质的组合,作为个体(单顺反子)mRNA被提供,该个体mRNA被单独给予。
[0466] 根据本发明的(药物)组合物可以以液体和/或干燥(例如冻干)形式被提供。
[0467] (药物)组合物一般包含安全和有效量的本文限定的根据本发明的RNA,其编码本文限定的肽或蛋白质或其片段或变体或肽或蛋白质的组合,优选如本文限定。如本文所用,“安全和有效量”是指足以显著引起本文限定的疾病或障碍的积极改善的RNA量。然而,同时,“安全和有效量”足够小以避免严重的副作用,也就是说,允许益处和险之间的合理关系。确定这些限制一般属于合理医学判断的范围。关于本发明的(药物)组合物,表述“安全和有效量”优选是指适于获得适当表达水平的被编码蛋白质(一种或多种)的RNA量(以及被
编码肽或蛋白质的量)。本文限定的(药物)组合物的RNA的这种“安全和有效量”可以进一步根据RNA的类型(例如,单顺反子、双顺反子或甚至多顺反子RNA)来选择,因为双顺反子或甚至多顺反子RNA可导致被编码蛋白质(一种或多种)的表达显著高于等量单顺反子RNA的。如
上限定的(药物)组合物的RNA的“安全和有效量”可以在伴随医生的知识和经验范围内,进一步结合待治疗的具体状况以及待治疗患者的年龄和身体情况、状况严重程度、治疗持续
时间,伴随疗法的属性、所用具体药学可接受运载体的属性和类似因素而变化。根据本发明的(药物)组合物可以根据本发明用于人类和兽医医学目的而使用。
[0468] 在优选的实施方式中,根据本发明的(药物)组合物或试剂盒的RNA以冻干形式提供。优选地,冻干的RNA在给予前在合适的缓冲剂中被重构——有利地基于水性运载体,例如,优选的林格乳酸盐(Ringer-Lactate)溶液、林格溶液、磷酸盐缓冲溶液。在优选的实施方式中,根据本发明的(药物)组合物或多部分试剂盒(a kit of parts)包含至少两种、三
种、四种、五种、六种、七种、八种、九种或更多种RNA,优选mRNA,其单独以冻干形式提供(任选地与至少一种其他添加剂一起)并且优选在其使用之前单独在合适的缓冲剂(例如林格
乳酸盐溶液)中重构,以允许单独给予每种(单顺反子)RNA。
[0469] 根据本发明的(药物)组合物一般可含有药学上可接受的运载体。本文所用的表述“药学上可接受的运载体”优选包括组合物的液体或非液体基础。如果组合物以液体形式提供,则运载体将是水,一般是无热原水;等渗盐水或缓冲(水性)溶液,例如磷酸盐、柠檬酸盐等缓冲溶液。特别是对于(药物)组合物的注射,可以使用水或优选缓冲剂,更优选水性缓冲剂,其含有钠盐,优选至少50mM的钠盐、钙盐,优选至少0.01mM的钙盐,和任选地盐,优选至少3mM的钾盐。根据优选的实施方式,钠盐、钙盐和任选地钾盐可以以如下形式存在:其卤化物形式,例如,氯化物、碘化物或溴化物,其氢氧化物、碳酸盐、碳酸氢盐或硫酸盐等形式。
在不限于此的情况下,钠盐的实例包括例如NaCl、NaI、NaBr、Na2CO3、NaHCO3、Na2SO4,任选的钾盐的实例包括例如KCl、KI、KBr、K2CO3、KHCO3、K2SO4,并且钙盐的实例包括例如CaCl2、CaI2、CaBr2、CaCO3、CaSO4、Ca(OH)2。此外,上述阳离子的有机阴离子可以被包含在缓冲剂中。
根据更优选的实施方式,适于如上限定的注射目的的缓冲剂可以含有选自氯化钠(NaCl)、
氯化钙(CaC)和任选地氯化钾(KCl)的盐,其中可以存在氯化物之外的阴离子。CaCl2也可以被另一种盐如KCI替代。一般,注射缓冲剂中的盐以如下浓度存在:至少50mM氯化钠(NaCl)、至少3mM氯化钾(KCl)和至少0.01mM氯化钙(CaCl2)的浓度存在。参考具体参考介质,注射缓冲剂可以是高渗的、等渗的或低渗的,即参考具体参考介质,缓冲剂可以具有较高、相同或较低的盐含量,其中优选地,可以使用前述盐的如下浓度:不因渗透或其他浓度效应导致对细胞的损害。参考介质是——例如在“体内”方法中——存在的液体,例如血液、淋巴液、细胞溶质液或其他体液,或者例如可用作“体外”方法中的参考介质的液体,例如普通缓冲剂或液体。这种普通缓冲剂或液体是技术人员已知的。特别优选林格乳酸盐溶液作为液体基
础。
[0470] 然而,也可以使用适合于对人给予的一种或多种相容的固体或液体填充剂或稀释剂或包封化合物。如本文所用的术语“相容”是指根据本发明的组合物的组分能够与本文所限定的根据本发明的RNA混合而不发生相互作用,发生相互作用将显著降低根据本发明的
(药物)组合物在一般使用条件下的有效性。当然,药学上可接受的运载体、填充剂和稀释剂必须具有足够高的纯度和足够低的毒性,以使其适于给予待治疗的人。可用作药学上可接
受的运载体、填充剂或其组分的化合物的一些实例是糖,例如乳糖、葡萄糖、海藻糖和蔗糖
淀粉,如例如玉米淀粉或马铃薯淀粉;右旋糖;纤维素及其衍生物,如例如羧甲基纤维素钠、乙基纤维素、乙酸纤维素;粉末状黄蓍胶;麦芽;明胶;动物脂;固体助流剂,如例如硬脂酸、硬脂酸镁;硫酸钙;植物油,如例如花生油籽油、芝麻油、橄榄油、玉米油和可可油;多元醇,如例如聚丙二醇、甘油、山梨糖醇、甘露醇和聚乙二醇;海藻酸。
[0471] 药学上可接受的运载体的选择原则上由给予本发明药物组合物的方式决定。(药物)组合物可以例如被全身或局部给予。全身给予的途径总体上包括例如透皮、口服、肠胃外途径,包括皮下、静脉内、肌内、动脉内、皮内和腹膜内注射和/或鼻内给予途径。局部给予的途径总体上包括例如局部给予途径,但也包括皮内、透皮、皮下或肌内注射或损伤内、颅内、内、心脏内和舌下注射。更优选地,根据本发明的(药物)组合物可以通过皮内、皮下或肌内途径给予,优选通过注射,其可以是无针和/或针式注射。(药物)组合物因此优选被配制成液体或固体形式。待给予的根据本发明(药物)的组合物的适当量可通过常规实验确
定,例如,通过使用动物模型。这种模型包括(不暗示任何限制)兔、绵羊、小鼠、大鼠、狗和非人灵长类动物模型。用于注射的优选单位剂型包括水、生理盐水或其混合物的无菌溶液。应将这种溶液的pH调节至约7.4。适于注射的运载体包括水凝胶、用于受控或延迟释放的装
置、聚乳酸和胶原基质。适于局部应用的药学上可接受的运载体包括适用于洗剂、乳膏、凝胶等的那些。如果(药物)组合物要被口服给予,则片剂、胶囊等是优选的单位剂型。用于制备可用于口服给予的单位剂型的药学上可接受的运载体在现有技术中是众所周知的。其选
择将取决于次要考虑因素,例如味道、成本和储存性,这对于本发明的目的而言并不重要,并且本领域技术人员可以毫无困难地做出其选择。
[0472] (药物)组合物中可以包含的其他添加剂是乳化剂,如例如吐温;润湿剂,如例如月桂基硫酸钠;着色剂;味道赋予剂,药物运载体;片剂形成剂;稳定剂;抗氧化剂防腐剂
[0473] 在优选的实施方式中,根据本发明的(药物)组合物除了根据本发明的RNA外还包含其他药物活性成分。优选地,所述其他药物活性成分选自适用于治疗或预防本文所限定
的肝脏疾病或障碍的化合物。
[0474] 本文限定的(药物)组合物还可以以任何口服可接受的剂型被口服给予,包括但不限于胶囊、片剂、水悬浮液或溶液。
[0475] (药物)组合物也可以被局部给予。适当的局部制剂容易针对这些区域或器官中的每一个制备。对于局部应用,(药物)组合物可以被配制在适当的油膏中,含有悬浮或溶解在一种或多种运载体中的根据本发明的RNA。
[0476] 根据本发明此方面的优选实施方式,根据本发明的(药物)组合物通过肠胃外途径被给予,优选通过注射。优选地,本发明的组合物通过皮内、皮下或肌内注射被给予。可以采用本领域已知的任何合适的注射技术,例如常规针式注射或无针注射技术,例如喷射注射。
[0477] 在一个实施方式中,(药物)组合物包含至少两种、三种、四种、五种、六种、七种、八种、九种或更多种本文限定的RNA,每种RNA优选被单独注射,优选通过无针注射。或者,(药物)组合物包含至少两种、三种、四种、五种、六种、七种、八种、九种或更多种RNA,其中所述至少两种、三种、四种、五种、六种、七种、八种、九种或更多种RNA作为混合物优选通过本文限定的注射被给予。
[0478] 本文限定的RNA或根据本发明的(药物)组合物的给予可以在时间交错处理中进行。时间交错处理可以是例如在疾病或障碍的常规治疗之前、同时和/或之后给予该RNA或
组合物,优选如本文所述,例如通过在治疗或给予适于治疗或预防本文所述疾病或障碍的
疗法或治疗剂给予之前、同时和/或之后给予该RNA或组合物。这种时间交错处理可以利用
例如试剂盒,优选本文限定的多部分试剂盒进行。
[0479] 时间交错处理可另外地或替代地还包括以如下形式给予本文限定的RNA或根据本发明的(药物)组合物:其中编码本文限定的肽或蛋白质的RNA或其片段或变体(优选形成组
合物的一部分)相对于编码如上限定的肽或蛋白质的另一种RNA(优选形成同一本发明组合
物的一部分)平行、在前或在后被给予。优选地,(所有RNA的)给予在1小时内进行,更优选在
30分钟内,甚至更优选在15、10、5、4、3或2分钟内或甚至在1分钟内。这种时间交错处理可以利用例如试剂盒,优选本文限定的多部分试剂盒进行。
[0480] 根据另一方面,本发明还提供了试剂盒,具体地多部分试剂盒。这种试剂盒,具体地多部分试剂盒,一般包含作为单独组分或与本文限定的其他组分组合的至少一种本文限定的本发明RNA种类,或包含根据本发明的RNA的本发明的(药物)组合物。本文限定的所述
至少一种RNA任选地与本文限定的其他组分组合,由此所述至少一种RNA(试剂盒的第一部
分)与包含一种或多种其他组分的试剂盒的至少一个其他部分被分开提供。(药物)组合物
可以存在于试剂盒的一个部分或不同部分中。作为实例,例如试剂盒的至少一个部分可包
含本文限定的至少一种RNA,并且试剂盒的至少一个其他部分可包含本文限定的至少一种
其他组分,例如,试剂盒的至少一个其他部分可包含至少一种(药物)组合物或其部分,例
如,试剂盒的至少一个部分可包含本文限定的RNA,试剂盒的至少一个其他部分可包含本文限定的至少一种其他组分,试剂盒的至少一个其他部分可包含(药物)组合物的至少一种组
分或(药物)组合物整体,和试剂盒的至少一个其他部分可包含例如至少一个药物运载体或
媒介物等。在试剂盒或多部分试剂盒包含如本文所述的多种RNA的情况下,试剂盒的一个部件可仅包含试剂盒中包含的一种、几种或所有RNA。在替代实施方式中,每种/各RNA种类可以被包含在试剂盒的不同/单独部件中,使得各部件形成试剂盒的一部分。此外,多于一种本文限定的RNA可以被包含在作为试剂盒一部分的第一部件中,而一个或多个其他(第二、
第三等)部件(提供试剂盒的一个或多个其他部分)可以包含一种或多于一种本文限定的
RNA,该其他部件可以与第一部件相同或部分相同或不同。试剂盒或多部分试剂盒可以进一步包含技术说明书,其具有关于根据本发明的RNA、本发明的(药物)组合物或其任何部件或部分的给予和剂量(例如,如果试剂盒被制备成多部分试剂盒)的信息。
[0481] 在另一方面,本发明还提供了根据本发明的RNA、(药物)组合物或多部分试剂盒的几种应用和用途。具体地,本发明提供了根据本发明的RNA的医学用途。此外,设想了根据本发明的RNA、根据本发明的(药物)组合物或多部分试剂盒在基因治疗中的用途。
[0482] 根据一个具体方面,本发明涉及根据本发明的RNA、本文限定的包含根据本发明的RNA或多种本发明RNA作为药物的(药物)组合物或试剂盒或多部分试剂盒的第一医学用途,
具体地在基因治疗中,优选用于治疗或预防本文限定的肝脏疾病或障碍。
[0483] 根据另一方面,本发明涉及根据本发明的RNA、本文限定的包含根据本发明的RNA或多种本发明RNA的(药物)组合物或试剂盒或多部分试剂盒的第二医学用途,用于治疗或
预防本文限定的肝脏疾病或障碍,优选涉及本文限定的RNA、本文限定的包含根据本发明的RNA的(药物)组合物、或试剂盒或多部分试剂盒用于制备预防、治疗和/或改善本文限定的
肝脏疾病或障碍的药物的用途。优选地,该药物组合物为此目的被用于或给予有此需要的
患者。
[0484] 根据另一方面,根据本发明的RNA或包含根据本发明的RNA的(药物)组合物用于制备药物,其中所述药物优选用于治疗或预防本文限定的肝脏疾病或障碍。
[0485] 在本发明的优选实施方式中,提供如本文所述的RNA、(药物)组合物或试剂盒或多部分试剂盒,用于治疗或预防肝脏疾病。因此,本发明涉及包含至少一个编码序列的RNA,其中编码序列编码如本文所述的至少一种肽或蛋白质,优选包含选自下列的肽或蛋白质或由
其组成:胞外基质蛋白酶、CCAAT/增强子结合蛋白α(CEBPA)、TNF相关凋亡诱导配体
(TRAIL)、肝细胞核因子4α(HNF4A)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、肝细胞生长因子(HGF)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)、或这些肽或蛋白质的中任意者的片段或变体;或包含根据本发明的RNA的(药物)组合物或试
剂盒或多部分试剂盒,用于治疗或预防肝脏疾病。
[0486] 如本文所用,术语“肝脏疾病”或“肝脏障碍”一般涉及与肝组织结构改变或损伤相关或导致肝组织结构改变或损伤,具体地导致肝纤维化的任何状况。具体地,本文所用的“肝脏疾病”,例如肝纤维化或肝硬化,是慢性疾病,其特征在于肝结缔组织的产生过量,具体地在于胞外基质(ECM)蛋白的积累,其优选由活化的肝星状细胞(HSC)引起。肝结缔组织
的产生过量和/或胞外基质(ECM)蛋白的积累的过程也可称为“纤维化”。本文所述的肝脏疾病也可称为“纤维化性肝脏疾病”。
[0487] 在本发明的环境中,术语“肝脏疾病”优选还指能够引起肝组织纤维化并且可能导致肝纤维化的疾病或障碍,例如感染性疾病(例如,乙型肝炎、丙型肝炎或丁型肝炎)、自身免疫性疾病(如原发性胆汁性肝硬化或自身免疫性肝炎)、基因/遗传性疾病(遗传性血色素沉着病(haematochromtosis)、威尔森氏病、囊性纤维化、糖尿病)、代谢和/或饮食相关疾病(肥胖、糖尿病、酒精滥用、酒精性肝脏疾病、非酒精性脂肪性肝疾病(NAFLD)或非酒精性脂肪性肝炎(NASH))、癌症或肿瘤疾病(如肝细胞癌(HCC))或其他疾病如胆结石、Budd-Chiari综合征或原发性硬化性胆管炎。
[0488] 在优选的实施方式中,提供根据本发明的RNA用于治疗或预防肝脏疾病,该肝脏疾病优选选自肝纤维化、肝硬化和肝癌。在优选的实施方式中,提供根据本发明的RNA用于治疗或预防肝细胞癌(HCC)。最优选地,提供根据本发明的RNA用于治疗或预防肝纤维化或肝
硬化。
[0489] 在优选的实施方式中,提供如本文所述的RNA或(药物)组合物用于治疗或预防肝脏疾病,其包括靶向递送RNA。优选地,在给予哺乳动物对象后,RNA被靶向肝脏。根据本发明的RNA的靶向递送优选通过以适合的方式(例如,作为如本文所述的脂质体或脂质纳米颗
粒)配制RNA和/或通过分别根据本发明通过合适的途径给予RNA或(药物)组合物来实现。
[0490] 优选地,如本文所述的肝脏疾病的治疗或预防包括以任何适合的方式给予根据本发明的RNA或(药物)组合物,优选如本文关于(药物)组合物所述。适当时,(药物)组合物的描述也适用于根据本发明的RNA的医学用途。
[0491] 在优选的实施方式中,治疗或预防包括将其他药物活性成分与根据本发明的RNA或根据本发明的(药物)组合物组合给予。优选地,所述其他药物活性成分选自适用于治疗
或预防本文所限定的肝脏疾病或障碍的化合物。
[0492] 本发明还包括治疗或预防疾病或障碍,优选本文所限定的肝脏疾病或障碍的方法——通过向有此需要的对象给予药学有效量的根据本发明的RNA或药物组合物。这种方
法一般包括制备本发明的RNA或组合物的任选的第一步骤,和第二步骤,第二步骤包括向有此需要的患者/对象给予(药学有效量的)所述组合物。有此需要的对象一般是哺乳动物。在本发明的环境中,哺乳动物优选选自包括(不限于此)山羊、牛、猪、狗、猫、驴、猴、猿、啮齿动物如小鼠、仓鼠、兔和具体地人,其中该哺乳动物一般患有疾病或障碍,优选本文限定的肝脏疾病或障碍。
[0493] 根据另一方面,本发明还提供了用于增加如本文所述的肽或蛋白质的表达的方法,所述方法包括步骤:例如a)提供本文限定的RNA或本文限定的(药物)组合物,b)将该RNA或组合物给予或给予表达系统,例如无细胞表达系统、细胞(例如表达宿主细胞或体细胞)、组织或生物体。该方法可以应用于实验室,用于研究、用于诊断、用于肽或蛋白质的商业生产和/或用于治疗目的。在此环境中,一般在制备RNA或组合物后,一般将其应用于或给予无细胞表达系统、细胞(例如表达宿主细胞或体细胞)、组织或生物体,例如以裸露或复合形式或作为本文所述的(药物)组合物,优选通过转染或通过利用本文所述的任何给予模式。该
方法可以在体外、体内或离体进行。该方法还可以在治疗特定疾病(优选如本文限定)的环
境下实施。
[0494] 在此环境中,体外被限定为将根据本发明的RNA或组合物转染或转导到生物体外培养的细胞中;体内在此被限定为通过将RNA或组合物应用于整个生物体或个体而将根据
本发明的RNA或组合物转染或转导到细胞中,并且离体在此被限定为将根据本发明的RNA或
组合物转染或转导到生物体或个体外的细胞中,随后将转染后的细胞施用于生物体或个
体。
[0495] 同样,根据另一方面,本发明还提供了根据本发明的RNA或组合物用于增加本文所述的肽或蛋白质的表达的用途,优选用于诊断或治疗目的,具体地在基因治疗中,例如通过应用或给予RNA或组合物,例如向无细胞表达系统、细胞(例如表达宿主细胞或体细胞)、组织或生物体应用或给予RNA或组合物。该用途可以应用于实验室,用于研究、用于诊断、用于肽或蛋白质的商业生产和/或用于治疗目的,优选用于基因治疗。在此环境中,一般在制备根据本发明的RNA或组合物之后,一般将其应用于或给予无细胞表达系统、细胞(例如表达
宿主细胞或体细胞)、组织或生物体,优选以裸露形式或复合形式、或作为本文所述的(药
物)组合物,优选通过转染或通过利用本文所述的任何给予模式。该用途可以在体外、体内或离体进行。此外,该用途可以在治疗特定疾病,优选本文限定的肝脏疾病或障碍的环境中进行。
[0496] 在另一方面,本发明还涉及本发明的表达系统,其包含根据本发明的RNA或包含根据本发明第一方面的包含相应核酸序列的表达载体或质粒。在此环境中,表达系统可以是
无细胞表达系统(例如体外转录/翻译系统)、细胞表达系统(例如哺乳动物细胞如CHO细胞、昆虫细胞、酵母细胞、细菌细胞如大肠杆菌(E.coli))或用于表达肽或蛋白质的生物体(例
如植物或动物,如牛)。
[0497] 项目
[0498] 本发明还可以下列项目为特征:
[0499] 1.用于治疗或预防肝脏疾病用途的RNA,其包含至少一个编码序列,
[0500] 其中编码序列编码选自下列的至少一种肽或蛋白质:
[0501] 胞外基质蛋白酶、CCAAT/增强子结合蛋白α(CEBPA)、TNF相关凋亡诱导配体(TRAIL)、肝细胞核因子4α(HNF4A)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3)、或这些肽或蛋白质的片段或变体。
[0502] 2.根据项目1所述用途的RNA,其中RNA是mRNA、病毒RNA或复制子RNA。
[0503] 3.根据项目1或2所述用途的RNA,其中RNA,优选编码序列,不包含化学修饰的糖、化学修饰的骨架或化学修饰的核碱基。
[0504] 4.根据项目3所述用途的RNA,其中RNA不包含化学修饰的核苷或核苷酸。
[0505] 5.根据项目3或4所述用途的RNA,其中RNA未经化学修饰。
[0506] 6.根据前述项目中任一项所述用途的RNA,其中所述肝脏疾病选自肝纤维化、肝硬化和肝癌。
[0507] 7.根据前述项目中任一项所述用途的RNA,其中所述肽或蛋白质包含胞外基质蛋白酶或其片段或变体。
[0508] 8.根据项目7所述用途的RNA,其中胞外基质蛋白酶选自细菌胶原酶和哺乳动物基质金属蛋白酶。
[0509] 9.根据项目7或8所述用途的RNA,其中胞外基质蛋白酶选自基质金属蛋白酶-1,优选人基质金属蛋白酶-1、梭菌胶原酶ColG和梭菌胶原酶ColH。
[0510] 10.根据项目7至9中任一项所述用途的RNA,其中所述肽或蛋白质包含选自SEQ ID NO:20至28的氨基酸序列,或任一所述氨基酸的片段或变体。
[0511] 11.根据项目1至6中任一项所述用途的RNA,其中所述肽或蛋白质包含CCAAT/增强子结合蛋白α(CEBPA),优选人CEBPA,或其片段或变体。
[0512] 12.根据项目11所述用途的RNA,其中所述肽或蛋白质包含选自SEQ ID NO:8至13的氨基酸序列,或任一所述氨基酸序列的片段或变体。
[0513] 13.根据项目1至6中任一项所述用途的RNA,其中所述肽或蛋白质包含TNF相关凋亡诱导配体(TRAIL)或其片段或变体。
[0514] 14.根据项目13所述用途的RNA,其中所述肽或蛋白质包含选自SEQ ID NO:4至7的氨基酸序列,或任一所述氨基酸序列的片段或变体。
[0515] 15.根据项目1至6中任一项所述用途的RNA,其中所述肽或蛋白质选自肝细胞核因子4α(HNF4A)、成纤维细胞生长因子21(FGF21)、阿片样生长因子受体样1(OGFRL1)、松弛素1(RLN1)、松弛素2(RLN2)和松弛素3(RLN3),并且其中肽或蛋白质优选包含选自SEQ ID NO:
14至19的氨基酸序列,或任一所述氨基酸序列的片段或变体。
[0516] 16.根据项目1至15中任一项所述用途的RNA,其中所述RNA的至少一个编码序列包含选自SEQ ID NO:32至71的核酸序列,或任一所述氨基酸序列的片段或变体。
[0517] 17.根据项目1-16中任一项所述用途的RNA,其中RNA是单顺反子、双顺反子或多顺反子的。
[0518] 18.根据项目1-17中任一项所述用途的RNA,其中RNA是mRNA。
[0519] 19.根据项目1-18中任一项所述用途的RNA,其中RNA是修饰的RNA,优选是稳定化的RNA。
[0520] 20.根据项目1至19中任一项所述用途的RNA,其中所述RNA的所述至少一个编码序列的G/C含量与相应野生型RNA的相应编码序列的G/C含量相比增加,
[0521] 所述RNA的所述至少一个编码序列的C含量与相应野生型RNA的相应编码序列的C含量相比增加,和/或其中
[0522] 所述RNA的所述至少一个编码序列中的至少一个密码子适应人密码子使用,其中所述RNA的所述至少一个编码序列中的密码子适应指数(CAI)优选增加或最大化,
[0523] 其中,所述RNA编码的氨基酸序列优选与相应野生型RNA编码的氨基酸序列相比不改变。
[0524] 21.根据项目20所述用途的RNA,其中所述至少一个编码序列包含选自下列的核酸序列:SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、
95、96、97、98、99、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、
118、119、120、121、122、123、124、125、126、127、131、132、133、134、135、136、137、138、139、
140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、159、160、161、
162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、
181、182、183、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、
203、204、205、206、207、208、209、210、211、215、216、217、218、219、220、221、222、223、224、
225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、243、244、245、246、
247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、
266、267、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、
288、289、290、291、292、293、294、295、299、300、301、302、303、304、305、306、307、308、309、
310、311、312、313、314、315、316、317、318、319、320、321、322、323、327、328、329、330、331、
332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、
351、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、
373、374、375、376、377、378、379、383、384、385、386、387、388、389、390、391、392、393、394、
395、396、397、398、399、400、401、402、403、404、405、406和407,或任一所述核酸序列的片段或变体。
[0525] 22.根据项目1至21中任一项所述用途的RNA,其中所述RNA包含5′-帽结构。
[0526] 23.根据项目1至22中任一项所述用途的RNA,其中所述RNA包含多(A)序列,所述多(A)序列优选包含10至200个、10至100个、40至80个或50至70个腺苷核苷酸;和/或多(C)序列,所述多(C)序列优选包含10至200个、10至100个、20至70个、20至60个或10至40个胞苷核苷酸。
[0527] 24.根据项目1至23中任一项所述用途的RNA,其中所述RNA包含至少一个组蛋白茎环。
[0528] 25.根据项目24所述用途的RNA,其中所述至少一个组蛋白茎环包含根据下式(I)或(II)的核酸序列:
[0529] 式(I)(无茎边界元件的茎环序列):
[0530]
[0531] 式(II)(有茎边界元件的茎环序列):
[0532]
[0533] 其中:
[0534] 茎1或茎2边界元件N1-6是1至6个,优选2至6个,更优选2至5个,甚至更优选3至5个,最优选4至5个或5个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
[0535] 茎1[N0-2GN3-5]与元件茎2反向互补或部分反向互补,并且是5至7个核苷酸的连续序列;
[0536] 其中N0-2是0至2个,优选0至1个,更优选1个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
[0537] 其中N3-5是3至5个,优选4至5个,更优选4个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物,并且
[0538] 其中G是鸟苷或其类似物,并且可以任选地被胞苷或其类似物替代,条件是茎2中其互补核苷酸胞苷被鸟苷替代;
[0539] 环序列[N0-4(U/T)N0-4]位于元件茎1和茎2之间,并且是3至5个核苷酸,更优选4个核苷酸的连续序列;
[0540] 其中各N0-4彼此独立地是0至4个,优选1至3个,更优选1至2个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;和
[0541] 其中U/T表示尿苷或任选地胸苷;
[0542] 茎2[N3-5CN0-2]与元件茎1反向互补或部分反向互补,并且是5至7个核苷酸的连续序列;
[0543] 其中N3-5是3至5个,优选4至5个,更优选4个N的连续序列,其中各N彼此独立地选自选自A、U、T、G和C的核苷酸或其核苷酸类似物;
[0544] 其中N0-2是0至2个,优选0至1个,更优选1个N的连续序列,其中各N彼此独立地选自选自A、U、T、G或C的核苷酸或其核苷酸类似物;和
[0545] 其中C是胞苷或其类似物,并且可以任选地被鸟苷或其类似物取代,条件是茎1中其互补核苷鸟苷被胞苷替代;
[0546] 其中
[0547] 茎1和茎2能够彼此碱基配对
[0548] 形成反向互补序列,其中在茎1和茎2之间可以发生碱基配对,
[0549] 或
[0550] 形成部分反向互补序列,其中茎1和茎2之间可以发生不完全碱基配对。
[0551] 26.根据项目24或25所述用途的RNA,其中所述至少一个组蛋白茎环包含根据下式(Ia)或(IIa)的核酸序列:
[0552] 式(Ia)(无茎边界元件的茎环序列):
[0553]
[0554] 式(IIa)(有茎边界元件的茎环序列):
[0555]
[0556] 27.根据项目24至26中任一项所述用途的RNA,其中所述至少一个组蛋白茎环包含根据SEQ ID NO:1451的核酸序列,并且最优选地根据SEQ ID NO:1452的RNA序列。
[0557] 28.根据项目1至27中任一项所述用途的RNA,其中所述RNA包含至少一个3′-非翻译区元件(3′-UTR元件)。
[0558] 29.根据项目28所述用途的RNA,其中3′-UTR元件包含衍生自基因的3′-UTR的核酸序列,该基因优选编码稳定的mRNA;或衍生自所述基因的同源物、片段或变体。
[0559] 30.根据项目29所述用途的RNA,其中3′-UTR元件包含衍生自选自白蛋白基因、α-珠蛋白基因、β-珠蛋白基因、酪氨酸羟化酶基因、脂氧合酶基因和胶原α基因的基因的3′-UTR或衍生自其同源物、片段或变体的核酸序列。
[0560] 31.根据项目29或30所述用途的RNA,其中3′-UTR元件包含衍生自α-珠蛋白基因的3′UTR的核酸序列,优选包含根据SEQ ID NO:1444的核酸序列,其同源物、片段或变体。
[0561] 32.根据项目1至31中任一项所述用途的RNA,其中RNA包含以下元件,优选5′至3′方向:
[0562] a)5′-CAP结构,优选m7GpppN,
[0563] b)如项目21中限定的至少一个编码序列,
[0564] c)3′-UTR元件,包含衍生自α-珠蛋白基因的核酸序列,优选包含根据SEQ ID NO:1444的核酸序列,或其同源物、片段或变体,
[0565] d)多(A)尾,优选由10至200个、10至100个、40至80个或50至70个腺苷核苷酸组成,[0566] e)多(C)尾,优选由10至200个、10至100个、20至70个、20至60个或10至40个胞苷核苷酸组成,和
[0567] f)组蛋白茎环,优选包含根据SEQ ID NO:1452的核酸序列。
[0568] 33.根据项目1至32中任一项所述用途的RNA,其中所述RNA包含选自SEQ ID NO:408至750的核酸序列,或任一所述核酸序列的片段或变体。
[0569] 34.根据项目29或30中任一项所述用途的RNA,其中所述至少一个3′-UTR元件包含如下核酸序列:衍生自脊椎动物白蛋白基因的3′-UTR或其变体,优选衍生自哺乳动物白蛋白基因的3′-UTR或其变体,更优选衍生自人白蛋白基因的3′-UTR或其变体,甚至更优选衍生自根据GenBank登录号N_000477.5的人白蛋白的3′-UTR或其片段或变体。
[0570] 35.根据项目34所述用途的RNA,其中3′-UTR元件包含根据SEQ ID NO:1448或1450的核酸序列,或其同源物、片段或变体。
[0571] 36.根据项目1至35中任一项所述用途的RNA,其中RNA包含5′-UTR元件。
[0572] 37.根据项目36所述用途的RNA,其中5′-UTR元件包含如下核酸序列:衍生自TOP基因的5′-UTR,优选衍生自相应RNA序列,或其同源物、片段、或变体,优选缺少5′TOP基序。
[0573] 38.根据项目37所述用途的RNA,其中5′-UTR元件包含如下核酸序列:衍生自编码核糖体蛋白的TOP基因的5′-UTR,优选衍生自相应RNA序列,或衍生自其同源物、片段或变体,优选缺少5′TOP基序。
[0574] 39.根据项目37或38所述用途的RNA,其中5′-UTR元件包含如下核酸序列:衍生自编码核糖体大蛋白(RPL)的TOP基因的5′-UTR,或衍生自其同源物、片段或变体,优选缺少5′TOP基序。
[0575] 40.根据项目37至39中任一项所述用途的RNA,其中5′-UTR元件包含根据SEQ ID NO:1432的核酸序列,或其同源物、片段或变体。
[0576] 41.根据项目1至40中任一项所述用途的RNA,其包含以下元件,优选5′至3′方向:
[0577] a)5′-帽结构,优选m7GpppN,
[0578] b)5′-UTR元件,其包含下列核酸序列或由下列核酸序列组成:所述核酸序列衍生自TOP基因的5′-UTR,优选包含根据SEQ ID NO:1432的核酸序列,或其同源物、片段或变体,[0579] c)如项目21中限定的至少一个编码序列,
[0580] d)3′-UTR元件,包含如下核酸序列:衍生自α-珠蛋白基因,优选包含根据SEQ ID NO:1444的核酸序列,或其同源物、片段或变体;和/或
[0581] 3′-UTR元件,包含如下核酸序列:衍生自白蛋白基因,优选包含根据SEQ ID NO:1448或1450的核酸序列,或其同源物、片段或变体,
[0582] e)多(A)尾,优选由10至200个、10至100个、40至80个或50至70个腺苷核苷酸组成,[0583] f)多(C)尾,优选由10至200个、10至100个、20至70个、20至60个或10至40个胞苷核苷酸组成,和
[0584] g)组蛋白茎环,优选包含根据SEQ ID NO:1452的核酸序列。
[0585] 42.根据项目1至40中任一项所述用途的RNA,其中所述RNA包含选自SEQ ID NO:751至1090的核酸序列,或任一所述核酸序列的片段或变体。
[0586] 43.根据项目36所述用途的RNA,其中5′-UTR元件包含如下核酸序列:衍生自HSD17B4基因,优选衍生自相应RNA序列,或其同源物、片段或变体。
[0587] 44.根据项目43所述用途的RNA,其中5′-UTR元件包含根据SEQ ID NO:1436的核酸序列,或其同源物、片段或变体。
[0588] 45.根据项目1至44中任一项所述用途的RNA,其包含以下元件,优选5′至3′方向:
[0589] a)5′-CAP结构,优选m7GpppN,
[0590] b)5′-UTR元件,其包含下列核酸序列或由下列核酸序列组成:所述核酸序列衍生自HSD17B4基因的5′-UTR,优选包含根据SEQ ID NO:1436的核酸序列,或其同源物、片段或变体,
[0591] c)如项目21中限定的至少一个编码序列,
[0592] d)3′-UTR元件,包含如下核酸序列:衍生自α-珠蛋白基因,优选包含根据SEQ ID NO:1444的核酸序列,或其同源物、片段或变体;和/或
[0593] 3′-UTR元件,其包含如下核酸序列:衍生自白蛋白基因,优选包含根据SEQ ID NO:1448或1450的核酸序列,或其同源物、片段或变体,
[0594] e)多(A)尾,优选由10至200个、10至100个、40至80个或50至70个腺苷核苷酸组成。
[0595] 46.根据项目1至45中任一项所述用途的RNA,其中RNA包含选自SEQ ID NO:1091至1430的核酸序列,或任一所述核酸序列的片段或变体。
[0596] 47.根据项目1至46中任一项所述用途的RNA,其中RNA包含选自SEQ ID NO:408至1430的核酸序列,或任一所述核酸序列的片段或变体。
[0597] 48.根据项目1至47中任一项所述用途的RNA,其中RNA与至少一种药学上可接受的运载体一起配制。
[0598] 49.根据项目48所述用途的RNA,其中RNA与一种或多种阳离子或聚阳离子化合物,优选与阳离子或聚阳离子聚合物、阳离子或聚阳离子肽或蛋白质——例如鱼精蛋白、阳离
子或聚阳离子多糖和/或阳离子或聚阳离子脂质复合。
[0599] 50.根据项目49所述用途的RNA,其中RNA与一种或多种阳离子或聚阳离子肽或蛋白质的N/P比例在约0.1至10的范围内,包括约0.3至约4、约0.5至2、约0.7至2、和约0.7至
1.5的范围。
[0600] 51.根据项目49或50中任一项所述用途的RNA,其中至少一种RNA与一种或多种阳离子或聚阳离子化合物复合,并且至少一种RNA处于游离状态。
[0601] 52.根据项目51所述用途的RNA,其中至少一种复合的RNA与所述至少一种游离的RNA相同。
[0602] 53.根据项目51或52所述用途的RNA,其中复合的RNA与游离的RNA的摩尔比选自约0.001∶1至约1∶0.001的摩尔比,包括约1∶1的比例。
[0603] 54.根据项目48至53中任一项所述用途的RNA,其中所述RNA与一种或多种脂质复合,从而形成脂质体、脂质纳米颗粒和/或脂质复合物。
[0604] 55.根据项目1至54中任一项所述用途的RNA,其中RNA或与RNA一起配制的药物运载体与靶向基团形成缀合物。
[0605] 56.根据项目55所述用途的RNA,其中所述靶向基团提供所述缀合物向肝脏的递送,优选向肝巨噬细胞、肝星状细胞、肝细胞和/或肝窦内皮细胞(LSEC)。
[0606] 57.根据项目55或56所述用途的RNA,其中靶向基团选自叶酸基、GalNAc、半乳糖、甘露糖、甘露糖-6P、适配体、整联蛋白受体配体、趋化因子受体配体、转铁蛋白、生物素、血清素受体配体、PSMA、内皮素、GCPII、生长抑素、LDL配体和HDL配体。
[0607] 58.根据项目1至57中任一项所述用途的RNA,其中所述RNA通过肠胃外给予,优选通过注射,被给予有此需要的对象。
[0608] 59.根据项目1至58中任一项所述用途的RNA,其中所述治疗或预防包括给予其他药物活性成分。
[0609] 60.组合物,包含根据项目1至59中任一项所限定的至少一种RNA和任选地另外的药学上可接受的运载体。
[0610] 61.试剂盒,优选多部分试剂盒,包含根据项目1至59中任一项所限定的至少一种RNA或根据项目60的组合物、任选地用于溶解的液体媒介物和任选地具有关于所述RNA或组
合物的给予和剂量的信息的技术说明书。
[0611] 62.根据项目61的试剂盒,其中所述试剂盒包含林格乳酸盐溶液作为一部分。
[0612] 63.根据项目1至59中任一项所限定的RNA、根据项目60的组合物、或根据项目61或62的试剂盒,其用于基因治疗用途
[0613] 64.根据项目1至59中任一项所限定的RNA、根据项目60的组合物、或根据项目61或62的试剂盒,其用于肝脏疾病的基因治疗用途。
[0614] 65.治疗或预防障碍的方法,其中所述方法包括向有此需要的对象给予有效量的根据项目1至59中任一项所限定的RNA、根据项目60的组合物或根据项目61或62的试剂盒。
[0615] 66.根据项目65的方法,其中所述障碍是肝脏疾病,优选选自肝纤维化、肝硬化和肝癌。
[0616] 附图
[0617] 图1:CCl4小鼠模型中肝纤维化的宏观分类:来自对照和CCl4处理的小鼠的肝脏的代表性宏观照片。肝脏中的纤维化等级分为0级(无纤维化)至3级(晚期纤维化)。0级:肝脏外表面光滑并且有光泽。1级:肝脏的部分外表面(<50%)确实显示出结构变化,例如细胞发育不良和肝脏的胶原沉积增加(瘢痕)。2级:肝脏的大部分外表面(>50%)确实显示出结构变化,例如细胞发育异常和肝脏的胶原沉积增加(瘢痕)。3级:肝脏外表面的强烈宏观变化,表现为发育异常的结节和肝脏的强烈胞外基质(ECM)和胶原沉积(瘢痕)。
[0618] 图2:纤维化阶段的评价:根据肝脏状况的宏观评估,根据图1中的宏观分类标准将所有动物的肝脏分类为不同的纤维化等级。纤维化分类:无纤维化(0级);开始至晚期纤维化(1级至3级)。与无mRNA处理的对照组2相比,mRNA处理组(组3至6)确实显示3级纤维化表观减少和2级和1级纤维化表观增加。虚线将对照组1-2与处理动物组3-6分开。
[0619] 图3(A)和3(B):mRNA处理的动物的肝脏重量和肝脏体重比例降低:
[0620] 图3(A)在CCl4给予开始后29天(mRNA处理开始后14天)确定肝脏重量。与无mRNA处理的对照组2相比,mRNA处理组(组3至6)确实显示出肝脏重量较低。数据(平均值±SEM)。
[0621] 图3(B)在CCl4给予开始后29天(mRNA处理开始后14天)确定肝脏重量与体重的比。将肝脏重量除以体重并乘以100以确定所述比例。与无mRNA处理的对照组2相比,mRNA处理
组(组3至6)确实显示出肝脏重量较低。数据(平均值±SEM)。
[0622] 图4:mRNA处理的动物中慢性肝损伤标记物氨基转移酶(ALT)减少:在CCl4给予开始后29天(mRNA处理开始后14天)评估血清ALT。通过酶分析自动确定ALT水平。与无mRNA处
理的对照组2相比,mRNA处理组(组3至6)确实显示出较低的ALT水平。
[0623] 数据(平均值±SEM)。实施例
[0624] 下文所示的实施例仅是示例性的,并且将以进一步的方式描述本发明。实施例不应被解释为将本发明限制于此。
[0625] 实施例1:mRNA处理对雄性BALB/c小鼠中四氯化碳引起的肝纤维化模型的治疗功效的评价
[0626] 将BALB/c小鼠分成6组,如表3所示的研究设计所示。通过CCl4给予实现肝衰竭的引起,随后用测试化合物治疗显示了治疗功效。CCl4:矿物油的给予通过腹膜内(i.p.)途
径,一个月,每周两次。作为对照,给5只动物给予盐水:矿物油(i.p.)。
[0627] 通过下颌骨下(sub-mandibular)途径或通过尾部切口的放血安排在第-1天、第15天、第22天,并且最后一次放血在收获第29天。在血清分离管中收集大约100μl全血,制备血清并储存在-20℃。
[0628] 为了评价肝功能,测量丙氨酸氨基转移酶(ALT)。
[0629] 表3:研究设计。
[0630]
[0631] ACCl4或盐水:矿物油(对照)被每周两次(i.p.)给予,给予4周;
[0632] BCureVa化合物或盐水通过i.v.给予,从CCl4给予后第14天开始,每2或3天,见时间表。
[0633] mRNA处理的功效通过其限制疾病或肝衰竭进展的能力来评估。为了评价治疗功效,在CCl4给予开始后第14、17、19、21、24和26天,通过静脉内途径(i.v.)将100μl(40μg)LNP配制的RNA(RNA-LNP)注射到动物(n=12)中。
[0634] 第1组动物(n=5)作为假对照(即,给予(a)盐水(i.p.)和(b)1ml/kg的1∶1比例的盐水∶矿物油(i.p.));
[0635] 第2组动物(n=12):给予(a)盐水(i.p.)(b)1ml/kg的1∶1比例的CCl4∶矿物油(i.p.);
[0636] 第3-6组动物(每次:n=12):给予(a)对应的mRNA和制剂(IV),(b)1ml/kg的1∶1比例的CCl4∶矿物油(i.p.)。
[0637] 最终收获在第29天进行,即最后一次CCl4给予后96小时,即称重所有存活的动物,观察活性水平,通过心脏放血提取血液用于血清制备,并对动物实施安乐死,然后进行总体尸检(gross necropsy)。随后,收获各动物的肝脏并称重。将肝脏的中叶固定在10%中性缓冲福尔马林中以便组织学检查,并将其余叶(lobes)分配到两个管中并快速冷冻。
[0638] 拍摄对照和CCl4处理的小鼠的肝脏的代表性宏观图片,并按照图1中的宏观分类标准(肝脏状况的宏观评价)分成不同的纤维化等级。肝脏中的纤维化等级分为0级(无纤维
化)至3级(晚期纤维化)。0级:肝脏外表面光滑并且有光泽。1级:肝脏的部分外表面(<
50%)确实显示出结构变化,例如细胞发育不良和肝脏的胶原沉积增加(瘢痕)。2级:肝脏的大部分外表面(>50%)确实显示出结构变化,例如细胞发育异常和肝脏的胶原沉积增加
(瘢痕)。3级:肝脏外表面的强烈宏观变化,表现为发育异常的结节和强烈胞外基质(ECM)和肝脏胶原沉积(瘢痕)。
[0639] 此外,在CCl4给予开始后29天(mRNA处理开始后14天;图3(A))确定肝脏重量,作为肝纤维化进展的指标,并确定肝脏重量与体重的比(图3(B))。此外,根据图4,评估血清ALT。
[0640] 结果:
[0641] 所有mRNA处理的动物(Gr3至Gr6)都显示与对照组(Gr2)相比较低的肝脏重量和较低的肝脏/体重比,图3A和3B,即表明纤维化的改善或进展减少。此外,如图1和图2显见,在mRNA处理的动物(Gr3至Gr6)中可以观察到较低量的肝脏具有高等级的纤维化。此外,如图4显见,与对照组相比,所有mRNA处理组的纤维化标记物丙氨酸氨基转移酶(ALT)均减少,即表明动物的肝纤维化改善或进展减少。
[0642] 为了进一步评价肝功能,测量其他酶组,即天冬氨酸转氨酶(AST)、碱性磷酸酶(ALP)和总胆红素(TBIL)。总胆红素的测量包括非缀合胆红素和缀合胆红素,因为非缀合胆红素是血红素的分解产物,并且肝脏问题反映为胆红素代谢缺陷(例如,肝细胞摄取减少、胆红素缀合受损、胆红素的肝细胞分泌减少);实例是肝硬化和病毒性肝炎)。
[0643] 实施例2:组织病理学分析[预言性]
[0644] 进行实施例1的动物的组织病理学分析,即切片和天狼猩红(PSR)染色(即胶原I和III纤维的组织学可视化)。此外,拍摄各动物的肝脏的数字图像,并且另外进行标准苏木
精-伊红(H&E)和PSR染色玻片的评分。组织病理学分析显示肝纤维化进展减少。
[0645] 实施例3:mRNA处理对雄性BALB/c小鼠中四氯化碳引起的肝纤维化模型的治疗功效的评价[预言性]
[0646] 从表4中显示的研究设计显见,BALB/c小鼠被分成17组。通过CCl4给予实现肝衰竭的引起,并且随后的测试化合物治疗显示了治疗功效。CCl4:矿物油的给予通过腹膜内
(i.p.)途径,一个月,每周两次。作为对照,给5只动物给予盐水:矿物油(i.p.)。
[0647] 通过下颌骨下途径或通过尾部切口的放血安排在第-1天、第14天、第25天,并且最后一次放血在收获第32天。在血清分离管中收集大约100μl全血,以及制备血清并储存在-20℃下。
[0648] 为了评价肝功能,测量酶组,即丙氨酸氨基转移酶(ALT)、天冬氨酸转氨酶(AST)、碱性磷酸酶(ALP)以及总胆红素(TBIL)。此外,测量碱性磷酸酶(ALP)、γ-谷氨酰转移酶(GGT)、总胆红素(TBIL)、氨、球蛋白和白蛋白/球蛋白比例。总胆红素的测量包括非缀合胆红素和结合胆红素,因为非缀合胆红素是血红素的分解产物,并且肝脏问题反映为胆红素
代谢缺陷(例如,肝细胞摄取减少、胆红素缀合受损、胆红素的肝细胞分泌减少;实例是肝硬化和病毒性肝炎)。此外,测量白蛋白水平,因为慢性肝脏疾病(例如肝硬化)中白蛋白水平降低。此外,测量总蛋白质(其余来自球蛋白)。
[0649] 表4:研究设计
[0650]
[0651]
[0652] ACCl4或盐水:矿物油(对照)被每周两次(i.p.)给予,给予4周;
[0653] B化合物或盐水该给予(i.v.),从CCl4给予后第17天开始,每3或4天。
[0654] mRNA处理的功效通过其限制疾病或肝衰竭进展的能力来评估。为了评价治疗功效,在CCl4给予开始后第17、20、24、27和30天,通过静脉内途径(i.v.)将100μl LNP配制的RNA(RNA-LNP)注射到动物(n=12)中:
[0655] 第1组的动物(n=5)用作假对照(即给予(a)盐水(i.p.)和(b)1ml/kg的1∶1比例的盐水∶矿物油(i.p.));
[0656] 第2组的动物(n=12):给予(a)盐水(i.p.),(b)1ml/kg的1∶1比例的CCl4∶矿物油(i.p.);
[0657] 第3-31组的动物(每次:n=12):给予(a)对应的mRNA和制剂(IV),(b)1ml/kg的1∶1比例的CCl4∶矿物油(i.p.);
[0658] 第32组的动物(n=12):给予(a)对照LNP(IV),(b)1ml/kg的1∶1比例的CCl4∶矿物油(i.p.)。
[0659] 在单独的实验中,用CVCM配制的mRNA代替LNP配制的mRNA,评估表4的研究设计。
[0660] 最终收获在第32天,即最后一次CCl4给予后96小时,即称重所有存活的动物,观察活性水平,通过心脏放血提取血液用于血清制备,并对动物实施安乐死,然后进行总体尸检。随后,收获肝脏并称重。将肝脏的中叶固定在10%中性缓冲福尔马林中用于组织学(检查),并将其余叶分到两个管中并快速冷冻。
[0661] 通过羟丙脯氨酸测量评价胶原沉积。此外,进行组织病理学分析,即切片和天狼猩红(PSR)染色(即胶原I和III纤维的组织学可视化),包括αSMA染色(活化的肝星状细胞的标记)。此外,拍摄每只动物的肝脏的数字图像,并且另外进行标准苏木精-伊红(H&E)和PSR染色的玻片的评分。
[0662] 结果:
[0663] 在几组中观察到肝脏中胶原减少。此外,在几组中观察到羟丙脯氨酸减少。此外,对于一些组,观察到胞外基质沉积减少,包括胶原和羟基丙氨酸含量。一些组显示HSC凋亡明确增加而不影响肝细胞。一些组显示动物模型达到肝硬化状态时的存活率增加。
[0664] 实施例4:评价在四氯化碳引起的肝纤维化的大鼠模型中用mRNA治疗的效果[预测性]
[0665] 将CCl4:橄榄油(1∶1比例)给予(i.p.)雄性大鼠(褐家鼠种类,品种:Sprague Dawley),3天一次,剂量为2ml/kg,2周时间(5次注射),然后是1ml/kg(i.p.),3天一次,6周。
根据表5中所示的研究设计显见,将大鼠分成17组。该研究在第10周终止(即,8周CCl4处理+
2周mRNA治疗)。
[0666] 在治疗后(8周后)在d2、d7、d10、d14收集血液。在研究终止时,收集血液样品,并提交血浆样品用于肝功能测试和凝血酶原时间测量。
[0667] mRNA治疗的功效通过其限制疾病或肝衰竭进展的能力来评估。
[0668] 表5:研究设计
[0669]
[0670]
[0671]
[0672]
[0673] 在单独的实验中,用CVCM配制的mRNA代替LNP配制的mRNA,评估表5的研究设计。
[0674] 进行肝功能测试,即测量丙氨酸氨基转移酶(ALT)、天冬氨酸氨基转移酶(AST)、碱性磷酸酶(ALP),γ-谷氨酰转移酶(GGT)、总胆红素(TBIL)、总蛋白(TP)、氨、白蛋白、球蛋白和白蛋白/球蛋白比例。
[0675] 将约100mg活组织的一部分在液氮中快速冷冻,并储存在-80℃下用于羟脯氨酸估测以评价胶原沉积。对于肝组织中的羟脯氨酸测定,应用标准市售试剂盒,将结果表示为μg/全肝脏或μg/g肝脏。
[0676] 将其余肝组织固定在10%中性缓冲福尔马林中,并在常规组织病理学处理后制备切片。石蜡切片用Masson三色染色进行染色,并由病理学家评估肝纤维化的严重程度。此
外,进行如实施例1中所述的肝功能测试。
[0677] 结果:
[0678] 类似于实施例1,在几组中观察到肝脏中胶原减少。此外,在几组中观察到羟脯氨酸减少。此外,对于一些组,观察到胞外基质沉积减少,包括胶原和羟脯氨酸含量。
[0679] 一些组显示aHSC凋亡明确增加而不影响肝细胞。一些组显示动物模型达到肝硬化状态时的存活率增加。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈