诱导型胱天蛋白酶及使用方法专利检索-过继细胞治疗细胞疗法疗法专利检索查询-专利查询网

诱导型胱天蛋白酶及使用方法

阅读：1006发布：2020-08-25

专利汇可以提供诱导型胱天蛋白酶及使用方法专利检索，专利查询，专利分析的服务。并且本公开内容提供诱导型胱天蛋白酶多肽，包含诱导型胱天蛋白酶多肽和编码诱导型胱天蛋白酶多肽的序列的组合物，经修饰以表达本公开内容的多肽和组合物的细胞，以及制备它们的方法和使用它们用于过继细胞疗法的方法。，下面是诱导型胱天蛋白酶及使用方法专利的具体信息内容。

权利要求

1.一种诱导型胱天蛋白酶多肽，其包含
(a) 配体结合区，
(b) 接头，和
(c) 截短的胱天蛋白酶9多肽，
其中诱导型胱天蛋白酶多肽不包含非人类序列。
2.权利要求1的多肽，其中非人类序列是限制性位点。
3. 权利要求1或2的多肽，其中配体结合区包含FK506结合蛋白12 (FKBP12)多肽。
4.权利要求1-3的任一项的多肽，其中氨基酸序列包含该序列36位的修饰。
5. 权利要求4的多肽，其中修饰是缬氨酸(V)取代36位的苯丙氨酸(F) (F36V)。
6. 权利要求3-5的任一项的多肽，其中FKBP12多肽由包含以下的氨基酸序列编码： GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 3)。
7.权利要求6的多肽，其中FKBP12多肽由包含以下的核酸序列编码：
GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATTTCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCTGGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGCCCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGGGAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACTGACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAGGGATCATTCCCCCTCATGCCACCCTGGTCTTCGAT GTGGAACTGCTGAAGCTGGAG (SEQ ID NO: 4)。
8. 权利要求1-7的任一项的多肽，其中接头区由包含GGGGS (SEQ ID NO: 5)的氨基酸编码。
9. 权利要求8的多肽，其中接头区由包含GGAGGAGGAGGATCC (SEQ ID NO: 6)的核酸序列编码。
10.权利要求1-9的任一项的多肽，其中截短的胱天蛋白酶9多肽由不包含序列的87位的精氨酸(R)的氨基酸序列编码。
11.权利要求1-10的任一项的多肽，其中截短的胱天蛋白酶9多肽由不包含序列的282位的丙氨酸(A)的氨基酸序列编码。
12. 权利要求1-11的任一项的多肽，其中截短的胱天蛋白酶9多肽由包含以下的氨基酸编码：GFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKTS (SEQ ID NO: 7)。
13.权利要求12的多肽，其中截短的胱天蛋白酶9多肽由包含以下的核酸序列编码：
TTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGCCGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCTGATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAACACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTTCTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGCCAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACCATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGGTGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACAGACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAACGGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTTATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGTGGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTGAACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACCAGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCGTGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCAAGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAACAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGTGGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCGGGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 8)。
14.权利要求1-13的任一项的多肽，其中多肽由包含以下的氨基酸序列编码：
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLEGGGGSGFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKTS (SEQ ID NO: 9)。
15. 权利要求14的多肽，其中多肽由包含以下的核酸序列编码：GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATTTCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCTGGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGCCCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGGGAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACTGACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAGGGATCATTCCCCCTCATGCCACCCTGGTCTTCGATGTGGAACTGCTGAAGCTGGAGGGAGGAGGAGGATCCGGATTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGCCGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCTGATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAACACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTTCTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGCCAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACCATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGGTGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACAGACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAACGGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTTATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGTGGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTGAACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACCAGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCGTGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCAAGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAACAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGTGGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCGGGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 10)。
16.一种包含任一项前述权利要求的诱导型胱天蛋白酶多肽的组合物。
17.一种包含任一项前述权利要求的诱导型胱天蛋白酶多肽的转座子。
18.权利要求17的转座子，其还包含编码治疗蛋白的序列。
19.权利要求18的转座子，其中治疗蛋白是天然存在的。
20.权利要求18的转座子，其中治疗蛋白不是天然存在的。
21.权利要求18-20的任一项的转座子，其中治疗蛋白包含细胞表面蛋白、膜结合蛋白、细胞外膜结合蛋白、细胞内膜结合蛋白、细胞内蛋白、核定位蛋白、核蛋白、细胞质蛋白、胞浆蛋白、分泌蛋白、溶酶体蛋白、内体蛋白、囊泡相关蛋白、线粒体蛋白、内质网蛋白、细胞骨架蛋白、参与细胞内信号传导的蛋白和/或参与细胞外信号传导的蛋白。
22.权利要求18-20的任一项的转座子，其中治疗蛋白包含抗原受体。
23.权利要求22的转座子，其中抗原受体包含T-细胞受体(TCR)。
24.权利要求23的转座子，其中抗原受体包含变异的或重组的T-细胞受体(TCR)。
25.权利要求23-25的任一项的转座子，其中抗原受体是嵌合抗原受体(CAR)。
26.权利要求26的转座子，其中CAR包含一或多个Centyrin序列。
27.权利要求26的转座子，其中CAR是CARTyrin。
28.权利要求25的转座子，其中CAR包含一或多个VHH序列。
29.权利要求28的转座子，其中CAR是一种VCAR。
30.权利要求17-29的任一项的转座子，其中转座子包含至少一种自切肽。
31.权利要求30的转座子，其中转座子包含至少一种自切肽，且其中自切肽位于诱导型胱天蛋白酶多肽和转座子中的另一个序列之间。
32.权利要求30的转座子，其中转座子包含至少一种自切肽，且其中第一自切肽位于诱导型胱天蛋白酶多肽的上游，和第二自切肽位于诱导型胱天蛋白酶多肽的下游。
33.权利要求30-32的任一项的转座子，其中至少一种自切肽包含T2A肽、GSG-T2A肽、E2A肽、GSG-E2A肽、F2A肽、GSG-F2A肽、P2A肽或GSG-P2A肽。
34. 权利要求33的转座子，其中T2A肽包含含有EGRGSLLTCGDVEENPGP (SEQ ID NO:
11)的氨基酸序列。
35. 权利要求33的转座子，其中GSG-T2A肽包含含有GSGEGRGSLLTCGDVEENPGP (SEQ ID NO: 12)的氨基酸序列。
36. 权利要求33的转座子，其中E2A肽包含含有QCTNYALLKLAGDVESNPGP (SEQ ID NO:
13)的氨基酸序列。
37. 权利要求33的转座子，其中GSG-E2A肽包含含有GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 14)的氨基酸序列。
38. 权利要求33的转座子，其中F2A肽包含含有VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 15)的氨基酸序列。
39. 权利要求33的转座子，其中GSG-F2A肽包含含有GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 16)的氨基酸序列。
40. 权利要求33的转座子，其中P2A肽包含含有ATNFSLLKQAGDVEENPGP (SEQ ID NO:
17)的氨基酸序列。
41. 权利要求44的转座子，其中GSG-P2A肽包含含有 GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18)的氨基酸序列。
42.权利要求17-41的任一项的转座子，其中转座子是piggyBac转座子。
43.一种组合物，其包含权利要求17-42的任一项的转座子。
44.权利要求43的组合物，其中转座子是piggyBac转座子和其中组合物还包含含有编码转座酶的序列的质粒。
45.权利要求44的组合物，其中编码转座酶的序列是mRNA序列。
46.权利要求44或45的组合物，其中转座酶是piggyBac转座酶。
47. 权利要求46的组合物，其中piggyBac转座酶包含含有SEQ ID NO: 1的氨基酸序列。
48. 权利要求46或47的组合物，其中piggyBac转座酶是一种超活性变体，和其中超活性变体包含在SEQ ID NO: 1的位置30、165、282和538的一个或多个的氨基酸取代。
49. 权利要求48的组合物，其中SEQ ID NO: 1的30位的氨基酸取代是缬氨酸(V)取代异亮氨酸(I) (I30V)。
50. 权利要求48的组合物，其中SEQ ID NO: 1的165位的氨基酸取代是丝氨酸(S)取代甘氨酸(G) (G165S)。
51. 权利要求48的组合物，其中SEQ ID NO: 1的282位的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M) (M282V)。
52. 权利要求48的组合物，其中SEQ ID NO: 1的538位的氨基酸取代是赖氨酸(K)取代天冬酰胺(N) (N538K)。
53. 权利要求48-52的任一项的组合物，其中转座酶是一种超级piggyBac (SPB)转座酶。
54. 权利要求53的组合物，其中超级piggyBac (sPBo)转座酶包含含有SEQ ID NO: 2的氨基酸序列。
55.权利要求43的组合物，其中转座子是睡美人转座子和其中组合物还包含含有编码转座酶的序列的质粒。
56.权利要求55的组合物，其中编码转座酶的序列包含编码睡美人转座酶或超活性睡美人转座酶(SB100X)的序列。
57.权利要求43的组合物，其中转座子是Helraiser转座子和其中组合物还包含含有编码转座酶的序列的质粒。
58.权利要求57的组合物，其中编码转座酶的序列包含编码Helitron转座酶的序列。
59.权利要求43的组合物，其中转座子是Tol2转座子和其中组合物还包含含有编码转座酶的序列的质粒。
60.权利要求59的组合物，其中编码转座酶的序列包含编码Tol2转座酶的序列。
61.权利要求56、58或60的任一项的组合物，其中编码转座酶的序列是mRNA序列。
62.一种载体，其包含权利要求1-15的任一项的诱导型胱天蛋白酶多肽。
63.权利要求62的载体，其中载体是病毒载体。
64.权利要求63的载体，其中病毒载体包含从逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)或其任何组合中分离或衍生的序列。
65.权利要求63或64的载体，其中病毒载体包含从逆转录病毒分离或衍生的序列。
66.权利要求65的载体，其中逆转录病毒是γ逆转录病毒。
67.权利要求65的载体，其中逆转录病毒是慢病毒。
68.权利要求63或64的载体，其中病毒载体包含从腺相关病毒(AAV)分离或衍生的序列。
69.权利要求68的载体，其中AAV包含血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11的AAV。
70.权利要求68的载体，其中AAV包含从rAAV-LK03、rAAV-NP59或rAAV-NP84分离或衍生的序列。
71.权利要求63-70的任一项的载体，其中病毒载体是一种重组载体。
72.权利要求62的载体，其中载体是一种纳米粒子载体。
73.权利要求72的载体，其中纳米粒子载体包含核酸、氨基酸、聚合物、胶束、脂质、有机分子、无机分子或其任何组合。
74.权利要求62-73的任一项的载体，其中载体包含至少一种自切肽。
75.权利要求62-74的任一项的载体，其中载体包含至少一种自切肽，且其中自切肽位于诱导型胱天蛋白酶多肽和载体的另一个序列之间。
76.权利要求62-74的任一项的载体，其中载体包含至少一种自切肽，且其中第一自切肽位于诱导型胱天蛋白酶多肽的上游，和第二自切肽位于诱导型胱天蛋白酶多肽的下游。
77.权利要求74-76的任一项的载体，其中至少一种自切肽包含T2A肽、GSG-T2A肽、E2A肽、GSG-E2A肽、F2A肽、GSG-F2A肽、P2A肽或GSG-P2A肽。
78. 权利要求77的载体，其中T2A肽包含含有EGRGSLLTCGDVEENPGP (SEQ ID NO: 11)的氨基酸序列。
79. 权利要求77的载体，其中GSG-T2A肽包含含有GSGEGRGSLLTCGDVEENPGP (SEQ ID NO: 12)的氨基酸序列。
80. 权利要求77的载体，其中E2A肽包含含有QCTNYALLKLAGDVESNPGP (SEQ ID NO:
13)的氨基酸序列。
81. 权利要求77的载体，其中GSG-E2A肽包含含有GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 14)的氨基酸序列。
82. 权利要求77的载体，其中F2A肽包含含有VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO:
15)的氨基酸序列。
83. 权利要求77的载体，其中GSG-F2A肽包含含有GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 16)的氨基酸序列。
84. 权利要求77的载体，其中P2A肽包含含有ATNFSLLKQAGDVEENPGP (SEQ ID NO: 17)的氨基酸序列。
85. 权利要求77的载体，其中GSG-P2A肽包含含有GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18)的氨基酸序列。
86.一种组合物，其包含权利要求62-85的任一项的载体。
87.一种细胞，其包含权利要求1-15的任一项的诱导型胱天蛋白酶多肽。
88.一种细胞，其包含权利要求17-42的任一项的转座子。
89.一种细胞，其包含权利要求16或43-61的任一项的组合物。
90.一种细胞，其包含权利要求62-85的任一项的载体。
91.权利要求87-90的任一项的细胞，其中细胞与诱导剂接触后表达诱导型胱天蛋白酶蛋白。
92.权利要求87-91的任一项的细胞，其中细胞是人类细胞。
93.权利要求87-92的任一项的细胞，其中细胞是免疫细胞。
94.权利要求93的细胞，其中免疫细胞是T-细胞、天然杀伤(NK)细胞、天然杀伤(NK)-样细胞、造血祖细胞、外周血(PB)衍生的T细胞或脐带血(UCB)衍生的T-细胞。
95.权利要求94的细胞，其中免疫细胞是T-细胞。
96.权利要求87-91的任一项的细胞，其中细胞是人工抗原呈递细胞。
97.权利要求87-91的任一项的细胞，其中细胞是干细胞。
98.权利要求97的细胞，其中干细胞是胚胎干细胞。
99.权利要求97的细胞，其中干细胞是成人干细胞。
100.权利要求97-99的任一项的细胞，其中干细胞是全能的、多能的或专能的。
101.权利要求97或99的细胞，其中干细胞是诱导性多能干细胞(iPSC)。
102.权利要求87-91的任一项的细胞，其中细胞是体细胞。
103.权利要求102的细胞，其中细胞是从人的心脏；骨骼肌或平滑肌；血管、静脉或毛细血管；脾脏；甲状腺；淋巴结或淋巴管；骨或骨髓；皮肤或内皮；肾上腺；食管；喉；脑或脊髓；
外周神经系统；眼睛；下丘脑；肝脏；嗅觉组织；前列腺；胃；大肠或小肠；肺或支气管；肾脏；
胰腺；胸腺；输尿管或尿道；膀胱；听觉组织；膀胱；甲状旁腺；唾液腺；或气管分离或衍生的。
104.一种组合物，其包含权利要求87-103的任一项的细胞。
105.权利要求104的组合物在过继细胞疗法中的用途。
106.权利要求105的用途，其中细胞是自体的。
107.权利要求105的用途，其中细胞是同种异体的。
108.权利要求104的组合物在离体基因疗法中的用途。
109.权利要求108的用途，其中细胞是自体的。
110.权利要求108的用途，其中细胞是同种异体的。
111.一种在有需要的受试者中更改细胞疗法的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含治疗剂和权利要求1-15的任一项的诱导型胱天蛋白酶多肽，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡。
112.一种在有需要的受试者中更改细胞疗法的方法，其包括给予受试者一种包含细胞的组合物，所述细胞包含治疗剂和权利要求16、43-61或86的任一项的组合物，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡。
113.一种在有需要的受试者中更改细胞疗法的方法，其包括给予受试者一种包含细胞的组合物，所述细胞包含治疗剂、权利要求17-42的任一项的转座子和包含权利要求43-61的任一项的转座酶的组合物，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡。
114.一种在有需要的受试者中更改细胞疗法的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含治疗剂和权利要求62-85的任一项的载体，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡。
115.权利要求111-114的任一项的方法，其中细胞是自体的。
116.权利要求111-114的任一项的方法，其中细胞是同种异体的。
117.权利要求111-116的任一项的方法，其中细胞疗法是过继细胞疗法。
118.权利要求111-117的任一项的方法，其中治疗剂已通过离体基因疗法引入。
119.权利要求118的方法，其中治疗剂是编码修饰的内源性基因、外源性基因或其部分的序列。
120.权利要求111-119的任一项的方法，其中更改是终止细胞疗法。
121.权利要求111-119的任一项的方法，其中更改是细胞疗法中提供的一部分细胞的耗竭。
122. 权利要求111-121的任一项的方法，其还包括给予诱导剂的抑制剂的步骤，以抑制细胞疗法的更改，从而恢复细胞疗法的功能和/或疗效。
123. 一种在有需要的受试者中治疗疾病或障碍的方法，其包括
给予受试者一种包含细胞的组合物，所述细胞包含动力剂和权利要求1-15的任一项的诱导型胱天蛋白酶多肽，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡，且其中包含动力剂的细胞在受试者的靶组织内诱导局部组织毒性，和
在受试者的非靶组织中诱导显著毒性之前，在含有动力剂的细胞中选择性地诱导细胞凋亡，
从而治疗性消除靶组织，保存非靶组织，并治疗受试者的疾病或障碍。
124. 一种在有需要的受试者中治疗疾病或障碍的方法，其包括
给予所述受试者一种包含细胞的组合物，所述细胞包含动力剂和权利要求16、43-61或
86的任一项的组合物，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡，且其中包含动力剂的细胞在受试者的靶组织内诱导局部组织毒性，和
在受试者的非靶组织中诱导显著毒性之前，在含有动力剂的细胞中选择性地诱导细胞凋亡，
从而治疗性消除靶组织，保存非靶组织，并治疗受试者的疾病或障碍。
125. 一种在有需要的受试者中治疗疾病或障碍的方法，其包括
给予所述受试者一种包含细胞的组合物，所述细胞包含动力剂、权利要求17-42的任一项的转座子和包含权利要求43-61的任一项的转座酶的组合物，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡，且其中包含动力剂的细胞在受试者的靶组织内诱导局部组织毒性，和
在受试者的非靶组织中诱导显著毒性之前，在含有动力剂的细胞中选择性地诱导细胞凋亡，
从而治疗性消除靶组织，保存非靶组织，并治疗受试者的疾病或障碍。
126. 一种在有需要的受试者中治疗疾病或障碍的方法，其包括
给予所述受试者一种包含细胞的组合物，所述细胞包含动力剂和权利要求62-85的任一项的载体，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡，且其中包含动力剂的细胞在受试者的靶组织内诱导局部组织毒性，和
在受试者的非靶组织中诱导显著毒性之前，在含有动力剂的细胞中选择性地诱导细胞凋亡，
从而治疗性消除靶组织，保存非靶组织，并治疗受试者的疾病或障碍。
127.权利要求123-126的任一项的方法，其中疾病或障碍是增殖性障碍或癌症。
128.权利要求127的方法，其中靶组织包含肿瘤。
129.权利要求128的方法，其中肿瘤是良性的。
130.权利要求128的方法，其中肿瘤是恶性的。
131.权利要求127-130的任一项的方法，其中靶组织包括切除肿瘤的暴露组织或边缘。
132.权利要求127-130的任一项的方法，其中靶组织包括可能转移的部位。
133.权利要求132的方法，其中转移部位包括淋巴结、淋巴液、外周循环血、局部循环血、骨、骨髓和脑脊液(CSF)中的一种或多种。
134.权利要求123-126的任一项的方法，其中疾病或障碍是炎性疾病或障碍。
135.权利要求134的方法，其中靶组织包括炎症部位。
136.权利要求123-126的任一项的方法，其中疾病或障碍是免疫或自身免疫性疾病或障碍。
137.权利要求136的方法，其中靶组织包括暴露或感染的组织部位。
138.权利要求136的方法，其中靶组织包括烧伤或创伤组织。
139.权利要求123-126的任一项的方法，其中疾病或障碍是传染性疾病或障碍。
140.权利要求139的方法，其中靶组织包括感染的组织。
141.权利要求123-126的任一项的方法，其中疾病或障碍是遗传或表观遗传疾病或障碍。
142.权利要求141的方法，其中与野生型细胞相比，靶组织包括一个或多个包含遗传或表观遗传修饰的细胞。
143.权利要求123-126的任一项的方法，其中疾病或障碍是代谢障碍。
144.权利要求141的方法，其中靶组织包括一个或多个具有代谢障碍的细胞。
145.权利要求123-126的任一项的方法，其中疾病或障碍是血管障碍。
146.权利要求145的方法，其中靶组织包括静脉、血管、毛细血管或循环血液成分的一个或多个细胞。
147.权利要求123-126的任一项的方法，其中疾病或障碍是呼吸性障碍。
148.权利要求147的方法，其中靶组织包括鼻道、食管或肺的一个或多个细胞。
149.权利要求123-126的任一项的方法，其中疾病或障碍是纤维性障碍。
150.权利要求149的方法，其中靶组织包括纤维瘤肿块或靠近纤维瘤肿块的细胞。
151.权利要求123-150的任一项的方法，其中过继细胞疗法包括包含动力剂的细胞。
152.权利要求123-151的任一项的方法，其中包含动力剂的细胞是自体的。
153.权利要求123-151的任一项的方法，其中包含动力剂的细胞是同种异体的。
154.权利要求123-153的任一项的方法，其中包含动力剂的细胞是T-细胞。
155.权利要求123-154的任一项的方法，其中动力剂是非-天然存在的受体。
156.权利要求155的方法，其中非-天然存在的受体是一种合成、修饰、重组或嵌合的受体。
157.权利要求156的方法，其中嵌合受体是嵌合抗原受体(CAR)。
158.权利要求151-154的任一项的方法，其中动力剂包括抗癌剂。
159.权利要求158的方法，其中抗癌剂包括抗-CD19剂。
160.权利要求158的方法，其中抗癌剂包括抗-BCMA剂。
161.权利要求158的方法，其中抗癌剂包括抗-PSMA剂。
162.权利要求158的方法，其中抗癌剂包括抗-Muc1剂。
163.权利要求158-162的任一项的方法，其中动力剂包含非-天然存在的受体。
164.权利要求163的方法，其中非-天然存在的受体包含一种合成、修饰、重组或嵌合的受体。
165.权利要求164的方法，其中嵌合受体是嵌合抗原受体(CAR)。
166.权利要求165的方法，其中CAR包含一个或多个VHH序列。
167.权利要求166的方法，其中CAR是VCAR。
168.权利要求158-167的任一项的方法，其中动力剂诱导发育不全。
169.权利要求168的方法，其中发育不全不是致命的。
170.权利要求158-169的任一项的方法，其中诱导剂消除了包含动力剂的细胞。
171.权利要求158-170的任一项的方法，其中诱导剂消除或减少发育不全的体征或症状。

说明书全文

诱导型胱天蛋白酶及使用方法

[0001] 相关申请本申请要求临时申请USSN 62/405,184 (2016年10月6日提交)的权益，其内容通过引
用以其整体并入本文。

[0002] 并入序列表命名为“POTH-011_001WO_SeqList.txt”的文档的内容，其于2017年10月6日创建，文档大小为61 KB，通过引用以其整体并入本文。

[0003] 本公开内容的领域本公开内容涉及分子生物学，且更特别地涉及包含至少一个编码诱导型胱天蛋白酶蛋
白的序列的组合物，以及其制备和使用方法。

[0004] 背景对于选择性诱导遗传修饰的细胞、尤其是那些打算作为例如过继细胞疗法给予受试者
的修饰的细胞的细胞凋亡的方法，在本领域中一直存在长期研究而未得到满足的需求。本公开内容提供对这种长期研究而未得到满足的需求的解决方案。

[0005] 概述本公开内容提供了一种可操作地连接到配体结合区的诱导型促凋亡多肽，所述区域可
被优化以结合二聚的化学诱导剂。当配体结合区与诱导剂特异性结合时，促凋亡目标分子被交联，从而激活以选择性地诱导含有本公开内容的诱导型促凋亡多肽的细胞的细胞凋亡。本公开内容的优选的诱导型促凋亡多肽包括，但不限于诱导型胱天蛋白酶多肽。本公开内容的优选的诱导型胱天蛋白酶多肽包括，但不限于诱导型胱天蛋白酶9多肽。本公开内容的优选的诱导型胱天蛋白酶9多肽可包含由编码截短的胱天蛋白酶9多肽的截短或修饰氨基酸和/或核酸序列编码的截短胱天蛋白酶9多肽。

[0006] 本公开内容的诱导型促凋亡多肽优于现有的诱导型多肽，因为本公开内容的诱导型促凋亡多肽的免疫原性要低得多。虽然本公开内容的诱导型促凋亡多肽是重组多肽，因此非-天然存在的，经重组以产生本公开内容的诱导型促凋亡多肽的序列并不包括宿主人类免疫系统能够识别为“非自身”的非人类序列，因此在接受本公开内容的诱导型促凋亡多肽、包含诱导型促凋亡多肽的细胞或包含诱导型促凋亡多肽或包含诱导型促凋亡多肽的细胞的组合物的受试者中诱导免疫应答。虽然接头序列是人工序列，但接头序列不包含非人类序列。例如，接头序列不包含限制性位点。

[0007] 本公开内容提供一种诱导型促凋亡多肽，其包含(a) 配体结合区，(b) 接头，和(c) 促凋亡多肽，其中诱导型促凋亡多肽不包含非人类序列。在某些实施方案中，非人类序列包含限制性位点。在某些实施方案中，配体结合区可以是多聚配体结合区。

[0008] 本公开内容提供一种诱导型胱天蛋白酶多肽，其包含(a) 配体结合区，(b) 接头，和(c) 胱天蛋白酶多肽, 其中诱导型促凋亡多肽不包含非人类序列。在某些实施方案中，非人类序列包含限制性位点。在某些实施方案中，配体结合区可以是多聚配体结合区。

[0009] 本公开内容提供一种诱导型胱天蛋白酶多肽，其包含(a) 配体结合区，(b) 接头，和(c) 截短的胱天蛋白酶9多肽，其中诱导型促凋亡多肽不包含非人类序列。在某些实施方案中，非人类序列包含限制性位点。在某些实施方案中，配体结合区可以是多聚配体结合区。

[0010] 在诱导型胱天蛋白酶多肽的某些实施方案中，配体结合区可特异性地结合诱导剂并激活本公开内容的促凋亡多肽(如胱天蛋白酶多肽)的转录作用。例如，配体结合区不会结合治疗剂。被本公开内容的诱导型多肽配体结合区特异性地结合的诱导剂不直接诱导内源性基因的转录作用。

[0011] 本公开内容的诱导型促凋亡(如胱天蛋白酶)多肽可受一个或多个转录调节元件的控制，包括但不限于启动子，该启动子能够启动胱天蛋白酶多肽在经修饰以包含本公开内容的诱导型胱天蛋白酶多肽的细胞中的转录作用。例如，本公开内容的诱导型胱天蛋白酶多肽可受一个或多个转录调节元件的控制，包括但不限于哺乳动物启动子，该启动子能够启动胱天蛋白酶多肽在经修饰以包含本公开内容的诱导型胱天蛋白酶多肽的哺乳动物细胞中的转录作用。例如，本公开内容的诱导型胱天蛋白酶多肽可受一个或多个转录调节元件的控制，包括但不限于异源或外源启动子，该启动子能够启动胱天蛋白酶多肽在经修饰以包含本公开内容的诱导型胱天蛋白酶多肽的哺乳动物细胞中的转录作用。优选的哺乳动物细胞包括，但不限于人类细胞。

[0012] 本公开内容提供一种诱导型胱天蛋白酶多肽，其包含(a) 配体结合区，(b) 接头，和(c) 截短的胱天蛋白酶9多肽，其中诱导型促凋亡多肽不包含非人类序列。在某些实施方案中，配体结合区可以是多聚配体结合区。

[0013] 在本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽或截短的胱天蛋白酶9多肽的某些实施方案中，配体结合区可包含FK506结合蛋白12 (FKBP12)多肽。在某些实施方案中，包含FK506结合蛋白12 (FKBP12)多肽的配体结合区的氨基酸序列可包含该序列36位的修饰。修饰可以是缬氨酸(V)取代36位的苯丙氨酸(F)(F36V)。在某些实施方案中，FKBP12多肽由包含以下的氨基酸序列编码： GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 3)。在某些实施方案中，FKBP12多肽由包含以下的核酸序列编码：GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATTTCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCTGGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGCCCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGGGAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACTGACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAGGGATCATTCCCCCTCATGCCACCCTGGTCTTCGAT GTGGAACTGCTGAAGCTGGAG (SEQ ID NO: 4)。在某些实施方案中，对配体结合区有特异性的诱导剂可包括具有取代36位的苯丙氨酸(F)的缬氨酸(V) (F36V)的FK506结合蛋白12 (FKBP12)多肽，包括AP20187和/或AP1903 (Rimiducid)，两种合成药物。

[0014] 在本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽或截短的胱天蛋白酶9多肽的某些实施方案中，接头区由包含GGGGS (SEQ ID NO: 5)的氨基酸或包含
GGAGGAGGAGGATCC (SEQ ID NO: 6)的核酸序列编码。在某些实施方案中，核酸序列编码不包含限制性位点的接头。

[0015] 在本公开内容的截短的胱天蛋白酶9多肽的某些实施方案中，截短的胱天蛋白酶9多肽由不包含序列的87位精氨酸(R)的氨基酸序列编码。可供选择地，或者另外，在本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽或截短的胱天蛋白酶9多肽的某些实施方案中，截短的胱天蛋白酶9多肽由不包含序列282位的丙氨酸(A)的氨基酸序列编码。在本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽或截短的胱天蛋白酶9多肽的某些实施方案中，截短的胱天蛋白酶9多肽由包含： GFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKTS (SEQ ID NO: 7)的氨基酸或包含TTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGCCGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCTGATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAACACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTTCTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGCCAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACCATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGGTGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACAGACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAACGGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTTATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGTGGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTGAACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACCAGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCGTGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCAAGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAACAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGTGGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCGGGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 8)的核酸序列编码。

[0016] 在诱导型促凋亡多肽的某些实施方案中，其中多肽包含截短的胱天蛋白酶9多肽，诱导型促凋亡多肽由包含：GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLEGGGGSGFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKTS (SEQ ID NO: 9)的氨基酸序列或包含GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATTTCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCTGGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGCCCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGGGAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACTGACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAGGGATCATTCCCCCTCATGCCACCCTGGTCTTCGATGTGGAACTGCTGAAGCTGGAGGGAGGAGGAGGATCCGGATTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGCCGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCTGATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAACACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTTCTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGCCAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACCATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGGTGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACAGACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAACGGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTTATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGTGGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTGAACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACCAGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCGTGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCAAGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAACAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGTGGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCGGGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 10)的核酸序列编码。

[0017] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的组合物。

[0018] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的转座子。

[0019] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的转座子。在本公开内容的转座子的某些实施方案中，所述转座子还包含编码治疗蛋白的序列。在某些实施方案中，治疗蛋白是天然存在的。在某些实施方案中，治疗蛋白是内源性蛋白。在某些实施方案中，治疗蛋白是外源性蛋白。

[0020] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的转座子。在本公开内容的转座子的某些实施方案中，转座子还包含编码治疗蛋白的序列。在某些实施方案中，治疗蛋白不是天然存在的。在某些实施方案中，治疗蛋白是内源性蛋白。在某些实施方案中，治疗蛋白是外源性蛋白。在某些实施方案中，治疗蛋白是合成蛋白。在某些实施方案中，治疗蛋白是嵌合或重组蛋白。在某些实施方案中，治疗蛋白是融合蛋白。在某些实施方案中，治疗蛋白是人类蛋白、野生型蛋白或其序列变体。

[0021] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的转座子。在本公开内容的转座子的某些实施方案中，转座子还包含编码治疗蛋白的序列。在某些实施方案中，治疗蛋白包含细胞表面蛋白、膜结合蛋白、细胞外膜结合蛋白、细胞内膜结合蛋白、细胞内蛋白、核定位蛋白、核蛋白、细胞质蛋白、胞浆蛋白、分泌蛋白、溶酶体蛋白、内体蛋白、囊泡相关蛋白、线粒体蛋白、内质网蛋白、细胞骨架蛋白、参与细胞内信号传导的蛋白和/或参与细胞外信号传导的蛋白。

[0022] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的转座子。在本公开内容的转座子的某些实施方案中，转座子还包含编码治疗蛋白的序列。在某些实施方案中，治疗蛋白包含抗原受体。在某些实施方案中，抗原受体包含T-细胞受体。在某些实施方案中，抗原受体包含从T-细胞受体分离或衍生的受体。在某些实施方案中，抗原受体包含与野生型T-细胞受体的一或多个序列变异和/或突变。在某些实施方案中，T-细胞受体是重组T-细胞受体。

[0023] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的转座子。在本公开内容的转座子的某些实施方案中，转座子还包含编码治疗蛋白的序列。在某些实施方案中，其中抗原受体是嵌合抗原受体(CAR)。在某些实施方案中，CAR包含一种或多种Centyrin序列。在某些实施方案中，CAR是CARTyrin。在某些实施方案中，CAR包含一个或多个VHH序列。在某些实施方案中，CAR是VCAR。

[0024] 在某些实施方案中，本公开内容的转座子可进一步包含至少一种自切肽。在某些实施方案中，本公开内容的转座子可包含至少一种自切肽，且其中自切肽位于本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽和转座子中的另一个序列之间。在某些实施方案中，本公开内容的转座子可包含至少一种自切肽，且其中自切肽位于本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的上游，而第二自切肽位于本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的下游。在某些实施方案中，本公开内容的转座子可包含至少一种自切肽，且其中自切肽位于本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的紧邻上游，而第二自切肽位于本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的紧邻下游。至少一种自切肽可包含T2A肽、GSG-T2A肽、E2A肽、GSG-E2A肽、F2A肽、GSG-F2A肽、P2A肽，或GSG-P2A肽。在某些实施方案中，T2A肽包含含有EGRGSLLTCGDVEENPGP (SEQ ID NO: 11)的氨基酸序列。在某些实施方案中，GSG-T2A肽包含含有GSGEGRGSLLTCGDVEENPGP (SEQ ID NO: 12)的氨基酸序列。在某些实施方案中，E2A肽包含含有QCTNYALLKLAGDVESNPGP (SEQ ID NO: 13)的氨基酸序列。在某些实施方案中，GSG-E2A肽包含含有GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 14)的氨基酸序列。在某些实施方案中，F2A肽包含含有VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 15)的氨基酸序列。在某些实施方案中，GSG- F2A肽包含含有
GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 16)的氨基酸序列。在某些实施方案中，P2A肽包含氨基酸序列包含ATNFSLLKQAGDVEENPGP (SEQ ID NO: 17)的氨基酸序列。在某些实施方案中，GSG-P2A肽包含含有GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18)的氨基酸序列。

[0025] 本公开内容提供一种包含本公开内容的转座子的组合物。在包含转座子的组合物的某些实施方案中，组合物还可包含含有编码转座酶的序列的质粒。序列编码转座酶可以是mRNA序列。在某些实施方案中，转座子是piggyBac转座子。在某些实施方案中，转座子是piggyBac转座子和转座酶是一种超级piggyBac转座酶。

[0026] 本公开内容的转座子可包含piggyBac转座子。在这种方法的某些实施方案中，转座子是一种质粒DNA转座子，其具有编码由两个顺式调节绝缘子元件侧接的本公开内容的诱导型胱天蛋白酶多肽的序列。在某些实施方案中，转座子是piggyBac转座子。本公开内容的转座酶可包括piggyBac转座酶或相容的酶。在某些实施方案中，并且特别是在其中转座子是piggyBac转座子的那些实施方案中，转座酶是piggyBac™或超级piggyBac™ (SPB)转座酶。在某些实施方案中，并且特别是在其中转座酶是一种超级piggyBac™ (SPB)转座酶的那些实施方案中，编码转座酶的序列是mRNA序列。

[0027] 在本公开内容的方法的某些实施方案中，转座酶是piggyBac™ (PB)转座酶。piggyBac (PB)转座酶可包含或由与以下序列有至少75%、80%、85%、90%、95%、99%或任何百分比的同一性的氨基酸序列组成：
1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG
61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG
121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF
181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV
241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD
301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ
361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC
421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN
481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPNEV
541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID
NO: 1)。

[0028] 在本公开内容的方法的某些实施方案中，转座酶是piggyBac™ (PB)转座酶，其包含或由具有在以下序列的位置30、165、282或538的一或多个的氨基酸取代的氨基酸序列组成：1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG
61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG
121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF
181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV
241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD
301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ
361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC
421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN
481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPNEV
541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID
NO: 1)。

[0029] 在某些实施方案中，转座酶是piggyBac™ (PB)转座酶，其包含或由具有在EQ ID NO: 1序列位置30、165、282或538的两个或更多个的氨基酸取代的氨基酸序列组成。在某些实施方案中，转座酶是piggyBac™ (PB)转座酶，其包含或由具有在SEQ ID NO: 1序列位置30、165、282或538的三个或更多个的氨基酸取代的氨基酸序列组成。在某些实施方案中，转座酶是piggyBac™ (PB)转座酶，其包含或由具有在SEQ ID NO: 1序列以下位置30、165、
282或538的每一个的氨基酸取代的氨基酸序列组成。在某些实施方案中，在SEQ ID NO: 1序列的位置30的氨基酸取代是缬氨酸(V)取代异亮氨酸(I)。在某些实施方案中，在SEQ ID NO: 1序列的位置165的氨基酸取代是丝氨酸(S)取代甘氨酸(G)。在某些实施方案中，在SEQ ID NO: 1序列的位置282的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1序列的位置538的氨基酸取代是赖氨酸(K)取代天冬酰胺(N)。

[0030] 在本公开内容的方法的某些实施方案中，转座酶是一种超级piggyBac™ (SPB)转座酶。在某些实施方案中，本公开内容的超级piggyBac™ (SPB)转座酶可包含或由SEQ ID NO: 1的序列的氨基酸序列组成，其中在位置30的氨基酸取代是缬氨酸(V)取代异亮氨酸(I)，在位置165的氨基酸取代是丝氨酸(S)取代甘氨酸(G)，在位置282的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M)，和在位置538的氨基酸取代是赖氨酸(K)取代天冬酰胺(N)。在某些实施方案中，超级piggyBac™ (SPB)转座酶可包含或由与以下序列之间具有至少75%、80%、85%、90%、95%、99%或任何百分比的同一性的氨基酸序列组成：
1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEV SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG
61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG
121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTSATFRD TNEDEIYAFF
181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV
241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RVYIPNKPSK YGIKILMMCD
301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ
361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC
421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN
481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPKEV
541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID
NO: 2)。

[0031] 在本公开内容的方法的某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™或超级piggyBac™转座酶可进一步包含SEQ ID NO: 1或SEQ ID NO: 2序列的位置3、46、82、103、119、125、177、180、185、187、200、207、209、226、235、240、241、243、258、296、298、311、315、319、327、328、340、421、436、
456、470、486、503、552、570和591的一个或多个氨基酸取代。在某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™或超级piggyBac™转座酶可进一步包含在位置46、119、125、177、180、185、187、200、207、209、226、
235、240、241、243、296、298、311、315、319、327、328、340、421、436、456、470、485、503、552和
570的一个或多个氨基酸取代。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置
3的氨基酸取代是天冬酰胺(N)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置46的氨基酸取代是丝氨酸(S)取代丙氨酸(A)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置46的氨基酸取代是苏氨酸(T)取代丙氨酸(A)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置82的氨基酸取代是色氨酸(W)取代异亮氨酸(I)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置103的氨基酸取代是脯氨酸(P)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置119的氨基酸取代是脯氨酸(P)取代精氨酸(R)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置125的氨基酸取代是丙氨酸(A)取代半胱氨酸(C)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置125的氨基酸取代是亮氨酸(L)取代半胱氨酸(C)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置177的氨基酸取代是赖氨酸(K)取代酪氨酸(Y)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置177的氨基酸取代是组氨酸(H)取代酪氨酸(Y)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置180的氨基酸取代是亮氨酸(L)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置180的氨基酸取代是异亮氨酸(I)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置180的氨基酸取代是缬氨酸(V)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置185的氨基酸取代是亮氨酸(L)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置187的氨基酸取代是甘氨酸(G)取代丙氨酸(A)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置200的氨基酸取代是色氨酸(W)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO:
1或SEQ ID NO: 2的位置207的氨基酸取代是脯氨酸(P)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置209的氨基酸取代是苯丙氨酸(F)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置226的氨基酸取代是苯丙氨酸(F)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置235的氨基酸取代是精氨酸(R)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 1的位置240的氨基酸取代是赖氨酸(K)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置241的氨基酸取代是亮氨酸(L)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置243的氨基酸取代是赖氨酸(K)取代脯氨酸(P)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置258的氨基酸取代是丝氨酸(S)取代天冬酰胺(N)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置296的氨基酸取代是色氨酸(W)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置296的氨基酸取代是酪氨酸(Y)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置296的氨基酸取代是苯丙氨酸(F)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置298的氨基酸取代是亮氨酸(L)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置298的氨基酸取代是丙氨酸(A)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1or SEQ ID NO: 2的位置
298的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置311的氨基酸取代是异亮氨酸(I)取代脯氨酸(P)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置311的氨基酸取代是缬氨酸取代脯氨酸(P)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置315的氨基酸取代是赖氨酸(K)取代精氨酸(R)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置319的氨基酸取代是甘氨酸(G)取代苏氨酸(T)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置
327的氨基酸取代是精氨酸(R)取代酪氨酸(Y)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置328的氨基酸取代是缬氨酸(V)取代酪氨酸(Y)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置340的氨基酸取代是甘氨酸(G)取代半胱氨酸(C)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置340的氨基酸取代是亮氨酸(L)取代半胱氨酸(C)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置421的氨基酸取代是组氨酸(H)取代天冬氨酸(D)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置436的氨基酸取代是异亮氨酸(I)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置456的氨基酸取代是酪氨酸(Y)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置470的氨基酸取代是苯丙氨酸(F)取代亮氨酸(L)。
在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置485的氨基酸取代是赖氨酸(K)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置503的氨基酸取代是亮氨酸(L)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置503的氨基酸取代是异亮氨酸(I)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置552的氨基酸取代是赖氨酸(K)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置570的氨基酸取代是苏氨酸(T)取代丙氨酸(A)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置591的氨基酸取代是脯氨酸(P)取代谷氨酰胺(Q)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置591的氨基酸取代是精氨酸(R)取代谷氨酰胺(Q)。

[0032] 在本公开内容的方法的某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™转座酶可包含或超级piggyBac™转座酶可进一步包含在序列SEQ ID NO: 1或SEQ ID NO: 2的位置103、194、372、375、450、509和570的一个或多个氨基酸取代。在本公开内容的方法的某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™转座酶可包含或超级piggyBac™转座酶可进一步包含序列SEQ ID NO: 1或SEQ ID NO: 2的位置103、194、
372、375、450、509和570的2个、3个、4个、5个、6个或更多个的氨基酸取代。在某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™转座酶可包含或超级piggyBac™转座酶可进一步包含在序列SEQ ID NO: 1或SEQ ID NO: 2的位置103、194、372、375、450、509和570的氨基酸取代。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置103的氨基酸取代是脯氨酸(P)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置194的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置372的氨基酸取代是丙氨酸(A)取代精氨酸(R)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置375的氨基酸取代是丙氨酸(A)取代赖氨酸(K)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO:
2的位置450的氨基酸取代是天冬酰胺(N)取代天冬氨酸(D)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置509的氨基酸取代是甘氨酸(G)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置570的氨基酸取代是丝氨酸(S)取代天冬酰胺(N)。在某些实施方案中，piggyBac™转座酶可包含缬氨酸(V)对SEQ ID NO: 1位置194的甲硫氨酸(M)的取代。在某些实施方案，包括其中piggyBac™转座酶可包含缬氨酸(V)取代SEQ ID NO: 1位置194的甲硫氨酸(M)的那些实施方案中，piggyBac™转座酶可进一步包含在序列SEQ ID NO: 1或SEQ ID NO: 2的位置372、375和450的氨基酸取代。在某些实施方案中，piggyBac™转座酶可包含缬氨酸(V)在SEQ ID NO: 1的位置194对甲硫氨酸(M)的取代，丙氨酸(A)在SEQ ID NO: 1的位置372对精氨酸(R)的取代，和丙氨酸(A)在SEQ ID NO: 1的位置375对赖氨酸(K)的取代。在某些实施方案中，piggyBac™转座酶可包含缬氨酸(V)在SEQ ID NO: 1的位置194对甲硫氨酸(M)的取代，丙氨酸(A)在SEQ ID NO: 1的位置372对精氨酸(R)的取代，丙氨酸(A)在SEQ ID NO: 1的位置375对赖氨酸(K)的取代和天冬酰胺(N)对SEQ ID NO: 1的位置450对天冬氨酸(D)的取代。

[0033] 本公开内容提供一种包含本公开内容的转座子的组合物。在这种方法的某些实施方案中，转座子是一种质粒DNA转座子，其序列编码由两个顺式调节绝缘子元件侧接的本公开内容的诱导型胱天蛋白酶多肽。在包含转座子的组合物的某些实施方案中，组合物还可包含含有编码转座酶的序列的质粒。编码转座酶的序列可以是mRNA序列。在某些实施方案中，转座子是睡美人转座子(Sleeping Beauty transposon)。在某些实施方案中，转座子是睡美人转座子和转座酶是睡美人转座酶或超活性睡美人(SB100X)转座酶。

[0034] 本公开内容的转座子可包含睡美人转座子。在某些实施方案，且特别是在其中转座子是睡美人转座子的那些实施方案中，组合物还包含含有编码转座酶的序列的质粒。在某些实施方案中，编码转座酶的序列是编码睡美人转座酶或超活性睡美人(SB100X)转座酶的序列。在某些实施方案中，编码转座酶的序列是mRNA序列。

[0035] 在本公开内容的方法的某些实施方案中，睡美人转座酶包含与以下序列之间的至少75%、80%、85%、90%、95%、99%或任何百分比的同一性的氨基酸序列：1 MGKSKEISQD LRKKIVDLHK SGSSLGAISK RLKVPRSSVQ TIVRKYKHHG TTQPSYRSGR
61 RRVLSPRDER TLVRKVQINP RTTAKDLVKM LEETGTKVSI STVKRVLYRH NLKGRSARKK
121 PLLQNRHKKA RLRFATAHGD KDRTFWRNVL WSDETKIELF GHNDHRYVWR KKGEACKPKN
181 TIPTVKHGGG SIMLWGCFAA GGTGALHKID GIMRKENYVD ILKQHLKTSV RKLKLGRKWV
241 FQMDNDPKHT SKVVAKWLKD NKVKVLEWPS QSPDLNPIEN LWAELKKRVR ARRPTNLTQL
301 HQLCQEEWAK IHPTYCGKLV EGYPKRLTQV KQFKGNATKY (SEQ ID NO: 19)。

[0036] 在本公开内容的方法的某些实施方案中，超活性睡美人(SB100X)转座酶包含包含与以下序列之间的至少75%、80%、85%、90%、95%、99%或任何百分比的同一性的氨基酸序列：1 MGKSKEISQD LRKRIVDLHK SGSSLGAISK RLAVPRSSVQ TIVRKYKHHG TTQPSYRSGR
61 RRVLSPRDER TLVRKVQINP RTTAKDLVKM LEETGTKVSI STVKRVLYRH NLKGHSARKK
121 PLLQNRHKKA RLRFATAHGD KDRTFWRNVL WSDETKIELF GHNDHRYVWR KKGEACKPKN
181 TIPTVKHGGG SIMLWGCFAA GGTGALHKID GIMDAVQYVD ILKQHLKTSV RKLKLGRKWV
241 FQHDNDPKHT SKVVAKWLKD NKVKVLEWPS QSPDLNPIEN LWAELKKRVR ARRPTNLTQL
301 HQLCQEEWAK IHPNYCGKLV EGYPKRLTQV KQFKGNATKY (SEQ ID NO: 20)。

[0037] 本公开内容提供一种包含本公开内容的转座子的组合物。在这种方法的某些实施方案中，转座子是一种质粒DNA转座子，其序列编码由两个顺式调节绝缘子元件侧接的本公开内容的诱导型胱天蛋白酶多肽。在包含转座子的组合物的某些实施方案中，组合物还可包含含有编码转座酶的序列的质粒。序列编码转座酶可以是mRNA序列。在某些实施方案中，转座子是Helraiser转座子。在某些实施方案中，转座子是Helraiser转座子和转座酶是Helitron转座酶。

[0038] 本公开内容的转座子可包含Helraiser转座子。在这种方法的某些实施方案中，转座子是一种质粒DNA转座子，其序列编码由两个顺式调节绝缘子元件侧接的本公开内容的诱导型胱天蛋白酶多肽。在这种方法的某些实施方案中，转座子是Helraiser转座子。在某些实施方案，且特别是在其中转座子是Helraiser转座子的那些实施方案中，组合物还包含含有编码转座酶的序列的质粒。在某些实施方案中，编码转座酶的序列包含编码Helitron转座酶的序列。在某些实施方案中，编码转座酶的序列是mRNA序列。

[0039] 在某些实施方案中，转座酶是Helitron转座酶。Helitron转座酶动员Helraiser转座子，一种来自大约在3000万到3600万年前就很活跃的蝙蝠基因组的古老元件。本公开内容的示例性Helraiser转座子包括Helibat1，其包含含有以下序列的核酸序列：1 TCCTATATAA TAAAAGAGAA ACATGCAAAT TGACCATCCC TCCGCTACGC TCAAGCCACG
61 CCCACCAGCC AATCAGAAGT GACTATGCAA ATTAACCCAA CAAAGATGGC AGTTAAATTT
121 GCATACGCAG GTGTCAAGCG CCCCAGGAGG CAACGGCGGC CGCGGGCTCC CAGGACCTTC
181 GCTGGCCCCG GGAGGCGAGG CCGGCCGCGC CTAGCCACAC CCGCGGGCTC CCGGGACCTT
241 CGCCAGCAGA GAGCAGAGCG GGAGAGCGGG CGGAGAGCGG GAGGTTTGGA GGACTTGGCA
301 GAGCAGGAGG CCGCTGGACA TAGAGCAGAG CGAGAGAGAG GGTGGCTTGG AGGGCGTGGC
361 TCCCTCTGTC ACCCCAGCTT CCTCATCACA GCTGTGGAAA CTGACAGCAG GGAGGAGGAA
421 GTCCCACCCC CACAGAATCA GCCAGAATCA GCCGTTGGTC AGACAGCTCT CAGCGGCCTG
481 ACAGCCAGGA CTCTCATTCA CCTGCATCTC AGACCGTGAC AGTAGAGAGG TGGGACTATG
541 TCTAAAGAAC AACTGTTGAT ACAACGTAGC TCTGCAGCCG AAAGATGCCG GCGTTATCGA
601 CAGAAAATGT CTGCAGAGCA ACGTGCGTCT GATCTTGAAA GAAGGCGGCG CCTGCAACAG
661 AATGTATCTG AAGAGCAGCT ACTGGAAAAA CGTCGCTCTG AAGCCGAAAA ACAGCGGCGT
721 CATCGACAGA AAATGTCTAA AGACCAACGT GCCTTTGAAG TTGAAAGAAG GCGGTGGCGA
781 CGACAGAATA TGTCTAGAGA ACAGTCATCA ACAAGTACTA CCAATACCGG TAGGAACTGC
841 CTTCTCAGCA AAAATGGAGT ACATGAGGAT GCAATTCTCG AACATAGTTG TGGTGGAATG
901 ACTGTTCGAT GTGAATTTTG CCTATCACTA AATTTCTCTG ATGAAAAACC ATCCGATGGG
961 AAATTTACTC GATGTTGTAG CAAAGGGAAA GTCTGTCCAA ATGATATACA TTTTCCAGAT
1021 TACCCGGCAT ATTTAAAAAG ATTAATGACA AACGAAGATT CTGACAGTAA AAATTTCATG
1081 GAAAATATTC GTTCCATAAA TAGTTCTTTT GCTTTTGCTT CCATGGGTGC AAATATTGCA
1141 TCGCCATCAG GATATGGGCC ATACTGTTTT AGAATACACG GACAAGTTTA TCACCGTACT
1201 GGAACTTTAC ATCCTTCGGA TGGTGTTTCT CGGAAGTTTG CTCAACTCTA TATTTTGGAT
1261 ACAGCCGAAG CTACAAGTAA AAGATTAGCA ATGCCAGAAA ACCAGGGCTG CTCAGAAAGA
1321 CTCATGATCA ACATCAACAA CCTCATGCAT GAAATAAATG AATTAACAAA ATCGTACAAG
1381 ATGCTACATG AGGTAGAAAA GGAAGCCCAA TCTGAAGCAG CAGCAAAAGG TATTGCTCCC
1441 ACAGAAGTAA CAATGGCGAT TAAATACGAT CGTAACAGTG ACCCAGGTAG ATATAATTCT
1501 CCCCGTGTAA CCGAGGTTGC TGTCATATTC AGAAACGAAG ATGGAGAACC TCCTTTTGAA
1561 AGGGACTTGC TCATTCATTG TAAACCAGAT CCCAATAATC CAAATGCCAC TAAAATGAAA
1621 CAAATCAGTA TCCTGTTTCC TACATTAGAT GCAATGACAT ATCCTATTCT TTTTCCACAT
1681 GGTGAAAAAG GCTGGGGAAC AGATATTGCA TTAAGACTCA GAGACAACAG TGTAATCGAC
1741 AATAATACTA GACAAAATGT AAGGACACGA GTCACACAAA TGCAGTATTA TGGATTTCAT
1801 CTCTCTGTGC GGGACACGTT CAATCCTATT TTAAATGCAG GAAAATTAAC TCAACAGTTT
1861 ATTGTGGATT CATATTCAAA AATGGAGGCC AATCGGATAA ATTTCATCAA AGCAAACCAA
1921 TCTAAGTTGA GAGTTGAAAA ATATAGTGGT TTGATGGATT ATCTCAAATC TAGATCTGAA
1981 AATGACAATG TGCCGATTGG TAAAATGATA ATACTTCCAT CATCTTTTGA GGGTAGTCCC
2041 AGAAATATGC AGCAGCGATA TCAGGATGCT ATGGCAATTG TAACGAAGTA TGGCAAGCCC
2101 GATTTATTCA TAACCATGAC ATGCAACCCC AAATGGGCAG ATATTACAAA CAATTTACAA
2161 CGCTGGCAAA AAGTTGAAAA CAGACCTGAC TTGGTAGCCA GAGTTTTTAA TATTAAGCTG
2221 AATGCTCTTT TAAATGATAT ATGTAAATTC CATTTATTTG GCAAAGTAAT AGCTAAAATT
2281 CATGTCATTG AATTTCAGAA ACGCGGACTG CCTCACGCTC ACATATTATT GATATTAGAT
2341 AGTGAGTCCA AATTACGTTC AGAAGATGAC ATTGACCGTA TAGTTAAGGC AGAAATTCCA
2401 GATGAAGACC AGTGTCCTCG ACTTTTTCAA ATTGTAAAAT CAAATATGGT ACATGGACCA
2461 TGTGGAATAC AAAATCCAAA TAGTCCATGT ATGGAAAATG GAAAATGTTC AAAGGGATAT
2521 CCAAAAGAAT TTCAAAATGC GACCATTGGA AATATTGATG GATATCCCAA ATACAAACGA
2581 AGATCTGGTA GCACCATGTC TATTGGAAAT AAAGTTGTCG ATAACACTTG GATTGTCCCT
2641 TATAACCCGT ATTTGTGCCT TAAATATAAC TGTCATATAA ATGTTGAAGT CTGTGCATCA
2701 ATTAAAAGTG TCAAATATTT ATTTAAATAC ATCTATAAAG GGCACGATTG TGCAAATATT
2761 CAAATTTCTG AAAAAAATAT TATCAATCAT GACGAAGTAC AGGACTTCAT TGACTCCAGG
2821 TATGTGAGCG CTCCTGAGGC TGTTTGGAGA CTTTTTGCAA TGCGAATGCA TGACCAATCT
2881 CATGCAATCA CAAGATTAGC TATTCATTTG CCAAATGATC AGAATTTGTA TTTTCATACC
2941 GATGATTTTG CTGAAGTTTT AGATAGGGCT AAAAGGCATA ACTCGACTTT GATGGCTTGG
3001 TTCTTATTGA ATAGAGAAGA TTCTGATGCA CGTAATTATT ATTATTGGGA GATTCCACAG
3061 CATTATGTGT TTAATAATTC TTTGTGGACA AAACGCCGAA AGGGTGGGAA TAAAGTATTA
3121 GGTAGACTGT TCACTGTGAG CTTTAGAGAA CCAGAACGAT ATTACCTTAG ACTTTTGCTT
3181 CTGCATGTAA AAGGTGCGAT AAGTTTTGAG GATCTGCGAA CTGTAGGAGG TGTAACTTAT
3241 GATACATTTC ATGAAGCTGC TAAACACCGA GGATTATTAC TTGATGACAC TATCTGGAAA
3301 GATACGATTG ACGATGCAAT CATCCTTAAT ATGCCCAAAC AACTACGGCA ACTTTTTGCA
3361 TATATATGTG TGTTTGGATG TCCTTCTGCT GCAGACAAAT TATGGGATGA GAATAAATCT
3421 CATTTTATTG AAGATTTCTG TTGGAAATTA CACCGAAGAG AAGGTGCCTG TGTGAACTGT
3481 GAAATGCATG CCCTTAACGA AATTCAGGAG GTATTCACAT TGCATGGAAT GAAATGTTCA
3541 CATTTCAAAC TTCCGGACTA TCCTTTATTA ATGAATGCAA ATACATGTGA TCAATTGTAC
3601 GAGCAACAAC AGGCAGAGGT TTTGATAAAT TCTCTGAATG ATGAACAGTT GGCAGCCTTT
3661 CAGACTATAA CTTCAGCCAT CGAAGATCAA ACTGTACACC CCAAATGCTT TTTCTTGGAT
3721 GGTCCAGGTG GTAGTGGAAA AACATATCTG TATAAAGTTT TAACACATTA TATTAGAGGT
3781 CGTGGTGGTA CTGTTTTACC CACAGCATCT ACAGGAATTG CTGCAAATTT ACTTCTTGGT
3841 GGAAGAACCT TTCATTCCCA ATATAAATTA CCAATTCCAT TAAATGAAAC TTCAATTTCT
3901 AGACTCGATA TAAAGAGTGA AGTTGCTAAA ACCATTAAAA AGGCCCAACT TCTCATTATT
3961 GATGAATGCA CCATGGCATC CAGTCATGCT ATAAACGCCA TAGATAGATT ACTAAGAGAA
4021 ATTATGAATT TGAATGTTGC ATTTGGTGGG AAAGTTCTCC TTCTCGGAGG GGATTTTCGA
4081 CAATGTCTCA GTATTGTACC ACATGCTATG CGATCGGCCA TAGTACAAAC GAGTTTAAAG
4141 TACTGTAATG TTTGGGGATG TTTCAGAAAG TTGTCTCTTA AAACAAATAT GAGATCAGAG
4201 GATTCTGCTT ATAGTGAATG GTTAGTAAAA CTTGGAGATG GCAAACTTGA TAGCAGTTTT
4261 CATTTAGGAA TGGATATTAT TGAAATCCCC CATGAAATGA TTTGTAACGG ATCTATTATT
4321 GAAGCTACCT TTGGAAATAG TATATCTATA GATAATATTA AAAATATATC TAAACGTGCA
4381 ATTCTTTGTC CAAAAAATGA GCATGTTCAA AAATTAAATG AAGAAATTTT GGATATACTT
4441 GATGGAGATT TTCACACATA TTTGAGTGAT GATTCCATTG ATTCAACAGA TGATGCTGAA
4501 AAGGAAAATT TTCCCATCGA ATTTCTTAAT AGTATTACTC CTTCGGGAAT GCCGTGTCAT
4561 AAATTAAAAT TGAAAGTGGG TGCAATCATC ATGCTATTGA GAAATCTTAA TAGTAAATGG
4621 GGTCTTTGTA ATGGTACTAG ATTTATTATC AAAAGATTAC GACCTAACAT TATCGAAGCT
4681 GAAGTATTAA CAGGATCTGC AGAGGGAGAG GTTGTTCTGA TTCCAAGAAT TGATTTGTCC
4741 CCATCTGACA CTGGCCTCCC ATTTAAATTA ATTCGAAGAC AGTTTCCCGT GATGCCAGCA
4801 TTTGCGATGA CTATTAATAA ATCACAAGGA CAAACTCTAG ACAGAGTAGG AATATTCCTA
4861 CCTGAACCCG TTTTCGCACA TGGTCAGTTA TATGTTGCTT TCTCTCGAGT TCGAAGAGCA
4921 TGTGACGTTA AAGTTAAAGT TGTAAATACT TCATCACAAG GGAAATTAGT CAAGCACTCT
4981 GAAAGTGTTT TTACTCTTAA TGTGGTATAC AGGGAGATAT TAGAATAAGT TTAATCACTT
5041 TATCAGTCAT TGTTTGCATC AATGTTGTTT TTATATCATG TTTTTGTTGT TTTTATATCA
5101 TGTCTTTGTT GTTGTTATAT CATGTTGTTA TTGTTTATTT ATTAATAAAT TTATGTATTA
5161 TTTTCATATA CATTTTACTC ATTTCCTTTC ATCTCTCACA CTTCTATTAT AGAGAAAGGG
5221 CAAATAGCAA TATTAAAATA TTTCCTCTAA TTAATTCCCT TTCAATGTGC ACGAATTTCG
5281 TGCACCGGGC CACTAG (SEQ ID NO: 21)。

[0040] 与其他转座酶不同，Helitron转座酶不含RNase-H样催化域，但是包含由复制起始结构域(Rep)和DNA解旋酶结构域组成的RepHel基序。Rep结构域是核酸酶的HUH超家族的核酸酶结构域。

[0041] 本公开内容的示例性Helitron转座酶包含含有以下序列的氨基酸序列：1 MSKEQLLIQR SSAAERCRRY RQKMSAEQRA SDLERRRRLQ QNVSEEQLLE KRRSEAEKQR
61 RHRQKMSKDQ RAFEVERRRW RRQNMSREQS STSTTNTGRN CLLSKNGVHE DAILEHSCGG
121 MTVRCEFCLS LNFSDEKPSD GKFTRCCSKG KVCPNDIHFP DYPAYLKRLM TNEDSDSKNF
181 MENIRSINSS FAFASMGANI ASPSGYGPYC FRIHGQVYHR TGTLHPSDGV SRKFAQLYIL
241 DTAEATSKRL AMPENQGCSE RLMININNLM HEINELTKSY KMLHEVEKEA QSEAAAKGIA
301 PTEVTMAIKY DRNSDPGRYN SPRVTEVAVI FRNEDGEPPF ERDLLIHCKP DPNNPNATKM
361 KQISILFPTL DAMTYPILFP HGEKGWGTDI ALRLRDNSVI DNNTRQNVRT RVTQMQYYGF
421 HLSVRDTFNP ILNAGKLTQQ FIVDSYSKME ANRINFIKAN QSKLRVEKYS GLMDYLKSRS
481 ENDNVPIGKM IILPSSFEGS PRNMQQRYQD AMAIVTKYGK PDLFITMTCN PKWADITNNL
541 QRWQKVENRP DLVARVFNIK LNALLNDICK FHLFGKVIAK IHVIEFQKRG LPHAHILLIL
601 DSESKLRSED DIDRIVKAEI PDEDQCPRLF QIVKSNMVHG PCGIQNPNSP CMENGKCSKG
661 YPKEFQNATI GNIDGYPKYK RRSGSTMSIG NKVVDNTWIV PYNPYLCLKY NCHINVEVCA
721 SIKSVKYLFK YIYKGHDCAN IQISEKNIIN HDEVQDFIDS RYVSAPEAVW RLFAMRMHDQ
781 SHAITRLAIH LPNDQNLYFH TDDFAEVLDR AKRHNSTLMA WFLLNREDSD ARNYYYWEIP
841 QHYVFNNSLW TKRRKGGNKV LGRLFTVSFR EPERYYLRLL LLHVKGAISF EDLRTVGGVT
901 YDTFHEAAKH RGLLLDDTIW KDTIDDAIIL NMPKQLRQLF AYICVFGCPS AADKLWDENK
961 SHFIEDFCWK LHRREGACVN CEMHALNEIQ EVFTLHGMKC SHFKLPDYPL LMNANTCDQL
1021 YEQQQAEVLI NSLNDEQLAA FQTITSAIED QTVHPKCFFL DGPGGSGKTY LYKVLTHYIR
1081 GRGGTVLPTA STGIAANLLL GGRTFHSQYK LPIPLNETSI SRLDIKSEVA KTIKKAQLLI
1141 IDECTMASSH AINAIDRLLR EIMNLNVAFG GKVLLLGGDF RQCLSIVPHA MRSAIVQTSL
1201 KYCNVWGCFR KLSLKTNMRS EDSAYSEWLV KLGDGKLDSS FHLGMDIIEI PHEMICNGSI
1261 IEATFGNSIS IDNIKNISKR AILCPKNEHV QKLNEEILDI LDGDFHTYLS DDSIDSTDDA
1321 EKENFPIEFL NSITPSGMPC HKLKLKVGAI IMLLRNLNSK WGLCNGTRFI IKRLRPNIIE
1381 AEVLTGSAEG EVVLIPRIDL SPSDTGLPFK LIRRQFPVMP AFAMTINKSQ GQTLDRVGIF
1441 LPEPVFAHGQ LYVAFSRVRR ACDVKVKVVN TSSQGKLVKH SESVFTLNVV YREILE (SEQ
ID NO: 22)。

[0042] 在Helitron转位中，接近转座子的3’端的发夹作为终止子发挥功能。然而，这种发夹可被转座酶绕过，导致侧翼序列的转换。此外，Helraiser转位产生共价封闭的循环中间体。此外，Helitron转位可能缺少目标位点重复。在Helraiser序列中，转座酶由分别称为LTS和RTS的左右末端序列侧接。这些序列用保守的5’-TC/CTAG-3’基序终止。一个具有形成发夹终止结构的可能性的19 bp回文序列位于RTS上游的11个核苷酸，且由该序列GTGCACGAATTTCGTGCACCGGGCCACTAG (SEQ ID NO: 23)组成。

[0043] 本公开内容提供一种包含本公开内容的转座子的组合物。在这种方法的某些实施方案中，转座子是一种质粒DNA转座子，其序列编码由两个顺式调节绝缘子元件侧接的本公开内容的诱导型胱天蛋白酶多肽。在包含转座子的组合物的某些实施方案中，组合物还可包含含有编码转座酶的序列的质粒。序列编码转座酶可以是mRNA序列。在某些实施方案中，转座子是Tol2转座子。在某些实施方案中，转座子是Tol2转座子和转座酶是Tol2转座酶。

[0044] 本公开内容的转座子可包含Tol2转座子。在这种方法的某些实施方案中，转座子是一种质粒DNA转座子，其序列编码由两个顺式调节绝缘子元件侧接的本公开内容的诱导型胱天蛋白酶多肽。在这种方法的某些实施方案中，转座子是Tol2转座子。在某些实施方案，并且特别是其中转座子是Tol2转座子的那些实施方案中，组合物还包含含有编码转座酶的序列的质粒。在某些实施方案中，编码转座酶的序列包含编码Tol2转座酶的序列。在某些实施方案中，序列编码转座酶是mRNA序列。

[0045] Tol2转座子可能是从青鳉鱼(medaka fish)的基因组中分离或衍生出来的，也可能类似于hAT家族的转座子。本公开的示例性Tol2转座子由一个包含约4.7千碱基的序列编码，并包含一个编码Tol2转座酶的基因，该转座酶包含四个外显子。本公开内容的示例性Tol2转座酶包含含有以下序列的氨基酸序列：1 MEEVCDSSAA ASSTVQNQPQ DQEHPWPYLR EFFSLSGVNK DSFKMKCVLC LPLNKEISAF
61 KSSPSNLRKH IERMHPNYLK NYSKLTAQKR KIGTSTHASS SKQLKVDSVF PVKHVSPVTV
121 NKAILRYIIQ GLHPFSTVDL PSFKELISTL QPGISVITRP TLRSKIAEAA LIMKQKVTAA
181 MSEVEWIATT TDCWTARRKS FIGVTAHWIN PGSLERHSAA LACKRLMGSH TFEVLASAMN
241 DIHSEYEIRD KVVCTTTDSG SNFMKAFRVF GVENNDIETE ARRCESDDTD SEGCGEGSDG
301 VEFQDASRVL DQDDGFEFQL PKHQKCACHL LNLVSSVDAQ KALSNEHYKK LYRSVFGKCQ
361 ALWNKSSRSA LAAEAVESES RLQLLRPNQT RWNSTFMAVD RILQICKEAG EGALRNICTS
421 LEVPMFNPAE MLFLTEWANT MRPVAKVLDI LQAETNTQLG WLLPSVHQLS LKLQRLHHSL
481 RYCDPLVDAL QQGIQTRFKH MFEDPEIIAA AILLPKFRTS WTNDETIIKR GMDYIRVHLE
541 PLDHKKELAN SSSDDEDFFA SLKPTTHEAS KELDGYLACV SDTRESLLTF PAICSLSIKT
601 NTPLPASAAC ERLFSTAGLL FSPKRARLDT NNFENQLLLK LNLRFYNFE (SEQ ID NO:
24)。

[0046] 本公开内容的示例性Tol2转座子，包括反向重复序列、亚末端序列和Tol2转座酶，由包含以下的核酸序列编码：1 CAGAGGTGTA AAGTACTTGA GTAATTTTAC TTGATTACTG TACTTAAGTA TTATTTTTGG
61 GGATTTTTAC TTTACTTGAG TACAATTAAA AATCAATACT TTTACTTTTA CTTAATTACA
121 TTTTTTTAGA AAAAAAAGTA CTTTTTACTC CTTACAATTT TATTTACAGT CAAAAAGTAC
181 TTATTTTTTG GAGATCACTT CATTCTATTT TCCCTTGCTA TTACCAAACC AATTGAATTG
241 CGCTGATGCC CAGTTTAATT TAAATGTTAT TTATTCTGCC TATGAAAATC GTTTTCACAT
301 TATATGAAAT TGGTCAGACA TGTTCATTGG TCCTTTGGAA GTGACGTCAT GTCACATCTA
361 TTACCACAAT GCACAGCACC TTGACCTGGA AATTAGGGAA ATTATAACAG TCAATCAGTG
421 GAAGAAAATG GAGGAAGTAT GTGATTCATC AGCAGCTGCG AGCAGCACAG TCCAAAATCA
481 GCCACAGGAT CAAGAGCACC CGTGGCCGTA TCTTCGCGAA TTCTTTTCTT TAAGTGGTGT
541 AAATAAAGAT TCATTCAAGA TGAAATGTGT CCTCTGTCTC CCGCTTAATA AAGAAATATC
601 GGCCTTCAAA AGTTCGCCAT CAAACCTAAG GAAGCATATT GAGGTAAGTA CATTAAGTAT
661 TTTGTTTTAC TGATAGTTTT TTTTTTTTTT TTTTTTTTTT TTTTTGGGTG TGCATGTTTT
721 GACGTTGATG GCGCGCCTTT TATATGTGTA GTAGGCCTAT TTTCACTAAT GCATGCGATT
781 GACAATATAA GGCTCACGTA ATAAAATGCT AAAATGCATT TGTAATTGGT AACGTTAGGT
841 CCACGGGAAA TTTGGCGCCT ATTGCAGCTT TGAATAATCA TTATCATTCC GTGCTCTCAT
901 TGTGTTTGAA TTCATGCAAA ACACAAGAAA ACCAAGCGAG AAATTTTTTT CCAAACATGT
961 TGTATTGTCA AAACGGTAAC ACTTTACAAT GAGGTTGATT AGTTCATGTA TTAACTAACA
1021 TTAAATAACC ATGAGCAATA CATTTGTTAC TGTATCTGTT AATCTTTGTT AACGTTAGTT
1081 AATAGAAATA CAGATGTTCA TTGTTTGTTC ATGTTAGTTC ACAGTGCATT AACTAATGTT
1141 AACAAGATAT AAAGTATTAG TAAATGTTGA AATTAACATG TATACGTGCA GTTCATTATT
1201 AGTTCATGTT AACTAATGTA GTTAACTAAC GAACCTTATT GTAAAAGTGT TACCATCAAA
1261 ACTAATGTAA TGAAATCAAT TCACCCTGTC ATGTCAGCCT TACAGTCCTG TGTTTTTGTC
1321 AATATAATCA GAAATAAAAT TAATGTTTGA TTGTCACTAA ATGCTACTGT ATTTCTAAAA
1381 TCAACAAGTA TTTAACATTA TAAAGTGTGC AATTGGCTGC AAATGTCAGT TTTATTAAAG
1441 GGTTAGTTCA CCCAAAAATG AAAATAATGT CATTAATGAC TCGCCCTCAT GTCGTTCCAA
1501 GCCCGTAAGA CCTCCGTTCA TCTTCAGAAC ACAGTTTAAG ATATTTTAGA TTTAGTCCGA
1561 GAGCTTTCTG TGCCTCCATT GAGAATGTAT GTACGGTATA CTGTCCATGT CCAGAAAGGT
1621 AATAAAAACA TCAAAGTAGT CCATGTGACA TCAGTGGGTT AGTTAGAATT TTTTGAAGCA
1681 TCGAATACAT TTTGGTCCAA AAATAACAAA ACCTACGACT TTATTCGGCA TTGTATTCTC
1741 TTCCGGGTCT GTTGTCAATC CGCGTTCACG ACTTCGCAGT GACGCTACAA TGCTGAATAA
1801 AGTCGTAGGT TTTGTTATTT TTGGACCAAA ATGTATTTTC GATGCTTCAA ATAATTCTAC
1861 CTAACCCACT GATGTCACAT GGACTACTTT GATGTTTTTA TTACCTTTCT GGACATGGAC
1921 AGTATACCGT ACATACATTT TCAGTGGAGG GACAGAAAGC TCTCGGACTA AATCTAAAAT
1981 ATCTTAAACT GTGTTCCGAA GATGAACGGA GGTGTTACGG GCTTGGAACG ACATGAGGGT
2041 GAGTCATTAA TGACATCTTT TCATTTTTGG GTGAACTAAC CCTTTAATGC TGTAATCAGA
2101 GAGTGTATGT GTAATTGTTA CATTTATTGC ATACAATATA AATATTTATT TGTTGTTTTT
2161 ACAGAGAATG CACCCAAATT ACCTCAAAAA CTACTCTAAA TTGACAGCAC AGAAGAGAAA
2221 GATCGGGACC TCCACCCATG CTTCCAGCAG TAAGCAACTG AAAGTTGACT CAGTTTTCCC
2281 AGTCAAACAT GTGTCTCCAG TCACTGTGAA CAAAGCTATA TTAAGGTACA TCATTCAAGG
2341 ACTTCATCCT TTCAGCACTG TTGATCTGCC ATCATTTAAA GAGCTGATTA GTACACTGCA
2401 GCCTGGCATT TCTGTCATTA CAAGGCCTAC TTTACGCTCC AAGATAGCTG AAGCTGCTCT
2461 GATCATGAAA CAGAAAGTGA CTGCTGCCAT GAGTGAAGTT GAATGGATTG CAACCACAAC
2521 GGATTGTTGG ACTGCACGTA GAAAGTCATT CATTGGTGTA ACTGCTCACT GGATCAACCC
2581 TGGAAGTCTT GAAAGACATT CCGCTGCACT TGCCTGCAAA AGATTAATGG GCTCTCATAC
2641 TTTTGAGGTA CTGGCCAGTG CCATGAATGA TATCCACTCA GAGTATGAAA TACGTGACAA
2701 GGTTGTTTGC ACAACCACAG ACAGTGGTTC CAACTTTATG AAGGCTTTCA GAGTTTTTGG
2761 TGTGGAAAAC AATGATATCG AGACTGAGGC AAGAAGGTGT GAAAGTGATG ACACTGATTC
2821 TGAAGGCTGT GGTGAGGGAA GTGATGGTGT GGAATTCCAA GATGCCTCAC GAGTCCTGGA
2881 CCAAGACGAT GGCTTCGAAT TCCAGCTACC AAAACATCAA AAGTGTGCCT GTCACTTACT
2941 TAACCTAGTC TCAAGCGTTG ATGCCCAAAA AGCTCTCTCA AATGAACACT ACAAGAAACT
3001 CTACAGATCT GTCTTTGGCA AATGCCAAGC TTTATGGAAT AAAAGCAGCC GATCGGCTCT
3061 AGCAGCTGAA GCTGTTGAAT CAGAAAGCCG GCTTCAGCTT TTAAGGCCAA ACCAAACGCG
3121 GTGGAATTCA ACTTTTATGG CTGTTGACAG AATTCTTCAA ATTTGCAAAG AAGCAGGAGA
3181 AGGCGCACTT CGGAATATAT GCACCTCTCT TGAGGTTCCA ATGTAAGTGT TTTTCCCCTC
3241 TATCGATGTA AACAAATGTG GGTTGTTTTT GTTTAATACT CTTTGATTAT GCTGATTTCT
3301 CCTGTAGGTT TAATCCAGCA GAAATGCTGT TCTTGACAGA GTGGGCCAAC ACAATGCGTC
3361 CAGTTGCAAA AGTACTCGAC ATCTTGCAAG CGGAAACGAA TACACAGCTG GGGTGGCTGC
3421 TGCCTAGTGT CCATCAGTTA AGCTTGAAAC TTCAGCGACT CCACCATTCT CTCAGGTACT
3481 GTGACCCACT TGTGGATGCC CTACAACAAG GAATCCAAAC ACGATTCAAG CATATGTTTG
3541 AAGATCCTGA GATCATAGCA GCTGCCATCC TTCTCCCTAA ATTTCGGACC TCTTGGACAA
3601 ATGATGAAAC CATCATAAAA CGAGGTAAAT GAATGCAAGC AACATACACT TGACGAATTC
3661 TAATCTGGGC AACCTTTGAG CCATACCAAA ATTATTCTTT TATTTATTTA TTTTTGCACT
3721 TTTTAGGAAT GTTATATCCC ATCTTTGGCT GTGATCTCAA TATGAATATT GATGTAAAGT
3781 ATTCTTGCAG CAGGTTGTAG TTATCCCTCA GTGTTTCTTG AAACCAAACT CATATGTATC
3841 ATATGTGGTT TGGAAATGCA GTTAGATTTT ATGCTAAAAT AAGGGATTTG CATGATTTTA
3901 GATGTAGATG ACTGCACGTA AATGTAGTTA ATGACAAAAT CCATAAAATT TGTTCCCAGT
3961 CAGAAGCCCC TCAACCAAAC TTTTCTTTGT GTCTGCTCAC TGTGCTTGTA GGCATGGACT
4021 ACATCAGAGT GCATCTGGAG CCTTTGGACC ACAAGAAGGA ATTGGCCAAC AGTTCATCTG
4081 ATGATGAAGA TTTTTTCGCT TCTTTGAAAC CGACAACACA TGAAGCCAGC AAAGAGTTGG
4141 ATGGATATCT GGCCTGTGTT TCAGACACCA GGGAGTCTCT GCTCACGTTT CCTGCTATTT
4201 GCAGCCTCTC TATCAAGACT AATACACCTC TTCCCGCATC GGCTGCCTGT GAGAGGCTTT
4261 TCAGCACTGC AGGATTGCTT TTCAGCCCCA AAAGAGCTAG GCTTGACACT AACAATTTTG
4321 AGAATCAGCT TCTACTGAAG TTAAATCTGA GGTTTTACAA CTTTGAGTAG CGTGTACTGG
4381 CATTAGATTG TCTGTCTTAT AGTTTGATAA TTAAATACAA ACAGTTCTAA AGCAGGATAA
4441 AACCTTGTAT GCATTTCATT TAATGTTTTT TGAGATTAAA AGCTTAAACA AGAATCTCTA
4501 GTTTTCTTTC TTGCTTTTAC TTTTACTTCC TTAATACTCA AGTACAATTT TAATGGAGTA
4561 CTTTTTTACT TTTACTCAAG TAAGATTCTA GCCAGATACT TTTACTTTTA ATTGAGTAAA
4621 ATTTTCCCTA AGTACTTGTA CTTTCACTTG AGTAAAATTT TTGAGTACTT TTTACACCTC
4681 TG (SEQ ID NO: 25)。

[0047] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的载体。在某些实施方案中，载体是病毒载体。

[0048] 本公开内容的病毒载体可包含从逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)或其任何组合中分离或衍生的序列。在某些实施方案中，病毒载体包含从逆转录病毒分离或衍生的序列。在某些实施方案中，逆转录病毒是γ逆转录病毒。在某些实施方案中，逆转录病毒是慢病毒。在某些实施方案中，本公开内容的病毒载体可以是重组载体。

[0049] 本公开内容的病毒载体可包含从腺相关病毒分离或衍生的序列。在某些实施方案中，AAV包含血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11的AAV。在某些实施方案中，AAV包含来自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11的一个或多个序列。在某些实施方案中，AAV包含从AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11的一个或多个分离、衍生或重组的序列。在某些实施方案中，AAV包含从AAV2分离、衍生或重组的序列。在某些实施方案中，包括其中载体越过血脑屏障(BBB)的那些，AAV包含从AAV9分离、衍生或重组的序列。本公开内容的示例性腺相关病毒和重组腺相关病毒包括，但不限于含有一个血清型的基因组和另一个血清型的衣壳的自补AAV (scAAV)和AAV杂种(如AAV2/5、AAV-DJ和AAV-DJ8)。本公开内容的示例性腺相关病毒和重组腺相关病毒包括，但不限于，rAAV-LK03、rAAV-NP59和rAAV-NP84。在某些实施方案中，AAV包含从rAAV-LK03、rAAV-NP59或rAAV-NP84分离或衍生的序列。在某些实施方案中，本公开内容的病毒载体可以是重组载体。

[0050] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的载体。在某些实施方案中，载体是纳米粒子载体。

[0051] 本公开内容的纳米粒子载体可包含核酸、氨基酸、聚合物、胶束、脂质、有机分子、无机分子或其任何组合。纳米颗粒可包含，例如，在国际专利公布号WO 2012/094679、国际专利公布号WO 2016/022805、国际专利公布号WO/2011/133635、国际专利公布号WO/2016/090111、国际专利公布号WO/2017/004498、WO/2017/004509、国际专利申请号PCT/US2017/
030271、美国专利号6,835,394、美国专利号7,217,427和美国专利号7,867,512中公开的聚合物。

[0052] 本公开内容的纳米粒子载体可进一步包含至少一种自切肽。在某些实施方案中，本公开内容的纳米粒子载体可包含至少一种自切肽，且其中自切肽位于本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽和/或诱导型截短的胱天蛋白酶9多肽和另一个连接于纳米颗粒的序列之间。在某些实施方案中，本公开内容的纳米粒子载体可包含至少一种自切肽，且其中自切肽位于本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽和/或诱导型截短的胱天蛋白酶9多肽的上游，而第二自切肽位于本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽，和/或诱导型截短的胱天蛋白酶9多肽的下游。至少一种自切肽可包含T2A肽、GSG-T2A肽、E2A肽、GSG-E2A肽、F2A肽、GSG-F2A肽、P2A肽或GSG-P2A肽。在某些实施方案中，T2A肽包含含有EGRGSLLTCGDVEENPGP (SEQ ID NO: 11)的氨基酸序列。在某些实施方案中，GSG-T2A肽包含含有GSGEGRGSLLTCGDVEENPGP (SEQ ID NO: 12)的氨基酸序列。在某些实施方案中，E2A肽包含含有QCTNYALLKLAGDVESNPGP (SEQ ID NO: 13)的氨基酸序列。在某些实施方案中，GSG-E2A肽包含包含有GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 14)的氨基酸序列。在某些实施方案中，F2A肽包含含有VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 15)的氨基酸序列。在某些实施方案中，GSG-F2A肽包含含有GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 16)的氨基酸序列。在某些实施方案中，P2A肽包含含ATNFSLLKQAGDVEENPGP (SEQ ID NO: 17)的氨基酸序列。在某些实施方案中，GSG-P2A肽包含含有GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18)的氨基酸序列。

[0053] 本公开内容提供一种包含本公开内容的载体的组合物。

[0054] 本公开内容提供一种包含本公开内容的诱导型促凋亡多肽、诱导型胱天蛋白酶多肽、诱导型胱天蛋白酶9多肽和/或诱导型截短的胱天蛋白酶9多肽的细胞。本公开内容提供一种包含本公开内容的转座子的细胞。本公开内容提供一种包含本公开内容的载体的细胞。在某些实施方案中，细胞在与诱导剂接触后表达本公开内容的诱导型胱天蛋白酶蛋白。

[0055] 在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是人类细胞。

[0056] 在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是免疫细胞。免疫细胞的例子包括，但不限于T-细胞、天然杀伤(NK)细胞、天然杀伤(NK)-样细胞、造血祖细胞、外周血(PB)衍生的T细胞和脐带血(UCB)衍生的T-细胞。在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是T-细胞。在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是激活的T-细胞。在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是表达本公开内容的iC9序列的激活的T-细胞。在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是人工抗原呈递细胞(APC)。本公开内容的免疫细胞可进一步包括任何市场上可买到的细胞系或修饰的细胞系，包括，但不限于树突状细胞、B细胞、巨噬细胞和单核细胞的细胞系。

[0057] 在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是免疫细胞。免疫细胞的例子包括，但不限于T-细胞、天然杀伤(NK)细胞、天然杀伤(NK)-样细胞、造血祖细胞、外周血(PB)衍生的T细胞和脐带血(UCB)衍生的T-细胞。在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是T-细胞。在某些实施方案中，细胞是人工抗原呈递细胞。

[0058] 在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是干细胞。本公开内容的干细胞可以是人类干细胞。本公开内容的干细胞可以是胚胎或成人干细胞。本公开内容的干细胞可以是全能的、多能的或专能的。在某些实施方案中，本公开内容的干细胞可以是诱导性多能干细胞(iPSC)。

[0059] 在某些实施方案中，包含本公开内容的多肽、转座子或载体的本公开内容的细胞可以是体细胞。本公开内容的体细胞可以从身体的任何部分，优选从人体中分离出来，包括，但不限于人的心脏；骨骼肌或平滑肌；血管、静脉或毛细血管；脾脏；甲状腺；淋巴结或淋巴管；骨或骨髓；皮肤或内皮；肾上腺；食管；喉；脑或脊髓；外周神经系统；眼睛；下丘脑；肝脏；嗅觉组织；前列腺；胃；大肠或小肠；肺或支气管；肾脏；胰腺；胸腺；输尿管或尿道；膀胱；听觉组织；膀胱；甲状旁腺；唾液腺；或气管。本公开内容的体细胞可以从可分化为身体(优选是人体)任何部分的前体或干细胞中分离或衍生出来，但不限于人的心脏；骨骼肌或平滑肌；血管、静脉或毛细血管；脾脏；甲状腺；淋巴结或淋巴管；骨或骨髓；皮肤或内皮；肾上腺；
食管；喉；脑或脊髓；外周神经系统；眼睛；下丘脑；肝脏；嗅觉组织；前列腺；胃；大肠或小肠；
肺或支气管；肾脏；胰腺；胸腺；输尿管或尿道；膀胱；听觉组织；膀胱；甲状旁腺；唾液腺；或气管。本公开内容的体细胞可以从转分化的细胞中分离或衍生出。

[0060] 本公开内容提供一种包含本公开内容的细胞的组合物，所述细胞包含本公开内容的多肽、转座子或载体。

[0061] 本公开内容提供本公开内容的组合物在过继细胞疗法中的用途。在某些实施方案中，组合物的细胞可以是自体的。在某些实施方案中，组合物的细胞可以是同种异体的。

[0062] 本公开内容提供本公开内容的组合物在离体基因疗法中的用途。在某些实施方案中，组合物的细胞可以是自体的。在某些实施方案中，组合物的细胞可以是同种异体的。

[0063] 本公开内容提供包含本公开内容的细胞的组合物在离体基因疗法中的用途。在应用包含本公开内容的细胞的组合物的某些实施方案中，细胞是自体的。在某些实施方案中，细胞是同种异体的。

[0064] 本公开内容提供一种在有需要的受试者中更改细胞疗法的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含治疗剂和本公开内容的诱导型胱天蛋白酶多肽，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡。

[0065] 本公开内容提供一种在有需要的受试者中更改细胞疗法的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含治疗剂和本公开内容的组合物，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡。

[0066] 本公开内容提供一种在有需要的受试者中更改细胞疗法的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含治疗剂、本公开内容的转座子和包含本公开内容的转座酶的组合物，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡。

[0067] 本公开内容提供一种在有需要的受试者中更改细胞疗法的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含本公开内容的治疗剂和载体，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡。

[0068] 在本公开内容的更改细胞疗法方法的某些实施方案中，组合物的细胞可以是自体的。在某些实施方案中，组合物的细胞可以是同种异体的。在该方法的某些实施方案中，细胞疗法是过继细胞疗法。在某些实施方案中，治疗剂已通过离体基因疗法引入。在某些实施方案中，治疗剂是编码修饰的内源性基因、外源性基因或其部分的序列。在该方法的某些实施方案中，更改细胞疗法是终止细胞疗法。在该方法的某些实施方案中，更改细胞疗法是细胞疗法中提供的一部分细胞的耗竭。这种耗竭可以是短暂的，或者可以维持一段时间，例如在疾病或障碍的缓解期间。在某些实施方案中，该方法还包括以下步骤：给予诱导剂的抑制剂以抑制细胞疗法的更改，从而恢复细胞疗法的功能和/或疗效。例如，如果一种疾病或障碍在缓解后或受试者的不良反应消退后复发，细胞疗法可以通过给予受试者一种诱导剂的抑制剂而恢复。

[0069] 本公开内容的更改细胞疗法的方法可被用来例如根据疾病的恢复迹象或疾病严重程度/进展下降的迹象、疾病缓解/停止的迹象和/或不良事件的发生的反应而终止或抑制治疗。如果疾病的体征或症状再次出现或严重程度增加和/或不良事件得到解决，则可通过抑制诱导剂恢复本公开内容的细胞疗法。

[0070] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含2x105-5x108个细胞每kg体重患者每次给药，或其任何范围、数值或分数。

[0071] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含0.2x106-20x106个细胞每kg体重患者每次给药。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含0.2x106个细胞每kg体重患者每次给药，2x106个细胞每kg体重患者每次给药，20x106个细胞每kg体重患者每次给药，或之间的任何细胞每kg体重患者每次给药。

[0072] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含1x106个细胞或约1x106个细胞每kg体重患者每次给药。

[0073] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含3x106个细胞或约3x106个细胞每kg体重患者每次给药。

[0074] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含0.7x106-6.7x106个细胞每kg体重患者每次给药。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含0.7x106个细胞每kg体重患者每次给药，6.7x106个细胞每kg体重患者每次给药或之间的任何细胞每kg体重患者每次给药。

[0075] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含0.7x106-16x106个细胞每kg体重患者每次给药。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含0.7x106个细胞每kg体重患者每次给药，2x106个细胞每kg体重患者每次给药，6x106个细胞每kg体重患者每次给药，10.7x106个细胞每kg体重患者每次给药，16x106个细胞每kg体重患者每次给药或之间的任何细胞每kg体重患者每次给药。

[0076] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含1.2x106-7.1x106个细胞每kg体重患者每次给药。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含1.2x106个细胞每kg体重患者每次给药，7.1x106个细胞每kg体重患者每次给药或任何数量的细胞每kg体重患者每次给药。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含2x106-3x106个细胞每kg体重患者每次给药。

[0077] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含1x106-2x106个细胞每kg体重患者每次给药。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含1x106个细胞每kg体重患者每次给药，2x106个细胞每kg体重患者每次给药或之间的任何数量的细胞每kg体重患者每次给药。在本公开内容的某些实施方案中，本公开内容的修饰细胞通过注射或静脉输注递送给患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含0.7x106-1.3x106个细胞每kg体重患者每次给药。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含0.7x106个细胞每kg体重患者每次给药，1.3x106个细胞每kg体重患者每次给药或之间的任何数量的细胞每kg体重患者每次给药。

[0078] 在某些实施方案中，包含本公开内容的细胞或本公开内容的修饰细胞的组合物通过注射或静脉输注给予患者。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含一个或多个剂量。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含分割剂量。在某些实施方案中，治疗有效量的本公开内容的组合物或包含本公开内容的修饰细胞的组合物包含初始剂量和维持剂量。

[0079] 本公开内容提供一种在有需要的受试者中治疗疾病或障碍的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含动力剂和本公开内容的诱导型胱天蛋白酶多肽，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡，且其中包含动力剂的细胞在受试者的靶组织内诱导局部组织毒性，和在对受试者的非靶组织诱导毒性之前，有选择地诱导包含动力剂的细胞的细胞凋亡，从而治疗消除靶组织，保存非靶组织，以及治疗受试者的疾病或障碍。

[0080] 如本文所用的，动力剂意欲描述对靶组织具有特异性的治疗剂，或已知/有意或未知/无意对非-靶组织的毒性，在任何一种情况下，这种毒性都可能受到控制或限制，使毒性不会对非-靶组织产生显著影响。动力剂特异性地靶向组织，特异性地和局部地诱导毒性，但在动力剂可能对非-靶组织造成重大毒性或损伤之前，可以使用本公开内容的诱导剂来减少或防止非-靶组织毒性。任何毒性对离靶组织的影响程度(例如对非-靶组织的损害)可能受到诱导剂的施用限制，并可能对应于非-靶组织接触动力剂的持续时间。在本公开内容的某些实施方案中，包含治疗剂的细胞可以同时在多个不同的组织中同时与靶上的肿瘤细胞和靶上的非肿瘤细胞发生反应。通过激活本公开内容的诱导型胱天蛋白酶多肽在包括治疗剂的细胞中保存靶上的非肿瘤细胞，例如在肿瘤被消除后，消除包含本公开内容的诱导型胱天蛋白酶多肽的细胞。在某些实施方案中，非肿瘤离靶效应可能是由于动力剂的交叉反应性所致。在某些实施方案中，如果离靶效应太大，在受试者疾病的治疗完成之前，通过给予诱导剂可以限制或消除动力剂的毒性。

[0081] 本公开内容提供一种在有需要的受试者中治疗疾病或障碍的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含动力剂和本公开内容的组合物，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡，且其中包含动力剂的细胞在受试者的靶组织内诱导局部组织毒性，和在受试者的非靶组织中诱导显著毒性之前，在含有动力剂的细胞中选择性地诱导细胞凋亡，从而治疗性消除靶组织，保存非靶组织，并治疗受试者的疾病或障碍。

[0082] 本公开内容提供一种在有需要的受试者中治疗疾病或障碍的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含动力剂、本公开内容的转座子和包含本公开内容的转座酶的组合物，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡，且其中包含动力剂的细胞在受试者的靶组织内诱导局部组织毒性，和在受试者的非靶组织中诱导显著毒性之前，在含有动力剂的细胞中选择性地诱导细胞凋亡，从而治疗性消除靶组织，保存非靶组织，并治疗受试者的疾病或障碍。

[0083] 本公开内容提供一种在有需要的受试者中治疗疾病或障碍的方法，其包括给予所述受试者一种包含细胞的组合物，所述细胞包含动力剂和本公开内容的载体，其中可通过使细胞接触诱导剂在细胞中选择性地诱导细胞凋亡，且其中包含动力剂的细胞在受试者的靶组织内诱导局部组织毒性，和在受试者的非靶组织中诱导显著毒性之前，在含有动力剂的细胞中选择性地诱导细胞凋亡，从而治疗性消除靶组织，保存非靶组织，并治疗受试者的疾病或障碍。

[0084] 术语“在非-靶组织中的显著毒性”可描述组织细胞死亡(例如，由于坏死或凋亡已死亡)、否则已变得不可存活或已停止进行一项或多项基本的生理功能的毒性水平。在某些实施方案中，显著毒性表示对细胞或组织的永久性损害。在某些实施方案中，显著毒性表示对细胞或组织功能的短暂损失。在某些实施方案中，显著毒性会在某一受试者中引起症状，而这类症状是该领域技术人员识别的。在某些实施方案中，显著毒性会导致死亡，缩短寿命，或降低受试者的生活质量。

[0085] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是增殖性障碍或癌症。在某些实施方案中，靶组织包含肿瘤。在某些实施方案中，肿瘤是良性的。在某些实施方案中，肿瘤是恶性的。在某些实施方案中，靶组织包括切除肿瘤的暴露组织或边缘。在某些实施方案中，靶组织包括可能转移的部位。在某些实施方案中，转移部位包括淋巴结、淋巴液、外周循环血、局部循环血、骨、骨髓和脑脊液(CSF)中的一种或多种。

[0086] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是炎性疾病或障碍。在某些实施方案中，靶组织包括炎症部位。

[0087] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是免疫或自身免疫性疾病或障碍。在某些实施方案中，靶组织包括暴露或感染的组织部位。在某些实施方案中，靶组织包括烧伤或创伤组织。

[0088] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是传染性疾病或障碍。在某些实施方案中，靶组织包括感染的组织。

[0089] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是遗传或表观遗传疾病或障碍。在某些实施方案中，与野生型细胞相比，靶组织包括一个或多个包含遗传或表观遗传修饰的细胞。

[0090] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是代谢障碍。在某些实施方案中，靶组织包括一个或多个具有代谢障碍的细胞。

[0091] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是血管障碍。在某些实施方案中，靶组织包括静脉、血管、毛细血管或循环血液成分的一个或多个细胞。

[0092] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是呼吸性障碍。在某些实施方案中，靶组织包括鼻道、食管或肺的一个或多个细胞。

[0093] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是纤维性障碍。在某些实施方案中，靶组织包括纤维瘤肿块或靠近纤维瘤肿块的细胞。

[0094] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，过继细胞疗法包含包含动力剂的细胞。在某些实施方案中，包含动力剂的细胞是自体的。在某些实施方案中，包含动力剂的细胞是同种异体的。在某些实施方案中，包含动力剂的细胞是T-细胞。在某些实施方案中，动力剂是非-天然存在的受体。在某些实施方案中，非-天然存在的受体是一种合成、修饰、重组或嵌合的受体。在某些实施方案中，嵌合受体是嵌合抗原受体(CAR)。

[0095] 在本公开内容的治疗疾病或障碍方法的某些实施方案中，疾病或障碍是增殖性障碍或癌症。在某些实施方案中，靶组织包含肿瘤。在某些实施方案中，肿瘤的治疗包括组合物，其包含含有本公开内容的诱导型胱天蛋白酶多肽的细胞。在某些实施方案中，包含含有本公开内容的诱导型胱天蛋白酶多肽的细胞的组合物还包含嵌合抗原受体(CAR)。在某些实施方案中，嵌合抗原受体(CAR)特异性地结合在肿瘤细胞上表达的序列，从而赋予CAR对肿瘤细胞的特异性。在某些实施方案中，表达与肿瘤细胞特异结合的CAR的细胞是T-细胞，从而使CAR-T特异性地结合肿瘤细胞。在某些实施方案中，包含特异性地靶向肿瘤细胞的CAR-T细胞的组合物将选择性地仅杀死表达抗原序列的那些肿瘤细胞。然而，在某些实施方案中，肿瘤抗原可在导致在非-靶组织中CAR-T细胞的靶上非-肿瘤活性的其他正常组织中表达。例如，抗原可以是CD19，而CD19几乎完全在B细胞中表达。在CD19的情况下，抗-CD19 CAR-T细胞的离靶活性是极小的。然而，如果例如，抗原是PSMA (叶酸水解酶1)且PSMA在几种正常细胞类型中表达，抗-PSMA CAR-T细胞可除病理靶细胞外，还可能靶向正常细胞，在一种称为靶上非-肿瘤毒性的活动中表达。在某些实施方案中，一旦本公开内容的病理靶细胞(例如，肿瘤细胞)被抗-PSMA CAR-T细胞根除，用本公开内容的诱导剂处理受试者，利用本公开内容的诱导型胱天蛋白酶多肽诱导抗-PSMA CAR-T细胞中的程序性细胞死亡，消除在靶上的非-肿瘤效应。

[0096] 在本公开内容的某些方法中，包括其中过继细胞疗法包含含有动力剂的细胞的那些，所述动力剂包括抗癌剂。在某些实施方案中，抗癌剂包括抗-CD19剂。在某些实施方案中，抗癌剂包括抗-BCMA剂。在某些实施方案中，抗癌剂包括抗-PSMA剂。在某些实施方案中，抗癌剂包括抗-Muc1剂。在某些实施方案中，动力剂包含非-天然存在的受体。在某些实施方案中，非-天然存在的受体包含一种合成、修饰、重组或嵌合的受体。在某些实施方案中，嵌合受体是嵌合抗原受体(CAR)。在某些实施方案中，CAR包含一个或多个VHH序列。在某些实施方案中，CAR是VCAR。在某些实施方案中，动力剂诱发发育不全。在某些实施方案中，发育不全不是致命的。在某些实施方案中，诱导剂消除了包含动力剂的细胞。在某些实施方案中，细胞是T-细胞。在某些实施方案中，诱导剂消除或减少发育不全的体征或症状。在某些实施方案中，CAR-T疗法消除了恶性肿瘤，但继续以健康的B细胞为靶子，以致受试者必须用IVIG输注治疗。在某些实施方案中，抗-BCMA CAR-T疗法消除了受试者自身未变异的浆细胞，以致受试者也必须用IVIG治疗。在某些实施方案中，引起发育不全的CAR-T可通过本公开内容的胱天蛋白酶9多肽和诱导剂消除。在某些实施方案中，使用本公开内容的诱导剂治疗受试者，可减轻发育不全的体征或症状。

[0097] 附图简述图1是一个示意图，它描绘了本公开内容的一个示例性诱导型截短的胱天蛋白酶9多
肽。

[0098] 图2是一系列的流式细胞术图，它描述在经修饰以表达单独的治疗剂(CARTyrin)的细胞中，或与本公开内容的诱导型胱天蛋白酶多肽(由在核转染后第12天被piggyBac (PB)转座酶引入细胞的iC9构建体(也称为“安全开关”)编码)组合，从活细胞区域(门控右下象限)移动到由凋亡细胞填充的区域(左上象限)的细胞的丰度，作为诱导剂(AP1903，也称为Rimiducid)的递增剂量的函数。

[0099] 图3是一系列的流式细胞术图，它描述在经修饰以表达单独的治疗剂(CARTyrin)的细胞中，或与本公开内容的诱导型胱天蛋白酶多肽(由在核转染后第19天被piggyBac (PB)转座酶引入细胞的iC9构建体(也称为“安全开关”)编码)组合，从活细胞区域(门控右下象限)移动到由凋亡细胞填充的区域(左上象限)的细胞的丰度，作为诱导剂(AP1903，也称为Rimiducid)的递增剂量的函数。

[0100] 图4是一对图，它描述了图2 (左图)或图3 (右图)中所示的聚合结果的量化。具体来说，这些图表显示了对每一种修饰的细胞类型在第12天(图2和左图)或第19天(图3和右图)，iC9安全开关对细胞存活率百分比的影响，细胞存活率百分比是iC9开关的诱导剂(AP1903，也称为Rimiducid)浓度的函数。

[0101] 图5是一张图表，它显示了体内研究的研究时间表和大纲。NSG小鼠经IV注射+
MM.1S/萤光素酶细胞，第8天分期，第9天注射T细胞，第12天按规定剂量用AP1903
(Rimiducid)治疗。24小时后，对小鼠实施安乐死，采集血、脾和骨髓细胞，并对huCD45+细胞的存在进行染色。

[0102] 图6是一张图表，它展示了在体内使用Rimiducid (AP1903)高效杀死包含P-BCMA-+ +101的细胞。图6显示在AP1903治疗后血、脾和骨髓中CARTyrin 细胞的存在。对于huCD45 细胞的存在，用流式细胞仪对血、脾和骨髓细胞进行分析。相对存活率由以下因素决定：
((huCD45细胞的数量/msCD45细胞的数量)/(未经治疗组中的huCD45/msCD45的平均数))*
100%/每1,500个珠子事件/每个样品。每个数据点表示不同的小鼠。在x-轴上，从0到175用
25的增量绘制百分比相对CAR-T存活率。在y轴上，从左到右的每幅小图为AP1903
(Rimiducid)治疗后的血、脾和骨髓。AP1903 (Rimiducid)从左到右的小图按以下顺序增加：0 mg/kg、0.005 mg/kg、0.05 mg/kg、0.5 mg/kg、5 mg/kg和在缺乏iC9基因下的5 mg/kg。

[0103] 详细描述本公开内容提供诱导型促凋亡多肽以及包含本公开内容的诱导型促凋亡多肽的转座
子、载体和细胞。本公开内容的诱导型促凋亡多肽可与治疗剂同时或顺序导入细胞内。例如，本公开内容的诱导型促凋亡多肽可与一种或多种编码嵌合抗原受体的序列同时或顺序导入细胞内，以产生一种本公开内容的修饰细胞。本公开内容的修饰细胞可用于基于细胞的疗法。为了控制本公开内容的包含诱导型促凋亡多肽的修饰细胞的活性，任选地，治疗剂、细胞和/或诱导型促凋亡多肽可接触特异性地结合诱导型促凋亡多肽的配体结合区的诱导剂，最终导致包含诱导型促凋亡多肽的细胞的细胞凋亡的启动。当本公开内容的修饰细胞用作细胞疗法时，诱导剂可局部或全身给予接受细胞疗法的受试者。诱导剂的抑制剂可局部或全身给予接受细胞疗法和诱导剂的受试者。

[0104] 如本文所用的，术语“治疗剂”可以指任何一种分子，无论是有机的还是无机的，当被引入打算用于细胞疗法的细胞时，改变细胞的活性、信号传导通路、信号传导结果和/或该细胞与细胞的内或外环境的相互作用，包括但不限于邻近细胞、胞外配体和信号传导分子，细胞宿主的免疫系统或其组成部分、宿主感染、宿主患病细胞(如癌细胞)、细胞内配体和信号传导分子、表观遗传调控、基因转录、基因调控、转录物组、DNA/RNA翻译、蛋白加工或分泌过程以及蛋白质组。治疗剂包括，但不限于重组和/或嵌合细胞表面受体、重组和/或嵌合跨膜受体、重组和/或嵌合离子通道、和重组和/或嵌合抗原受体。在某些实施方案中，治疗剂是嵌合抗原受体(CAR)，任选地，其中抗原识别区包含至少一个Centyrin的嵌合抗原受体。如本公开内容全文所用的，包含Centyrin的CAR被称为CARTyrin。

[0105] 本公开内容提供包含配体结合区、接头和促凋亡肽的诱导型促凋亡多肽，其中诱导型促凋亡多肽不包含非人类序列。在某些实施方案中，非人类序列包含限制性位点。本公开内容的诱导型促凋亡多肽通过与诱导剂的相互作用而二聚化。第一诱导型促凋亡多肽和第二诱导型促凋亡多肽的二聚化促进或激活胱天蛋白酶多肽的相互作用、交联、交叉激活，或激活。胱天蛋白酶多肽的相互作用、交联、交叉激活，或激活包含本公开内容的诱导型促凋亡多肽或编码本公开内容的诱导型促凋亡多肽序列的细胞凋亡的启动。本公开内容的诱导型促凋亡多肽不启动细胞凋亡，除非本公开内容的诱导型促凋亡多肽接触诱导剂。诱导剂和本公开内容的诱导型促凋亡多肽之间的接触可在体内、离体或体外发生。诱导剂和本公开内容的诱导型促凋亡多肽之间的接触可在细胞内发生。

[0106] 至于细胞疗法，本公开内容提供用于过继细胞疗法的修饰的T细胞，其包含诱导型促凋亡多肽或编码本公开内容的诱导型促凋亡多肽的序列。

[0107] 用于过继细胞疗法的修饰的T细胞可以是自体的或同种异体的。如本文所用的术语“同种异体的”，指具有抗原差异的HLA或MHC基因座。从同一物种转移的细胞或组织在抗原上可以是不同的。同基因小鼠可以在一个或多个基因座上有差异(同类系)，而同种异体小鼠可以有相同的背景。

[0108] 用于过继细胞疗法的修饰的T细胞可包括激活的T细胞。T细胞(也称为T淋巴细胞)属于一组称为淋巴细胞的白细胞。淋巴细胞一般参与细胞-介导的免疫。“T细胞”中的“T”指由胸腺产生或其成熟受胸腺影响的细胞。T细胞与其他淋巴细胞类型，如B细胞和天然杀伤(NK)细胞，可通过称为T细胞受体的细胞表面蛋白的存在而区分开来。如本文所用的术语“激活的T细胞”，指通过识别II类主要组织相容性(MHC)标记中提呈的抗原决定簇，被刺激产生免疫应答的T细胞(例如，激活的T细胞的克隆扩张)。T-细胞被抗原决定簇、细胞因子和/或淋巴因子以及分化细胞表面蛋白簇(如CD3、CD4、CD8等及其组合)所激活。表达差异蛋白簇的细胞通常被认为是在T细胞表面表达该蛋白的“阳性”细胞(例如，对于CD3或CD4表达阳性的细胞称为CD3+或CD4+)。CD3和CD4蛋白是可直接和/或间接参与T细胞信号转导的细胞表面受体或共受体。

[0109] 用于过继细胞疗法的修饰的T细胞可包括“全T细胞”。如本文所用的，全T-细胞包括从生物样品中分离出来的所有T淋巴细胞，不按亚型、活化状态、成熟状态或细胞-表面标记表达进行分类。

[0110] 用于过继细胞疗法的修饰的T细胞可从例如全血、外周血、脐带血、淋巴液、淋巴结组织、骨髓和脑脊液(CSF)中获得和/或制备。所谓“获得和/或制备”例如，在细胞的情况下，意味着细胞或细胞培养物是从来源中分离、纯化或部分纯化的，而来源可能是例如脐带血、骨髓或外周血。这些术语也可能适用于原始来源或细胞培养物已被培养且细胞已经复制的情况，以及后代细胞现在是从原始来源衍生而来的情况。如本文所用的术语“外周血”指血液的细胞成分(如红细胞、白细胞和血小板)，它们是从循环的血液池中获得或制备的，而不是在淋巴系统、脾脏、肝脏或骨髓内螯合的细胞。脐带血不同于外周血和淋巴系统、脾脏、肝脏或骨髓中分离的血液。术语“脐带血(umbilical cord blood)”、“脐血(umbilical blood)”或“脐带血液(cord blood)”，它们可互换使用的术语，是指胎儿出生后留在胎盘和附在脐带中的血液。脐带血液常常含有干细胞，包括造血细胞。

[0111] 本公开内容提供包含配体结合区、接头和促凋亡肽的诱导型促凋亡多肽，其中诱导型促凋亡多肽不包含非人类序列。在某些实施方案中，非人类序列包含限制性位点。在某些实施方案中，促凋亡肽是胱天蛋白酶多肽。在某些实施方案中，胱天蛋白酶多肽是胱天蛋白酶9多肽。在某些实施方案中，胱天蛋白酶9多肽是截短的胱天蛋白酶9多肽。本公开内容的诱导型促凋亡多肽可以是非-天然存在的。

[0112] 本公开内容的胱天蛋白酶多肽包括，但不限于胱天蛋白酶1、胱天蛋白酶2、胱天蛋白酶3、胱天蛋白酶4、胱天蛋白酶5、胱天蛋白酶6、胱天蛋白酶7、胱天蛋白酶8、胱天蛋白酶9、胱天蛋白酶10、胱天蛋白酶11、胱天蛋白酶12和胱天蛋白酶14。本公开内容的胱天蛋白酶多肽包括，但不限于与凋亡相关的那些胱天蛋白酶多肽，包括胱天蛋白酶2、胱天蛋白酶3、胱天蛋白酶6、胱天蛋白酶7、胱天蛋白酶8、胱天蛋白酶9和胱天蛋白酶10。本公开内容的胱天蛋白酶多肽包括，但不限于那些启动凋亡的胱天蛋白酶多肽，包括胱天蛋白酶2、胱天蛋白酶8、胱天蛋白酶9和胱天蛋白酶10。本公开内容的胱天蛋白酶多肽包括，但不限于执行凋亡的那些胱天蛋白酶多肽，包括胱天蛋白酶3、胱天蛋白酶6和胱天蛋白酶7。

[0113] 本公开内容的胱天蛋白酶多肽可由与野生型氨基酸或核酸序列相比具有一个或多个修饰的氨基酸或核酸序列编码。编码本公开内容的胱天蛋白酶多肽的核酸序列可以进行密码子优化。与野生型氨基酸或核酸序列相比，对本公开内容的胱天蛋白酶多肽的氨基酸和/或核酸序列的一个或多个修饰可增加本公开内容的胱天蛋白酶多肽的相互作用、交联、交叉激活或激活。可供选择地，或者另外，对本公开内容的胱天蛋白酶多肽的氨基酸和/或核酸序列的一个或多个修饰可能比野生型氨基酸或核酸序列降低本公开内容的胱天蛋白酶多肽的免疫原性。

[0114] 与野生型胱天蛋白酶多肽比较，本公开内容的胱天蛋白酶多肽可被截短。例如，胱天蛋白酶多肽可被截短，以消除编码胱天蛋白酶激活和再招募结构域(CARD)的序列，以消除或最小化激活局部炎症反应的可能性，以及在包含本公开内容的诱导型胱天蛋白酶多肽的细胞中启动凋亡的可能性。编码本公开内容的胱天蛋白酶多肽的核酸序列与野生型胱天蛋白酶多肽相比，可以拼接以形成本公开内容的胱天蛋白酶多肽的变异氨基酸序列。本公开内容的胱天蛋白酶多肽可由重组和/或嵌合序列编码。本公开内容的重组和/或嵌合胱天蛋白酶多肽可包括来自一个或多个不同的胱天蛋白酶多肽的序列。可供选择地，或者另外，本公开内容的重组和/或嵌合胱天蛋白酶多肽可包括来自一个或多个物种的序列(如人类序列和非人类序列)。本公开内容的胱天蛋白酶多肽可以是非-天然存在的。

[0115] 本公开内容的诱导型促凋亡多肽的配体结合区可包括任何多肽序列，其利于或促进第一个本公开内容的诱导型前凋亡多肽与第二个本公开内容的诱导型促凋亡多肽的二聚，其二聚作用激活或诱导促凋亡多肽的交联和细胞凋亡的起始。

[0116] 配体-结合(“二聚”)区可包含任何多肽或其功能结构域，其将允许使用天然或非天然配体(即和诱导剂)引入，例如，非天然合成配体。配体-结合区可能是细胞膜的内部或外部，取决于诱导型促凋亡多肽的性质和配体(即诱导剂)的选择。广泛种类的配体-结合多肽及其功能结构域，包括受体，是已知的。本公开内容的配体-结合区可包括来自受体的一个或多个序列。特别令人感兴趣的是配体结合区，其中配体(例如，小的有机配体)是已知的或可能容易产生。这些配体-结合区或受体可包括，但不限于，FKBP和亲环蛋白受体，甾体受体，四环素受体等，以及“非天然”受体，其可从抗体，特别是重链或轻链亚单位、其突变序列、经随机过程得到的随机氨基酸序列、组合合成等而获得。在某些实施方案中，配体-结合区选自FKBP配体-结合区、亲环蛋白受体配体-结合区、甾体受体配体-结合区、亲环蛋白受体配体-结合区，和四环素受体配体-结合区。

[0117] 包含一个或多个受体结构域的配体-结合区可以有至少约50个氨基酸，和少于约350个氨基酸，通常少于200个氨基酸，或者作为天然结构域或其截短的活性部分。结合区可以例如是小的(< 25 kDa，允许在病毒载体中有效转染)、单体的、非免疫原的、具有易于合成的、细胞可渗透的、无毒的配体，其可配置用于二聚。

[0118] 包含一个或多个受体结构域的配体-结合区可以在细胞内或细胞外，取决于诱导型促凋亡多肽的设计和适宜的配体(即诱导剂)的可利用性。对于疏水性配体，结合区可以是在膜的任一面上，但对于亲水性配体，特别是蛋白配体，结合区将通常是在细胞膜的外面，除非有一种转运系统将配体以一种可供结合的形式内化。对于细胞内受体，包含诱导型促凋亡多肽的诱导型促凋亡多肽或转座子或载体可编码信号肽和受体结构域序列的跨膜结构域5′或3′或可具有受体结构域序列的脂质附着信号序列5′。当受体结构域是在信号肽和跨膜结构域之间时，受体结构域将是在细胞外。

[0119] 抗体和抗体亚单位，例如重链或轻链，特别是片段，更特别是所有或部分的可变区，或重链和轻链的融合以建立高-亲和性结合，可用作本公开内容的配体结合区。设想中的抗体包括为外生表达的人类产物的抗体，如胞外结构域，它不会引起免疫反应，通常不会在周围(即，CNS/脑区外)表达。这样的实例包括，但不限于低亲和力神经生长因子受体(LNGFR)，和胚胎表面蛋白(即癌胚抗原)。此外，还可以制备抗触觉分子的抗体，其在生理上可以接受的，以及筛选出的个体抗体亚基的结合亲和力。cDNA编码亚单位可通过缺失恒定区、可变区的部分、可变区的突变等分离和修饰，以获得对配体具有适当亲和力的结合蛋白结构域。这样，几乎任何生理上可以接受的触觉化合物都可以用作配体或为配体提供一个抗原决定部位。可以用天然受体代替抗体单位，其中结合区或结构域是已知的，并且有一个有用的或已知的配体来结合。

[0120] 为使受体多聚化，用于诱导型促凋亡多肽的配体-结合区/受体结构域的配体可能是多聚体，因为在这个意义上，配体可有至少两个结合位点，每个结合位点都能够结合于配体受体区(即配体具有能够结合第一个诱导型促凋亡多肽的配体-结合区的第一个结合位点和能够结合第二个诱导型促凋亡多肽的配体-结合区的第二个结合位点，其中第一个和第二个诱导型促凋亡多肽的配体-结合区是相同或不同的)。因此，如本文所用的，术语“多聚体配体结合区”指结合于多聚体配体的本公开内容的诱导型促凋亡多肽的配体-结合区。本公开内容的多聚配体包括二聚配体。本公开内容的二聚配体可具有两个能够结合配体受体结构域的结合位点。在某些实施方案中，本公开内容的多聚体配体是二聚体或高阶低聚物，通常由小的合成有机分子组成的不大于约四聚的配体，单个分子通常是至少约150 Da和少于约5 kDa，通常少于约3 kDa。可以使用多种合成配体和受体对。例如，在涉及天然受体的实施方案中，二聚FK506可与FKBP12受体一起使用，二聚环孢菌素A可与亲环蛋白受体一起使用，二聚雌激素与雌激素受体、二聚糖皮质激素与糖皮质激素受体、二聚四环素与四环素受体、二聚维生素D与维生素D受体等。另外，也可以使用高阶配体，例如，三聚体。对于涉及非天然受体的实施方案，例如抗体亚单位、修饰的抗体亚单位、由重链和轻链可变区串联而成的单链抗体，由柔性接头分开，或修饰受体，及其突变序列等，可使用多种化合物中的任何一种。包含本公开内容的多聚体配体的单元的一个显著特征是，各个结合位点能够以高亲和力结合受体，且优选地，它们能够在化学上二聚化。同样，所述方法可用来平衡配体的疏水性/亲水性，以便它们能够以功能水平溶解在血清中，而在大多数应用中则能扩散越过质膜。

[0121] 本公开内容的诱导型促凋亡多肽的激活可通过例如，由诱导剂介导的化学诱导的二聚(CID)完成，以产生一种条件控制的蛋白或多肽。由于不稳定的二聚化剂的降解或单体竞争抑制剂的使用，本公开内容的促凋亡多肽不仅是诱导型的，而且这些多肽的诱导也是可逆的。

[0122] 在某些实施方案中，配体结合区包含FK506结合蛋白12 (FKBP12)多肽。在某些实施方案中，配体结合区包含具有缬氨酸(V)取代位置36的苯丙氨酸(F) (F36V)的FKBP12多肽。在某些实施方案中，其中配体结合区包含具有缬氨酸(V)取代位置36的苯丙氨酸(F) (F36V)的FKBP12多肽，诱导剂可包含AP1903 (Rimiducid)，一种合成药物(CAS索引名：2-哌啶甲酸，1-[(2S)-1-氧代-2-(3,4,5-三甲氧基苯基)丁基]-, 1,2-乙烷二基双[亚氨基(2-氧代-2,1-乙烷二基)氧基-3,1-亚苯基[(1R)-3-(3,4-二甲氧基苯基)亚丙基]]酯, [2S-[1(R*),2R*[S*[S*[1(R*),2R*]]]]]-(9Cl) CAS登记号：195514-63-7；分子式：C78H98N4O20; 分子量: 1411.65))。在某些实施方案中，其中配体结合区包含具有缬氨酸(V)取代位置36的苯丙氨酸(F) (F36V)的FKBP12多肽，诱导剂可包含AP20187 (CAS登记号：195514-80-8和分子式：C82H107N5O20)。在某些实施方案中，诱导剂是AP20187同系物，例如，AP1510。如本文所用的，诱导剂AP20187、AP1903 (Rimiducid)和AP1510可互换使用。

[0123] AP1903 (Rimiducid) API由Alphora Research Inc.产生，而用于注射的AP1903 (Rimiducid)药品由Formatech Inc制造。它被配制为AP1903 (Rimiducid)在非-离子增溶剂Solutol HS 15 (250 mg/mL, BASF)的25%溶液中的5 mg/mL溶液。在室温，这个制剂是稍显黄色的澄清溶液。在制冷时，这个制剂经历了可逆的相变，形成了乳白色的溶液。这种相变在再加热到室温时被逆转。在3 mL玻璃小瓶中装入2.33 mL (每小瓶注射总共大约10 mg AP1903 (Rimiducid))。在确定给予AP1903 (Rimiducid)的需要时，患者可以例如，在2小时内，使用一种非-DEHP、非-环氧乙烷消毒输液器，经由IV输注给予单次固定剂量的注射用AP1903 (Rimiducid) (0.4 mg/kg)。对所有患者的AP1903 (Rimiducid)的剂量分别计算，且不再重新计算，除非体重波动≧10%。经计算的剂量在100 mL的0.9%正常盐水中稀释，然后输注。在AP1903 (Rimiducid)的先前的I期研究中，24名健康志愿者用单剂量的注射用AP1903 (Rimiducid)治疗，以0.01、0.05、0.1、0.5和1.0 mg/kg的剂量水平经IV输注2小时。AP1903 (Rimiducid)血浆水平与剂量成正比，其中对于0.01-1.0 mg/kg剂量范围，平均Cmax值在大约10-1275 ng/mL范围内。初始输注期后，血液浓度显示出快速的分布期，血浆水平在给药后0.5、2和10小时分别减少至大约18、7和1%最大浓度。注射用AP1903
(Rimiducid)显示在所有剂量水平都是安全和耐受性好的，并显示出有利的药代动力学特征。Iuliucci J D等, J Clin Pharmacol. 41: 870-9, 2001。

[0124] 注射用AP1903 (Rimiducid)的固定剂量，例如，可以是0.4 mg/kg，静脉内输注2小时。细胞有效信号转导所需的体外AP1903 (Rimiducid)的量是10-100 nM (1600 Da MW)。这等于16-160 μg/L或˜0.016-1.6 μg/kg (1.6-160 μg/kg)。高达1 mg/kg的剂量在上述AP1903 (Rimiducid)的I期研究中是完全耐受的。因此，0.4 mg/kg可以是AP1903
(Rimiducid)用于与治疗细胞组合的这个I期研究的安全有效的剂量。

[0125] 与野生型氨基酸或核酸序列相比，本公开内容的编码配体结合的氨基酸和/或核酸序列可含有序列一个或多个修饰。例如，本公开内容的氨基酸和/或核酸序列编码配体结合区可以是密码子-优化的序列。与野生型多肽比较，一个或多个修饰可增加配体(如诱导剂)对本公开内容的配体结合区的结合亲和力。做为选择，或者另外地，与野生型多肽比较，一个或多个修饰可降低本公开内容的配体结合区的免疫原性。本公开内容的配体结合区和/或本公开内容的诱导剂可以是非-天然存在的。

[0126] 本公开内容的诱导型促凋亡多肽包含配体结合区、接头和促凋亡肽，其中诱导型促凋亡多肽不包含非-人序列。在某些实施方案中，非-人序列包含限制性位点。接头可包含允许配体结合区二聚、相互作用、交联、交叉激活，或激活促凋亡多肽的任何有机或无机材料，以致促凋亡多肽的相互作用或激活启动细胞凋亡。在某些实施方案中，接头是多肽。在某些实施方案中，接头是包含G/S富含氨基酸序列(“GS”接头)的多肽。在某些实施方案中，接头是包含氨基酸序列GGGGS (SEQ ID NO: 5)的多肽。在优选的实施方案中，接头是多肽，编码多肽的核酸不含限制性内切酶的限制性位点。本公开内容的接头可以是非-天然存在的。

[0127] 本公开内容的诱导型促凋亡多肽可在能够引发和/或调节本公开内容的诱导型促凋亡多肽在细胞中的表达的任何启动子的转录调节下，在细胞中表达。如本文所用的术语“启动子”指用作RNA聚合酶转录基因的起始结合位点的启动子。例如，本公开内容的诱导型促凋亡多肽可在能够启动和/或调节本公开内容的诱导型促凋亡多肽在哺乳动物细胞中的表达的任何启动子的转录调节下，在哺乳动物细胞中表达，包括，但不限于天然的、内源的、外源的和异源的启动子。优选的哺乳动物细胞包括人类细胞。因此，本公开内容的诱导型促凋亡多肽可在能够启动和/或调节本公开内容的诱导型促凋亡多肽在人细胞中的表达的任何启动子的转录调节下，在人类细胞中表达，包括，但不限于人类启动子或病毒性启动子。用于在人类细胞中表达的示例性启动子包括，但不限于人巨细胞病毒(CMV)即刻早期基因启动子、SV40早期启动子、Rous肉瘤病毒长端重复序列、β-肌动蛋白启动子、大鼠胰岛素启动子和甘油醛-3-磷酸脱氢酶启动子，其每一个可被用来获得本公开内容的诱导型促凋亡多肽的高水平表达。也考虑了使用本领域熟知的其它病毒或哺乳动物细胞或细菌噬菌体启动子，以达到本公开内容的诱导型促凋亡多肽的表达，只要表达水平足以引发细胞凋亡。通过使用具有熟知的特性的启动子，可以优化转染或转化后感兴趣蛋白的表达水平和表达模式。

[0128] 选择响应特定生理或合成信号而调节的启动子可允许本公开内容的诱导型促凋亡多肽的诱导型表达。蜕皮激素系统(Invitrogen, Carlsbad, Calif.)就是一个这样的系统。这种系统被设计以允许相关基因在哺乳动物细胞中的调节表达。它由一种严格调控的表达机制组成，几乎不允许转基因的基础水平表达，但是超过200倍的可诱导性。系统是建立在果蝇(Drosophila)异二聚体蜕皮激素受体的基础上的，且当蜕皮激素或类似物例如muristerone A结合受体时，受体激活启动子，以启动mRNA转录子的下游转基因高水平的表达。在该系统中，杂二聚体受体的两个单体由一个载体构成表达，而蜕皮激素-反应性启动子，其驱动感兴趣基因的表达，位于另一个质粒上。因此，将这种类型的系统设计成感兴趣的载体可能是有用的。另一个可能有用的诱导型系统是Tet-Off ™或Tet-On™ 系统(Clontech, Palo Alto, Calif.)，最早由Gossen和Bujard (Gosse和Bujard, Proc.
Natl. Acad. Sci. USA, 89:5547-5551, 1992; Gossen等, Science, 268:1766-1769,
1995)开发。这种系统还允许对四环素或四环素衍生物如多西环素的反应来调节高水平的基因表达。在Tet-On™系统中，基因表达在多西环素的存在下开启，而在Tet-Off™系统中，基因表达在多西环素的不存在下开启。这些系统是基于从大肠杆菌的四环素抗性操纵子衍生出的两个调节元件：四环素操纵子序列(四环素抑制剂结合的序列)和四环素抑制剂蛋白。感兴趣的基因被克隆到启动子后面的质粒中，启动子中含有四环素反应元件。第二个质粒含有称为四环素-受控反式激活剂的调节元件，其在Tet-Off™系统中由源自单纯疱疹病毒的VP16结构域和野生型四环素抑制剂组成。因此在多西环素的不存在下，转录作用被组成型开启。在Tet-On™系统中，四环素抑制剂不是野生型的，且在多西环素的存在下激活转录作用。对于基因疗法载体生产，可使用Tet-Off™系统，以使产生者细胞可以在四环素或多西环素存在下生长，并防止潜在毒性转基因的表达，但当载体引入患者时，基因表达将被组成型开启。

[0129] 在某些情况下，需要调节转基因在基因治疗载体中的表达。例如，采用具有不同活性强度的不同病毒性启动子，这取决于期望水平的表达。在哺乳动物细胞中，CMV即刻早期启动子常常被用来提供强的转录激活。CMV启动子在Donnelly, J. J.等, 1997. Annu. Rev. Immunol. 15:617-48中有评述。当期望转基因的表达水平减少时，效力较差的CMV启动子的修饰版本也被使用。当转基因在造血细胞中的表达是期望的情况下，通常采用逆转录病毒启动子例如来自MLV或MMTV的LTR。取决于所需效果而使用的其它病毒性启动子包括SV40、RSV LTR、HIV-1和HIV-2 LTR，例如来自E1A、E2A或MLP区的腺病毒启动子、AAV LTR、HSV-TK和禽肉瘤病毒。

[0130] 在其它实例中，启动子的选择可能受到发育调控，并且在特定的分化细胞中是活跃的。因此，例如，启动子在多能干细胞中可能不活跃，但是，例如，当多能干细胞分化成更成熟的细胞时，则启动子可能被激活。

[0131] 类似地，组织特异性启动子被用来在特定组织或细胞中进行转录，以减少对非-靶标组织的潜在的毒性或不需要的效应。这些启动子可导致与较强启动子例如CMV启动子比较的表达减少，但也可导致更有限的表达和免疫原性(Bojak, A.等, 2002. Vaccine. 20:1975-79; Cazeaux, N.等, 2002. Vaccine 20:3322-31)。例如，组织特异性启动子例如PSA相关启动子或前列腺特异性腺激肽释放酶，或肌肉肌酸激酶基因可在合适时使用。

[0132] 组织特异性或分化特异性启动子的例子包括，但不限于以下：B29 (B细胞)；CD14 (单核细胞)；CD43 (粒细胞和血小板)；CD45 (造血细胞)；CD68 (巨噬细胞)；间线蛋白(肌肉)；弹性蛋白酶-1 (胰腺腺泡细胞)；内皮蛋白(内皮细胞)；纤连蛋白(分化细胞、愈合组织)；和Flt-1 (内皮细胞)；GFAP (星形胶质细胞)。

[0133] 在某些适应症中，在给予基因治疗载体后的特定时间激活转录作用是可取的。这是用那些激素或细胞因子可以调节的此类启动子来完成的。可使用的细胞因子和炎症蛋白应答启动子包括K和T激肽原(Kageyama等, (1987) J. Biol. Chem., 262, 2345-2351)、c-fos、TNF-α、C-反应性蛋白(Arcone等, (1988) Nucl. Acids Res., 16(8), 3195-3207)、触珠蛋白(Oliviero等, (1987) EMBO J., 6, 1905-1912)、血清淀粉状蛋白A2、C/EBPα、IL-1、IL-6 (Poli和Cortese, (1989) Proc. Nat'l Acad. Sci. USA, 86, 8202-
8206)，补体C3 (Wilson等, (1990) Mol. Cell. Biol., 6181-6191)、IL-8、α-1酸糖蛋白(Prowse和Baumann, (1988) Mol Cell Biol, 8, 42-51)、α-1抗胰蛋白酶、脂蛋白脂肪酶(Zechner等, Mol. Cell. Biol., 2394-2401, 1988)、血管紧张素原(Ron等, (1991) Mol. Cell. Biol., 2887-2895)、纤维蛋白原、c-jun (被佛波醇酯、TNF-α、UV 辐射、维甲酸和过氧化氢诱导)、胶原酶(被佛波醇酯和维甲酸诱导)、金属硫蛋白(重金属和糖皮质激素诱导型)、基质溶素(被佛波醇酯、白细胞介素-1和EGF诱导)、α-2巨球蛋白和α-1抗-糜蛋白酶。其它启动子包括，例如，SV40、MMTV、人免疫缺陷病毒(MV)、莫罗尼病毒、ALV、爱泼斯坦巴尔病毒、劳氏肉瘤病毒、人肌动蛋白、肌球蛋白、血红蛋白和肌酸。

[0134] 已设想上述任何一种启动子单独或与另一种启动子结合使用可能是有用的，这取决于所期望的作用。选择启动子和其它调节元件以使它们在期望的细胞或组织发挥功能。此外，启动子的这个列表不应视为是穷举的或限制性的；其它启动子与本文公开的启动子和方法一起使用。

[0135] 核酸分子本公开内容的核酸分子，包括编码本公开内容的诱导型多肽的序列，可呈现为RNA的形式，如mRNA、hnRNA、tRNA或任何其他形式，或为DNA的形式，包括，但不限于CDNA和通过克隆获得的或合成产生的基因组DNA，或其任何组合。DNA可以是三链、双链或单链的，或其任何组合。DNA或RNA的至少一条链的任何部分可以是编码链，也称为有义链，或它可以是非-编码链，也称为反义链。

[0136] 本公开内容的分离的核酸分子可包含含有开放阅读框(ORF)的核酸分子，任选地具有一个或多个内含子，例如，但不限于至少一个编码本公开内容的诱导型多肽的序列的至少一个特定的部分；包含编码本公开内容的诱导型多肽的序列的核酸分子；和包含基本上不同于上述那些的核苷酸序列，但由于遗传密码的简并性，仍然编码本公开内容的诱导型多肽的核酸分子，如在此描述的和/或如本领域已知的。当然，遗传密码是本领域熟知的。因此，对于本领域技术人员来说，生产这样的简并核酸变体将是常规的，所述核酸变体编码本公开内容的诱导型多肽。见例如，Ausubel等同上，这样的核酸变体被包括在本公开内容内。

[0137] 如在此指明的，本公开内容的包含编码本公开内容的诱导型多肽的核酸的核酸分子可包括，但不限于编码诱导型多肽或片段自身的氨基酸序列的那些；完整的诱导型多肽或其部分的编码序列；本公开内容的诱导型多肽、片段或部分的编码序列，以及附加序列，如至少一个信号先导或融合肽的编码序列，有或没有前面提到的附加编码序列，例如至少一个内含子以及另外的非-编码序列，包括但不限于非-编码5′和3′序列，如在转录、mRNA加工，包括剪接和多腺苷化信号(例如，mRNA的核糖体结合和稳定性)中起作用的转录、非翻译的序列；编码额外的氨基酸的附加编码序列，例如提供额外功能的那些。因此，编码本公开内容的诱导型多肽的序列可融合于标记序列，如编码促进包含蛋白支架片段或部分的融合蛋白支架的纯化的肽的序列。

[0138] 核酸的构建本公开内容的分离的核酸可采用以下方法制备：(a) 重组方法，(b) 合成技术；(c) 纯化技术，和/或(d) 其组合，如本领域熟知的。

[0139] 除了编码本公开内容的诱导型多肽的序列外，所述核酸可方便地还包含其他序列。例如，包含一个或多个限制性内切酶位点的多克隆位点可插入核酸中以帮助分离编码本公开内容的诱导型多肽的序列。同样，可以插入可翻译的序列，以帮助分离本公开内容的翻译的多核苷酸。例如，六-组氨酸标记序列提供了一种纯化本公开内容的胱天蛋白酶蛋白的便利方法。本公开内容的核酸(不包括编码序列)可任选地为用于编码本公开内容的诱导型多肽的序列或本公开内容的诱导型多肽的克隆和/或表达的载体、适配体或接头。

[0140] 附加序列可被加入到这样的克隆和/或表达序列中，以优化它们在克隆和/或表达中的功能，以帮助分离编码本公开内容的诱导型多肽的多核苷酸序列，或改善编码本公开内容的诱导型多肽的多核苷酸序列在细胞中的导入。克隆载体、表达载体、适配体和接头的使用是本领域熟知的(见例如，Ausubel, 同上；或Sambrook, 同上)。

[0141] 构建核酸的重组方法本公开内容的分离的核酸组合物，如RNA、cDNA、基因组DNA或其任何组合，可以使用任意数量的本领域技术人员已知的克隆方法从生物来源获得。在一些实施方案中，在严格的条件下，与本发明的多核苷酸选择性地杂交的寡核苷酸探针被用来鉴定cDNA或基因组DNA库中的期望的序列。RNA的分离、cDNA和基因组库的构建是本领域普通技术人员熟知的(见例如，Ausubel, 同上；或Sambrook, 同上)。

[0142] 核酸筛选和分离方法cDNA或基因组库可使用基于本公开内容的多核苷酸或其片段的序列的探针进行筛选。
探针可被用来与基因组DNA或cDNA序列杂交，以分离同一或不同生物中的同源基因。本领域技术人员将意识到，该方法可采用不同程度的杂交强度；和无论是杂交还是洗涤介质都可以是严格的。因为杂交的条件越来越严格，探针和靶标之间必须有更大程度的互补性，才能形成双链。严格程度可由温度、离子强度、pH和部分变性溶剂如甲酰胺的存在中的一个或多个因素控制。例如，通过改变反应物溶液的极性，可以例如通过控制甲酰胺的浓度在0%-50%的范围内，方便地改变杂交的严格性。为可检测的结合所需的互补性(序列同一性)程度将根据杂交培养基和/或洗涤介质的严格性而有所不同。互补性程度将最好为100%，或70-
100%，或其中的任何范围或值，然而，应该理解，探针和引物中的微小序列变异可以通过减少杂交和/或洗涤介质的严格性来补偿。

[0143] RNA或DNA的扩增方法是本领域熟知的并可依据本公开内容基于本文的讲述和指导采用，而无需不适当的实验。

[0144] DNA或RNA扩增的已知的方法包括，但不限于聚合酶链反应(PCR)和相关扩增过程(参见例如，授予Mullis等的美国专利号4,683,195、4,683,202、4,800,159、4,965,188；授予Tabor等的4,795,699和4,921,794；授予Innis的5,142,033；授予Wilson等的5,122,464；授予Innis的5,091,310；授予Gyllensten等的5,066,584；授予Gelfand等的4,889,818；授予Silver等的4,994,370；授予Biswas的4,766,067；授予Ringold的4,656,134)和RNA介导的扩增(使用作为双链DNA合成模板的目标序列的反义RNA) (授予Malek等的美国专利号5,
130,238，商品名NASBA)，其参考文献的全部内容通过引用并入本文(见例如，Ausubel, 同上；或Sambrook, 同上)。

[0145] 例如，聚合酶链反应(PCR)技术可被用来扩增本公开内容的多核苷酸的序列和直接来自基因组DNA或cDNA库的相关基因。PCR和其它体外扩增方法也可用于例如克隆编码要表达的蛋白的核酸序列，制备用作检测期望的mRNA在样品中的存在的探针的核酸，用于核酸测序或用于其它目的。足以通过体外扩增方法指导技术人员的技术的实例见于Berger, 同上, Sambrook, 同上，和Ausubel, 同上，以及Mullis等美国专利号4,683,202 (1987)；和Innis等PCR Protocols A Guide to Methods and Applications, Eds., Academic Press Inc., San Diego, Calif. (1990)。用于基因组PCR扩增的市售可获得的试剂盒是本领域已知的。见例如，Advantage-GC Genomic PCR Kit (Clontech)。另外，例如，T4基因
32蛋白(Boehringer Mannheim)可被用来提高长PCR产物的收率。

[0146] 构建核酸的合成方法本公开内容的分离的核酸也可以用已知的方法，通过直接化学合成来制备(见例如，
Ausubel等, 同上)。化学合成一般产生单链寡核苷酸，其可以通过与互补序列杂交，或通过使用单链作为模板，用DNA聚合酶聚合而转化成双链DNA。本领域技术人员将认识到，虽然DNA的化学合成可能限制在大约100、500和1000个或更多个碱基的序列，更长的序列可以通过连接较短的序列获得。

[0147] 重组表达盒本公开内容进一步提供包含本公开内容的核酸的重组表达盒。本公开内容的核酸序
列，例如，编码本公开内容的诱导型多肽部分的cDNA或基因组序列，可被用来构建可引入至少一个期望的宿主细胞中的重组表达盒。重组表达盒通常包含可操作地连接到转录起始调控序列的本公开内容的多核苷酸，所述调控序列将指导预期宿主细胞中多核苷酸的转录。
异源的和非-异源的(即，内源的)启动子都可能被用来指导本公开内容的核酸的表达。

[0148] 在一些实施方案中，用作启动子、增强子或其它元件的分离的核酸可在本公开内容的多核苷酸的非-异源形式的适当位置(上游、下游或在内含子中)引入，以便上调或下调本公开内容的多核苷酸的表达。例如，内源性启动子可以在体内或体外通过突变、缺失和/或取代而改变。

[0149] 载体和宿主细胞本公开内容还涉及包含编码本公开内容的诱导型多肽的序列的载体、用重组载体进行
基因工程改造的宿主细胞和用重组技术制备至少一种本公开内容的诱导型多肽，这是本领域熟知的。见例如，Sambrook等, 同上；Ausubel等,同上，各自通过引用全文并入本文。

[0150] 包括编码本公开内容的诱导型多肽的序列的多核苷酸可任选地连接到包含可选择标记的载体，以供在宿主中增殖。一般来说，在沉淀物，如磷酸钙沉淀中，或在带电荷脂质的复合物中引入质粒载体。如果载体是病毒，它可以用合适的包装细胞系在体外包装，然后导入宿主细胞。

[0151] 本公开内容提供一种包含本公开内容的转座子的组合物。在某些实施方案中，组合物可进一步包含含有编码转座酶的序列的质粒。编码转座酶的序列可以是mRNA序列。

[0152] 本公开内容的转座子在表观上保持或整合到重组/修饰细胞的基因组中。转座子可以是利用转座子和转座酶以推动非-病毒性基因转移的两个组分piggyBac系统的部分。在这种方法的某些实施方案中，转座子是质粒DNA转座子，其具有编码由两个顺式调节绝缘子元件侧接的本公开内容的诱导型胱天蛋白酶多肽的序列。在某些实施方案中，转座子是piggyBac转座子。在某些实施方案，且特别是其中转座子是piggyBac转座子的那些实施方案中，转座酶是piggyBac™或超级piggyBac™ (SPB)转座酶。

[0153] 本公开内容的转座子可包含piggyBac转座子。在本公开内容的方法的某些实施方案中，转座子是质粒DNA转座子，其序列编码由两个顺式调节绝缘子元件侧接的本公开内容的诱导型胱天蛋白酶多肽。在某些实施方案中，转座子是piggyBac转座子。在某些实施方案，且特别是其中转座子是piggyBac转座子的那些实施方案中，转座酶是piggyBac™或超级piggyBac™ (SPB)转座酶。在某些实施方案，且特别是其中转座酶是一种超级piggyBac™ (SPB)转座酶的那些实施方案中，序列编码转座酶是mRNA序列。

[0154] 在本公开内容的方法的某些实施方案中，转座酶是piggyBac™ (PB)转座酶。piggyBac (PB)转座酶可包含或由与以下序列之间有至少75%、80%、85%、90%、95%、99%或任何百分比的同一性的氨基酸序列组成：
1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG
61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG
121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF
181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV
241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD
301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ
361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC
421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN
481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPNEV
541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID
NO: 1)。

[0155] 在本公开内容的方法的某些实施方案中，转座酶是piggyBac™ (PB)转座酶，其包含或由具有在以下序列的位置30、165、282或538的一个或多个的氨基酸取代组成：1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG
61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG
121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF
181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV
241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD
301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ
361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC
421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN
481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPNEV
541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID
NO: 1)。

[0156] 在某些实施方案中，转座酶是piggyBac™ (PB)转座酶，其包含或由具有在SEQ ID NO: 1序列位置30、165、282或538的两个或更多个的氨基酸取代的氨基酸序列组成。在某些实施方案中，转座酶是piggyBac™ (PB)转座酶，其包含或由在SEQ ID NO: 1序列位置30、165、282或538的三个或更多个的氨基酸取代的氨基酸序列组成。在某些实施方案中，转座酶是piggyBac™ (PB)转座酶，其包含或由在SEQ ID NO: 1序列的以下位置30、165、282或
538的每一个的氨基酸取代的氨基酸序列组成。在某些实施方案中，SEQ ID NO: 1序列的位置30的氨基酸取代是缬氨酸(V)取代异亮氨酸(I)。在某些实施方案中，SEQ ID NO: 1序列的位置165的氨基酸取代是丝氨酸(S)取代甘氨酸(G)。在某些实施方案中，SEQ ID NO: 1序列的位置282的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M)。在某些实施方案中，SEQ ID NO:
1序列的位置538的氨基酸取代是赖氨酸(K)取代天冬酰胺(N)。

[0157] 在本公开内容的方法的某些实施方案中，转座酶是一种超级piggyBac™ (SPB)转座酶。在某些实施方案中，超级piggyBac™ (SPB)本公开内容的转座酶可包含或由SEQ ID NO: 1序列的氨基酸序列组成，其中位置30的氨基酸取代是缬氨酸(V)取代异亮氨酸(I)，位置165的氨基酸取代是丝氨酸(S)取代甘氨酸(G)，位置282的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M)，和位置538的氨基酸取代是赖氨酸(K)取代天冬酰胺(N)。在某些实施方案中，超级piggyBac™ (SPB)转座酶可包含或由与以下序列之间有至少75%、80%、85%、90%、95%、99%或任何百分比的同一性的氨基酸序列组成：
1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEV SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG
61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG
121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTSATFRD TNEDEIYAFF
181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV
241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RVYIPNKPSK YGIKILMMCD
301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ
361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC
421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN
481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPKEV
541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID
NO: 2)。

[0158] 在本公开内容的方法的某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™或超级piggyBac™转座酶可进一步包含在序列SEQ ID NO: 1或SEQ ID NO: 2的位置3、46、82、103、119、125、177、180、185、187、200、207、209、226、235、240、241、243、258、296、298、311、315、319、327、328、340、421、436、
456、470、486、503、552、570和591的一个或多个的氨基酸取代。在某些实施方案，包括其中转座酶包含位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™或超级piggyBac™转座酶可进一步包含在位置46、119、125、177、180、185、187、200、207、209、226、
235、240、241、243、296、298、311、315、319、327、328、340、421、436、456、470、485、503、552和
570的一个或多个的氨基酸取代。在某些实施方案中，SEQ ID NO: 1或SEQ ID NO: 2的位置
3的氨基酸取代是天冬酰胺(N)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置46的氨基酸取代是丝氨酸(S)取代丙氨酸(A)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置46的氨基酸取代是苏氨酸(T)取代丙氨酸(A)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置82的氨基酸取代是色氨酸(W)取代异亮氨酸(I)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置103的氨基酸取代是脯氨酸(P)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置119的氨基酸取代是脯氨酸(P)取代精氨酸(R)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置125的氨基酸取代是丙氨酸(A)取代半胱氨酸(C)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置125的氨基酸取代是亮氨酸(L)取代半胱氨酸(C)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置177的氨基酸取代是赖氨酸(K)取代酪氨酸(Y)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置177的氨基酸取代是组氨酸(H)取代酪氨酸(Y)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置180的氨基酸取代是亮氨酸(L)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置180的氨基酸取代是异亮氨酸(I)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置180的氨基酸取代是缬氨酸(V)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置185的氨基酸取代是亮氨酸(L)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的氨基酸取代位置
187的是甘氨酸(G)取代丙氨酸(A)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置200的氨基酸取代是色氨酸(W)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO:
1或SEQ ID NO: 2的位置207的氨基酸取代是脯氨酸(P)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置209的氨基酸取代是苯丙氨酸(F)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置226的氨基酸取代是苯丙氨酸(F)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置235的氨基酸取代是精氨酸(R)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 1的位置240的氨基酸取代是赖氨酸(K)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置241的氨基酸取代是亮氨酸(L)取代苯丙氨酸(F)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置243的氨基酸取代是赖氨酸(K)取代脯氨酸(P)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置258的氨基酸取代是丝氨酸(S)取代天冬酰胺(N)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置296的氨基酸取代是色氨酸(W)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置296的氨基酸取代是酪氨酸(Y)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置296的氨基酸取代是苯丙氨酸(F)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置298的氨基酸取代是亮氨酸(L)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置298的氨基酸取代是丙氨酸(A)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置298的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置311的氨基酸取代是异亮氨酸(I)取代脯氨酸(P)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置311的氨基酸取代是缬氨酸取代脯氨酸(P)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置315的氨基酸取代是赖氨酸(K)取代精氨酸(R)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置319的氨基酸取代是甘氨酸(G)取代苏氨酸(T)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置327的氨基酸取代是精氨酸(R)取代酪氨酸(Y)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置328的氨基酸取代是缬氨酸(V)取代酪氨酸(Y)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置340的氨基酸取代是甘氨酸(G)取代半胱氨酸(C)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置340的氨基酸取代是亮氨酸(L)取代半胱氨酸(C)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置421的氨基酸取代是组氨酸(H)取代天冬氨酸(D)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置436的氨基酸取代是异亮氨酸(I)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置456的氨基酸取代是酪氨酸(Y)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置470的氨基酸取代是苯丙氨酸(F)取代亮氨酸(L)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置485的氨基酸取代是赖氨酸(K)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置503的氨基酸取代是亮氨酸(L)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置503的氨基酸取代是异亮氨酸(I)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO:
1或SEQ ID NO: 2的氨基酸取代位置552的是赖氨酸(K)取代缬氨酸(V)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置570的氨基酸取代是苏氨酸(T)取代丙氨酸(A)。
在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置591的氨基酸取代是脯氨酸(P)取代谷氨酰胺(Q)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置591的氨基酸取代是精氨酸(R)取代谷氨酰胺(Q)。

[0159] 在本公开内容的方法的某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™转座酶可包含或超级piggyBac™转座酶可进一步包含在序列SEQ ID NO: 1或SEQ ID NO: 2的位置103、194、372、375、450、509和570的一个或多个的氨基酸取代。在本公开内容的方法的某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™转座酶可包含或超级piggyBac™转座酶可进一步包含在序列SEQ ID NO: 1或SEQ ID NO: 2的位置103、
194、372、375、450、509和570的2个、3个、4个、5个、6个或更多个的氨基酸取代。在某些实施方案，包括其中转座酶包含在位置30、165、282和/或538的上述突变的那些实施方案中，piggyBac™转座酶可包含或超级piggyBac™转座酶可进一步包含在序列SEQ ID NO: 1或SEQ ID NO: 2的位置103、194、372、375、450、509和570的氨基酸取代。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置103的氨基酸取代是脯氨酸(P)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置194的氨基酸取代是缬氨酸(V)取代甲硫氨酸(M)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置372的氨基酸取代是丙氨酸(A)取代精氨酸(R)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置375的氨基酸取代是丙氨酸(A)取代赖氨酸(K)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置450的氨基酸取代是天冬酰胺(N)取代天冬氨酸(D)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置509的氨基酸取代是甘氨酸(G)取代丝氨酸(S)。在某些实施方案中，在SEQ ID NO: 1或SEQ ID NO: 2的位置570的氨基酸取代是丝氨酸(S)取代天冬酰胺(N)。在某些实施方案中，piggyBac™转座酶可包含在SEQ ID NO: 1的位置194取代甲硫氨酸(M)的缬氨酸(V)。在某些实施方案中，包括那些实施方案其中
piggyBac™转座酶可包含在SEQ ID NO: 1的位置194取代甲硫氨酸(M)的缬氨酸(V)，
piggyBac™转座酶可进一步包含在序列SEQ ID NO: 1或SEQ ID NO: 2的位置372、375和
450的氨基酸取代。在某些实施方案中，piggyBac™转座酶可包含在SEQ ID NO: 1的位置
194取代甲硫氨酸(M)的缬氨酸(V)，在SEQ ID NO: 1的位置372取代精氨酸(R)的丙氨酸(A)，和在SEQ ID NO: 1的位置375取代赖氨酸(K)的丙氨酸(A)。在某些实施方案中，
piggyBac™转座酶可包含在SEQ ID NO: 1的位置194取代甲硫氨酸(M)的缬氨酸(V)，在SEQ ID NO: 1的位置372取代精氨酸(R)的丙氨酸(A)，在SEQ ID NO: 1的位置375取代赖氨酸(K)的丙氨酸(A)和在SEQ ID NO: 1的位置450取代天冬氨酸(D)的天冬酰胺(N)。

[0160] 在本公开内容的方法的某些实施方案中，转座子是睡美人转座子。在某些实施方案，且特别是其中转座子是睡美人转座子的那些实施方案中，转座酶是睡美人转座酶或超活性睡美人转座酶(SB100X)。

[0161] 在本公开内容的方法的某些实施方案中，睡美人转座酶包含与以下序列之间有至少75%、80%、85%、90%、95%、99%或任何百分比的同一性的氨基酸序列：1 MGKSKEISQD LRKKIVDLHK SGSSLGAISK RLKVPRSSVQ TIVRKYKHHG TTQPSYRSGR
61 RRVLSPRDER TLVRKVQINP RTTAKDLVKM LEETGTKVSI STVKRVLYRH NLKGRSARKK
121 PLLQNRHKKA RLRFATAHGD KDRTFWRNVL WSDETKIELF GHNDHRYVWR KKGEACKPKN
181 TIPTVKHGGG SIMLWGCFAA GGTGALHKID GIMRKENYVD ILKQHLKTSV RKLKLGRKWV
241 FQMDNDPKHT SKVVAKWLKD NKVKVLEWPS QSPDLNPIEN LWAELKKRVR ARRPTNLTQL
301 HQLCQEEWAK IHPTYCGKLV EGYPKRLTQV KQFKGNATKY (SEQ ID NO: 19)。

[0162] 在本公开内容的方法的某些实施方案中，超活性睡美人(SB100X)转座酶包含与以下序列之间有至少75%、80%、85%、90%、95%、99%或任何百分比的同一性的氨基酸序列：1 MGKSKEISQD LRKRIVDLHK SGSSLGAISK RLAVPRSSVQ TIVRKYKHHG TTQPSYRSGR
61 RRVLSPRDER TLVRKVQINP RTTAKDLVKM LEETGTKVSI STVKRVLYRH NLKGHSARKK
121 PLLQNRHKKA RLRFATAHGD KDRTFWRNVL WSDETKIELF GHNDHRYVWR KKGEACKPKN
181 TIPTVKHGGG SIMLWGCFAA GGTGALHKID GIMDAVQYVD ILKQHLKTSV RKLKLGRKWV
241 FQHDNDPKHT SKVVAKWLKD NKVKVLEWPS QSPDLNPIEN LWAELKKRVR ARRPTNLTQL
301 HQLCQEEWAK IHPNYCGKLV EGYPKRLTQV KQFKGNATKY (SEQ ID NO: 20)。

[0163] 在本公开内容的方法的某些实施方案中，转座酶是Helitron转座酶。Helitron转座酶动员Helraiser转座子，一种大约在3000万到3600万年前就已经活跃的蝙蝠基因组中的古老元件。本公开内容的示例性Helraiser转座子包括Helibat1，其包含含有以下的核酸序列：1 TCCTATATAA TAAAAGAGAA ACATGCAAAT TGACCATCCC TCCGCTACGC TCAAGCCACG
61 CCCACCAGCC AATCAGAAGT GACTATGCAA ATTAACCCAA CAAAGATGGC AGTTAAATTT
121 GCATACGCAG GTGTCAAGCG CCCCAGGAGG CAACGGCGGC CGCGGGCTCC CAGGACCTTC
181 GCTGGCCCCG GGAGGCGAGG CCGGCCGCGC CTAGCCACAC CCGCGGGCTC CCGGGACCTT
241 CGCCAGCAGA GAGCAGAGCG GGAGAGCGGG CGGAGAGCGG GAGGTTTGGA GGACTTGGCA
301 GAGCAGGAGG CCGCTGGACA TAGAGCAGAG CGAGAGAGAG GGTGGCTTGG AGGGCGTGGC
361 TCCCTCTGTC ACCCCAGCTT CCTCATCACA GCTGTGGAAA CTGACAGCAG GGAGGAGGAA
421 GTCCCACCCC CACAGAATCA GCCAGAATCA GCCGTTGGTC AGACAGCTCT CAGCGGCCTG
481 ACAGCCAGGA CTCTCATTCA CCTGCATCTC AGACCGTGAC AGTAGAGAGG TGGGACTATG
541 TCTAAAGAAC AACTGTTGAT ACAACGTAGC TCTGCAGCCG AAAGATGCCG GCGTTATCGA
601 CAGAAAATGT CTGCAGAGCA ACGTGCGTCT GATCTTGAAA GAAGGCGGCG CCTGCAACAG
661 AATGTATCTG AAGAGCAGCT ACTGGAAAAA CGTCGCTCTG AAGCCGAAAA ACAGCGGCGT
721 CATCGACAGA AAATGTCTAA AGACCAACGT GCCTTTGAAG TTGAAAGAAG GCGGTGGCGA
781 CGACAGAATA TGTCTAGAGA ACAGTCATCA ACAAGTACTA CCAATACCGG TAGGAACTGC
841 CTTCTCAGCA AAAATGGAGT ACATGAGGAT GCAATTCTCG AACATAGTTG TGGTGGAATG
901 ACTGTTCGAT GTGAATTTTG CCTATCACTA AATTTCTCTG ATGAAAAACC ATCCGATGGG
961 AAATTTACTC GATGTTGTAG CAAAGGGAAA GTCTGTCCAA ATGATATACA TTTTCCAGAT
1021 TACCCGGCAT ATTTAAAAAG ATTAATGACA AACGAAGATT CTGACAGTAA AAATTTCATG
1081 GAAAATATTC GTTCCATAAA TAGTTCTTTT GCTTTTGCTT CCATGGGTGC AAATATTGCA
1141 TCGCCATCAG GATATGGGCC ATACTGTTTT AGAATACACG GACAAGTTTA TCACCGTACT
1201 GGAACTTTAC ATCCTTCGGA TGGTGTTTCT CGGAAGTTTG CTCAACTCTA TATTTTGGAT
1261 ACAGCCGAAG CTACAAGTAA AAGATTAGCA ATGCCAGAAA ACCAGGGCTG CTCAGAAAGA
1321 CTCATGATCA ACATCAACAA CCTCATGCAT GAAATAAATG AATTAACAAA ATCGTACAAG
1381 ATGCTACATG AGGTAGAAAA GGAAGCCCAA TCTGAAGCAG CAGCAAAAGG TATTGCTCCC
1441 ACAGAAGTAA CAATGGCGAT TAAATACGAT CGTAACAGTG ACCCAGGTAG ATATAATTCT
1501 CCCCGTGTAA CCGAGGTTGC TGTCATATTC AGAAACGAAG ATGGAGAACC TCCTTTTGAA
1561 AGGGACTTGC TCATTCATTG TAAACCAGAT CCCAATAATC CAAATGCCAC TAAAATGAAA
1621 CAAATCAGTA TCCTGTTTCC TACATTAGAT GCAATGACAT ATCCTATTCT TTTTCCACAT
1681 GGTGAAAAAG GCTGGGGAAC AGATATTGCA TTAAGACTCA GAGACAACAG TGTAATCGAC
1741 AATAATACTA GACAAAATGT AAGGACACGA GTCACACAAA TGCAGTATTA TGGATTTCAT
1801 CTCTCTGTGC GGGACACGTT CAATCCTATT TTAAATGCAG GAAAATTAAC TCAACAGTTT
1861 ATTGTGGATT CATATTCAAA AATGGAGGCC AATCGGATAA ATTTCATCAA AGCAAACCAA
1921 TCTAAGTTGA GAGTTGAAAA ATATAGTGGT TTGATGGATT ATCTCAAATC TAGATCTGAA
1981 AATGACAATG TGCCGATTGG TAAAATGATA ATACTTCCAT CATCTTTTGA GGGTAGTCCC
2041 AGAAATATGC AGCAGCGATA TCAGGATGCT ATGGCAATTG TAACGAAGTA TGGCAAGCCC
2101 GATTTATTCA TAACCATGAC ATGCAACCCC AAATGGGCAG ATATTACAAA CAATTTACAA
2161 CGCTGGCAAA AAGTTGAAAA CAGACCTGAC TTGGTAGCCA GAGTTTTTAA TATTAAGCTG
2221 AATGCTCTTT TAAATGATAT ATGTAAATTC CATTTATTTG GCAAAGTAAT AGCTAAAATT
2281 CATGTCATTG AATTTCAGAA ACGCGGACTG CCTCACGCTC ACATATTATT GATATTAGAT
2341 AGTGAGTCCA AATTACGTTC AGAAGATGAC ATTGACCGTA TAGTTAAGGC AGAAATTCCA
2401 GATGAAGACC AGTGTCCTCG ACTTTTTCAA ATTGTAAAAT CAAATATGGT ACATGGACCA
2461 TGTGGAATAC AAAATCCAAA TAGTCCATGT ATGGAAAATG GAAAATGTTC AAAGGGATAT
2521 CCAAAAGAAT TTCAAAATGC GACCATTGGA AATATTGATG GATATCCCAA ATACAAACGA
2581 AGATCTGGTA GCACCATGTC TATTGGAAAT AAAGTTGTCG ATAACACTTG GATTGTCCCT
2641 TATAACCCGT ATTTGTGCCT TAAATATAAC TGTCATATAA ATGTTGAAGT CTGTGCATCA
2701 ATTAAAAGTG TCAAATATTT ATTTAAATAC ATCTATAAAG GGCACGATTG TGCAAATATT
2761 CAAATTTCTG AAAAAAATAT TATCAATCAT GACGAAGTAC AGGACTTCAT TGACTCCAGG
2821 TATGTGAGCG CTCCTGAGGC TGTTTGGAGA CTTTTTGCAA TGCGAATGCA TGACCAATCT
2881 CATGCAATCA CAAGATTAGC TATTCATTTG CCAAATGATC AGAATTTGTA TTTTCATACC
2941 GATGATTTTG CTGAAGTTTT AGATAGGGCT AAAAGGCATA ACTCGACTTT GATGGCTTGG
3001 TTCTTATTGA ATAGAGAAGA TTCTGATGCA CGTAATTATT ATTATTGGGA GATTCCACAG
3061 CATTATGTGT TTAATAATTC TTTGTGGACA AAACGCCGAA AGGGTGGGAA TAAAGTATTA
3121 GGTAGACTGT TCACTGTGAG CTTTAGAGAA CCAGAACGAT ATTACCTTAG ACTTTTGCTT
3181 CTGCATGTAA AAGGTGCGAT AAGTTTTGAG GATCTGCGAA CTGTAGGAGG TGTAACTTAT
3241 GATACATTTC ATGAAGCTGC TAAACACCGA GGATTATTAC TTGATGACAC TATCTGGAAA
3301 GATACGATTG ACGATGCAAT CATCCTTAAT ATGCCCAAAC AACTACGGCA ACTTTTTGCA
3361 TATATATGTG TGTTTGGATG TCCTTCTGCT GCAGACAAAT TATGGGATGA GAATAAATCT
3421 CATTTTATTG AAGATTTCTG TTGGAAATTA CACCGAAGAG AAGGTGCCTG TGTGAACTGT
3481 GAAATGCATG CCCTTAACGA AATTCAGGAG GTATTCACAT TGCATGGAAT GAAATGTTCA
3541 CATTTCAAAC TTCCGGACTA TCCTTTATTA ATGAATGCAA ATACATGTGA TCAATTGTAC
3601 GAGCAACAAC AGGCAGAGGT TTTGATAAAT TCTCTGAATG ATGAACAGTT GGCAGCCTTT
3661 CAGACTATAA CTTCAGCCAT CGAAGATCAA ACTGTACACC CCAAATGCTT TTTCTTGGAT
3721 GGTCCAGGTG GTAGTGGAAA AACATATCTG TATAAAGTTT TAACACATTA TATTAGAGGT
3781 CGTGGTGGTA CTGTTTTACC CACAGCATCT ACAGGAATTG CTGCAAATTT ACTTCTTGGT
3841 GGAAGAACCT TTCATTCCCA ATATAAATTA CCAATTCCAT TAAATGAAAC TTCAATTTCT
3901 AGACTCGATA TAAAGAGTGA AGTTGCTAAA ACCATTAAAA AGGCCCAACT TCTCATTATT
3961 GATGAATGCA CCATGGCATC CAGTCATGCT ATAAACGCCA TAGATAGATT ACTAAGAGAA
4021 ATTATGAATT TGAATGTTGC ATTTGGTGGG AAAGTTCTCC TTCTCGGAGG GGATTTTCGA
4081 CAATGTCTCA GTATTGTACC ACATGCTATG CGATCGGCCA TAGTACAAAC GAGTTTAAAG
4141 TACTGTAATG TTTGGGGATG TTTCAGAAAG TTGTCTCTTA AAACAAATAT GAGATCAGAG
4201 GATTCTGCTT ATAGTGAATG GTTAGTAAAA CTTGGAGATG GCAAACTTGA TAGCAGTTTT
4261 CATTTAGGAA TGGATATTAT TGAAATCCCC CATGAAATGA TTTGTAACGG ATCTATTATT
4321 GAAGCTACCT TTGGAAATAG TATATCTATA GATAATATTA AAAATATATC TAAACGTGCA
4381 ATTCTTTGTC CAAAAAATGA GCATGTTCAA AAATTAAATG AAGAAATTTT GGATATACTT
4441 GATGGAGATT TTCACACATA TTTGAGTGAT GATTCCATTG ATTCAACAGA TGATGCTGAA
4501 AAGGAAAATT TTCCCATCGA ATTTCTTAAT AGTATTACTC CTTCGGGAAT GCCGTGTCAT
4561 AAATTAAAAT TGAAAGTGGG TGCAATCATC ATGCTATTGA GAAATCTTAA TAGTAAATGG
4621 GGTCTTTGTA ATGGTACTAG ATTTATTATC AAAAGATTAC GACCTAACAT TATCGAAGCT
4681 GAAGTATTAA CAGGATCTGC AGAGGGAGAG GTTGTTCTGA TTCCAAGAAT TGATTTGTCC
4741 CCATCTGACA CTGGCCTCCC ATTTAAATTA ATTCGAAGAC AGTTTCCCGT GATGCCAGCA
4801 TTTGCGATGA CTATTAATAA ATCACAAGGA CAAACTCTAG ACAGAGTAGG AATATTCCTA
4861 CCTGAACCCG TTTTCGCACA TGGTCAGTTA TATGTTGCTT TCTCTCGAGT TCGAAGAGCA
4921 TGTGACGTTA AAGTTAAAGT TGTAAATACT TCATCACAAG GGAAATTAGT CAAGCACTCT
4981 GAAAGTGTTT TTACTCTTAA TGTGGTATAC AGGGAGATAT TAGAATAAGT TTAATCACTT
5041 TATCAGTCAT TGTTTGCATC AATGTTGTTT TTATATCATG TTTTTGTTGT TTTTATATCA
5101 TGTCTTTGTT GTTGTTATAT CATGTTGTTA TTGTTTATTT ATTAATAAAT TTATGTATTA
5161 TTTTCATATA CATTTTACTC ATTTCCTTTC ATCTCTCACA CTTCTATTAT AGAGAAAGGG
5221 CAAATAGCAA TATTAAAATA TTTCCTCTAA TTAATTCCCT TTCAATGTGC ACGAATTTCG
5281 TGCACCGGGC CACTAG (SEQ ID NO: 21)。

[0164] 与其他转座酶不同，Helitron转座酶不含RNase-H样催化域，但是包含由复制起始结构域(Rep)和DNA解旋酶结构域组成的RepHel基序。Rep结构域是核酸酶的HUH超家族的核酸酶结构域。

[0165] 本公开内容的示例性Helitron转座酶包含含有以下的氨基酸序列：1 MSKEQLLIQR SSAAERCRRY RQKMSAEQRA SDLERRRRLQ QNVSEEQLLE KRRSEAEKQR
61 RHRQKMSKDQ RAFEVERRRW RRQNMSREQS STSTTNTGRN CLLSKNGVHE DAILEHSCGG
121 MTVRCEFCLS LNFSDEKPSD GKFTRCCSKG KVCPNDIHFP DYPAYLKRLM TNEDSDSKNF
181 MENIRSINSS FAFASMGANI ASPSGYGPYC FRIHGQVYHR TGTLHPSDGV SRKFAQLYIL
241 DTAEATSKRL AMPENQGCSE RLMININNLM HEINELTKSY KMLHEVEKEA QSEAAAKGIA
301 PTEVTMAIKY DRNSDPGRYN SPRVTEVAVI FRNEDGEPPF ERDLLIHCKP DPNNPNATKM
361 KQISILFPTL DAMTYPILFP HGEKGWGTDI ALRLRDNSVI DNNTRQNVRT RVTQMQYYGF
421 HLSVRDTFNP ILNAGKLTQQ FIVDSYSKME ANRINFIKAN QSKLRVEKYS GLMDYLKSRS
481 ENDNVPIGKM IILPSSFEGS PRNMQQRYQD AMAIVTKYGK PDLFITMTCN PKWADITNNL
541 QRWQKVENRP DLVARVFNIK LNALLNDICK FHLFGKVIAK IHVIEFQKRG LPHAHILLIL
601 DSESKLRSED DIDRIVKAEI PDEDQCPRLF QIVKSNMVHG PCGIQNPNSP CMENGKCSKG
661 YPKEFQNATI GNIDGYPKYK RRSGSTMSIG NKVVDNTWIV PYNPYLCLKY NCHINVEVCA
721 SIKSVKYLFK YIYKGHDCAN IQISEKNIIN HDEVQDFIDS RYVSAPEAVW RLFAMRMHDQ
781 SHAITRLAIH LPNDQNLYFH TDDFAEVLDR AKRHNSTLMA WFLLNREDSD ARNYYYWEIP
841 QHYVFNNSLW TKRRKGGNKV LGRLFTVSFR EPERYYLRLL LLHVKGAISF EDLRTVGGVT
901 YDTFHEAAKH RGLLLDDTIW KDTIDDAIIL NMPKQLRQLF AYICVFGCPS AADKLWDENK
961 SHFIEDFCWK LHRREGACVN CEMHALNEIQ EVFTLHGMKC SHFKLPDYPL LMNANTCDQL
1021 YEQQQAEVLI NSLNDEQLAA FQTITSAIED QTVHPKCFFL DGPGGSGKTY LYKVLTHYIR
1081 GRGGTVLPTA STGIAANLLL GGRTFHSQYK LPIPLNETSI SRLDIKSEVA KTIKKAQLLI
1141 IDECTMASSH AINAIDRLLR EIMNLNVAFG GKVLLLGGDF RQCLSIVPHA MRSAIVQTSL
1201 KYCNVWGCFR KLSLKTNMRS EDSAYSEWLV KLGDGKLDSS FHLGMDIIEI PHEMICNGSI
1261 IEATFGNSIS IDNIKNISKR AILCPKNEHV QKLNEEILDI LDGDFHTYLS DDSIDSTDDA
1321 EKENFPIEFL NSITPSGMPC HKLKLKVGAI IMLLRNLNSK WGLCNGTRFI IKRLRPNIIE
1381 AEVLTGSAEG EVVLIPRIDL SPSDTGLPFK LIRRQFPVMP AFAMTINKSQ GQTLDRVGIF
1441 LPEPVFAHGQ LYVAFSRVRR ACDVKVKVVN TSSQGKLVKH SESVFTLNVV YREILE (SEQ
ID NO: 22)。

[0166] 在Helitron转位中，接近转座子的3’端的发夹作为终止子发挥功能。然而，这种发夹可被转座酶绕过，导致侧翼序列的转换。此外，Helraiser转位产生共价封闭的循环中间体。此外，Helitron转位可能缺少目标位点重复。在Helraiser序列中，转座酶由分别称为LTS和RTS的左右末端序列侧接。这些序列用保守的5’-TC/CTAG-3’基序终止。一个具有形成发夹终止结构的可能性的19 bp回文序列位于RTS上游的11个核苷酸，且由该序列GTGCACGAATTTCGTGCACCGGGCCACTAG (SEQ ID NO: 23)组成。

[0167] 在本公开内容的方法的某些实施方案中，转座酶是Tol2转座酶。Tol2转座子可能是从青鳉鱼(medaka fish)的基因组中分离或衍生出来的，也可能类似于hAT家族的转座子。本公开的示例性Tol2转座子由一个包含约4.7千碱基的序列编码，并包含一个编码Tol2转座酶的基因，该转座酶包含四个外显子。本公开内容的示例性Tol2转座酶包含含有以下序列的氨基酸序列：1 MEEVCDSSAA ASSTVQNQPQ DQEHPWPYLR EFFSLSGVNK DSFKMKCVLC LPLNKEISAF
61 KSSPSNLRKH IERMHPNYLK NYSKLTAQKR KIGTSTHASS SKQLKVDSVF PVKHVSPVTV
121 NKAILRYIIQ GLHPFSTVDL PSFKELISTL QPGISVITRP TLRSKIAEAA LIMKQKVTAA
181 MSEVEWIATT TDCWTARRKS FIGVTAHWIN PGSLERHSAA LACKRLMGSH TFEVLASAMN
241 DIHSEYEIRD KVVCTTTDSG SNFMKAFRVF GVENNDIETE ARRCESDDTD SEGCGEGSDG
301 VEFQDASRVL DQDDGFEFQL PKHQKCACHL LNLVSSVDAQ KALSNEHYKK LYRSVFGKCQ
361 ALWNKSSRSA LAAEAVESES RLQLLRPNQT RWNSTFMAVD RILQICKEAG EGALRNICTS
421 LEVPMFNPAE MLFLTEWANT MRPVAKVLDI LQAETNTQLG WLLPSVHQLS LKLQRLHHSL
481 RYCDPLVDAL QQGIQTRFKH MFEDPEIIAA AILLPKFRTS WTNDETIIKR GMDYIRVHLE
541 PLDHKKELAN SSSDDEDFFA SLKPTTHEAS KELDGYLACV SDTRESLLTF PAICSLSIKT
601 NTPLPASAAC ERLFSTAGLL FSPKRARLDT NNFENQLLLK LNLRFYNFE (SEQ ID NO:
24)。

[0168] 本公开内容的示例性Tol2转座子，包括反向重复序列、亚末端序列和Tol2转座酶，由包含以下的核酸序列编码：1 CAGAGGTGTA AAGTACTTGA GTAATTTTAC TTGATTACTG TACTTAAGTA TTATTTTTGG
61 GGATTTTTAC TTTACTTGAG TACAATTAAA AATCAATACT TTTACTTTTA CTTAATTACA
121 TTTTTTTAGA AAAAAAAGTA CTTTTTACTC CTTACAATTT TATTTACAGT CAAAAAGTAC
181 TTATTTTTTG GAGATCACTT CATTCTATTT TCCCTTGCTA TTACCAAACC AATTGAATTG
241 CGCTGATGCC CAGTTTAATT TAAATGTTAT TTATTCTGCC TATGAAAATC GTTTTCACAT
301 TATATGAAAT TGGTCAGACA TGTTCATTGG TCCTTTGGAA GTGACGTCAT GTCACATCTA
361 TTACCACAAT GCACAGCACC TTGACCTGGA AATTAGGGAA ATTATAACAG TCAATCAGTG
421 GAAGAAAATG GAGGAAGTAT GTGATTCATC AGCAGCTGCG AGCAGCACAG TCCAAAATCA
481 GCCACAGGAT CAAGAGCACC CGTGGCCGTA TCTTCGCGAA TTCTTTTCTT TAAGTGGTGT
541 AAATAAAGAT TCATTCAAGA TGAAATGTGT CCTCTGTCTC CCGCTTAATA AAGAAATATC
601 GGCCTTCAAA AGTTCGCCAT CAAACCTAAG GAAGCATATT GAGGTAAGTA CATTAAGTAT
661 TTTGTTTTAC TGATAGTTTT TTTTTTTTTT TTTTTTTTTT TTTTTGGGTG TGCATGTTTT
721 GACGTTGATG GCGCGCCTTT TATATGTGTA GTAGGCCTAT TTTCACTAAT GCATGCGATT
781 GACAATATAA GGCTCACGTA ATAAAATGCT AAAATGCATT TGTAATTGGT AACGTTAGGT
841 CCACGGGAAA TTTGGCGCCT ATTGCAGCTT TGAATAATCA TTATCATTCC GTGCTCTCAT
901 TGTGTTTGAA TTCATGCAAA ACACAAGAAA ACCAAGCGAG AAATTTTTTT CCAAACATGT
961 TGTATTGTCA AAACGGTAAC ACTTTACAAT GAGGTTGATT AGTTCATGTA TTAACTAACA
1021 TTAAATAACC ATGAGCAATA CATTTGTTAC TGTATCTGTT AATCTTTGTT AACGTTAGTT
1081 AATAGAAATA CAGATGTTCA TTGTTTGTTC ATGTTAGTTC ACAGTGCATT AACTAATGTT
1141 AACAAGATAT AAAGTATTAG TAAATGTTGA AATTAACATG TATACGTGCA GTTCATTATT
1201 AGTTCATGTT AACTAATGTA GTTAACTAAC GAACCTTATT GTAAAAGTGT TACCATCAAA
1261 ACTAATGTAA TGAAATCAAT TCACCCTGTC ATGTCAGCCT TACAGTCCTG TGTTTTTGTC
1321 AATATAATCA GAAATAAAAT TAATGTTTGA TTGTCACTAA ATGCTACTGT ATTTCTAAAA
1381 TCAACAAGTA TTTAACATTA TAAAGTGTGC AATTGGCTGC AAATGTCAGT TTTATTAAAG
1441 GGTTAGTTCA CCCAAAAATG AAAATAATGT CATTAATGAC TCGCCCTCAT GTCGTTCCAA
1501 GCCCGTAAGA CCTCCGTTCA TCTTCAGAAC ACAGTTTAAG ATATTTTAGA TTTAGTCCGA
1561 GAGCTTTCTG TGCCTCCATT GAGAATGTAT GTACGGTATA CTGTCCATGT CCAGAAAGGT
1621 AATAAAAACA TCAAAGTAGT CCATGTGACA TCAGTGGGTT AGTTAGAATT TTTTGAAGCA
1681 TCGAATACAT TTTGGTCCAA AAATAACAAA ACCTACGACT TTATTCGGCA TTGTATTCTC
1741 TTCCGGGTCT GTTGTCAATC CGCGTTCACG ACTTCGCAGT GACGCTACAA TGCTGAATAA
1801 AGTCGTAGGT TTTGTTATTT TTGGACCAAA ATGTATTTTC GATGCTTCAA ATAATTCTAC
1861 CTAACCCACT GATGTCACAT GGACTACTTT GATGTTTTTA TTACCTTTCT GGACATGGAC
1921 AGTATACCGT ACATACATTT TCAGTGGAGG GACAGAAAGC TCTCGGACTA AATCTAAAAT
1981 ATCTTAAACT GTGTTCCGAA GATGAACGGA GGTGTTACGG GCTTGGAACG ACATGAGGGT
2041 GAGTCATTAA TGACATCTTT TCATTTTTGG GTGAACTAAC CCTTTAATGC TGTAATCAGA
2101 GAGTGTATGT GTAATTGTTA CATTTATTGC ATACAATATA AATATTTATT TGTTGTTTTT
2161 ACAGAGAATG CACCCAAATT ACCTCAAAAA CTACTCTAAA TTGACAGCAC AGAAGAGAAA
2221 GATCGGGACC TCCACCCATG CTTCCAGCAG TAAGCAACTG AAAGTTGACT CAGTTTTCCC
2281 AGTCAAACAT GTGTCTCCAG TCACTGTGAA CAAAGCTATA TTAAGGTACA TCATTCAAGG
2341 ACTTCATCCT TTCAGCACTG TTGATCTGCC ATCATTTAAA GAGCTGATTA GTACACTGCA
2401 GCCTGGCATT TCTGTCATTA CAAGGCCTAC TTTACGCTCC AAGATAGCTG AAGCTGCTCT
2461 GATCATGAAA CAGAAAGTGA CTGCTGCCAT GAGTGAAGTT GAATGGATTG CAACCACAAC
2521 GGATTGTTGG ACTGCACGTA GAAAGTCATT CATTGGTGTA ACTGCTCACT GGATCAACCC
2581 TGGAAGTCTT GAAAGACATT CCGCTGCACT TGCCTGCAAA AGATTAATGG GCTCTCATAC
2641 TTTTGAGGTA CTGGCCAGTG CCATGAATGA TATCCACTCA GAGTATGAAA TACGTGACAA
2701 GGTTGTTTGC ACAACCACAG ACAGTGGTTC CAACTTTATG AAGGCTTTCA GAGTTTTTGG
2761 TGTGGAAAAC AATGATATCG AGACTGAGGC AAGAAGGTGT GAAAGTGATG ACACTGATTC
2821 TGAAGGCTGT GGTGAGGGAA GTGATGGTGT GGAATTCCAA GATGCCTCAC GAGTCCTGGA
2881 CCAAGACGAT GGCTTCGAAT TCCAGCTACC AAAACATCAA AAGTGTGCCT GTCACTTACT
2941 TAACCTAGTC TCAAGCGTTG ATGCCCAAAA AGCTCTCTCA AATGAACACT ACAAGAAACT
3001 CTACAGATCT GTCTTTGGCA AATGCCAAGC TTTATGGAAT AAAAGCAGCC GATCGGCTCT
3061 AGCAGCTGAA GCTGTTGAAT CAGAAAGCCG GCTTCAGCTT TTAAGGCCAA ACCAAACGCG
3121 GTGGAATTCA ACTTTTATGG CTGTTGACAG AATTCTTCAA ATTTGCAAAG AAGCAGGAGA
3181 AGGCGCACTT CGGAATATAT GCACCTCTCT TGAGGTTCCA ATGTAAGTGT TTTTCCCCTC
3241 TATCGATGTA AACAAATGTG GGTTGTTTTT GTTTAATACT CTTTGATTAT GCTGATTTCT
3301 CCTGTAGGTT TAATCCAGCA GAAATGCTGT TCTTGACAGA GTGGGCCAAC ACAATGCGTC
3361 CAGTTGCAAA AGTACTCGAC ATCTTGCAAG CGGAAACGAA TACACAGCTG GGGTGGCTGC
3421 TGCCTAGTGT CCATCAGTTA AGCTTGAAAC TTCAGCGACT CCACCATTCT CTCAGGTACT
3481 GTGACCCACT TGTGGATGCC CTACAACAAG GAATCCAAAC ACGATTCAAG CATATGTTTG
3541 AAGATCCTGA GATCATAGCA GCTGCCATCC TTCTCCCTAA ATTTCGGACC TCTTGGACAA
3601 ATGATGAAAC CATCATAAAA CGAGGTAAAT GAATGCAAGC AACATACACT TGACGAATTC
3661 TAATCTGGGC AACCTTTGAG CCATACCAAA ATTATTCTTT TATTTATTTA TTTTTGCACT
3721 TTTTAGGAAT GTTATATCCC ATCTTTGGCT GTGATCTCAA TATGAATATT GATGTAAAGT
3781 ATTCTTGCAG CAGGTTGTAG TTATCCCTCA GTGTTTCTTG AAACCAAACT CATATGTATC
3841 ATATGTGGTT TGGAAATGCA GTTAGATTTT ATGCTAAAAT AAGGGATTTG CATGATTTTA
3901 GATGTAGATG ACTGCACGTA AATGTAGTTA ATGACAAAAT CCATAAAATT TGTTCCCAGT
3961 CAGAAGCCCC TCAACCAAAC TTTTCTTTGT GTCTGCTCAC TGTGCTTGTA GGCATGGACT
4021 ACATCAGAGT GCATCTGGAG CCTTTGGACC ACAAGAAGGA ATTGGCCAAC AGTTCATCTG
4081 ATGATGAAGA TTTTTTCGCT TCTTTGAAAC CGACAACACA TGAAGCCAGC AAAGAGTTGG
4141 ATGGATATCT GGCCTGTGTT TCAGACACCA GGGAGTCTCT GCTCACGTTT CCTGCTATTT
4201 GCAGCCTCTC TATCAAGACT AATACACCTC TTCCCGCATC GGCTGCCTGT GAGAGGCTTT
4261 TCAGCACTGC AGGATTGCTT TTCAGCCCCA AAAGAGCTAG GCTTGACACT AACAATTTTG
4321 AGAATCAGCT TCTACTGAAG TTAAATCTGA GGTTTTACAA CTTTGAGTAG CGTGTACTGG
4381 CATTAGATTG TCTGTCTTAT AGTTTGATAA TTAAATACAA ACAGTTCTAA AGCAGGATAA
4441 AACCTTGTAT GCATTTCATT TAATGTTTTT TGAGATTAAA AGCTTAAACA AGAATCTCTA
4501 GTTTTCTTTC TTGCTTTTAC TTTTACTTCC TTAATACTCA AGTACAATTT TAATGGAGTA
4561 CTTTTTTACT TTTACTCAAG TAAGATTCTA GCCAGATACT TTTACTTTTA ATTGAGTAAA
4621 ATTTTCCCTA AGTACTTGTA CTTTCACTTG AGTAAAATTT TTGAGTACTT TTTACACCTC
4681 TG (SEQ ID NO: 25)。

[0169] DNA插入应该可操作地连接到适当的启动子上。表达构建体还将包含转录起始、终止的位点，并在转录区包含用于翻译的核糖体结合位点。由构建体表达的成熟转录子的编码部分将优选地包含从开头开始的翻译和适当定位在要翻译的mRNA末端的终止密码子(如，UAA、UGA或UAG)，UAA和UAG优先用于哺乳动物或真核细胞表达。

[0170] 表达载体将优选地(但任选地)包括至少一个可选择的标记。这样的标记包括，例如，但不限于对真核细胞培养物的氨苄西林、zeocin (Sh bla基因)、嘌呤霉素(pac基因)、潮霉素B (hygB基因)、G418/遗传霉素(neo基因)、麦考酚酸或谷氨酰胺合成酶(GS, 美国专利号5,122,464；5,770,359；5,827,739)、杀稻瘟菌素(bsd基因)抗性基因，以及对在大肠杆菌和其它细菌或原核生物中培养的氨苄西林、zeocin (Sh bla基因)、嘌呤霉素(pac基因)、潮霉素B (hygB基因)、G418/遗传霉素(neo基因)、卡那霉素、大观霉素、链霉素、羧苄西林、博莱霉素、红霉素、多粘菌素B或四环素抗性基因(以上专利通过引用全部并入本文)。对于上述宿主细胞的适宜的培养基和条件是本领域已知的。对于技术人员而言，合适的载体将是显而易见的。将载体构建体导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染、阳离子脂质-介导的转染、电穿孔、转导、感染或其它已知的方法进行。这样的方法在本领域有描述，如Sambrook, 同上, 章节1-4和16-18; Ausubel, 同上, 章节1、9、13、15、16。

[0171] 表达载体将优选地(但任选地)包含至少一个可选择的细胞表面标记，以供分离由本公开内容的组合物和方法修饰的细胞。本公开内容的可选择的细胞表面标记包括表面蛋白、糖蛋白，或将细胞或细胞的子集与另一个定义的细胞子集区分开来的一组蛋白。优选地，可选择的细胞表面标记将由本公开内容的组合物和方法修饰的那些细胞与未由本公开内容的组合物和方法修饰的那些细胞区分开来。这样的细胞表面标记包括，例如，但不限于“指定群(cluster of designation)”或“分类决定因素(classification determinant)”蛋白(通常缩写为“CD”)，例如截短或全长形式的CD19、CD271、CD34、CD22、CD20、CD33、CD52，或其任何组合。细胞表面标记还包括自杀基因标记RQR8 (Philip B等Blood. 2014 Aug 21; 124(8):1277-87)。

[0172] 表达载体将优选地(但任选地)包括至少一个可选择的抗性标记，以供分离由本公开内容的组合物和方法修饰的细胞。本公开内容的可选择的抗性标记可包含野生型或突变体Neo、DHFR、TYMS、FRANCF、RAD51C、GCS、MDR1、ALDH1、NKX2.2，或其任何组合。

[0173] 至少一个本公开内容的诱导型多肽可以以一种修饰的形式表达，例如融合蛋白，并且可以包括额外的异源功能区。例如，额外的氨基酸区，特别是荷电的氨基酸，可被加入到蛋白支架的N-末端，以提高在纯化过程中，或在随后的处理和储存过程中的稳定性和在宿主细胞中的持久性。同样，所述肽部分可加入到本公开内容的蛋白支架以促进纯化。在最后制备诱导型多肽或其至少一个片段之前，可以移除这样的区。这样的方法被描述于许多标准实验室手册，如Sambrook, 同上, 章节17.29-17.42和18.1-18.74; Ausubel, 同上, 章节16、17和18。

[0174] 本领域普通技术人员对大量可用于表达编码本公开内容的蛋白的核酸表达系统非常了解。做为选择，通过在含有编码本公开内容的诱导型多肽的宿主细胞中打开(通过操作)，本公开内容的核酸可在宿主细胞中表达。这样的方法是本领域熟知的，例如，如在美国专利号5,580,734、5,641,670、5,733,746和5,733,761中所述，通过引用全部并入本文。

[0175] 用于修饰的细胞的表达载体可包含一个或多个以下的表达控制序列，例如，但不限于复制起点；启动子(如，延迟或早期SV40启动子、CMV启动子(美国专利号5,168,062; 5,385,839)、HSV tk启动子、pgk (磷酸甘油酸激酶)启动子、EF-1α启动子(美国专利号5,266,
491)、至少一个人启动子；增强子，和/或处理信息位点，如核糖体结合位点、RNA剪接位点、多腺苷酸化位点(例如，SV40大T Ag聚A加成位点)，和转录终止子序列。见例如，Ausubel等，同上；Sambrook等，同上。可用于制备本发明的核酸或蛋白的其它细胞是已知的和/或可从例如美国典型培养物保藏中心细胞系和杂交瘤目录(American Type Culture Collection Catalogue of Cell Lines and Hybridomas) (www.atcc.org)或其它已知的或商业来源获得。

[0176] 当利用真核宿主细胞时，多腺苷酸化或转录终止子序列通常被结合到载体中。终止子序列的实例是来自牛生长激素基因的多腺苷酸化序列。转录本的准确剪接序列也可以包括在内。剪接序列的实例是来自SV40的VP1内含子(Sprague等J. Virol. 45:773-781 (1983))。另外，控制宿主细胞复制的基因序列可以结合到载体中，如本领域已知的。

[0177] 氨基酸密码组成本公开内容的蛋白支架的氨基酸通常都是缩写的。氨基酸命名可以通过用其单字
母代码指定氨基酸、其三个字母代码、名称或本领域普遍理解的三个核苷酸密码子来表示(见Alberts, B.等, Molecular Biology of The Cell, 第3版, Garland Publishing, Inc., New York, 1994)。本公开内容的诱导型多肽可包含一个或多个氨基酸取代、缺失或添加，无论是从自然突变或人为操纵，如本文所指定的。本公开内容的诱导型多肽中为功能所必需的氨基酸，可以通过本领域已知的方法来识别，例如定点诱变或丙氨酸扫描诱变(如，Ausubel, 同上, 章节8, 15; Cunningham和Wells, Science 244:1081-1085
(1989))。后一种程序在分子中的每一个残基上都引入了单一的丙氨酸突变。然后对产生的突变分子进行生物活性测试，例如，但不限于至少一种中和活性。对于功能(即诱导细胞凋亡)的关键位点也可通过结构分析来确定，如结晶、核磁共振或光亲和标记(Smith等J. Mol. Biol. 224:899-904 (1992)和de Vos等, Science 255:306-312 (1992))。

[0178] 本公开内容的生物活性的诱导型多肽包括一种或多种蛋白或酶(如胱天蛋白酶如胱天蛋白酶9)，其能够以细胞的天然(非-合成)、内源或相关和已知的蛋白或酶的表达或诱导的至少20%、30%或40%，和优选至少50%、60%或70%，且最优选至少80%、90%或95%-99%或更有效的效力诱导细胞的细胞凋亡。蛋白结合和酶促活性的测定和定量测量的方法是本领域技术人员熟知的。

[0179] 作为过继细胞疗法的修饰细胞的输注本公开内容提供表达一种或多种本公开内容的诱导型多肽的修饰细胞，其已经选择以
给予有需要的受试者。本公开内容的修饰细胞可被配制以在任何温度(包括室温和体温)下储存。本公开内容的修饰细胞可被配制以冷冻保存和随后解冻。本公开内容的修饰细胞可在药学上可接受的载体中配制，以指导从无菌包装给予受试者。
实施例

[0180] 实施例1：piggyBac整合iC9安全开关在人类全T-细胞中的表达及功能使用具有4种piggyBac转座子之一的Amaxa 4D核转仪对人类全T-细胞进行核转染。接
受“模拟”条件的修饰的T细胞用空piggyBac转座子进行核转染。修饰的T细胞接受含有单独治疗剂(编码CARTyrin的序列)的piggyBac转座酶或含有整合的iC9序列和治疗剂(编码
CARTyrin的序列)的piggyBac转座酶。

[0181] 图1提供iC9安全开关的示意图，该开关包含配体结合区、接头和截短的胱天蛋白酶9多肽。具体来说，iC9多肽包含配体结合区，该配体结合区包含包括在第36位取代苯丙氨酸(F)的缬氨酸(V) (F36V)的FK 506结合蛋白12 (FKBP12)多肽。iC9多肽的FKBP12多肽由包含以下的氨基酸序列编码： GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 3)。iC9多肽的FKBP12多肽由包含以下的核酸序列编码：GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATTTCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCTGGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGCCCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGGGAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACTGACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAGGGATCATTCCCCCTCATGCCACCCTGGTCTTCGAT GTGGAACTGCTGAAGCTGGAG (SEQ ID NO: 4)。iC9多肽的接头区由包含GGGGS (SEQ ID NO: 5)的氨基酸和包含GGAGGAGGAGGATCC (SEQ ID NO: 6)的核酸序列编码。编码iC9多肽的氨基酸序列由包含以下的氨基酸编码： GFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRES GLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKTS (SEQ ID NO: 7)。编码iC9多肽的核酸序列由包含以下的核酸序列编码：TTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGCCGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCTGATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAACACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTTCTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGCCAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACCATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGGTGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACAGACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAACGGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTTATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGTGGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTGAACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACCAGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCGTGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCAAGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAACAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGTGGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCGGGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 8)。

[0182] 为了测试ic9的安全开关，4种修饰T细胞的每一种用0、0.1 nM、1 nM、10 nM、100 nM或1000 nM AP1903 (一种AP1903的诱导剂，也称为Rimiducid)培养24小时。使用7-氨基放线菌素D (7-AAD)，一种荧光嵌入剂，作为细胞经历凋亡的标记物，通过流式细胞术评价存活率。

[0183] 在第12天评价细胞存活率(见图2)。数据显示出随着诱导剂在含有iC9构建体的细胞中的浓度逐渐增加，细胞群从右下象限迁移到左上象限；然而，这个效应在缺乏iC9构建体的细胞(仅接受CARTyrin的那些)中未观察到，其中细胞在这两个区域均匀地分布，而与诱导剂的浓度无关。而且，细胞存活率在第19天评价(见图3)。数据显示如在图2 (核转染后第12天)所示的相同趋势；然而，在这个较晚的时间点(核转染后第19天)，群体向左上象限的迁移更为明显。

[0184] 对聚集结果进行了量化，如图4所示，显示iC9安全开关对每个修饰细胞类型的百分比细胞存活率(作为iC9开关的诱导剂(AP1903，也称为Rimiducid)的浓度的函数)在第12天(图2和左图)或第19天(图3和右图)的显著影响。iC9安全开关的存在到第12天在绝大多数细胞中诱导细胞凋亡，到第19天该效果甚至更显著。

[0185] 这个研究结果显示，iC9安全开关在与诱导剂(如AP1903，也称为Rimiducid)接触时，极其有效地消除活性细胞，因为AP1903 (Rimiducid)即使在研究的最低浓度(0.1 nM)下也诱导细胞凋亡。此外，iC9安全开关可以在功能上作为三顺反子载体的一部分表达。

[0186] 实施例2：在NGS小鼠体内使用iC9安全开关对包含P-BCMA-101的细胞的高效杀伤作用NSG小鼠IV注射MM.1S/萤光素酶+细胞，第8天分期，第9天注射T细胞，第12天按规定剂量用AP1903 (Rimiducid)治疗。24小时后，对小鼠进行安乐死，采集血液、脾脏和骨髓细胞，并对huCD45+细胞的存在进行染色(图5)。对于huCD45+细胞的存在，用流式细胞术对血液、脾脏和骨髓细胞进行分析。通过将huCD45细胞的数量除以msCD45细胞的数量，并归一化至未经处理组的huCD45/msCD45的平均值，乘以100%/每1,500个珠子事件/每个样品，确定相对存活率。每个数据点表示不同的小鼠(图6)。

[0187] 通过引用并入本文引用的每份文件，包括任何交叉参照或相关的专利或申请通过引用以其整体并入
本文，除非明确排除或另有限制。任何文件的引用并不是承认它是关于在此公开或要求的任何本发明的现有技术，或它单独或与任何其它一个或多个参考文献组合来教导、建议或公开任何这样的发明。此外，在本文件中某一术语的任何含义或定义与通过引用并入的文件中同一术语的任何含义或定义达到冲突的程度时，将以本文件中指定给该术语的含义或定义为准。

[0188] 其他实施方案虽然本公开内容的特定实施方案已作了说明和描述，各种其它改变和修饰可在不背离
本公开内容的精神和范围的情况下进行。所附权利要求书的范围包括所有这样的改变和修饰，其落入本公开内容的范围内。

标题	发布/更新时间	阅读量
用于检测单个T细胞受体亲和力和序列的方法和组合物	2020-05-17	575
与髓源性抑制细胞相关的病症的治疗方法	2020-05-21	377
重定向T细胞以治疗HIV感染的方法	2020-05-20	796
表达嵌合细胞内信号传导分子的细胞的方法和组合物	2020-05-17	542
用于治疗癌症的RNA改造的T细胞	2020-05-15	935
TGFβ信号转换器	2020-05-19	883
使用过继细胞疗法治疗B细胞恶性肿瘤的方法	2020-05-12	54
使用精氨酸耗竭剂的组合癌症免疫疗法	2020-05-18	974
改进的用于过继细胞治疗的细胞培养方法	2020-05-13	996
IL-36β的应用	2020-05-18	802

诱导型胱天蛋白酶及使用方法

诱导型胱天蛋白酶及使用方法

该功能需要专业版企业版VIP权限，您可以：