首页 / 国际专利分类库 / 化学;冶金 / 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程 / / 作用于酯键的水解酶 (3.1) / 短縮ガイドRNA(tru−gRNA)を用いたRNA誘導型ゲノム編集の特異性の増大

短縮ガイドRNA(tru−gRNA)を用いたRNA誘導型ゲノム編集の特異性の増大

申请号 JP2016502976 申请日 2014-03-14 公开(公告)号 JP2016512691A 公开(公告)日 2016-05-09
申请人 ザ ジェネラル ホスピタル コーポレイション; ザ ジェネラル ホスピタル コーポレイション; 发明人 ジョン,ジェー.キース; ディー. サンダー,ジェフリー; ディー. サンダー,ジェフリー; フ,ヤンファン; メーダー,モーガン;
摘要 短縮ガイドRNA(tru−gRNA)を用いて、RNA誘導型ゲノム編集、例えば、CRISPR/Cas9系を用いた編集の特異性を増大させる方法。【選択図】図2H
权利要求

細胞におけるRNA誘導型ゲノム編集の特異性を増大させる方法であって、前記細胞と、選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドに相補的な17〜18ヌクレオチドからなる相補性領域を含むガイドRNAとを接触させることを含む、方法。細胞内の二本鎖DNA分子の標的領域に切断を誘発する方法であって、 Cas9ヌクレアーゼまたはCas9ニッカーゼと、 二本鎖DNA分子の相補鎖の連続する17〜18ヌクレオチドに相補的な17〜18ヌクレオチドからなる相補性領域を含むガイドRNAと を前記細胞内で発現させるか、前記細胞内に導入することを含む、方法。細胞内の二本鎖DNA分子の標的領域を修飾する方法であって、 dCas9−異種機能ドメイン融合タンパク質(dCas9−HFD)と、 選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドに相補的な17〜18ヌクレオチドからなる相補性領域を含むガイドRNAと を前記細胞内で発現させるか、前記細胞内に導入することを含む、方法。前記ガイドRNが、 (i)選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドに相補的な17〜18ヌクレオチドからなる相補性領域を含む単一ガイドRNAまたは (ii)選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドに相補的な17〜18ヌクレオチドからなる相補性領域を含むcrRNA、およびtracrRNA である、請求項1〜3に記載の方法。前記ガイドRNAが、 (X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407);または (X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408); (X17〜18)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(配列番号1)、 (X17〜18)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号2)、 (X17〜18)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号3)、 (X17〜18)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(配列番号4)、 (X17〜18)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号5); (X17〜18)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号6);または (X17〜18)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号7) からなる群より選択されるリボ核酸であるか、これを含み、 X17〜18が、選択される標的配列、好ましくはプロトスペーサー隣接モチーフ(PAM)の5’側に隣接する標的配列の相補鎖の連続する17〜18ヌクレオチドに相補的な相補性領域であり、XNが、前記リボ核酸とCas9との結合に干渉しない任意の配列であり、Nが0〜200、例えば、0〜100、0〜50または0〜20であり得る、 請求項1〜3に記載の方法。17〜18ヌクレオチドの標的相補性領域を有する、ガイドRNA分子。前記標的相補性領域が17〜18ヌクレオチドからなる、請求項6に記載のgRNA。前記標的相補性領域が17〜18ヌクレオチドの標的相補性からなる、請求項6に記載のgRNA。以下の配列 (X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407);または (X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408); (X17〜18)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(配列番号1)、 (X17〜18)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号2)、 (X17〜18)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号3)、 (X17〜18)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(配列番号4)、 (X17〜18)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号5); (X17〜18)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号6);または (X17〜18)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号7) からなり、 X17〜18が、選択される標的配列、好ましくはプロトスペーサー隣接モチーフ(PAM)の5’側に隣接する標的配列の相補鎖の連続する17〜18ヌクレオチドに相補的な配列であり、XNが、前記リボ核酸とCas9との結合に干渉しない任意の配列であり、Nが0〜200、例えば、0〜100、0〜50または0〜20であり得る、 請求項6に記載のgRNA。前記リボ核酸が、前記リボ核酸分子の3’末端に1つまたは複数のUを含む、請求項5に記載の方法または請求項6に記載のリボ核酸。前記リボ核酸が、前記RNA分子の5’末端に前記標的配列に相補的ではない1つまたは複数の追加のヌクレオチドを含む、請求項5に記載の方法または請求項6に記載のリボ核酸。前記リボ核酸が、前記RNA分子の5’末端に前記標的配列に相補的ではない1つ、2つまたは3つの追加のヌクレオチドを含む、請求項5に記載の方法または請求項6に記載のリボ核酸。前記相補性領域が、選択される標的配列の相補鎖の連続する17ヌクレオチドに相補的である、請求項1〜5に記載の方法または請求項6〜12に記載のリボ核酸。前記相補性領域が、選択される標的配列の相補鎖の連続する18ヌクレオチドに相補的である、請求項1〜5に記載の方法または請求項6〜12に記載のリボ核酸。請求項6〜14のリボ核酸をコードする、DNA分子。請求項15に記載のDNA分子を含む、ベクター。請求項16に記載のベクターを発現する、宿主細胞。前記標的領域が標的ゲノム配列内にある、請求項1〜5に記載の方法または請求項6〜12に記載のリボ核酸。前記標的ゲノム配列が、プロトスペーサー隣接モチーフ(PAM)の5’側に隣接する、請求項1〜5に記載の方法または請求項6〜12に記載のリボ核酸。 前記tracrRNAが、以下の配列 GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号8)もしくはその活性部分; UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2405)もしくはその活性部分; AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2407)もしくはその活性部分; CAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2409)もしくはその活性部分; UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUG(配列番号2410)もしくはその活性部分; UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA(配列番号2411)もしくはその活性部分;または UAGCAAGUUAAAAUAAGGCUAGUCCG(配列番号2412)もしくはその活性部分 からなる、請求項4に記載の方法。前記cRNAが(X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407)であり、前記tracrRNAがGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号8)であるか;前記cRNAが(X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404)であり、前記tracrRNAがUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2405)であるか;または前記cRNAが(X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408)であり、前記tracrRNAがAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2406)である、請求項4に記載の方法。前記dCas9−異種機能ドメイン融合タンパク質(dCas9−HFD)が、遺伝子発現、ヒストンまたはDNAを修飾するHFDを含む、請求項3に記載の方法。前記異種機能ドメインが、転写活性化ドメイン、DNA脱メチル化を触媒する酵素、ヒストン修飾を触媒する酵素、または転写サイレンシングドメインである、請求項21に記載の方法。前記転写活性化ドメインが、VP64またはNF−κB p65由来のものである、請求項22に記載の方法。前記ヒストン修飾を触媒する酵素が、LSD1、ヒストンメチルトランスフェラーゼ(HNMT)、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)またはヒストンデメチラーゼである、請求項22に記載の方法。前記転写サイレンシングドメインが、ヘテロクロマチンタンパク質1(HP1)、例えばHP1αまたはHP1β由来のものである、請求項22に記載の方法。前記選択される標的ゲノム配列に挿入欠失変異または配列変化を生じさせる、請求項1〜5のいずれかに記載の方法。前記細胞が真核細胞である、請求項1〜5のいずれかに記載の方法。前記細胞が哺乳動物細胞である、請求項27に記載の方法。

说明书全文

(優先権の主張) 本願は、2013年3月15日に出願された米国特許出願第61/799,647号;2013年6月21日に出願された米国特許出願第61/838,178号;2013年6月21日に出願された米国特許出願第61/838,148号および2013年12月26日に出願された米国特許出願第61/921,007号の利益を主張するものである。上記出願の内容全体が参照により本明細書に組み込まれる。

(連邦支援による研究または開発) 本発明は、米国国立衛生研究所により授与された助成番号DP1 GM105378の下、政府の支援を受けてなされたものである。政府は本発明に一定の権利を有する。

短縮ガイドRNA(tru−gRNA)を用いて、RNA誘導型ゲノム編集、例えばCRISPR/Cas9系を用いた編集の特異性を増大させる方法。

近年の研究では、クラスター化され等間隔にスペーサーが入った短い回文型の反復配列(CRISPR)/CRISPR関連(Cas)系(Wiedenheftら,Nature 482,331−338(2012);Horvathら,Science 327,167−170(2010);Ternsら,Curr Opin Microbiol 14,321−327(2011))が、細菌、酵母およびヒト細胞のほか、ショウジョウバエ、ゼブラフィッシュおよびマウスなどのそのままの生物体においてin vivoでゲノム編集を実施するための基盤としての役割を果たし得ることが明らかにされている(Wangら,Cell 153,910−918(2013);Shenら,Cell Res(2013);Dicarloら,Nucleic Acids Res(2013);Jiangら,Nat Biotechnol 31,233−239(2013);Jinekら,Elife 2,e00471(2013);Hwangら,Nat Biotechnol 31,227−229(2013);Congら,Science 339,819−823(2013);Maliら,Science 339,823−826(2013c);Choら,Nat Biotechnol 31,230−232(2013);Gratzら,Genetics 194(4):1029−35(2013))。化膿性連鎖球菌(S.pyogenes)由来のCas9ヌクレアーゼ(以降、単にCas9と呼ぶ)は、人工的に設計されたガイドRNA(gRNA)の最初の20ヌクレオチドと、プロトスペーサー隣接モチーフ(PAM)、例えば、配列NGGまたはNAGにマッチするPAMに隣接する目的とする標的ゲノムDNA配列の相補鎖との間の塩基対相補性を介して誘導され得る(Shenら,Cell Res(2013);Dicarloら,Nucleic Acids Res(2013);Jiangら,Nat Biotechnol 31,233−239(2013);Jinekら,Elife 2,e00471(2013);Hwangら,Nat Biotechnol 31,227−229(2013);Congら,Science 339,819−823(2013);Maliら,Science 339,823−826(2013c);Choら,Nat Biotechnol 31,230−232(2013);Jinekら,Science 337,816−821(2012))。in vitro(Jinekら,Science 337,816−821(2012))、細菌(Jiangら,Nat Biotechnol 31,233−239(2013))およびヒト細胞(Congら,Science 339,819−823(2013))で実施されたこれまでの研究では、Cas9を介した切断が、場合によっては、gRNA/標的部位接合部、特に20ヌクレオチド(nt)gRNA相補性領域の3’末端にある最後の10〜12ntにおける単一のミスマッチによって無効になり得ることが示されている。

CRISPR−Casゲノム編集では、相補性領域(塩基対形成によって標的DNAと結合する)とCas9結合領域をともに含むガイドRNAを用いて、Cas9ヌクレアーゼを標的DNAに誘導する(図1を参照されたい)。このヌクレアーゼは相補性領域におけるいくつかのミスマッチ(本明細書に示されるように、最大5つまで)を許容し、なおも切断することが可能であるが、任意の単一のミスマッチまたはミスマッチの組合せが活性に及ぼす影響を予測するのは困難である。まとめると、これらのヌクレアーゼは著しいオフターゲット効果を示し得るが、その部位を予測するのが困難であり得る。本明細書には、CRISPR/Cas系を用いるゲノム編集、例えば、Cas9またはCas9ベースの融合タンパク質を用いるゲノム編集の特異性を増大させる方法が記載される。具体的には、短縮された標的相補性領域(すなわち、20nt未満、例えば17〜19ntまたは17〜18ntの標的相補性、例えば17nt、18ntまたは19ntの標的相補性)を含む短縮ガイドRNA(tru−gRNA)およびそれらの使用方法が提供される。本明細書で使用される「17〜18」または「17〜19」には17ヌクレオチド、18ヌクレオチドまたは19ヌクレオチドが含まれる。

一態様では、本発明は、17〜18ヌクレオチドまたは17〜19ヌクレオチドの標的相補性領域、例えば、17〜18ヌクレオチドまたは17〜19ヌクレオチドからなる標的相補性領域、例えば、17〜18ヌクレオチドまたは17〜19ヌクレオチドの連続する標的相補性からなる標的相補性領域を有するガイドRNA分子(例えば、単一のガイドRNAまたはcrRNA)を提供する。いくつかの実施形態では、ガイドRNAは、選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドまたは17〜19ヌクレオチドに相補的な17〜18ヌクレオチドまたは17〜19ヌクレオチドからなる相補性領域を含む。いくつかの実施形態では、標的相補性領域は、17〜18ヌクレオチド(の標的相補性)からなる。いくつかの実施形態では、相補性領域は、選択される標的配列の相補鎖の連続する17ヌクレオチドに相補的である。いくつかの実施形態では、相補性領域は、選択される標的配列の相補鎖の連続する18ヌクレオチドに相補的である。

別の態様では、本発明は、配列: (X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407);または (X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408); (X17〜18またはX17〜19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(配列番号1); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号2); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号3); (X17〜18)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(配列番号4)、 (X17〜18またはX17〜19)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号5); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号6);または (X17〜18またはX17〜19)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号7); からなるリボ核酸を提供し、配列中、X17〜18またはX17〜19は、選択される標的配列、好ましくはプロトスペーサー隣接モチーフ(PAM)、例えばNGG、NAGまたはNNGGの5’側に隣接する標的配列の相補鎖に相補的な(17〜18ヌクレオチドまたは17〜19ヌクレオチドの)配列であり(例えば、図1の構造を参照されたい)、XNは、リボ核酸とCas9との結合に干渉しない任意の配列であり、(RNA中の)Nは0〜200、例えば、0〜100、0〜50または0〜20であり得る。X17〜18またはX17〜19は、RNAの残りの部分に隣接して自然に発生する配列と同一であることは決してない。いくつかの実施形態では、RNA PolIII転写を停止させる終止シグナルとして用いられる1つまたは複数のTが任意選択で存在するので、RNAは分子の3’末端に1つまたは複数のU、例えば、1〜8つまたはそれ以上のU(例えば、U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)を含む。いくつかの実施形態では、RNAは、RNA分子の5’末端に標的配列に相補的ではない1つまたは複数、例えば最大3つ、例えば1つ、2つまたは3つの追加のヌクレオチドを含む。いくつかの実施形態では、標的相補性領域は、17〜18ヌクレオチド(の標的相補性)からなる。いくつかの実施形態では、相補性領域は、選択される標的配列の相補鎖の連続する17ヌクレオチドに相補的である。いくつかの実施形態では、相補性領域は、連続する18に相補的である。

別の態様では、本発明は、本明細書に記載のリボ核酸をコードするDNA分子およびリボ核酸またはベクターを保有または発現する宿主細胞を提供する。

さらなる態様では、本発明は、細胞でのRNA誘導型ゲノム編集の特異性を増大させる方法を提供し、この方法は、細胞と、選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドまたは17〜19ヌクレオチドに相補的な17〜18ヌクレオチドまたは17〜19ヌクレオチドからなる相補性領域を含む本明細書に記載のガイドRNAとを接触させることを含む。

さらに別の態様では、本発明は、例えば細胞のゲノム配列内の二本鎖DNA分子の標的領域に一本鎖または二本鎖の切断を誘導する方法を提供する。この方法は、Cas9ヌクレアーゼまたはニッカーゼ;および選択される標的配列、好ましくはプロトスペーサー隣接モチーフ(PAM)、例えばNGG、NAGまたはNNGGの5’側に隣接する標的配列の相補鎖に相補的な17ヌクレオチドまたは18ヌクレオチドまたは19ヌクレオチドからなる配列を含むガイドRNA、例えば、本明細書に記載のリボ核酸を細胞内で発現させるか、細胞内に導入することを含む。

本明細書にはこのほか、細胞内の二本鎖DNA分子の標的領域を修飾する方法が提供される。この方法は、dCas9−異種機能ドメイン融合タンパク質(dCas9−HFD);および選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドまたは17〜19ヌクレオチドに相補的な17〜18ヌクレオチドまたは17〜19ヌクレオチドからなる相補性領域を含む本明細書に記載のガイドRNAを細胞内で発現させるか、細胞内に導入することを含む。

いくつかの実施形態では、ガイドRNAは、(i)選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドもしくは17〜19ヌクレオチドに相補的な17〜18ヌクレオチドもしくは17〜19ヌクレオチドからなる相補性領域を含む単一ガイドRNAまたは(ii)選択される標的ゲノム配列の相補鎖の連続する17〜18ヌクレオチドもしくは17〜19ヌクレオチドに相補的な17〜18ヌクレオチドもしくは17〜19ヌクレオチドからなる相補性領域を含むcrRNAおよびtracrRNAである。

いくつかの実施形態では、標的相補性領域は17〜18ヌクレオチド(の標的相補性)からなる。いくつかの実施形態では、相補性領域は、選択される標的配列の相補鎖の連続する17ヌクレオチドに相補的である。いくつかの実施形態では、相補性領域は、連続する18に相補的である。

本明細書に記載のいかなる分子のX17〜18またはX17〜19も、RNAの残りの部分に隣接して自然に発生する配列と同一であるものは決してない。いくつかの実施形態では、RNA PolIII転写を停止させる終止シグナルとして用いられる1つまたは複数のTが任意選択で存在するので、RNAは分子の3’末端に1つまたは複数のU、例えば、1〜8つまたはそれ以上のU(例えば、U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)を含む。いくつかの実施形態では、RNAは、標的配列に相補的ではない1つまたは複数、例えば最大3つ、例えば1つ、2つまたは3つの追加のヌクレオチドをRNA分子の5’末端に含む。

いくつかの実施形態では、RNAの1つまたは複数のヌクレオチド、例えば、標的相補性領域X17〜18またはX17〜19の内部または外部の1つまたは複数のヌクレオチドが修飾されている、例えば、ロックされている(2’−O−4’−Cメチレン架橋)、5’−メチルシチジンである、2’−O−メチル−プソイドウリジンである、あるいはリボースリン酸骨格がポリアミド鎖に置き換わっている。いくつかの実施形態では、tracrRNAまたはcrRNAの一部または全部が、例えばX17〜18またはX17〜19標的相補性領域の内部または外部に、デオキシリボヌクレオチドを含む(例えば、全部または一部がDNAである、例えば、DNA/RNAハイブリッドである)。

ほかの態様では、本発明は、例えば細胞のゲノム配列内の二本鎖DNA分子の標的領域を修飾する方法を提供する。この方法は、dCas9−異種機能ドメイン融合タンパク質(dCas9−HFD);および選択される標的配列、好ましくはプロトスペーサー隣接モチーフ(PAM)、例えばNGG、NAGまたはNNGGの5’側に隣接する標的配列の相補鎖に相補的な17〜18ヌクレオチドまたは17〜19ヌクレオチドからなる配列を含むガイドRNA、例えば、本明細書に記載のリボ核酸を細胞内で発現させるか、細胞内に導入することを含む。X17〜18またはX17〜19は、RNAの残りの部分に隣接して自然に発生する配列と同一であることは決してない。いくつかの実施形態では、RNAは、標的配列に相補的ではない1つまたは複数、例えば最大3つ、例えば1つ、2つまたは3つの追加のヌクレオチドをRNA分子の5’末端に含む。

別の態様では、本発明は、例えば細胞のゲノム配列内の二本鎖DNA分子の標的領域を修飾する、例えば、このような領域内に配列特異的切断を導入する方法を提供する。この方法は、 Cas9ヌクレアーゼもしくはニッカーゼまたはdCas9−異種機能ドメイン融合タンパク質(dCas9−HFD)と、 tracrRNA、例えば、配列GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号8)もしくはその活性部分; UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2405)もしくはその活性部分; AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2407)もしくはその活性部分; CAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2409)もしくはその活性部分; UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUG(配列番号2410)もしくはその活性部分; UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA(配列番号2411)もしくはその活性部分;または UAGCAAGUUAAAAUAAGGCUAGUCCG(配列番号2412)もしくはその活性部分を含むか、これよりなるtracrRNAと、 選択される標的配列、好ましくはプロトスペーサー隣接モチーフ(PAM)、例えばNGG、NAGまたはNNGGの5’側に隣接する標的配列の相補鎖に相補的な17〜18ヌクレオチドまたは17〜19ヌクレオチドからなる配列を含む、crRNAと を細胞内で発現させるか、細胞内に導入することを含み、いくつかの実施形態では、crRNAは配列: (X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407);または (X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408) を有する。

いくつかの実施形態では、crRNAが(X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407)であり、かつtracrRNAがGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号8)である;cRNAが(X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404)であり、かつtracrRNAがUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2405)である;あるいはcRNAが(X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408)であり、かつtracrRNAがAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2406)である。

X17〜18またはX17〜19は、RNAの残りの部分に隣接して自然に発生する配列と同一であることは決してない。いくつかの実施形態では、RNA PolIII転写を停止させる終止シグナルとして用いられる1つまたは複数のTが任意選択で存在するので、RNA(例えば、tracrRNAまたはcrRNA)は、分子の3’末端に1つまたは複数のU、例えば、2〜8つまたはそれ以上のU(例えば、U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)を含む。いくつかの実施形態では、RNA(例えば、tracrRNAまたはcrRNA)は、RNA分子の5’末端に標的配列に相補的ではない1つまたは複数、例えば最大3つ、例えば1つ、2つまたは3つの追加のヌクレオチドを含む。いくつかの実施形態では、crRNAまたはtracrRNAの1つまたは複数のヌクレオチド、例えば、配列X17〜18またはX17〜19の内部または外部の1つまたは複数のヌクレオチドが修飾されている、例えば、ロックされている(2’−O−4’−Cメチレン架橋)、5’−メチルシチジンである、2’−O−メチル−プソイドウリジンである、あるいはリボースリン酸骨格がポリアミド鎖に置き換わっている。いくつかの実施形態では、tracrRNAまたはcrRNAの一部または全部が、例えばX17〜18またはX17〜19標的相補性領域の内部または外部に、デオキシリボヌクレオチドを含む(例えば、全部または一部がDNAである、例えば、DNA/RNAハイブリッドである)。

いくつかの実施形態では、dCas9−異種機能ドメイン融合タンパク質(dCas9−HFD)は、遺伝子発現、ヒストンもしくはDNAを修飾するHFD、例えば、転写活性化ドメイン、転写リプレッサー(例えば、ヘテロクロマチンタンパク質1(HP1)、例えばHP1αもしくはHP1βなどのサイレンサー)、DNAのメチル化状態を修飾する酵素(例えば、DNAメチルトランスフェラーゼ(DNMT)もしくはTETタンパク質、例えばTET1)またはヒストンサブユニットを修飾する酵素(例えば、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)もしくはヒストンデメチラーゼ)を含む。好ましい実施形態では、異種機能ドメインは、転写活性化ドメイン、例えばVP64もしくはNF−κB p65転写活性化ドメイン;DNA脱メチル化を触媒する酵素、例えばTETタンパク質ファミリーのメンバーもしくはこのようなファミリーのメンバーのうちの1つの触媒ドメイン;またはヒストン修飾(例えば、LSD1、ヒストンメチルトランスフェラーゼ、HDACもしくはHAT)もしくは転写サイレンシングドメイン、例えば、ヘテロクロマチンタンパク質1(HP1)、例えばHP1αもしくはHP1βの転写サイレンシングドメイン;または生物学的テザー、例えば、MS2、CRISPR/CasサブタイプYpestタンパク質4(Csy4)もしくはラムダNタンパク質である。dCas9−HFDについては、2013年3月15日に出願された代理人整理番号00786−0882P02の米国仮特許出願第61/799,647号、2013年6月21日に出願された米国特許出願第61/838,148号および国際出願PCT/US14/27335号に記載されており、上記出願はすべてその全体が参照により本明細書に組み込まれる。

いくつかの実施形態では、本明細書に記載の方法によって、選択される標的ゲノム配列に挿入欠失変異または配列変化が生じる。

いくつかの実施形態では、細胞は真核細胞、例えば哺乳動物細胞、例えばヒト細胞である。

特に明記されない限り、本明細書で使用される技術用語および科学用語はいずれも、本発明が属する技術分野の当業者に一般に理解されるものと同じ意味を有する。本明細書には本発明で使用する方法および材料が記載されるが、ほかにも、当該技術分野で公知の他の適切な方法および材料を使用することができる。材料、方法および具体例は単に例示的なものであって、限定することを意図するものではない。本明細書で言及される刊行物、特許出願、特許、配列、データベースエントリをはじめとする参照物はいずれも、その全体が参照により組み込まれる。不一致が生じた場合、定義を含めた本明細書が優先される.

本発明のその他の特徴と利点は、以下の詳細な説明および図面ならびに特許請求の範囲から明らかになるであろう。

図1:標的DNA部位と結合したgRNA/Cas9ヌクレアーゼ複合体を示す模式図である。鋏はゲノムDNA標的部位のCas9ヌクレアーゼのおよその切断点を示す。ガイドRNAのヌクレオチドの番号が5’から3’に向かって逆向きに進むことに留意されたい。

図2A:gRNAの5’相補性領域を短縮する原理を示す模式図である。灰色の太線=標的DNA部位、濃い灰色の細線の構造=gRNAであり、黒線はgRNAと標的DNA部位との間の塩基対形成(またはその欠如)を示している。

図2B:EGFP崩壊アッセイの模式的概観である。単一の組み込まれたEGFP−PESTレポーター遺伝子の標的化Cas9仲介性二本鎖切断が、誤りがちなNHEJ仲介性修復によって修復されると、細胞にコード配列を崩壊させるフレームシフト変異およびそれに付随する蛍光の消失が起こる。

図2C〜図2F:EGFPレポーター遺伝子配列の3つの異なる標的部位でアッセイした、(C)単一ミスマッチ、(D)隣接する二重ミスマッチ、(E)様々な間隔の二重ミスマッチおよび(F)数の増加する隣接するミスマッチを有する単一ガイドRNA(gRNA)を保有するRNA誘導型ヌクレアーゼ(RGN)の活性。反復試験の活性を、完全にマッチする単一gRNAの活性に正規化した平均値が示されている。エラーバーは平均値の標準誤差を表す。各単一gRNAのミスマッチの位置が下の格子に灰色で強調されている。3つのEGFP標的部位の配列は以下の通りであった: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号9) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号10) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号11)

図2C〜図2F:EGFPレポーター遺伝子配列の3つの異なる標的部位でアッセイした、(C)単一ミスマッチ、(D)隣接する二重ミスマッチ、(E)様々な間隔の二重ミスマッチおよび(F)数の増加する隣接するミスマッチを有する単一ガイドRNA(gRNA)を保有するRNA誘導型ヌクレアーゼ(RGN)の活性。反復試験の活性を、完全にマッチする単一gRNAの活性に正規化した平均値が示されている。エラーバーは平均値の標準誤差を表す。各単一gRNAのミスマッチの位置が下の格子に灰色で強調されている。3つのEGFP標的部位の配列は以下の通りであった: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号9) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号10) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号11)

図2C〜図2F:EGFPレポーター遺伝子配列の3つの異なる標的部位でアッセイした、(C)単一ミスマッチ、(D)隣接する二重ミスマッチ、(E)様々な間隔の二重ミスマッチおよび(F)数の増加する隣接するミスマッチを有する単一ガイドRNA(gRNA)を保有するRNA誘導型ヌクレアーゼ(RGN)の活性。反復試験の活性を、完全にマッチする単一gRNAの活性に正規化した平均値が示されている。エラーバーは平均値の標準誤差を表す。各単一gRNAのミスマッチの位置が下の格子に灰色で強調されている。3つのEGFP標的部位の配列は以下の通りであった: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号9) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号10) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号11)

図2G:gRNAの5’末端のミスマッチの方が3’のミスマッチよりもCRISPR/Casの感度が高くなる。gRNAは、ワトソン−クリックトランスバージョンを用いてミスマッチさせた「m」で表される位置を除いて、RNAとDNAとの間でワトソン−クリック塩基対を形成する(すなわち、EGFP部位#2 M18−19は、位置18および19でgRNAをそのワトソン−クリックパートナーに変化させることによってミスマッチさせたものである)。gRNAの5’付近の位置は一般に許容性が極めて高いが、他の残基がミスマッチである場合、この位置でのマッチがヌクレアーゼ活性には重要である。4つの位置すべてがミスマッチである場合、ヌクレアーゼ活性はもはや検出されなくなる。このことはさらに、この5’の位置でのマッチがほかにも3’の位置に生じたミスマッチを相殺し得ることを示している。これらの実験はコドン最適化型よりも低い絶対レベルのヌクレアーゼ活性を示し得る非コドン最適化型のCas9を用いて実施したものであることに留意されたい。 図2H:ヒト細胞ベースのU2OS EGFP崩壊アッセイにおいて15〜25ntの範囲の様々な長さの相補性領域を有するgRNAによって誘導されたCas9ヌクレアーゼ活性の効率。U6プロモーターからのgRNA発現には5’Gの存在が必要であるため、標的DNA部位に対して特定の長さの相補性(15nt、17nt、19nt、20nt、21nt、23ntおよび25nt)を保有するgRNAに限り評価することが可能であった。

図3A:Cas9およびEGFPレポーター遺伝子の4か所の標的部位に対する完全長gRNAまたは短縮gRNAによって仲介されるEGFP崩壊のヒト細胞における効率。相補性領域の長さおよび対応する標的DNA部位が示されている。Ctrl=相補性領域を欠く対照gRNA。

図3B:マッチする標準的なRGN(Cas9および標準的な完全長gRNA)およびtru−RGN(Cas9および5’相補性領域に短縮を有するgRNA)によって7つの異なるヒト内在遺伝子標的に導入された標的化挿入欠失変異の効率。gRNA相補性領域の長さおよび対応する標的DNA部位が示されている。挿入欠失頻度はT7EIアッセイによって測定したものである。Ctrl=相補性領域を欠く対照gRNA。

図3C:EMX1部位を標的とするtru−gRNAまたはマッチする完全長gRNAを用いたRGNによって誘発された挿入欠失変異のDNA配列。標的DNA部位のgRNA相補性領域と相互作用する部分が灰色で強調され、PAM配列の最初の塩基が小文字で示されている。欠失が灰色で強調された破線で表され、挿入が灰色で強調されたイタリック体の文字で表されている。欠失または挿入塩基の総数および各配列が単離された回数が右側に示されている。

図3D:マッチする標準的なRGNおよびtru−RGNによって2つの内在ヒト遺伝子に導入された正確なHDR/ssODN仲介性変化の効率。%HDRはBamHI制限消化アッセイを用いて測定したものである(実施例2の実験手順を参照されたい)。対照gRNA=空のU6プロモーターベクター。

図3E:U2OS.EGFP細胞に様々な量の完全長gRNA発現プラスミド(上段)またはtru−gRNA発現プラスミド(下段)を一定量のCas9発現プラスミドとともにトランスフェクトした後、EGFP発現が減少した細胞の百分率をアッセイした。二重反復実験の平均値が平均値の標準誤差とともに示されている。この3か所のEGFP標的部位では、tru−gRNAで得られたデータがtru−gRNAプラスミドの代わりに完全長gRNA発現プラスミドで実施した実験のデータと緊密に一致していることに留意されたい。 図3F:U2OS.EGFP細胞に様々な量のCas9発現プラスミドを一定量の各標的に対する完全長gRNA発現プラスミド(上段)またはtru−gRNA発現プラスミド(下段)(図3Eの実験から各tru−gRNAの量を決定した)とともにトランスフェクトした。二重反復実験の平均値が平均値の標準誤差とともに示されている。この3か所のEGFP標的部位では、tru−gRNAで得られたデータがtru−gRNAプラスミドの代わりに完全長gRNA発現プラスミドで実施した実験のデータと緊密に一致していることに留意されたい。これらの漸増法の結果から、実施例1および2で実施したEGFP崩壊アッセイに使用するプラスミドの濃度を決定した。

図4A:ペアの二重ニックのためのgRNAが標的とするVEGFA部位1および4の位置を示す模式図である。完全長gRNAの標的部位に下線が施されており、PAM配列の最初の塩基が小文字で示されている。ssODNドナーを用いたHDRによって挿入されるBamHI制限部位の位置が示されている。 図4B:tru−gRNAをペアニッカーゼ戦略とともに用いて挿入欠失変異を効率的に誘発することができる。VEGFA部位1に対する完全長gRNAをtru−gRNAに置き換えても、EGFA部位4に対するペアの完全長gRNAおよびCas9−D10Aニッカーゼで観察される挿入欠失変異の効率は低下しない。使用した対照gRNAは相補性領域を欠くgRNAである。 図4C:tru−gRNAをペアニッカーゼ戦略とともに用いて正確なHDR/ssODN仲介性配列変化を効率的に誘発することができる。VEGFA部位1に対する完全長gRNAをtru−gRNAに置き換えても、ssODNドナー鋳型を用いたVEGFA部位4に対するペアの完全長gRNAおよびCas9−D10Aニッカーゼで観察される挿入欠失変異の効率は低下しない。使用した対照gRNAは相補性領域を欠くgRNAである。

図5A:完全長gRNA(上段)または各位置(U6プロモーターからの効率的な発現のためのGのままでなければならない最も5’側の塩基を除く)に単一ミスマッチを有するtru−gRNA(下段)を用いた、EGFPの3つの部位をそれぞれ標的とするRGNの活性。下の格子の灰色の四はワトソン−クリックトランスバージョンミスマッチの位置を表す。使用した空のgRNA対照は相補性領域を欠くgRNAである。RGN活性はEGFP崩壊アッセイを用いて測定したものであり、示される値は、完全にマッチするgRNAを用いたRGNに対する観察されたEGFP陰性の百分率を表す。実験は二重反復で実施したものであり、平均値が平均値の標準誤差を表すエラーバーとともに示されている。

図5B:完全長gRNA(上段)または各位置(U6プロモーターからの効率的な発現のためのGでなければならない最も5’側の塩基を除く)に隣接した二重ミスマッチを有するtru−gRNA(下段)を用いた、EGFPの3つの部位をそれぞれ標的とするRGNの活性。データは図5Aと同じように表されている。

図6A:ディープシーケンシングによって測定した、3か所の異なる内在ヒト遺伝子部位を標的とするRGNによって誘発されたオンターゲットおよびオフターゲット挿入欠失変異の絶対頻度。完全長gRNA、tru−gRNAまたは相補性領域を欠く対照gRNAを有する標的化RGNを発現した細胞の3か所の標的部位について挿入欠失頻度が示されている。これらのグラフの作成に用いた挿入欠失変異の絶対数を表3Bにみることができる。

図6B:3種類のtru−RGNのオフターゲット部位特異性の改善倍数。示される値は、示されるオフターゲット部位について(A)および表3Bのデータを用いて計算した、tru−RGNのオンターゲット活性/オフターゲット活性の、標準的なRGNのオンターゲット活性/オフターゲット活性に対する比を表す。アスタリスク(

*)の付いた部位については、tru−RGNでは挿入欠失が観察されなかったため、示される値は、これらのオフターゲット部位に対する特異性の控えめな統計的推定値を表す(結果および実験手順を参照されたい)。 図6C、上段:T7EIアッセイによって特定されたVEGFA部位1を標的とするtru−RGNのオンターゲット部位とオフターゲット部位の比較(ディープシーケンシングによってさらに多くの部位が特定された)。完全長gRNAが標的部位の5’末端にある2つのヌクレオチドにミスマッチであり、これらはtru−gRNA標的部位に存在しない2つのヌクレオチドであることに留意されたい。オンターゲット部位に対するオフターゲット部位のミスマッチが下線を施した太字で強調されている。gRNAとオフターゲット部位との間のミスマッチがXで示されている。 図6C、下段:完全長gRNAまたは短縮gRNAを有するRGNによってオフターゲット部位に誘発された挿入欠失変異の頻度。挿入欠失変異頻度はT7EIアッセイによって決定したものである。この図のオフターゲット部位は、本発明者らが以前の研究でVEGFA部位1を標的とする標準的なRGNによって誘発される挿入欠失変異ついて既に検討し、部位OT1−30と命名した部位であることに留意されたい(実施例1およびFuら,Nat Biotechnol.31(9):822−6(2013))。挿入欠失変異の頻度はT7EIアッセイの信頼できる検出限界(2〜5%)にあると思われるので、本発明者らの以前の実験ではこの部位にオフターゲット変異が確認されなかった可能性がある。

図7A〜図7D:VEGFA部位1および3を標的とするtru−gRNAまたはマッチする完全長gRNAを用いたRGNによって誘発された挿入欠失変異のDNA配列。配列は図3Cと同じように図示されている。

図7A〜図7D:VEGFA部位1および3を標的とするtru−gRNAまたはマッチする完全長gRNAを用いたRGNによって誘発された挿入欠失変異のDNA配列。配列は図3Cと同じように図示されている。

図7A〜図7D:VEGFA部位1および3を標的とするtru−gRNAまたはマッチする完全長gRNAを用いたRGNによって誘発された挿入欠失変異のDNA配列。配列は図3Cと同じように図示されている。

図7A〜図7D:VEGFA部位1および3を標的とするtru−gRNAまたはマッチする完全長gRNAを用いたRGNによって誘発された挿入欠失変異のDNA配列。配列は図3Cと同じように図示されている。

図7E:ミスマッチの5’Gヌクレオチドを有するtru−gRNAによって誘発された挿入欠失変異の頻度。VEGFA部位1および3ならびにEMX1部位1に対する17nt、18ntまたは20ntの相補性領域を有するtru−gRNAによって誘導されるCas9によってヒトU2OS.EGFP細胞に誘発された挿入欠失変異の頻度が示されている。この3種類のgRNAにはミスマッチの5’G(太字で印をつけた位置によって表される)が含まれている。バーは、完全長gRNA(20nt)、tru−gRNA(17ntまたは18nt)およびミスマッチの5’Gヌクレオチドを有するtru−gRNA(5’末端に太字のTがある17ntまたは18nt)を用いた実験の結果を表す。(ミスマッチのあるEMX1部位1に対するtru−gRNAでは活性が検出されなかったことに留意されたい。)

図8A〜図8C:RGNによってヒトU2OS.EGFP細胞に誘発されたオフターゲット挿入欠失変異の配列。RGNによって認識される野生型ゲノムオフターゲット部位(PAM配列を含む)が灰色で強調されており、表1および表Bと同じように番号が付されている。いくつかの部位については相補鎖が示されていることに留意されたい。欠失塩基は灰色の背景に破線で示されている。挿入塩基はイタリック体で表され、灰色で強調されている。

図8A〜図8C:RGNによってヒトU2OS.EGFP細胞に誘発されたオフターゲット挿入欠失変異の配列。RGNによって認識される野生型ゲノムオフターゲット部位(PAM配列を含む)が灰色で強調されており、表1および表Bと同じように番号が付されている。いくつかの部位については相補鎖が示されていることに留意されたい。欠失塩基は灰色の背景に破線で示されている。挿入塩基はイタリック体で表され、灰色で強調されている。

図8A〜図8C:RGNによってヒトU2OS.EGFP細胞に誘発されたオフターゲット挿入欠失変異の配列。RGNによって認識される野生型ゲノムオフターゲット部位(PAM配列を含む)が灰色で強調されており、表1および表Bと同じように番号が付されている。いくつかの部位については相補鎖が示されていることに留意されたい。欠失塩基は灰色の背景に破線で示されている。挿入塩基はイタリック体で表され、灰色で強調されている。

図9A〜図9C:RGNによってヒトHEK293細胞に誘発されたオフターゲット挿入欠失変異の配列。RGNによって認識される野生型ゲノムオフターゲット部位(PAM配列を含む)が灰色で強調されており、表1および表Bと同じように番号が付されている。いくつかの部位については相補鎖が示されていることに留意されたい。欠失塩基は灰色の背景に破線で示されている。挿入塩基はイタリック体で表され、灰色で強調されている。

*単一bpの挿入欠失が多数生じた。

図9A〜図9C:RGNによってヒトHEK293細胞に誘発されたオフターゲット挿入欠失変異の配列。RGNによって認識される野生型ゲノムオフターゲット部位(PAM配列を含む)が灰色で強調されており、表1および表Bと同じように番号が付されている。いくつかの部位については相補鎖が示されていることに留意されたい。欠失塩基は灰色の背景に破線で示されている。挿入塩基はイタリック体で表され、灰色で強調されている。

*単一bpの挿入欠失が多数生じた。

図9A〜図9C:RGNによってヒトHEK293細胞に誘発されたオフターゲット挿入欠失変異の配列。RGNによって認識される野生型ゲノムオフターゲット部位(PAM配列を含む)が灰色で強調されており、表1および表Bと同じように番号が付されている。いくつかの部位については相補鎖が示されていることに留意されたい。欠失塩基は灰色の背景に破線で示されている。挿入塩基はイタリック体で表され、灰色で強調されている。

*単一bpの挿入欠失が多数生じた。

(詳細な説明) CRISPR RNA誘導型ヌクレアーゼ(RGN)は、簡便で効率的なゲノム編集のプラットフォームとして急速に登場した。Marraffiniら(Jiangら,Nat Biotechnol 31,233−239(2013))は近年、細菌でのCas9 RGNの特異性を体系的に研究したが、ヒト細胞でのRGN特異性については十分に明らかにされていない。これらのヌクレアーゼを研究および治療応用に広く用いるのであれば、ヒトをはじめとする真核細胞においてRGNによるオフターゲット効果が及ぶ範囲を理解することが極めて重要になる。本発明者らは、ヒト細胞ベースのレポーターアッセイを用いてCas9ベースのRGNによるオフターゲット切断の特徴を明らかにした。ガイドRNA(gRNA)−DNA接合部に沿った位置に応じて、様々な程度で単一および二重のミスマッチが許容された。一部ミスマッチのある部位を調べることによって、ヒト細胞の内在遺伝子座を標的とした6種類のRGNのうちの4種類によって誘発されるオフターゲット変化が迅速に検出された。特定されたオフターゲット部位は最大5つのミスマッチを保有しており、その多くが目的とするオンターゲット部位で観察された頻度と同等(またはそれ以上)の頻度で変異していた。したがって、RGNはヒト細胞において、不完全にマッチしたRNA−DNAに対しても高い活性を示し、この観察結果は研究および治療応用での使用を複雑なものにしかねないものである。

本明細書に記載される結果は、任意のRGNの特異性プロファイルを予測することが容易なものでもなく単純なものでもないことを示している。EGFPレポーターアッセイの実験は、単一および二重のミスマッチがヒト細胞でのRGN活性に様々な影響を及ぼし得るものであり、その影響はミスマッチの標的部位内での位置(1つまたは複数)に厳密に依存するものではないことを示している。例えば、これまでに公開されている報告の通り、一般にsgRNA/DNA接合部の3’側半分にみられる変化の方が、5’側半分にみられる変化よりも影響が大きいが(Jiangら,Nat Biotechnol 31,233−239(2013);Congら,Science 339,819−823(2013);Jinekら,Science 337,816−821(2012))。しかしながら3’末端の単一および二重変異が十分に許容されると思われる場合もあるのに対して、5’末端の二重変異は活性を大幅に低下させ得る。さらに、任意の位置(1つまたは複数)のミスマッチの影響の大きさは部位依存的であると思われる。可能なあらゆるヌクレオチド置換(本発明者らのEGFPレポーター実験で用いられるワトソン−クリックトランスバージョン以外にも)を試験し、大きな一連のRGNに関して広範囲にわたるプロファイリングを実施すれば、オフターゲットの及び得る範囲についてさらに洞察が得られると考えられる。この点に関して、近年記載されたMarraffiniらの細菌細胞ベースの方法(Jiangら,Nat Biotechnol 31,233−239(2013))または以前にLiuらがZFNに適用したin vitroのコンビナトリアルライブラリーベースの切断部位選択手法(Pattanayakら,Nat Methods 8,765−770(2011))が、さらに大きなRGN特異性プロファイルの作製に有用であると考えられる。

RGN特異性を広範囲にわたって予測するには上に挙げたような困難が伴うが、オンターゲット部位と1〜5つのミスマッチの分だけ異なる一部のゲノム部位を調べることによって、真のRGNによるオフターゲットを特定することができた。注目すべきことに、これらの実験の条件下では、多くのこれらのオフターゲット部位におけるRGN誘発変異の頻度は、目的とするオンターゲット部位で観察された頻度とほぼ同じ(またはそれ以上)であり、T7EIアッセイ(本発明者らの実験室で実施した場合、信頼できる変異頻度の検出限界が約2〜5%である)を用いてこれらの部位を検出することが可能であった。これらの変異率は極めて高いため、これまではるかに頻度の低いZFN誘発オフターゲット変化およびTALEN誘発オフターゲット変化の検出に必要とされたディープシーケンシング法の使用を回避することができた(Pattanayakら,Nat Methods 8,765−770(2011);Perezら,Nat Biotechnol 26,808−816(2008);Gabrielら,Nat Biotechnol 29,816−823(2011);Hockemeyerら,Nat Biotechnol 29,731−734(2011))。このほか、ヒト細胞におけるRGNオフターゲット変異誘発の解析から、RGN特異性を予測することが困難であることが確認され、単一および二重のミスマッチのあるオフターゲット部位がすべて変異の証拠を示すわけではないが、ミスマッチが5つに及ぶ一部の部位でも変化がみられた。さらに、特定された真のオフターゲット部位には、目的とする標的配列と比較して、転移または転換による差への明らかな偏りは全くみられない(表E;灰色で強調した行)。

いくつかのRGNにオフターゲット部位がみられたが、このような部位の特定は広範囲の規模でもゲノム全域にわたる規模でもなかった。研究対象にした6種類のRGNでは、ヒトゲノム内にある総数がはるかに多い潜在的オフターゲット配列のごく一部のものだけ(目的とする標的部位とは3〜6つのヌクレオチドが異なる部位;表Eと表Cを比較されたい)を検討した。T7EIアッセイによってこれだけ多数のオフターゲット変異の遺伝子座を検討するのは実用的な戦略でも費用効果に優れた戦略でもないが、今後の研究でハイスループットシーケンシングを使用することになれば、多数のオフターゲット部位の候補を調べることが可能になり、より高感度に真のオフターゲット変異を検出する方法が得られるものと考えられる。例えば、そのような方法を用いれば、本発明者らがいかなるオフターゲット変異も明らかにできなかった2種類のRGNについて、さらなるオフターゲット部位を明らかにすることが可能になると考えられる。さらに、細胞内でのRGN活性に影響を及ぼし得るRGN特異性とエピゲノミックな要因(例えば、DNAメチル化およびクロマチン状態)の両方の理解が進展すればほかにも、検討する必要のある潜在的部位の数が減少し、これによりゲノム全域にわたるRGNオフターゲットの評価の実用性が高まり、価格も手頃なものになり得ると考えられる。

本明細書に記載されるように、ゲノムオフターゲット変異の頻度を最小限に抑えるのにいくつかの戦略を用いることができる。例えば、RGN標的部位の特異的選択を最適化することができる。目的とする標的部位と最大5つの位置において異なるオフターゲット部位がRGNによって効率的に変異され得るとすると、ミスマッチの計数によって判定される最小数のオフターゲット部位を有する標的部位を選択するのが効果的であるとは思われない。ヒトゲノム内の配列を標的とする任意のRGNには通常、20bpのRNA:DNA相補性領域内の4つまたは5つの位置が異なる何千もの潜在的オフターゲット部位が存在することになる(例えば、表Cを参照されたい)。このほか、gRNA相補性領域のヌクレオチド含有量が潜在的オフターゲット効果の範囲に影響を及ぼす可能性がある。例えば、GC含有量が高いとRNA:DNAハイブリッドが安定することが示されており(Sugimotoら,Biochemistry 34,11211−11216(1995))、したがって、gRNA/ゲノムDNAのハイブリダイゼーションの安定性およびミスマッチの許容性も高まることが予想されると考えられる。この2つのパラメータ(ゲノム内のミスマッチ部位の数およびRNA:DNAハイブリッドの安定性)がゲノム全域にわたるRGN特異性に影響を及ぼす可能性およびその機序を評価するには、gRNAの数を増やした実験がさらに必要となる。しかし、このような予測パラメータを定めることができるとしても、このようなガイドラインの実施による影響がRGNの標的化の範囲をさらに制限することになる可能性があることに留意することが重要である。

RGN誘発オフターゲット効果を低減する一般的な戦略で有望なものの1つに、細胞内で発現するgRNAおよびCas9ヌクレアーゼの濃度を低くすることが考えられる。U2OS.EGFP細胞のVEGFA標的部位2および3にRGNを用いて、この考えを検討した。トランスフェクトするsgRNA発現およびCas9発現プラスミドを減らしたところ、オンターゲット部位での変異率が低下したが、オフターゲット変異の相対的比率はあまり変化しなかった(表2Aおよび2B)。これと同じように、他の2種類のヒト細胞型(HEK293細胞およびK562細胞)でも、オンターゲット変異誘発の絶対的比率がU2OS.EGFP細胞より低いものの、高レベルのオフターゲット変異誘発率が観察された。したがって、細胞内でのgRNAおよびCas9の発現レベルを低下させてもオフターゲット効果を低減する解決策にはならないと思われる。さらに、上の結果はほかにも、ヒト細胞に観察される高率のオフターゲット変異誘発がgRNAおよび/またはCas9の過剰発現に起因するものではないことを示唆している。

3種類の異なるヒト細胞型でRGNによって大幅なオフターゲット変異誘発が引き起こされ得るという観察結果は、このゲノム編集プラットフォームの使用に重要な意味を持つ。研究に適用する場合、特に望ましくない変化の他配が課題となる世代時間の長い培養細胞または生物体を用いる実験では、高頻度のオフターゲット変異の潜在的に複雑な作用を考慮に入れる必要がある。オフターゲット効果はランダムなものではなく、標的とする部位と関係があるため、このような作用を制御する方法の1つとして、異なるDNA配列を標的とする複数のRGNを用いて同じゲノム変化を誘発することが考えられる。しかし、治療に適用する場合、ここに挙げた観察結果は、これらのヌクレアーゼをヒト疾患の治療により長期間にわたって安全に使用するのであれば、RGN特異性を慎重に定め、かつ/または改善する必要があることを明確に示している。

特異性を改善する方法 本明細書に示されるように、化膿性連鎖球菌(S.pyogenes)Cas9タンパク質を土台とするCRISPR−Cas RNA誘導型ヌクレアーゼは、目的とするオンターゲット活性と同等以上の著しいオフターゲット変異誘発効果を有し得る(実施例1)。このようなオフターゲット効果は、研究の適用する際に、また特に将来治療に適用する際に問題となり得る。したがって、CRISPR−Cas RNA誘導型ヌクレアーゼ(RGN)の特異性を改善する方法が必要とされている。

実施例1に記載されるように、Cas9 RGNはヒト細胞のオフターゲット部位に高頻度の挿入欠失変異を誘発し得る(このほか、Cradickら,2013;Fuら,2013;Hsuら,2013;Pattanayakら,2013を参照されたい)。このような望ましくない変化は、目的とするオンターゲット部位と5つものミスマッチによって異なるゲノム配列に起こり得る(実施例1を参照されたい)。さらに、gRNA相補性領域の5’末端のミスマッチは一般に、3’末端のミスマッチよりも許容されやすいが、このような関係は絶対的なものではなく、部位依存性を示す(実施例1およびFuら,2013;Hsuら,2013;Pattanayakら,2013を参照されたい)。その結果、現在、ミスマッチの数および/または位置に依存するコンピュータを用いる方法は、真のオフターゲット部位を特定するために予測に用いる価値が低下している。したがって、RNA誘導型ヌクレアーゼを研究および治療応用に使用するのであれば、オフターゲット変異の頻度を低下させる方法が依然として重要な優先事項である。

短縮ガイドRNAs(tru−gRNAs)により特異性が高くなる 一般的に言えば、ガイドRNAには2つの系、すなわち、一緒に機能してCas9による切断を誘導する別個のcrRNAとtracrRNAを用いる系1および2つの別個のガイドRNAを単一の系に組み合わせるキメラcrRNA−tracrRNAハイブリッドを用いる系2(単一ガイドRNAまたはsgRNAと呼ばれる。このほか、Jinekら,Science 2012;337:816−821を参照されたい)がある。tracrRNAは様々な長さに短縮することが可能であり、様々な長さのものが別個の系(系1)およびキメラgRNA系(系2)の両方で機能することが示されている。例えば、いくつかの実施形態では、tracrRNAは、その3’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。いくつかの実施形態では、tracrRNA分子は、その5’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。あるいは、tracrRNA分子は、5’末端および3’末端の両方から、例えば、5’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15ntまたは20nt、3’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。例えば、Jinekら,Science 2012;337:816−821;Maliら,Science.2013 Feb 15;339(6121):823−6;Congら,Science.2013 Feb 15;339(6121):819−23;ならびにHwangおよびFuら,Nat Biotechnol.2013 Mar;31(3):227−9;Jinekら,Elife 2,e00471(2013)を参照されたい。系2では一般に、キメラgRNAの長さが長いほどオンターゲット活性が高いことがわかっているが、様々な長さのgRNAの相対的特異性は現時点では明らかにされておらず、したがって、場合によっては短いgRNAを用いる方が望ましいことがある。いくつかの実施形態では、gRNAは、転写開始部位を含む転写開始部位の上流約100〜800bp以内、例えば、転写開始部位の上流約500bp以内、または転写開始部位の下流約100〜800bp以内、例えば、約500bp以内にある領域に相補的である。いくつかの実施形態では、2種類以上のgRNAをコードするベクター(例えば、プラスミド)、例えば、標的遺伝子の同じ領域の異なる部位を対象とする2種類、3種類、4種類、5種類またはそれ以上のgRNAをコードするプラスミドを用いる。

本願は、gRNAの相補性領域を長くするのではなく短くするという、一見反直観的に思える考えに基づいてRGN特異性を改善する戦略について記載するものである。これらの短いgRNAは、組み込まれた単一のEGFPレポーター遺伝子および内在ヒト遺伝子の複数の部位において完全長gRNAと同等(または場合によってはそれを上回る)の効率を示す様々なタイプのCas9仲介性オンターゲットゲノム編集事象を誘発し得る。さらに、このような短いgRNAを用いたRGNは、gRNA−標的DNA接合部の少数のミスマッチに対する感度が増大する。最も重要なのは、短縮したgRNAを用いると、ヒト細胞でのゲノムオフターゲット効果の発生率が大幅に低下し、それらの部位において5000倍にも及ぶ特異性の改善が得られることである。したがって、この短縮したgRNAを用いる戦略は、オンターゲット活性を損なわず、かつ変異を誘発する可能性のある第二のgRNAを発現させる必要もなくオフターゲット効果を低減する極めて効率的な方法となる。この方法は、ヒト細胞でのRGNのオフターゲット効果を低減するのに単独で実施することも、対を形成したニッカーゼを用いる方法などの他の戦略とともに実施することも可能である。

したがって、CRISPR/Casヌクレアーゼの特異性を増大させる1つの方法は、ヌクレアーゼの特異性を誘導するために使用するガイドRNA(gRNA)種の長さを短くする。5’末端にゲノムDNA標的部位の相補鎖に相補的な17〜18ntを有するガイドRNA、例えば単一gRNAまたはcrRNA(tracrRNAと対を形成する)を用いて、追加の隣接する、例えば配列NGGのプロトスペーサー隣接モチーフ(PAM)を有する特定の17〜18ntゲノム標的までCas9ヌクレアーゼを誘導することができる(図1)。

gRNAの相補性領域の長さを長くすれば特異性が改善されることも予想されようが、本発明者ら(Hwangら,PLoS One.2013 Jul 9;8(7):e68708)および他の者(Ranら,Cell.2013 Sep 12;154(6):1380−9)は以前、gRNAの5’末端の標的部位相補性領域を長くすると、オンターゲット部位における機能の効率が実際に低下することを観察している。

一方、実施例1の実験では、標準的な長さの5’相補性標的化領域内に複数のミスマッチを有するgRNAが依然として、その標的部位のCas9仲介性切断を確実に誘発することが可能であることが示された。したがって、これらの5’末端ヌクレオチドを欠く短縮gRNAがその完全長の対応物と同等の活性を示す可能性が考えられた(図2A)。さらに、これらの5’ヌクレオチドは通常、gRNA−標的DNA接合部の他の位置のミスマッチを相殺すると考えられたため、短いgRNAの方がミスマッチに対する感度が高く、したがって、誘発するオフターゲット変異のレベルが低くなると予測された(図2A)。

ほかにも、標的とするDNA配列の長さを短くすれば、gRNA:DNAハイブリッドの安定性が低下してミスマッチに対する許容性が低下し、これにより標的化の特異性が増大すると考えられる。つまり、より短いDNA標的を認識するようにgRNA配列を短縮すれば、単一のヌクレオチドミスマッチに対しても許容性が低く、したがって特異性が高く、目的外のオフターゲット効果が減少したRNA誘導型ヌクレアーゼが実際に得られると考えられる。

このgRNA相補性領域を短縮する戦略は、細菌もしくは古細菌由来の他のCasタンパク質およびDNAの単一鎖に切れ目を入れるCas9変異体または一方もしくは両方のヌクレアーゼドメインに触媒能不活性化変異を有するdCas9などのヌクレアーゼ活性をもたないCas9変異体を含めた化膿性連鎖球菌(S.pyogenes)Cas9以外のRNA誘導型タンパク質に用いることができる可能性がある。この戦略は、単一gRNAを用いる系のほか、二重gRNA(例えば、天然の系にみられるcrRNAとtracrRNA)を用いる系に適用することができる。

したがって、本明細書には、通常通りにトランスコードされたtracrRNAと融合したcrRNAを含む単一ガイドRNA、例えば、Maliら,Science 2013 Feb 15;339(6121):823−6に記載されている単一Cas9ガイドRNAであるが、プロトスペーサー隣接モチーフ(PAM)、例えばNGG、NAGまたはNNGGの5’側に隣接する標的配列の相補鎖の20未満のヌクレオチド(nt)、例えば19nt、18ntまたは17nt、好ましくは17ntまたは18ntに相補的な配列を5’末端に有するガイドRNAが記載される。いくつかの実施形態では、短縮Cas9ガイドRNAは配列: (X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407);または (X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408); (X17〜18またはX17〜19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(配列番号1); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号2); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号3);(X17〜18またはX17〜19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(配列番号4)、 (X17〜18またはX17〜19)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号5); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号6);または(X17〜18またはX17〜19)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号7); からなり、配列中、X17〜18またはX17〜19はそれぞれ、標的配列の連続する17〜18ヌクレオチドまたは17〜19ヌクレオチドに相補的なヌクレオチド配列である。本明細書にはほかにも、既に文献(Jinekら,Science.337(6096):816−21(2012)およびJinekら,Elife.2:e00471(2013))に記載されている短縮Cas9ガイドRNAをコードするDNAが記載される。

ガイドRNAは、リボ核酸とCas9との結合に干渉しない任意の配列であり得るXNを含んでよく、(RNA中の)Nは0〜200、例えば、0〜100、0〜50または0〜20であり得る。

いくつかの実施形態では、ガイドRNAは、3’末端に1つまたは複数のアデニン(A)またはウラシル(U)ヌクレオチドを含む。いくつかの実施形態では、RNA PolIII転写を停止させる終止シグナルとして用いられる1つまたは複数のTが任意選択で存在するの、RNAは分子の3’末端に1つまたは複数のU、例えば、1〜8つまたはそれ以上のU(例えば、U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)を含む。

ロックト核酸(LNA)などの修飾RNAオリゴヌクレオチドが、修飾オリゴヌクレオチドをより好ましい(安定な)コンホメーションにロックすることによってRNA−DNAハイブリダイゼーションの特異性を増大させることが示されている。例えば、2’−O−メチルRNAは2’酸素と4’炭素の間に追加の共有結合が存在する修飾塩基であり、これをオリゴヌクレオチド内に組み込むことによって全体の熱安定性および選択性を改善することができる(式I)。

したがって、いくつかの実施形態では、本明細書に開示されるtru−gRNAは、1つまたは複数の修飾RNAオリゴヌクレオチドを含み得る。例えば、本明細書に記載の短縮ガイドRNA分子は、標的配列に相補的なガイドRNAの17〜18ntまたは17〜19n5’領域の1つ、一部または全部が修飾されていてよく、例えば、ロックされていてよく(2’−O−4’−Cメチレン架橋)、5’−メチルシチジンであってよく、2’−O−メチル−プソイドウリジンであってよく、あるいはリボースリン酸骨格がポリアミド鎖に置き換わっていてよく(ペプチド核酸)、例えば、合成リボ核酸であってよい。

他の実施形態では、tru−gRNA配列の1つ、一部または全部のヌクレオチドが修飾されていてよく、例えば、ロックされていてよく(2’−O−4’−Cメチレン架橋)、5’−メチルシチジンであってよく、2’−O−メチル−プソイドウリジンであってよく、あるいはリボースリン酸骨格がポリアミド鎖に置き換わっていてよく(ペプチド核酸)、例えば、合成リボ核酸であってよい。

細胞との関連において、Cas9と上に挙げた合成gRNAの複合体によりCRISPR/Cas9ヌクレアーゼ系のゲノム全域にわたる特異性を改善することが可能である。

例示的な修飾または合成tru−gRNAは以下の配列: (X17〜18またはX17〜19)GUUUUAGAGCUA(XN)(配列番号2404); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(XN)(配列番号2407); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(XN)(配列番号2408); (X17〜18またはX17〜19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(配列番号1); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号2); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号3); (X17〜18)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(配列番号4)、 (X17〜18またはX17〜19)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号5); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号6);または (X17〜18またはX17〜19)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号7); を含むか、これよりなるものであり得、配列中、X17〜18またはX17〜19はそれぞれ、標的配列、好ましくはプロトスペーサー隣接モチーフ(PAM)、例えばNGG、NAGまたはNNGGの5’側に隣接する標的配列の17〜18ntまたは17〜19ntに相補的な配列であり、さらに配列中、1つまたは複数のヌクレオチド、例えば、配列X17〜18もしくはX17〜19内の1つもしくは複数のヌクレオチド、配列XN内の1つもしくは複数のヌクレオチドまたはtru−gRNAの任意の配列内の1つもしくは複数のヌクレオチドがロックされている。XNは、リボ核酸とCas9との結合に干渉しない任意の配列であり、(RNA中の)Nは0〜200、例えば、0〜100、0〜50または0〜20であり得る。いくつかの実施形態では、RNA PolIII転写を停止させる終止シグナルとして用いられる1つまたは複数のTが任意選択で存在するので、RNAは分子の3’末端に1つまたは複数のU、例えば、1〜8つまたはそれ以上のU(例えば、U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)を含む。

本明細書に記載される実施例の一部では単一gRNAを用いるが、ほかにもこの方法を二重gRNA(例えば、天然の系にみられるcrRNAとtracrRNA)とともに用いてもよい。この場合、単一tracrRNAを、本発明の系を用いて発現させる複数の異なるcrRNAとともに使用し、例えば、以下のように:(X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407);または (X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408);とtracrRNA配列とを使用する。この場合、crRNAを本明細書に記載の方法および分子のガイドRNAとして使用し、tracrRNAを同じまたは異なるDNA分子から発現させ得る。いくつかの実施形態では、この方法は、細胞と、配列GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号8)またはその活性部分(活性部分とは、Cas9またはdCas9と複合体を形成する能を保持している部分のことである)を含むか、これよりなるtracrRNAとを接触させることを含む。いくつかの実施形態では、tracrRNA分子は、その3’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。別の実施形態では、tracrRNA分子は、その5’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。あるいは、tracrRNA分子は、5’末端および3’末端の両方から、例えば、5’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15ntまたは20nt、3’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。例示的なtracrRNA配列は配列番号8のほかにも、以下のものを含む: UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2405)もしくはその活性部分; AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2407)もしくはその活性部分; CAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2409)もしくはその活性部分; UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUG(配列番号2410)もしくはその活性部分; UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA(配列番号2411)もしくはその活性部分;またはUAGCAAGUUAAAAUAAGGCUAGUCCG(配列番号2412)もしくはその活性部分。

(X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUG(配列番号2407)をcrRNAとして用いるいくつかの実施形態では、以下のtracrRNAを用いる:GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号8)またはその活性部分。(X17〜18またはX17〜19)GUUUUAGAGCUA(配列番号2404)をcrRNAとして用いるいくつかの実施形態では、以下のtracrRNAを用いる:UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2405)またはその活性部分。(X17〜18またはX17〜19)GUUUUAGAGCUAUGCU(配列番号2408)をcrRNAとして用いるいくつかの実施形態では、以下のtracrRNAを用いる:AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号2406)またはその活性部分。

さらに、別個のcrRNAとtracrRNAを用いる系では、その一方または両方が合成であり、1つまたは複数の修飾(例えば、ロックト)ヌクレオチドまたはデオキシリボヌクレオチドを含むものであり得る。

いくつかの実施形態では、単一ガイドRNAおよび/またはcrRNAおよび/またはtracrRNAは、3’末端に1つまたは複数のアデニン(A)またはウラシル(U)ヌクレオチドを含み得る。

既存のCas9ベースのRGNは、目的とするゲノム部位への標的化を誘導するのにgRNA−DNAヘテロ二本鎖の形成を利用するものである。しかし、RNA−DNAヘテロ二本鎖ではそのDNA−DNA対応物よりも無差別な範囲の構造が形成され得る。実際、DNA−DNA二本鎖の方がミスマッチに対する感度が高く、このことは、DNA誘導型ヌクレアーゼがオフターゲット配列と容易には結合せず、RNA誘導型ヌクレアーゼに比して特異性が高いことを示唆している。したがって、本明細書に記載の短縮ガイドRNAはハイブリッド、すなわち、1つまたは複数のデオキシリボヌクレオチド、例えば短いDNAオリゴヌクレオチドが、gRNAの全部または一部、例えばgRNAの相補性領域の全部または一部と置き換わったハイブリッドであり得る。このDNAベースの分子は、単一gRNA系の全部または一部と置き換わってもよく、あるいは二重crRNA/tracrRNA系のcrRNAの全部または一部と置き換わってもよい。一般にDNA−DNA二本鎖の方がRNA−DNA二本鎖よりもミスマッチに対する許容性が低いことから、相補性領域内にDNAを組み込むこのような系の方がより高い信頼性で目的とするゲノムDNA配列を標的とするはずである。このような二本鎖を作製する方法は当該技術分野で公知であり、例えば、Barkerら,BMC Genomics.2005 Apr 22;6:57;およびSugimotoら,Biochemistry.2000 Sep 19;39(37):11270−81を参照されたい。

例示的な修飾または合成tru−gRNAは、以下の配列: (X17〜18またはX17〜19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(配列番号1); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号2); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(配列番号3);(X17〜18またはX17〜19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(配列番号4)、 (X17〜18またはX17〜19)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号5); (X17〜18またはX17〜19)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号6);または (X17〜18またはX17〜19)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(配列番号7); を含むか、これよりなるものであり得、配列中、X17〜18またはX17〜19はそれぞれ、標的配列、好ましくはプロトスペーサー隣接モチーフ(PAM)、例えばNGG、NAGまたはNNGGの5’側に隣接する標的配列の17〜18ntまたは17〜19ntに相補的な配列であり、さらに配列中、1つまたは複数のヌクレオチド、例えば、配列X17〜18もしくはX17〜19内の1つもしくは複数のヌクレオチド、配列XN内の1つもしくは複数のヌクレオチドまたはtru−gRNAの任意の配列内の1つもしくは複数のヌクレオチドがデオキシリボヌクレオチドである。XNは、リボ核酸とCas9との結合に干渉しない任意の配列であり、(RNA中の)Nは0〜200、例えば、0〜100、0〜50または0〜20であり得る。いくつかの実施形態では、RNA PolIII転写を停止させる終止シグナルとして用いられる1つまたは複数のTが任意選択で存在するため、RNAは分子の3’末端に1つまたは複数のU、例えば、1〜8つまたはそれ以上のU(例えば、U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)を含む。

さらに、別個のcrRNAとtracrRNAを用いる系では、その一方または両方が合成であり、1つまたは複数のデオキシリボヌクレオチドを含むものであり得る。

いくつかの実施形態では、単一ガイドRNAまたはcrRNAまたはtracrRNAは、3’末端に1つまたは複数のアデニン(A)またはウラシル(U)ヌクレオチドを含む。

いくつかの実施形態では、オフターゲット効果を最小限に抑えるため、gRNAをゲノムの残りの部分の配列と異なる少なくとも3つ以上のミスマッチである部分に標的化する。

記載される方法は、細胞内で本明細書に記載の短縮Cas9 gRNA(tru−gRNA)(任意選択で、修飾tru−gRNAまたはDNA/RNAハイブリッドtru−gRNA)およびこの短縮Cas9 gRNAによって誘導され得るヌクレアーゼ、例えばCas9ヌクレアーゼ、例えば、Maliらに記載されているCas9ヌクレアーゼ、Jinekら,2012に記載されているCas9ニッカーゼ;またはdCas9−異種機能ドメイン融合物(dCas9−HFD)を発現させるか、細胞とこれらとを接触させることを含み得る。

Cas9 いくつかの細菌がCas9タンパク質変異体を発現する。現在、化膿性連鎖球菌(Streptococcus pyogenes)Cas9が最もよく用いられているが、他のCas9タンパク質にも化膿性連鎖球菌(S.pyogenes)Cas9と高レベルの配列同一性を有し、同じガイドRNAを利用するものがある。それ以外のものはさらに多様であり、利用するgRNAが異なり、認識するPAM配列(RNAによって定められる配列に隣接するタンパク質によって定められる、2〜5のヌクレオチドの配列)も異なる。Chylinskiらは多数の細菌群のCas9タンパク質を分類し(RNA Biology 10:5,1−12;2013)、その付図1および付表1に多数のCas9タンパク質を列記しており、これらは参照により本明細書に組み込まれる。ほかのCas9タンパク質については、Esveltら,Nat Methods.2013 Nov;10(11):1116−21およびFonfaraら,“Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.” Nucleic Acids Res.2013 Nov 22.[印刷前電子出版]doi:10.1093/nar/gkt1074に記載されている。

本明細書に記載の方法および組成物には様々な種のCas9分子を用いることができる。化膿性連鎖球菌(S.pyogenes)およびサーモフィルス菌(S.thermophilus)のCas9分子が本開示の大部分の対象となるが、ほかにも、本明細書に列記する他の種のCas9タンパク質に由来するか、これに基づくCas9分子を用いることができる。換言すれば、本記載の大部分が化膿性連鎖球菌(S.pyogenes)およびサーモフィルス菌(S.thermophilus)のCas9分子を用いるものであるが、他の種のCas9分子をその代わりに用いることができる。このような種としては、Chylinskiら,2013の付図に基づいて作成した以下の表に記載される種が挙げられる。

本明細書に記載の構築物および方法は上に挙げたいずれかのCas9タンパク質およびその対応するガイドRNAまたはこれに相当する他のガイドRNAの使用を含み得る。このほか、サーモフィルス菌(Streptococcus thermophilus)LMD−9のCas9 CRISPR1系がヒト細胞で機能することがCongらに示されている(Science 339,819(2013))。髄膜炎菌(N.meningitides)Cas9オルソログがHouら,Proc Natl Acad Sci U S A.2013 Sep 24;110(39):15644−9およびEsveltら,Nat Methods.2013 Nov;10(11):1116−21に記載されている。さらに、Jinekらは、サーモフィルス菌(S.thermophilus)およびL.イノキュア(L.innocua)のCas9オルソログ(異なるガイドRNAを利用すると思われる髄膜炎菌(N.meningitidis)およびジェジュニ菌(C.jejuni)のCas9オルソログではない)が、わずかに効率が低下するものの、化膿性連鎖球菌(S.pyogenes)二重gRNAによって誘導されて標的プラスミドDNAを切断し得ることをin vitroで明らかにしている。

いくつかの実施形態では、本発明の系は、細菌にコードされるか、哺乳動物細胞での発現にコドン最適化され、D10、E762、H983またはD986およびH840またはN863の変異、例えば、D10A/D10NおよびH840A/H840N/H840Yを含む化膿性連鎖球菌(S.pyogenes)Cas9タンパク質を用いてタンパク質のヌクレアーゼ部分の触媒能を不活性化し;これらの位置における置換は、(Nishimasuら,Cell 156,935−949(2014)に記載されているように)アラニンであってよく、また他の残基、例えばグルタミン、アスパラギン、チロシン、セリンまたはアスパラギン酸、例えばE762Q、H983N、H983Y、D986N、N863D、N863SまたはN863Hであってよい(図1C)。本明細書に記載の方法および組成物に使用することができる触媒能が不活性化された化膿性連鎖球菌(S.pyogenes)Cas9は以下の通りであり、例示的なD10AおよびH840Aの変異は太字で表され、下線が施されている。

いくつかの実施形態では、本明細書で使用されるCas9ヌクレアーゼは、化膿性連鎖球菌(S.pyogenes)Cas9の配列と少なくとも約50%同一である、すなわち、配列番号33と少なくとも50%同一である。いくつかの実施形態では、ヌクレオチド配列は配列番号33と約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%または100%同一である。いくつかの実施形態では、配列番号33との差はいずれも非保存領域内にあり、これはChylinskiら,RNA Biology 10:5,1−12;2013(例えば、その付図1および付表1);Esveltら,Nat Methods.2013 Nov;10(11):1116−21およびFonfaraら,Nucl.Acids Res.(2014)42(4):2577−2590.[印刷前電子出版 2013 Nov 22]doi:10.1093/nar/gkt1074に記載されている配列の配列アライメントによって確認される。

2つの配列のパーセント同一性を決定するには、最適比較目的で配列を整列させる(最適な整列に必要であれば第一および第二のアミノ酸または核酸配列の一方または両方にギャップを導入し、また非相同配列を無視することができる)。比較目的で整列させる参照配列の長さは少なくとも50%である(いくつかの実施形態では、参照配列の長さの約50%、55%、60%、65%、70%、75%、85%、90%、95%または100%を整列させる)。次いで、対応する位置のヌクレオチドまたは残基を比較する。第一の配列のある位置が、第二の配列の対応する位置と同じヌクレオチドまたは残基によって占められていれば、2つの分子はその位置において同一である。2つの配列のパーセント同一性は、2つの配列の最適な整列のために導入する必要があるギャップの数および各ギャップの長さを考慮に入れた、2つの配列に共通する同一の位置の数の関数となる。

配列の比較および2つの配列間のパーセント同一性の決定は、数学的アルゴリズムを用いて実施することができる。本願の目的には、GCGソフトウェアパッケージのGAPプログラムに組み込まれているNeedlemanおよびWunsch((1970)J.Mol.Biol.48:444−453)のアルゴリズムを使用し、ギャップペナルティが12、ギャップ伸長ペナルティが4、フレームシフトギャップペナルティが5のBlossum62スコア行列を用いて、2つのアミノ酸配列間のパーセント同一性を決定する。

Cas9−HFD Cas9−HFDについては、2013年3月15日に出願された米国仮特許出願第61/799,647号、2013年6月21日に出願された米国特許出願第61/838,148号および国際出願PCT/US14/27335号に記載されており、上記出願はすべてその全体が参照により本明細書に組み込まれる。

Cas9−HFDは、異種機能ドメイン(例えば転写活性化ドメイン、例えば、VP64またはNF−κB p65の転写活性化ドメイン)と、触媒能不活性化Cas9タンパク質(dCas9)のN末端またはC末端とを融合することによって作製される。本発明の場合、上記の通り、dCas9は任意の種のものでよいが、好ましくは化膿性連鎖球菌(S.pyogenes)のdCas9であり、いくつかの実施形態では、Cas9は、例えば、上の配列番号33に示されるように、タンパク質のヌクレアーゼ部分の触媒能が不活性化されるようD10およびH840残基の変異、例えば、D10N/D10AおよびH840A/H840N/H840Yを含む。

転写活性化ドメインはCas9のN末端に融合しても、C末端に融合してもよい。さらに、本記載では転写活性化ドメインを例にあげているが、ほかにも当該技術分野で公知の他の異種機能ドメイン(例えば、転写リプレッサー(例えば、KRAB、ERD、SIDなど、例えば、ets2リプレッサー因子(ERF)リプレッサードメイン(ERD)のアミノ酸473〜530、KOX1のKRABドメインのアミノ酸1〜97またはMad mSIN3相互作用ドメイン(SID)のアミノ酸1〜36;Beerliら,PNAS USA 95:14628−14633(1998)を参照されたい)またはヘテロクロマチンタンパク質1(HP1、swi6としても知られる)、例えば、HP1αもしくはHP1βなどのサイレンサー;固定化RNA結合配列、例えばMS2コートタンパク質,エンドリボヌクレアーゼCsy4またはラムダNタンパク質が結合するRNA結合配列などと融合した長い非コードRNA(lncRNA)を動員し得るタンパク質またはペプチド;DNAのメチル化状態を修飾する酵素(例えば、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質);あるいはヒストンサブユニットを修飾する酵素(例えば、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(例えば、リジンまたはアルギニン残基をメチル化する)またはヒストンデメチラーゼ(例えば、リジンまたはアルギニン残基を脱メチル化する))を用いることができる。このようなドメインのいくつかの配列、例えば、DNA中のメチル化シトシンのヒドロキシル化を触媒するドメインの配列が当該技術分野で公知である。例示的なタンパク質は、DNA中の5−メチルシトシン(5−mC)を5−ヒドロキシメチルシトシン(5−hmC)n変換する酵素である、Ten−Eleven−Translocation(TET)1〜3のファミリーを含む。

ヒトTET1−3の配列は当該技術分野で公知であり、これを下の表に示す。

いくつかの実施形態では、触媒ドメインの完全長配列の全部または一部、例えば、システインリッチ延長と7つの高度の保存されたエキソンによってコードされる2OGFeDOドメインとを含む触媒モジュール、例えば、アミノ酸1580〜2052を含むTet1触媒ドメイン、アミノ酸1290〜1905を含むTet2およびアミノ酸966〜1678を含むTet3を含み得る。例えば、3種類すべてのTetタンパク質の重要な触媒残基を示す整列に関しては、Iyerら,Cell Cycle.2009 Jun 1;8(11):1698−710.Epub 2009 Jun 27の図1を、また完全長配列に関してはその付属資料(ftpサイトftp.ncbi.nih.gov/pub/aravind/DONS/supplementary_material_DONS.htmlで入手可能)を参照されたい(例えば、seq 2cを参照されたい);いくつかの実施形態では、配列はTet1のアミノ酸1418〜2136またはTet2/3の対応する領域を含む。

その他の触媒モジュールは、Iyerら,2009で特定されているタンパク質に由来するものであり得る。

いくつかの実施形態では、異種機能ドメインは生物学的テザーであり、MS2コートタンパク質、エンドリボヌクレアーゼCsy4またはラムダNタンパク質の全部または一部(例えば、これらのDNA結合ドメイン)を含む。これらのタンパク質を用いて、特異的なステムループ構造を含むRNA分子をdCas9 gRNA標的化配列によって特定される場所に動員することができる。例えば、MS2コートタンパク質、エンドリボヌクレアーゼCsy4またはラムダNと融合したdCas9を用いて、Csy4結合配列、MS2結合配列またはラムダN結合配列と連結したXISTまたはHOTAIRなどの長い非コードRNA(lncRNA)を動員することができる(例えば、Keryer−Bibensら,Biol.Cell 100:125−138(2008)を参照されたい)。あるいは、Csy4結合配列、MS2結合配列またはラムダNタンパク質結合配列を例えば、Keryer−Bibensら(上記)に記載されているように、別のタンパク質と連結してもよく、本明細書に記載の方法および組成物を用いて、このタンパク質をdCas9結合部位に標的化してもよい。いくつかの実施形態では、Csy4は触媒能が不活性化されている。

いくつかの実施形態では、融合タンパク質はdCas9と異種機能ドメインとの間にリンカーを含む。これらの融合タンパク質(または連結構造の融合タンパク質同士)に使用し得るリンカーは、融合タンパク質の機能に干渉しない任意の配列を含み得る。好ましい実施形態では、リンカーは短く、例えば2〜20アミノ酸であり、通常は柔軟である(すなわち、グリシン、アラニンおよびセリンなどの自由度の高いアミノ酸を含む)。いくつかの実施形態では、リンカーはGGGS(配列番号34)またはGGGGS(配列番号35)からなる1つまたは複数の単位、例えば、2回、3回、4回またはそれ以上反復したGGGS(配列番号34)またはGGGGS(配列番号35)の単位を含む。ほかにも、これ以外のリンカー配列を使用することができる。

発現系 記載されるガイドRNAを使用するためには、それをコードする核酸から発現させるのが望ましいであろう。これは様々な方法で実施することができる。例えば、ガイドRNAをコードする核酸を中間ベクターにクローン化して原核細胞または真核細胞を形質転換し、複製および/または発現させる。中間ベクターは通常、ガイドRNAをコードする核酸を保管または操作しガイドRNAを産生するための原核生物ベクター、例えばプラスミドもしくはシャトルベクターまたは昆虫ベクターである。このほか、ガイドRNAをコードする核酸を発現ベクターにクローン化して植物細胞、動物細胞、好ましくは哺乳動物細胞もしくはヒト細胞、真菌細胞、細菌細胞または原生動物細胞に投与してもよい。

発現させるためには、ガイドRNAをコードする配列を通常、転写を指令するプロモーターを含む発現ベクターにサブクローン化する。適切な細菌プロモーターおよび真核プロモーターは当該技術分野で周知であり、例えば、Sambrookら,Molecular Cloning,A Laboratory Manual(第3版,2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);およびCurrent Protocols in Molecular Biology(Ausubelら編,2010)に記載されている。設計したタンパク質を発現させるための細菌発現系を例えば、大腸菌(E.coli)、バチルス(Bacillus)菌種およびサルモネラ(Salmonella)で入手することができる(Palvaら,1983,Gene 22:229−235)。そのような発現系のキットが市販されている。哺乳動物細胞、酵母および昆虫細胞用の真核発現系は当該技術分野で周知であり、同じく市販されている。

核酸の発現を指令するために使用するプロモーターは、具体的な用途によって決まる。例えば、融合タンパク質の発現および精製には通常、強力な構成的プロモーターを使用する。これに対して、遺伝子調節のためにガイドRNAをin vivoで投与する場合、ガイドRNAの具体的な用途に応じて構成的プロモーターまたは誘導プロモーターのいずれかを使用することができる。さらに、ガイドRNAの投与に好ましいプロモーターは、HSV TKなどの弱いプロモーターまたはこれと類似する活性を有するプロモーターであり得る。プロモーターはほかにも、トランス活性化に応答性の要素、例えば、低酸素応答要素、Gal4応答要素、lacリプレッサー応答要素ならびにテトラサイクリン調節系およびRU−486系などの小分子制御系を含み得る(例えば、GossenおよびBujard,1992,Proc.Natl.Acad.Sci.USA,89:5547;Oliginoら,1998,Gene Ther.,5:491−496;Wangら,1997,Gene Ther.,4:432−441;Neeringら,1996,Blood,88:1147−55;ならびにRendahlら,1998,Nat.Biotechnol.,16:757−761を参照されたい)。

発現ベクターは通常、プロモーターに加えて、原核または真核宿主細胞で核酸を発現するのに必要なほかのあらゆる要素を含む転写単位または発現カセットを含む。したがって、典型的な発現カセットは、例えばgRNAをコードする核酸配列と作動可能に連結されたプロモーターと、例えば効率的な転写産物のポリアデニル化、転写停止、リボソーム結合部位または翻訳停止に必要な任意のシグナルとを含む。カセットのほかの要素としては、例えば、エンハンサーおよび異種スプライスイントロンシグナルを挙げ得る。

細胞内に遺伝情報を輸送するのに使用する具体的な発現ベクターは、意図するgRNAの用途、例えば、植物、動物、細菌、真菌、原生動物などでの発現を考慮して選択する。標準的な細菌発現ベクターとしては、pBR322ベースのプラスミド、pSKF、pET23DなどのプラスミドならびにGSTおよびLacZなどの市販のタグ融合発現系が挙げられる。

真核発現ベクターには真核ウイルスの調節要素を含む発現ベクター、例えば、SV40ベクター、パピローマウイルスベクターおよびエプスタイン・バーウイルス由来のベクターを用いることが多い。その他の例示的な真核ベクターとしては、pMSG、pAV009/A+、pMTO10/A+、pMAMneo−5、バキュロウイルスpDSVEおよびSV40初期プロモーター、SV40後期プロモーター、メタロチオネインプロモーター、マウス乳腺腫瘍ウイルスプロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーターをはじめとする真核細胞での発現に効果を示すプロモーターの指令を受けてタンパク質を発現させる他の任意のベクターが挙げられる。

ガイドRNAを発現させるためのベクターは、ガイドRNAの発現を駆動するRNA PolIIIプロモーター、例えば、H1、U6または7SKプロモーターを含み得る。これらのヒトプロモーターは、プラスミドトランスフェクション後に哺乳動物細胞にgRNAを発現させる。あるいは、例えばvitro転写にT7プロモーターを使用してもよく、RNAをin vitroで転写させてから精製することができる。短いRNA、例えば、siRNA、shRNAをはじめとする低分子RNAの発現に適したベクターを使用することができる。

一部の発現系は、安定にトランスフェクトされた細胞系を選択するためのマーカー、例えばチミジンキナーゼ、ヒグロマイシンBホスホトランスフェラーゼおよびジヒドロ葉酸レダクターゼなどを有する。このほか、昆虫細胞にバキュロウイルスベクターを用いてポリヘドリンプロモーターをはじめとする強力なバキュロウイルスプロモーターの指令の下にgRNAコード配列を置くものなど、高収率の発現系が適している。

発現ベクターに通常含まれる要素としてはほかにも、大腸菌(E.coli)で機能するレプリコン、組換えプラスミドを保有する細菌の選択を可能にする抗生物質耐性をコードする遺伝子およびプラスミドの非必須領域にあり組換え配列の挿入を可能にする固有の制限部位が挙げられる。

標準的なトランスフェクション法を用いて、大量のタンパク質を発現する細菌、哺乳動物、酵母または昆虫の細胞系を作製し、次いで標準的な技術を用いてこのタンパク質を精製する(例えば、Colleyら,1989,J.Biol.Chem.,264:17619−22;Guide to Protein Purification,in Methods in Enzymology,vol.182(Deutscherら編,1990)を参照されたい)。真核および原核細胞の形質転換を標準的な技術により実施する(例えば、Morrison,1977,J.Bacteriol.132:349−351;Clark−CurtissおよびCurtiss,Methods in Enzymology 101:347−362(Wuら編,1983)を参照されたい)。

宿主細胞内に外来ヌクレオチド配列を導入するあらゆる既知の方法を用い得る。このような方法としては、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合、エレクトロポレーション、ヌクレオフェクション、リポソーム、マイクロインジェクション、裸のDNA、プラスミドベクター、ウイルスベクター(エピソーム型および組込み型の両方)およびクローン化したゲノムDNA、cDNA、合成DNAをはじめとする外来遺伝物質を宿主細胞内に導入する他のあらゆる周知の方法の使用が挙げられる(例えば、Sambrookら,上記を参照されたい)。唯一必要なのは、用いる具体的な遺伝子工学的方法で、宿主細胞内にgRNAの発現が可能な遺伝子を少なくとも1つ良好に導入することができることである。

本発明は、ベクターおよびベクターを含む細胞を含む。

本発明は以下の実施例でさらに説明されるが、これらの実施例は特許請求の範囲に記載される本発明の範囲を限定するものではない。

実施例1.RNA誘導型エンドヌクレアーゼの特異性の評価 CRISPR RNA誘導型ヌクレアーゼ(RGN)は、簡便で効率的なゲノム編集のプラットフォームとして急速に登場したものである。この実施例では、ヒト細胞ベースのレポーターアッセイを用いてCas9ベースのRGNのオフターゲット切断の特徴を明らかにすることついて記載する。

材料および方法 実施例1では以下の材料および方法を用いた。

ガイドRNAの構築 Cas9標的化のための可変20nt配列を保有するDNAオリゴヌクレオチド(表A)をアニールさせて、4bpオーバーハングを有しBsmBI消化プラスミドpMLM3636へのライゲーションに適合した短い二本鎖DNAフラグメントを作製した。このアニールしたオリゴヌクレオチドのクローン化により、U6プロモーターの発現下に20の可変5’ヌクレオチドを有するキメラ+103一本鎖ガイドRNAをコードするプラスミドが得られる(Hwangら,Nat Biotechnol 31,227−229(2013);Maliら,Science 339,823−826(2013))。この研究に使用するpMLM3636および発現プラスミドpJDS246(コドン最適化型のCas9をコードする)はともに非営利プラスミド配布サービスAddgene(addgene.org/crispr−cas)から入手可能である。

EGFP活性アッセイ EGFP−PEST融合遺伝子の単一コピーが組み込まれたU2OS.EGFP細胞を既に記載されている通りに培養した(Reyonら,Nat Biotech 30,460−465(2012))。トランスフェクションでは、SE Cell Line 4D−Nucleofector(商標)Xキット(Lonza)を製造業者のプロトコルに従って用い、示される量のsgRNA発現プラスミドおよびpJDS246をTd−トマトコードプラスミド30ngとともに200,000個の細胞にヌクレオフェクトした。トランスフェクションの2日後、BD LSRIIフローサイトメータを用いて細胞を解析した。gRNA/Cas9プラスミドの濃度を最適化するトランスフェクションを三重反復で実施し、他のトランスフェクションをいずれも二重反復で実施した。

内在ヒトゲノム部位のPCR増幅および配列検証 Phusion Hot Start II高忠実度DNAポリメラーゼ(NEB)およびPCRプライマーならびに表Bに列記される条件を用いてPCR反応を実施した。ほとんどの遺伝子座がタッチダウンPCR([98℃、10秒;72〜62℃、−1℃/サイクル、15秒;72℃、30秒]10サイクル、[98℃、10秒;62℃、15秒;72℃、30秒]25サイクル)を用いて良好に増幅された。必要に応じて、68℃または72℃の一定のアニーリング温度および3%DMSOまたは1Mベタインを用いて残りの標的のPCRを35サイクル実施した。PCR産物をQIAXCELキャピラリー電気泳動系で分析して、その大きさおよび純度を検証した。妥当性が確認された産物をExoSap−IT(Affymetrix)で処理し、サンガー法(MGH DNA Sequencing Core)により配列決定して各標的部位を検証した。

ヒト細胞におけるRGN誘発オンターゲットおよびオフターゲット変異の頻度の決定 U2OS.EGFP細胞およびK562細胞では、4D Nucleofector System(Lonza)を製造業者の説明書に従って用い、2×105個の細胞にgRNA発現プラスミドまたは空のU6プロモータープラスミド(陰性対照)250ng、Cas9発現プラスミド750ngおよびtd−トマト発現プラスミド30ngをトランスフェクトした。HEK293細胞では、Lipofectamine LTX試薬(Life Technologies)を製造業者の指示に従って用い、1.65×105個の細胞にgRNA発現プラスミドまたは空のU6プロモータープラスミド(陰性対照)125ng、Cas9発現プラスミド375ngおよびtd−トマト発現プラスミド30ngをトランスフェクトした。QIAamp DNA Blood Mini Kit(QIAGEN)を製造業者の説明書に従って用い、トランスフェクトしたU2OS.EGFP細胞、HEK293細胞またはK562細胞からゲノムDNAを回収した。オフターゲット候補部位を増幅するのに十分なゲノムDNAが得られるように、3回のヌクレオフェクション(U2OS.EGFP細胞)、2回のヌクレオフェクション(K562細胞)または2回のLipofectamine LTXトランスフェクションで得られたDNAをプールしてからT7EIを実施した。試験した各条件に対してこの操作を2回実施することにより同じゲノムDNAのプールを2つ作製し、各トランスフェクションを計4回または6回分得た。次いで、これらのゲノムDNAを鋳型に用いてPCRを上記の通りに実施し、Ampure XPビーズ(Agencourt)を製造業者の説明書に従って用い精製した。T7EIアッセイを既に記載されている通りに実施した(Reyonら,2012,上記)。

NHEJ仲介性挿入欠失変異のDNAシークエンシング T7EIアッセイに使用した精製PCR産物をZero Blunt TOPOベクター(Life Technologies)にクローン化し、MGH DNA Automation Coreによりアルカリ溶解ミニプレップ法を用いてプラスミドDNAを単離した。M13順方向プライマー(5’−GTAAAACGACGGCCAG−3’(配列番号1059)を用いてサンガー法(MGH DNA Sequencing Core)によりプラスミドの配列を決定した。

実施例1a.単一ヌクレオチドミスマッチ ヒト細胞におけるRGN特異性決定因子を明らかにすることを始めるにあたり、複数のgRNA/標的DNA接合部内の様々な位置に系統的にミスマッチを生じさせることの影響を評価するために大規模な試験を実施した。これを実施するため、既に記載されている標的ヌクレアーゼ活性の迅速の定量化が可能な定量的なヒト細胞ベースの高感度緑色蛍光タンパク質(EGFP)崩壊アッセイ(上の「方法」およびReyonら,2012,上記を参照されたい)(図2B)を用いた。このアッセイでは、ヌクレアーゼ誘発二本鎖切断(DSB)の誤りがちな非相同末端結合(NHEJ)修復によって導入されるフレームシフト挿入/欠失(挿入欠失)変異を不活性化することによって起こるヒトU2OS.EGFP細胞内の蛍光シグナルを評価することによって、単一の組み込まれたEGFPレポーター遺伝子を標的とするヌクレアーゼの活性を定量化することができる(図2B)。ここに記載される研究では、EGFP内の異なる配列を標的とする以下のような3種類の約100ntの単一gRNAを用いた: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号9) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号10) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号11)。 上記gRNAはそれぞれ、Cas9仲介性のEGFP発現崩壊を効率的に誘導することができる(実施例1eおよび2aならびに図3E(最上段)および3F(最上段)を参照されたい)。

最初の実験では、3種類のEGFP標的化gRNAの相補的標的化領域の20ヌクレオチドのうち19ヌクレオチドにおける単一ヌクレオチドミスマッチの影響を試験した。これを実施するため、3種類の標的部位のそれぞれについて、位置1〜19(3’から5’の方向に1〜20の番号を付した;図1を参照されたい)にワトソン−クリックトランスバージョンミスマッチを保有する変異体gRNAを作製し、これらの各種gRNAがヒト細胞においてCas9仲介性EGFP崩壊を誘導する能力を試験した(位置20のヌクレオチドはU6プロモーター配列の一部であり、発現への影響を避けるためグアニンでなければならないことから、この位置に置換のある変異体gRNAは作製しなかった)。

EGFP標的部位#2では、gRNAの3’末端よりも5’末端のミスマッチの方が許容性に高いことを示唆するこれまでの研究結果(Jiangら,Nat Biotechnol 31,233−239(2013);Congら,Science 339,819−823(2013);Jinekら,Science 337,816−821(2012))の通り、gRNAの位置1〜10に単一ミスマッチがあると、付随するCas9の活性に著しい影響がみられた(図2C、中央パネル)。しかし、EGFP標的部位#1および#3では、gRNAの一部を除くいずれの位置に単一ミスマッチがあっても、それが配列の3’末端内でも、高い許容性がみられた。さらに、上記2種類の標的にはミスマッチに対する感度が高い具体的な位置に差がみられた(図2C、最上段と最下段のパネルを比較されたい)。例えば、標的部位#1は特に位置2のミスマッチに対して高い感度を示したのに対して、標的部位#3は位置1および8のミスマッチに対して最も高い感度を示した。

実施例1b.複数のミスマッチ gRNA/DNA接合部の2つ以上のミスマッチによる影響を試験するため、隣接する位置および離れた位置にワトソン−クリックトランスバージョンミスマッチを2つ有する一連の変異体gRNAを作製し、EGFP崩壊アッセイを用いて、ヒト細胞でこれらのgRNAがCas9ヌクレアーゼ活性を誘導する能力を試験した。全般的に標的部位は3種類とも、一方または両方のミスマッチがgRNA標的化領域の3’側半分に起こる2つの変化に対して感度が高くなることが分かった。しかし、この影響の大きさには部位による差がみられ、標的部位#2がこの2つのミスマッチに対して最も高い感度を示し、標的部位#1が全般的に最も低い感度を示した。許容され得る隣接したミスマッチの数を試験するため、gRNA標的化領域の5’末端の位置19〜15(単一および2つのミスマッチの許容性が高いと思われる位置)の範囲でミスマッチの位置の数が漸増する変異体gRNAを構築した。

このようにミスマッチを漸増させたgRNAを試験したところ、3種類の標的部位でいずれも、3つ以上の隣接するスマッチを導入することによってRGN活性が大幅に消失することが明らかになった。5’末端の位置19から開始し、3’末端に向かってミスマッチを追加して漸増させていくと、3種類の異なるEGFP標的化gRNAの活性が突然低下した。具体的には、位置19および19+18にミスマッチを含むgRNAが実質的に完全な活性を示すのに対して、位置19+18+17、19+18+17+16および19+18+17+16+15にミスマッチのあるgRNAには陰性対照に比して実質的に差がみられなかった(図2F)。(位置20はgRNAの発現を駆動するU6プロモーターの一部であるためGでなければならないことから、本発明者らは上記変異体gRNAの位置20にはミスマッチを生じさせなかったことに留意されたい。)

gRNA相補性を短縮することにより特異性が増大したRGNを得ることができる根拠がほかにも以下の実験で得られた:4種類の異なるEGFP標的化gRNA(図2H)では、位置18および19に2つのミスマッチを導入しても活性にあまり影響を及ぼさなかった。しかし、上記gRNAの位置10および11にさらに2つのミスマッチを導入すると活性がほぼ完全に消失する。10/11の2つのミスマッチのみを導入しても、全般的に活性にそれほど大きな影響を及ぼさないのは興味深い。

以上をまとめると、ヒト細胞で得られたこれらの結果は、RGNの活性がgRNA標的化配列の3’側半分のミスマッチに対する方が高い感度を示し得ることを裏付けるものである。しかし、以上のデータはほかにも、RGN特異性が複雑で標的部位依存性であり、単一および2つのミスマッチであれば、RNA標的化領域の3’側半分に1つまたは複数のミスマッチが生じても高い許容性を示すことが多いことを明確に示している。さらに、以上のデータはほかにも、gRNA/DNA接合部の5’側半分のあらゆるミスマッチが必ずしも許容性が高いわけではないことを示唆している。

さらに、以上の結果は、より短い領域の相補性(具体的には約17nt)を有するgRNAの方が活性の特性が高くなることを強く示唆している。本発明者らは、17ntの特異性と、PAM配列によって付与される2ntの特異性とを組み合わせることによって、ヒト細胞にみられるゲノムのような大型で複雑なゲノム内で固有なものとなるのに十分な長さの1つである19bp配列の仕様が得られることに注目する。

実施例1c.オフターゲット変異 内在ヒト遺伝子を標的とするRGNのオフターゲット変異を特定することができるかどうかを明らかにするため、VEGFA遺伝子の3つの異なる部位、EMX1遺伝子の1つの部位、RNF2遺伝子の1つの部位およびFANCF遺伝子の1つの部位を標的とする6種類の単一gRNAを用いた(表1および表A)。上記6種類のgRNAは、T7エンドヌクレアーゼI(T7EI)アッセイによって検出されたように、ヒトU2OS.EGFP細胞のそれぞれの内在遺伝子座におけるCas9仲介性挿入欠失を効率的に誘導するものであった(上の「方法」および表1)。次いで本発明者らは、この6種のRGNそれぞれについて、U2OS.EGFP細胞におけるヌクレアーゼ誘発NHEJ仲介性挿入欠失変異の証拠を得るため、候補となるオフターゲット部位を数十か所(46から64に及ぶ箇所数)検討した。評価した遺伝子座には、ヌクレオチドが1つまたは2つ異なる全ゲノム部位のほかにも、ヌクレオチドが3〜6つ異なるゲノム部位のサブセットを含め、gRNA標的化配列の5’側半分にこのようなミスマッチを1つまたは複数有するものを重視した(表B)。T7EIアッセイを用いて、VEGFA部位1では(検討した53か所の候補部位うち)4か所のオフターゲット部位、VEGFA部位2では(検討した46か所のうち)12か所、VEGFA部位3では(検討した64か所のうち)7か所、EMX1部位では(検討した46か所のうち)1か所(表1および表B)が容易に特定された。RNF2またはFANCF遺伝子について検討したそれぞれ43か所および50か所の候補部位にはオフターゲット変異は検出されなかった(表B)。実証されたオフターゲット部位の変異率は極めて高く、目的とする標的部位に観察された変異率の5.6%から125%(平均40%)に及ぶものであった(表1)。このような真のオフターゲットには、標的部位の3’末端にミスマッチを有し、合計5つに及ぶミスマッチを有する配列が含まれ、ほとんどのオフターゲット部位がタンパク質をコードする遺伝子内にみられた(表1)。一部のオフターゲット部位のDNAシーケンシングから、予測されるRGN切断部位に挿入欠失変異が起こることを示す分子的な裏付けがさらに得られた(図8A〜8C)。

実施例1d.その他の細胞型のオフターゲット変異 RGNがU2OS.EGFP細胞に高頻度でオフターゲット変異を誘発し得ることが確認されたため、本発明者らは次に、これらのヌクレアーゼが他のタイプのヒト細胞にもこのような影響を及ぼすかどうかを明らかにしようとした。本発明者らは以前、TALEN15の活性を評価するのにU2OS.EGFP細胞を用いたため、本発明者らの最初の実験にはU2OS.EGFP細胞を選択したが、標的化ヌクレアーゼの活性の試験にはヒトHEK293細胞およびK562細胞の方が広く用いられている。したがって、本発明者らはHEK293細胞およびK562細胞についてもVEGFA部位1、2および3ならびにEMX1部位に標的化した4種類のRGNを評価した。本発明者らは、この4種類のRGNが、変異頻度はU2OS.EGFP細胞に観察された頻度よりもいくぶん低いものの、上記のさらなる2種類のヒト細胞系でもその目的とするオンターゲット部位にNHEJ仲介性挿入欠失変異を効率的に誘発することを発見した(T7EIアッセイによる評価)(表1)。最初にU2OS.EGFP細胞で特定された上記4種類のRGNの24か所のオフターゲット部位を評価したところ、多くの部位が、HEK293細胞およびK562細胞でも同様にその対応するオンターゲット部位と同程度の頻度で変異することが明らかになった(表1)。予想された通り、HEK293細胞のこれらのオフターゲット部位の一部のDNAシーケンシングにより、予測されたゲノム遺伝子座に変化が生じることを示す分子的な根拠がさらに得られた(図9A〜9C)。U2OS.EGFP細胞で特定されたオフターゲット部位のうち、HEK293細胞の4か所、K562細胞の11か所が検出可能な変異を示さなかった理由は正確にはわからない。しかし、これらのオフターゲット部位の多くがU2OS.EGFP細胞でも比較的低い変異頻度を示したことが注目される。したがって、本発明者らの実験ではU2OS.EGFP細胞に比してHEK293細胞およびK562細胞の方が全般的にRGNの活性が低いと思われるため、HEK293細胞およびK562細胞のこれらの部位における変異率が本発明者らのT7EIアッセイの信頼できる検出限界(約2〜5%)未満になるものと推測される。以上をまとめると、本発明者らがHEK293細胞およびK562細胞で得た結果は、今回RGNに観察される高頻度のオフターゲット変異が複数のヒト細胞型にみられる一般的な現象である根拠を示すものである。

実施例1e.EGFP崩壊アッセイに使用するgRNA発現およびCas9発現プラスミドの量の漸増 非相同末端結合を介したフレームシフト変異の誘発がEGFPの発現を確実に崩壊させ得る位置であるEGFPヌクレオチド502の上流に位置する3つの異なる配列(上に示したEGFP部位1〜3)に対して単一gRNAを作製した(Maeder,M.L.ら,Mol Cell 31,294−301(2008);Reyon,D.ら,Nat Biotech 30,460−465(2012))。

3つの標的部位について、最初に様々な量のgRNA発現プラスミド(12.5〜250ng)を、構成的に発現するEGFP−PESTレポーター遺伝子の単一コピーを有する本発明者らのU2OS.EGFPレポーター細胞に、コドン最適化型のCas9ヌクレアーゼ発現プラスミド750ngとともにトランスフェクトした。最高濃度のgRNAコードプラスミド(250ng)ではRGNが3種類とも効率的にEGFP発現を崩壊させた(図3E(上段))。しかし、これより少ない量のgRNA発現プラスミドをトランスフェクトした場合、標的部位#1および#3に対するRGNが同レベルの崩壊を示したのに対して、標的部位#2のRGN活性は、トランスフェクトするgRNA発現プラスミドの量を減らすと直ちに低下した(図3E(上段))。

本発明者らのU2OS.EGFPレポーター細胞にトランスフェクトするCas9コードプラスミドの量を漸増させ(50ng〜750ng)てEGFP崩壊をアッセイした。図3F(上段)に示されるように、標的部位#1では、トランスフェクトするCas9コードプラスミドの量を3分の1にしても、EGFP崩壊活性が実質的に低下せずに許容された。しかし、標的部位#2および#3を標的とするRGNの活性は、トランスフェクトするCas9プラスミドの量を3分の1にすると直ちに低下した(図3F(上段))。以上の結果を踏まえて、実施例1a〜1dに記載される実験には、EGFP標的部位#1、#2および#3に対してgRNA発現プラスミド/Cas9発現プラスミドをそれぞれ25ng/250ng、250ng/750ngおよび200ng/750ng用いた。

一部のgRNA/Cas9の組合せが他の組合せよりもEGFP発現の崩壊に高い効果を示す理由も、これらの組合せの一部がトランスフェクションに用いるプラスミドの量に多かれ少なかれ感受性を示す理由も理解されていない。上記3種類のgRNAゲノム内に存在するオフターゲット部位の範囲がそれぞれの活性に影響を及ぼしている可能性があるが、3種類のgRNAの挙動の差の原因となり得るこれらの特定の標的部位の1〜6bpだけ異なるゲノム部位の数に差はみられなかった(表C)。

実施例2:RGN切断特異性を改善させるためのgRNA相補性の長さの短縮 最初は反直観的に思われる方法であるが、単にgRNA−DNA接合部の長さを短くことによって、オンターゲット活性を損なわずにRGNのオフターゲット効果が最小限に抑えられるとする仮説を立てた。実際、長いgRNAの方がオンターゲット部位における機能の効率が低い(以下の記述およびHwangら,2013a;Ranら,2013を参照されたい)。これに対して、上の実施例1に示されるように、5’末端に複数のミスマッチを有するgRNAでも依然としてその標的部位に確実な切断を誘発することが可能であり(図2Aおよび2C〜2F)、完全なオンターゲット活性にはこれらのヌクレオチドが不要である可能性が示唆された。したがって、これらの5’ヌクレオチドを欠く短縮gRNAが完全長gRNAと同等の活性を示すのではないかとする仮説を立てた(図2A)。完全長gRNAの5’ヌクレオチドがオンターゲット活性に不要であるならば、その存在がgRNA−標的DNA接合部の他の位置におけるミスマッチも相殺するのではないかと推測された。この推測が正しいとすれば、gRNAのミスマッチに対する感度が高くなることに加えて、Cas9仲介性オフターゲット変異のレベルが実質的に低下するのではないかとする仮説を立てた(図2A)。

実験手順 実施例2では以下の実験手順を用いた。

プラスミド構築 gRNA発現プラスミドはいずれも、上記(実施例1)のように相補性領域を保有するオリゴヌクレオチド(IDT)のペアを設計、合成、アニーリングし、プラスミドpMLM3636(Addgene社から入手可能)にクローン化することによって組み立てた。得られたgRNA発現ベクターは、ヒトU6プロモーターによって発現が駆動される約100ntのgRNAをコードする。gRNA発現ベクターの構築に使用した全オリゴヌクレオチドを表Dに示す。QuikChangeキット(Agilent Technologies)を以下のプライマー:Cas9 D10Aセンスプライマー5’−tggataaaaagtattctattggtttagccatcggcactaattccg−3’(配列番号1089);Cas9 D10Aアンチセンスプライマー 5’−cggaattagtgccgatggctaaaccaatagaatactttttatcca−3’(配列番号1090)とともに用いてプラスミドpJDS246を変異させることによって、RuvCエンドヌクレアーゼドメインに変異を有するCas9 D10Aニッカーゼ発現プラスミド(pJDS271)を作製した。この研究に使用した標的化gRNAプラスミドおよびCas9ニッカーゼプラスミドはいずれも、非営利プラスミド配布サービスAddgene(addgene.org/crispr−cas)から入手可能である。

ヒト細胞ベースのEGFP崩壊アッセイ 単一コピーの組み込まれたEGFP−PEST遺伝子レポーターを保有するU2OS.EGFP細胞については既に記載されている(Reyonら,2012)。この細胞を10%FBS、2mM GlutaMax(Life Technologies)、ペニシリン/ストレプトマイシンおよび400μg/ml G418を添加したAdvanced DMEM(Life Technologies)で維持した。EGFP発現の崩壊をアッセイするため、LONZA 4D−Nucleofector(商標)にSE溶液およびDN100プログラムを製造業者の説明書に従って用い、2×105個のU2OS.EGFP細胞にgRNA発現プラスミドまたは陰性対照の空のU6プロモータープラスミド、Cas9発現プラスミド(pJDS246)(実施例1およびFuら,2013)およびtd−トマト発現プラスミド(トランスフェクション効率の対照)10ngを二重反復でトランスフェクトした。本発明者らは、EGFP部位#1、#2、#3および#4の実験にgRNA発現プラスミド/Cas9発現プラスミドをそれぞれ25ng/250ng、250ng/750ng、200ng/750ngおよび250ng/750ng用いた。トランスフェクションの2日後、細胞をトリプシンで処理し、10%(vol/vol)ウシ胎仔血清(FBS)を添加したダルベッコ改変イーグル培地(DMEM、Invitrogen)に再懸濁させ、BD LSRIIフローサイトメータで解析した。各試料について、トランスフェクションおよびフローサイトメトリー測定を二重反復で実施した。

ヒト細胞のトランスフェクションおよびゲノムDNAの単離 内在ヒト遺伝子を標的とするRGNによって誘発されるオンターゲットおよびオフターゲット挿入欠失変異を評価するため、以下の条件を用いてU2OS.EGFP細胞またはHEK293細胞にプラスミドをトランスフェクトした:U2OS.EGFP細胞は上記のEGFP崩壊アッセイと同じ条件を用いてトランスフェクトした。HEK293細胞は、37℃のCO2インキュベーター中、10%FBSおよび2mM GlutaMax(Life Technologies)を添加したAdvanced DMEM(Life Technologies)を入れた24ウェルプレートに1ウェル当たり1.65×105細胞の密度で播種することによってトランスフェクトした。22〜24時間インキュベートした後、Lipofectamine LTX試薬を製造業者の説明書(Life Technologies)に従って用い、細胞にgRNA発現プラスミドまたは空のU6プロモータープラスミド(陰性対照)125ng、Cas9発現プラスミド(pJDS246)(実施例1およびFuら,2013)375ngおよびtd−トマト発現プラスミド10ngをトランスフェクトした。トランスフェクションの16時間後に培地を交換した。両細胞型とも、トランスフェクションの2日後にAgencourt DNAdvanceゲノムDNA単離キット(Beckman)を製造業者の説明書に従って用い、ゲノムDNAを回収した。アッセイする各RGN試料には、12回の個別の4Dトランスフェクション反復を実施し、この12回のトランスフェクションからそれぞれゲノムDNAを単離した後、これらの試料を合わせて、それぞれが6つのプールしたゲノムDNA試料からなる「二重反復」プールを2つ作製した。次いで、以下に記載するT7EIアッセイ、サンガーシーケンシングおよび/またはディープシーケンシングによって、上記二重反復試料のオンターゲットおよびオフターゲット部位における挿入欠失変異を評価した。

ssODNドナー鋳型を用いるHDRによって導入される正確な変化の頻度を評価するため、2×105個のU2OS.EGFP細胞にgRNA発現プラスミドまたは空のU6プロモータープラスミド(陰性対照)250ng、Cas9発現プラスミド(pJDS246)750ng、ssODNドナー50pmol(または対照にはssODN無し)およびtd−トマト発現プラスミド(トランスフェクション対照)10ngをトランスフェクトした。トランスフェクションの3日後、Agencourt DNAdvanceを用いてゲノムDNAを精製し、以下に記載するように目的とする遺伝子座におけるBamHI部位の導入をアッセイした。上記トランスフェクションはいずれも二重反復で実施した。

Cas9ニッカーゼに関する実験では、2×105個のU2OS.EGFP細胞に各gRNA発現プラスミド(対形成したgRNAを用いる場合)125ngまたはgRNA発現プラスミド(単一gRNAを用いる場合)250ng、Cas9−D10Aニッカーゼ発現プラスミド(pJDS271)750ng、td−トマトプラスミド10ngおよび(HDRを実施する場合)ssODNドナー鋳型(BamHI部位をコードする)50pmolをトランスフェクトした。トランスフェクションはいずれも二重反復で実施した。トランスフェクションの2日後(挿入欠失変異をアッセイする場合)またはトランスフェクションの3日後(HDR/ssODN仲介性の変化をアッセイする場合)、Agencourt DNAdvanceゲノムDNA単離キット(Beckman)を用いてゲノムDNAを回収した。

挿入欠失変異の頻度を定量化するためのT7EIアッセイ T7EIを既に記載されている通りに実施した(実施例1およびFuら,2013)。簡潔に述べれば、Phusion高忠実度DNAポリメラーゼ(New England Biolabs)に以下のプログラムのうちの一方:(1)タッチダウンPCRプログラム[(98℃、10秒;72〜62℃、−1℃/サイクル、15秒;72℃、30秒)×10サイクル、(98℃、10秒;62℃、15秒;72℃、30秒)×25サイクル]または(2)定常Tm PCRプログラム[(98℃、10秒;68℃または72℃、15秒;72℃、30秒)×35サイクル]を必要に応じて3%DMSOまたは1Mベタインとともに用いて、特異的オンターゲットまたはオフターゲット部位を増幅するPCR反応を実施した。上記の増幅に使用した全プライマーを表Eに列記する。得られたPCR産物は大きさが300〜800bpであり、これを製造業者の説明書に従ってAmpure XPビーズ(Agencourt)により精製した。精製したPCR産物200ngを総体積19μの1×NEB緩衝液2中でハイブリダイズさせ、以下の条件を用いて変性させてヘテロ二本鎖を形成させた:95℃、5分;95〜85℃、−2℃/秒;85〜25℃、−0.1℃/秒;4℃で保持。ハイブリダイズしたPCR産物にT7エンドヌクレアーゼI(New England Biolabs、10単位/μl)を1μl加え、37℃で15分間インキュベートした。0.25M EDTA溶液2μlを加えることによりT7EI反応を停止させ、AMPure XPビーズ(Agencourt)を用いて0.1×EB緩衝液(QIAgen)20μlで溶離させることにより反応生成物を精製した。次いで、QIAXCELキャピラリー電気泳動系で反応生成物を分析し、既に記載されているもの(Reyonら,2012)と同じ式を用いて挿入欠失変異の頻度を計算した。

挿入欠失変異の頻度を定量化するためのサンガーシーケンシング T7EIアッセイに使用した精製PCR産物をZero Blunt TOPOベクター(Life Technologies)内に連結し、化学的コンピテントTop10細菌細胞中に形質転換した。プラスミドDNAを単離し、マサチューセッツ総合病院(MGH)DNA Automation CoreにM13順方向プライマー(5’−GTAAAACGACGGCCAG−3’)(配列番号1059)を用いて配列決定した。

ssODNを用いるHDRによって誘発される特異的変化を定量化するための制限消化アッセイ Phusion高忠実度DNAポリメラーゼ(New England Biolabs)を用いて特異的オンターゲット部位のPCR反応を実施した。タッチダウンPCRプログラム((98℃、10秒;72〜62℃、−1℃/サイクル、15秒;72℃、30秒)×10サイクル、(98℃、10秒;62℃、15秒;72℃、30秒)×25サイクル)を3%DMSOとともに用いてVEGFおよびEMX1遺伝子座を増幅した。これらのPCR反応に用いたプライマーを表Eに列記する。製造業者の説明書に従ってAmpureビーズ(Agencourt)によりPCR産物を精製した。ssODNドナー鋳型によってコードされるBamHI制限部位の検出には、精製PCR産物200ngを37℃で45分間、BamHIにより消化した。Ampure XPビーズ(Agencourt)を用いて20μl 0.1×EB緩衝液で溶離させることにより消化産物を精製し、QIAXCELキャピラリー電気泳動系を用いて分析および定量化した。

TruSeqライブラリーの作製およびシーケンシングデータの解析 遺伝子座特異的プライマーをオンターゲット部位および候補となる検証済みのオフターゲット部位に隣接するように設計して、長さ約300bp〜400bpのPCR産物を作製した。上記のプールした二重反復試料のゲノムDNAをPCRの鋳型として用いた。全PCR産物を製造業者の説明書に従ってAmpure XPビーズ(Agencourt)により精製した。精製PCR産物をQIAXCELキャピラリー電気泳動系で定量化した。プールした二重反復試料(上記)それぞれから各遺伝子座のPCR産物を増幅、精製、定量化した後、ディープシーケンシング用に等量ずつプールした。プールしたアンプリコンを既に記載されている通り(Fisherら,2011)にデュアルインデックスIllumina TruSeqアダプターと連結した。アダプター連結後、ライブラリーを精製し、QIAXCELキャピラリー電気泳動系で泳動させて大きさの変化を確認した。アダプター連結ライブラリーをqPCRにより定量化した後、Illumina MiSeq 250bpペアエンドリードを用いて、配列決定をダナ・ファーバー癌研究所分子生物学コア施設によって実施した。本発明者らは、各試料について75,000〜1,270,000(平均約422,000)のリードを解析した。既に記載されている通り(Sanderら,2013)にTruSeqリードの挿入欠失変異誘発率を解析した。特異性の比をディープシーケンシングによって決定されるオンターゲット遺伝子座に観察された変異誘発の、特定のオフターゲット遺伝子座に観察された変異誘発との比として計算した。tru−RGNの個々のオフターゲット部位に対する特異性の改善倍数を、マッチする完全長gRNAを用いた同じ標的の特異性の比に対するtru−gRNAを用いて観察された特異性の比として計算した。本文で言及されるように、一部のオフターゲット部位についてはtru−gRNAによる挿入欠失変異は観察されなかった。これらの場合、本発明者らは、ポアソン計算器を用いて、変異配列の実際の数の上限値が3になるよう95%の信頼度で計算した。本発明者らは次いで、この上限値を用いて、上記オフターゲット部位の特異性の最小改善倍数を推定した。

実施例2a.短縮gRNAはヒト細胞に効率的にCas9仲介性ゲノム編集を誘導することができる 5’末端で短縮したgRNAがその完全長対応物と同程度の効率で機能するのではないかとする仮説を検証するため、最初に、以下の配列:5’−GGCGAGGGCGATGCCACCTAcGG−3’(配列番号2241)を有するEGFPレポーター遺伝子の単一の標的部位に対して、徐々に短くなる一連のgRNAを上記の通りに構築した。この特定のEGFP部位を選択したのは、それぞれが5’末端にG(これらの実験に使用するU6プロモーターから効率的に発現させるのに必要である)を有する15nt、17nt、19ntおよび20ntの相補性のgRNAをこの部位に対して作製することが可能であったからである。組み込まれて構成的に発現する単一の高感度緑色蛍光タンパク質(EGFP)遺伝子の崩壊を評価することによってRGN誘発挿入欠失の頻度を定量化することが可能なヒト細胞ベースのレポーターアッセイ(実施例1およびFuら,2013;Reyonら,2012)(図2B)を用いて、上記の長さを変えたgRNAが標的部位にCas9誘発挿入欠失を誘導する能力を測定した。

上記の通り、より長い相補性(21nt、23ntおよび25nt)を有するgRNAの方が20ntの相補配列を含む標準的な完全長gRNAよりも低い活性を示し(図2H)、この結果は、他の者(Ranら,Cell 2013)によって近年報告された結果と一致している。しかし、17ntまたは19ntの標的相補性を有するgRNAが完全長gRNAと同等かそれ以上の活性を示したのに対して、これより短いわずか15ntの相補性を有するgRNAでは有意な活性はみられなかった(図2H)。

これらの最初の知見の一般性を検証するため、完全長gRNAおよび4つの追加のEGFPレポーター遺伝子部位(EGFP部位#1、#2、#3および#4;図3A)に対して18nt、17ntおよび/または16ntの相補性を有する対応するgRNAをアッセイした。4種類の標的部位のいずれでも、17ntおよび/または18ntの相補性を有するgRNAは、その対応する完全長gRNAと同程度の効率で(またはある場合には、これよりも効率的に)機能してCas9仲介性のEGFP発現崩壊を誘発した(図3A)。しかし、相補性が16ntしかないgRNAでは、作製することができた2つの部位で大幅に減少した活性または検出不可能な活性がみられた(図3A)。本発明者らは、検証した様々な部位のそれぞれについて、同じ量の完全長または短縮gRNA発現プラスミドおよびCas9発現プラスミドをトランスフェクトした。EGFP部位#1、#2および#3についてトランスフェクトするCas9発現プラスミドおよび短縮gRNA発現プラスミドの量を変化させた対照実験では、短縮gRNAがその完全長対応物と同程度に機能すること(図3E(下段)および3F(下段))、したがって、任意の標的部位で比較をする際に同じ量のプラスミドを用いることが可能であることが示唆された。まとめると、以上の結果は、17ntまたは18ntの相補性を有する短縮gRNAが一般に、完全長gRNAと同程度の効率で機能し得る根拠を示すものであり、以後、相補性がこのような長さである短縮gRNAを「tru−gRNA」と呼び、このようなtru−gRNAを用いたRGNを「tru−RGN」と呼ぶ。

次に、tru−RGNが、クロマチン化した内在遺伝子標的に効率的に挿入欠失を誘導することができるかどうかを検証した。既に3つの内在ヒト遺伝子(VEGFA、EMX1およびCLTA)内で標準的な完全長gRNAで標的化されている4つの部位:VEGFA部位1、VEGFA部位3、EMX1およびCTLA(実施例1およびFuら,2013;Hsuら,2013;Pattanayakら,2013)を含めた3つの内在ヒト遺伝子内の7つの部位に対してtru−gRNAを構築した(図3B)。(実施例1のVEGFA部位2については、この標的配列にはU6プロモーターからgRNAが発現するのに必要な相補性領域の位置17にも位置18にもGがないため、これに対するtru−gRNAを検証することは不可能であった。)上記の十分に確立されたT7エンドヌクレアーゼI(T7EI)遺伝子型決定アッセイ(Reyonら,2012)を用いて、上記各種のgRNAがそれぞれの標的部位に誘発するCas9仲介性挿入欠失変異の頻度をヒトU2OS.EGFP細胞で定量化した。7つの4つの部位のうち5つの部位ではいずれも、tru−RGNが、対応する標準的なRGNによって仲介される挿入欠失変異と同程度の効率で挿入欠失変異を確実に誘発した(図3B)。tru−RGNがその完全長対応物よりも低い活性を示した2つの部位については、絶対変異誘発率が依然としてほとんどの適用に有用と思われる高い値(平均13.3%および16.6%)を示したことが注目される。上記標的部位のうち3つの部位(VEGFA部位1および3ならびにEMX1)のサンガーシーケンシングでは、tru−RGNによって誘発される挿入欠失が予測された切断部位に由来するものであり、これらの変異は標準的なRGNによって誘発される変異と実質的に識別不可能であることが確認された(図3Cおよび図7A〜7D)。

ほかにも、効率的なRGN活性には最小でも17ntの相補性が必要であるという本発明者らの知見の通り、ミスマッチ5’Gと18ntの相補性領域とを有するtru−gRNAがCas9誘発挿入欠失を効率的に誘導することができるのに対して、ミスマッチ5’Gと17ntの相補性領域とを有するtru−gRNAは、対応する完全長gRNAに比して低い活性または検出不可能な活性を示すことがわかった(図7E)。

tru−RGNのゲノム編集能をさらに評価するため、tru−RGNがssODNドナー鋳型を用いたHDRを介して正確な配列変化を誘発する能力を試験した。これまでの研究から、ヒト細胞ではCas9誘発切断が相同なssODNドナーから内因遺伝子座への配列の導入を刺激し得ることがわかっている(Congら,2013;Maliら,2013c;Ranら,2013;Yangら,2013)。したがって、相同なssODNにコードされるBamHI制限部位をこれらの内在遺伝子に導入する能力をVEGFA部位1およびEMX1部位を標的とする対応する完全長gRNAとtru−gRNAとで比較した。tru−RGNは両部位において、完全長gRNA対応物を保有する標準的なRGNと同程度の効率でBamHI部位の導入を仲介した(図3D)。まとめると、このデータは、tru−RGNがヒト細胞において標準的なRGNと同程度の効率で両部位の挿入欠失および正確なHDR仲介性ゲノム編集事象を誘導するよう機能し得ることを示している。

実施例2b.tru−RGNはgRNA/DNA接合部のミスマッチに対する感度の増大を示す tru−RGNがオンターゲットゲノム編集変化を誘発するよう効率的に機能し得ることが確認されたため、これらのヌクレアーゼがgRNA/DNA接合部のミスマッチに対して高い感度を示すかどうかを試験した。これを評価するため、既にEGFP部位#1、#2および#3で試験したtru−gRNA(図3Aの上方)の体系的な一連の変異体を構築した。この変異体gRNAは相補性領域内の各位置(U6プロモーターからの発現に必要な5’Gは除く)に単一のワトソン−クリック置換を保有する(図5A)。ヒト細胞ベースのEGFP崩壊アッセイを用いて、実施例1に記載されているものと同じ3つの部位に対して作製したこれらの変異体tru−gRNAおよび対応する類似した一連の変異体完全長gRNAがCas9仲介性挿入欠失を誘導する相対的能力を評価した。その結果から、3つのEGFP標的部位ではいずれも、tru−RGNの方が全般的に、対応する完全長gRNAを保有する標準的なRGNよりも単一ミスマッチに対して高い感度を示すことがわかる(図5Aの上下のパネルを比較されたい)。感度の強さは部位によって異なり、tru−gRNAが17ntの相補性を有する部位#2および#3に最も大きな差がみられた。

単一のヌクレオチドミスマッチに対するtru−RGNの感度が増大したことに後押しされて、本発明者らは次に、gRNA−DNA接合部の2つの隣接する位置を体系的にミスマッチさせることによる影響を検討しようとした。そこで本発明者らは、それぞれが2つの隣接するヌクレオチド位置にワトソン−クリックトランスバージョン置換を有し、EGFP標的部位#1、#2および#3を標的とするtru−gRNAの変異体を作製した(図5B)。EGFP崩壊アッセイによる判定では、隣接する二重ミスマッチがRGN活性に及ぼす影響も同様に、tru−gRNAの方が実施例1で作製した全3種類のEGFP標的部位を標的とする対応する完全長gRNAの類似した変異体よりも大幅に大きかった(図5Bの上下のパネルを比較されたい)。このような効果は部位依存性であると思われ、EGFP部位#2および#3に対する二重ミスマッチtru−gRNAのほぼすべてが、相補性領域を欠く対照gRNAよりもEGFP崩壊活性の増大を示すことはなく、EGFP部位#1に対するミスマッチtru−gRNA変異体のうちの3つのみが残存活性を示した(図5B)。さらに、二重変異は全般的に、完全長gRNAでは5’末端の方が大きい影響を示したが、tru−gRNAではこのような影響は観察されなかった。以上をまとめると、本発明者らのデータは、tru−gRNAの方が完全長gRNAよりもgRNA−DNA接合部における単一および二重のワトソン−クリックトランスバージョンミスマッチに対して高い感度を示すことを示唆している。

実施例2c.内在遺伝子を標的とするtru−RGNはヒト細胞での特異性の改善を示す tru−RGNが完全長gRNA対応物を保有する標準的なRGNに比してヒト細胞におけるゲノムオフターゲット効果の低減を示すかどうかを明らかにするべく次の実験を実施した。それまでの研究(実施例1およびFuら,2013;Hsuら,2013を参照されたい)でVEGFA部位1、VEGFA部位3およびEMX1部位1(図3Bの上方に記載されている)を標的とする完全長gRNAについて13か所の真のオフターゲット部位が明らかにされていたため、本発明者らはこれらの部位を標的とする対応する完全長gRNAおよびtru−gRNAを検討した。(VEGFA部位2にはU6プロモーターからgRNAが効率的に発現するのに必要な相補性領域の位置17にも位置18にもGがないため、本発明者らの初期の研究6からこの標的配列に対するtru−gRNAを試験することはできなかった。)特筆すべきことに、T7EIアッセイによって判定したところ、これらの真のオフターゲット部位13か所すべてにおいて、tru−RGNが対応する標準的なRGNに比してヒトU2OS.EGFP細胞における変異誘発活性が大幅に低減されていることがわかり(表3A);13か所のオフターゲット部位のうち11か所では、tru−RGNによる変異の頻度がT7EIアッセイの信頼できる検出限界(2〜5%)未満に低下した(表3A)。これらの標準的なRGNとtru−RGNの対応する対を別のヒト細胞系(FT−HEK293細胞)の同じ13か所のオフターゲット部位で試験したところ、ほぼ同じ結果が観察された(表3A)。

tru−RGNに観察された特異性改善の程度を定量化するため、本発明者らは、低頻度の変異をT7EIアッセイよりも高感度で検出および定量化する方法であるハイスループットシーケンシングを用いて、オフターゲット変異頻度を測定した。本発明者らは、T7EIアッセイによってtru−gRNAによる変異率の低下がみられた13か所の真のオフターゲット部位のうち12か所のサブセットを評価し(13か所の部位のうちの1か所については、技術的な理由から必要な短いアンプリコンを増幅することができなかった)、ほかにも、別のグループ7によって特定されていたほかのEMX1部位1のオフターゲット部位を検討した(図6A)。検討した13か所のオフターゲット部位すべてについて、tru−RGNは対応する標準的なRGNに比して大幅に低下した変異誘発の絶対頻度を示し(図6Aおよび表3B)、その標準的なRGN対応物の約5000倍以上もの特異性の改善をもたらした(図6B)。2か所のオフターゲット部位(OT1−4およびOT1−11)については、tru−RGNによって誘発された挿入欠失変異の絶対数および頻度がバックグラウンドのレベルまたはほぼバックグラウンドのレベルまで低下していたため、tru−RGNのオンターゲットとオフターゲットの比を定量化するのが困難であった。したがって、この場合、オンターゲットのオフターゲットに対する比は無限大であると計算された。この問題に対処するため、本発明者らは代わりに、これらの部位について95%の信頼準で推定される挿入欠失頻度の最大値を特定し、次いで、この内輪の見積もりを用いて、標準的なRGNと比較したこれらのオフターゲットに対するtru−RGNの推定される特異性改善の程度の最小値を計算した。これらの計算から、tru−RGNがこれらの部位において約10,000倍以上の改善をもたらすことが示唆される(図6B)。

tru−RGNの特異性をさらに検証するため、本発明者らは、tru−RGNがヒトゲノムのほかの密接に関係する部位にオフターゲット変異を誘発する能力を検討した。それぞれ18ntの標的部位相補性を有するVEGFA部位1およびEMX1に対するtru−gRNAについて、相補性領域内の1つまたは2つの位置にミスマッチのあるヒトゲノムのほかのあらゆる部位(上の表3Aで未だ検討されていない部位)および本発明者らが支持する実施例1に記載されている部位の5’末端のミスマッチのうち3つの位置にミスマッチのあるあらゆる部位のサブセットをコンピュータで特定した。17ntの標的部位相補性を有するVEGFA部位3に対するtru−gRNAについては、5’末端のミスマッチが支持される位置のうち1つの位置にミスマッチのあるあらゆる部位および2つの位置にミスマッチのあるあらゆる部位(同じく表3Aで未だ検討されていない部位)のサブセットを特定した。このコンピュータによる解析から、VEGFA部位1、VEFGA部位3およびEMX1部位をそれぞれ標的とするtru−RGNのさらなる潜在的オフターゲット部位がそれぞれ計30か所、30か所および34か所得られ、次いで、RGNを発現させたヒトU2OS.EGFP細胞およびHEK293細胞にT7EIアッセイを用いて、これらの部位の変異を評価した。

特筆すべきことに、VEGFA部位1、VEFGA部位3およびEMX1それぞれに対する3種類のtru−RGNは、ヒトU2OS.EGFP細胞で検討した94か所の潜在的オフターゲット部位のうち93か所に検出可能なCas9仲介性挿入欠失変異を誘発せず、またヒトHEK293細胞の94か所の潜在的オフターゲット部位にはいずれも検出可能なCas9仲介性挿入欠失変異を誘発しなかった(表3C)。オフターゲット変異がみられた1か所の部位について、VEGFA部位1を標的とし完全長gRNAを有する標準的なRGNも、この同じオフターゲット部位を変異させることができるかどうかを検討したところ、標準的なRGNはtru−RGNよりわずかに頻度が低いものの、検出可能な変異を誘発した(図6C)。このオフターゲット部位にはgRNAを短縮しても改善が見られなかったという事実は、完全長gRNAとtru−gRNAの20nt配列と18nt配列とを比較することによって理解することが可能であり、この比較は、完全長20ntの標的にある2つの追加の塩基がともにミスマッチであることを示している(図6C)。まとめると、94か所のさらなる潜在的オフターゲット部位を対象にしたこの調査結果から、gRNAを短縮しても新たに高頻度のオフターゲット変異を誘発することはないと思われる。

この94部位のセットのうち最も密接にマッチする潜在的オフターゲット部位(すなわち、1つまたは2つのミスマッチを有する部位)30か所のディープシーケンシングにより、以前に特定された他のオフターゲット部位で観察されたもの(表3B)と同程度の検出不可能な挿入欠失変異または極めて低い割合の挿入欠失変異(表3D)が示された。本発明者らは、tru−RGNが一般に、オンターゲット部位と1つまたは2つのミスマッチによって異なる部位に極めて低レベルまたは検出不可能なレベルの変異を誘発すると思われるという結論を導いた。この結論は、5つものミスマッチによって異なる部位に高頻度のオフターゲット変異が比較的容易にみられた標準的なRGNとは対照的なものである(実施例1を参照されたい)。

実施例2d.tru−gRNAを二重Cas9ニッカーゼとともに用いてヒト細胞に効率的にゲノム編集を誘発することができる 近年記載された挿入欠失変異を誘発するための二重Cas9ニッカーゼ法を用いてtru−gRNAを試験した。この試験を実施するため、Cas9−D10Aニッカーゼを、ヒトVEGFA遺伝子の部位(VEGFA部位1および本発明者らがVEGFA部位4と呼ぶ追加の配列)を標的とする2種類の完全長gRNAとともにU2OS.EGFP細胞で共発現させた(図4A)。既に記載されているように(Ranら,2013)、このニッカーゼのペアは協働して機能して、VEGFA標的遺伝子座に高率で挿入欠失変異を誘発した(図4B)。興味深いことに、VEGFA部位4を標的とするgRNAとのみ共発現させたCas9−D10Aニッカーゼでも、ペアの完全長gRNAで観察された変異率よりいくぶん低いものの、高率で挿入欠失変異が誘発された(図4B)。重要なことに、VEGFA部位1に完全長gRNAの代わりにtru−gRNAを使用しても、二重ニッカーゼ法が挿入欠失変異を誘発する効果に影響を及ぼさなかった(図4B)。

二重ニッカーゼ戦略はこのほか、ssODNを用いた特異的配列変化の導入を刺激するためにも使用されていることから(Maliら,2013a;Ranら,2013)、tru−gRNAをこのタイプの変化に使用し得るかどうかについても試験した。VEGFA部位1および4に対するペアの完全長gRNAはCas9−D10Aニッカーゼと協働して、ssODNドナーから予想されるヒトU2OS.EGFP細胞のVEGFA遺伝子座(図3C)への短い挿入物の効率的な導入を増強した(図3A)。さらに、二重ニッキングによるssODN仲介性配列変化の効率は、VEGFA部位1を標的とする完全長gRNAの代わりにtru−gRNAを使用した場合と同程度に高い値で維持された(図3C)。まとめると、以上の結果は、tru−gRNAを二重Cas9ニッカーゼ戦略の一部として用いて、この方法によるゲノム編集の効率を損なわずに挿入欠失変異およびssODN仲介性配列変化の両方を誘発し得ることを示している。

tru−gRNAを使用してもペアのニッカーゼのオンターゲットゲノム編集活性が消失しないことが確認されたため、本発明者らは次に、ディープシーケンシングを用いて、既に特定されている4か所の真のオフターゲット部位におけるVEGFA部位1 gRNAによる変異頻度を検討した。この解析から、ペアのニッカーゼをtru−gRNAとともに使用すると、上記4か所のオフターゲット部位のいずれにおいても変異率が実質的に検出不可能なレベルまで低下することが明らかになった(表4)。一方、上記4か所のオフターゲット部位のうち1か所(OT1−3)では、tru−RGN(表3B)、完全長gRNAを有するペアのニッカーゼ(表4)ともにオフターゲット変異を完全には排除することはできなかった。以上の結果は、tru−gRNAを使用することにより、オンターゲットゲノム編集の効率を損なわずにペアのCas9ニッカーゼのオフターゲット効果をさらに低減し得る(逆も同様である)ことを示している。

参考文献 Cheng,A.W.,Wang,H.,Yang,H.,Shi,L.,Katz,Y.,Theunissen,T.W.,Rangarajan,S.,Shivalila,C.S.,Dadon,D.B.,and Jaenisch,R.Multiplexed activation of endogenous genes by CRISPR−on,an RNA−guided transcriptional activator system.Cell Res 23,1163−1171.(2013). Cho,S.W.,Kim,S.,Kim,J.M.& Kim,J.S.Targeted genome engineering in human cells with the Cas9 RNA−guided endonuclease.Nat Biotechnol 31,230−232(2013). Cong,L.et al.Multiplex genome engineering using CRISPR/Cas systems.Science 339,819−823(2013). Cradick,T.J.,Fine,E.J.,Antico,C.J.,and Bao,G.CRISPR/Cas9 systems targeting beta−globin and CCR5 genes have substantial off−target activity.Nucleic Acids Res.(2013). Dicarlo,J.E.et al.Genome engineering in Saccharomyces cerevisiae using CRISPR−Cas systems.Nucleic Acids Res(2013). Ding,Q.,Regan,S.N.,Xia,Y.,Oostrom,L.A.,Cowan,C.A.,and Musunuru,K.Enhanced efficiency of human pluripotent stem cell genome editing through replacing TALENs with CRISPRs.Cell Stem Cell 12,393−394.(2013). Fisher,S.,Barry,A.,Abreu,J.,Minie,B.,Nolan,J.,Delorey,T.M.,Young,G.,Fennell,T.J.,Allen,A.,Ambrogio,L.,et al.A scalable,fully automated process for construction of sequence−ready human exome targeted capture libraries.Genome Biol 12,R1.(2011). Friedland,A.E.,Tzur,Y.B.,Esvelt,K.M.,Colaiacovo,M.P.,Church,G.M.,and Calarco,J.A.Heritable genome editing in C.elegans via a CRISPR−Cas9 system.Nat Methods 10,741−743.(2013). Fu,Y.,Foden,J.A.,Khayter,C.,Maeder,M.L.,Reyon,D.,Joung,J.K.,and Sander,J.D.High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nat Biotechnol 31,822−826.(2013). Gabriel,R.et al.An unbiased genome−wide analysis of zinc−finger nuclease specificity.Nat Biotechnol 29,816−823(2011). Gilbert,L.A.,Larson,M.H.,Morsut,L.,Liu,Z.,Brar,G.A.,Torres,S.E.,Stern−Ginossar,N.,Brandman,O.,Whitehead,E.H.,Doudna,J.A.,et al.(2013).CRISPR−Mediated Modular RNA−Guided Regulation of Transcription in Eukaryotes.Cell 154,442−451. Gratz,S.J.et al.Genome engineering of Drosophila with the CRISPR RNA−guided Cas9 nuclease.Genetics(2013). Hockemeyer,D.et al.Genetic engineering of human pluripotent cells using TALE nucleases.Nat Biotechnol 29,731−734(2011). Horvath,P.& Barrangou,R.CRISPR/Cas,the immune system of bacteria and archaea.Science 327,167−170(2010). Hsu,P.D.,Scott,D.A.,Weinstein,J.A.,Ran,F.A.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.J.,Wu,X.,Shalem,O.,et al.DNA targeting specificity of RNA−guided Cas9 nucleases.Nat Biotechnol 31,827−832.(2013). Hwang,W.Y.et al.Efficient genome editing in zebrafish using a CRISPR−Cas system.Nat Biotechnol 31,227−229(2013). Hwang,W.Y.,Fu,Y.,Reyon,D.,Maeder,M.L.,Kaini,P.,Sander,J.D.,Joung,J.K.,Peterson,R.T.,and Yeh,J.R.Heritable and Precise Zebrafish Genome Editing Using a CRISPR−Cas System.PLoS One 8,e68708.(2013a). Jiang,W.,Bikard,D.,Cox,D.,Zhang,F.& Marraffini,L.A.RNA−guided editing of bacterial genomes using CRISPR−Cas systems.Nat Biotechnol 31,233−239(2013). Jinek,M.et al.A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity.Science 337,816−821(2012). Jinek,M.et al.RNA−programmed genome editing in human cells.Elife 2,e00471(2013). Li,D.,Qiu,Z.,Shao,Y.,Chen,Y.,Guan,Y.,Liu,M.,Li,Y.,Gao,N.,Wang,L.,Lu,X.,et al.Heritable gene targeting in the mouse and rat using a CRISPR−Cas system.Nat Biotechnol 31,681−683.(2013a). Li,W.,Teng,F.,Li,T.,and Zhou,Q.Simultaneous generation and germline transmission of multiple gene mutations in rat using CRISPR−Cas systems.Nat Biotechnol 31,684−686.(2013b). Maeder,M.L.,Linder,S.J.,Cascio,V.M.,Fu,Y.,Ho,Q.H.,and Joung,J.K.CRISPR RNA−guided activation of endogenous human genes.Nat Methods 10,977−979.(2013). Mali,P.,Aach,J.,Stranges,P.B.,Esvelt,K.M.,Moosburner,M.,Kosuri,S.,Yang,L.,and Church,G.M.CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.Nat Biotechnol 31,833−838.(2013a). Mali,P.,Esvelt,K.M.,and Church,G.M.Cas9 as a versatile tool for engineering biology.Nat Methods 10,957−963.(2013b). Mali,P.et al.RNA−guided human genome engineering via Cas9.Science 339,823−826(2013c). Pattanayak,V.,Lin,S.,Guilinger,J.P.,Ma,E.,Doudna,J.A.,and Liu,D.R.High−throughput profiling of off−target DNA cleavage reveals RNA−programmed Cas9 nuclease specificity.Nat Biotechnol 31,839−843.(2013). Pattanayak,V.,Ramirez,C.L.,Joung,J.K.& Liu,D.R.Revealing off−target cleavage specificities of zinc−finger nucleases by in vitro selection.Nat Methods 8,765−770(2011). Perez,E.E.et al.Establishment of HIV−1 resistance in CD4+ T cells by genome editing using zinc−finger nucleases.Nat Biotechnol 26,808−816(2008). Perez−Pinera,P.,Kocak,D.D.,Vockley,C.M.,Adler,A.F.,Kabadi,A.M.,Polstein,L.R.,Thakore,P.I.,Glass,K.A.,Ousterout,D.G.,Leong,K.W.,et al.RNA−guided gene activation by CRISPR−Cas9−based transcription factors.Nat Methods 10,973−976.(2013). Qi,L.S.,Larson,M.H.,Gilbert,L.A.,Doudna,J.A.,Weissman,J.S.,Arkin,A.P.,and Lim,W.A.Repurposing CRISPR as an RNA−guided platform for sequence−specific control of gene expression.Cell 152,1173−1183.(2013). Ran,F.A.,Hsu,P.D.,Lin,C.Y.,Gootenberg,J.S.,Konermann,S.,Trevino,A.E.,Scott,D.A.,Inoue,A.,Matoba,S.,Zhang,Y.,et al.Double nicking by RNA−guided CRISPR Cas9 for enhanced genome editing specificity.Cell 154,1380−1389.(2013). Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotech 30,460−465(2012). Sander,J.D.,Maeder,M.L.,Reyon,D.,Voytas,D.F.,Joung,J.K.,and Dobbs,D.ZiFiT(Zinc Finger Targeter):an updated zinc finger engineering tool.Nucleic Acids Res 38,W462−468.(2010). Sander,J.D.,Ramirez,C.L.,Linder,S.J.,Pattanayak,V.,Shoresh,N.,Ku,M.,Foden,J.A.,Reyon,D.,Bernstein,B.E.,Liu,D.R.,et al.In silico abstraction of zinc finger nuclease cleavage profiles reveals an expanded landscape of off−target sites.Nucleic Acids Res.(2013). Sander,J.D.,Zaback,P.,Joung,J.K.,Voytas,D.F.,and Dobbs,D.Zinc Finger Targeter(ZiFiT):an engineered zinc finger/target site design tool.Nucleic Acids Res 35,W599−605.(2007). Shen,B.et al.Generation of gene−modified mice via Cas9/RNA−mediated gene targeting.Cell Res(2013). Sugimoto,N.et al.Thermodynamic parameters to predict stability of RNA/DNA hybrid duplexes.Biochemistry 34,11211−11216(1995). Terns,M.P.& Terns,R.M.CRISPR−based adaptive immune systems.Curr Opin Microbiol 14,321−327(2011). Wang,H.et al.One−Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas−Mediated Genome Engineering.Cell 153,910−918(2013). Wiedenheft,B.,Sternberg,S.H.& Doudna,J.A.RNA−guided genetic silencing systems in bacteria and archaea.Nature 482,331−338(2012). Yang,L.,Guell,M.,Byrne,S.,Yang,J.L.,De Los Angeles,A.,Mali,P.,Aach,J.,Kim−Kiselak,C.,Briggs,A.W.,Rios,X.,et al.(2013).Optimization of scarless human stem cell genome editing.Nucleic Acids Res 41,9049−9061.

その他の実施形態 ここまで本発明をその詳細な説明と関連させて記載してきたが、上記説明は例示を目的とするものであり、添付の「特許請求の範囲」の範囲によって定められる本発明の範囲を限定するものではないことを理解するべきである。その他の態様、利点および改変は以下の特許請求の範囲内にある。

QQ群二维码
意见反馈