RNA誘導型FokIヌクレアーゼ(RFN)を用いたRNA誘導型ゲノム編集の特異性の増大

申请号 JP2016502853 申请日 2014-03-14 公开(公告)号 JP2016517276A 公开(公告)日 2016-06-16
申请人 ザ ジェネラル ホスピタル コーポレイション; ザ ジェネラル ホスピタル コーポレイション; 发明人 ジョン,ジェー.キース; ツァイ,シェンダー;
摘要 RNA誘導型ゲノム編集、例えば、CRISPR/Cas9系を用いた編集の特異性を増大させる方法。【選択図】図5A
权利要求

RNA誘導型FokIヌクレアーゼ(RFN)融合タンパク質であって、触媒的に不活性であるCRISPR関連9(dCas9)のアミノ末端に融合するFokI触媒ドメイン配列を含み、任意に、介在リンカーを備える、RNA誘導型FokIヌクレアーゼ(RFN)融合タンパク質。2〜30個のアミノ酸のリンカーを含む、請求項1に記載の融合タンパク質。前記リンカーが、Gly4Serを含む、請求項2に記載の融合タンパク質。FokI触媒ドメインが、配列番号4のアミノ酸388〜583、または408〜583を含む、請求項1に記載の融合タンパク質。dCas9が、D10、E762、H983、またはD986での変異、およびH840またはN863での変異を含む、請求項1に記載の融合タンパク質。dCas9が、 (i)D10AまたはD10N、および (ii)H840A、H840Y、またはH840N での変異を含む、請求項5に記載の融合タンパク質。請求項1〜6に記載の融合タンパク質をコードする核酸。請求項7に記載の核酸を含むベクター。請求項1〜6に記載の融合タンパク質を発現する宿主細胞。細胞において、ゲノム配列の配列特異的な崩壊を誘導する方法であって、前記方法が、請求項1〜6に記載のRNA誘導型FokIヌクレアーゼ(RFN)融合タンパク質、および好ましくは0〜31ヌクレオチド離れた2つの標的ゲノム配列に前記RFNを配向するガイドRNAを、前記細胞に発現すること、または前記細胞と接触させることとを含み、好ましくは、前記2つの標的配列が、それぞれ3’末端でPAM配列を有する、 方法。前記2つの標的ゲノム配列が、10〜20塩基対、好ましくは、13〜17塩基対離れている、請求項10に記載の方法。前記ガイドRNAが、 (a)2つの単一ガイドRNAであって、1つの単一ガイドRNAが第1の鎖を標的とし、他方のガイドRNAが相補鎖を標的とし、FokIが各鎖を切断して、反対のDNA鎖上に1対のニックをもたらし、それにより二重鎖を切断する、2つの単一ガイドRNA、または (b)tracrRNAおよび2つのcrRNAであって、1つのcrRNAが第1の鎖を標的とし、他方のcrRNAが相補鎖を標的とし、FokIが各鎖を切断して、反対のDNA鎖上に1対のニックをもたらし、それにより二重鎖を切断する、tracrRNAおよび2つのcrRNA である、請求項10に記載の方法。前記2つのガイドRNAが、それぞれ、標的ゲノム配列の17〜20個のヌクレオチドと相補的な相補領域を含む、請求項10に記載の方法。挿入欠失変異が、前記2つの標的配列の間に誘導される、請求項10〜13のいずれか1項に記載の方法。細胞におけるRNA誘導型ゲノム編集の特異性が増大する、請求項10〜14のいずれか1項に記載の方法。細胞におけるRNA誘導型ゲノム編集の特異性を増大させる方法であって、前記細胞を、請求項1〜6に記載のRNA誘導型FokIヌクレアーゼ(RFN)融合タンパク質と接触させることを含む、方法。

说明书全文

(優先権の主張) 本願は、2013年3月15日に出願された米国仮特許出願第61/799,647号;2013年6月21日に出願された米国仮特許出願第61/838,178号;2013年6月21日に出願された米国仮特許出願第61/838,148号および2013年12月26日に出願された米国仮特許出願第61/921,007号に対する米国特許法119条(e)に基づく優先権を主張するものである。上記出願の内容全体が参照により本明細書に組み込まれる。

(連邦支援による研究または開発) 本発明は、米国国立衛生研究所により授与された助成番号DP1 GM105378の下、政府の支援を受けてなされたものである。政府は本発明に一定の権利を有する。

RNA誘導型FokIヌクレアーゼ(RFN)、たとえばFokI−dCas9融合タンパク質を用いて、RNA誘導型ゲノム編集、例えばCRISPR/Cas9系を用いた編集の特異性を増大させる方法。

近年の研究では、クラスター化され等間隔にスペーサーが入った短い回文型の反復配列(CRISPR)/CRISPR関連(Cas)系(Wiedenheftら,Nature 482,331−338(2012);Horvathら,Science 327,167−170(2010);Ternsら,Curr Opin Microbiol 14,321−327(2011))が、細菌、酵母およびヒト細胞のほか、ショウジョウバエ、ゼブラフィッシュおよびマウスなどのそのままの生物体においてin vivoで基板としてのゲノム編集の役割を果たし得ることが明らかにされている(Wangら,Cell 153,910−918(2013);Shenら,Cell Res(2013);Dicarloら,Nucleic Acids Res(2013);Jiangら,Nat Biotechnol 31,233−239(2013);Jinekら,Elife 2,e00471(2013);Hwangら,Nat Biotechnol 31,227−229(2013);Congら,Science 339,819−823(2013);Maliら,Science 339,823−826(2013c);Choら,Nat Biotechnol 31,230−232(2013);Gratzら,Genetics 194(4):1029−35(2013))。化膿性連鎖球菌(S.pyogenes)由来のCas9ヌクレアーゼ(以降、単にCas9と呼ぶ)は、人工的に設計されたgRNAの最初の20ヌクレオチドと、プロトスペーサー隣接モチーフ(PAM)、例えば、配列NGGまたはNAGにマッチするPAMに隣接する目的とする標的ゲノムDNA配列の相補鎖との間の塩基対相補性を介して誘導され得る(Shenら,Cell Res(2013);Dicarloら,Nucleic Acids Res(2013);Jiangら,Nat Biotechnol 31,233−239(2013);Jinekら,Elife 2,e00471(2013);Hwangら,Nat Biotechnol 31,227−229(2013);Congら,Science 339,819−823(2013);Maliら,Science 339,823−826(2013c);Choら,Nat Biotechnol 31,230−232(2013);Jinekら,Science 337,816−821(2012))。in vitro(Jinekら,Science 337,816−821(2012))、細菌(Jiangら,Nat Biotechnol 31,233−239(2013))およびヒト細胞(Congら,Science 339,819−823(2013))で実施されたこれまでの研究では、Cas9を介した切断が、場合によっては、gRNA/標的部位接合部、特に20ヌクレオチド(nt)gRNA相補性領域の3’末端にある最後の10〜12のヌクレオチド(nt)における単一のミスマッチによって、無効になり得ることが示されている。

多くの研究で、CRISPR−Casヌクレアーゼが、最大5つのミスマッチを許容し、なおも切断することが可能であるが、任意の単一のミスマッチまたはミスマッチの組合せが活性に及ぼす影響を予測するのは困難であることが示されている。まとめると、これらのヌクレアーゼは著しいオフターゲット効果を示し得るが、その部位を予測するのが困難であり得る。本明細書には、CRISPR/Cas系を用いるゲノム編集、例えば、RNA誘導型FokIヌクレアーゼ(RFN)、たとえばFokI−Cas9またはFokI−dCas9ベースの融合タンパク質を用いるゲノム編集の特異性を増大させる方法が記載される。

第一の態様では、本発明は、dCas9の末端、たとえばN末端に融合するFokI触媒ドメイン配列を含むFokI−dCas9融合タンパク質であって、任意に、介在リンカー、たとえば、2〜30個、たとえば4〜12個のアミノ酸、たとえば、Gly4Serのリンカーを含む、FokI−Cas9融合タンパク質を提供する。いくつかの実施形態では、FokI触媒ドメインは、配列番号4の388〜583、または408〜583のアミノ酸を含む。いくつかの実施形態では、dCas9は、D10、E762、H983、またはD986での変異、およびH840またはN863での変異、たとえば、(i)D10AまたはD10N;および(ii)H840A、H840YまたはH840Nでの変異を含む。

別の態様では、本発明は、これらの融合タンパク質をコードする核酸、この核酸を含むベクター、およびこの核酸、ベクター、または融合タンパク質を保有または発現する宿主細胞を提供する。

別の態様では、本発明は、細胞中の二重鎖DNA分子の中、たとえば、ゲノム配列の中で配列特異的な切断を誘導する方法であって、本明細書に記載されるFokI−dCas9融合タンパク質を、細胞中で発現させるか、または細胞と接触させることと、 (a)2つの単一ガイドRNAであって、この2つの単一ガイドRNAのそれぞれが、標的配列の1本鎖にそれぞれ相補的な配列を含むことにより、両方のガイドRNAを使用することにより、両方の鎖の標的化をもたらし、(すなわち、1つの単一ガイドRNAは、第1の鎖を標的化し、他方のガイドRNAが、相補鎖を標的化する)、FokIが、反対のDNA鎖上に1対のニックをもたらす各鎖を切断することにより、二重鎖が切断される、2つの単一ガイドRNAと、 (b)tracrRNAおよび2つのcrRNAであって、2つのCrRNAのそれぞれが、標的配列の内の1つの鎖と相補的な配列を含むことにより、両方のcrRNAを使用することにより、両方の鎖の標的化をもたらし(すなわち、1つのcrRNAは第1の鎖を標的化し、他方は、相補鎖を標的化する)、FokIが、反対のDNA鎖上に1対のニックをもたらす各鎖を切断することにより、二重鎖が切断される、tracrRNAおよび2つのcrRNAと を含む。

別の態様では、本発明は、細胞のRNA誘導型ゲノム編集の特異性を増大させる方法であって、本明細書中に記載されるRNA誘導型FokIヌクレアーゼ(RFN)融合タンパク質と細胞を接触させることを含む、方法を提供する。

本方法は、 (a)2つの単一ガイドRNAであって、この2つの単一ガイドRNAのそれぞれが、標的配列の内の1つの鎖とそれぞれ相補的である配列を含むことにより、両方のガイドRNAを使用することにより、両鎖の標的化をもたらし(すなわち1つの単一ガイドRNAが第1の鎖を標的化し、他方のガイドRNAが相補鎖を標的化する)、FokIが、反対のDNA鎖上に1対のニックをもたらす各鎖を切断することにより、二本鎖が切断される、2つの単一ガイド鎖と、 (b)tracrRNAおよび2つのcrRNAであって、2つのcrRNAのそれぞれが、標的配列の内の1つの鎖に相補的な配列を含むことにより、両方のcrRNAを使用することにより、両方の鎖の標的化をもたらし(すなわち、1つのcrRNAが第1の鎖を標的化し、他方のcrRNAが、相補鎖を標的化する)、FokIが、反対のDNA鎖上に1対のニックをもたらすことにより、二重鎖が切断される、tracrRNAおよび2つのcrRNA を細胞で発現させるか、この細胞と接触させることをさらに含んでもよい。

いくつかの実施形態では、2つの標的ゲノム配列(すなわち、crRNAまたは単一ガイドRNAの標的相補領域に相補的な配列)は、10〜20塩基対、好ましくは13〜17塩基対離れている。

いくつかの実施形態では、挿入欠失変異が、2つの標的配列の間に誘導される。

いくつかの実施形態では、細胞のRNA誘導型ゲノム編集の特異性が増大する。

特に明記されない限り、本明細書で使用される技術用語および科学用語はいずれも、本発明が属する技術分野の当業者に一般に理解されるものと同じ意味を有する。本明細書には本発明で使用する方法および材料が記載されるが、ほかにも、当該技術分野で公知の他の適切な方法および材料を使用することができる。材料、方法および具体例は単に例示的なものであって、限定することを意図するものではない。本明細書で言及される刊行物、特許出願、特許、配列、データベースエントリをはじめとする参照物はいずれも、その全体が参照により組み込まれる。不一致が生じた場合、定義を含めた本明細書が優先される。

本発明のその他の特徴と利点は、以下の詳細な説明および図面ならびに特許請求の範囲から明らかになるであろう。

標的DNA部位と結合したgRNA/Cas9ヌクレアーゼ複合体を示す模式図である。鋏はゲノムDNA標的部位のCas9ヌクレアーゼのおよその切断点を示す。ガイドRNAのヌクレオチドの番号が5’から3’に向かって逆向きに進むことに留意されたい。

gRNAの5’相補性領域を短縮する原理を示す模式図である。灰色の太線=標的DNA部位、灰色の細線の構造=gRNA、灰色の楕円=Cas9ヌクレアーゼであり、黒線はgRNAと標的DNA部位との間の塩基対形成を示している。

EGFP崩壊アッセイの模式的概観である。単一の組み込まれたEGFP−PESTレポーター遺伝子の標的化Cas9仲介性二本鎖切断が、誤りがちなNHEJ仲介性修復によって修復されると、細胞にコード配列を崩壊させるフレームシフト変異およびそれに付随する蛍光の消失が起こる。

EGFPレポーター遺伝子配列の3つの異なる標的部位でアッセイした、(C)単一ミスマッチを有するsgRNAを保有するRGNの活性。反復試験の活性を完全にマッチするgRNAの活性に正規化した平均値が示されている(オンラインの方法を参照)。エラーバーは平均値の標準誤差を表す。各gRNAのミスマッチの位置が下の格子に灰色で強調されている。3つのEGFP標的部位の配列は以下の通りであった: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号1) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号2) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号3)

EGFPレポーター遺伝子配列の3つの異なる標的部位でアッセイした、(D)隣接する二重ミスマッチを有するsgRNAを保有するRGNの活性。反復試験の活性を完全にマッチするgRNAの活性に正規化した平均値が示されている(オンラインの方法を参照)。エラーバーは平均値の標準誤差を表す。各gRNAのミスマッチの位置が下の格子に灰色で強調されている。3つのEGFP標的部位の配列は以下の通りであった: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号1) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号2) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号3)

EGFPレポーター遺伝子配列の3つの異なる標的部位でアッセイした、(E)様々な間隔の二重ミスマッチを有するsgRNAを保有するRGNの活性。反復試験の活性を完全にマッチするgRNAの活性に正規化した平均値が示されている(オンラインの方法を参照)。エラーバーは平均値の標準誤差を表す。各gRNAのミスマッチの位置が下の格子に灰色で強調されている。3つのEGFP標的部位の配列は以下の通りであった: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号1) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号2) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号3)

EGFPレポーター遺伝子配列の3つの異なる標的部位でアッセイした、(F)数の増加する隣接するミスマッチを有するsgRNAを保有するRGNの活性。反復試験の活性を完全にマッチするgRNAの活性に正規化した平均値が示されている(オンラインの方法を参照)。エラーバーは平均値の標準誤差を表す。各gRNAのミスマッチの位置が下の格子に灰色で強調されている。3つのEGFP標的部位の配列は以下の通りであった: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号1) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号2) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号3)

gRNAの5’末端のミスマッチの方が3’のミスマッチよりもCRISPR/Casの感度が高くなる。gRNAは、ワトソン−クリックトランスバージョンを用いてミスマッチさせた「m」で表される位置を除いて、RNAとDNAとの間でワトソン−クリック塩基対を形成する(すなわち、EGFP部位#2 M18−19は、位置18および19でgRNAをそのワトソン−クリックパートナーに変化させることによってミスマッチさせたものである)。gRNAの5’付近の位置は一般に許容性が極めて高いが、他の残基がミスマッチである場合、この位置でのマッチがヌクレアーゼ活性には重要である。4つの位置すべてがミスマッチである場合、ヌクレアーゼ活性はもはやは検出されなくなる。このことはさらに、この5’の位置でのマッチがほかにも3’の位置に生じたミスマッチを相殺し得ることを示している。これらの実験はコドン最適化型よりも低い絶対レベルのヌクレアーゼ活性を示し得る非コドン最適化型のCas9を用いて実施したものであることに留意されたい。

ヒト細胞ベースのU2OS EGFP崩壊アッセイにおいて15〜25ntの範囲の様々な長さの相補性領域を有するgRNAによって誘導されたCas9ヌクレアーゼ活性の効率。U6プロモーターからのgRNA発現には5’Gの存在が必要であるため、標的DNA部位に対して特定の長さの相補性(15nt、17nt、19nt、20nt、21nt、23ntおよび25nt)を保有するgRNAに限り評価することが可能であった。

Cas9およびEGFPレポーター遺伝子の4か所の標的部位に対する完全長gRNAまたは短縮gRNAによって仲介されるEGFP崩壊のヒト細胞における効率。相補性領域の長さおよび対応する標的DNA部位が示されている。Ctrl=相補性領域を欠く対照gRNA。

マッチする標準的なRGNおよびtru−RGNによって7つの異なるヒト内在遺伝子標的に導入された標的化挿入欠失変異の効率。相補性領域の長さおよび対応する標的DNA部位が示されている。挿入欠失頻度はT7EIアッセイによって測定したものである。Ctrl=相補性領域を欠く対照gRNA。

EMX1部位を標的とするtru−gRNAまたはマッチする完全長gRNAを用いたRGNによって誘発された挿入欠失変異のDNA配列。標的DNA部位のgRNA相補性領域と相互作用する部分が灰色で強調され、PAM配列の最初の塩基が小文字で示されている。欠失が灰色で強調された破線で表され、挿入が灰色で強調されたイタリック体の文字で表されている。欠失または挿入塩基の正味の数および各配列が単離された回数が右側に示されている。

マッチする標準的なRGNおよびtru−RGNによって2つの内在ヒト遺伝子に導入された正確なHDR/ssODN仲介性変化の効率。%HDRはBamHI制限消化アッセイを用いて測定したものである(実施例2の実験手順を参照されたい)。対照gRNA=空のU6プロモーターベクター。

U2OS.EGFP細胞に可変量の完全長gRNA発現プラスミド(上段)またはtru−gRNA発現プラスミド(下段)を一定量のCas9発現プラスミドとともにトランスフェクトした後、EGFP発現が減少した細胞の百分率をアッセイした。二重反復実験の平均値が平均値の標準誤差とともに示されている。この3か所のEGFP標的部位では、tru−gRNAで得られたデータがtru−gRNAプラスミドの代わりに完全長gRNA発現プラスミドで実施した実験のデータと緊密に一致していることに留意されたい。

U2OS.EGFP細胞に可変量のCas9発現プラスミドを可変量の完全長gRNA発現プラスミド(上段)またはtru−gRNA発現プラスミド(下段)(図3Eの実験から各tru−gRNAの量を決定した)とともにトランスフェクトした。二重反復実験の平均値が平均値の標準誤差とともに示されている。この3か所のEGFP標的部位では、tru−gRNAで得られたデータがtru−gRNAプラスミドの代わりに完全長gRNA発現プラスミドで実施した実験のデータと緊密に一致していることに留意されたい。これらの漸増法の結果から、実施例1および2で実施したEGFP崩壊アッセイに使用するプラスミドの濃度を決定した。

RNA誘導型FokIヌクレアーゼおよびCRISPR/CasサブタイプYpestタンパク質4(Csy4)ベースのマルチプレックスgRNA発現系である。 (a)RNA誘導型FokIヌクレアーゼの図式的概要。2つのFokI−dCas9融合タンパク質が、FokIの二量体化およびDNAの切断を促進するために、2つの異なるgRNAより隣接した標的部位に動員される。

RNA誘導型FokIヌクレアーゼおよびCRISPR/CasサブタイプYpestタンパク質4(Csy4)ベースのマルチプレックスgRNA発現系である。 (b)Csy4ベースのマルチプレックスgRNA発現系の図式的概要。2つのgRNA(いずれかの5’末端ヌクレオチドを備える)が、Csy4認識部位に隣接するそれぞれのgRNAと、UGプロモーターから単一の転写物中で共発現される。Csy4は、転写物からgRNAを切断し、放出する。Csy4認識領域は、gRNAの3’末端に維持され、Csy4ヌクレアーゼがこの部位に結合する。

RNA誘導型FokIヌクレアーゼおよびCRISPR/CasサブタイプYpestタンパク質4(Csy4)ベースのマルチプレックスgRNA発現系である。 (c)多重Csy4ベースの系の検証。EGFPの隣接部位を標的とした2つのgRNAを、Csy4およびCas9のヌクレアーゼと共に、ヒトU2OS.EGFP細胞のCsy4ベースの系を使用して単一のRNA転写物中に発現した。これらの細胞に誘導された挿入欠失変異の配列が示される。野生型の配列が上部に示され、両方の標的部位が灰色で強調されて、PAM配列が下線を施した文字として示される。欠失は、灰色の背景に対して破線により示され、挿入は、灰色の背景に対して小文字により示される。各配列の右側には、挿入(+)または欠失(Δ)の大きさが特定される。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (a)ZFN、TALEN、FokI−dCas9融合物およびdCas9−FokI融合物の概略的な例示。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (b)2つの配向:PAM内部(PAM in)(左側のパネル)およびPAM外部(PAM out)(右側のパネル)のうちの1つの片側部位を標的化とするgRNA対でのFokI−dCas9融合物のEGFP崩壊の活性化のスクリーニング。片側部位は、0〜31bpの範囲の可変的な長さのスペーサー配列により分離した。EGFP崩壊は、フローサイトメトリーにより定量した(n=1)。dCas9−FokI融合物および同一のgRNA対の対応するデータを図5Eに示す。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (c)PAM外部と共に配向され、10〜20bpの範囲の長さのスペーサー長と共に配向される片側部位を備える標的部位のFokI−dCas9仲介性EGFP崩壊の追加的な評価。EGFP崩壊は、フローサイトメトリーにより定量化された。エラーバーは、平均値の標準誤差(s.e.m)を示す(n=2)。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (d)スペーサー長により分類した(c)からのデータの、EGFP崩壊の平均値。エラーバーは、s.e.mを示す。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (e)これらのプロットは、0〜31bpのスペーシングおよびPAM内部およびPAM外部の配向を伴う60個のgRNA対でのU2OS.EGFP細胞のEGFP崩壊アッセイにおけるdCas9−FokI活性のスクリーニング結果を示す。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (f)U2OS細胞のFokI−dCas9誘導型変異の配列を示す。Cas9またはFokI−dCas9により結合される23nt標的配列を灰色で示す。プロトスペーサー隣接モチーフ、すなわちPAM配列を、下線を付して太字で表す。欠失を、薄い灰色の背景上に破線を付して表す。挿入は灰色で強調する。挿入または欠失した塩基の正味の数は、配列の直右側の縦列中に示される。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (f)U2OS細胞のFokI−dCas9誘導型変異の配列を示す。Cas9またはFokI−dCas9により結合される23nt標的配列を灰色で示す。プロトスペーサー隣接モチーフ、すなわちPAM配列を、下線を付して太字で表す。欠失を、薄い灰色の背景上に破線を付して表す。挿入は灰色で強調する。挿入または欠失した塩基の正味の数は、配列の直右側の縦列中に示される。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (f)U2OS細胞のFokI−dCas9誘導型変異の配列を示す。Cas9またはFokI−dCas9により結合される23nt標的配列を灰色で示す。プロトスペーサー隣接モチーフ、すなわちPAM配列を、下線を付して太字で表す。欠失を、薄い灰色の背景上に破線を付して表す。挿入は灰色で強調する。挿入または欠失した塩基の正味の数は、配列の直右側の縦列中に示される。

RNA誘導型FokIヌクレアーゼの設計および最適化。 (f)U2OS細胞のFokI−dCas9誘導型変異の配列を示す。Cas9またはFokI−dCas9により結合される23nt標的配列を灰色で示す。プロトスペーサー隣接モチーフ、すなわちPAM配列を、下線を付して太字で表す。欠失を、薄い灰色の背景上に破線を付して表す。挿入は灰色で強調する。挿入または欠失した塩基の正味の数は、配列の直右側の縦列中に示される。

FokI−dCas9 RFNの二量体化が、有効なゲノム編集の活性に必要である。 (a)(EGFP部位47および81を)正確に標的とするgRNA対、およびgRNAの1つまたは他方が、(VEGFA遺伝子中の)非EGFP配列を標的とする別のgRNAと置き換えられている対の存在下で評価される2つのREN対のEGFP崩壊の活性。EGFP崩壊は、フローサイトメトリーにより定量化された。EGFP:高感度緑色蛍光タンパク質、VEGFA:血管内皮増殖因子A。エラーバーは、平均値の標準誤差の(s.e.m)を表す(n=3)。

FokI−dCas9 RFNの二量体化が、有効なゲノム編集の活性に必要である。 (b)(a)のEGFP崩壊アッセイで使用されるのと同一の細胞由来のゲノムDNAで実施したT7EIアッセイによる変異誘発の頻度の定量化。エラーバーは、s.e.mを表す(n=3)。

FokI−dCas9 RFNの二量体化が、有効なゲノム編集の活性に必要である。 (c)APC、MLH1およびVEGFA遺伝子中の部位を標的とするRFNの活性化。各標的で、本出願人は、「左の」片側部位では1つのgRNAのみ、または「右の」片側部位では1つのgRNAのみである、1対の同族のgRNAとFokI−dCas9を共発現させた。変異原性の比率は、T7E1アッセイにより測定した。APC:大腸腺腫症;MLH1:mutL 相同体1;VEGFA:血管内皮細胞増殖因子。エラーバーはs.e.mを表す(n=3)。

FokI−dCas9 RFNの二量体化が、有効なゲノム編集の活性に必要である。 (d)VEGFA部位1を標的とするために使用されるgRNAの1つでのオンターゲット部位および5つの従来より知られているオフターゲット(OT)部位でVEGFA部位1を標的とするRFNの変異誘発頻度。変異の頻度は、ディープシーケンシングにより決定した。報告される各値は、3つの独立したトランスフェクションの実験から集められたゲノムDNAから調製した単一のディープシーケンシングライブラリーから決定した。オンターゲットVEGFA部位1について示される値(アスタリスクが付される)は、以下の図4aの値と同一であり、この図面に表される値との比較を簡単にすることのみを目的として示される。

単一gRNAと共発現したCas9ニッカーゼまたはFokI−dCas9の変異原性活性。 (a)6つの異なるヒト遺伝子部位を標的とする1つまたは2つのgRNAの存在下でのFokI−dCas9(左のバー)またはCas9ニッカーゼ(中央のバー)により誘導される挿入欠失変異の頻度。各遺伝子標的について、両方のgRNAでの挿入欠失の頻度を評価した。「左」の片側部位では1つのみのgRNA、または「右」の片側部位では他方のgRNAのみを用いる。変異の頻度を、ディープシーケンシングにより決定した。報告するそれぞれの挿入欠失の頻度は、3つの独立したトランスフェクションの実験から集めたゲノムDNAから調製した単一のディープシーケンシングライブラリーから決定した。VEGFA:血管内皮増殖因子A、DDB2:損傷特異的DNA結合タンパク質2(Damage−Specific DNA Binding Protein 2);FANCF:ファンコニ貧血相補群F(Fanconi Anemia, Complementation Group F);FES:ネコ肉腫ウイルス癌遺伝子;RUNX 1:Runt関連転写因子1(Runt−Related Transcription Factor 1)。

単一gRNAと共発現したCas9ニッカーゼまたはFokI−dCas9の変異原性活性。 (b)単一gRNAの実験または対照の実験(gRNAなし、およびCas9ニッカーゼまたはFokI−dCas9なし)のそれぞれに対して、gRNA対を備える各標的部位で得られた値と比較した挿入欠失の頻度における倍数減少として表される(a)由来のデータ。この倍数減少は、FokI−dCas9(各対の左側のバー、薄灰色)およびCas9ニッカーゼ(各対の右側のバー、濃灰色)の両方について計算された。

単一のCas9ニッカーゼは、それぞれの標的部位に点変異を高い効率で導入することができる。 FokI−dCas9、Cas9ニッカーゼ、またはtdTomato対照の存在下の(a)VEGFA、(b)FANCF、および(c)RUNX1の遺伝子標的での、単一gRNAが標的化とする片側部位の各位置で見出される異なる点変異の頻度。変異の頻度を、ディープシーケンシングにより決定した。報告する各点変異の値は、3つの独立したトランスフェクションの実験から集めたゲノムDNAから調製した単一ディープシーケンシングから決定した。これらの実験に使用するゲノムDNAは、図7A〜Bの挿入欠失変異で分析した同一の細胞から単離したことに留意されたい。VEGFA:血管内皮増殖因子A;FANCF:ファンコニ貧血相補群F;RUNX 1:Runt関連転写因子1。

(詳細な説明) CRISPR RNA誘導型ヌクレアーゼ(RGN)は、簡便で効率的なゲノム編集のプラットフォームとして急速に登場した。Marraffiniら(Jiangら,Nat Biotechnol 31,233−239(2013))は近年、細菌でのCas9 RGNの特異性を体系的に研究したが、ヒト細胞でのRGN特異性については十分に明らかにされていない。これらのヌクレアーゼを研究および治療応用に広く用いるのであれば、ヒトをはじめとする真核細胞においてRGNによるオフターゲット効果が及ぶ範囲を理解することが極めて重要になる。本発明者らは、ヒト細胞ベースのレポーターアッセイを用いてCas9ベースのRGNによるオフターゲット切断の特徴を明らかにした。ガイドRNA(gRNA)−DNA接合部に沿った位置に応じて、様々な程度で単一および二重のミスマッチが許容された。一部ミスマッチのある部位を調べることによって、ヒト細胞の内在遺伝子座を標的とした6種類のRGNのうちの4種類によって誘発されるオフターゲット変化が迅速に検出された。特定されたオフターゲット部位は最大5つのミスマッチを保有しており、その多くが目的とするオンターゲット部位で観察された頻度と同等(またはそれ以上)の頻度で変異していた。したがって、RGNはヒト細胞において、不完全にマッチしたRNA−DNAに対しても高い活性を示し、この観察結果は研究および治療応用での使用を複雑なものにしかねないものである。

本明細書に記載される結果は、任意のRGNの特異性プロファイルを予測することが容易なものでもなく単純なものでもないことを示している。EGFPレポーターアッセイの実験は、単一および二重のミスマッチがヒト細胞でのRGN活性に様々な影響を及ぼし得るものであり、その影響はミスマッチの標的部位内での位置(1つまたは複数)に厳密に依存するものではないことを示している。例えば、これまでに公開されている報告の通り、一般にgRNA/DNA接合部の3’側半分にみられる変化の方が、5’側半分にみられる変化よりも影響が大きいが(Jiangら,Nat Biotechnol 31,233−239(2013);Congら,Science 339,819−823(2013);Jinekら,Science 337,816−821(2012))。しかしながら3’末端の単一および二重変異が十分に許容されると思われる場合もあるのに対して、5’末端の二重変異は活性を大幅に低下させ得る。さらに、任意の位置(1つまたは複数)のミスマッチの影響の大きさは部位依存的であると思われる。可能なあらゆるヌクレオチド置換(本発明者らのEGFPレポーター実験で用いられるワトソン−クリックトランスバージョン以外にも)を試験し、大きな一連のRGNに関して広範囲にわたるプロファイリングを実施すれば、オフターゲットの及び得る範囲についてさらに洞察が得られると考えられる。この点に関して、近年記載されたMarraffiniらの細菌細胞ベースの方法(Jiangら,Nat Biotechnol 31,233−239(2013))または以前にLiuらがZFNに適用したin vitroのコンビナトリアルライブラリーベースの切断部位選択手法(Pattanayakら,Nat Methods 8,765−770(2011))が、さらに大きなRGN特異性プロファイルの作製に有用であると考えられる。

RGN特異性を広範囲にわたって予測するには上に挙げたような困難が伴うが、オンターゲット部位と1〜5つのミスマッチの分だけ異なる一部のゲノム部位を調べることによって、真のRGNによるオフターゲットを特定することができた。注目すべきことに、これらの実験の条件下では、多くのこれらのオフターゲット部位におけるRGN誘発変異の頻度は、目的とするオンターゲット部位で観察された頻度とほぼ同じ(またはそれ以上)であり、T7EIアッセイ(本発明者らの実験室で実施した場合、信頼できる変異頻度の検出限界が約2〜5%である)を用いてこれらの部位を検出することが可能であった。これらの変異率は極めて高いため、これまではるかに頻度の低いZFN誘発オフターゲット変化およびTALEN誘発オフターゲット変化の検出に必要とされたディープシーケンシング法の使用を回避することができた(Pattanayakら,Nat Methods 8,765−770(2011);Perezら,Nat Biotechnol 26,808−816(2008);Gabrielら,Nat Biotechnol 29,816−823(2011);Hockemeyerら,Nat Biotechnol 29,731−734(2011))。このほか、ヒト細胞におけるRGNオフターゲット変異誘発の解析から、RGN特異性を予測することが困難であることが確認され、単一および二重のミスマッチのあるオフターゲット部位がすべて変異の証拠を示すわけではないが、ミスマッチが5つに及ぶ一部の部位でも変化がみられた。さらに、特定された真のオフターゲット部位には、目的とする標的配列と比較して、転移または転換による差への明らかな偏りは全くみられない。

いくつかのRGNにオフターゲット部位がみられたが、このような部位の特定は広範囲の規模でもゲノム全域にわたる規模でもなかった。研究対象にした6種類のRGNでは、ヒトゲノム内にある総数がはるかに多い潜在的オフターゲット配列のごく一部のものだけを検討した。T7EIアッセイによってこれだけ多数のオフターゲット変異の遺伝子座を検討するのは実用的な戦略でも費用効果に優れた戦略でもないが、今後の研究でハイスループットシーケンシングを使用することになれば、多数のオフターゲット部位の候補を調べることが可能になり、より高感度に真のオフターゲット変異を検出する方法が得られるものと考えられる。例えば、そのような方法を用いれば、本発明者らがいかなるオフターゲット変異も明らかにできなかった2種類のRGNについて、さらなるオフターゲット部位を明らかにすることが可能になると考えられる。さらに、細胞内でのRGN活性に影響を及ぼし得るRGN特異性とエピゲノミックな要因(例えば、DNAメチル化およびクロマチン状態)の両方の理解が進展すればほかにも、検討する必要のある潜在的部位の数が減少し、これによりゲノム全域にわたるRGNオフターゲットの評価の実用性が高まり、価格も手頃なものになり得ると考えられる。

ゲノムオフターゲット変異の頻度を最小限に抑えるのにいくつかの戦略を用いることができる。例えば、RGN標的部位の特異的選択を最適化することができる。目的とする標的部位と最大5つの位置において異なるオフターゲット部位がRGNによって効率的に変異され得るとすると、ミスマッチの計数によって判定される最小数のオフターゲット部位を有する標的部位を選択するのが効果的であるとは思われない。ヒトゲノム内の配列を標的とする任意のRGNには通常、20bpのRNA:DNA相補性領域内の4つまたは5つの位置が異なる何千もの潜在的オフターゲット部位が存在することになる。このほか、gRNA相補性領域のヌクレオチド含有量が潜在的オフターゲット効果の範囲に影響を及ぼす可能性がある。例えば、GC含有量が高いとRNA:DNAハイブリッドが安定することが示されており(Sugimotoら,Biochemistry 34,11211−11216(1995))、したがって、gRNA/ゲノムDNAのハイブリダイゼーションの安定性およびミスマッチの許容性も高まることが予想されると考えられる。この2つのパラメータ(ゲノム内のミスマッチ部位の数およびRNA:DNAハイブリッドの安定性)がゲノム全域にわたるRGN特異性に影響を及ぼす可能性およびその機序を評価するには、gRNAの数を増やした実験がさらに必要となる。しかし、このような予測パラメータを定めることができるとしても、このようなガイドラインの実施による影響がRGNの標的化の範囲をさらに制限することになる可能性があることに留意することが重要である。

RGN誘発オフターゲット効果を低減する一般的な戦略で有望なものの1つに、細胞内で発現するgRNAおよびCas9ヌクレアーゼの濃度を低くすることが考えられる。U2OS.EGFP細胞のVEGFA標的部位2および3にRGNを用いて、この考えを検討した。トランスフェクトするgRNA発現およびCas9発現プラスミドを減らしたところ、オンターゲット部位での変異率が低下したが、オフターゲット変異の相対的比率はあまり変化しなかった。これと同じように、他の2種類のヒト細胞型(HEK293細胞およびK562細胞)でも、オンターゲット変異誘発の絶対的比率がU2OS.EGFP細胞より低いものの、高レベルのオフターゲット変異誘発率が観察された。したがって、細胞内でのgRNAおよびCas9の発現レベルを低下させてもオフターゲット効果を低減する解決策にはならないと思われる。さらに、上の結果はほかにも、ヒト細胞に観察される高率のオフターゲット変異誘発がgRNAおよび/またはCas9の過剰発現に起因するものではないことを示唆している。

3種類の異なるヒト細胞型でRGNによって大幅なオフターゲット変異誘発が引き起こされ得るという観察結果は、このゲノム編集プラットフォームの使用に重要な意味を持つ。研究に適用する場合、特に望ましくない変化の他配が課題となる世代時間の長い培養細胞または生物体を用いる実験では、高頻度のオフターゲット変異の潜在的に複雑な作用を考慮に入れる必要がある。オフターゲット効果はランダムなものではなく、標的とする部位と関係があるため、このような作用を制御する方法の1つとして、異なるDNA配列を標的とする複数のRGNを用いて同じゲノム変化を誘発することが考えられる。しかし、治療に適用する場合、ここに挙げた観察結果は、これらのヌクレアーゼをヒト疾患の治療により長期間にわたって安全に使用するのであれば、RGN特異性を慎重に定め、かつ/または改善する必要があることを明確に示している。

特異性を改善する方法 本明細書に示されるように、化膿性連鎖球菌(S.pyogenes)Cas9タンパク質を土台とするCRISPR−Cas RNA誘導型ヌクレアーゼは、目的とするオンターゲット活性と同等以上の著しいオフターゲット変異誘発効果を有し得る(実施例1)。このようなオフターゲット効果は、研究の適用する際に、また特に将来治療に適用する際に問題となり得る。したがって、CRISPR−Cas RNA誘導型ヌクレアーゼ(RGN)の特異性を改善する方法が必要とされている。

実施例1に記載されるように、Cas9 RGNはヒト細胞のオフターゲット部位に高頻度の挿入欠失変異を誘発し得る(このほか、Cradickら,2013;Fuら,2013;Hsuら,2013;Pattanayakら,2013を参照されたい)。このような望ましくない変化は、目的とするオンターゲット部位と5つものミスマッチによって異なるゲノム配列に起こり得る(実施例1を参照されたい)。さらに、gRNA相補性領域の5’末端のミスマッチは一般に、3’末端のミスマッチよりも許容されやすいが、このような関係は絶対的なものではなく、部位依存性を示す(実施例1およびFuら,2013;Hsuら,2013;Pattanayakら,2013を参照されたい)。その結果、現在、ミスマッチの数および/または位置に依存するコンピュータを用いる方法は、真のオフターゲット部位を特定するために予測に用いる価値が低下している。したがって、RNA誘導型ヌクレアーゼを研究および治療応用に使用するのであれば、オフターゲット変異の頻度を低下させる方法が依然として重要な優先事項である。

二量体化は、Cas9ヌクレアーゼの特異性を改善する魅的な戦略となる可能性がある。これは、真の二量体系ではない、対形成されたCas9ニッカーゼの手法とは異なるものである。対形成されたニッカーゼは、DNAのセグメント上に2つのCas9ニッカーゼを同時に局在することにより働き、これにより、定義されていない機構を介して効率の高いゲノム編集を誘導する。二量体化は、酵素活性に必要ではないため、単一のCas9ニッカーゼもまた、特定の部位で(知られていない機構を介して)挿入欠失を高い効率で誘導することもでき、したがって、ゲノム中の望ましくないオフターゲット変異を潜在的に引き起こす可能性がある。

したがって、RGNの特異性を改善する1つの手法として、D10AおよびH840Aの変異を有する触媒的に不活性な形態のCas9(dCas9としても知られる)に、FokIエンドヌクレアーゼドメインを融合することがある。FokIヌクレアーゼドメインは、二量体として機能し、したがって、二重鎖の切断を誘導するために、2つのサブユニットがDNAの同一の局所部分に動員されなければならない。この構成(図9Aおよび実施例2)では、2つのFokI−dCas9融合物が、二重鎖の切断を得るために2つの異なるgRNAを使用した適切な構成で動員される。したがって、この系では、FokI−dCas9融合物は、単一のRGNの部位より2倍長い部位に結合し、それにより、この系はより特異的になると予測される。

よって、本明細書は、FokI−dCas9融合タンパク質であって、FokI配列が、dCas9(好ましくは、dCas9のアミノ酸末端、また任意にカルボキシ末端)に融合し、任意に、介在リンカー、たとえば、任意に2〜30個のアミノ酸、たとえば4〜12個のアミノ酸、たとえばGly4Ser(配列番号:23)または(Gly4Ser)3のリンカーを含む、FokI−dCas9融合タンパク質を提供する。いくつかの実施形態では、融合タンパク質は、dCas9およびFokIのドメインの間にリンカーを含む。これらの融合タンパク質(または連結構造の融合タンパク質の間)に使用し得るリンカーは、融合タンパク質の機能に干渉しない任意の配列を含み得る。好ましい実施形態では、リンカーは短く、例えば2〜20アミノ酸であり、通常は柔軟である(すなわち、グリシン、アラニンおよびセリンなどの自由度の高いアミノ酸を含む)。いくつかの実施形態では、リンカーはGGGS(配列番号22)またはGGGGS(配列番号23)、たとえば、GGGS(配列番号22)またはGGGGS(配列番号23)ユニットのうちの2、3、4つ、またはそれ以上の反復ユニットからなる1つ以上のユニットを含む。同様に他のリンカー配列も使用できる。

また本明細書は、単なる共局在化ではなく二量体化が効率的なゲノム編集の活性に必要であるRNA誘導型FokIヌクレアーゼプラットフォームを記載する。これらのヌクレアーゼは、ヒトの細胞で効率の高いゲノム編集を強く仲介することができ、高感度ディープシーケンシング法により判定して、検出できないレベルまでオフターゲット変異を減少させることができる。また、5’末端のヌクレオチドを備えるgRNA対を発現するために有効な系であって、RFNプラットフォーム上のより広い標的化範囲を与える方法を記載する。最後に、単量体のCas9ニッカーゼは、一般的に、単一gRNAが存在する中、本明細書中に記載されるヌクレアーゼよりもよりも多く望ましくない挿入欠失および点変異を導入する。これらの結果は、良好に特徴付けられた二量体構築物および対形成したCas9ニッカーゼと比較した変異誘発プロファイルの改善、最も可能性のあるゲノム編集の正確さを必要とする研究または治療の適用に重要な特徴といった、特異性の利点を備えた、強力であり、取扱いが簡単なヌクレアーゼプラットフォームを定義する。

したがって、本明細書中で、ヒトの細胞で強力かつ特異性の高いゲノム編集を行うための新規のRNA誘導型FokIヌクレアーゼ(RFN)プラットフォームが記載される。RFNは、二量体としての活性と機能のために二つのgRNAを必要とする。驚くべきことに、活性RFNの遺伝子操作は、FokIドメインが遺伝子操作した亜鉛フィンガーまたは転写アクチベータ—様エフェクター反復アレイのカルボキシ末端に融合したZenおよびTALENと異なる構築物である、dCas9タンパク質のアミノ末端へのFokIヌクレアーゼドメインの融合を必要とした。またRFNは、各Fok−dCas9/gRNA複合体により結合された片側部位が、14〜17bpの長さの相対的に限定された介在スペーサーを備えた特定の相対配向(PAM外部)を有することを必要とする。(活性は、追加的なスペーシングで可能であり得るが、ほとんど一貫して成功しない)。

RFNの二量体の性質は、標準的な単量体Cas9ヌクレアーゼに対して重要な特異性に関する利点を提供する。理想的な二量体系では、活性は、片側部位で、モノマーではほとんど観察されない。提示されるデータから、単一gRNAにより配向されるFokI−dCas9は、RFN片側部位で変異誘発をほとんど誘導しないか、または全く誘導しないことが例証される。12つの単一gRNA(6つのRFN標的部位に対する)を、共発現したFokI−dCas9を用いて試験し、挿入欠失が、非常に低い頻度(0.0045%〜0.47%の範囲)、場合によっては、gRNAまたはヌクレアーゼの発現がない対照細胞で観察されるバックグラウンドの比率と同程度の低いレベルで観察された。二量体としてFokIヌクレアーゼドメインが機能することを考慮すると、単一gRNAで観察されるいずれかの挿入欠失が、DNAへのFokI—dCas9ダイマーの動員によるものである可能性が高いことが推定される。機構に関わらず、非常に低いレベルの変異誘発のみが、FokI−dCas9を12のオンターゲット片側部位での単一gRNAを用いて試験する際に観察されることを考慮すると、何等かの変異誘発が、部分的にミスマッチのオフターゲット片側部位で誘導される可能性が非常に少ない。実際に、VEGFAを標的とするRFNは、ディープシーケンシングにより判定されるように、gRNAのうちの1つの知られているオフターゲット部位で検出可能な変異を誘導しなかった。

RFNは真の二量体系であるので、RFNは、共局在化に依存するが二量体化を必要するものではない対形成するニッカーゼの技術に勝って、多くの重要な利点を有している。第1に、本明細書中の直接的な比較から、単一のCas9ニッカーゼは、一般的に、同一の個々のgRNAにより配向されるFokI−dCas9融合タンパク質よりも挿入欠失変異を効率良く導入することが示される。第2に、単量体のCas9ニッカーゼはまた、標的片側部位に塩基対の置換を、この試験で包有されていない従来では知られていない変異原性の副作用を伴って、高い効率で誘導する場合がある。ここでも、直接的な比較から、単量体のCas9ニッカーゼが、同一の単一gRNAにより誘導されるFokI−dCas9融合物よりも実質的に高い比率で点変異を誘導することが示される。第3に、対形成したCas9ニッカーゼは、二量体RFNよりも標的片側部位の配向およびスペーシングにおいて高い無差別性を示し、それゆえオフターゲット変異が誘導され得る可能性がより高くなる範囲の部位を有する。対形成したニッカーゼの片側部位は、PAM内部またはPAM外部、および、0〜1000bpの範囲の長さのスペーサー配列を含んで配向できる(Ran et al., Cell 154, 1380−1389 (2013); Mali et al., Nat Biotechnol 31, 833−838 (2013); Cho et al., Genome Res (2013))。この無差別性は、Cas9ニッカーゼのゲノム編集活性が、酵素の二量体化に依存するものではなく、むしろ2つのニックの単なる共局在に依存するために存在する。対照的に、RFNは、特異性において、より厳密性が高い。片側部位は、有効な切断のための2つのおおよそ配置されたFokI切断ドメインの必要条件のため、PAM外部を有していなければならず、14〜17bp離れていなければならない。

FokI FokIは、DNA認識ドメインおよび触媒(エンドヌクレアーゼ)ドメインを含む2型制限エンドヌクレアーゼである。本明細書中に記載される融合タンパク質は、FokI全体、または触媒エンドヌクレアーゼドメイン、たとえば、GenBank アクセッション番号第AAA24927.1のアミノ酸388〜583または408〜583(たとえばLi et al., Nucleic Acids Res. 39(1): 359-372 (2011); Cathomen and Joung, Mol. Ther. 16: 1200-1207 (2008)に記載)、またはMiller et al. Nat Biotechnol 25: 778-785 (2007); Szczepek et al., Nat Biotechnol 25: 786-793 (2007);もしくはBitinaite et al., Proc. Natl. Acad. Sci. USA. 95:10570-10575 (1998)に記載されるような、FokIの変異形態を含むことができる。

FokIの例示的なアミノ酸配列は、以下の通りである。

FokIをコードする例示的な核酸配列は、以下の通りである。

いくつかの実施形態では、本明細書中で使用されるFokIヌクレアーゼは、配列番号4、たとえば、配列番号4のアミノ酸388〜583、または408〜583と少なくとも約50%同一である。これらの変異体ヌクレアーゼは、DNAを切断する特性を保持したままでなければならない。いくつかの実施形態では、ヌクレオチド配列は、配列番号4のアミノ酸383〜583、または408〜583と約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%または100%同一である。いくつかの実施形態では、配列番号4のアミノ酸388〜583、または408〜583とのいずの差異も、非保存領域にある。

2つの配列のパーセント同一性を決定するには、最適比較目的で配列を整列させる(最適な整列に必要であれば第一および第二のアミノ酸または核酸配列の一方または両方にギャップを導入し、また非相同配列を比較目的のため無視することができる)。比較目的で整列させる参照配列の長さは少なくとも50%である(いくつかの実施形態では、参照配列の長さの約50%、55%、60%、65%、70%、75%、85%、90%、95%または100%を整列させる)。次いで、対応する位置のヌクレオチドまたは残基を比較する。第一の配列のある位置が、第二の配列の対応する位置と同じヌクレオチドまたは残基によって占められていれば、2つの分子はその位置において同一である。2つの配列間のパーセント同一性は、2つの配列の最適な整列のために導入する必要があるギャップの数および各ギャップの長さを考慮に入れた、2つの配列に共通する同一の位置の数の関数となる。

配列の比較および2つの配列間のパーセント同一性の決定は、数学的アルゴリズムを用いて実施することができる。本願の目的には、GCGソフトウェアパッケージのGAPプログラムに組み込まれているNeedlemanおよびWunsch((1970)J.Mol.Biol.48:444−453)のアルゴリズムを使用し、ギャップペナルティが12、ギャップ伸長ペナルティが4、フレームシフトギャップペナルティが5のBlossum62スコア行列を用いて、2つのアミノ酸配列間のパーセント同一性を決定する。

Cas9 いくつかの細菌がCas9タンパク質変異体を発現する。現在、化膿性連鎖球菌(Streptococcus pyogenes)Cas9が最もよく用いられているが、他のCas9タンパク質にも化膿性連鎖球菌(S.pyogenes)Cas9と高レベルの配列同一性を有し、同じガイドRNAを利用するものがある。それ以外のものはさらに多様であり、利用するgRNAが異なり、認識するPAM配列(RNAによって定められる配列に隣接するタンパク質によって定められる、2〜5のヌクレオチド配列)も異なる。Chylinskiらは多数の細菌群のCas9タンパク質を分類し(RNA Biology 10:5,1−12;2013)、その付図1および付表1に多数のCas9タンパク質を列記しており、これらは参照により本明細書に組み込まれる。ほかのCas9タンパク質については、Esveltら,Nat Methods.2013 Nov;10(11):1116−21およびFonfaraら,“Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.” Nucleic Acids Res.2013 Nov 22.[印刷前電子出版]doi:10.1093/nar/gkt1074に記載されている。

本明細書に記載の方法および組成物には様々な種のCas9分子を用いることができる。化膿性連鎖球菌(S.pyogenes)およびサーモフィルス菌(S.thermophilus)のCas9分子が本開示の大部分の対象となるが、ほかにも、本明細書に列記する他の種のCas9タンパク質に由来するか、これに基づくCas9分子を用いることができる。換言すれば、本記載の大部分が化膿性連鎖球菌(S.pyogenes)およびサーモフィルス菌(S.thermophilus)のCas9分子を用いるものであるが、他の種のCas9分子をその代わりに用いることができる。このような種としては、Chylinskiら,2013の付図に基づいて作成した以下の表に記載される種が挙げられる。

本明細書に記載の構築物および方法は上に挙げたいずれかのCas9タンパク質およびその対応するガイドRNAまたはこれに相当する他のガイドRNAの使用を含み得る。このほか、サーモフィルス菌(Streptococcus thermophilus)LMD−9のCas9 CRISPR1系がヒト細胞で機能することがCongらに示されている(Science 339,819(2013))。髄膜炎菌(N.meningitides)Cas9オルソログがHouら,Proc Natl Acad Sci U S A.2013 Sep 24;110(39):15644−9およびEsveltら,Nat Methods.2013 Nov;10(11):1116−21に記載されている。さらに、Jinekらは、サーモフィルス菌(S.thermophilus)およびL.イノキュア(L.innocua)のCas9オルソログ(異なるガイドRNAを利用すると思われる髄膜炎菌(N.meningitidis)およびジェジュニ菌(C.jejuni)のCas9オルソログではない)が、わずかに効率が低下するものの、化膿性連鎖球菌(S.pyogenes)二重gRNAによって誘導されて標的プラスミドDNAを切断し得ることをin vitroで明らかにしている。

いくつかの実施形態では、本発明の系は、細菌にコードされるか、哺乳動物細胞での発現にコドン最適化され、D10、E762、H983またはD986およびH840またはN863の変異、例えば、D10A/D10NおよびH840A/H840N/H840Yを含む化膿性連鎖球菌(S.pyogenes)Cas9タンパク質を用いてタンパク質のヌクレアーゼ部分の触媒能を不活性化し;これらの位置における置換は、(Nishimasuら,Cell 156,935−949(2014)に記載されているように)アラニンであってよく、また他の残基、例えばグルタミン、アスパラギン、チロシン、セリンまたはアスパラギン酸、例えばE762Q、H983N、H983Y、D986N、N863D、N863SまたはN863Hであってよい(図1C)。本明細書に記載の方法および組成物に使用することができる触媒能が不活性化された化膿性連鎖球菌(S.pyogenes)Cas9は以下の通りであり、例示的なD10AおよびH840Aの変異は太字で表され、下線が施されている。

いくつかの実施形態では、本明細書で使用されるCas9ヌクレアーゼは、化膿性連鎖球菌(S.pyogenes)Cas9の配列と少なくとも約50%同一である、すなわち、配列番50%同号5と少なくとも一である。いくつかの実施形態では、ヌクレオチド配列は配列番号5と約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%または100%同一である。いくつかの実施形態では、配列番号5との差はいずれも非保存領域内にあり、これはChylinskiら,RNA Biology 10:5,1−12;2013(例えば、その付図1および付表1);Esveltら,Nat Methods.2013 Nov;10(11):1116−21およびFonfaraら,Nucl.Acids Res.(2014)42(4):2577−2590.[印刷前電子出版 2013 Nov 22]doi:10.1093/nar/gkt1074に記載されている配列の配列アライメントによって確認される。同一性を上述のように決定する。

ガイドRNA(gRNA) 一般的に言えば、ガイドRNAには2つの系、すなわち、一緒に機能してCas9による切断を誘導する別個のcrRNAとtracrRNAを用いる系1および2つの別個のガイドRNAを単一の系に組み合わせるキメラcrRNA−tracrRNAハイブリッドを用いる系2(単一ガイドRNAまたはsgRNAと呼ばれる。このほか、Jinekら,Science 2012;337:816−821を参照されたい)がある。tracrRNAは様々な長さに短縮することが可能であり、様々な長さのものが別個の系(系1)およびキメラgRNA系(系2)の両方で機能することが示されている。例えば、いくつかの実施形態では、tracrRNAは、その3’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。いくつかの実施形態では、tracrRNA分子は、その5’末端から少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。あるいは、tracrRNA分子は、5’末端および3’末端の両方から、例えば、5’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15ntまたは20nt、3’末端で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35ntまたは40nt短縮されていてよい。例えば、Jinekら,Science 2012;337:816−821;Maliら,Science.2013 Feb 15;339(6121):823−6;Congら,Science.2013 Feb 15;339(6121):819−23;ならびにHwangおよびFuら,Nat Biotechnol.2013 Mar;31(3):227−9;Jinekら,Elife 2,e00471(2013)を参照されたい。系2では一般に、キメラgRNAの長さが長いほどオンターゲット活性が高いことがわかっているが、様々な長さのgRNAの相対的特異性は現時点では明らかにされておらず、したがって、場合によっては短いgRNAを用いる方が望ましいことがある。いくつかの実施形態では、gRNAは、転写開始部位の上流約100〜800bp以内、例えば、転写開始部位の上流約500bp以内、または転写開始部位の下流約100〜800bp以内、例えば、約500bp以内にある領域に相補的である。いくつかの実施形態では、2種類以上のgRNAをコードするベクター(例えば、プラスミド)、例えば、標的遺伝子の同じ領域の異なる部位を対象とする2種類、3種類、4種類、5種類またはそれ以上のgRNAをコードするプラスミドを用いる。

Cas9ヌクレアーゼは、たとえば、ゲノムDNA標的部位の相補鎖に相補的な5’末端で17〜20ntを有する単一gRNAまたはtracrRNA/crRNAといった、ガイドRNAを使用して、配列NGGといった追加的なプロトスペーサー隣接モチーフ(PAM)を有する、特異的な17〜20ntのゲノム標的に誘導することができる。したがって、本発明の方法は、たとえば、Mali et al., Science 2013 Feb 15; 339(6121):823−6に記載されるような単一のCas9ガイドRNAといった、標準的なトランスコード化tracrRNAに融合されるcrRNAを含む単一のガイドRNAの使用を含むことができる。これは、たとえば、NGG、NAG、またはNNGGといったプロトスペーサー隣接モチーフ(PAM)の5’末端標的配列に相補的な鎖のうち、20nt、19nt、18nt、または17nt、好ましくは17ntまたは18ntといった、25〜17、任意に20以下のヌクレオチド(nt)の標的配列に相補的な5’末端での配列を備える。いくつかの実施形態では、単一のCas9誘導型RNAは、配列

であって、式中X17〜20が、標的配列の17〜20個の連続したヌクレオチドに相補的なヌクレオチド配列である、配列からなる。単一ガイドRNAをコードするDNAは、以前に文献で記載されている(Jinek et al., Science. 337(6096):816−21 (2012)およびJinek et al., Elife. 2:e00471 (2013))。

ガイドRNAは、リボ核酸とCas9との結合に干渉しない任意の配列であり得るXNを含んでよく、(RNA中の)Nは0〜200、例えば、0〜100、0〜50または0〜20であり得る。

いくつかの実施形態では、ガイドRNAは、3’末端に1つまたは複数のアデニン(A)またはウラシル(U)ヌクレオチドを含む。いくつかの実施形態では、RNA PolIII転写を停止させる終止シグナルとして用いられる1つまたは複数のTが任意選択で存在する結果として、RNAは、分子の3’末端に1つまたは複数のU、例えば、1〜8つまたはそれ以上のU(例えば、U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)を含む。

本明細書中に記載されるいくつかの例は単一gRNAを利用するが、本方法は、二重のgRNA(たとえば天然に存在する系で見出されるcrRNAおよびtracrRNA)を用いても使用できる。この場合、単一のtracrRNA、本発明の系を使用して発現する複数の異なるcrRNA、たとえば以下 (X17—20)GUUUUAGAGCUA(配列番号:13); (X17—20)GUUUUAGAGCUAUGCUGUUUUG(配列番号:14);または (X17—20)GUUUUAGAGCUAUGCU(配列番号:15) およびtracrRNA配列と共に使用される。この場合、crRNAは、本明細書に記載される方法および分子におけるガイドRNAとして使用され、tracrRNAは、同一または異なるRNA分子から発現できる。いくつかの実施形態では、本方法は、配列

またはその活性部位(活性部位は、Cas9またはdCas9との複合体を形成する特性を保持する部位である)を含む、またはからなるtracrRNAと細胞を接触させることを含む。いくつかの実施形態では、tracrRNA分子は、少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35nt、または40ntだけ、3’末端から短縮されていてもよい。別の実施形態では、tracrRNA分子は、少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35nt、または40ntだけ、5’末端から短縮されてもよい。あるいは、tracrRNA分子は、たとえば5’末端上で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、または20nt分、および3’末端上で少なくとも1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、15nt、20nt、25nt、30nt、35nt、または40nt分、5’末端および3’末端の両方から短縮されてもよい。配列番号8に加えて例示的なtracrRNA配列は、以下を含む:

(X17—20)GUUUUAGAGCUAUGCUGUUUUG(配列番号:14)をcRNAとして使用するいくつかの実施形態では、以下のtracrRNAを使用する:

(X17—20)GUUUUAGAGCUA(配列番号:13)をcrRNAとして使用するいくつかの実施形態では、以下のtracrRNAを使用する:

(X17—20)GUUUUAGAGCUAUGCU(配列番号:15)をcrRNAとして使用するいくつかの実施形態では、以下のtracrRNAを使用する:

いくつかの実施形態では、gRNAは、オフターゲット作用を最小限にするために、ゲノムの残りのいずれかの配列と異なる少なくとも3つ以上のミスマッチである部位を標的とする。

ロックト核酸(LNA)などの修飾RNAオリゴヌクレオチドが、修飾オリゴヌクレオチドをより好ましい(安定な)コンホメーションにロックすることによってRNA−DNAハイブリダイゼーションの特異性を増大させることが示されている。例えば、2’−O−メチルRNAは2’酸素と4’炭素の間に追加の共有結合が存在する修飾塩基であり、これをオリゴヌクレオチド内に組み込むことによって全体の熱安定性および選択性を改善することができる(式I)。

したがって、いくつかの実施形態では、本明細書に開示されるtru−gRNAは、1つまたは複数の修飾RNAオリゴヌクレオチドを含み得る。例えば、本明細書に記載の短縮ガイドRNA分子は、標的配列に相補的なガイドRNAの17〜18ntまたは17〜19ntの5’領域のうちの1つ、一部または全部が修飾されていてよく、例えば、ロックされていてよく(2’−O−4’−Cメチレン架橋)、5’−メチルシチジンであってよく、2’−O−メチル−プソイドウリジンであってよく、あるいはリボースリン酸骨格がポリアミド鎖に置き換わっていてよく(ペプチド核酸)、例えば、合成リボ核酸であってよい。

他の実施形態では、tru−gRNA配列の1つ、一部または全部のヌクレオチドが修飾されていてよく、例えば、ロックされていてよく(2’−O−4’−Cメチレン架橋)、5’−メチルシチジンであってよく、2’−O−メチル−プソイドウリジンであってよく、あるいはリボースリン酸骨格がポリアミド鎖に置き換わっていてよく(ペプチド核酸)、例えば、合成リボ核酸であってよい。

いくつかの実施形態では、単一ガイドRNAおよび/またはcrRNAおよび/またはtracrRNAは、3’末端に1つまたは複数のアデニン(A)またはウラシル(U)ヌクレオチドを含み得る。

既存のCas9ベースのRGNは、目的とするゲノム部位への標的化を誘導するのにgRNA−DNAヘテロ二本鎖の形成を利用するものである。しかし、RNA−DNAヘテロ二本鎖ではそのDNA−DNA対応物よりも無差別な範囲の構造が形成され得る。実際、DNA−DNA二本鎖の方がミスマッチに対する感度が高く、このことは、DNA誘導型ヌクレアーゼがオフターゲット配列と容易には結合せず、RNA誘導型ヌクレアーゼに比して特異性が高いことを示唆している。したがって、本明細書に記載の方法に使用可能なガイドRNAはハイブリッド、すなわち、1つまたは複数のデオキシリボヌクレオチド、例えば短いDNAオリゴヌクレオチドが、gRNAの全部または一部、例えばgRNAの相補性領域の全部または一部と置き換わったハイブリッドであり得る。このDNAベースの分子は、単一gRNA系の全部または一部と置き換わってもよく、あるいは二重crRNA/tracrRNA系のcrRNAおよび/またはtracrRNAの全部または一部と置き換わってもよい。一般にDNA−DNA二本鎖の方がRNA−DNA二本鎖よりもミスマッチに対する許容性が低いことから、相補性領域内にDNAを組み込むこのような系の方がより高い信頼性で目的とするゲノムDNA配列を標的とするはずである。このような二本鎖を作製する方法は当該技術分野で公知であり、例えば、Barkerら,BMC Genomics.2005 Apr 22;6:57;およびSugimotoら,Biochemistry.2000 Sep 19;39(37):11270−81を参照されたい。

さらに、別個のcrRNAおよびtracrRNAを使用する系では、1つまたは両方を合成とすることができ、1つ以上の修飾(たとえばロックト)ヌクレオチドまたはデオキシリボヌクレオチドを含むことができる。

細胞との関連において、Cas9と合成gRNAの複合体を使用して、CRISPR/Cas9ヌクレアーゼ系のゲノム全域にわたる特異性を改善することが可能である。

記載される方法は、本明細書中に記載されるCas9 gRNA+融合タンパク質を、細胞中で発現すること、または細胞と接触させることとを含むことができる。

発現系 記載される融合タンパク質を使用するためには、それをコードする核酸から発現させるのが望ましいであろう。これは様々な方法で実施することができる。例えば、ガイドRNAをコードする核酸を中間ベクターにクローン化して原核細胞または真核細胞を形質転換し、複製および/または発現させる。中間ベクターは通常、融合タンパク質をコードする核酸を保管または操作して融合タンパク質を産生するための原核生物ベクター、例えばプラスミドもしくはシャトルベクターまたは昆虫ベクターである。このほか、融合タンパク質をコードする核酸を発現ベクターにクローン化して植物細胞、動物細胞、好ましくは哺乳動物細胞もしくはヒト細胞、真菌細胞、細菌細胞または原生動物細胞に投与してもよい。

発現させるためには、融合タンパク質をコードする配列を通常、転写を指令するプロモーターを含む発現ベクターにサブクローン化する。適切な細菌プロモーターおよび真核プロモーターは当該技術分野で周知であり、例えば、Sambrookら,Molecular Cloning,A Laboratory Manual(第3版,2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);およびCurrent Protocols in Molecular Biology(Ausubelら編,2010)に記載されている。設計したタンパク質を発現させるための細菌発現系を例えば、大腸菌(E.coli)、バチルス(Bacillus)菌種およびサルモネラ(Salmonella)で入手することができる(Palvaら,1983,Gene 22:229−235)。そのような発現系のキットが市販されている。哺乳動物細胞、酵母および昆虫細胞用の真核発現系は当該技術分野で周知であり、同じく市販されている。

核酸の発現を指令するために使用するプロモーターは、具体的な用途によって決まる。例えば、融合タンパク質の発現および精製には通常、強力な構成的プロモーターを使用する。これに対して、遺伝子調節のためにガイドRNAをin vivoで投与する場合、ガイドRNAの具体的な用途に応じて構成的プロモーターまたは誘導プロモーターのいずれかを使用することができる。さらに、ガイドRNAの投与に好ましいプロモーターは、HSV TKなどの弱いプロモーターまたはこれと類似する活性を有するプロモーターであり得る。プロモーターはほかにも、トランス活性化に応答性の要素、例えば、低酸素応答要素、Gal4応答要素、lacリプレッサー応答要素ならびにテトラサイクリン調節系およびRU−486系などの小分子制御系を含み得る(例えば、GossenおよびBujard,1992,Proc.Natl.Acad.Sci.USA,89:5547;Oliginoら,1998,Gene Ther.,5:491−496;Wangら,1997,Gene Ther.,4:432−441;Neeringら,1996,Blood,88:1147−55;ならびにRendahlら,1998,Nat.Biotechnol.,16:757−761を参照されたい)。

発現ベクターは通常、プロモーターに加えて、原核または真核宿主細胞で核酸を発現するのに必要なほかのあらゆる要素を含む転写単位または発現カセットを含む。したがって、典型的な発現カセットは、例えばgRNAをコードする核酸配列と作動可能に連結されたプロモーターと、例えば効率的な転写産物のポリアデニル化、転写停止、リボソーム結合部位または翻訳停止に必要な任意のシグナルとを含む。カセットのほかの要素としては、例えば、エンハンサーおよび異種スプライスイントロンシグナルを挙げ得る。

細胞内に遺伝情報を輸送するのに使用する具体的な発現ベクターは、意図するgRNAの用途、例えば、植物、動物、細菌、真菌、原生動物などでの発現を考慮して選択する。標準的な細菌発現ベクターとしては、pBR322ベースのプラスミド、pSKF、pET23DなどのプラスミドならびにGSTおよびLacZなどの市販のタグ融合発現系が挙げられる。

真核発現ベクターには真核ウイルスの調節要素を含む発現ベクター、例えば、SV40ベクター、パピローマウイルスベクターおよびエプスタイン・バーウイルス由来のベクターを用いることが多い。その他の例示的な真核ベクターとしては、pMSG、pAV009/A+、pMTO10/A+、pMAMneo−5、バキュロウイルスpDSVEおよびSV40初期プロモーター、SV40後期プロモーター、メタロチオネインプロモーター、マウス乳腺腫瘍ウイルスプロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーターをはじめとする真核細胞での発現に効果を示すプロモーターの指令を受けてタンパク質を発現させる他の任意のベクターが挙げられる。

ガイドRNAを発現させるためのベクターは、ガイドRNAの発現を駆動するRNA PolIIIプロモーター、例えば、H1、U6または7SKプロモーターを含み得る。これらのヒトプロモーターは、プラスミドトランスフェクション後に哺乳動物細胞にgRNAを発現させる。あるいは、例えばvitro転写にT7プロモーターを使用してもよく、RNAをin vitroで転写させてから精製することができる。短いRNA、例えば、siRNA、shRNAをはじめとする低分子RNAの発現に適したベクターを使用することができる。図4Bに記載のCys4ベースのマルチプレックス系を用いて、複数のgRNAを、単一の転写物に発現でき(RNA PolIIまたはPol IIIプロモーターにより駆動)、次いでより大きな転写物から切断され得る。

一部の発現系は、安定にトランスフェクトされた細胞系を選択するためのマーカー、例えばチミジンキナーゼ、ヒグロマイシンBホスホトランスフェラーゼおよびジヒドロ葉酸レダクターゼなどを有する。このほか、昆虫細胞にバキュロウイルスベクターを用いてポリヘドリンプロモーターをはじめとする強力なバキュロウイルスプロモーターの指令の下にgRNAコード配列を置くものなど、高収率の発現系が適している。

発現ベクターに通常含まれる要素としてはほかにも、大腸菌(E.coli)で機能するレプリコン、組換えプラスミドを保有する細菌の選択を可能にする抗生物質耐性をコードする遺伝子およびプラスミドの非必須領域にあり組換え配列の挿入を可能にする固有の制限部位が挙げられる。

標準的なトランスフェクション法を用いて、大量のタンパク質を発現する細菌、哺乳動物、酵母または昆虫の細胞系を作製し、次いで標準的な技術を用いてこのタンパク質を精製する(例えば、Colleyら,1989,J.Biol.Chem.,264:17619−22;Guide to Protein Purification,in Methods in Enzymology,vol.182(Deutscherら編,1990)を参照されたい)。真核および原核細胞の形質転換を標準的な技術により実施する(例えば、Morrison,1977,J.Bacteriol.132:349−351;Clark−CurtissおよびCurtiss,Methods in Enzymology 101:347−362(Wuら編,1983)を参照されたい)。

宿主細胞内に外来ヌクレオチド配列を導入するあらゆる既知の方法を用い得る。このような方法としては、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合、エレクトロポレーション、ヌクレオフェクション、リポソーム、マイクロインジェクション、裸のDNA、プラスミドベクター、ウイルスベクター(エピソーム型および組込み型の両方)およびクローン化したゲノムDNA、cDNA、合成DNAをはじめとする外来遺伝物質を宿主細胞内に導入する他のあらゆる周知の方法の使用が挙げられる(例えば、Sambrookら,上記を参照されたい)。唯一必要なのは、用いる具体的な遺伝子工学的方法で、宿主細胞内にgRNAの発現が可能な遺伝子を少なくとも1つ良好に導入することができることである。

本発明は、ベクターおよびベクターを含む細胞を含む。

本発明は以下の実施例でさらに説明されるが、これらの実施例は特許請求の範囲に記載される本発明の範囲を限定するものではない。

実施例1.RNA誘導型エンドヌクレアーゼの特異性の評価 CRISPR RNA誘導型ヌクレアーゼ(RGN)は、簡便で効率的なゲノム編集のプラットフォームとして急速に登場したものである。この実施例では、ヒト細胞ベースのレポーターアッセイを用いてCas9ベースのRGNのオフターゲット切断の特徴を明らかにすることついて記載する。

材料および方法 実施例1では以下の材料および方法を用いた。

ガイドRNAの構築 Cas9標的化のための可変20nt配列を保有するDNAオリゴヌクレオチドをアニールさせて、4bpオーバーハングを有しBsmBI消化プラスミドpMLM3636へのライゲーションに適合した短い二本鎖DNAフラグメントを作製した。このアニールしたオリゴヌクレオチドのクローン化により、U6プロモーターの発現下に20の可変5’ヌクレオチドを有するキメラ+103一本鎖ガイドRNAをコードするプラスミドが得られる(Hwangら,Nat Biotechnol 31,227−229(2013);Maliら,Science 339,823−826(2013))。この研究に使用するpMLM3636および発現プラスミドpJDS246(コドン最適化型のCas9をコードする)はともに非営利プラスミド配布サービスAddgene(addgene.org/crispr−cas)から入手可能である。

EGFP活性アッセイ EGFP−PEST融合遺伝子の単一コピーが組み込まれたU2OS.EGFP細胞を既に記載されている通りに培養した(Reyonら,Nat Biotech 30,460−465(2012))。トランスフェクションでは、SE Cell Line 4D−Nucleofector(商標)Xキット(Lonza)を製造業者のプロトコルに従って用い、示される量のgRNA発現プラスミドおよびpJDS246をTd−トマトコードプラスミド30ngとともに200,000個の細胞にヌクレオフェクトした。トランスフェクションの2日後、BD LSRIIフローサイトメータを用いて細胞を解析した。gRNA/Cas9プラスミドの濃度を最適化するトランスフェクションを三重反復で実施し、他のトランスフェクションをいずれも二重反復で実施した。

内在ヒトゲノム部位のPCR増幅および配列検証 Phusion Hot Start II高忠実度DNAポリメラーゼ(NEB)を用いてPCR反応を実施した。ほとんどの遺伝子座がタッチダウンPCR([98℃、10秒;72〜62℃、−1℃/サイクル、15秒;72℃、30秒]10サイクル、[98℃、10秒;62℃、15秒;72℃、30秒]25サイクル)を用いて良好に増幅された。必要に応じて、68℃または72℃の一定のアニーリング温度および3%DMSOまたは1Mベタインを用いて残りの標的のPCRを35サイクル実施した。PCR産物をQIAXCELキャピラリー電気泳動系で分析して、その大きさおよび純度を検証した。妥当性が確認された産物をExoSap−IT(Affymetrix)で処理し、サンガー法(MGH DNA Sequencing Core)により配列決定して各標的部位を検証した。

ヒト細胞におけるRGN誘発オンターゲットおよびオフターゲット変異の頻度の決定 U2OS.EGFP細胞およびK562細胞では、4D Nucleofector System(Lonza)を製造業者の説明書に従って用い、2×105個の細胞にgRNA発現プラスミドまたは空のU6プロモータープラスミド(陰性対照)250ng、Cas9発現プラスミド750ngおよびtd−トマト発現プラスミド30ngをトランスフェクトした。HEK293細胞では、Lipofectamine LTX試薬(Life Technologies)を製造業者の指示に従って用い、1.65×105個の細胞にgRNA発現プラスミドまたは空のU6プロモータープラスミド(陰性対照)125ng、Cas9発現プラスミド375ngおよびtd−トマト発現プラスミド30ngをトランスフェクトした。QIAamp DNA Blood Mini Kit(QIAGEN)を製造業者の説明書に従って用い、トランスフェクトしたU2OS.EGFP細胞、HEK293細胞またはK562細胞からゲノムDNAを回収した。オフターゲット候補部位を増幅するのに十分なゲノムDNAが得られるように、3回のヌクレオフェクション(U2OS.EGFP細胞)、2回のヌクレオフェクション(K562細胞)または2回のLipofectamine LTXトランスフェクションで得られたDNAをプールしてからT7EIを実施した。試験した各条件に対してこの操作を2回実施することにより同じゲノムDNAのプールを2つ作製し、各トランスフェクションを計4回または6回分得た。次いで、これらのゲノムDNAを鋳型に用いてPCRを上記の通りに実施し、Ampure XPビーズ(Agencourt)を製造業者の説明書に従って用い精製した。T7EIアッセイを既に記載されている通りに実施した(Reyonら,2012,上記)。

NHEJ仲介性挿入欠失変異のDNA配列決定 T7EIアッセイに使用した精製PCR産物をZero Blunt TOPOベクター(Life Technologies)にクローン化し、MGH DNA Automation Coreによりアルカリ溶解ミニプレップ法を用いてプラスミドDNAを単離した。M13順方向プライマー(5’−GTAAAACGACGGCCAG−3’(配列番号19)を用いてサンガー法(MGH DNA Sequencing Core)によりプラスミドの配列を決定した。

実施例1a.単一ヌクレオチドミスマッチ ヒト細胞におけるRGN特異性決定因子を明らかにすることを始めるにあたり、複数のgRNA/標的DNA接合部内の様々な位置に系統的にミスマッチを生じさせることの影響を評価するために大規模な試験を実施した。これを実施するため、既に記載されている標的ヌクレアーゼ活性の迅速の定量化が可能な定量的なヒト細胞ベースの高感度緑色蛍光タンパク質(EGFP)崩壊アッセイ(上の「方法」およびReyonら,2012,上記を参照されたい)(図2B)を用いた。このアッセイでは、ヌクレアーゼ誘発二本鎖切断(DSB)の誤りがちな非相同末端結合(NHEJ)修復によって導入されるフレームシフト挿入/欠失(挿入欠失)変異を不活性化することによって起こるヒトU2OS.EGFP細胞内の蛍光シグナルを評価することによって、単一の組み込まれたEGFPレポーター遺伝子を標的とするヌクレアーゼの活性を定量化することができる(図2B)。ここに記載される研究では、EGFP内の異なる配列を標的とする以下のような3種類の約100ntの単一gRNA(sgRNA)を用いた: EGFP部位1 GGGCACGGGCAGCTTGCCGGTGG(配列番号1) EGFP部位2 GATGCCGTTCTTCTGCTTGTCGG(配列番号2) EGFP部位3 GGTGGTGCAGATGAACTTCAGGG(配列番号3)。 上記sgRNAはそれぞれ、Cas9仲介性のEGFP発現崩壊を効率的に誘導することができる(実施例1eおよび2aならびに図3E(最上段)および3F(最上段)を参照されたい)。

最初の実験では、3種類のEGFP標的化sgRNAの相補的標的化領域の20ヌクレオチドのうち19ヌクレオチドにおける単一ヌクレオチドミスマッチの影響を試験した。これを実施するため、3種類の標的部位のそれぞれについて、位置1〜19(3’から5’の方向に1〜20の番号を付した;図1を参照されたい)にワトソン−クリックトランスバージョンミスマッチを保有する変異体sgRNAを作製し、これらの各種sgRNAがヒト細胞においてCas9仲介性EGFP崩壊を誘導する能力を試験した(位置20のヌクレオチドはU6プロモーター配列の一部であり、発現への影響を避けるためグアニンでなければならないことから、この位置に置換のある変異体sgRNAは作製しなかった)。

EGFP標的部位#2では、gRNAの3’末端よりも5’末端のミスマッチの方が許容性に高いことを示唆するこれまでの研究結果(Jiangら,Nat Biotechnol 31,233−239(2013);Congら,Science 339,819−823(2013);Jinekら,Science 337,816−821(2012))の通り、gRNAの位置1〜10に単一ミスマッチがあると、付随するCas9の活性に著しい影響がみられた(図2C、中央パネル)。しかし、EGFP標的部位#1および#3では、gRNAの一部を除くいずれの位置に単一ミスマッチがあっても、それが配列の3’末端内でも、高い許容性がみられた。さらに、上記2種類の標的にはミスマッチに対する感度が高い具体的な位置に差がみられた(図2C、最上段と最下段のパネルを比較されたい)。例えば、標的部位#1は特に位置2のミスマッチに対して高い感度を示したのに対して、標的部位#3は位置1および8のミスマッチに対して最も高い感度を示した。

実施例1b.複数のミスマッチ gRNA/DNA接合部の2つ以上のミスマッチによる影響を試験するため、隣接する位置および離れた位置にワトソン−クリックトランスバージョンミスマッチを2つ有する一連の変異体sgRNAを作製し、EGFP崩壊アッセイを用いて、ヒト細胞でこれらのsgRNAがCas9ヌクレアーゼ活性を誘導する能力を試験した。全般的に標的部位は3種類とも、一方または両方のミスマッチがgRNA標的化領域の3’側半分に起こる2つの変化に対して感度が高くなることが分かった。しかし、この影響の大きさには部位による差がみられ、標的部位#2がこの2つのミスマッチに対して最も高い感度を示し、標的部位#1が全般的に最も低い感度を示した。許容され得る隣接したミスマッチの数を試験するため、gRNA標的化領域の5’末端の位置19〜15(単一および2つのミスマッチの許容性が高いと思われる位置)の範囲でミスマッチの位置の数が漸増する変異体sgRNAを構築した。

このようにミスマッチを漸増させたsgRNAを試験したところ、3種類の標的部位でいずれも、3つ以上の隣接するスマッチを導入することによってRGN活性が大幅に消失することが明らかになった。5’末端の位置19から開始し、3’末端に向かってミスマッチを追加して漸増させていくと、3種類の異なるEGFP標的化gRNAの活性が突然低下した。具体的には、位置19および19+18にミスマッチを含むgRNAが実質的に完全な活性を示すのに対して、位置19+18+17、19+18+17+16および19+18+17+16+15にミスマッチのあるgRNAには陰性対照に比して実質的に差がみられなかった(図2F)。(位置20はgRNAの発現を駆動するU6プロモーターの一部であるためGでなければならないことから、本発明者らは上記変異体gRNAの位置20にはミスマッチを生じさせなかったことに留意されたい。)

gRNA相補性を短縮することにより特異性が増大したRGNを得ることができる根拠がほかにも以下の実験で得られた:4種類の異なるEGFP標的化gRNA(図2H)では、位置18および19に2つのミスマッチを導入しても活性にあまり影響を及ぼさなかった。しかし、上記gRNAの位置10および11にさらに2つのミスマッチを導入すると活性がほぼ完全に消失する。10/11の2つのミスマッチのみを導入しても、全般的に活性にそれほど大きな影響を及ぼさないのは興味深い。

以上をまとめると、ヒト細胞で得られたこれらの結果は、RGNの活性がgRNA標的化配列の3’側半分のミスマッチに対する方が高い感度を示し得ることを裏付けるものである。しかし、以上のデータはほかにも、RGN特異性が複雑で標的部位依存性であり、単一および2つのミスマッチであれば、RNA標的化領域の3’側半分に1つまたは複数のミスマッチが生じても高い許容性を示すことが多いことを明確に示している。さらに、以上のデータはほかにも、gRNA/DNA接合部の5’側半分のあらゆるミスマッチが必ずしも許容性が高いわけではないことを示唆している。

さらに、以上の結果は、より短い領域の相補性(具体的には約17nt)を有するgRNAの方が活性の特性が高くなることを強く示唆している。本発明者らは、17ntの特異性と、PAM配列によって付与される2ntの特異性とを組み合わせることによって、ヒト細胞にみられるゲノムのような大型で複雑なゲノム内で固有なものとなるのに十分な長さの1つである19bp配列の仕様が得られることに注目する。

実施例1c.オフターゲット変異 内在ヒト遺伝子を標的とするRGNのオフターゲット変異を特定することができるかどうかを明らかにするため、VEGFA遺伝子の3つの異なる部位、EMX1遺伝子の1つの部位、RNF2遺伝子の1つの部位およびFANCF遺伝子の1つの部位を標的とする6種類のsgRNAを用いた。上記6種類のsgRNAは、T7エンドヌクレアーゼI(T7EI)アッセイによって検出されたように、ヒトU2OS.EGFP細胞のそれぞれの内在遺伝子座におけるCas9仲介性挿入欠失を効率的に誘導するものであった(上の「方法」)。次いで本発明者らは、この6種のRGNそれぞれについて、U2OS.EGFP細胞におけるヌクレアーゼ誘発NHEJ仲介性挿入欠失変異の証拠を得るため、候補となるオフターゲット部位を数十か所(46から64に及ぶ箇所数)検討した。評価した遺伝子座には、ヌクレオチドが1つまたは2つ異なる全ゲノム部位のほかにも、ヌクレオチドが3〜6つ異なるゲノム部位のサブセットを含め、gRNA標的化配列の5’側半分にこのようなミスマッチを1つまたは複数有するものを重視した。T7EIアッセイを用いて、VEGFA部位1では(検討した53か所の候補部位うち)4か所のオフターゲット部位、VEGFA部位2では(検討した46か所のうち)12か所、VEGFA部位3では(検討した64か所のうち)7か所、EMX1部位では(検討した46か所のうち)1か所が容易に特定された。RNF2またはFANCF遺伝子について検討したそれぞれ43か所および50か所の候補部位にはオフターゲット変異は検出されなかった。実証されたオフターゲット部位の変異率は極めて高く、目的とする標的部位に観察された変異率の5.6%から125%(平均40%)に及ぶものであった。このような真のオフターゲットには、標的部位の3’末端にミスマッチを有し、合計5つに及ぶミスマッチを有する配列が含まれ、ほとんどのオフターゲット部位がタンパク質をコードする遺伝子内にみられた。一部のオフターゲット部位のDNAシーケンシングから、予測されるRGN切断部位に挿入欠失変異が起こることを示す分子的な裏付けがさらに得られた(図8A〜8C)。

実施例1d.その他の細胞型のオフターゲット変異 RGNがU2OS.EGFP細胞に高頻度でオフターゲット変異を誘発し得ることが確認されたため、次に、これらのヌクレアーゼが他のタイプのヒト細胞にもこのような影響を及ぼすかどうかを明らかにしようとした。これらの細胞は、以前、TALEN15の活性を評価するのにU2OS.EGFP細胞を用いたため、最初の実験にはU2OS.EGFP細胞を選択したが、標的化ヌクレアーゼの活性の試験にはヒトHEK293細胞およびK562細胞の方が広く用いられている。したがって、HEK293細胞およびK562細胞についてもVEGFA部位1、2および3ならびにEMX1部位を標的とする4種類のRGNの活性をも評価した。この4種類のそれぞれのRGNが、変異頻度はU2OS.EGFP細胞に観察された頻度よりもいくぶん低いものの、上記のさらなる2種類のヒト細胞系でもその目的とするオンターゲット部位にNHEJ仲介性挿入欠失変異を効率的に誘発した(T7EIアッセイによる評価)。最初にU2OS.EGFP細胞で特定された上記4種類のRGNの24か所のオフターゲット部位を評価したところ、多くの部位が、HEK293細胞およびK562細胞でも同様にその対応するオンターゲット部位と同程度の頻度で変異することが明らかになった。予想された通り、HEK293細胞のこれらのオフターゲット部位の一部のDNAシーケンシングにより、予測されたゲノム遺伝子座に変化が生じることを示す分子的な根拠がさらに得られた。U2OS.EGFP細胞で特定されたオフターゲット部位のうち、HEK293細胞の4か所、K562細胞の11か所が検出可能な変異を示さなかった理由は正確にはわからない。しかし、これらのオフターゲット部位の多くがU2OS.EGFP細胞でも比較的低い変異頻度を示したことが注目される。したがって、本発明者らの実験ではU2OS.EGFP細胞に比してHEK293細胞およびK562細胞の方が全般的にRGNの活性が低いと思われるため、HEK293細胞およびK562細胞のこれらの部位における変異率がT7EIアッセイの信頼できる検出限界(約2〜5%)未満になり得る。以上をまとめると、HEK293細胞およびK562細胞で得た結果は、今回RGNに観察される高頻度のオフターゲット変異が複数のヒト細胞型にみられる一般的な現象である根拠を示すものである。

実施例1e.EGFP崩壊アッセイに使用するgRNA発現およびCas9発現プラスミドの量の漸増 非相同末端結合を介したフレームシフト変異の誘発がEGFPの発現を確実に崩壊させ得る位置であるEGFPヌクレオチド502の上流に位置する3つの異なる配列(上に示したEGFP部位1〜3)に対して単一ガイドRNA(sgRNA)を作製した(Maeder,M.L.ら,Mol Cell 31,294−301(2008);Reyon,D.ら,Nat Biotech 30,460−465(2012))。

3つの標的部位について、最初に様々な量のgRNA発現プラスミド(12.5〜250ng)を、構成的に発現するEGFP−PESTレポーター遺伝子の単一コピーを有する本発明者らのU2OS.EGFPレポーター細胞に、コドン最適化型のCas9ヌクレアーゼ発現プラスミド750ngとともにトランスフェクトした。最高濃度のgRNAプラスミド(250ng)ではRGNが3種類とも効率的にEGFP発現を崩壊させた(図3E(上段))。しかし、これより少ない量のgRNA発現プラスミドをトランスフェクトした場合、標的部位#1および#3に対するRGNが同レベルの崩壊を示したのに対して、標的部位#2のRGN活性は、トランスフェクトするgRNA発現プラスミドの量を減らすと直ちに低下した(図3E(上段))。

本発明者らのU2OS.EGFPレポーター細胞にトランスフェクトするCas9コードプラスミドの量を漸増させて(50ng〜750ng)EGFP崩壊をアッセイした。図3F(上段)に示されるように、標的部位#1では、トランスフェクトするCas9コードプラスミドの量を3分の1にしても、EGFP崩壊活性が実質的に低下せずに許容された。しかし、標的部位#2および#3を標的とするRGNの活性は、トランスフェクトするCas9プラスミドの量を3分の1にすると直ちに低下した(図3F(上段))。以上の結果を踏まえて、実施例1a〜1dに記載される実験には、EGFP標的部位#1、#2および#3に対してgRNA発現プラスミド/Cas9発現プラスミドをそれぞれ25ng/250ng、250ng/750ngおよび200ng/750ng用いた。

一部のgRNA/Cas9の組合せが他の組合せよりもEGFP発現の崩壊に高い効果を示す理由も、これらの組合せの一部がトランスフェクションに用いるプラスミドの量に多かれ少なかれ感受性を示す理由も理解されていない。上記3種類のsgRNAゲノム内に存在するオフターゲット部位の範囲がそれぞれの活性に影響を及ぼしている可能性があるが、3種類のsgRNAの挙動の差の原因となり得るこれらの特定の標的部位の1〜6bpだけ異なるゲノム部位の数に差はみられなかった(表1)。

VEGFA、RNF2、FANCFおよびEMX1遺伝子を標的とする6種類のRGNならびにEGFP標的部位#1、#2および#3を標的とする3種類のRGNそれぞれのオフターゲット部位はヒトゲノム配列ビルドGRCh37で特定されたものである。ミスマッチはgRNAがアニールする20nt領域に対するもののみを認め、PAM配列に対するものは認めなかった。

実施例2:FokI−dCas9融合タンパク質とのガイドRNA対の使用 単量体のCRISPR−Cas9ヌクレアーゼは、標的化ゲノム編集に広く使用されているが、望まれていないオフターゲット変異を高い頻度で誘導し得る。本実施例は、伸長した、二本鎖の配列を認識し、切断活性のための2つの単一ガイドRNA(gRNA)に厳密に依存する新規の二量体RNA誘導型FokIヌクレアーゼ(RFN)を記載する。RFNは、内在性のヒト遺伝子のDNA配列を効率良く強力に編集できる。さらに、いずれかの5’末端のヌクレオチドを保有するgRNAを発現する方法が記載され、これは、二量体RFNに有益な標的化範囲を与える重要な利点を有する。直接の比較では、単量体Cas9ニッカーゼは、一般的に、マッチした単一gRNAにより導かれるRFNよりも高い頻度で、望ましくない挿入欠失および予期していない限局的点変異を誘導する。RFNは、二量体化の特異性の増強とCRISPR RNAベースの標的化の簡便性を組み合わせ、非常に正確なゲノム編集を必要とする研究および治療上の適用のための重要な新規プラットフォームを提供する。

材料および方法 以下の材料および方法を実施例2に使用した。 単一gRNAおよびマルチクレックスgRNA発現プラスミド 単一またはマルチプレックスgRNAをコードするプラスミドを、BsmBI消化型Csy4−隣接gRNA骨格(pSQT1313; Addgene)を備える、アニールした標的部位のオリゴ二重鎖(Integrated DNA Technologies)および定常領域のオリゴ二重鎖(複数のgRNAに対して)の単一ステップの連結で構築した。

マルチプレックスgRNAコードプラスミドを、1)第1の標的部位をコードするアニーリングしたオリゴ、2)crRNA、tracrRNAおよびCsy4結合部位をコードするリン酸化しアニールしたオリゴ、および3)第2の標的部位をコードするアニール化オリゴを、BsmBI 2型制限酵素で消化したU6−Csy4部位−gRNAプラスミド骨格の中に連結することにより構築した。Csy4RNA結合部位を、gRNA配列の3’末端および5’末端に付着させ、細胞においてCas9とともに発現させた。Csy4 RNA結合部位の配列‘GUUCACUGCCGUAUAGGCAGCUAAGAAA’(配列番号:20)を、標準的なgRNA配列の5’末端および3’末端に融合した。

この配列は、Csy4部位に隣接するマルチプレックスgRNA配列である(下線)。機能的に、1つの転写物上のマルチプレックスにこれらをコードすることは、別々にこれらをコードしたものと同一の結果を有する。Csy4隣接sgRNAの全ての部分は、本明細書に記載される実験の多重部分で発現したが、sgRNAは、1つの転写物上でコードされるCsy4部位により分離されるマルチプレックスsgRNA、および追加的なCsy4配列を有する個々のsgRNAでコードすることができる。この配列では、第1のN20配列は、標的ゲノム配列の1つの鎖に相補的な配列を表し、第2のN20配列は、標的ゲノム配列の他方の鎖に相補的な配列を表す。

gRNAを含むCsy4認識部位をコードするプラスミドを、「2A」ペプチド結合により分かれるCas9およびCsy4タンパク質をコードするプラスミドと共に同時にトランスフェクトした。この結果から、5’末端および3’末端に融合したCsy4部位を備えるgRNAは、上述したU2OS−EGFP崩壊アッセイを使用して、ヒト細胞中でのCas9仲介性切断の誘導が可能なままであった。したがって、Csy4RNAの結合部位は、gRNA配列の3’末端に付着することができ、Cas9とこれらCsy4部位含有gRNAの複合体は、細胞中で機能的なままである。

いくつかの実験では、Csy4−T2A−FokI−dCas9をコードする構築物を使用した。FokI−dCas9融合物の配列を以下に示す。この配列は、FokIおよびdCas9および核局在配列の間にGGGGS(配列番号:23)リンカー(下線)を含む。

代替として、ヒトコドンを最適化した構築物を使用した。これは、NおよびC末端核局在シグナルを含むものであった。配列を以下に示す。

組織培養およびトランスフェクション すべての細胞培養実験を、HEK293細胞、U2OS細胞、または安定して統合された単一複製の不安定化EGFP遺伝子を保有するU2OS細胞(U2OS.EGFP細胞)で行った。細胞株を、10%のFBS、2mM GlutaMax(Life Technologies)、およびペニシリン/ストレプトマイシンを補充したAdvanced DMEM(Life Technologies)の中、5%のCO2、37Cで培養した。さらに、U2OS.EGFP細胞を、400μg/mlのG418の存在下で培養した。

U2OS細胞およびU2OS.EGFP細胞を、製造元の説明書にしたがって、Lonza 4D−NucleofectorのDN−100プログラムを使用してトランスフェクトした。最初のFokI−dCas9活性のスクリーニングおよび融合したスペーサー長解析の実験では、750ngのpCAG−Csy4−FokI−dCas9−nlsヌクレアーゼプラスミドおよび250ngのgRNAコードプラスミドを、トランスフェクションの対照としての50ngのtdTomato発現プラスミド(Clontech)と共にトランスフェクトした。U2OS細胞およびU2OS.EGFP細胞の他のすべての実験では、975ngのヒトコドン最適化pCAG−Csy4−T2A−nls−hFokI−dCas9−nls(SQT1601)またはpCAG−Cas9−D10Aニッカーゼ(NW3)を、325ngのgRNAベクターおよび10ngのTd tomato発現プラスミドと共にトランスフェクトし、トランスフェクションから3日後に解析した。HEK293細胞を、製造元の説明書にしたがってリポフェクタミン(Life Technologies)を使用し、750ngのヌクレアーゼプラスミド、250ngのgRNA発現プラスミド、および10ngのTd tomatoでトランスフェクトし、トランスフェクションから3日後に、NHEJ媒介性変異原性について解析した。

単一のトランスフェクションを、最初のスペーサー活性スクリーニングのために実施し、焦点を当てたスペーサー長解析のためにトランスフェクションを二重に行った。他のすべてのトランスフェクションを3重に行った。

EGFP崩壊アッセイ EGFP崩壊アッセイを、U2OS.EGFPレポーター細胞を使用して、以前に記載されているように実施した(実施例1およびReyon et al., Nat Biotech 30, 460−465 (2012)参照)。細胞を、BD Biosciences LSR IIまたはFortessa FACSのアナライザーを使用してEGFPおよびtdTomatoの発現についてアッセイした。

T7E1アッセイによるヌクレアーゼまたはニッカーゼ誘導型変異比率の定量化 T7E1アッセイを、以前に記載されているように実施した(Reyon et al., Nat Biotech 30, 460−465 (2012))。簡潔に述べると、Sciclone G3 リキッドハンドリングワークステーション(Caliper)と共に製造元の説明書にしたがってAgencourt DNAdvance ゲノムDNA単離キット(Beckman Coulter Genomics)を使用して、ゲノムDNAをトランスフェクションから72時間後に単離した。ゲノムの座位を増幅するPCR反応を、Phusion Hot−start Flex DNAポリメラーゼ(New England Biolabs)を使用して実施した。2つのステッププロトコル(98℃、30秒;(98℃、7秒;72℃、30秒)×35、72℃、5分)、またはタッチダウンプロトコル((98°C、10秒;72〜62°C、?1°C/周期、15秒;72°C、30秒)×10周期(98°C、10秒;62°C、15秒;72°C、30秒)×25周期)を使用して試料を増幅した。200ngの精製したPCRアンプリコンを、変性、ハイブリダイズし、T7エンドヌクレアーゼ(I)(New England Biolabs)を用いて処理した。変異の頻度を、以前に記載されているようにQiaxcel キャピラリー電気泳動器具(Qiagen)を用いて定量した(Reyon et al., Nat Biotech 30, 460−465 (2012))。

変異誘発ゲノムDNAのサンガー配列決定 T7E1アッセイで使用した同一の精製したPCR産物を、Topoクローニングし(Life Technologies)、個々のクローンのプラスミドDNAを単離し、M13リバースプライマー(5′−GTAAAACGACGGCCAG−3′;配列番号:19)を使用して配列決定した。

照度ライブラリーの調製および解析 200〜350bpの短いPCR産物を、Phusion Hot−start FLEX DNAポリメラーゼを使用して増幅した。PCR産物を、製造元の説明書にしたがってAmpure XPビーズ(Beckman Coulter Genomics)を使用して生成した。Dual−indexed TruSeq Illuminaディープシーケンシングライブラリーを、Sciclone G3リキッドハンドリングワークステーション上のハイスループットライブラリー調製系(Kapa Biosystems)を使用して調製した。最終的なアダプター−連結ライブラリーを、Qiaxcelキャピラリー電気泳動器具(Qiagen)を用いて定量した。150bpの対形成した末端の配列決定を、Dana−Farber Cancer Institute Molecular Biology CoreによるIllumina MiSeq シークエンサー上で実施した。

MiSeqの対形成した末端の読み取り値を、bwaを使用してヒトゲノム参照GChr37に対してマッピングした。30超の平均定量スコアを有する読み取り値を、統合した標的または候補となるオフターゲットヌクレアーゼの結合部位に重複する挿入または欠失の変異について解析した。変異解析を、Genome Analysis Toolkit(GATK)およびPythonを用いて行った。

オフターゲット探索アルゴリズム ヒトゲノムを通してスライディングウインドゥ中に特定数未満のミスマッチを有するマッチを探索する標的部位のマッチングアルゴリズムを実施した。

実施例2a:二量体RNA誘導型ヌクレアーゼを設計する根拠 Cas9の標的化の簡便性と二量体の特異性の利点を組み合わせる単一のプラットフォームを開発し得ると仮定した。それを実施するために、良好に特徴付けられた、二量体化依存性FokIヌクレアーゼドメインを、RNA誘導型触媒不活性Cas9(dCas9)タンパク質に融合した。FokI含有ZFNおよびTALENのように、これら融合体の二量体は、これらの間に特定の長さの「スペーサー」配列を備える2つの「片側部位」から構成される部位を標的化するために結合する際、配列特異的なDNA切断を媒介し得ることが期待された(図4A)。そのような融合体は、活性のために2つのgRNAを必要とし、かつ単一gRNAが、DNA切断に必要な2つのFokI含有融合タンパク質を動員するには恐らく不十分であるか、動員することができないので、高い特異性を有すると仮定された(図4A)。そのような二量体系は、標準的な単量体Cas9ヌクレアーゼと比較して改善した特異性を示し、また、単一のニッカーゼが望ましくない変異原性作用を発揮する場合のある対形成されたニッカーゼ系に勝って、重要な特性の利点を有する可能性があるであろうと仮定された。

実施例2b:5’末端のヌクレオチドの制限なしのgRNAのマルチプレックス発現 二量体のRNA誘導型ヌクレアーゼのための標的化の範囲は、現存するgRNA発現方法を使用すると、狭い(low)ものである。2つの配列の要件、すなわちdCas9により特定される5’—NGGのPAM配列の要件、およびほとんどの発現ベクターにおけるU6プロモーターの使用により課されるgRNAの5’末端でのGヌクレオチドの要件は、概して、dCas9モノマーの標的化範囲を制限する。しかしながら、gRNAの5’Gの要件が軽減されるなら、標的化の範囲は16倍改善するであろう。

5’ヌクレオチドを備えるgRNAの発現を可能にするマルチプレックス系を開発するために、プラスミドを構築したが、そのプラスミドから、それぞれがCsy4リボヌクレアーゼの切断部位に隣接する(Haurwitz et al., Science 329, 1355−1358 (2010))2つのgRNAが、U6プロモーターから転写した単一のRNAの中に発現できる(図4B)。Csy4は、この転写物を処理し、これにより2つのgRNAを放出すると予期される。知られているCsy媒介性切断の機構((Haurwitz et al., Science 329, 1355−1358 (2010); Sternberg et al., RNA 18, 661−672 (2012))に基づき、それぞれ処理されたgRNAは、3’末端上にCsy4認識領域を保持し、Csy4タンパク質がこの部位に結合される(図4B)。この構成では、いずれの5’ヌクレオチドを備えるgRNAをも発現することが可能であるはずである。この系を、EGFPレポーター遺伝子内の部位を標的とする2つのgRNAを発現するために使用することにより、試験した。ヒト細胞において、Csy4およびCas9ヌクレアーゼと共にこの転写物を共発現することにより、両方のEGFP標的部位での挿入欠失変異、およびこれら部位の間の配列の欠失が導入される(図4C)。これらの実験から、両方のgRNAが、単一の親RNA転写物から処理され、両方が、ヒト細胞でのCas9ヌクレアーゼの活性を誘導できることが示唆される。

実施例2c.二量体RNA誘導型ヌクレアーゼの構築および最適化 FokIヌクレアーゼドメインおよびdCasタンパク質を保有する2つの異なるハイブリッドタンパク質を構築した。このうち1つでは、FokIヌクレアーゼドメインが、dCas9のカルボキシ末端に融合しており(dCas9−FokI)、もう一つでは、アミノ末端に融合している(FokI−dCas9)(図5A)。dCas9−FokIタンパク質は、構造上ZFNおよびTALENに類似する(図5A)。これらの融合物のいずれかまたは両方が、DNAの部位特異性切断を媒介し得るかどうかを確かめるために、NHEJ媒介性挿入欠失のEGFPレポーター遺伝子への導入を迅速かつ簡便に定量化できる良好に確立したヒト細胞系アッセイを使用した(実施例1で上述のEGFP崩壊アッセイ)。効率的な切断に必要とされる片側部位の幾何学形状は知られていないので、EGFPの様々な部位を標的とする60対のgRNAを設計した。これらgRNA対のそれぞれが標的化とする2つの片側部位は、PAM配列の両方が、スペーサー配列に直接隣接しているか(PAM内部配向)、または完全長の標的部位の外の境界に位置している(「PAM外部」配向)(図5B)ように配向された。さらに、スペーサー配列は、0〜31bpの長さでも変動させた(図5Bおよび表2)。

驚くべきことに、dCas9−FokIタンパク質は、ヒトU2OS.EGFP細胞において60個のgRNA対のいずれと共発現する際にも、検出可能なEGFP崩壊活性を示さなかった(図5E)。しかしながら、同一の60のgRNA対でのFokI−dCas9タンパク質のスクリーニングは、PAM外部の配向の片側部位から構成され、13〜17bpおよび26bp(およそ1回転で13〜17bp超のスペーサー長のDNAへリックス)を備える標的部位のEGFP崩壊活性を明らかにした(図5B)。10〜20bpの範囲のスペーサー長を備え、PAM外部の配向の片側部位を備える追加の25個の標的DNA部位上でのFokI−dCas9の試験は、13〜18bpのスペーサー長を備える標的での効率的な切断を例証した(図5C〜D)。これらの実験では、1つの部位を、それぞれ17bpまたは18bpのスペーサー長で試験し、13bpスペーサー長を備える全ての部位が活性を示したわけではなかった。T7EI解析およびサンガー配列決定により成功して標的とされた部位のサブセット解析は、さらに、意図する位置に挿入欠失の存在を確認した。したがって、FokI−dCas9は、対象となる完全長の標的部位を効率的に切断するために、2つの適切に配置されたgRNAにより配向できる。単純性のため、2つのFokI−dCas9融合物および2つのgRNAの複合体は、本明細書中でRNA誘導型FokIヌクレアーゼ(RFN)を指す。

EGFPレポーター遺伝子を用いて最初の知見を拡張し、RFNが、内在性ヒト遺伝子の定常化したゲノム編集を実施するために使用できるかどうかを確認するために、gRNA対を、9つの異なるヒト遺伝子の12の異なる標的部位のために設計した(表2)。試験した12のRFNのうち7つは、T7EIにより判断されるように、ヒトU2OS.EGFP細胞において意図される標的部位で、高い効率の(3〜40%の範囲)挿入欠失を誘導した(表2)。類似の結果を、HEK293細胞における同一の12RFN対を用いて得た(表2)。U2OS.EGFP細胞からうまく標的化したアレルのサンガー配列決定から、予期した切断部位で、ある範囲の挿入欠失(おもに欠損)の導入が明らかとなった(図5F)。2つの異なるヒト細胞株で観察される修飾の高い成功率および高い効率は、内在性ヒト遺伝子を修飾するRFNの強さを例証するものである。

実施例2d.RFNは、それらの切断部位に対して拡張した特異性を有する RFNが、二量体化に関連する高い認識特異性を有するかどうかを試験するために、これらヌクレアーゼが、対の中の両方のgRNAの存在に密に依存するかどうかを試験した。理想的な二量体系では、単一gRNAは、FokI−dCas9誘導型挿入欠失を効率的に配向することが可能でないはずである。最初の試験を実施するために、ヒトU2OS.EGFP細胞における標的部位(EGFP部位47および81)に対してFokI−dCas9−誘導型挿入欠失を効率的に配向することを示した、EGFPにおける2つの標的部位に配向した2対のgRNAを使用した(図5C)。VEGFA中の関連しない部位を標的とするgRNAでのこれら2つの対のそれぞれの1つまたは他のgRNAの置換は、EGFP崩壊活性の低減をもたらし(図6A)、T7EIアッセイにより判定して、検出できないレベルまで標的化した変異の低減をもたらした(図6B)。同様に、2つのgRNAのそれぞれの1つのみを使用した効果を、ヒトAPC、MLH1、およびVEGFA遺伝子におけるFokI−dCas9−仲介性挿入欠失を効率的に誘導する対を使用して試験し(表2)、ここでも、T7EIアッセイにより検出可能なRFN誘導型挿入欠失の損失を観察した(図6C)。これらの結果は、RFNによるゲノム編集の効率的な誘導が、完全長の標的部位に対する適切な相補性を備える2つのgRNAを必要とすることを例証する。

本出願人のRFNの活性が2つのgRNAの発現に依存することを考慮すると、対の中の単一gRNAのうち1つの知られているオフターゲット部位上の変異原性作用は無視できるべきものであろうと推定される。これら直接的な比較を実施することは、二量体RFNを標的化するために必要とされる2つのgRNAのうちの1つとしてそれ自体が作用できる単一gRNAにより誘導される単量体Cas9ヌクレアーゼのオフターゲット部位を知ることが必要である。単量体のCas9ヌクレアーゼオフターゲット部位が、文献でほとんど定義されていないが、本出願人がヒトVEGFA遺伝子の二量体RFN部位を標的とするために使用したgRNAのうちの1つについて5つのオフターゲット部位が以前に特定されている(実施例1)。ディープシーケンシングを使用して、これら5つのオフターゲット部位が、VEGFA−標的化RFNが発現した細胞での変異の根拠を示したかどうかを確認した。(これらは、図6Cに示されるT7EIアッセイで使用したものと同一の細胞である)。5つすべてのオフターゲット部位での挿入欠失変異の頻度は、背景と区別できないものであった(図6Dおよび表3)。これらの結果から、RFNの使用することにより、Cas9ヌクレアーゼおよび単一gRNAにより本来誘導されたオフターゲット作用を本質的に除去できることを例証し、FokI−dCas9と共に発現した単一gRNAが、挿入欠失を効率的に誘導しないとの本出願人の観察と一致した。しかしながら、現在のところ、追加の部位上でのこれらの直接的な比較を実施することは可能ではなく、このような実験は、二量体RFNの片側部位をも標的化できる、より多くの単一gRNA部位のオフターゲット部位の特定を待つ必要があり、二量体RFNは、標準的な単量体Cas9ヌクレアーゼと比較して特異性を高めたとの結論となった。

実施例2e.単量体Cas9ニッカーゼは、単一gRNA/FokI−dCas9複合体よりも高い比率の変異原性を誘導する。 上述のように、対形成したCas9ニッカーゼの手法の重要となる脆弱性は、単一の単量体ニッカーゼが、ある特定の標的部位で、挿入欠失変異を高頻度で誘導する可能性があることである(実施例1およびRan et al., Cell 154, 1380−1389 (2013); Mali et al., Nat Biotechnol 31, 833−838 (2013); Cho et al., Genome Res (2013); and Mali et al., Science 339, 823−826(2013)参照)。対形成されるCas9ニッカーゼ系の二量体化−依存性の欠損は、2つの単量体ニッカーゼがゲノムの他の場所に望ましくない挿入欠失変異をそれぞれ作製し得るため、オフターゲットの潜在的な原因である。RFNは、二量体化依存性FokIヌクレアーゼを使用して変質を誘導するため、これらの融合物は、単量体Cas9ニッカーゼで観察されるものと比較して、1つのgRNAのみの存在下での望ましくない挿入欠失活性がより少ないことを示すと仮定される。

この仮定を試験するために、FokI−dCas9およびCas9ニッカーゼの活性を、6つの二量体ヒト遺伝子標的部位での単一gRNAの存在下で比較した(合計12の片側部位、表4)。これら特定の部位は、対の中の1つのみおよび/または他のgRNAにより配向される単量体Cas9ニッカーゼが、これらの標的で挿入欠失変異を誘導し得るため、選択された。ディープシーケンシングを使用して、FokI−dCas9またはCas9ニッカーゼのゲノム編集活性を、1つまたは他のgRNAのうち両方または1つのみが存在する中で評価した。FokI−dCas9およびCas9ニッカーゼの両方は、2つのgRNAの存在する中、高い効率で、6つすべての標的部位で挿入欠失を誘導した(表5)。仮説として、12個の単一gRNAにより配向した単量体Cas9ニッカーゼは、0.0048%〜3.04%の範囲の頻度で挿入欠失を誘導した(図7Aおよび表5)。対照的に、同一の12個の単一gRNAにより配向したFokI−dCas9は、0.0045〜0.473%の範囲のより低い頻度で挿入欠失を誘導した(図7Aおよび表5)。これらのデータを直接比較することにより、FokI−dCas9は、12個の単一gRNAのうち10個でCas9ニッカーゼよりも低い頻度で、挿入欠失を誘導した(図7Aおよび表5)。さらに、FokI−dCas9は、単一gRNA比率と、対形成したgRNAの比率を比較する際に、12個の片側部位のうち11個でCas9ニッカーゼよりも多くの挿入欠失の頻度の倍数減少を示した(図7B)。

また、ディープシーケンシングの実験は、標的部位の中の特定の位置の点変異の導入 といった、特定の単量体のCas9ニッカーゼの従来説明されておらず、予期していない副作用を明らかにした。VEGFA標的の「右」の片側部位に対する単一gRNAと共発現したCas9ニッカーゼは、10.5%の頻度で、認識部位の位置15に塩基置換を誘導した(図8A)。類似の結果が、FACF標的部位1の「右」の片側部位(位置16で16.3%の変異頻度)(図8B)またはRUNX1標的部位の「右」の片側部位(位置17で2%の変異頻度)(図8C)に配向されるCas9ニッカーゼおよび単一gRNAで観察された。これらの位置での点変異は、Cas9ニッカーゼまたはgRNAが細胞で発現していない対照試料のバックグラウンドレベルを超えて観察されるものではなかった(図8A〜8C)。興味深いことに、この高頻度変異が観察された3つの部位のうち2つでは、観察された置換基の大部分が、非標的DNA鎖上のCのGへ塩基転換である。これら点変異が観察された位置は、dCas9/gRNA/標的DNA複合体においてin vitroでP1ヌクレアーゼに感受性があると観察された標的部位の鎖−分離領域内にある。重要なことに、これらの点変異は、FokI−dCas9タンパク質および同一のgRNAを発現する細胞において、より低い頻度(5〜100倍低い)で起こる(図8A〜C)。全体的に見て、単一gRNAにより配向されるFokI−dCas9ヌクレアーゼは、概して、マッチした単一のCas9ニッカーゼよりも低い頻度で変異原性の挿入欠失および点変異を誘導する。

実施例2f.二量体RFNは高い度合いの特異性を有する。 2つのgRNAにより配向される二量体RFNは、ヒトの細胞中で明らかなオフターゲット変異を誘導すると予期されるものではない。2つの片側部位から構成される完全長の配列を切断する1対のgRNAにより配向されるRFNは、標的部位のDNAのうち最大44bpを特定すると予測される。この長さの配列は、偶然であるが、ほとんど常に固有である(標的が複製したゲノム配列にある特定の状況を除く)。さらに、この完全長部位に対して、ゲノムで最も近接してマッチした部位は、ほとんどの場合、多数のミスマッチを保有しており、それが次いで、RFN二量体による切断活性を最小限にするか、または消失させると予期される。実際に、この試験でのRFNでの標的化が成功した15の完全長の配列に0〜16個のミスマッチ(12〜17bpの長さのスペーサーを可能にする)を有するヒトゲノムの全ての部位を特定した。この解析から、全ての15個の完全長配列は固有であり、ゲノム中のほとんど近接して一致した部位は、7〜12のミスマッチの範囲であることが示された(表6)。この数のミスマッチを含む部位は、RFNにより効率的に変異誘発されるものではなく、この仮説を確認するためのさらなる試験に興味がもたれる。全体的にみて、二量体RFNは、ヒト細胞において高い度合いの特異性を有するが、特異性の最終的な特徴付けは、ゲノム全体を通してRFNの特異性を包括的に定義できる公平な方法の開発が待たれる。

参考文献 Cheng,A.W.,Wang,H.,Yang,H.,Shi,L.,Katz,Y.,Theunissen,T.W.,Rangarajan,S.,Shivalila,C.S.,Dadon,D.B.,and Jaenisch,R.Multiplexed activation of endogenous genes by CRISPR−on,an RNA−guided transcriptional activator system.Cell Res 23,1163−1171.(2013). Cho,S.W.,Kim,S.,Kim,J.M.& Kim,J.S.Targeted genome engineering in human cells with the Cas9 RNA−guided endonuclease.Nat Biotechnol 31,230−232(2013). Cong,L.et al.Multiplex genome engineering using CRISPR/Cas systems.Science 339,819−823(2013). Cradick,T.J.,Fine,E.J.,Antico,C.J.,and Bao,G.CRISPR/Cas9 systems targeting beta−globin and CCR5 genes have substantial off−target activity.Nucleic Acids Res.(2013). Dicarlo,J.E.et al.Genome engineering in Saccharomyces cerevisiae using CRISPR−Cas systems.Nucleic Acids Res(2013). Ding,Q.,Regan,S.N.,Xia,Y.,Oostrom,L.A.,Cowan,C.A.,and Musunuru,K.Enhanced efficiency of human pluripotent stem cell genome editing through replacing TALENs with CRISPRs.Cell Stem Cell 12,393−394.(2013). Fisher,S.,Barry,A.,Abreu,J.,Minie,B.,Nolan,J.,Delorey,T.M.,Young,G.,Fennell,T.J.,Allen,A.,Ambrogio,L.,et al.A scalable,fully automated process for construction of sequence−ready human exome targeted capture libraries.Genome Biol 12,R1.(2011). Friedland,A.E.,Tzur,Y.B.,Esvelt,K.M.,Colaiacovo,M.P.,Church,G.M.,and Calarco,J.A.Heritable genome editing in C.elegans via a CRISPR−Cas9 system.Nat Methods 10,741−743.(2013). Fu,Y.,Foden,J.A.,Khayter,C.,Maeder,M.L.,Reyon,D.,Joung,J.K.,and Sander,J.D.High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nat Biotechnol 31,822−826.(2013). Gabriel,R.et al.An unbiased genome−wide analysis of zinc−finger nuclease specificity.Nat Biotechnol 29,816−823(2011). Gilbert,L.A.,Larson,M.H.,Morsut,L.,Liu,Z.,Brar,G.A.,Torres,S.E.,Stern−Ginossar,N.,Brandman,O.,Whitehead,E.H.,Doudna,J.A.,et al.(2013).CRISPR−Mediated Modular RNA−Guided Regulation of Transcription in Eukaryotes.Cell 154,442−451. Gratz,S.J.et al.Genome engineering of Drosophila with the CRISPR RNA−guided Cas9 nuclease.Genetics(2013). Hockemeyer,D.et al.Genetic engineering of human pluripotent cells using TALE nucleases.Nat Biotechnol 29,731−734(2011). Horvath,P.& Barrangou,R.CRISPR/Cas,the immune system of bacteria and archaea.Science 327,167−170(2010). Hsu,P.D.,Scott,D.A.,Weinstein,J.A.,Ran,F.A.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.J.,Wu,X.,Shalem,O.,et al.DNA targeting specificity of RNA−guided Cas9 nucleases.Nat Biotechnol 31,827−832.(2013). Hwang,W.Y.et al.Efficient genome editing in zebrafish using a CRISPR−Cas system.Nat Biotechnol 31,227−229(2013). Hwang,W.Y.,Fu,Y.,Reyon,D.,Maeder,M.L.,Kaini,P.,Sander,J.D.,Joung,J.K.,Peterson,R.T.,and Yeh,J.R.Heritable and Precise Zebrafish Genome Editing Using a CRISPR−Cas System.PLoS One 8,e68708.(2013a). Jiang,W.,Bikard,D.,Cox,D.,Zhang,F.& Marraffini,L.A.RNA−guided editing of bacterial genomes using CRISPR−Cas systems.Nat Biotechnol 31,233−239(2013). Jinek,M.et al.A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity.Science 337,816−821(2012). Jinek,M.et al.RNA−programmed genome editing in human cells.Elife 2,e00471(2013). Li,D.,Qiu,Z.,Shao,Y.,Chen,Y.,Guan,Y.,Liu,M.,Li,Y.,Gao,N.,Wang,L.,Lu,X.,et al.Heritable gene targeting in the mouse and rat using a CRISPR−Cas system.Nat Biotechnol 31,681−683.(2013a). Li,W.,Teng,F.,Li,T.,and Zhou,Q.Simultaneous generation and germline transmission of multiple gene mutations in rat using CRISPR−Cas systems.Nat Biotechnol 31,684−686.(2013b). Maeder,M.L.,Linder,S.J.,Cascio,V.M.,Fu,Y.,Ho,Q.H.,and Joung,J.K.CRISPR RNA−guided activation of endogenous human genes.Nat Methods 10,977−979.(2013). Mali,P.,Aach,J.,Stranges,P.B.,Esvelt,K.M.,Moosburner,M.,Kosuri,S.,Yang,L.,and Church,G.M.CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.Nat Biotechnol 31,833−838.(2013a). Mali,P.,Esvelt,K.M.,and Church,G.M.Cas9 as a versatile tool for engineering biology.Nat Methods 10,957−963.(2013b). Mali,P.et al.RNA−guided human genome engineering via Cas9.Science 339,823−826(2013c). Pattanayak,V.,Lin,S.,Guilinger,J.P.,Ma,E.,Doudna,J.A.,and Liu,D.R.High−throughput profiling of off−target DNA cleavage reveals RNA−programmed Cas9 nuclease specificity.Nat Biotechnol 31,839−843.(2013). Pattanayak,V.,Ramirez,C.L.,Joung,J.K.& Liu,D.R.Revealing off−target cleavage specificities of zinc−finger nucleases by in vitro selection.Nat Methods 8,765−770(2011). Perez,E.E.et al.Establishment of HIV−1 resistance in CD4+ T cells by genome editing using zinc−finger nucleases.Nat Biotechnol 26,808−816(2008). Perez−Pinera,P.,Kocak,D.D.,Vockley,C.M.,Adler,A.F.,Kabadi,A.M.,Polstein,L.R.,Thakore,P.I.,Glass,K.A.,Ousterout,D.G.,Leong,K.W.,et al.RNA−guided gene activation by CRISPR−Cas9−based transcription factors.Nat Methods 10,973−976.(2013). Qi,L.S.,Larson,M.H.,Gilbert,L.A.,Doudna,J.A.,Weissman,J.S.,Arkin,A.P.,and Lim,W.A.Repurposing CRISPR as an RNA−guided platform for sequence−specific control of gene expression.Cell 152,1173−1183.(2013). Ran,F.A.,Hsu,P.D.,Lin,C.Y.,Gootenberg,J.S.,Konermann,S.,Trevino,A.E.,Scott,D.A.,Inoue,A.,Matoba,S.,Zhang,Y.,et al.Double nicking by RNA−guided CRISPR Cas9 for enhanced genome editing specificity.Cell 154,1380−1389.(2013). Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotech 30,460−465(2012). Sander,J.D.,Maeder,M.L.,Reyon,D.,Voytas,D.F.,Joung,J.K.,and Dobbs,D.ZiFiT(Zinc Finger Targeter):an updated zinc finger engineering tool.Nucleic Acids Res 38,W462−468.(2010). Sander,J.D.,Ramirez,C.L.,Linder,S.J.,Pattanayak,V.,Shoresh,N.,Ku,M.,Foden,J.A.,Reyon,D.,Bernstein,B.E.,Liu,D.R.,et al.In silico abstraction of zinc finger nuclease cleavage profiles reveals an expanded landscape of off−target sites.Nucleic Acids Res.(2013). Sander,J.D.,Zaback,P.,Joung,J.K.,Voytas,D.F.,and Dobbs,D.Zinc Finger Targeter(ZiFiT):an engineered zinc finger/target site design tool.Nucleic Acids Res 35,W599−605.(2007). Shen,B.et al.Generation of gene−modified mice via Cas9/RNA−mediated gene targeting.Cell Res(2013). Sugimoto,N.et al.Thermodynamic parameters to predict stability of RNA/DNA hybrid duplexes.Biochemistry 34,11211−11216(1995). Terns,M.P.& Terns,R.M.CRISPR−based adaptive immune systems.Curr Opin Microbiol 14,321−327(2011). Wang,H.et al.One−Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas−Mediated Genome Engineering.Cell 153,910−918(2013). Wiedenheft,B.,Sternberg,S.H.& Doudna,J.A.RNA−guided genetic silencing systems in bacteria and archaea.Nature 482,331−338(2012). Yang,L.,Guell,M.,Byrne,S.,Yang,J.L.,De Los Angeles,A.,Mali,P.,Aach,J.,Kim−Kiselak,C.,Briggs,A.W.,Rios,X.,et al.(2013).Optimization of scarless human stem cell genome editing.Nucleic Acids Res 41,9049−9061.

その他の実施形態 ここまで本発明をその詳細な説明と関連させて記載してきたが、上記説明は例示を目的とするものであり、添付の「特許請求の範囲」の範囲によって定められる本発明の範囲を限定するものではないことを理解するべきである。その他の態様、利点および改変は以下の特許請求の範囲内にある。

QQ群二维码
意见反馈