首页 / 国际专利分类库 / 化学;冶金 / 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程 / / 作用于酯键的水解酶 (3.1) / 変更PAM特異性を有する遺伝子操作CRISPR−Cas9ヌクレアーゼ

変更PAM特異性を有する遺伝子操作CRISPR−Cas9ヌクレアーゼ

申请号 JP2017546196 申请日 2016-03-03 公开(公告)号 JP2018506987A 公开(公告)日 2018-03-15
申请人 ザ ジェネラル ホスピタル コーポレイション; 发明人 ジョン,ジェー.キース; クレインスティヴァー,ベンジャミン;
摘要 変更および改善PAM特異性を有する遺伝子操作CRISPR−Cas9ヌクレアーゼならびにゲノム遺伝子操作、エピゲノミック遺伝子操作、およびゲノム標的化におけるその使用。
权利要求

以下の位置:G1104、S1109、L1111、D1135、S1136、G1218、N1317、R1335、T1337の1つ以上における突然変異を有する単離膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質。配列番号1のアミノ酸配列と少なくとも80%同一である配列を含む、請求項1に記載の単離タンパク質。以下の突然変異:G1104K;S1109T;L1111H;D1135V;D1135E;D1135N;D1335Y;S1136N;G1218R;N1317K;R1335E;R1335Q;およびT1337Rの1つ以上を含む、請求項1に記載の単離タンパク質。以下の突然変異:D1135E(D1135Eバリアント);D1135V/R1335Q/T1337R(VQRバリアント);D1135V/G1218R/R1335Q/T1337R(VRQRバリアント);D1135E/R1335Q/T1337R(EQRバリアント);D1135N/G1218R/R1335Q/T1337R(NRQRバリアント);D1135Y/G1218R/R1335Q/T1337R(YRQRバリアント);G1104K/D1135V/G1218R/R1335Q/T1337R(KVRQRバリアント);S1109T/D1135V/G1218R/R1335Q/T1337R(TVRQRバリアント);L1111H/D1135V/G1218R/R1335Q/T1337R(HVRQRバリアント);D1135V/S1136N/G1218R/R1335Q/T1337R(VNRQRバリアント);D1135V/G1218R/N1317K/R1335Q/T1337R(VRKQRバリアント);またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)を含む、請求項1〜3のいずれか一項に記載の単離タンパク質。D10、E762、D839、H983、またはD986;およびH840またはN863における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異をさらに含む、請求項1に記載の単離タンパク質。前記突然変異が、 (i)D10AまたはD10N、および (ii)H840A、H840N、またはH840Y である、請求項5に記載の単離タンパク質。以下の位置:E782、N968、および/またはR1015の1つ以上における突然変異を有する単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質。配列番号2のアミノ酸配列と少なくとも80%同一である配列を含む、請求項7に記載の単離タンパク質。以下の突然変異:R1015Q、R1015H、E782K、N968K、E735K、K929R、A1021T、K1044N、E782K/N968K/R1015H(KKHバリアント);E782K/K929R/R1015H(KRHバリアント);またはE782K/K929R/N968K/R1015H(KRKHバリアント)の1つ以上を含む、請求項7に記載の単離タンパク質。D10、D556、H557、および/またはN580における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異をさらに含む、請求項7に記載の単離タンパク質。前記突然変異が、D10A、D556A、H557A、N580A、例えば、D10A/H557Aおよび/またはD10A/D556A/H557A/N580Aである、請求項7に記載の単離タンパク質。任意選択の介在リンカーにより異種機能ドメインに融合されている請求項1〜11のいずれか一項に記載の単離タンパク質を含む融合タンパク質であって、前記リンカーが前記融合タンパク質の活性を妨害しない、融合タンパク質。前記異種機能ドメインが転写活性化ドメインである、請求項12に記載の融合タンパク質。前記転写活性化ドメインがVP64またはNF−κB p65からのものである、請求項12に記載の融合タンパク質。前記異種機能ドメインが転写サイレンサーまたは転写抑制ドメインである、請求項12に記載の融合タンパク質。前記転写抑制ドメインが、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)、またはmSin3A相互作用ドメイン(SID)である、請求項15に記載の融合タンパク質。前記転写サイレンサーがヘテロクロマチンタンパク質1(HP1)である、請求項15に記載の融合タンパク質。前記異種機能ドメインが、DNAのメチル化状態を改変する酵素である、請求項12に記載の融合タンパク質。前記DNAのメチル化状態を改変する前記酵素がDNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である、請求項18に記載の融合タンパク質。前記TETタンパク質がTET1である、請求項19に記載の融合タンパク質。前記異種機能ドメインが、ヒストンサブユニットを改変する酵素である、請求項12に記載の融合タンパク質。ヒストンサブユニットを改変する前記酵素が、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)、またはヒストンデメチラーゼである、請求項12に記載の融合タンパク質。前記異種機能ドメインが生物学的係留物である、請求項12に記載の融合タンパク質。前記生物学的係留物がMS2、Csy4またはラムダNタンパク質である、請求項23に記載の融合タンパク質。前記異種機能ドメインがFokIである、請求項12に記載の融合タンパク質。請求項1〜25のいずれか一項に記載のタンパク質をコードする単離核酸。請求項26に記載の単離核酸を含むベクター。請求項21に記載の単離核酸が、以下の位置:G1104、S1109、L1111、D1135、S1136、G1218、N1317、R1335、T1337の1つ以上における突然変異を有する単離膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質を発現させるための1つ以上の調節ドメインに作動可能に結合されている、請求項27に記載のベクター。請求項21に記載の単離核酸が、以下の位置:E782、N968、および/またはR1015の1つ以上における突然変異を有する単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質を発現させるための1つ以上の調節ドメインに作動可能に結合されている、請求項27に記載のベクター。請求項26に記載の核酸を含み、および任意選択的に請求項1〜25のいずれか一項に記載のタンパク質を発現する宿主細胞、好ましくは哺乳動物宿主細胞。細胞のゲノムを変更する方法であって、前記細胞中で、請求項1〜25のいずれか一項に記載の単離タンパク質または融合タンパク質、および前記細胞の前記ゲノムの選択部分に相補的な領域を有するガイドRNAを発現させるか、またはそれらと前記細胞を接触させることを含む方法。前記単離タンパク質または融合タンパク質が、核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む、請求項31に記載の方法。前記細胞が幹細胞である、請求項31に記載の方法。前記細胞が胚性幹細胞、間葉系幹細胞、もしくは誘導多能性幹細胞であるか、生存動物中に存在するか、または胚中に存在する、請求項33に記載の方法。二本鎖DNA(dsDNA)分子を変更する方法であって、前記dsDNA分子を、請求項1〜25のいずれか一項に記載の単離タンパク質または融合タンパク質、および前記dsDNA分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む方法。前記dsDNA分子がインビトロで存在する、請求項35に記載の方法。

说明书全文

優先権の主張 本出願は、2015年3月3日に出願された米国仮特許出願第61/127,634号明細書;2015年5月22日に出願された同第62/165,517号明細書;2015年10月9日に出願された同第62/239,737号明細書;および2015年11月20日に出願された同第62/258,402号明細書の利益を主張する。上記の全体の内容は、参照により本明細書に組み込まれる。

連邦政府による資金提供を受けた研究または開発 本発明は、National Institutes of Healthにより授与された助成金番号DP1GM105378、NIHR01GM107427、およびR01GM088040のもとで政府支援により作製された。政府は、本発明における一定の権利を有する。

本発明は、少なくとも部分的に、変更および改善されたプロトスペーサー隣接モチーフ(PAM)特異性を有する遺伝子操作クラスター化等間隔短鎖回文リピート(Clustered Regularly Interspaced Short Palindromic Repeats)(CRISPR)/CRISPR関連タンパク質9(Cas9)ヌクレアーゼならびにゲノム遺伝子操作、エピゲノミック遺伝子操作、およびゲノム標的化におけるその使用に関する。

CRISPR−Cas9ヌクレアーゼは、広範な生物および細胞タイプにおいて効率的でカスタマイズ可能なゲノム編集を可能とする(Sander&Joung,Nat Biotechnol 32,347−355(2014);Hsuet al.,Cell 157,1262−1278(2014);Doudna&Charpentier,Science 346,1258096(2014);Barrangou&May,Expert Opin Biol Ther 15,311−314(2015))。Cas9による標的部位認識は、crRNAおよびtracrRNA(Deltcheva et al.,Nature 471,602−607(2011);Jinek et al.,Science 337,816−821(2012))として公知の2つの短鎖RNAにより指向され、それらは、キメラ単一ガイドRNA(sgRNA)に融合させることができる(Jinek et al.,Science 337,816−821(2012);Jinek et al.,Elife 2,e00471(2013);Mali et al.,Science 339,823−826(2013);Cong et al.,Science 339,819−823(2013))。sgRNAの5’末端(crRNAに由来)は、標的DNA部位と塩基対合し得、それによりCas9/sgRNA複合体による部位特異的開裂の直接的な再プログラミングを許容する(Jinek et al.,Science 337,816−821(2012))。しかしながら、Cas9は、sgRNAと塩基対合するDNAに近接して存在する特異的プロトスペーサー隣接モチーフ(PAM)も認識しなければならず(Mojica et al.,Microbiology 155,733−740(2009);Shah et al.,RNA Biol 10,891−899(2013);Jinek et al.,Science 337,816−821(2012);Sapranauskas et al,Nucleic Acids Res 39,9275−9282(2011);Horvath et al.,J Bacteriol 190,1401−1412(2008))、その要件は、配列特異的認識を開始するために必要とされるが(Sternberg et al.,Nature 507,62−67(2014))、さらにゲノム編集のためのそれらのヌクレアーゼの標的化範囲を拘束し得る。広く使用される化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)は、短鎖NGG PAMを認識し(Jinek et al.,Science 337,816−821(2012);Jiang et al.,Nat Biotechnol 31,233−239(2013))、それは、ランダムDNA配列の8bpごとに1回生じる。対照的に、これまで特徴付けされている他のCas9オルソログは、より長鎖のPAMを認識し得る(Horvath et al.,J Bacteriol 190,1401−1412(2008);Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014);Esvelt et al.,Nat Methods 10,1116−1121(2013);Ran et al.,Nature 520,186−191(2015);Zhang et al.,Mol Cell 50,488−503(2013))。例えば、黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)は、ウイルス送達により良好に適するいくつかのより小さいCas9オルソログの1つであり(Horvath et al.,J Bacteriol 190,1401−1412(2008);Ran et al.,Nature 520,186−191(2015);Zhang et al.,Mol Cell 50,488−503(2013))、ランダムDNAの32bpごとに1回生じることが予測される、より長鎖のNNGRRT(配列番号46)PAMを認識する。Cas9オルソログの標的化範囲の拡大は、種々の用途、例として、小さい遺伝子エレメント(例えば、転写因子結合部位(Canver et al.Nature.;527(7577):192−7(2015);Vierstra et al.,Nat Methods.12(10):927−30(2015))の改変、またはPAM内の配列差異の位置決めによるアレル特異的変更(Courtney,D.G.et al.Gene Ther.23(1):108−12(2015)の実施に重要である。

本明細書に記載のとおり、一般に使用される化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)および黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)を、構造情報、細菌選択ベース指向進化、およびコンビナトリアル設計を使用して新規PAM配列を認識するように遺伝子操作した。これらの変更PAM特異性バリアントは、野生型SpCas9によってもSaCas9によっても効率的に標的化することができないゼブラフィッシュおよびヒト細胞中の内在性遺伝子部位のロバストな編集を可能とする。さらに、本発明者らは、非カノニカルNAGおよびNGA PAMを有する部位に対する低減した活性を保有する、ヒト細胞中で改善されたPAM特異性を示す別のSpCas9バリアントを同定および特徴付けした。さらに、本発明者らは、完全に異なるPAM特異性を有する2つのより小サイズのCas9オルソログ、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)Cas9(St1Cas9)および黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)が、本発明者らの細菌選択系およびヒト細胞中で効率的に機能することを見出し、それは、本発明者らの遺伝子操作方針を他の種からのCas9に拡張し得ることを示唆した。本発明者らの知見は、広く有用なSpCas9およびSaCas9バリアントを提供し、本明細書においてそれらをまとめて「バリアント(variants)」または「そのバリアント(the variants)」と称する。

第1の態様において、本発明は、例えば、配列番号1のアミノ酸配列と少なくとも80%同一である配列を含む、以下の位置:G1104、S1109、L1111、D1135、S1136、G1218、N1317、R1335、T1337の1つ以上における突然変異を有する単離膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質を提供する。一部の実施形態において、バリアントSpCas9タンパク質は、以下の突然変異:G1104K;S1109T;L1111H;D1135V;D1135E;D1135N;D1135Y;S1136N;G1218R;N1317K;R1335E;R1335Q;およびT1337Rの1つ以上を含む。一部の実施形態において、バリアントSpCas9タンパク質は、以下の突然変異:D1135;D1135V/R1335Q/T1337R(VQRバリアント);D1135E/R1335Q/T1337R(EQRバリアント);D1135V/G1218/R1335Q/T1337R(VRQRバリアント);D1135N/G1218R/R1335Q/T1337R(NRQRバリアント);D1135Y/G1218R/R1335Q/T1337R(YRQRバリアント);G1104K/D1135V/G1218R/R1335Q/T1337R(KVRQRバリアント);S1109T/D1135V/G1218R/R1335Q/T1337R(TVRQRバリアント);L1111H/D1135V/G1218R/R1335Q/T1337R(HVRQRバリアント);D1135V/S1136N/G1218R/R1335Q/T1337R(VNRQRバリアント);D1135V/G1218R/N1317K/R1335Q/T1337R(VRKQRバリアント);またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)を含む。

一部の実施形態において、バリアントSpCas9タンパク質は、D10、E762、D839、H983、またはD986;およびH840またはN863における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異を含む。

一部の実施形態において、突然変異は、(i)D10AまたはD10N、および(ii)H840A、H840N、またはH840Yである。

本明細書において、例えば、配列番号2のアミノ酸配列と少なくとも80%同一である配列を含む、以下の位置:E782、N968、および/またはR1015の1つ以上における突然変異を有する単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質も提供される。本明細書において、以下の位置:E735、E782、K929、N968、A1021、K1044および/またはR1015の1つ、2つまたは3つ以上における突然変異を有する単離黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質も提供される。一部の実施形態において、バリアントSaCas9タンパク質は、以下の突然変異:R1015Q、R1015H、E782K、N968K、E735K、K929R、A1021T、K1044Nの1つ以上を含む。一部の実施形態において、バリアントSaCas9タンパク質は、D10、D556、H557、および/またはN580における突然変異からなる群から選択される、ヌクレアーゼ活性を減少させる1つ以上の突然変異を含む。

一部の実施形態において、バリアントSaCas9タンパク質は、D10A、D556A、H557A、N580A、例えば、D10A/H557Aおよび/またはD10A/D556A/H557A/N580Aにおける突然変異を含む。

本明細書に記載のSpCas9バリアントは、以下の位置:D1135、G1218、R1335、T1337の1つ以上における突然変異を有する配列番号1のアミノ酸配列を含み得る。一部の実施形態において、SpCas9バリアントは、以下の突然変異:D1135V;D1135E;G1218R;R1335E;R1335Q;およびT1337Rの1つ以上を含み得る。一部の実施形態において、SpCas9バリアントは、以下の突然変異の組:D1135V/R1335Q/T1337R(VQRバリアント);D1135V/G1218R/R1335Q.T1337R(VRQRバリアント);D1135E/R1335Q/T1337R(EQRバリアント);またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)の1つを含み得る。

本明細書に記載のSaCas9バリアントは、以下の位置:E735、E782、K929、N968、R1015、A1021、および/またはK1044の1つ以上における突然変異を有する配列番号2のアミノ酸配列を含み得る。一部の実施形態において、SaCas9バリアントは、以下の突然変異:R1015Q、R1015H、E782K、N968K、E735K、K929R、A1021T、K1044Nの1つ以上を含み得る。一部の実施形態において、SaCas9バリアントは、以下の突然変異の組:E782K/N968K/R1015H(KKHバリアント);E782K/K929R/R1015H(KRHバリアント);またはE782K/K929R/N968K/R1015H(KRKHバリアント)の1つを含み得る。

本明細書において、任意選択の介在リンカーにより異種機能ドメインに融合されている本明細書に記載の単離バリアントSaCas9またはSpCas9タンパク質を含む融合タンパク質であって、リンカーが融合タンパク質の活性を妨害しない、融合タンパク質も提供される。一部の実施形態において、異種機能ドメインは転写活性化ドメインである。一部の実施形態において、転写活性化ドメインはVP64またはNF−κB p65からのものである。一部の実施形態において、異種機能ドメインは転写サイレンサーまたは転写抑制ドメインである。一部の実施形態において、転写抑制ドメインは、クルッペル関連ボックス(KRAB)ドメイン、ERFリプレッサードメイン(ERD)、またはmSin3A相互作用ドメイン(SID)である。一部の実施形態において、転写サイレンサーはヘテロクロマチンタンパク質1(HP1)、例えば、HP1αまたはHP1βである。一部の実施形態において、異種機能ドメインは、DNAのメチル化状態を改変する酵素である。一部の実施形態において、DNAのメチル化状態を改変する酵素はDNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質である。一部の実施形態において、TETタンパク質はTET1である。一部の実施形態において、異種機能ドメインは、ヒストンサブユニットを改変する酵素である。一部の実施形態において、ヒストンサブユニットを改変する酵素は、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(HMT)、またはヒストンデメチラーゼである。一部の実施形態において、異種機能ドメインは生物学的係留物である。一部の実施形態において、生物学的係留物はMS2、Csy4またはラムダNタンパク質である。一部の実施形態において、異種機能ドメインはFokIである。

本明細書において、任意選択的に、本明細書に記載のバリアントSaCas9またはSpCas9タンパク質の発現のための1つ以上の調節ドメインに作動可能に結合されている、本明細書に記載のバリアントSaCas9またはSpCas9タンパク質をコードする単離核酸、ならびに単離核酸を含むベクターも提供される。本明細書において、本明細書に記載の核酸を含み、および任意選択的に本明細書に記載のバリアントSaCas9またはSpCas9タンパク質を発現する宿主細胞、例えば哺乳動物宿主細胞も提供される。

本明細書において、細胞中で、本明細書に記載の単離バリアントSaCas9またはSpCas9タンパク質、および細胞のゲノムの選択部分に相補的な領域を有するガイドRNAを発現させることにより、細胞のゲノムを変更する方法も提供される。

本明細書において、細胞中で、バリアントタンパク質、および細胞のゲノムの選択部分に相補的な領域を有するガイドRNAを発現させることにより、細胞のゲノムを変更する、例えば、選択的に変更する方法も提供される。

細胞を、本明細書に記載のタンパク質バリアント、および細胞のゲノムの選択部分に相補的な領域を有するガイドRNAと接触させることにより、細胞のゲノムを変更する、例えば、選択的に変更する方法も提供される。

一部の実施形態において、単離タンパク質または融合タンパク質は、核局在化配列、細胞浸透ペプチド配列、および/または親和性タグの1つ以上を含む。

本明細書に記載の方法の一部の実施形態において、細胞は、幹細胞、例えば、胚性幹細胞、間葉系幹細胞、もしくは誘導多能性幹細胞であるか、生存動物中に存在するか、または胚、例えば、哺乳動物、昆虫、もしくは魚類(例えば、ゼブラフィッシュ)胚もしくは胚細胞中に存在する。

さらに、本明細書において、二本鎖DNA(dsDNA)分子を変更する方法、例えば、インビトロ方法が提供される。本方法は、dsDNA分子を、本明細書に記載のバリアントタンパク質の1つ以上、およびds分子の選択部分に相補的な領域を有するガイドRNAと接触させることを含む。

特に定義のない限り、本明細書において使用される全ての技術および科学用語は、本発明が属する技術分野の当業者により一般に理解されるものと同一の意味を有する。方法および材料は、本発明における使用のために本明細書に記載され、当技術分野において公知の他の好適な方法および材料を使用することもできる。材料、方法、および実施例は、説明のためのものにすぎず、限定するものではない。本明細書に挙げられる全ての刊行物、特許出願、特許、配列、データベースエントリー、および他の参照文献は、参照により全体として組み込まれる。矛盾する場合、本明細書が定義を含めて優先される。

本発明の他の特徴部および利点は、以下の詳細な説明および図面、ならびに特許請求の範囲から明らかである。

特許または出願書類は、有色の少なくとも1つの図面を含有する。色付きの図面を有するこの特許または特許出願刊行物の複写物は、請求および必要な手数料の支払い時に省庁により提供される。

図1A−J:変更PAM特異性を有するSpCas9バリアントの進化および特徴付け。a、PAM塩基への塩基特異的接触を作製するSpCas9残基の合理的突然変異は、U2OSヒト細胞ベース高感度緑色蛍光タンパク質(Enhanced Green Fluorescent Protein)(EGFP)崩壊アッセイにおいてPAM特異性を変更するには不十分である。崩壊頻度は、フローサイトメトリーにより定量し;バックグラウンド対照について観察された崩壊の平均レベルを、このおよび後続のパネル(c、g、h、およびj)について赤色破線により表し;エラーバーは、s.e.m.、n=3を表す。b、SpCas9のPAM特異性を変更するために使用された2プラスミド陽性選択アッセイの概略図。機能的Cas9/sgRNA複合体による陽性選択プラスミド内の標的部位の開裂は、細菌を選択培地上でプレーティングする場合に生存に必要である(図12A〜Bも参照)。c、NGA PAMを含有する標的部位を開裂し得るSpCas9バリアントについての陽性選択から得られた突然変異のコンビナトリアルアセンブリおよび試験。SpCas9バリアントは、NGGまたはNGA PAMのいずれかを含有する部位を標的化するsgRNAと対合させ、EGFP崩壊アッセイを使用して活性を評価した。エラーバーは、s.e.m.、n=3を表す。d、細菌を選択培地上でプレーティングする場合、選択プラスミドの開裂が細胞死をもたらす陰性選択アッセイの概略図。この系は、プロトスペーサーの3’末端に隣接するランダム化配列を含有するプラスミドのライブラリーの生成によりCas9のPAM特異性をプロファイリングするように適合させた(図13bも参照)。

図1A−J:変更PAM特異性を有するSpCas9バリアントの進化および特徴付け。e、2つのランダム化PAMライブラリー(それぞれ異なるプロトスペーサーを有する)についての野生型SpCas9の選択後PAM枯渇値(PPDV)の分散プロット。PAMをそれらの2番目/3番目/4番目の位置ごとにグループ化およびプロットした。赤色破線は、統計的に有意な枯渇についてのカットオフ(dCas9対照実験から得られた、図13c参照)を示し、灰色破線は5倍枯渇(0.2のPPDV)を表す。f、野生型SpCas9により認識されるものから区別されるPAMを認識するVQRおよびEQR SpCas9バリアントについてのPPDV分散プロット。

図1A−J:変更PAM特異性を有するSpCas9バリアントの進化および特徴付け。g、NGANおよびNGNG PAMを有する部位に対する野生型、VQR、およびEQR SpCas9についてのEGFP崩壊頻度。エラーバーは、s.e.m.、n=3を表す。h、NGCG PAMを含有する標的部位を開裂し得るSpCas9バリアントについての陽性選択から得られた突然変異のコンビナトリアルアセンブリおよび試験。NGGGまたはNGCG PAMのいずれかを含有する部位を標的するsgRNAを、EGFP崩壊アッセイを使用してCas9標的化について評価した。エラーバーは、s.e.m.、n=3を表す。i、VRERバリアントについてのPPDV分散プロット。

図1A−J:変更PAM特異性を有するSpCas9バリアントの進化および特徴付け。j、NGCNおよびNGNG PAMを有する部位に対する野生型およびVRER SpCas9についてのEGFP崩壊頻度。エラーバーは、s.e.m.、n=3を表す。

進化PAM特異性を有するSpCas9バリアントは、ゼブラフィッシュ胚およびヒト細胞中の内在性部位をロバストに改変する。a、NGAG PAMを担持する内在性遺伝子部位に対する野生型またはVQR SpCas9により誘導されたゼブラフィッシュ胚における突然変異誘発頻度の定量。突然変異頻度は、T7E1アッセイを使用して決定し;エラーバーは、s.e.m.、n=5から9つの個々の胚を表す。b、NGAG、NGAT、およびNGAA PAMを含有する部位に標的化されるsgRNAについての4つの内在性ヒト遺伝子中の16個の標的部位におけるT7E1アッセイにより定量されたVQRバリアントの突然変異頻度。エラーバーは、s.e.m.、n=3を表す。

進化PAM特異性を有するSpCas9バリアントは、ゼブラフィッシュ胚およびヒト細胞中の内在性部位をロバストに改変する。c.NGA PAMを有する内在性ヒト遺伝子標的部位に対する野生型SpCas9の突然変異頻度。容易な比較のため、同一のsgRNAを使用するVQRバリアントについての突然変異頻度をここで再提示する(パネルbに示される同一のデータ)。エラーバーは、s.e.m.、n=3を表し;n.d.は、T7E1により検出不能であることを表す。d、T7E1アッセイにより定量された3つの内在性ヒト遺伝子中のNGCG PAMを含有する9つの標的部位における野生型、VRER、およびVQR SpCas9の突然変異頻度。19および20ntのsgRNA相補性長さを使用し;エラーバーは、s.e.m.、n=3を表す。

進化PAM特異性を有するSpCas9バリアントは、ゼブラフィッシュ胚およびヒト細胞中の内在性部位をロバストに改変する。e、野生型、VQR、およびVRER SpCas9により標的化可能な20ntのスペーサーを有するヒトゲノム中の部位数の表示。f、パネルbおよびdからのsgRNAを使用するVQRおよびVRER SpCas9バリアントについてのGUIDE−seqにより同定されたオフターゲット開裂部位の数。

D1135E突然変異は、SpCas9のPAM認識およびスペーサー特異性を改善する。a、2つのランダム化PAMライブラリーについての野生型およびD1135E SpCas9(それぞれ左および右パネル)についてのPPDV分散プロット。PAMをそれらの2番目/3番目/4番目の位置ごとにグループ化およびプロットした。野生型SpCas9について示されるデータは、図1dからのプロットと同一であり、容易な比較のためここで再提示する。赤色破線は、統計的に有意に枯渇するPAMを示し(図13c参照)、灰色破線は、5倍枯渇カットオフ(0.2のPPDV)を示す。b、ヒト細胞中のNGG、NAG、およびNGA PAMを含有する部位に対する野生型およびD1135E SpCas9のEGFP崩壊活性。崩壊頻度は、フローサイトメトリーにより定量し;バックグラウンド対照について観察された崩壊の平均レベルを、このパネルおよび(d)について赤色破線により表し;エラーバーは、s.e.m.、n=3を表し;活性の平均倍率変化を示す。c、ヒト細胞中の6つの内在性部位における野生型およびD1135E SpCas9についてのT7E1により検出された突然変異誘発頻度。エラーバーは、s.e.m.、n=3を表し;活性の平均変化倍率を示す。

D1135E突然変異は、SpCas9のPAM認識およびスペーサー特異性を改善する。d、ヒト細胞中のEGFP崩壊実験についての形質移入野生型またはD1135E SpCas9コードプラスミドの量のタイトレーション。これらの実験の全てに使用されたsgRNAプラスミドの量は、250ngに固定した。異なるEGFP部位を標的化する2つのsgRNAを使用し;エラーバーは、s.e.m.、n=3を表す。e、野生型およびD1135E SpCas9を使用する3つのsgRNAについてのオンおよびオフターゲット部位の標的化ディープシーケンシング。オンターゲット部位を上段に示し、オフターゲット部位を下段に、オンターゲットに対するミスマッチを強調して列記する。オンターゲット部位における活性の変化よりも大きい、オフターゲット部位における野生型SpCas9に対するD1135Eについての活性の倍率減少を緑色で強調し;それぞれのアンプリコンについての対照インデルレベルを報告する。f、野生型SpCas9について観察されたインデル頻度に対するD1135Eを使用するオンおよびオフターゲティング部位における活性の減少倍率としてプロットされた標的化ディープシーケンシングデータのまとめ。

D1135E突然変異は、SpCas9のPAM認識およびスペーサー特異性を改善する。g、野生型SpCas9を使用するオフターゲット部位におけるリードカウントに対するD1135Eを使用する特異性の正規化変化倍率としてプロットされたそのオフターゲット部位における野生型およびD1135E間の特異性のGUIDE−seq検出変化のまとめ(図18cも参照)。D1135Eについてのリードカウントを有さない部位における特異性の推定増加倍率は、プロットしない(図18c参照)。

細菌およびヒト細胞中のSt1Cas9およびSaCas9オルソログの特徴付け。a、2つのランダム化PAMライブラリーを使用するSt1Cas9についてのPPDVの分散プロット。PAMをそれらの3番目/4番目/5番目/6番目の位置ごとにグループ化およびプロットした。20および21ヌクレオチドのsgRNA相補性長さを使用して両方のライブラリーについてSt1Cas9をプログラミングした(それぞれ左および右パネル)。赤色破線は、統計的に有意に枯渇するPAMを示し(図13c参照)、灰色破線は、5倍枯渇(0.2のPPDV)を示し;αは、生物情報学的アプローチにより既に予測されたPAM

27であり;βは、ストリンジェントな実験条件下で既に同定されたPAM

20であり;*は、本試験において発見された新規PAMであり;γは、モデレートな実験条件下で既に同定されたPAM

20である。b、2つのランダム化PAMライブラリーを使用するSaCas9についてのPPDV分散プロット。PAMをそれらの3番目/4番目/5番目/6番目の位置ごとにグループ化およびプロットした。21および23ヌクレオチドのsgRNA相補性長さを使用して両方のライブラリーについてSaCas9をプログラミングした(それぞれ左および右パネル)。SaCas9について同定されたPAMを示し、PAM1〜3は、それらの実験において使用されたスペーサーおよびスペーサー長の全ての組合せにわたり一貫して枯渇した。

細菌およびヒト細胞中のSt1Cas9およびSaCas9オルソログの特徴付け。c、x軸上に示される、異なる標的部位およびPAMを保有する選択プラスミドをチャレンジした場合の細菌陽性選択におけるSt1Cas9およびSaCas9の生存割合。St1Cas9およびSaCas9についてのパネル(a)および(b)からの高度に枯渇したPAMを陽性選択プラスミドにおける標的部位に使用した。d、e、NNAGAA(配列番号3)またはNNGGGT(配列番号4)/NNGAGT(配列番号5)PAMをそれぞれ含有するEGFP中の部位に対するSt1Cas9(パネルd)またはSaCas9(パネルe)のEGFP崩壊活性。同一部位についての異なる長さのマッチsgRNAを示し;崩壊頻度をフローサイトメトリーにより定量し;陰性対照について得られたEGFP崩壊の平均頻度を赤色破線により表し;エラーバーは、s.e.m.、n=3を表す。f、g、NNAGAA(配列番号3)またはNNGGGT(配列番号4)/NNGAGT(配列番号5)/NNGAAT(配列番号6)PAMをそれぞれ含有する4つの内在性ヒト遺伝子中の部位におけるT7E1アッセイにより定量されたSt1Cas9(パネルf)およびSaCas9(パネルg)の突然変異頻度。エラーバーは、s.e.m.、n=3を表し;n.d.は、T7E1により検出不能であることを表す。

図5A−J:本試験において使用されたプラスミドの配列およびマップ。

図5A−J:本試験において使用されたプラスミドの配列およびマップ。

図5A−J:本試験において使用されたプラスミドの配列およびマップ。

図5A−J:本試験において使用されたプラスミドの配列およびマップ。

図5A−J:本試験において使用されたプラスミドの配列およびマップ。

SaCas9のPAM相互作用残基を予測するためのCas9オルソログのアラインメント。SpCas9、SaCas9、および11個の他のCas9オルソログのPAM相互作用ドメインをアラインし、SpCas9について公知のものに基づきSaCas9中のPAM接触残基を同定した。上段、上段、化膿性連鎖球菌(S.Pyogenes)、配列番号1、次いでそれぞれ配列番号29〜40のアミノ酸1229〜1368。

細菌スクリーンにおける異なるPAMに対する活性について評価されたSaCas9中の置換。図6からのアラインメントに基づき、単一アミノ酸置換を細菌陽性選択において試験してカノニカルNNGAGT(配列番号5)および非カノニカルNNAAGT(配列番号41)およびNNAGGT(配列番号42)PAMに対する活性に対する効果についてスクリーニングした。選択培地上の細菌コロニーは、SaCas9バリアントが示されるPAMを含有する部位に対する活性を有することを示唆する。

図8A−B:SaCas9バリアントがNNARRT(配列番号43)PAMを標的化することを可能とするアミノ酸置換のまとめ。NNARRT(配列番号43)PAMを含有する部位に対する細菌中の生存を可能とした52個の選択突然変異SaCas9クローンのPAM相互作用ドメインのアミノ酸配列;提示される配列は、表6に示される配列番号53〜104の部分配列である。

図8A−B:SaCas9バリアントがNNARRT(配列番号43)PAMを標的化することを可能とするアミノ酸置換のまとめ。NNARRT(配列番号43)PAMを含有する部位に対する細菌中の生存を可能とした52個の選択突然変異SaCas9クローンのPAM相互作用ドメインのアミノ酸配列;提示される配列は、表6に示される配列番号53〜104の部分配列である。

野生型および遺伝子操作SaCas9バリアントのヒト細胞活性。野生型、KKQ、およびKKH SaCas9の活性を、NNRRRT(配列番号45)PAMを含有する部位に対してヒト細胞EGFPレポーターアッセイにおいて評価した。

細菌中の非カノニカルPAMに対するSaCas9活性、およびR1015における指向突然変異の、同一の非カノニカルPAMに対する活性への影響の仕方。

遺伝子操作バリアントは、形態NNNRRTのPAMを認識し得る。

12A−B:SpCas9の変更PAM特異性バリアントを遺伝子操作するために使用された細菌ベース陽性選択。a、図1bからの陽性選択の拡大概略図(左パネル)、およびSpCas9が陽性選択において予測されるとおりに挙動するバリデーション(右パネル)。スペーサー1、配列番号105;スペーサー2、配列番号106。

12A−B:SpCas9の変更PAM特異性バリアントを遺伝子操作するために使用された細菌ベース陽性選択。b、変更PAM認識特異性を有するSpCas9バリアントを選択するように陽性選択を適合させた方法の概略図。ランダム化PAM相互作用(PI)ドメイン(残基1097〜1368)を有するSpCas9クローンのライブラリーを、変更PAMを保有する選択プラスミドによりチャレンジする。陽性選択プラスミドを開裂することにより選択で生存するSpCas9バリアントをシーケンシングして変更PAM特異性を可能とする突然変異を決定した。

図13A−D:Cas9ヌクレアーゼの全体PAM特異性をプロファイリングするための細菌細胞ベース部位枯渇アッセイ。a、図1dからの陰性選択を説明する拡大概略図(左パネル)、および野生型SpCas9が、機能的(NGG)および非機能的(NGA)PAMを有する部位のスクリーンにおいて予測されるとおりに挙動するバリデーション(右パネル)。

図13A−D:Cas9ヌクレアーゼの全体PAM特異性をプロファイリングするための細菌細胞ベース部位枯渇アッセイ。b、陰性選択を部位枯渇アッセイとして使用し、PAMに代えて6つのランダム化塩基対を含有する陰性選択プラスミドライブラリーを構築することにより機能的PAMについてスクリーニングした方法の概略図。目的のCas9/sgRNAにより開裂されるPAMを含有する選択プラスミドは枯渇する一方、開裂されない(または不十分に開裂される)PAMは保持される。選択後のPAMの頻度を出発ライブラリーにおけるそれらの選択前頻度と比較して選択後PAM枯渇値(PPDV)を計算する。スペーサー1、配列番号105;スペーサー2、配列番号106。

図13A−D:Cas9ヌクレアーゼの全体PAM特異性をプロファイリングするための細菌細胞ベース部位枯渇アッセイ。c、d、統計的に有意なPPDVについてのカットオフは、2つのランダム化PAMライブラリーについて触媒的に不活性なSpCas9(dCas9)についてのPAMのPPDVをプロットすることにより確立した(それらの2番目/3番目/4番目の位置ごとにグループ化およびプロットした(c)。2つのライブラリーについての平均PPDVから3.36標準偏差の閾値が計算され((d)中の赤線)、0.85未満の任意のPPDV偏差が、dCas9処理((c)中の赤色破線)と比較して統計的に有意であることを確立した。(c)中の灰色破線は、アッセイにおける5倍枯渇(0.2のPPDV)を示す。

部位枯渇アッセイおよびEGFP崩壊活性間の一致。データ点は、対応するPAMについてライブラリー1および2について観察された平均PPDV(図1f)に対してプロットされたVQRおよびEQR SpCas9バリアント(図1g)についての2つのNGANおよびNGNG PAM部位の平均EGFP崩壊を表す。赤色破線は、統計的に有意に枯渇するPAMを示し(0.85のPPDV、図13c参照)、灰色破線は、5倍枯渇(0.2のPPDV)を表す。平均値を95%信頼区間でプロットする。

NGAG PAMを含有する内在性ゼブラフィッシュ部位におけるVQR SpCas9バリアントにより誘導された挿入または欠失突然変異。それぞれの標的遺伝子座について、野生型配列を上段に示し、プロトスペーサーを黄色で強調し(相補鎖上に存在する場合、緑色で強調する)、PAMを赤色下線文字として標識する。欠失を灰色で強調された赤色破線として示し、挿入を青色で強調された小文字として示す。それぞれのインデル突然変異により引き起こされる長さの正味の変化を右側に示す(+、挿入;−、欠失)。一部の変更が配列の両方の挿入および欠失を有し、それらの例において、変更を括弧内に列記することに留意されたい。それぞれの突然変異アレルが回復した回数の数(2回以上の場合)を括弧内に示す。

16A−B:野生型SpCas9およびその進化バリアントにより標的化される内在性遺伝子。a、野生型、VQR、およびVRER SpCas9により標的化される配列をそれぞれ青色、赤色、および緑色で示す。T7E1のためのこれらの遺伝子座を増幅するために使用されたsgRNAおよびプライマーの配列を以下の表1および2に提供する。

16A−B:野生型SpCas9およびその進化バリアントにより標的化される内在性遺伝子。b、4つの異なる内在性ヒト遺伝子(上段パネル中の注釈に対応)におけるNGG PAMを担持する8つの標的部位における野生型SpCas9についてのT7E1により検出された平均突然変異誘発頻度。エラーバーは、s.e.m.、n=3を表す。

図17A−B:GUIDE−seqを使用して決定されたVQRおよびVRER SpCas9バリアントの特異性プロファイル。設定オンターゲット部位を黒色四により標識し、オフターゲット部位内のミスマッチ位置を強調する。a、VQRバリアントの特異性を、ヒト細胞においてNGA PAMを含有する内在性部位を標的化することにより評価した:EMX1部位4(配列番号142)、FANCF部位1(配列番号143)、FANCF部位3(配列番号144)、FANCF部位4(配列番号145)、RUNX1部位1(配列番号146)、RUNX1部位3(配列番号147)、VEGFA部位1(配列番号148)、およびZSCAN2(配列番号149)。

図17A−B:GUIDE−seqを使用して決定されたVQRおよびVRER SpCas9バリアントの特異性プロファイル。設定オンターゲット部位を黒色四角により標識し、オフターゲット部位内のミスマッチ位置を強調する。b、VRERバリアントの特異性を、ヒト細胞においてNGCG PAMを含有する内在性部位を標的化することにより評価した:FANCF部位3(配列番号150)、FANCF部位4(配列番号151)、RUNX1部位1(配列番号152)、VEGFA部位1(配列番号153)、およびVEGFA部位2(配列番号154)。

図18A−C:GUIDE−seqにより検出されたオフターゲット部位におけるD1135Eおよび野生型SpCas9間の活性差異。a、制限断片長多型分析により推定されたオンターゲット部位におけるオリゴタグインテグレーションの平均頻度。エラーバーは、s.e.m.、n=4を表す。b、T7E1により検出されたオンターゲット部位における平均突然変異誘発頻度。エラーバーは、s.e.m.、n=4を表す。

図18A−C:GUIDE−seqにより検出されたオフターゲット部位におけるD1135Eおよび野生型SpCas9間の活性差異。c、3つの内在性ヒト細胞部位(EMX1部位3(配列番号155);ZNF629部位(配列番号156)、VEGFA部位3(配列番号157))における野生型SpCas9およびD1135E間のGUIDE−seqリードカウント差異。オンターゲット部位を上段に示し、オフターゲット部位を下段に列記し、ミスマッチを強調する。表中、オフターゲット活性とオンターゲット部位との比を野生型およびD1135E間で比較して特異性の正規化変化倍率を計算する(特異性の増加を緑色で強調する)。検出可能なGUIDE−seqリードを有さない部位について、1の値を割り当てて推定特異性変化を計算した(橙色で示す)。図3eにおけるディープシーケンシングにより分析されたオフターゲット部位をEMX1部位3およびVEGFA部位3オフターゲット部位の左に番号付けした。

図19A−F:St1Cas9およびSaCas9についての追加のPAMならびにヒト細胞中のスペーサー長さに基づく活性。a、スペーサー1(上段パネル)またはスペーサー2(下段パネル)についてのランダム化PAMライブラリーについて得られた20および21ヌクレオチドのsgRNA相補性長さを比較するSt1Cas9についてのPPDV分散プロット。PAMをそれらの3番目/4番目/5番目/6番目の位置ごとにグループ化およびプロットした。赤色破線は、統計的に有意に枯渇するPAMを示し(図13c参照)、灰色破線は、5倍枯渇(0.2のPPDV)を表す。b、4つのそれぞれの試験条件下でのSt1Cas9についての0.2未満のPPDVを有するPAMの表。左に示されるPAM番号付けは、図4aと同一である。c、スペーサー1(上段パネル)またはスペーサー2(下段パネル)についてのランダム化PAMライブラリーについて得られた21および23ヌクレオチドのsgRNA相補性長さを比較するSaCas9についてのPPDV分散プロット。PAMをそれらの3番目/4番目/5番目/6番目の位置ごとにグループ化およびプロットした。赤色および灰色破線は、(a)のものと同一である。

図19A−F:St1Cas9およびSaCas9についての追加のPAMならびにヒト細胞中のスペーサー長さに基づく活性。d、4つのそれぞれの試験条件下でのSaCas9についての0.2未満のPPDVを有するPAMの表。PAM番号付けは、図4bのものと同一である。

図19A−F:St1Cas9およびSaCas9についての追加のPAMならびにヒト細胞中のスペーサー長さに基づく活性。e、f、EGFP崩壊を介する種々のスペーサー長さにわたるSt1Cas9およびSaCas9のヒト細胞活性(パネルe、図4d、4eからのデータ)ならびにT7E1により検出された内在性遺伝子突然変異誘発(パネルf、図4f、4gからのデータ)。全てのレプリケートについての活性を示し(n=3または4);バーは、平均および95%信頼区間を説明し;スペーサー長さごとの部位の数を示す。

20A−B:SpCas9によるPAM認識におけるD1135、G1218、およびT1337の構造的および機能的役割。a、PAM認識に関与する6つの残基の構造表示。左パネルは、PAM15の3番目の塩基位置への媒介性副溝接触を作製する残基であるS1136へのD1135の近接性を説明する。右パネルはPAM15の3番目の塩基位置への直接の塩基特異的な主溝接触を作製する残基であるR1335へのG1218、E1219、およびT1337の近接性を説明する。オングストローム距離を黄色破線により示し;PAMの非標的鎖グアニン塩基dG2およびdG3を青色で示し;他のDNA塩基を橙色で示し;水分子を赤色で示し;PDB:4UN3からPyMOLを使用して画像を作成した。b、PAM認識に関与するSpCas9中の6つの残基の突然変異分析。それぞれの位置における3つのタイプの突然変異の1つを含有するクローンをEGFP崩壊について試験し、NGG PAMを保有する部位に2つのsgRNAを標的化させた。それぞれの位置について、本発明者らは、1つのアラニン置換および2つの非保存的突然変異を作出した。S1136およびR1335は、PAM15の3番目のグアニンへの接触を媒介することが既に報告され、D1135、G1218、E1219、およびT1337は、本試験において報告される。EGFP崩壊活性をフローサイトメトリーにより定量し;バックグラウンド対照を赤色破線により表し;エラーバーは、s.e.m.、n=3を表す。

図21A−F:変更PAM特異性を有するSaCas9バリアントの選択およびアセンブリ。(a)SpCas9およびSaCas9を強調したCas9オルソログの系統樹。(b)細菌陽性選択アッセイにおいて評価された単一アミノ酸置換を有するSaCas9バリアントの活性(図31bも参照)。エラーバーは、s.e.m.、n=3を表し;NS=生存なし。(c)野生型およびR1015H SaCas9のヒト細胞活性。EGFP崩壊活性をフローサイトメトリーにより定量し;エラーバーは、s.e.m、n=3を表し、バックグラウンドEGFP損失の平均レベルを赤色破線により表す(このおよびパネルeについて)。

図21A−F:変更PAM特異性を有するSaCas9バリアントの選択およびアセンブリ。(d)変更PAM特異性を有するSaCas9バリアントについて選択した場合にそれぞれのアミノ酸位置において観察された置換の総数。R1015における出発突然変異は、カウントしない。(e)変更PAM特異性について選択した場合に観察された突然変異を含有するバリアントのヒト細胞EGFP崩壊活性。

図21A−F:変更PAM特異性を有するSaCas9バリアントの選択およびアセンブリ。(f)野生型SaCas9対KKHバリアントの平均選択後PAM枯渇値(PPDV)分散プロット(n=2、図34cも参照)。PAMに代えて異なるプロトスペーサーおよび8つのランダム化塩基対を有する2つのライブラリーを使用して、いずれのPAMがそれぞれのCas9により標的化可能であるかを決定した。統計的に有意な枯渇を赤色破線により示し(dCas9対照に対して、図34aおよび34b参照)、5倍枯渇を灰色破線により示す。

図22A−F:ヒト細胞中の内在性部位に標的化されるSaCas9 KKHバリアントの活性。(a)T7E1アッセイにより決定された、KKH SaCas9により誘導されたNNNRRT PAMを担持する55個の異なる部位にわたる突然変異誘発頻度。エラーバーは、s.e.m.、n=3を表し、NDは、T7E1アッセイにより検出不能であることを表す。

図22A−F:ヒト細胞中の内在性部位に標的化されるSaCas9 KKHバリアントの活性。(b)PAMの3番目の位置についてのKKHバリアント優先性。パネルaのデータからの平均活性を、このならびにパネルbおよびcについて示す。(c)PAMの4番目および5番目の位置についてのKKHバリアント優先性。(d)KKH SaCas9バリアントのスペーサー長さ優先性。(e)NNNRRT PAMを含有する種々の部位に標的化される野生型およびKKH SaCas9のヒト細胞EGFP崩壊活性の比較。EGFP崩壊をフローサイトメトリーにより定量し;エラーバーは、s.e.m、n=3を表し、バックグラウンドEGFP損失の平均レベルを赤色破線により表す。

図22A−F:ヒト細胞中の内在性部位に標的化されるSaCas9 KKHバリアントの活性。(f)パネルaからの16個の考えられるNNNRRT部位(最大KKH活性を有する部位を選択した)のそれぞれについての1つの部位に対する野生型SaCas9の突然変異誘発頻度。エラーバーは、s.e.m.、n=3を表し、NDは、T7E1アッセイにより検出不能であることを表す。

図23A−E:野生型およびKKH SaCas9のゲノムワイド特異性プロファイル。(a)EMX部位1(配列番号158)およびVEGF部位8(配列番号159)におけるオフターゲットの総数(パネルa)およびそれぞれのオフターゲット部位において観察されたミスマッチ(パネルb)により表される、NNGRRT(配列番号46)PAMを含有する部位に標的化される野生型およびKKH SaCas9の直接比較。パネルbおよびeについて、それぞれの部位におけるGUIDE−seqリードカウントを示し;オンターゲット配列を黒色の枠により標識し;オフターゲット部位内のミスマッチ位置を強調し;配列を細胞タイプ特異的SNPについて補正し;潜在的なsgRNAまたはDNAバルジヌクレオチドを有する部位を小さい赤色で縁取った塩基または破線によりそれぞれ示す。

図23A−E:野生型およびKKH SaCas9のゲノムワイド特異性プロファイル。(b)EMX部位1(配列番号158)およびVEGF部位8(配列番号159)におけるオフターゲットの総数(パネルa)およびそれぞれのオフターゲット部位において観察されたミスマッチ(パネルb)により表される、NNGRRT(配列番号46)PAMを含有する部位に標的化される野生型およびKKH SaCas9の直接比較。パネルbおよびeについて、それぞれの部位におけるGUIDE−seqリードカウントを示し;オンターゲット配列を黒色の枠により標識し;オフターゲット部位内のミスマッチ位置を強調し;配列を細胞タイプ特異的SNPについて補正し;潜在的なsgRNAまたはDNAバルジヌクレオチドを有する部位を小さい赤色で縁取った塩基または破線によりそれぞれ示す。

図23A−E:野生型およびKKH SaCas9のゲノムワイド特異性プロファイル。(c)VEGFA部位8における野生型およびKKH SaCas9によるオフターゲット部位開裂における差異を強調するベン図。(d)オフターゲットの総数(パネルd)およびそれぞれのオフターゲット部位において観察されたミスマッチ(パネルe)により表される、NNHRRT(配列番号44)PAMを含有する部位、EMX部位1(配列番号160)、EMX部位4(配列番号161)、EMX部位10(配列番号162)、FANCF部位9(配列番号163)、およびFANCF部位16(配列番号164)に標的化されるKKHバリアントの特異性プロファイル。

図23A−E:野生型およびKKH SaCas9のゲノムワイド特異性プロファイル。(e)オフターゲットの総数(パネルd)およびそれぞれのオフターゲット部位において観察されたミスマッチ(パネルe)により表される、NNHRRT(配列番号44)PAMを含有する部位、EMX部位1(配列番号160)、EMX部位4(配列番号161)、EMX部位10(配列番号162)、FANCF部位9(配列番号163)、およびFANCF部位16(配列番号164)に標的化されるKKHバリアントの特異性プロファイル。

細菌2プラスミドスクリーンにおけるVQR誘導体クローンの活性。NGAN PAMを含有する細菌中の部位に対する24個の異なるVQR誘導体バリアントの試験。非選択プレートに対する選択プレート上の生存率は、示されるPAMに対する活性を示す。

SpCas9−VQR誘導体のヒト細胞EGFP崩壊活性。SpCas9バリアントのEGFP崩壊活性は、示されるPAMを含有する部位に対する活性の尺度である。

SpCas9−VQRおよび−VRQRバリアントのヒト細胞EGFP崩壊活性。SpCas9バリアントのEGFP崩壊活性は、示されるPAMを含有する部位に対する活性の尺度である。

細菌2プラスミドスクリーンにおけるSpCas9−VRQR誘導体バリアントの活性。VQRおよびVRQRバリアントと比較した、NGAN PAMを含有する細菌中の部位に対する12個の異なるVQR誘導体バリアントの試験。非選択プレートに対する選択プレート上の生存率は、示されるPAMに対する活性を示す。

SpCas9−VRQRバリアントのヒト細胞EGFP崩壊活性。SpCas9バリアントのEGFP崩壊活性は、示されるPAMを含有する部位に対する活性の尺度である。

Cas9オルソログ(図21aからのもの)のタンパク質ドメインアラインメント。SpCas9のドメイン構造を上段に示し(PDB:4UN3;Anders et al.,2014に基づく);SpCas9のPAM接触残基を強調し;変更PAM特異性バリアントを選択するために突然変異させたSaCas9の領域を示す。

PAM相互作用残基の同定のためのCas9オルソログの一次配列アラインメント;それぞれ配列番号165〜176。PAMへの接触に重要であることが既に同定されたSpCas9残基(Anders et al.,2014;実施例1〜2)を青色で強調し、SaCas9のPAM特異性をモジュレートし得る残基(本試験において同定)を橙色で強調し、R1015に隣接する正荷電残基を黄色で強調する。構造予測されたSpCas9のPAM相互作用ドメインを青色破線により強調し(PDBに基づく:4UN3;Anders et al.,2014)、PCR突然変異誘発についてのバウンダリーとして使用されるSaCas9 PAM相互作用ドメインの保守的推定を橙色破線により示す。

PAM相互作用残基の同定のためのCas9オルソログの一次配列アラインメント;それぞれ配列番号165〜176。PAMへの接触に重要であることが既に同定されたSpCas9残基(Anders et al.,2014;実施例1〜2)を青色で強調し、SaCas9のPAM特異性をモジュレートし得る残基(本試験において同定)を橙色で強調し、R1015に隣接する正荷電残基を黄色で強調する。構造予測されたSpCas9のPAM相互作用ドメインを青色破線により強調し(PDBに基づく:4UN3;Anders et al.,2014)、PCR突然変異誘発についてのバウンダリーとして使用されるSaCas9 PAM相互作用ドメインの保守的推定を橙色破線により示す。

図31A−B:細菌陽性選択アッセイの概略図。(a)選択プラスミドは、代替PAM配列を認識し得るCas9バリアントについてスクリーニングするように改変することができる。(b)陽性選択プラスミドの概略図(左パネル)、および陽性選択において機能的または非機能的Cas9/sgRNAペアをスクリーニングする場合に予測される帰結(右パネル)。

KNHおよびKKHバリアントへのK929R突然変異の追加。EGFP崩壊活性をフローサイトメトリーにより定量し;エラーバーは、s.e.m、n=3を表し、バックグラウンドEGFP損失の平均レベルを赤色破線により表す。

細菌部位枯渇アッセイの概略図。野生型またはKKH SaCas9による開裂が生じないPAMに代えて8つのランダム化ヌクレオチドを有する部位枯渇プラスミドをシーケンシングする。ライブラリー1スペーサー配列、配列番号105;ライブラリー2スペーサー配列、配列番号106。標的化可能なPAMは、選択後PAM枯渇値(PPDV)として計算されたインプットライブラリーに対するそれらの枯渇により推定する。

34A−E:野生型およびKKH SaCas9についての部位枯渇アッセイ結果。(a)両方のライブラリーに対するdCas9対照実験についてのPPDV値。赤色破線は、統計的有意性を示し(PPDV=0.794、パネルb参照);灰色破線は、5倍枯渇を示し;PAMの3番目/4番目/5番目/6番目の位置を含むウインドウについてPPDVをプロットする(このおよびパネルcについて)。(b)統計的に有意な選択後PAM枯渇値(PPDV)をパネルaにおけるdCas9対照実験から決定した。統計的有意性は、標準偏差の3.36倍において閾値を設定することにより決定した。

34A−E:野生型およびKKH SaCas9についての部位枯渇アッセイ結果。(c)PAMに代えて8つのランダム化ヌクレオチドを含有する2つのライブラリーのそれぞれについての野生型およびKKH SaCas9についてのPPDVの比較。

34A−E:野生型およびKKH SaCas9についての部位枯渇アッセイ結果。(d)PAMおよび全てのPAMについての対応するPPDV値は、野生型およびKKH SaCas9についてそれぞれ5倍超枯渇した。配列モチーフをPAMについて2つのカテゴリーで示す:1)10倍超または2)5〜10倍枯渇。(e)PAMおよび全てのPAMについての対応するPPDV値は、野生型およびKKH SaCas9についてそれぞれ5倍超枯渇した。配列モチーフをPAMについて2つのカテゴリーで示す:1)10倍超または2)5〜10倍枯渇。

図35A−D:KKH SaCas9により標的化される内在性部位の追加の特徴。(a)NNNRRT PAMの16個の考えられるNRRモチーフに基づきビン化された、55個の内在性部位sgRNAのそれぞれについての活性。図2aからの平均活性を、このならびにパネルbおよびcについて示す。(b)スペーサーおよびPAMのそれぞれの内在性遺伝子崩壊活性およびGC含有率間の関係。

図35A−D:KKH SaCas9により標的化される内在性部位の追加の特徴。(c)スペーサーおよびPAMのそれぞれの内在性遺伝子崩壊活性およびGC含有率間の関係。(d)活性に基づきビン化された標的部位のスペーサーおよびPAMについての配列ロゴ。部位を平均突然変異頻度(図2aからのもの)に基づき、低程度(0〜10%、17個の部位)、中程度(10〜30%、17個の部位)、または高程度(>30%、21個の部位)活性にグループ化した。

図36A−B:GUIDE−seq実験についてのオンターゲットタグインテグレーションおよび突然変異誘発頻度。(a)平均GUIDE−seqタグインテグレーション頻度を決定するための制限断片長多型(RFLP)分析。エラーバーは、s.e.m.、n=3を表す(このおよびパネルbについて)。

図36A−B:GUIDE−seq実験についてのオンターゲットタグインテグレーションおよび突然変異誘発頻度。(b)T7E1アッセイにより検出された平均突然変異誘発。

図37A−B:トランケートリピート:アンチリピートsgRNAは、従来の結果(Ran et al.,2015)と同様、全長sgRNAよりも優れている。(a)NNGRRT(配列番号46)PAMを含有する4つの部位に対する野生型SaCas9についてのヒト細胞EGFP崩壊活性。EGFP崩壊活性をフローサイトメトリーにより定量し;エラーバーは、s.e.m、n=3を表し、バックグラウンドEGFP損失の平均レベルを赤色破線により表す(このおよびパネルbについて)。(b)NNNRRT PAMを含有する8つの部位に対するKKH SaCas9についてのヒト細胞EGFP崩壊活性。

CRISPR−Cas9ヌクレアーゼは、ゲノム編集に広く使用されるが1−4、Cas9が開裂し得る配列の範囲は、標的部位中の特異的プロトスペーサー隣接モチーフ(PAM)についての必要性により拘束される5,6。例えば、最もロバストで、これまで広く使用されるCas9のSpCas9は、主にNGG PAMを認識する。結果として、種々のゲノム編集用途に必要な精度で二本鎖分解(DSB)を標的化することが困難であり得ることが多い。さらに、Cas9による不完全なPAM認識は、不所望なオフターゲット突然変異の作出をもたらし得る7,8。意図的に変更または改善されたPAM特異性を有するCas9誘導体を進化させる能は、それらの制限に対処するが、本発明者らの見識では、そのようなCas9バリアントは記載されていない。

伸長PAMを認識するオルソゴナルCas9の標的化範囲を改善するための潜在的方針は、それらのPAM認識特異性を変更することである。本明細書に記載のとおり、SpCas9のPAM認識特異性は、構造ガイド設計および細菌細胞ベース選択系を用いて実施される指向進化の組合せを使用して変更することができる;実施例1および2を参照されたい。本明細書において、PAM内のある位置についての緩和または部分的に緩和した特異性を有するように進化させたバリアントも記載される;実施例3を参照されたい。これらのバリアントは、より長いPAM配列を規定するCas9オルソログの有用性を広げる。

変更PAM特異性を有する遺伝子操作Cas9バリアント 本試験において遺伝子操作されたSpCas9バリアントは、野生型SpCas9によりアクセス可能な部位を大幅に増加させ、これは、CRISPR−Cas9プラットフォームを使用して効率的なHDRを実現する機会、NHEJ媒介インデルを小さい遺伝子エレメントに標的化する機会、およびPAMについての要求を活用して同一細胞中の2つの異なるアレルを区別する機会をさらに向上させる。変更PAM特異性のSpCas9バリアントは、現在、ゼブラフィッシュ胚およびヒト細胞中の両方でSpCas9により標的化可能でない内在性遺伝子部位を効率的に崩壊させ得、それらは種々の異なる細胞タイプおよび生物中で機能することを示唆する。重要なことに、GUIDE−seq実験は、VQRおよびVRER SpCas9バリアントの全体プロファイルが、野生型SpCas9について観察されるものと類似し、またはそれよりも良好であることを示す。さらに、本発明者らが同定および特徴付けした改善された特異性のD1135Eバリアントは、広く使用される野生型SpCas9の優れた代替物を提供する。D1135Eは、カノニカルNGG PAMを有する部位に対して野生型SpCas9と類似の活性を有するが、ミスマッチスペーサー配列およびカノニカルまたは非カノニカルPAMのいずれかを担持するオフターゲット部位のゲノムワイド開裂を低減させる。

本明細書に記載のSpCas9およびSaCas9バリアントの全ては、例えば、簡易な部位特異的突然変異誘発により既存および広く使用されるベクター中に迅速に取り込むことでき、それらはPAM相互作用ドメイン内に含有される少数の突然変異のみを要求するため、バリアントはまた、SpCas9プラットフォームの他の既に記載の改善とともに機能するはずである(例えば、トランケートsgRNA(Tsai et al.,Nat Biotechnol 33,187−197(2015);Fu et al.,Nat Biotechnol 32,279−284(2014))、ニッカーゼ突然変異(Mali et al.,Nat Biotechnol 31,833−838(2013);Ran et al.,Cell 154,1380−1389(2013))、二量体FokI−dCas9融合物(Guilinger et al.,Nat Biotechnol 32,577−582(2014);Tsai et al.,Nat Biotechnol 32,569−576(2014))。

本試験において進化させたSpCas9バリアントは、推定上、3番目のPAM塩基位置に接触するR1335の突然変異を超え、SpCas9−PAM構造中の3番目のPAM位置への直接または間接的接触を作製するが、それら自体はPAM塩基との接触を媒介しない残基付近またはそれに隣接して全てが局在するD1135、G1218、およびT1337におけるアミノ酸置換を担持する(Anders et al.,Nature 513,569−573(2014))(図20a)。これと一致して、本発明者らは、それらの位置における種々の突然変異が、NGG PAMを担持する部位のSpCas9媒介開裂に影響しないと考えられることを見出した(図20b)。これらの結果は、VQRおよびVRER SpCas9バリアント中のG1218およびT1337におけるアミノ酸置換の性質と一緒に、それらの2つの位置における変更が、機能獲得突然変異であり得ることを示唆する。例えば、T1337R突然変異が、特にVRERバリアントの場合、バックボーンまたはPAMの4番目の位置付近もしくはそれへの塩基特異的接触を形成していることが考えられる。D1135における突然変異の機序的役割は、不明確のままであるが、それらは、おそらく、PAMの3番目の位置のグアニンへの副溝を介する水媒介接触の作製に関与する隣接S1136残基の活性に影響を及ぼし得る(Anders et al.,Nature 513,569−573(2014))。D1135E突然変異は、このネットワークを崩壊させることにより特異性を改善し得、おそらく標的部位とのSpCas9/gRNA複合体の相互作用エネルギー全体を低減させ、本発明者らが既に提案した機序は、エネルギー的に好ましくないそれらの不所望な配列の開裂を作製することによりオフターゲット効果を低減させ得る(Fu et al.,Nat Biotechnol 32,279−284(2014))。

本発明の結果は、変更PAM特異性を有するCas9ヌクレアーゼの遺伝子操作の実行可能性を明らかに確立する。既に記載されている追加のCas9オルソログの特徴付け(Esvelt et al.,Nat Methods 10,1116−1121(2013);Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014))またはドメイン交換Cas9キメラの生成(Nishimasu et al.,Cell.156(5):935−49(2014))も、異なるPAMを標的化する潜在的な手法を提供する。本明細書に記載の遺伝子操作方針は、そのようなオルソログまたは合成ハイブリッドCas9を用いて実施して標的化可能なPAMの範囲をさらに多様化させることもできる。St1Cas9およびSaCas9は、SpCas9に対するそれらの小さいサイズを考慮した将来の遺伝子操作の試行ならびに本発明者らの細菌選択系およびヒト細胞中のそれらのロバストなゲノム編集活性の本発明者らの実証のために特に魅力的なフレームワークをなす。

本発明者らの結果は、野生型SaCas9中のR1015が3番目のPAM位置のGに接触することを強く示唆した。理論により拘束されるものではないが、R1015H置換は、この接触を除去し、3番目の位置における特異性を緩和させ得;しかしながら、R1015のGへの接触の損失はまた、標的部位結合に関連するエネルギーを認識可能に低減させ得、それは、なぜR1015H突然変異単独が、ヒト細胞中のNNNRRT部位におけるロバストな活性に十分でないかを説明し得る。E782KおよびN968K置換の両方が陽性電荷を追加するため、それらは、DNAリン酸骨格との非特異的相互作用をなしてR1015のグアニンへの接触の損失をエネルギー的に補い得ることが考えられる。

本明細書に記載の遺伝的アプローチは、構造情報を要求せず、したがって、多くの他のCas9オルソログに適用可能であるはずである。拡大PAM特異性を有するCas9ヌクレアーゼを進化させるための唯一の要求は、それらが細菌ベース選択において機能することである。従来の研究が、高度に関連するCas9オルソログのPAM相互作用ドメインを交換することによりPAM認識を変更し得ることを実証した一方(Nishimasu et al.,Cell(2014))、依然として、この方針がより多様なオルソログを使用する場合に一般化可能であり、または有効であるか否かを決定すべきである。対照的に、本発明者らが本明細書に記載した進化方針は、天然Cas9オルソログ内でコードされるものを超えてPAM認識特異性を遺伝子操作するために使用することができる。この全体方針は、天然に存在する多数のCas9オルソログの標的化範囲を広げ、その有用性を拡張するために用いることができる。

変更特異性を有するSpCas9バリアント したがって、本明細書において、spCas9バリアントが提供される。SpCas9野生型配列は、以下のとおりである。

本明細書に記載のSpCas9バリアントは、以下の位置:D1135、G1218、R1335、T1337(またはそれらに相似する位置)の1つ以上における突然変異を含み得る。一部の実施形態において、SpCas9バリアントは、以下の突然変異:D1135V;D1135E;G1218R;R1335E;R1335Q;およびT1337Rの1つ以上を含む。一部の実施形態において、SpCas9は、配列番号1のアミノ酸配列と少なくとも80%、例えば、少なくとも85%、90%、または95%同一であり、例えば、保存的突然変異により置き換えられている、例えば、配列番号1の残基の最大5%、10%、15%、または20%における差異を有する。好ましい実施形態において、バリアントは、親の所望の活性、例えば、ヌクレアーゼ活性(親がニッカーゼまたはデッドCas9である場合を除外する)、ならびに/またはガイドRNAおよび標的DNA)と相互作用する能力を保持する。

2つの核酸配列の同一性パーセントを決定するため、最適な比較目的のために配列をアラインする(例えば、最適なアラインメントのため、ギャップを第1および第2のアミノ酸または核酸配列の一方または両方の中に導入することができ、比較目的のために、非相同配列を無視することができる)。比較目的のためにアラインされる参照配列の長さは、参照配列の長さの少なくとも80%であり、一部の実施形態において、少なくとも90%または100%である。次いで、対応するアミノ酸位置またはヌクレオチド位置におけるヌクレオチドを比較する。第1の配列中のある位置が、第2の配列中の対応する位置と同一のヌクレオチドにより占有される場合、その分子はその位置において同一である(本明細書において使用される核酸「同一性」は、核酸「相同性」に相当する)。2つの配列間の同一性パーセントは、それらの配列により共有される同一位置の数の関数であり、それら2つの配列の最適なアラインメントのために導入が必要とされるギャップの数、およびそれぞれのギャップの長さを考慮する。2つのポリペプチドまたは核酸配列間の同一性パーセントは、当技術分野の技能の範囲内の種々の手段で、例えば、公的に入手可能なコンピュータソフトウェア、例えば、Smith Waterman Alignment(Smith,T.F.and M.S.Waterman(1981)J Mol Biol 147:195−7);GeneMatcher Plus(商標)に組み込まれた“BestFit”(Smith and Waterman,Advances in Applied Mathematics,482−489(1981))、Schwarz and Dayhof(1979)Atlas of Protein Sequence and Structure,Dayhof,M.O.,Ed,pp 353−358;BLASTプログラム(Basic Local Alignment Search Tool;(Altschul,S.F.,W.Gish,et al.(1990)J Mol Biol 215:403−10)、BLAST−2、BLAST−P、BLAST−N、BLAST−X、WU−BLAST−2、ALIGN、ALIGN−2、CLUSTAL、またはMegalign(DNASTAR)ソフトウェアを使用して決定する。さらに、当業者は、アラインメントを計測するための適切なパラメータ、例として、比較される配列の長さにわたり最大アラインメントを達成するために必要される任意のアルゴリズムを決定することができる。一般に、タンパク質または核酸について、比較の長さは、全長以下の任意の長さ(例えば、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%)であり得る。本組成物および方法の目的のため、配列の全長の少なくとも80%は、BLASTアルゴリズムおよびデフォルトパラメータを使用してアラインする。

本発明の目的のため、2つの配列間の配列の比較および同一性パーセントの決定は、Blossum 62スコアリング行列をギャップペナルティ12、ギャップ伸長ペナルティ4、およびフレームシフトギャップペナルティ5で使用して達成することができる。

保存的置換としては、典型的には、以下の群:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、トレオニン;リジン、アルギニン;およびフェニルアラニン、チロシン内の置換が挙げられる。

一部の実施形態において、SpCas9バリアントは、以下の突然変異の組:D1135V/R1335Q/T1337R(VQRバリアント);D1135V/G1218R/R1335Q/T1337R(VRQRバリアント);D1135E/R1335Q/T1337R(EQRバリアント);またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)の1つを含む。

一部の実施形態において、SpCas9バリアントは、タンパク質のヌクレアーゼ部分を触媒的に不活性にするため、Cas9のヌクレアーゼ活性を低減させ、または破壊する以下の突然変異:D10、E762、D839、H983、またはD986およびH840またはN863の1つ、例えば、D10A/D10NおよびH840A/H840N/H840Yも含み;それらの位置における置換は、アラニン(Nishimasu al.,Cell 156,935−949(2014)におけるとおり)、または他の残基、例えば、グルタミン、アスパラギン、チロシン、セリン、またはアスパラギン酸、例えば、E762Q、H983N、H983Y、D986N、N863D、N863S、またはN863Hであり得る(国際公開第2014/152432号パンフレット参照)。一部の実施形態において、バリアントは、D10AまたはH840A(一本鎖ニッカーゼを作出する)における突然変異、またはD10AおよびH840A(ヌクレアーゼ活性を解消する;この突然変異体は、デッドCas9またはdCas9として公知である)における突然変異を含む。

本明細書において、SaCas9バリアントも提供される。SaCas9野生型配列は、以下のとおりである。

本明細書に記載のSaCas9バリアントは、以下の位置:E782、N968、および/またはR1015(またはそれらに相似する位置)の1つ以上における突然変異を含む。一部の実施形態において、バリアントは、以下の突然変異:R1015Q、R1015H、E782K、N968K、E735K、K929R、A1021T、K1044Nの1つ以上を含む。一部の実施形態において、SaCas9バリアントは、突然変異E782K、K929R、N968K、およびR1015X(Xは、R以外の任意のアミノ酸である)を含む。一部の実施形態において、SaCas9バリアントは、配列番号2のアミノ酸配列と少なくとも80%、例えば、少なくとも85%、90%、または95%同一であり、例えば、保存的突然変異により置き換えられている、例えば、配列番号2の残基の最大5%、10%、15%、または20%における差異を有する。好ましい実施形態において、バリアントは、親の所望の活性、例えば、ヌクレアーゼ活性(親がニッカーゼまたはデッドCas9である場合を除外する)、ならびに/またはガイドRNAおよび標的DNA)と相互作用する能力を保持する。

一部の実施形態において、SaCas9バリアントは、タンパク質のヌクレアーゼ部分を触媒的に不活性にするため、SaCas9のヌクレアーゼ活性を低減させ、または破壊し得る以下の突然変異:D10A、D556A、H557A、N580A、例えば、D10A/H557Aおよび/またはD10A/D556A/H557A/N580Aも含み;それらの位置における置換は、アラニン(Nishimasu al.,Cell 156,935−949(2014)におけるとおり)、または他の残基、例えば、グルタミン、アスパラギン、チロシン、セリン、またはアスパラギン酸であり得る。一部の実施形態において、バリアントは、D10A、D556A、H557A、またはN580A(一本鎖ニッカーゼを作出し得る)における突然変異、またはD10A/H557Aおよび/もしくはD10A/D556A/H557A/N580A(SpCas9と同様にヌクレアーゼ活性を解消し得;それらは、デッドCas9またはdCas9と称される)における突然変異を含む。

本明細書において、任意選択的に、バリアントタンパク質の発現のための1つ以上の調節ドメインに作動可能に結合されているSpCas9および/またはSaCas9バリアントをコードする単離核酸、単離核酸を含むベクター、ならびにその核酸を含み、および任意選択的にバリアントタンパク質を発現する宿主細胞、例えば、哺乳動物宿主細胞も提供される。

本明細書に記載のバリアントは、細胞のゲノムを変更するために使用することができ;本方法は、一般に、細胞中でバリアントタンパク質を、細胞のゲノムの選択部分に相補的な領域を有するガイドRNAとともに発現させることを含む。細胞のゲノムを選択的に変更する方法は、当技術分野において公知であり、例えば、米国特許第8,697,359号明細書;米国特許出願公開第2010/0076057号明細書;米国特許出願公開第2011/0189776号明細書;米国特許出願公開第2011/0223638号明細書;米国特許出願公開第2013/0130248号明細書;国際公開第2008/108989号パンフレット;国際公開第2010/054108号パンフレット;国際公開第2012/164565号パンフレット;国際公開第2013/098244号パンフレット;国際公開第2013/176772号パンフレット;;;米国特許出願公開第20150050699号明細書;米国特許出願公開第20150045546号明細書;米国特許出願公開第20150031134号明細書;米国特許出願公開第20150024500号明細書;米国特許出願公開第20140377868号明細書;米国特許出願公開第20140357530号明細書;米国特許出願公開第20140349400号明細書;米国特許出願公開第20140335620号明細書;米国特許出願公開第20140335063号明細書;米国特許出願公開第20140315985号明細書;米国特許出願公開第20140310830号明細書;米国特許出願公開第20140310828号明細書;米国特許出願公開第20140309487号明細書;米国特許出願公開第20140304853号明細書;米国特許出願公開第20140298547号明細書;米国特許出願公開第20140295556号明細書;米国特許出願公開第20140294773号明細書;米国特許出願公開第20140287938号明細書;米国特許出願公開第20140273234号明細書;米国特許出願公開第20140273232号明細書;米国特許出願公開第20140273231号明細書;米国特許出願公開第20140273230号明細書;米国特許出願公開第20140271987号明細書;米国特許出願公開第20140256046号明細書;米国特許出願公開第20140248702号明細書;米国特許出願公開第20140242702号明細書;米国特許出願公開第20140242700号明細書;米国特許出願公開第20140242699号明細書;米国特許出願公開第20140242664号明細書;米国特許出願公開第20140234972号明細書;米国特許出願公開第20140227787号明細書;米国特許出願公開第20140212869号明細書;米国特許出願公開第20140201857号明細書;米国特許出願公開第20140199767号明細書;米国特許出願公開第20140189896号明細書;米国特許出願公開第20140186958号明細書;米国特許出願公開第20140186919号明細書;米国特許出願公開第20140186843号明細書;米国特許出願公開第20140179770号明細書;米国特許出願公開第20140179006号明細書;米国特許出願公開第20140170753号明細書;Makarova et al.,“Evolution and classification of the CRISPR−Cas systems”9(6)Nature Reviews Microbiology 467−477(1−23)(Jun.2011);Wiedenheft et al.,“RNA−guided genetic silencing systems in bacteria and archaea”482 Nature 331−338(Feb.16,2012);Gasiunas et al.,“Cas9−crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria”109(39)Proceedings of the National Academy of Sciences USA E2579−E2586(Sep.4,2012);Jinek et al.,“A Programmable Dual−RNA−Guided DNA Endonuclease in Adaptive Bacterial Immunity”337 Science 816−821(Aug.17,2012);Carroll,“A CRISPR Approach to Gene Targeting”20(9)Molecular Therapy 1658−1660(Sep.2012);2012年5月25日に出願された米国特許出願第61/652,086号明細書;Al−Attar et al.,Clustered Regularly Interspaced Short Palindromic Repeats(CRISPRs):The Hallmark of an Ingenious Antiviral Defense Mechanism in Prokaryotes,Biol Chem.(2011)vol.392,Issue 4,pp.277−289;Hale et al.,Essential Features and Rational Design of CRISPR RNAs That Function With the Cas RAMP Module Complex to Cleave RNAs,Molecular Cell,(2012)vol.45,Issue 3,292−302を参照されたい。

本明細書に記載のバリアントタンパク質は、上記の参照文献に記載のSpCas9タンパク質に代えて、以下の表4によるPAM配列を有する配列を標的化するガイドRNAとともに使用することができる。

さらに、本明細書に記載のバリアントは、当技術分野において公知の野生型Cas9または他のCas9突然変異(例えば、上記のdCas9またはCas9ニッカーゼ)に代えて融合タンパク質、例えば、国際公開第2014/124284号パンフレットに記載の異種機能ドメインを有する融合タンパク質中で使用することができる。例えば、バリアント、好ましくは、1つ以上のヌクレアーゼ低減または殺傷突然変異を含むバリアントをCas9のNまたはC末端上で、転写活性化ドメインまたは他の異種機能ドメイン(例えば、転写リプレッサー(例えば、KRAB、ERD、SIDなど、例えば、ets2リプレッサー因子(ERF)リプレッサードメイン(ERD)のアミノ酸473〜530、KOX1のKRABドメインのアミノ酸1〜97、またはMad mSIN3相互作用ドメイン(SID)のアミノ酸1〜36;Beerli et al.,PNAS USA 95:14628−14633(1998)参照)またはサイレンサー、例えば、ヘテロクロマチンタンパク質1(HP1、swi6としても公知)、例えば、HP1αまたはHP1β;固定RNA結合配列に融合している長鎖非コードRNA(lncRNA)をリクルートし得るタンパク質またはペプチド、例えば、MS2コートタンパク質、エンドリボヌクレアーゼCsy4、またはラムダNタンパク質により結合されるものに融合させることができ;当技術分野において公知のDNAのメチル化状態を改変する酵素(例えば、DNAメチルトランスフェラーゼ(DNMT)またはTETタンパク質);またはヒストンサブユニットを改変する酵素(例えば、ヒストンアセチルトランスフェラーゼ(HAT)、ヒストンデアセチラーゼ(HDAC)、ヒストンメチルトランスフェラーゼ(例えば、リジンまたはアルギニン残基のメチル化のため)またはヒストンデメチラーゼ(例えば、リジンまたはアルギニン残基の脱メチル化のため))を使用することもできる。多数のこのようなドメインの配列、例えば、DNA中のメチル化シトシンのヒドロキシル化を触媒するドメインが当技術分野において公知である。例示的なタンパク質としては、テンイレブントランスロケーション(Ten−Eleven−Translocation)(TET)1〜3ファミリー、DNA中の5−メチルシトシン(5−mC)を5−ヒドロキシメチルシトシン(5−hmC)に変換する酵素が挙げられる。

ヒトTET1〜3配列は当技術分野において公知であり、それを以下の表に示す。

一部の実施形態において、触媒ドメインの全長配列の全部または一部、例えば、システインリッチ伸長部および7つの高度に保存されるエキソンによりコードされる2OGFeDOドメイン、例えば、アミノ酸1580〜2052を含むTet1触媒ドメイン、アミノ酸1290〜1905を含むTet2、およびアミノ酸966〜1678を含むTet3を含む触媒モジュールを含めることができる。3つ全てのTetタンパク質中のキー触媒残基を説明するアラインメント、および全長配列についてのその補助材料については、例えば、Iyer et al.,Cell Cycle.2009 Jun 1;8(11):1698−710.Epub 2009 Jun 27の図1を参照されたい(例えば、seq 2c参照);一部の実施形態において、配列は、Tet1のアミノ酸1418〜2136またはTet2/3中の対応領域を含む。

他の触媒モジュールは、Iyer et al.,2009において同定されたタンパク質からのものであり得る。

一部の実施形態において、異種機能ドメインは、生物学的係留物であり、MS2コートタンパク質、エンドリボヌクレアーゼCsy4、またはラムダNタンパク質の全部または一部(例えば、それからのDNA結合ドメイン)を含む。これらのタンパク質は、特異的ステム−ループ構造を含有するRNA分子をdCas9 gRNA標的化配列により規定される場所にリクルートするための使用することができる。例えば、MS2コートタンパク質、エンドリボヌクレアーゼCsy4、またはラムダNに融合しているdCas9バリアントは、Csy4、MS2またはラムダN結合配列に結合している長鎖非コードRNA(lncRNA)、例えば、XISTまたはHOTAIRをリクルートするために使用することができる;例えば、Keryer−Bibens et al.,Biol.Cell 100:125−138(2008)を参照されたい。あるいは、Csy4、MS2またはラムダNタンパク質結合配列は、例えば、Keryer−Bibens et al.,前掲に記載のとおり、別のタンパク質に結合させることができ、本明細書に記載の方法および組成物を使用してタンパク質をdCas9バリアント結合部位に標的化させることができる。一部の実施形態において、Csy4は、触媒的に不活性である。一部の実施形態において、Cas9バリアント、好ましくは、dCas9バリアントは、国際公開第2014/204578号パンフレットに記載のとおり、FokIに融合している。

一部の実施形態において、融合タンパク質は、dCas9バリアントおよび異種機能ドメイン間のリンカーを含む。これらの融合タンパク質中(または連結構造の融合タンパク質間)で使用することができるリンカーは、融合タンパク質の機能を妨害しない任意の配列を含み得る。好ましい実施形態において、リンカーは、短鎖であり、例えば、2〜20アミノ酸であり、典型的には、フレキシブルである(すなわち、高い自由度を有するアミノ酸、例えば、グリシン、アラニン、およびセリンを含む)。一部の実施形態において、リンカーは、GGGS(配列番号188)またはGGGGS(配列番号189)からなる1つ以上の単位、例えば、GGGS(配列番号188)またはGGGGS(配列番号189)単位の2、3、4つ、またはそれより多いリピートを含む。他のリンカー配列を使用することもできる。

発現系 本明細書に記載のCas9バリアントを使用するため、それらをコードする核酸からそれらを発現させることが望ましいことがある。これは、種々の手段で実施することができる。例えば、Cas9バリアントをコードする核酸を、複製および/または発現のための原核または真核細胞中への形質転換のための中間ベクター中にクローニングすることができる。中間ベクターは、典型的には、Cas9バリアントの産生のためのCas9バリアントをコードする核酸の貯蔵または操作のための原核生物ベクター、例えば、プラスミド、もしくはシャトルベクター、または昆虫ベクターである。Cas9バリアントをコードする核酸は、植物細胞、動物細胞、好ましくは、哺乳動物細胞もしくはヒト細胞、真菌細胞、細菌細胞、または原虫細胞への投与のための発現ベクター中にクローニングすることもできる。

発現を得るため、Cas9バリアントをコードする配列は、典型的には、転写を指向するためのプロモーターを含有する発現ベクター中にサブクローニングする。好適な細菌および真核生物プロモーターは、当技術分野において周知であり、例えば、Sambrook et al.,Molecular Cloning,A Laboratory Manual(3d ed.2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);およびCurrent Protocols in Molecular Biology(Ausubel et al.,eds.,2010)に記載されている。遺伝子操作タンパク質を発現させるための細菌発現系は、例えば、大腸菌(E.coli)、バシラス属種(Bacillus sp.)、およびサルモネラ属(Salmonella)において利用可能である(Palva et al.,1983,Gene 22:229−235)。このような発現系のためのキットは、市販されている。哺乳動物細胞、酵母、および昆虫細胞のための真核生物発現系も、当技術分野において周知であり、それらも市販されている。

核酸の発現を指向するために使用されるプロモーターは、特定の用途に依存する。例えば、強力な構成的プロモーターは、典型的には、融合タンパク質の発現および精製に使用される。対照的に、Cas9バリアントを遺伝子調節のためにインビボ投与すべき場合、Cas9バリアントの特定の使用に応じて構成的または誘導性プロモーターのいずれかを使用することができる。さらに、Cas9バリアントの投与に好ましいプロモーターは、弱いプロモーター、例えば、HSV TKまたは類似の活性を有するプロモーターであり得る。プロモーターは、トランス活性化に応答性であるエレメント、例えば、低酸素症応答エレメント、Gal4応答エレメント、lacリプレッサー応答エレメント、ならびに小分子制御系、例えば、テトラサイクリン調節系およびRU−486系も含み得る(例えば、Gossen&Bujard,1992,Proc.Natl.Acad.Sci.USA,89:5547;Oligino et al.,1998,Gene Ther.,5:491−496;Wang et al.,1997,Gene Ther.,4:432−441;Neering et al.,1996,Blood,88:1147−55;およびRendahl et al.,1998,Nat.Biotechnol.,16:757−761参照)。

プロモーターに加え、発現ベクターは、典型的には、原核生物または真核生物のいずれであれ、宿主細胞中の核酸の発現に要求される全ての追加のエレメントを含有する転写単位または発現カセットを含有する。したがって、典型的な発現カセットは、例えば、Cas9バリアントをコードする核酸配列に作動可能に結合しているプロモーター、および例えば、転写物の効率的なポリアデニル化、転写終結、リボソーム結合部位、または翻訳終結に要求される任意のシグナルを含有する。カセットの追加のエレメントとしては、例えば、エンハンサー、および異種スプライシングイントロンシグナルを挙げることができる。

遺伝子情報を細胞中に輸送するために使用される特定の発現ベクターは、Cas9バリアントの目的の使用、例えば、植物、動物、細菌、真菌、原生動物中などでの発現に関して選択される。標準的な細菌発現ベクターとしては、pBR322ベースのプラスミド、pSKF、pET23Dなどのプラスミド、ならびに市販のタグ融合発現系、例えば、GSTおよびLacZが挙げられる。

真核発現ベクターでは、真核生物ウイルスからの調節エレメントを含有する発現ベクター、例えば、SV40ベクター、パピローマウイルスベクター、およびエプスタイン・バーウイルス由来のベクターを使用することが多い。他の例示的な真核生物ベクターとしては、pMSG、pAV009/A+、pMTO10/A+、pMAMneo−5、バキュロウイルスpDSVE、およびSV40初期プロモーター、SV40後期プロモーター、メタロチオネインプロモーター、ネズミ乳腺腫瘍ウイルスプロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーターまたは真核細胞中での発現に有効であることが示されている他のプロモーターの指向下でタンパク質の発現を可能とする他の任意のベクターが挙げられる。

Cas9バリアントを発現させるためのベクターは、ガイドRNAの発現を駆動するRNA PolIIIプロモーター、例えば、H1、U6または7SKプロモーターを含み得る。これらのヒトプロモーターは、プラスミド形質移入後に哺乳動物細胞中でのCas9バリアントの発現を可能とする。

一部の発現系は、安定的に形質移入された細胞系を選択するためのマーカー、例えばチミジンキナーゼ、ハイグロマイシンBホスホトランスフェラーゼ、およびジヒドロ葉酸レダクターゼを有する。高収率の発現系、例えば、バキュロウイルスベクターを昆虫細胞中で、ポリヘドリンプロモーターまたは他の強力なバキュロウイルスプロモーターの指向下でgRNAコード配列とともに使用するものも好適である。

発現ベクター中に典型的に含まれるエレメントとしては、大腸菌(E.coli)中で機能するレプリコン、組換えプラスミドを保有する細菌の選択を可能にする抗生物質耐性をコードする遺伝子、および組換え配列の挿入を可能にするためのプラスミドの非必須領域中のユニーク制限部位も挙げられる。

標準的な形質移入法を使用して大量のタンパク質を発現する細菌、哺乳動物、酵母または昆虫の細胞系を産生し、次いで標準的な技術を用いてそのタンパク質を精製する(例えば、Colley et al.,1989,J.Biol.Chem.,264:17619−22;Guide to Protein Purification,in Methods in Enzymology,vol.182(Deutscher,ed.,1990)参照)。真核および原核細胞の形質転換は、標準的な技術に従って実施する(例えば、Morrison,1977,J.Bacteriol.132:349−351;Clark−Curtiss&Curtiss,Methods in Enzymology 101:347−362(Wu et al.,eds,1983参照)。

宿主細胞内に外来ヌクレオチド配列を導入する公知の手順のいずれかを使用することができる。このような方法としては、リン酸カルシウム形質移入、ポリブレン、プロトプラスト融合、エレクトロポレーション、ヌクレオフェクション、リポソーム、マイクロインジェクション、ネイキッドDNA、プラスミドベクター、ウイルスベクター(エピソーム型および組込み型の両方)およびクローニングされたゲノムDNA、cDNA、合成DNAまたは他の外来遺伝子材料を宿主細胞内に導入する他の周知の方法のいずれかの使用が挙げられる(例えば、Sambrook et al.,前掲参照)。唯一必要なことは、使用される特定の遺伝子操作手順が、Cas9バリアントを発現し得る宿主細胞内に少なくとも1つの遺伝子を良好に導入し得ることである。

本発明は、ベクターおよびベクターを含む細胞を含む。

本発明を以下の実施例においてさらに説明するが、それらの実施例は特許請求の範囲に記載の本発明の範囲を限定するものではない。

方法 実施例1および2では、以下の材料および方法を使用した。

プラスミドおよびオリゴヌクレオチド 本試験において使用される親構築物についての概略図およびDNA配列は、図5A〜Jおよび配列番号7〜20に見出すことができる。陽性選択プラスミド、陰性選択プラスミド、および部位枯渇ライブラリーを生成するために使用されるオリゴヌクレオチドの配列は、表1において入手可能である。本試験における全てのgRNA標的の配列は、表2において入手可能である。Cas9中の点突然変異は、PCRにより生成した。

Cas9およびsgRNAを別個に発現させるための2つのT7プロモーターを有する細菌Cas9/sgRNA発現プラスミドを構築した。これらのプラスミドは、化膿性連鎖球菌(S.pyogenes)についてのCas9(BPK764、JDS246からサブクローニングされたSpCas9配列17)、CRISPR遺伝子座1からのS.サーモフィラス(S.thermophilus)Cas9についてのCas9(MSP1673、既に公開された記載から改変されたSt1Cas9配列20)、および黄色ブドウ球菌(S.aureus)についてのCas9(BPK2101、Uniprot J7RUA5からコドン最適化されたSaCas9配列)のヒトコドン最適化バージョンをコードする。SpCas934,35およびSt1Cas920については、既に記載されているsgRNA配列を利用した一方、SaCas9 sgRNA配列は、CRISPRfinderを使用するcrRNAリピートについてのEuropean Nucleotide Archive配列HE980450の検索、および既に記載されているものと同様の生物情報学的アプローチを使用するtracrRNAの同定により決定した36。sgRNAのスペーサー相補性領域を完成させるためにアニールされるオリゴをBsaI切断BPK764およびBPK2101、またはBspMI切断MSP1673中にライゲートした(5’−ATAGをスペーサーに付加してトップオリゴを生成し、5’−AAACをスペーサー配列の逆相補鎖に付加してボトムオリゴを生成する)。

Mutazyme II(Agilent Technologies)を使用してSpCas9の残基1097〜1368を約5.2個の置換/キロベースの率においてランダムに突然変異させて突然変異PAM相互作用(PI)ドメインライブラリーを生成した。それぞれのPIドメインライブラリーの理論複雑度は、得られた形質転換体の数に基づき107個超のクローンであると推定された。陽性および陰性選択プラスミドは、XbaI/SphIまたはEcoRI/SphI切断p11−lacY−wtx117中にアニールされる標的部位オリゴをそれぞれライゲートすることにより生成した。

2つのランダム化PAMライブラリー(それぞれ異なるプロトスペーサー配列を有する)は、クレノウ(−エキソ)を使用して構築し、プロトスペーサーの3’末端に直接隣接する6つのランダム化ヌクレオチドを含有するオリゴのボトム鎖をフィルインした(表1参照)。二本鎖産物をEcoRIにより切断し、切断p11−lacY−wtx1中へのライゲーションのためのEcoRI/SphI末端を残した。それぞれのランダム化PAMライブラリーの理論複雑度は、得られた形質転換体の数に基づき106個超であることが推定された。

SpCas9およびSpCas9バリアントは、JDS24616に由来するベクターからヒト細胞中で発現させた。St1Cas9およびSaCas9について、MSP1673およびBPK2101からのCas9 ORFをCAGプロモーターベクター中にサブクローニングして、それぞれMSP1594およびBPK2139を生成した。sgRNAのU6発現のためのプラスミド(その中に、所望のスペーサーオリゴをクローニングすることができる)は、SpCas9 sgRNA(BPK1520)、St1Cas9 sgRNA(BPK2301)、およびSaCas9 gRNA(VVT1)について上記のsgRNA配列を使用して生成した。sgRNAのスペーサー相補性領域を完成させるためにアニールされるオリゴをそれらのベクターのBsmBIオーバーハング中にライゲートした(5’−CACCをスペーサーに付加してトップオリゴを生成し、5’−AAACをスペーサー配列の逆相補鎖に付加してボトムオリゴを生成する)。

SpCas9バリアントを進化させるための細菌ベース陽性選択アッセイ 陽性選択プラスミド(標的部位が埋め込まれた)を含有するコンピテント大腸菌(E.coli)BW25141(λDE3)23をCas9/sgRNAコードプラスミドにより形質転換した。SOB培地中の60分間のリカバリー後、クロラムフェニコール(非選択)またはクロラムフェニコール+10mMのアラビノース(選択)のいずれかを含有するLB培地上で形質転換物をプレーティングした。陽性選択プラスミドの開裂は、生存頻度:選択プレート上のコロニー/非選択プレート上のコロニーを計算することにより推定した(図12も参照)。

新規PAMを開裂し得るSpCas9バリアントについて選択するため、標的部位+目的のPAMをコードする陽性選択プラスミドを含有する大腸菌(E.coli)BW25141(λDE3)細胞中に、PIドメイン突然変異Cas9/sgRNAプラスミドライブラリーをエレクトロポレートした。一般に、約50,000個のクローンをスクリーニングして50〜100個の生存物を得た。生存クローンのPIドメインをフレッシュなバックボーンプラスミド中にサブクローニングし、陽性選択において再試験した。活性についてのこの第2のスクリーンにおいて10%超の生存率を有したクローンをシーケンシングした。シーケンシングされたクローン中で観察された突然変異を、生存クローン中のそれらの頻度、置換のタイプ、SpCas9/sgRNA結晶構造(PDB:4UN3)14中のPAM塩基への近接性、および(一部の場合)ヒト細胞ベースEGFP崩壊アッセイにおける活性に基づきさらなる評価のために選択した。

Cas9PAM特異性をプロファイルするための細菌ベース部位枯渇アッセイ Cas9/sgRNA発現プラスミドを含有するコンピテント大腸菌(E.coli)BW25141(λDE3)を、開裂性または非開裂性標的部位を保有する陰性選択プラスミドにより形質転換した。SOB培地中の60分間のリカバリー後、クロラムフェニコール+カルベニシリンを含有するLB培地上で形質転換物をプレーティングした。陰性選択プラスミドの開裂は、形質転換されたDNA1μg当たりのコロニー形成単位を計算することにより推定した(図13も参照)。

陰性選択は、適切なCas9/sgRNAプラスミドを既に保有する大腸菌(E.coli)BW25141(λDE3)細胞中にそれぞれのランダム化PAMライブラリーをエレクトロポレートすることにより、Cas9ヌクレアーゼのPAM特異性プロファイルを決定するように適合させた。80,000〜100,000個のコロニーをLB+クロラムフェニコール+カルベニシリンプレート上で低密度スプレッドにおいてプレーティングした。Cas9による開裂が生じない陰性選択プラスミドを含有する生存コロニーをハーベストし、プラスミドDNAをマキシプレップ(Qiagen)により単離した。得られたプラスミドライブラリーは、Phusion Hot−start Flex DNA Polymerase(New England BioLabs)使用するPCRと、それに続くAgencourt Ampure XPクリーンアップステップ(Beckman Coulter Genomics)とにより増幅した。それぞれの部位枯渇実験についての約500ngのクリーンPCR産物から、KAPA HTPライブラリー調製キット(KAPA BioSystems)を使用して二重インデックス化Tru−Seq Illuminaディープシーケンシングライブラリーを調製した。Dana−Farber Cancer Institute Molecular Biology Coreにより、Illumina MiSeq Sequencer上で150bpペアドエンドシーケンシングが実施された。

それぞれのMiSeqランについて出力された未処理FASTQファイルをPythonプログラムにより分析して相対PAM枯渇を決定した。プログラム(方法参照)は、以下のとおり作動する:第1に、所与の実験についての全てのFASTQリードファイルを選択することができるファイルダイアログを使用者に提示する。これらのファイルについて、それぞれのFASTQエントリーを両方の鎖上の固定スペーサー領域についてスキャンする。スペーサー領域が見出される場合、スペーサー領域をフランキングする6つの変動ヌクレオチドを捕捉し、カウンタに付加する。この検出された変動領域の組から、それぞれの考えられる位置における長さ2〜6ntのそれぞれのウインドウのカウントおよび頻度を一覧にした。両方のランダム化PAMライブラリーについての部位枯渇データは、選択後PAM枯渇値(PPDV):選択集団におけるPAMの選択後頻度を、そのPAMの選択前ライブラリー頻度により除したものを計算することにより分析した。PPDV分析は、6bpランダム化領域中の全ての考えられる2〜6長のウインドウにわたるそれぞれの実験について実施した。PAM優先性を可視化するために本発明者らが使用したウインドウは、野生型およびバリアントSpCas9実験についての2番目、3番目、および4番目のPAM位置を表す3ntウインドウ、ならびにSt1Cas9およびSaCas9についての3番目、4番目、5番目、6番目のPAM位置を表す4ntウインドウであった。

PPDVについての2つの有意性閾値は、1)dCas9対選択前ライブラリー対数リードカウント比の分布に基づく統計的有意性閾値(図13cおよび13d参照)、ならびに2)ヒト細胞における枯渇値および活性間の経験的相関に基づく生物学的活性閾値に基づき決定した。統計的閾値は、dCas9についての平均PPDVからの3.36標準偏差(0.85の相対PPDVに相当)において設定し、それは多重比較のための調整後の0.05の正規分布両側p値に対応する(すなわち、p=0.05/64)。生物学的活性閾値は、5倍枯渇(0.2のPPDVに相当)において設定した。なぜなら、この枯渇のレベルがヒト細胞における活性の妥当な予測因子として機能するためである(図14も参照)。図14の95%信頼区間は、平均の標準偏差を、1.96により乗じた試料サイズの平方根により除することにより計算した。

ヒト細胞培養および形質移入 構成的に発現されるEGFP−PESTレポーター遺伝子の単一インテグレートコピーを保有するU2OS.EGFP細胞15を、10%のFBS、2mMのGlutaMax(Life Technologies)、ペニシリン/ストレプトマイシン、および400μg/mlのG418が補給されたAdvanced DMEM培地(Life Technologies)中で、37℃において5%CO2を用いて培養した。Lonza 4D−nucleofectorのDN−100プログラムを製造業者のプロトコルに従って使用して、750ngのCas9プラスミドおよび250ngのsgRNAプラスミド(特に注釈のない限り)により、細胞を同時形質移入した。空のU6プロモータープラスミドと一緒に形質移入されるCas9プラスミドを全てのヒト細胞実験についての陰性対照として使用した。内在性遺伝子実験についての標的部位を野生型SpCas9により開裂可能なNGG部位の200bp内で選択した(図16aおよび表2参照)。

ゼブラフィッシュケアおよび注射 ゼブラフィッシュケアおよび使用は、Massachusetts General Hospital Subcommittee on Research Animal Careにより承認された。Cas9 mRNAは、既に記載のとおりmMESSAGE mMACHINE T7 ULTRA Kit(Life Technologies)を使用してPmeI消化JDS246(野生型SpCas9)またはMSP469(VQRバリアント)により転写させた21。本試験の全てのsgRNAは、クローニング非依存的sgRNA生成法に従って調製した24。sgRNAは、MEGAscript SP6 Transcription Kit(Life Technologies)により転写させ、RNA Clean&Concentrator−5(Zymo Research)により精製し、RNアーゼ不含水により溶出させた。

sgRNAおよびCas9コードmRNAを一細胞期のゼブラフィッシュ胚中に同時注射した。それぞれの胚に、30ng/μLのgRNAおよび300ng/μLのCas9 mRNAを含有する約2〜4.5nLの溶液を注射した。翌日、注射された胚を立体鏡下で正常な形態発生について精査し、ゲノムDNAを5〜9つの胚から抽出した。

ヒト細胞EGFP崩壊アッセイ EGFP崩壊実験を既に記載のとおり実施した16。EGFP発現について、形質移入された細胞を形質移入の約52時間後にFortessaフローサイトメーター(BD Biosciences)を使用して分析した。バックグラウンドEGFP損失を全ての実験について約2.5%においてゲーティングした(赤色破線としてグラフにより表示)。

ヌクレアーゼ誘導突然変異率を定量するためのT7E1アッセイ、標的化ディープシーケンシング、およびGUIDE−seq T7E1アッセイは、ヒト細胞15およびゼブラフィッシュ21について既に記載のとおり実施した。U2OS.EGFPヒト細胞について、Agencourt DNAdvance Genomic DNA Isolation Kit(Beckman Coulter Genomics)を使用してゲノムDNAを形質移入細胞から形質移入の約72時間後に抽出した。表1に列記されるプライマーを使用してゼブラフィッシュまたはヒト細胞ゲノムDNAからの標的遺伝子座を増幅した。ほぼ200ngの精製PCR産物を変性し、アニールし、T7E1(New England BioLabs)により消化した。突然変異誘発頻度は、ヒト細胞15およびゼブラフィッシュ21について既に記載のとおりQiaxcelキャピラリー電気泳動装置(QIagen)を使用して定量した。

標的化ディープシーケンシングについて、表1に列記されるプライマーを用いるPhusion Hot−start Flexを使用して、既に特徴付けされたオンおよびオフターゲット部位(Tsai et al.,Nat Biotechnol 33,187−197(2015);Fu et al.,Nat Biotechnol 31,822−826(2013;Fu et al.,Nat Biotechnol 32,279−284(2014))を増幅した。ゲノム遺伝子座は、対照条件(空のsgRNA)、野生型、およびD1135E SpCas9について増幅した。Agencourt Ampure XPクリーンアップステップ(Beckman Coulter Genomics)を実施してから、ライブラリー調製のためにそれぞれの条件から約500ngのDNAをプールした。KAPA HTPライブラリー調製キット(KAPA BioSystems)を使用して二重インデックス化Tru−Seq Illuminaディープシーケンシングライブラリーを生成した。Dana−Farber Cancer Institute Molecular Biology Coreにより、Illumina MiSeq Sequencer上で150bpペアドエンドシーケンシングが実施された。標的化ディープシーケンシングデータの突然変異分析は、既に記載のとおり実施した(Tsai et al.,Nat Biotechnol 32,569−576(2014))。簡潔に述べると、bwa(Li et al.,Bioinformatics 25,1754−1760(2009))を使用してIllumina MiSeqペアドエンドリードデータをヒトゲノム参照GRChr37にマッピングした。高品質リード(品質スコア>=30)を標的またはオフターゲット部位に重複するインデル突然変異について評価した。1bpインデル突然変異は、それらが予測切断点の1bp内で生じない限り、分析から除外した。D1135Eを野生型SpCas9に対して比較するオンおよびオフターゲット部位における活性の変化は、両方の条件からのインデル頻度を比較することにより計算した(バックグラウンド対照アンプリコンインデルレベルを超える率について)。

GUIDE−seq実験は、既に記載のとおり実施した(Tsai et al.,Nat Biotechnol 33,187−197(2015))。簡潔に述べると、リン酸化ホスホロチオエート修飾二本鎖オリゴデオキシヌクレオチド(dsODN)を上記のとおりCas9およびsgRNA発現プラスミドとともにCas9ヌクレアーゼとともにU2OS細胞中に形質移入した。dsODN特異的増幅、ハイスループットシーケンシング、およびマッピングを実施してDSB活性を含有するゲノム間隔を同定した。野生型対D1135E実験のため、オフターゲットリードカウントをオンターゲットリードカウントに正規化して、試料間のシーケンシング深度の差を補正した。次いで、野生型およびD1135E SpCas9についての正規化比を比較してオフターゲット部位における活性の変化倍率を計算した。GUIDE−seqについての野生型およびD1135E試料が、設定標的部位における類似のオリゴタグインテグレーション率を有するか否かを決定するため、表1に列記されるプライマーを使用して100ngのゲノムDNA(上記のとおり単離)からPhusion Hot−Start Flexにより設定標的遺伝子座を増幅することにより制限断片長多型(RFLP)アッセイを実施した。ほぼ150ngのPCR産物を20UのNdeI(New England BioLabs)により37℃において3時間消化してから、Agencourt Ampure XPキットを使用してクリーンアップした。Qiaxcelキャピラリー電気泳動装置(QIagen)を使用してRFLP結果を定量してオリゴタグインテグレーション率を推定した。T7E1アッセイを上記のとおり同様の目的のために実施した。

実施例1 標的化範囲の制限に対処する1つの潜在的な解決策は、新規PAM特異性を有するCas9バリアントを遺伝子操作することである。PAM特異性を変更する従来の試行は、塩基特異的SpCas9−PAM相互作用についての構造情報を利用し、2番目および3番目のPAM位置におけるグアニンヌクレオチドに接触するアルギニン残基(R1333およびR1335)をそれぞれ突然変異させた(Anders et al.,Nature 513,569−573(2014))。両方のアルギニンのグルタミンによる置換(側鎖がアデニンと相互作用すると予測され得るもの)は、インビトロで予測NAA PAMを保有する標的を開裂し得るSpCas9バリアントを生じさせ得なかった(Anders et al.,Nature 513,569−573(2014))。ヌクレアーゼ誘導インデルが蛍光の損失をもたらすヒト細胞ベースU2OS EGFPレポーター遺伝子崩壊アッセイ(Reyon et al.,Nat Biotechnol 30,460−465(2012);Fu et al.,Nat Biotechnol 31,822−826(2013))を使用して、本発明者らは、R1333Q/R1335Q SpCas9バリアントがNAA PAMを有する標的部位を効率的に開裂し得ないことを確認した(図1a)。さらに、本発明者らは、単一のR1333QおよびR1335Q SpCas9バリアントが、それぞれ、それらの予測NAGおよびNGA部位をそれぞれ有する標的部位を効率的に開裂し得ないことを見出した(図1a)。したがって、本発明者らは、PAM特異性の再遺伝子操作は、R1333およびR1335以外の位置における追加の突然変異を要求し得ることを結論付けた。例えば、入手可能な構造情報は、K1107およびS1136が、PAM中の2番目および3番目の塩基への直接および間接的な副溝の接触を作ることを示す(Anders et al.,Nature 513,569−573(2014))。したがって、これらの位置におけるまたはその付近の追加の変更は、PAM特異性を変更することを必要とし得ることが妥当である。

PAM特異性の改変に重要であり得る追加の位置を同定するため、本発明者らは、既に使用されている細菌選択系を、ホーミングエンドヌクレアーゼの特性を試験するように適合させた(以下、陽性選択と称する)(Chen&Zhao,Nucleic Acids Res 33,e154(2005);Doyon et al.,J Am Chem Soc 128,2477−2484(2006))。本発明者らのこの系の適合において、誘導性毒性遺伝子をコードする陽性選択プラスミドのCas9媒介開裂により、線形化プラスミドの後続の分解および損失に起因して細胞生存が可能となる(図1bおよび図12a)。SpCas9が陽性選択系において機能し得ることを確立した後、本発明者らは、野生型およびR1335Qバリアントの両方を、NGA PAMを有する標的部位を保有する選択プラスミドを開裂するそれらの能力について試験し、予測されるとおり生存を観察し得なかった(図12a)。機能獲得突然変異についてスクリーニングするため、本発明者らは、1キロベース当たり5.2個の突然変異の平均率でランダムに突然変異したPAM相互作用ドメイン(アミノ酸位置1097〜1368)を担持する野生型およびR1335Q SpCas9ライブラリーを生成した(図12bおよび方法)。NGA PAMを有する標的部位を含有する陽性選択プラスミドを有する細菌中にこれらのライブラリーを導入し、選択培地上でプレーティングした。R1335Qベースライブラリーからの生存クローンの配列により、既存のR1335Q突然変異に加わった最大頻度の置換は、D1135V/Y/N/EおよびT1337Rであることが明らかになった(表3)。本発明者らは、野生型SpCas9ベースライブラリー選択についてより少ない生存物を得たが、それらのクローンの配列もD1135V/Y/NおよびR1335Q突然変異を含んだ。次に、本発明者らは、ヒト細胞ベースEGFP崩壊アッセイを使用してD1135V/Y/N/E、R1335Q、およびT1337R突然変異の全ての考えられる単一、二重および三重の組合せを担持するSpCas9をアセンブルおよび試験した。この分析は、3つ全ての位置における置換を有するSpCas9バリアントが、NGA PAMに対して最大活性を示すが、NGG PAMに対して最小活性も示すことを示した(図1c)。本発明者らは、2つのSpCas9バリアント、D1135V/R1335Q/T1337RおよびD1135E/R1335Q/T1337R(以下、それぞれVQRおよびEQR SpCas9バリアントと称する)を選択した。なぜなら、それらは、さらなる特徴付けのためのNGAおよびNGG PAM間の最大の差(図1c)を有したためである。

本発明者らの新規SpCas9バリアントの全体PAM特異性プロファイルを評価するため、本発明者らは、細菌ベース陰性選択系を使用した(図1dおよび図13a)。従来の研究は、類似タイプの選択系を使用してCas9ヌクレアーゼの開裂部位優先性を同定した(Jiang et al.,Nat Biotechnol 31,233−239(2013);Esvelt et al.,Nat Methods 10,1116−1121(2013))。このアッセイの本発明者らの変法(本発明者らは、部位枯渇アッセイと称する)では、プロトスペーサーに隣接して配置されるランダム化6bp配列を担持するプラスミドのライブラリーを大腸菌(E.coli)中のCas9/sgRNA複合体による開裂について試験する(図13b)。Cas9/sgRNA複合体による開裂に耐性であるプロトスペーサー隣接配列を有するプラスミドにより、抗生物質耐性遺伝子の存在に起因して細胞生存が可能となる一方、開裂性配列を担持するプラスミドは、分解され、したがって、ライブラリーから枯渇する(図13b)。約100,000個の標的化可能でない配列のハイスループットシーケンシングにより、任意の所与のPAMについての選択後PAM枯渇値(PPDV)を計算することができた。PAM(またはPAMの群)のPPDVは、選択後集団中のそのPAMの頻度を選択前ライブラリー中のその頻度により除したものと定義される。この定量値は、そのPAMに対するCas9活性の推定値を提供する。2つのランダム化PAMライブラリー(それぞれ異なるプロトスペーサーを有する)に対して触媒的に不活性なCas9(dCas9)について得られたプロファイルにより、任意の所与のPAMまたはPAMの群についてのPPDVの統計的に有意な変化を表すものを定義することが可能となった(図13c)。次いで、本発明者らは、2つのランダム化PAMライブラリーについて得られた野生型SpCas9についてのPPDVが、その既に記載された標的化可能なPAMのプロファイル(Jiang et al.,Nat Biotechnol 31,233−239(2013))(図1e)を再現することを実証することにより本発明者らの部位枯渇アッセイをバリデートした。

部位枯渇アッセイを使用して、本発明者らは、2つのランダム化PAMライブラリーを使用してVQRおよびEQR SpCas9バリアントについてのPAM特異性プロファイルを得た。VQRバリアントは、NGANおよびNGCG PAMを担持する部位を強力に枯渇させ、NGGG、NGTG、およびNAAG PAMを担持する部位をより弱く枯渇させた(図1f)。対照的に、EQRバリアントは、NGAG PAMを強力に、NGAT、NGAA、およびNGCG PAMをより弱く枯渇させ(図1f)、それは、VQRバリアントに対して潜在的により制限される標的化範囲を実証した。部位枯渇アッセイにより同定されたPAMがヒト細胞中でも認識することができるか否かを試験するため、本発明者らは、EGFP崩壊アッセイを使用して標的部位に対するVQRおよびEQR SpCas9バリアントによる開裂を評価した。VQRバリアントは、NGAN PAMを担持するEGFPにおける部位をロバストに開裂し(相対効率は、NGAG>NGAT=NGAA>NGACである)、およびさらにNGCG、NGGG、およびNGTG PAMを担持する部位を一般により低い効率で開裂した(図1g)。EQRバリアントは、ヒト細胞において他のNGAN PAMよりもNGAGおよびNGNG PAMについてのその優先性も再現し、ここでも全てVQRバリアントよりも低い活性であった(図1g)。まとめると、ヒト細胞におけるこれらの結果は、細菌部位枯渇アッセイについて観察されたものを強力に反映し(図14)、細菌アッセイにおける0.2のPPDV(5倍枯渇を表す)が、ヒト細胞における活性についての妥当な予測閾値を提供することを示唆した(図14)。

次に、本発明者らは、NGC PAMを認識し得るSpCas9バリアントを同定する試行により本発明者らの遺伝子操作方針の一般化可能性を拡張することを求めた。本発明者らは、最初に、シトシンと相互作用することが予測することができるR1335のアミノ酸置換(D、E、S、またはT)を担持するCas9突然変異体を設計し、陽性選択系を使用してNGC PAM部位に対する活性を見出さなかった。次いで、本発明者らは、それらの単置換SpCas9バリアントのそれぞれのPAM相互作用ドメインをランダムに突然変異させたが、依然として陽性選択において生存コロニーを得ることができなかった。T1337R突然変異は、本発明者らのVQRおよびEQR SpCas9バリアントの活性を増加させたため(図1c)、本発明者らは、この突然変異と、A、D、E、S、T、またはVのR1335置換と組み合わせ、ここでもそれらのPAM相互作用ドメインをランダムに突然変異させた。これら6つの突然変異ライブラリーの2つ(既存のR1335E/T1337RおよびR1335T/T1337R置換を担持する)を使用する選択により、種々の追加の突然変異を保有する生存コロニーが生じた(表3)。細菌およびヒト細胞ベースアッセイの両方を使用する種々の選択クローンの特徴付けは、特に4つの位置における置換(D1135V、G1218R、R1335E、およびT1337R)が、NGC PAMの開裂に重要であると考えられることを示唆した。EGFP崩壊アッセイを使用するこれらの突然変異の全ての潜在的な単一、二重、三重、および四重の組合せのアセンブリおよび試験は、四重VRERバリアントがNGCG PAMに対する最大活性およびNGGG PAMに対する最小活性を示すことを確立した(図1h)。部位枯渇アッセイを使用するVRERバリアントの分析により、それは、NGCG PAMに高度に特異的であることが明らかになった(図1i)。この結果と一致して、VRERバリアントを用いてヒト細胞において実施されたEGFP崩壊アッセイにより、NGCG PAMを有する部位の効率的な開裂、NGCA、NGCC、およびNGCT PAMを有する部位の大幅に減少した不一致の開裂、ならびにNGAG、NGTG、およびNGGG PAMを有する部位に対する本質的な無活性が明らかになった(図1j)。

本発明者らのVQRおよびVRER SpCas9バリアントが、野生型SpCas9により現在、改変可能でない部位を標的化し得ることを直接実証するため、本発明者らは、ゼブラフィッシュ胚およびヒト細胞中の内在性遺伝子に対するそれらの活性を試験した。単細胞ゼブラフィッシュ胚において、本発明者らは、VQRバリアントが、NGAG PAMを担持する内在性遺伝子部位を20〜43%の平均突然変異誘発頻度で効率的に改変し得ること(図2a)、およびインデルが予測開裂部位において生じることを見出した(図15)。ヒト細胞において、本発明者らは、VQRバリアントが、NGAG、NGAT、およびNGAA PAMを保有する4つの異なる内在性遺伝子にわたる16個の部位をロバストに改変することを見出した(6〜53%の範囲、平均33%;図2bおよび図16a)。重要なことに、本発明者らは、野生型SpCas9が、ゼブラフィッシュおよびヒト細胞中のNGAGおよびNGAT PAMを有する同一部位のほとんどを効率的に変更し得ないことを確認したが(図16b)、NGG PAMを担持する隣接部位を効率的に改変し得た(図16b)。同様に、3つの内在性ヒト遺伝子にわたるNGCG PAMを有する9つの部位におけるVRERバリアント活性を試験した場合、本発明者らはまた、ロバストな平均崩壊頻度を観察した(5〜36%の範囲、平均21%;図2d)。本発明者らの部位枯渇データ(図1eおよび1f)と一致して、VQRバリアントは、VRERバリアントについて観察されたものと同様にNGCG PAM部位の効率を変更した一方、野生型SpCas9は変更し得なかった(図2d)。参照ヒトゲノム配列のコンピュータ分析は、本発明者らのVQRおよびVRER SpCas9バリアントの追加が、野生型SpCas9単独について既に考えられたものと比較して潜在的な標的部位の範囲を2倍にすることを示す(図2e)。まとめると、これらの結果は、本発明者らの遺伝子操作SpCas9バリアントが、ゼブラフィッシュ胚およびヒト細胞中の従来アクセス不可能な内在性部位を改変し得ることによりSpCas9の標的化範囲を広げることを実証する。

本発明者らのVQRおよびVRER SpCas9ヌクレアーゼのゲノムワイド特異性を決定するため、本発明者らは、近年記載されたGUIDE−seq(シーケンシングによる二本鎖分解のゲノムワイドな偏りのない識別)法10を使用してヒト細胞におけるそれらのSpCas9バリアントのオフターゲット開裂イベントをプロファイリングした。本発明者らは、設定オンターゲット部位における高い改変効率を誘導し得ること本発明者らが示した合計13個の異なるsgRNA(図2bおよび2dから、それぞれVQRについて8つ、およびVRERについて5つ)を使用してVQRおよびVRER SpCas9バリアントのゲノムワイド活性をプロファイリングした。これらのGUIDE−seq実験について、多数の重要な観察が見られた:ヒト細胞中で本発明者らのSpCas9バリアントにより誘導されたオフターゲットDSBの数は、野生型SpCas9について既に観察されたものと同等である(またはVRERバリアントの場合、おそらくよりいっそう良好である)(図2f)。本発明者らは、VRERについて観察された高いゲノムワイド特異性が、NGCG PAMについてのその制限された特異性、およびおそらくヒトゲノム中のNGCG PAMを有する部位の相対枯渇の両方から生じ得たことを留意する(図2e)21。さらに、観察されたオフターゲット部位は、一般に、1塩基だけ3’に「シフトした」PAM(図1fおよび1iからのPAMを図17の部位のものと比較する)についていくらかの寛容を含む、本発明者らの部位枯渇実験により予測される予測PAM配列を有する。最後に、本発明者らのVQRおよびVRER SpCas9バリアントについてのオフターゲット部位中に見出されたミスマッチの位置および数(図17)は、それらの分布において、非反復配列に標的化されるsgRNAについて野生型SpCas9について本発明者らが既に観察したものと類似する10

従来の研究は、SpCas9による不完全なPAM認識が、ヒト細胞中の非カノニカルNAG、NGA、および他のPAMを含有する不所望な部位の認識をもたらし得ることを示している(Hsu et al.,Nat Biotechnol 31,827−832(2013);Tsai et al.,Nat Biotechnol 33,187−197(2015);Jiang et al.,Nat Biotechnol 31,233−239(2013);Mali et al.,Nat Biotechnol 31,833−838(2013);Zhang et al.,Sci Rep 4,5405(2014))。したがって、本発明者らは、PAM相互作用を媒介する残基におけるまたはその付近の突然変異が、SpCas9PAM特異性を改善し得るか否かの探索に関心を向けた。VQRバリアントの遺伝子操作の間、本発明者らは、D1135E SpCas9突然変異体が、野生型SpCas9と比較してカノニカルNGG PAMおよび非カノニカルNGA PAM間を良好に区別することが考えられることに留意した(図1c)。この観察を考慮して、本発明者らは、本発明者らの部位枯渇アッセイを使用してD1135EバリアントのPAM認識プロファイルを包括的に評価した。この実験により、野生型SpCas9に対してD1135E SpCas9について非カノニカルNAG、NGA、およびNNGG PAMの枯渇の減少が明らかになった(図3a)。興味深いことに、この効果は、本発明者らが使用した2つのプロトスペーサーの一方について、より傑出しており、それは、非カノニカルPAM認識に対するD1135E置換の影響がある程度プロトスペーサー依存的に変動し得ることを示唆した。重要なことに、本発明者らは、いかなる新たな非カノニカルPAM特異性の出現も観察しなかった。

次に、本発明者らは、D1135E SpCas9の改善されたPAM特異性がヒト細胞中でも観察することができるか否かを試験した。非カノニカルNAGまたはNGA PAMを有する8つの標的部位に対する野生型およびD1135E SpCas9の直接比較において、本発明者らは、それらの部位が、EGFP崩壊アッセイにおいて野生型SpCas9よりもD1135Eにより一貫して効率的に開裂されないことを観察した(図3b、1.94の活性の平均減少倍率)。重要なことに、野生型およびD1135E SpCas9は、両方とも4つのEGFPレポーター遺伝子部位およびカノニカルNGG PAMを有する6つの内在性ヒト遺伝子部位に対する同等の活性を示し(それぞれ図3bおよび3c)、それは、D1135EバリアントがNGG PAMを有するオンターゲット部位の開裂にそれほど影響しないことを実証した(10個全ての部位にわたる1.04の活性の平均減少倍率)。本発明者らが、ヒト細胞中に形質移入されたCas9コードプラスミドの濃度を減少させたタイトレーション実験により、野生型およびD1135E SpCas9の活性には、それらを同一部位に標的化した場合に実質的な差異がないことが明らかになり(図3d)、それは、D1135Eバリアントについて観察された増加した特異性が、単にタンパク質の不安定化の結果でないことを意味した。

D1135Eの導入がSpCas9のオフターゲット開裂効果を低減させ得るか否かをより直接的に評価するため、本発明者らは、ディープシーケンシングを使用して3つの異なるsgRNAの25個の既に公知のオフターゲット部位(Hsu et al.,Nat Biotechnol 31,827−832(2013);Tsai et al.,Nat Biotechnol 33,187−197(2015);Fu et al.,Nat Biotechnol 31,822−826(2013))に対して野生型およびD1135E SpCas9により誘導された突然変異率を比較した。これらの25個の部位は、スペーサー配列ならびにカノニカルNGGおよび非カノニカルPAM中の両方の種々のミスマッチを有するオフターゲット部位を含んだ(図3e)。これらのディープシーケンシング実験の結果により、D1135Eバリアントが、3つのオンターゲット部位において観察された突然変異頻度に対してバックグラウンドインデル率を超える活性を有する22個のオフターゲット部位の19個における低減した突然変異頻度を示すことが明らかになった(図3eおよび3f)。興味深いことに、これらの低減したオフターゲット突然変異頻度は、カノニカルPAMを有する多くの部位において観察され、それは、D1135Eによる特異性の獲得が、非カノニカルPAMを有する部位にのみ制限されないことを示唆した。D1135Eに関連する特異性の改善をゲノムワイドスケールで評価するため、本発明者らは、3つの異なるsgRNA(そのうちの2つは、カノニカルおよび非カノニカルPAMを有するオフターゲット部位を有することが既に公知であった(Hsu et al.,Nat Biotechnol 31,827−832(2013);Tsai et al.,Nat Biotechnol 33,187−197(2015);Fu et al.,Nat Biotechnol 31,822−826(2013))とともに野生型およびD1135E SpCas9を使用するGUIDE−seq実験を実施した。本発明者らは、野生型SpCas9と比較してD1135E SpCas9バリアントを使用した場合、ゲノムワイド特異性の一般化した改善を観察した(図3g)。本発明者らが試験した3つ全てのsgRNAについて、カノニカルまたは非カノニカルPAMを有するミスマッチスペーサーを含有するオフターゲット部位において特異性のそれらの改善が観察された(図18)。重要なことに、これらのGUIDE−seq実験により、D1135E突然変異の導入が、SpCas9により誘導されるオフターゲット効果の数を増加させないことが実証された。まとめると、これらの結果は、D1135E置換がSpCas9の全体特異性を増加させ得ることを示す。

上記の実験の全てはSpCas9を用いて実施したが、新規PAM特異性を有するCas9の特徴付けおよび遺伝子操作に魅力的な候補となり得る他の細菌からの多くのCas9オルソログが存在する(Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014);Ran et al.,Nature 520,186−191(2015))。この実行可能性を探索するため、本発明者らは、2つのより小さいサイズのオルソログ、CRISPR1遺伝子座からのストレプトコッカス・サーモフィラス(Streptococcus thermophilus)Cas9(St1Cas9)(Deveau et al.,J Bacteriol 190,1390−1400(2008);Horvath et al.,J Bacteriol 190,1401−1412(2008))および黄色ブドウ球菌(Staphyloccocus aureus)(SaCas9)(Hsu et al.,Cell 157,1262−1278(2014);Ran et al.,Nature 520,186−191(2015))が、本発明者らの細菌選択アッセイにおいても機能し得るか否かを決定した。St1Cas9のPAMは、NNAGAA(配列番号3)として既に特徴付けされている一方(Esvelt et al.,Nat Methods 10,1116−1121(2013);Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014);Deveau et al.,J Bacteriol 190,1390−1400(2008);Horvath et al.,J Bacteriol 190,1401−1412(2008))、既に記載されているアプローチ(Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014))を使用してSaCas9 PAMを生物情報学的に導出する本発明者らの試行は、コンセンサス配列を生じさせ得なかった(データ示さず)。したがって、本発明者らは、本発明者らの部位枯渇アッセイを使用し、SaCas9についておよび陽性対照としてSt1Cas9についてのPAMを決定した。これらの実験は、2つの異なるプロトスペーサーおよびそれぞれプロトスペーサーについての2つの異なる相補性長さを有するsgRNAを使用して実施し、それぞれのCas9について4つの選択をもたらした。St1Cas9について、本発明者らは、既に記載されている6つのPAM(Esvelt et al.,Nat Methods 10,1116−1121(2013);Fonfara et al.,Nucleic Acids Res 42,2577−2590(2014);Horvath et al.,J Bacteriol 190,1401−1412(2008))に加えて2つの新規PAMを同定した(図4aならびに図19cおよび19d、SaCas9 PAM特異性の近年の定義(Ran et al.,Nature 520,186−191(2015))と一致)。SaCas9について、主に、1つのプロトスペーサーについて観察される制限されたPAM優先性に起因する4つの選択間のPPDV変動性が存在した。結果として、3つのPAMのみが4つ全ての実験において5倍超で枯渇した:NNGGGT(配列番号4)、NNGAAT(配列番号6)、NNGAGT(配列番号5)(図4b)。しかしながら、本発明者らは、第2のプロトスペーサーライブラリーを有する多くのより標的化可能なPAMを同定し、それは、SaCas9が多数の追加のPAMを認識し得ることを意味した(図18cおよび18d)。本発明者らの部位枯渇実験において同定されたSt1Cas9についてのPAM(NNAGAA(配列番号3)およびSaCas9についてのNNGAGT(配列番号5))を使用して、本発明者らは、St1Cas9およびSaCas9の両方が細菌陽性選択系において効率的に機能し得ることを見出し(図4c)、それは、それらのPAM特異性を突然変異誘発および選択により改変し得ることを示唆する。

全てのCas9オルソログがそれらの天然環境外で効率的に機能するわけではないため(Esvelt et al.,Nat Methods 10,1116−1121(2013))、本発明者らは、St1Cas9およびSaCas9が、ヒト細胞中の標的部位をロバストに開裂し得るか否かを試験した。St1Cas9は、ヒト細胞中でヌクレアーゼとして機能するが、数個の部位に対してのみ機能することが既に示されている(Esvelt et al.,2013;Cong et al.,Science 339,819−823(2013))。本発明者らは、変動長さの相補性領域を有するsgRNAを使用してNNAGAA(配列番号3)PAMを保有する部位に対するSt1Cas9活性を評価し、5つの標的部位の3つにおいて高い活性を見出した(図4d)。SaCas9について、本発明者らは、NNGGGT(配列番号4)またはNNGAGT(配列番号5)PAMを保有する8つの部位において効率的な活性を観察した(図4e)。St1Cas9およびSaCas9の両方について、活性およびスペーサー相補性の長さ間の明らかな相関は観察されなかった(図19e)。次に、本発明者らは、St1Cas9およびSaCas9がヒト細胞中で内在性遺伝子座を効率的に改変し得るか否かを決定した。St1Cas9について、4つの遺伝子にわたる11個の部位のうちの7つが、T7E1アッセイにより判断されるとおり効率的に崩壊された一方(1〜25%、平均13%;図4f)、SaCas9は、4つの遺伝子にわたる16個の試験部位においていくぶんよりロバストな活性を示した(1%〜37%、平均19%;図4g)。ここでも、St1Cas9およびSaCas9についてのsgRNAスペーサー長さを考慮した場合に区別の傾向は観察されなかった(図19f)。まとめると、本発明者らの結果は、St1Cas9およびSaCas9が、本発明者らの細菌ベース選択およびヒト細胞の両方においてロバストに機能することを示し、それらを、新規PAM特異性を有する追加のSpCas9バリアントの遺伝子操作のための魅力的な候補とする。

実施例2.黄色ブドウ球菌(Staphylococcus aureus)Cas9のPAM特異性の遺伝子操作 本発明者らは、化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)のいずれの残基がPAM認識に重要であるかに知得したため(R1333およびR1335)、本発明者らは、Cas9オルソログのアラインメントを生成して黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)のPAM相互作用ドメイン(PIドメイン)中の相同性残基を探索した(図6参照)。本発明者らは、SaCas9のPAMがNNGRRT(配列番号46)(Nは、任意のヌクレオチドであり、Rは、AまたはGである)であることを既に示した。PAMの3番目の位置におけるGについての優先性が本発明者らのデータに基づき最も厳密な要求であると考えられるため、本発明者らは、正荷電残基、例えば、リジン(K)またはアルギニン(R)がその相互作用を媒介し得ることを仮定した。図6に示されるとおり、SpCas9のR1333およびR1335との相同性領域中のSaCas9中の多数の候補残基、例として、K1101、R1012、R1015、K1018、およびK1023が存在する。

本発明者らは、これら5つの位置におけるアラニン(A)およびグルタミン(Q)置換を生成し、突然変異クローンが依然としてカノニカルNNGRRT PAM(配列番号46)を含有する部位を開裂し得るか否か、または場合により、従来、標的化可能でないNNARRT(配列番号43)のPAMを開裂し得るか否かを決定した(図7)。本発明者らは、選択条件下でプレーティングした場合の細菌コロニーの生存によりCas9の活性を可視化することができる本発明者らの細菌アッセイ(先行特許出願に記載)を利用した。Cas9の相対活性は、非選択培地に対する選択培地上で増殖する細菌コロニーの比を計算することにより定量することができる。図7において、本発明者らは、R1015AおよびR1015Q突然変異のみが、カノニカルNNGAGT(配列番号5)PAMを認識するSaCas9の能力に影響する一方、ピーク、NNARRT(配列番号43)PAM(NNAAGT(配列番号41)またはNNAGGT(配列番号42))を標的化し得る突然変異は見られないことを示す。これらの結果は、R1015がSaCas9によるPAM認識における役割を担うことを示唆した。

次いで、本発明者らは、野生型SaCas9、またはR1015Qバリアントのいずれかを選択し、ランダムに突然変異させ、NNAAGT(配列番号41)またはNNAGGT(配列番号42)PAMを含有する部位に対する変更PAM特異性クローンについて選択した(SpCas9について既に記載)。本発明者らは、図8(および表6)に示されるアミノ酸配列を有する、それらのPAMを標的化し得る多数の突然変異クローンを同定し、再スクリーニングし、シーケンシングした。これらの配列のまとめにおいて、多数の変化がSaCas9の変更に極めて重要である一方(R1015Q、R1015H、E782K)、多くの他の突然変異も寄与し得ると考えられる(N968K、E735K、K929R、A1021T、K1044N)。

NNARRT(配列番号43)に対するSaCas9のPAM特異性を変更するために必須の位置および突然変異を同定した後、本発明者らは、単一、二重、および三重突然変異体組合せを作製することにより特異性変化に対する最も豊富な突然変異の寄与を評価した(表5)。本発明者らの陽性選択(既に記載)における種々のPAMに対するそれらの突然変異を試験した場合、本発明者らは、多数の突然変異がカノニカルNNGAGT(配列番号5)および非カノニカルNNAAGT(配列番号41)またはNNAGGT(配列番号42)PAMの両方に対する活性を可能とする一方、野生型SaCas9酵素が非カノニカルPAMに対する極めて低い活性を有することを観察した。具体的には、三重突然変異がPAMの3番目の位置における緩和した特異性を可能とすると考えられ(KKQ、KKH、GKQ、GKH−E782/N968/R1015位の突然変異に基づき命名した)、それは、カノニカルNNGRRT(配列番号46)に対するNNRRRT(配列番号45)のコンセンサスPAMモチーフをもたらす。PAM要求のこの緩和は、理論的には、SpCas9の標的化範囲を2倍にする。以下、バリアントは、782、968、および1015位におけるそれらのアイデンティティに基づき命名する。例えば、E782K/N968K/R1015Hは、SaCas9KKHバリアントと命名する。

次に、本発明者らは、ヒト細胞EGFP崩壊アッセイ(既に記載)において三重突然変異体の2つを評価して遺伝子操作バリアントがヒト細胞環境中で非カノニカルPAMを標的化し得るか否かを決定した(図9)。非カノニカルPAMを含有するEGFP遺伝子内の部位を標的化し得るバリアントは、EGFPコードフレームを崩壊させ、シグナルの損失をもたらす。この結果により、KKQおよびKKH突然変異体の両方がカノニカルNNGRRT(配列番号46)PAMに対して野生型SaCas9と類似する活性を保持するが、NNARRT(配列番号43)PAMに対してかなり高い活性を有することが明らかになった。

全体として、本発明者らは、GからR(AまたはG)へのPAMの3番目の位置における野生型酵素の優先性を緩和することが考えられるSaCas9中の突然変異(KKQまたはKKHバリアント)を同定した。これは、NNGRRT(配列番号46)PAM制約からNNRRRT(配列番号45)PAMにSaCas9の標的化を効率的に緩和する。

本発明者らは、ヒト細胞中でNNARRT(配列番号43)PAMを標的化し得るバリアントを良好に誘導したため、次に、本発明者らは、NNCRRT(配列番号47)またはNNTRRT(配列番号48)についての特異性を有するバリアントを遺伝子操作することができるか否かを追求した。これを行うため、本発明者らは、最初に、R1015をEに(PAMの3番目の位置におけるCを規定する場合)、およびLまたはMに(PAMの3番目の位置におけるTを規定する場合)突然変異させ、本発明者らの細菌陽性選択アッセイ(既に記載)においてそれらの予測PAMに対してそれらを試験した(図10)。本発明者らは、野生型SaCas9がNNCAGT(配列番号511)PAMを含有する部位を非効率に開裂し得ること、R1015Eバリアントがその同一部位に対してわずかに良好な活性を有すること、ならびに野生型または他の指向突然変異のいずれも他のPAMに対する活性を与えないことを観察した(図10)。これは、本発明者らがR1015Qについて観察したとおり、NNCRRT(配列番号47)およびNNTRRT(配列番号48)PAMを標的化し得るSaCas9バリアントを遺伝子操作するために他の突然変異が必要であることを示唆した。

NNARRT(配列番号43)PAMに対するSaCas9進化バリアントのため、ER1015(H/Q)とともに782KおよびN968K突然変異が必要および必須であった。これらの突然変異がそれらの予測PAMに対するR1015(E/L/M)バリアントの活性を増加させるか否かを試験するため、本発明者らは、KKE、KKL、およびKKMバリアントを生成した。図11に示されるとおり、KKE、KKL、およびKKMは全て、それらの予測PAMに対するロバストな活性を有した。

本発明者らは、KKQ、KKH、KKE、KKL、またはKKMバリアントが、PAMの3番目の位置における任意のヌクレオチドに対する緩和した特異性を有するか否かに関しても関心があったため、NNNRRT PAMを含有する本発明者らの細菌陽性選択アッセイにおける多数の部位を調査した。図11に示されるとおり、若干の例外はあるものの、それらのバリアントのほぼ全てが、NNNRRT PAMを含有する全ての試験部位を開裂し得る。これは、それらがNNNRRT部位を効率的に標的化し得るため、それらがPAMの3番目の位置における緩和した特異性を有することを示した。これは、数個のNNNRRT部位に対する極めて低い活性でNNGAGT(配列番号5)部位のみを効率的に標的化し得る野生型タンパク質(ENR)とは対照的である。まとめると、KKH(および図11に示される他の類似の誘導体)バリアントは、細菌中でNNNRRT PAMを含有する部位を標的化し得、SaCas9の標的化範囲を効率的に4倍にする。

したがって、KKHバリアント(および図6の他のバリアントの一部)は、細菌中でNNNRRT PAMを標的化し得、SaCas9の標的化範囲を効率的に4倍にする。

実施例3のための方法 以下の材料および方法を実施例3に使用した。

プラスミドおよびオリゴヌクレオチド オリゴヌクレオチドを表11に列記し、sgRNA標的部位を表12に列記し、本試験において使用されるプラスミドを表10に列記する。

細菌Cas9/sgRNA発現プラスミドを使用し、それぞれ別個のT7プロモーター下で発現されるSaCas9のヒトコドン最適化バージョンおよびsgRNAの両方を発現させた。選択において使用される細菌発現プラスミドは、BPK2101(実施例1〜2参照)に由来した一方、部位枯渇アッセイにおいて使用されるものを改変して短縮リピート:アンチリピート配列を有するsgRNAを発現させた(下記参照)。これらの細菌発現プラスミド中の全てのsgRNAは、T7プロモーターからの適切な発現のためのスペーサー配列の5’末端における2つのグアニンを含んだ。

SaCas9バリアントのライブラリーを生成するため、Mutazyme II(Agilent Technologies)を使用してSaCas9のアミノ酸M657〜G1053を約5.5個の突然変異/キロベースの頻度においてランダムに突然変異させた。野生型およびR1015Q SaCas9の両方を突然変異誘発のための出発テンプレートとして使用し、6×106個超のクローンの推定複雑度を有する2つのライブラリーをもたらした。

陽性選択プラスミドは、XbaI/SphI消化p11−lacY−wtx1(Chen,Z.&Zhao,H.A highly sensitive selection method for directed evolution of homing endonucleases.Nucleic Acids Res 33,e154(2005))中に、標的部位をコードするオリゴヌクレオチド二本鎖をライゲートすることによりアセンブルした。部位枯渇実験のため、異なるスペーサー配列を含有する2つの別個のライブラリーを生成した。それぞれのライブラリーのため、スペーサー配列に隣接する8つのランダム化ヌクレオチド(PAMに代えて)を含有するオリゴヌクレオチドをボトム鎖プライマーと複合体化させ、クレノウ(−エキソ)を使用してフィルインした(表11参照)。得られた産物をEcoRIにより消化し、EcoRI/SphI消化p11−lacY−wtx1中にライゲートした。2つの部位枯渇ライブラリーの推定複雑度は、4×106個超のクローンであった。

ヒト細胞実験のため、CAGプロモーターを含有するプラスミドからヒトコドン最適化野生型およびバリアントSaCas9を発現させた(表12)。BsmBI消化VVT1(実施例1〜2参照またはBPK2660(全長120ntのcrRNA:tracrRNA sgRNAまたは84ntの短縮リピート:アンチリピートバージョンをそれぞれ含有する)中に、スペーサー配列をコードするオリゴヌクレオチド二本鎖をライゲートすることにより、sgRNA発現プラスミド(U6プロモーターを含有する)を生成した。ヒト発現のために本試験において使用される全てのsgRNAは、U6プロモーターからの適切な発現を確保するためのスペーサーの5’末端における1つのグアニンを含み、既に記載のもの(Ran,F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520,186−191(2015))と類似する短縮sgRNA(図37A〜B)も使用した。

Cas9オルソログ配列の生物情報学的分析 従来の研究(Fonfara,I.et al.Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.Nucleic Acids Res 42,2577−2590(2014);Ran,F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520,186−191(2015);Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature 513,569−573(2014))において実施されたアラインメントと同様に、ClustalW2(ebi.ac.uk/Tools/msa/clustalw2/)を使用してSpCas9およびSaCas9の両方と類似するCas9オルソログをアラインした。Geneiousバージョン8.1.6およびESPript(espript.ibcp.fr/ESPript/ESPript/)を使用して、得られた系統樹およびタンパク質アラインメントを可視化した。

細菌ベース陽性選択アッセイ 細菌陽性選択アッセイは、既に記載のとおり実施した(実施例1〜2参照)。簡潔に述べると、陽性選択プラスミドを含有する大腸菌(E.coli)BW25141(λDE3)(Kleinstiver et al.,Nucleic Acids Res 38,2411−2427(2010))中に、Cas9/sgRNAプラスミドを形質転換した。非選択(クロラムフェニコール)および選択(クロラムフェニコール+10mMのアラビノース)条件上の両方で形質転換物をプレーティングした。生存率:(選択プレート上のコロニーの数/非選択プレート上のコロニーの数)×100を計算することにより、選択プラスミドのCas9開裂を推定した。代替PAMを認識し得るSaCas9バリアントについて選択するため、NNAAGT(配列番号41)、NNAGGT(配列番号42)、NNCAGT(配列番号511)、NNCGGT(配列番号512)、NNTAGT(配列番号513)、またはNNTGGT(配列番号514)PAMを有する陽性選択プラスミドを含有するコンピテント大腸菌(E.coli)BW25141(λDE3)中に、突然変異PIドメインを有する野生型およびR1015Qライブラリーを形質転換した。選択条件上でプレーティングすることにより、約1×105個のクローンをスクリーニングし、選択プラスミドを開裂することが想定されるSaCas9バリアントを含有する生存コロニーをミニプレップした(MGH DNA Core)。全てのバリアントを陽性選択アッセイにおいて個々に再スクリーニングし、約20%超の生存率を有するものをシーケンシングして代替PAMの認識に要求される突然変異を決定した。

細菌ベース部位枯渇アッセイ 部位枯渇実験は、既に記載のとおり実施した(実施例1〜2参照)。簡潔に述べると、野生型、触媒的に不活性な(D10A/H557A)、またはKKHバリアントSaCas9/sgRNAプラスミドのいずれかを含有するコンピテント大腸菌(E.coli)BW25141(λDE3)中に、ランダム化PAMライブラリーをエレクトロポレートした。1×105個超のコロニーをクロラムフェニコール/カルベニシリンプレート上でプレーティングし、生存コロニー内に含有されるCas9標的化に耐性であるPAMを有する選択プラスミドをマキシプレップ(Qiagen)により単離した。表11に列記されるプライマーを使用して、スペーサー配列およびPAMを含有するプラスミドの領域をPCR増幅した。KAPA HTPライブラリー調製キット(KAPA BioSystems)を使用し、それぞれの部位枯渇条件からの約500ngの精製PCR産物を使用して二重インデックス化Tru−seq Illuminaシーケンシングライブラリーを生成してから、Dana−Farber Cancer Institute Molecular Biology CoreにおいてIllumina MiSeqハイスループットシーケンシングランした。部位枯渇実験からのデータを既に記載のとおり分析し(実施例1〜2参照)、但し、スクリプトを改変して8つのランダム化ヌクレオチドを分析した。任意の所与のPAMの選択後PAM枯渇値(PPDV):そのPAMの選択後頻度と、選択前ライブラリー頻度との比を計算することにより、PAMを認識するCas9の能力を決定した。触媒的に不活性なSaCas9を使用する対照実験を使用して0.794のPPDVが、インプットライブラリーに対する統計的に有意な枯渇を表すことを確立した。

ヒト細胞培養および形質移入 本発明者らの協力者T.Cathomen氏(Freiburg)から入手したU2OS細胞、およびEGFP−PESTレポーター遺伝子の単一インテグレートコピーを保有するU2OS.EGFP細胞(Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012))を、10%のFBS、ペニシリン/ストレプトマイシン、および2mMのGlutaMAX(Life Technologies)を有するAdvancedDMEM培地(Life Technologies)培地中で37℃、5%のCO2を用いて培養した。細胞系アイデンティティは、STRプロファイリング(ATCC)およびディープシーケンシングによりバリデートし、細胞をマイコプラズマ汚染について週2回試験した。U2OS.EGFP培養培地に、400μg/mLのG418をさらに補給した。Lonza 4D−nucleofectorのDN−100プログラムを製造業者の説明書に従って使用して、750ngのCas9プラスミドおよび250ngのsgRNAプラスミドにより、細胞を同時形質移入した。

ヒト細胞EGFP崩壊アッセイ EGFP崩壊実験は、既に記載のとおり実施した(Fu,Y.et al.High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nat Biotechnol 31,822−826(2013);Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012))。形質移入の約52時間後、Fortessaフローサイトメーター(BD Biosciences)を使用して形質移入U2OS.EGFP細胞中のEGFP蛍光を計測した。Cas9および空のU6プロモータープラスミドの陰性対照形質移入を使用して全ての実験について約2.5%のバックグラウンドEGFP損失を確立した(図中に赤色破線として表す)。

T7E1アッセイ T7E1アッセイは、既に記載のとおり実施して(Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012))ヒト細胞中の内在性遺伝子座におけるCas9誘導突然変異誘発を定量した。形質移入の約72時間後、Agencourt DNAdvance Genomic DNA Isolation Kit(Beckman Coulter Genomics)を使用してゲノムDNAを単離した。表11に列記されるプライマーを使用して約100ngのゲノムDNAから、標的遺伝子座をPCR増幅した。Agencourt Ampure XPクリーンアップステップ(Beckman Coulter Genomics)後、約200ngの精製PCR産物を変性し、ハイブリダイズしてからT7E1(New England Biolabs)により消化した。2回目のクリーンアップステップ後、Qiaxcelキャピラリー電気泳動装置(Qiagen)を使用して突然変異誘発頻度を定量した。

GUIDE−seq実験 GUIDE−seq実験は、既に記載のとおり実施および分析した(Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))。簡潔に述べると、U2OS細胞を上記のとおり、Cas9およびsgRNAプラスミド、ならびにNdeI部位が埋め込まれた100pmolのリン酸化ホスホロチオエート修飾二本鎖オリゴデオキシヌクレオチド(dsODN)により形質移入した。制限断片長多型(RFLP)分析を実施してdsODNタグインテグレーション頻度の頻度を決定し(実施例1〜2参照:Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))、T7E1アッセイを実施してオンターゲットCas9突然変異誘発頻度を定量した。dsODNタグ特異的増幅およびライブラリー調製(Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))を実施してから、Illumina MiSeq Sequencerを使用してハイスループットシーケンシングを行った。潜在的なオフターゲット部位をマッピングした場合、オンターゲットスペーサー配列に対するアラインメントについてのカットオフを21ヌクレオチドスペーサーについて8ミスマッチに、22ヌクレオチドスペーサーについて9ミスマッチに、および23ヌクレオチドスペーサーについて10ミスマッチに設定した。潜在的なDNAまたはRNAバルジ(Lin,Y.et al.CRISPR/Cas9 systems have off−target activity with insertions or deletions between target DNA and guide RNA sequences.Nucleic Acids Res 42,7473−7485(2014))を有するオフターゲット部位をマニュアルアラインメントにより同定した。

実施例3.黄色ブドウ球菌(Staphylococcus aureus)Cas9のPAM特異性の遺伝子操作 CRISPR−Cas9ヌクレアーゼによる部位特異的DNA開裂は、主に、RNA−DNA相互作用によりガイドされるが、プロトスペーサー隣接モチーフ(PAM)のCas9媒介認識も要求する。一般に使用される化膿性連鎖球菌(Streptococcus pyogenes)Cas9は、そのNGG PAM内の2つのヌクレオチドを規定するが、望ましい特性を有する他のCas9オルソログは、より長鎖のPAMを認識する。伸長PAM配列は、特異性の関連から潜在的に有利である一方、ゲノム編集用途のためのCas9オルソログの標的化範囲を制限し得る。このようなCas9オルソログにより標的化可能な配列の範囲を拡大する1つの考えられる方針は、PAM内のある位置についての緩和した特異性を有するバリアントを進化させることであり得る。ここで、本発明者らは、分子進化を使用して黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)(ウイルス送達を要求する用途に有用なより小さいサイズのオルソログ)のNNGRRT(配列番号46)PAM特異性を改変した。本発明者らが同定した1つのバリアントは、KKH SaCas9と称され、NNNRRT PAMを有する内在性ヒト標的部位におけるロバストなゲノム編集活性を示す。重要なことに、GUIDE−seq法を使用して、本発明者らは、野生型およびKKH SaCas9の両方がヒト細胞中で同等数のオフターゲット効果を誘導することを示した。KKH SaCas9は、SaCas9の標的化範囲をほぼ2〜4倍だけ増加させ、それは、野生型ヌクレアーゼにより変更することができない配列の標的化を可能とした。より一般に、これらの結果は、Cas9オルソログの標的化範囲を拡大するためのPAM特異性緩和の実行可能性を実証する。本発明者らの分子進化方針は、PAMに接触する特異的残基の構造情報も先験的知識も要求せず、したがって、広範なCas9オルソログに適用可能であるはずである。

結果 本発明者らは、構造情報を要求しない、緩和したPAM認識特異性を有するCas9バリアントを遺伝子操作するための偏りのない遺伝的アプローチを考案した。本発明者らは、本発明者らがそれらの試験を開始した時点で構造データが入手可能でないSaCas9を使用してこの方針を試験した。初期ステップにおいて、本発明者らは、構造的に十分に特徴付けされたSpCas9(Jiang et al.,Science 348,1477−1481(2015);Anders et al.,Nature 513,569−573(2014);Jinek et al.,Science(2014);Nishimasu et al.,Cell(2014))との配列比較によりSaCas9についてのPAM相互作用ドメインを保守的に推定することを求めた。SpCas9およびSaCas9は、一次配列レベルにおいてかなり異なるが(図21a、図29)、10個の追加のオルソログとのその両方のアラインメントにより、SaCas9についての予測PAM相互作用ドメインを保守的に定義することが可能となった(実施例3のための方法;図29および30参照)。

SaCas9 PAM中の3番目の位置におけるグアニンは最も厳密に規定された塩基であるため(Ran et al.,Nature 520,186−191(2015))、本発明者らは、予測PIドメインをランダムに突然変異させ、本発明者らの既に記載された細菌細胞ベース法(実施例1〜2参照)を使用し、3番目のPAM位置における3つの他の考えられるヌクレオチドのそれぞれ(すなわち、NN[A/C/T]RRT PAM(NNHRRT(配列番号44));図31a)を有する部位を開裂し得る突然変異体について選択することを試行した。NNARRT(配列番号43)およびNNCRRT(配列番号47)PAMを含有する部位に対する選択からの生存バリアントの1つを除き全てが、R1015H突然変異を保有した一方、本発明者らは、NNTRRT(配列番号48)PAMについての選択からいかなるバリアントも得なかった。これらの結果は、R1015が、SpCas9 PAMの3番目の位置におけるグアニンの認識に関与し得ることを強力に示唆した。実際、本発明者らのアラインメントにおいて、SaCas9のR1015は、PAMの3番目の塩基位置の認識に既に関与する残基のSpCas9 R1335に近接することを見出した(図30)((実施例1〜2参照;Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature 513,569−573(2014))。これと一致して、本発明者らは、R1015のアラニンまたはグルタミンへの突然変異が、本発明者らの細菌選択系(図31b)において試験した場合、NNGRRT(配列番号46)PAMを含有する標的部位に対するSaCas9活性をかなり減少させることを見出した(図21b)。R1015に近接する他の正荷電残基のアラニンまたはグルタミン置換は、SaCas9活性に対する強力な効果を有さなかった(図21b、図30)。

本発明者らの細菌ベース選択結果は、R1015H突然変異が、PAMの3番目の位置におけるSaCas9の特異性を少なくとも部分的に緩和し得ることも示唆した。しかしながら、本発明者らは、NNNRRT PAMの3番目の位置における任意のヌクレオチドを有する部位に対して試験した場合、R1015H単一突然変異体が本発明者らの既に記載されたヒト細胞ベースEGFP崩壊アッセイ(Fu et al.,Nat Biotechnol 31,822−826(2013);Reyon et al.,Nat Biotechnol 30,460−465(2012))において準最適活性を有することを見出した(図21c)。これは、ヒト細胞中でR1015H突然変異体の活性を増加または最適化させるために追加の突然変異が要求され得ることを示唆したため、本発明者らは、R1015Q突然変異も保有するSaCas9の予測PIドメインを包含する領域をランダムに突然変異させた。次いで本発明者らは、本発明者らの細菌選択系を使用して3つの異なるNNHRRT(配列番号44)PAMのそれぞれを有する標的部位を開裂し得るこのライブラリーからのバリアントについて選択した。本発明者らは、R1015Hではなく、R1015Qを使用した。なぜなら、この突然変異体が細菌中で活性を示さなかったためである(図21b)。NNTRRT(配列番号48)PAMに対して選択した場合、生存クローンはここでも観察されなかったが、NNARRT(配列番号43)またはNNCRRT(配列番号47)に対するR1015Qバリアントについての選択は、E782、K929、N968における突然変異、および驚くべきことに、1015におけるQのHへの突然変異を生じさせた。

野生型SaCas9からの選択結果と組み合わせると、全ての選択にわたり同定された最も高頻度のミスセンス突然変異は、E782K、K929R、N968K、およびR1015Hであり(図21d)、それらの突然変異の組合せが、SaCas9 PAMの3番目の位置におけるAまたはCを含有する部位の効率的な開裂を許容し得ることを示唆した。したがって、本発明者らは、PAM(すなわち、NNNRRT PAM上)の3番目の位置における4つの塩基のそれぞれを保有する部位に標的化されるsgRNAを用いるヒト細胞ベースEGFP崩壊アッセイを使用してそれらの突然変異の異なる組合せを含有するSaCas9バリアントを試験した(図21e、図32)。本発明者らは、三重突然変異体の組合せE782K/N968K/R1015HおよびE782K/K929R/R1015Hを有するバリアントが、NNNRRT PAMを有する部位において高度に活性である一方(図21e、図32)、4つ全ての突然変異を含有する四重突然変異バリアント(E782K/K929R/N968K/R1015H)が、それらの部位に対する一般により低い活性を有することを見出した(図32)。本発明者らは、さらなる特徴付けのためにE782K/N968K/R1015H(以下、KKHバリアントと称する)を選択し、本発明者らのヒト細胞ベースEGFP崩壊アッセイを使用してKKHバリアントを含む3つ全ての置換が活性に要求されることを確認した(図21e)。

KKHおよび野生型SaCas9のPAM特異性をより包括的に定義するため、本発明者らは、本発明者らの既に記載された細菌細胞ベース部位枯渇アッセイ(実施例1〜2参照)を使用した(図33)。この方法は、選択後PAM枯渇値(PPDV)として定量される、ランダム化PAM配列を担持するDNAプラスミドの相対開裂(およびしたがって細菌細胞中の枯渇)を同定することにより、Cas9PAM特異性プロファイルを生じさせる。本発明者らは、PAMに代えて8つのランダム化塩基をそれぞれ有する2つの異なるスペーサー配列を有するライブラリーを使用して野生型およびKKH SaCas9の両方を用いる部位枯渇実験を実施した(図33)。触媒的に不活性なSaCas9を使用する対照実験は、任意のPAM配列の枯渇をほとんど示さず(図34a)、それは、統計的に有意な枯渇についての閾値を0.794のPPDVとして確立することを可能とした(図34b)。先行実験は、本発明者らの細菌部位枯渇アッセイにおける<0.2のPPDVを有するPAMを、本発明者らのヒト細胞ベースEGFP崩壊アッセイにおいて効率的に開裂し得ることを示した(実施例1〜2参照)。野生型SaCas9について、最も枯渇したPAM(2つのライブラリーから得られた平均PPDVに基づく)は、予測されるとおり、4つのNNGRRT(配列番号46)(PAM(図21fおよび図34c)であった。興味深いことに、<0.1の平均PPDVを有する他のPAMは、形態NNGRRN(配列番号49)のものを含み(図34d)、それは、本発明者らの細菌ベースアッセイにおいて一部のスペーサー配列についてPAMの最後の位置が、Tとして十分に規定され得ないことを示唆した(しかし、従来の報告は、インビトロPAM枯渇アッセイ、ChIP−seq、および内在性ヒト部位の標的化によりPAMの6番目の位置におけるチミンが非常に好ましいことを実証した(Ran,F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520,186−191(2015)))。対照的に、KKHバリアントについて、<0.2の平均PPDVを有するPAMは、NNGRRT(配列番号46)PAMだけでなく、4つ全てのNNARRT(配列番号43)、4つ全てのNNCRRT(配列番号47)、および4つのNNTRRT(配列番号48)PAMの3つも含んだ(図21f、図34cおよび34e)。これらの結果は、KKH SaCas9が、その野生型相当物に対して拡大したPAM標的化範囲を有すると考えられることを示唆した。

ヒト細胞中でのKKH SaCas9バリアントのロバストネスを評価するため、本発明者らは、種々のNNNRRT PAMを含有する55個の異なる内在性遺伝子標的部位に対するその活性を試験した(図22a)。KKHバリアントは、効率的な活性を示し、平均突然変異誘発頻度は全ての部位にわたり24.7%であり、部位の80%(55個の部位の44個)が、5%超の崩壊を示した。55個全ての部位にわたるKKH SaCas9活性の分析により、PAMの3番目の位置(NN[G>A=C>T]RRT;図22b)、およびPAMの4番目/5番目の位置(NNN[AG>GG>GA>AA]T;図22c)についての順序付けられた優先性が明らかになった。これと一致して、本発明者らは、NNNRRT PAMの3番目/4番目/5番目の位置の16個の考えられる組合せ間の差異を観察した(図35a)。KKH SaCas9は、21〜23ヌクレオチドに及ぶスペーサー長さ(図22d)、変動GC含有率を有するスペーサー配列(図35b)、および変動GC含有率を有するPAM(図35c)に対して効率的に機能した。低程度、中程度、および高程度の効率(それぞれ0〜10%、10〜30%、および>30%の平均突然変異誘発頻度)で開裂された部位から導かれた配列ロゴにより、NNNRRT PAMの4番目および5番目の位置以外の標的部位全体にわたる希少な配列優先性、およびおそらく高程度の効率で開裂された部位上の2番目のPAM位置におけるグアニンについてのわずかな優先性が明らかになった(図35d)。

KKHバリアントが、野生型SaCas9により標的化することができないPAMの改変を可能とすることを実証するため、本発明者らは、種々のNNNRRT PAMを担持する部位に対するヒト細胞中のそれらのヌクレアーゼの直接比較を実施した。本発明者らのEGFP崩壊アッセイおよび16個の内在性ヒト遺伝子標的を使用する16個の部位の評価(それぞれ図22eおよび22f)は、KKH SaCas9がNNNRRT PAMを担持する標的部位をロバストに改変する一方、野生型SaCas9はNNGRRT(配列番号46)PAMを有する部位のみを効率的に標的化することを示した。NNHRRT(配列番号44)PAMを有する24個全ての部位について、KKHバリアントは、NNGRRT(配列番号46)PAMを有する8つの部位に対して、野生型SaCas9よりもかなり高い率の突然変異誘発を誘導し、KKH SaCas9は、野生型と比較して同等またはわずかに低いレベルの突然変異誘発を誘導した(図22eおよび22f)。これらの結果は、まとめて、KKHバリアントがNNNRRT PAMを有する部位を開裂し得、それにより、現在、ヒト細胞中で野生型SaCas9により効率的に変更することができないNNHRRT(配列番号44)PAMを有する部位の標的化が可能となることを実証する。

SaCas9のゲノムワイド特異性に対するKKH突然変異の影響を評価するため、本発明者らは、GUIDE−seq(シーケンシングによるDSBのゲノムワイドな偏りのない識別)法(Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))を使用して野生型およびKKH SaCas9のオフターゲットプロファイルを同一のsgRNAと直接比較した。NNGRRT(配列番号46)PAMを含有する6つの内在性ヒト遺伝子部位に標的化されるsgRNAについて試験した場合、本発明者らは、野生型およびKKH SaCas9が6つ全ての部位についてほぼ同一のGUIDE−seqタグインテグレーション率およびオンターゲット開裂頻度を誘導することを観察した(それぞれ図36aおよび36b)。さらに、野生型およびKKH SaCas9は、6つのsgRNAのそれぞれを有する類似数のオフターゲット部位における突然変異を誘導する(図23aおよび23b)。KKHバリアントについてのオフターゲット部位は、一般に、NNNRRT PAMモチーフに付着し、野生型SaCas9についてのオフターゲット部位は、NNGRR[T>G]モチーフに付着した(図22b)。6つの試験sgRNAのうちの最大数のオフターゲット部位を誘導したsgRNAの1つについて、本発明者らは、野生型およびKKH SaCas9について類似数のオフターゲット部位を観察した。しかしながら、オフターゲット部位は、野生型およびKKH SaCas9間で部分的にのみ重複し、それは、それらの異なるPAM特異性を考慮して予測することができたとおりである(図23bおよび23c)。本発明者らは、NNGRRT(配列番号46)PAMを有する部位の標的化のためのKKHバリアントの使用を提唱しないが(野生型SaCas9は、それらの部位についてKKHよりも高いオンターゲット活性を示し得るため)、これらの結果は、KKH SaCas9が、予測PAMを有するオフターゲット部位のみを開裂し、一般に、野生型SaCas9について観察されるものと同等数のオフターゲット部位を誘導することを示唆する。

KKH SaCas9のゲノムワイド特異性をさらに試験するため、本発明者らは、NNHRRT(配列番号44)PAMを含有する部位に標的化される5つの追加のsgRNAを試験した(図23dおよび23e)。GUIDE−seqにより検出されたオフターゲット部位は、一般に、(既に公開された実験において野生型SpCas9およびSpCas9バリアントについて観察された数と同等に数が少なく(実施例1〜2参照(Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015))、潜在的なDNAおよびRNAバルジ型オフターゲットを示し(Lin,Y.et al.CRISPR/Cas9 systems have off−target activity with insertions or deletions between target DNA and guide RNA sequences.Nucleic Acids Res 42,7473−7485(2014))、予測PAM配列を含有した。まとめると、本発明者らの実験は、野生型およびKKH SaCas9のゲノムワイド特異性が類似することを実証し、一般に、GUIDE−seqにより判断されるとおりヒト細胞中の少ない数のオフターゲット突然変異を示す。

野生型SaCas9はNNGRRT(配列番号46)PAMの標的化のための最適な選択を保つが、本発明者らが本明細書に記載するKKH SaCas9バリアントは、NNARRT(配列番号43)およびNNCRRT(配列番号47)PAMを有する部位をロバストに標的化し得、NNTRRT(配列番号48)PAMを有する部位についての妥当な良好な率を有する。したがって、本発明者らは、KKHバリアントがSaCas9の標的化範囲をランダムDNA配列中でほぼ2〜4倍だけ増加させ、それにより、高精度の標的化を要求する種々の異なる用途におけるSaCas9のより広い利用の見込みを改善することを保守的に推定する。GUIDE−seqを使用して、本発明者らは、NNGRRT(配列番号46)PAMを含有する同一部位に標的化される場合、KKH SaCas9が、野生型SaCas9と類似数のオフターゲット突然変異を誘導することを実証した。さらに、KKH SaCas9は、NNHRRT(配列番号44)PAMを担持する部位に標的化される場合、少数のみのオフターゲット突然変異を誘導する。KKH SaCas9は野生型SaCas9に対して改変PAM配列を認識するが、本発明者らの知見は、プロトスペーサーおよびPAMの合計の組合せ長さがKKHバリアントについてヒトゲノムに妥当にオルソゴナルであるために依然として十分に長い(24〜26bp)ことを考慮すると完全に驚くべきことではない。さらに、PAM認識の改変は、Cas9/sgRNAのその標的部位との相互作用のエネルギー論を変更することにより特異性を改善し得ることが考えられる(トランケートsgRNA(Fu,Y.,Sander,J.D.,Reyon,D.,Cascio,V.M.&Joung,J.K.Improving CRISPR−Cas nuclease specificity using truncated guide RNAs.Nat Biotechnol 32,279−284(2014))またはD1135E SpCas9突然変異体(実施例1〜2参照)の改善された特異性について既に提案された機序と類似する)。

実施例4.SpCas9−VQRバリアントの活性の改善 SpCas9−VQRバリアントはNGAG>NGAA=NGAT>NGACのNGAN PAMについての優先性を有するため、本発明者らは、NGAH PAM(H=A、C、またはT)に対する改善された活性を有する誘導体バリアントについて選択することを求めた。NGAA、NGAT、またはNGAC PAMのいずれかを有する標的部位を含有する細胞に対するR1335Qライブラリー(ランダムに突然変異誘発したPIドメインを有する)についての選択により、変更PAM特異性を与える突然変異を含有する追加のクローンをシーケンシングすることが可能となった。これらのクローンの配列により、NGAA、NGAT、またはNGAC PAMへのPAM特異性の変更に重要であり得る追加の突然変異が明らかになった。

これらの選択の結果に基づき、VQRバリアントおよび24個の他の誘導体バリアントを細菌中のNGAG、NGAA、NGAT、およびNGAC PAM部位に対して試験した。多数のこれらの誘導体バリアントは、NGAH PAM部位に対してVQRバリアントよりも良好に生存し、それらの多くはG1218R突然変異を含有した(表7および図24)。

細菌スクリーンからの結果が、それらの追加の突然変異の一部がNGAH PAM部位に対する活性を改善することを実証したことを考慮して、本発明者らは、EGFP崩壊アッセイにおいてヒト細胞中で最良の候補の一部を試験した。本発明者らが観察したことは、多数のそれらのバリアント、例として、VRQR、NRQR、およびYRQRバリアントがVQRバリアントよりも、NGAH部位の標的化において優れていることである(表8および図25)。これらのクローンおよびVQRバリアント間の主な差異は、それらがG1218R突然変異を含むことである。

VRQRバリアントは試験したもののなかで最もロバストであると考えられるため、本発明者らは、ヒト細胞中の9つの異なる内在性部位(NGAA、NGAC、NGAT、およびNGAG PAMについて2つの部位、ならびにNGCG PAMについて1つの部位)に対するその活性をVQRバリアントのものと比較した。このデータにより、ヒト細胞中の全ての試験部位においてVRQRバリアントがVQRバリアントよりも優れていることが明らかになる(図26)。

VRQRバリアントがVQRバリアントに対して改善された活性を有することを実証した後、本発明者らは、追加の置換の追加が活性をさらに改善し得るか否かを決定することを求めた。本発明者らは、SpCas9のPAM相互作用ポケットに近接する選択における追加の突然変異を観察したため、それらの突然変異のサブセットをVQRおよびVRQRバリアントに追加し、NGAG、NGAA、NGAT、およびNGAC PAMを含有する部位に対して細菌中でスクリーニングした(表9および図27)。多数の誘導体バリアントは、NGATおよびNGAC PAM部位に対するより高い活性を有することが考えられるため、本発明者らは、ヒト細胞中のそれらのバリアントの試験を開始した。本発明者らは、ヒト細胞EGFP崩壊アッセイにおいて、VQRまたはVRQRバックグラウンドのいずれかへの追加の突然変異を含有する追加のバリアントを試験した。これらの実験により、ここでも、VRQRがVQRバリアントよりも、NGAH PAMに対するよりロバストな活性を有すること、およびVRQRバックボーンへの追加の突然変異が有益であることが明らかになった。

まとめると、これらの結果は、SpCas9−VQRバリアント中で追加の突然変異を含めることは、NGAN PAMを含有する部位、具体的には、NGAH PAMを含有する部位に対する活性を改善し得ることを示唆する。

参照文献 1.Sander,J.D.&Joung,J.K.CRISPR−Cas systems for editing,regulating and targeting genomes.Nat Biotechnol 32,347−355(2014). 2.Hsu,P.D.,Lander,E.S.&Zhang,F.Development and applications of CRISPR−Cas9 for genome engineering.Cell 157,1262−1278(2014). 3.Doudna,J.A.&Charpentier,E.Genome editing.The new frontier of genome engineering with CRISPR−Cas9.Science 346,1258096(2014). 4.Barrangou,R.&May,A.P.Unraveling the potential of CRISPR−Cas9 for gene therapy.Expert Opin Biol Ther 15,311−314(2015). 5.Jinek,M.et al.A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity.Science 337,816−821(2012). 6.Sternberg,S.H.,Redding,S.,Jinek,M.,Greene,E.C.&Doudna,J.A.DNA interrogation by the CRISPR RNA−guided endonuclease Cas9.Nature 507,62−67(2014). 7.Hsu,P.D.et al.DNA targeting specificity of RNA−guided Cas9 nucleases.Nat Biotechnol 31,827−832(2013). 8.Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015). 9.Hou,Z.et al.Efficient genome engineering in human pluripotent stem cells using Cas9 from Neisseria meningitidis.Proc Natl Acad Sci U S A(2013). 10.Fonfara,I.et al.Phylogeny of Cas9 determines functional exchangeability of dual−RNA and Cas9 among orthologous type II CRISPR−Cas systems.Nucleic Acids Res 42,2577−2590(2014). 11.Esvelt,K.M.et al.Orthogonal Cas9 proteins for RNA−guided gene regulation and editing.Nat Methods 10,1116−1121(2013). 12.Cong,L.et al.Multiplex genome engineering using CRISPR/Cas systems.Science 339,819−823(2013). 13.Horvath,P.et al.Diversity,activity,and evolution of CRISPR loci in Streptococcus thermophilus.J Bacteriol 190,1401−1412(2008). 14.Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature 513,569−573(2014). 15.Reyon,D.et al.FLASH assembly of TALENs for high−throughput genome editing.Nat Biotechnol 30,460−465(2012). 16.Fu,Y.et al.High−frequency off−target mutagenesis induced by CRISPR−Cas nucleases in human cells.Nat Biotechnol 31,822−826(2013). 17.Chen,Z.&Zhao,H.A highly sensitive selection method for directed evolution of homing endonucleases.Nucleic Acids Res 33,e154(2005). 18.Doyon,J.B.,Pattanayak,V.,Meyer,C.B.&Liu,D.R.Directed evolution and substrate specificity profile of homing endonuclease I−SceI.J Am Chem Soc 128,2477−2484(2006). 19.Jiang,W.,Bikard,D.,Cox,D.,Zhang,F.&Marraffini,L.A.RNA−guided editing of bacterial genomes using CRISPR−Cas systems.Nat Biotechnol 31,233−239(2013). 20.Mali,P.et al.RNA−guided human genome engineering via Cas9.Science 339,823−826(2013). 21.Hwang,W.Y.et al.Efficient genome editing in zebrafish using a CRISPR−Cas system.Nat Biotechnol 31,227−229(2013). 22.Chylinski,K.,Le Rhun,A.&Charpentier,E.The tracrRNA and Cas9 families of type II CRISPR−Cas immunity systems.RNA Biol 10,726−737(2013). 23.Kleinstiver,B.P.,Fernandes,A.D.,Gloor,G.B.&Edgell,D.R.A unified genetic,computational and experimental framework identifies functionally relevant residues of the homing endonuclease I−BmoI.Nucleic Acids Res 38,2411−2427(2010). 24.Gagnon,J.A.et al.Efficient mutagenesis by Cas9 protein−mediated oligonucleotide insertion and large−scale assessment of single−guide RNAs.PLoS One 9,e98186(2014).

他の実施形態 本発明をその詳細な説明とともに記載した一方、上記の説明は、添付の特許請求の範囲の範囲により定義される本発明の範囲を説明するものであり、限定するものではないことを理解すべきである。他の態様、利点、および改変は、以下の特許請求の範囲の範囲内である。

QQ群二维码
意见反馈