首页 / 国际专利分类库 / 化学;冶金 / 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程 / / 作用于酯键的水解酶 (3.1) / 配列操作のための系、方法および最適化ガイド組成物のエンジニアリング

配列操作のための系、方法および最適化ガイド組成物のエンジニアリング

申请号 JP2016067687 申请日 2016-03-30 公开(公告)号 JP6420273B2 公开(公告)日 2018-11-07
申请人 ザ・ブロード・インスティテュート・インコーポレイテッド; マサチューセッツ・インスティトュート・オブ・テクノロジー; プレジデント アンド フェローズ オブ ハーバード カレッジ; 发明人 フェン・ジャン; レ・コン; パトリック・シュウ; フェイ・ラン;
摘要
权利要求

エンジニアリングされた、天然に存在しないクラスター化等間隔短鎖回分リピート(CRISPR)−CRISPR関連(Cas)(CRISPR−Cas)ベクター系であって、 a)ガイド配列、tracrRNA及びtracrメイト配列を含む1つ以上のCRISPR−Cas系ポリヌクレオチド配列をコードする1つ以上のヌクレオチド配列に作動可能に結合している第1の調節エレメントであって、前記ガイド配列は、真核細胞中のポリヌクレオチド遺伝子座中の1つ以上の標的配列にハイブリダイズする、第1の調節エレメント、 b)II型Cas9タンパク質をコードするヌクレオチド配列に作動可能に結合している第2の調節エレメント を含む1つ以上のベクターを含み、 成分(a)及び(b)は、前記系の同じ又は異なるベクター上に位置し、 前記CRISPR−Cas系は、前記Cas9タンパク質をコードする前記ヌクレオチド配列とともに発現される2つ以上の核局在化シグナル(NLS)を含み、少なくとも1つのNLSが、前記Cas9タンパク質のアミノ末端に若しくはその付近に存在し、及び、少なくとも1つのNLSが、前記Cas9タンパク質のカルボキシ末端に若しくはその付近に存在し、 それによって、前記1つ以上のガイド配列が、真核細胞中の前記1つ以上のポリヌクレオチド遺伝子座を標的とし、前記Cas9タンパク質が、前記1つ以上のポリヌクレオチド遺伝子座を開裂し、それによって、前記1つ以上のポリヌクレオチド遺伝子座の配列が、改変される、 CRISPR−Casベクター系。前記Cas9タンパク質が、対応する野生型Cas9タンパク質と比較して突然変異し、その結果、前記突然変異タンパク質が、標的ポリヌクレオチドの一本鎖を開裂する能を欠くニッカーゼであり、 それによって、前記1つ以上のガイド配列が、真核細胞中の前記1つ以上のポリヌクレオチド遺伝子座を標的とし、前記Cas9タンパク質が、前記ポリヌクレオチド遺伝子座の一本鎖のみを開裂し、それによって、前記1つ以上のポリヌクレオチド遺伝子座の配列が、改変される、 請求項1に記載のエンジニアリングされた、天然に存在しないII型CRISPR−Casベクター系。前記ベクターが、ウイルスベクターである、請求項1又は2に記載の系。前記ウイルスベクターが、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴又は単純ヘルペスウイルスベクターである、請求項3に記載の系。前記Cas9タンパク質が、RuvC I、RuvC II又はRuvC III触媒ドメイン中に1つ以上の突然変異を含む、請求項2〜4のいずれか一項に記載の系。前記Cas9タンパク質が、化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9)タンパク質の位置ナンバリングに対して、D10A、H840A、N854A及びN863Aからなる群から選択される突然変異を含む、請求項2〜4のいずれか一項に記載の系。前記1つ以上のCRISPR−Cas系ポリヌクレオチド配列が、トランス活性化cr(tracr)配列に融合したガイド配列を含む、請求項1〜6のいずれか一項に記載の系。前記CRISPR−Cas系ポリヌクレオチド配列が、前記ガイド配列、前記tracr配列及びtracrメイト配列を含むキメラRNAである、請求項1〜7のいずれか一項に記載の系。前記真核細胞が、哺乳動物細胞又はヒト細胞である、請求項1〜8のいずれか一項に記載の系。前記Cas9タンパク質が、真核細胞中の発現のためにコドン最適化されている、請求項1〜9のいずれか一項に記載の系。前記系が、ゲノムエンジニアリングのためのものである、請求項1〜10のいずれか一項に記載の系。ゲノムエンジニアリングのための請求項1〜11のいずれか一項に記載の系の使用であって、前記使用は、人間の生殖系列の遺伝的同一性を改変するためのプロセスを含まず、前記使用は、人体における疾患の治療又は予防のための方法ではなく、前記使用は、前記系を人体に投与する工程を含まない、使用。前記ゲノムエンジニアリングが、真核細胞中の標的ポリヌクレオチドを改変すること、真核細胞中のポリヌクレオチドの発現を改変すること、突然変異疾患遺伝子を含むモデル真核細胞を生成すること、又は、遺伝子をノックアウトすることを含む、請求項12に記載の使用。前記使用が、外因性テンプレートポリヌクレオチドを挿入することによって前記開裂標的ポリヌクレオチドを修復することをさらに含み、前記修復が、前記標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失又は置換を含む突然変異をもたらす、請求項12又は13に記載の使用。前記使用が、外因性テンプレートポリヌクレオチドを挿入することによって前記開裂標的ポリヌクレオチドを編集することをさらに含み、前記編集が、前記標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失又は置換を含む突然変異をもたらす、請求項12〜14のいずれか一項に記載の使用。前記挿入することが、相同組換えによる、請求項14又は15に記載の使用。非ヒトトランスジェニック動物又はトランスジェニック植物の製造における、請求項1〜11のいずれか一項に記載の系の使用。

说明书全文

関連出願および参照による組み込み 本出願は、2013年6月17日に出願された米国仮特許出願第61/836,127号明細書、標題ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED COMPOSITIONS FOR SEQUENCE MANIPULATIONの優先権を主張する。本出願は、米国仮特許出願第61/758,468号明細書;同第61/769,046号明細書;同第61/802,174号明細書;同第61/806,375号明細書;同第61/814,263号明細書;同第61/819,803号明細書および同第61/828,130号明細書の優先権も主張し、それぞれ標題ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATIONであり、それぞれ2013年1月30日;2013年2月25日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日および2013年5月28日に出願されたものである。それぞれ2012年12月12日および2013年1月2日に出願された両方とも標題SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATIONの米国仮特許出願第61/736,527号明細書および同第61/748,427号明細書の優先権も主張される。それぞれ2013年3月15日および2013年6月17日に出願された両方とも標題BI−2011/008/44790.02.2003およびBI−2011/008/44790.03.2003の米国仮特許出願第61/791,409号明細書および同第61/835,931号明細書の優先権も主張される。 2013年6月17日にそれぞれ出願された米国仮特許出願第61/835,936号明細書、同第61/836,101号明細書、同第61/836,080号明細書、同第61/836,123号明細書および同第61/835,973号明細書も参照される。

上記の出願、ならびにそれらの出願においてまたはそれらの審査中に引用される全ての文献(「出願引用文献」)およびその出願引用文献において引用または参照される全ての文献、ならびに本明細書において引用または参照される全ての文献(「本明細書引用文献」)、および本明細書引用文献において引用または参照される全ての文献は、本明細書においてまたは本明細書に参照により組み込まれる任意の文献において挙げられる任意の製品に関する任意の製造業者の指示書、説明書、製品仕様書、および製品シートと一緒に、参照により本明細書に組み込まれ、本発明の実施において用いることができる。より具体的には、全ての参照文献は、それぞれの個々の文献が個別具体的に参照により組み込まれることが示されるような程度で参照により組み込まれる。

本発明は、一般に、クラスター化等間隔短鎖回分リピート(Clustered Regularly Interspaced Short Palindromic Repeat)(CRISPR)およびその成分に関するベクター系を使用し得る配列ターゲティング、例えば、ゲノム摂動または遺伝子編集を含む遺伝子発現の制御に使用される系、方法および組成物に関する。

連邦政府により資金提供された研究に関する記述 本発明は、米国国立衛生研究所(National Institutes of Health)、NIHパイオニアアワードDP1MH100706により助成された政府支援によりなされた。米国政府は本発明において一定の権利を有する。

ゲノムシーケンシング技術および分析法の近年の進歩により、多様な範囲の生物学的機能および疾患に関連する遺伝因子を分類およびマッピングする技能が顕著に加速されている。正確なゲノムターゲティング技術は、個々の遺伝子エレメントの選択的摂動を可能とすることにより因果的遺伝子変異の体系的なリバースエンジニアリングを可能とするため、ならびに合成生物学、バイオテクノロジーおよび医薬用途を進歩させるために必要とされる。ゲノム編集技術、例えば、デザイナー亜鉛フィンガー、転写アクチベーター様エフェクター(TALE)、またはホーミングメガヌクレアーゼがターゲティングされるゲノム摂動の産生に利用可能であるが、安価で、設定が容易で、スケーラブルで、真核ゲノム内の複数位置をターゲティングしやすい新たなゲノムエンジニアリング技術が依然として必要とされている。

米国特許第4,873,316号明細書

多彩な用途の配列ターゲティングのための代替的で堅牢な系および技術が差し迫って必要とされている。本発明は、この必要性に対処し、関連する利点を提供する。CRISPR/CasまたはCRISPR−Cas系(両方の用語は、本出願全体にわたり互換的に使用される)は特異的配列をターゲティングするためにカスタム化タンパク質の生成を要求しないが、単一Cas酵素を短鎖RNA分子によりプログラミングして特異的DNA標的を認識させることができ、換言すると、Cas酵素は、前記短鎖RNA分子を使用して特異的DNA標的にリクルートすることができる。ゲノムシーケンシング技術および分析法のレパートリーへのCRISPR−Cas系の付加により方法論が顕著に簡易化され、多様な範囲の生物学的機能および疾患に関連する遺伝因子を分類およびマッピングする技能が加速される。有害効果を有さずにゲノム編集にCRISPR−Cas系を有効に利用するため、特許請求される本発明の態様であるそれらのゲノムエンジニアリングツールのエンジニアリングおよび最適化の態様を理解することが重要である。

一態様において、本発明は、1つ以上のベクターを含むベクター系を提供する。一部の実施形態において、系は、(a)tracrメイト配列および1つ以上のガイド配列をtracrメイト配列の上流に挿入するための1つ以上の挿入部位に作動可能に結合している第1の調節エレメント(ガイド配列は、発現された場合、細胞中、例えば真核細胞中の標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含む);ならびに(b)核局在化配列を含む前記CRISPR酵素をコードする酵素コード配列に作動可能に結合している第2の調節エレメントを含み;成分(a)および(b)は、系の同一または異なるベクター上にある。一部の実施形態において、成分(a)は、第1の調節エレメントの制御下でtracrメイト配列の下流のtracr配列をさらに含む。一部の実施形態において、成分(a)は、第1の調節エレメントに作動可能に結合している2つ以上のガイド配列をさらに含み、2つ以上のガイド配列のそれぞれは、発現された場合、真核細胞中の異なる標的配列へのCRISPR複合体の配列特異的結合を指向する。一部の実施形態において、系は、第3の調節エレメント、例えば、ポリメラーゼIIIプロモーターの制御下でtracr配列を含む。一部の実施形態において、tracr配列は、最適にアラインされた場合にtracrメイト配列の長さに沿って少なくとも50%、60%、70%、80%、90%、95%、または99%の配列相補性を示す。一部の実施形態において、CRISPR複合体は、真核細胞の核中の検出可能な量の前記CRISPR複合体の蓄積をドライブするために十分な強度の1つ以上の核局在化配列を含む。理論により拘束されるものではないが、核局在化配列は、真核生物中のCRISPR複合体活性に必要でないが、そのような配列を含めることにより、特に核中の核酸分子のターゲティングに関して系の活性が向上すると考えられる。一部の実施形態において、CRISPR酵素は、II型CRISPR系酵素である。一部の実施形態において、CRISPR酵素は、Cas9酵素である。一部の実施形態において、Cas9酵素は、炎連鎖球菌(S.pneumoniae)、化膿性連鎖球菌(S.pyogenes)、またはS.サーモフィラス(S.thermophilus)Cas9であり、それらの生物に由来する突然変異Cas9を含み得る。酵素は、Cas9ホモログまたはオルソログであり得る。一部の実施形態において、CRISPR酵素は、真核細胞中の発現のためにコドン最適化されている。一部の実施形態において、CRISPR酵素は、標的配列の局在における1つまたは2つの鎖の開裂を指向する。一部の実施形態において、CRISPR酵素は、DNA鎖開裂活性を欠く。一部の実施形態において、第1の調節エレメントは、ポリメラーゼIIIプロモーターである。一部の実施形態において、第2の調節エレメントは、ポリメラーゼIIプロモーターである。一部の実施形態において、ガイド配列は、少なくとも15、16、17、18、19、20、25ヌクレオチド、または10〜30、もしくは15〜25、もしくは15〜20ヌクレオチド長である。一般に、および本明細書全体で、用語「ベクター」は、それが結合した別の核酸を輸送し得る核酸分子を指す。ベクターとしては、限定されるものではないが、一本鎖、二本鎖、または部分二本鎖の核酸分子;1つ以上の自由末端を含み、自由末端を含まない(例えば、環状)核酸分子;DNA、RNA、またはその両方を含む核酸分子;および当技術分野において公知の他の種々のポリヌクレオチドが挙げられる。あるタイプのベクターは、「プラスミド」であり、それは、付加DNAセグメントを例えば標準分子クローニング技術により挿入することができる環状二本鎖DNAループを指す。別のタイプのベクターは、ウイルスベクターであり、それにおいてウイルス由来DNAまたはRNA配列がウイルス(例えば、レトロウイルス、複製欠損レトロウイルス、アデノウイルス、複製欠損アデノウイルス、およびアデノ随伴ウイルス)中へのパッケージングのためにベクター中に存在する。ウイルスベクターとしては、宿主細胞中への形質移入のためにウイルスにより担持されるポリヌクレオチドも挙げられる。あるベクターは、それが導入された宿主細胞中で自己複製し得る(例えば、細菌複製起点を有する細菌ベクターおよびエピソーマル哺乳動物ベクター)。他のベクター(例えば、非エピソーマル哺乳動物ベクター)は、宿主細胞中への導入時に宿主細胞のゲノム中にインテグレートされ、それにより宿主ゲノムとともに複製される。さらに、あるベクターは、それが作動的に結合している遺伝子の発現を指向し得る。このようなベクターは、本明細書において「発現ベクター」と称される。組換えDNA技術において有用な一般的な発現ベクターは、プラスミドの形態であることが多い。

組換え発現ベクターは、宿主細胞中の核酸の発現に好適な形態の本発明の核酸を含み得、そのことは、組換え発現ベクターが、発現に使用すべき宿主細胞に基づき選択することができ、発現させるべき核酸配列に作動的に結合している1つ以上の調節エレメントを含むことを意味する。組換え発現ベクターのうち、「作動可能に結合している」は、目的ヌクレオチド配列が調節エレメントに、そのヌクレオチド配列の発現(例えば、インビトロ転写/翻訳系またはベクターが宿主細胞中に導入された場合、宿主細胞中で)を可能とするように結合していることを意味するものとする。

用語「調節エレメント」は、プロモーター、エンハンサー、内部リボソーム進入部位(IRES)、および他の発現制御エレメント(例えば、転写終結シグナル、例えば、ポリアデニル化シグナルおよびポリU配列)を含むものとする。このような調節エレメントは、例えば、Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)に記載されている。調節エレメントとしては、多くのタイプの宿主細胞中のヌクレオチド配列の構成的発現を指向するものおよびある宿主細胞中でのみヌクレオチド配列の発現を指向するもの(例えば、組織特異的調節配列)が挙げられる。組織特異的プロモーターは、主として所望の目的組織、例えば、筋肉、神経細胞、骨、皮膚、血液、特異的臓器(例えば、肝臓、膵臓)、または特定の細胞タイプ(例えば、リンパ球)中で発現を指向し得る。調節エレメントは、時間依存的様式、例えば、細胞周期依存的または発生段階依存的様式の発現も指向し得、それは、組織または細胞タイプ特異的であってもなくてもよい。一部の実施形態において、ベクターは、1つ以上のpolIIIプロモーター(例えば、1、2、3、4、5つ、またはそれよりも多いpolIIIプロモーター)、1つ以上のpolIIプロモーター(例えば、1、2、3、4、5つ、またはそれよりも多いpolIIプロモーター)、1つ以上のpolIプロモーター(例えば、1、2、3、4、5つ、またはそれよりも多いpolIプロモーター)、またはそれらの組合せを含む。polIIIプロモーターの例としては、限定されるものではないが、U6およびH1プロモーターが挙げられる。polIIプロモーターの例としては、限定されるものではないが、レトロウイルスのラウス肉腫ウイルス(RSV)LTRプロモーター(場合により、RSVエンハンサーを有する)、サイトメガロウイルス(CMV)プロモーター(場合により、CMVエンハンサーを有する)[例えば、Boshart et al,Cell,41:521−530(1985)参照]、SV40プロモーター、ジヒドロ葉酸レダクターゼプロモーター、β−アクチンプロモーター、ホスホグリセロールキナーゼ(PGK)プロモーター、およびEF1αプロモーターが挙げられる。用語「調節エレメント」により、エンハンサーエレメント、例えば、WPRE;CMVエンハンサー;HTLV−IのLTR中のR−U5’セグメント(Mol.Cell.Biol.,Vol.8(1),p.466−472,1988);SV40エンハンサー;およびウサギβ−グロビンのエキソン2と3との間のイントロン配列(Proc.Natl.Acad.Sci.USA.,Vol.78(3),p.1527−31,1981)も包含される。発現ベクターの設計は、形質転換すべき宿主細胞の選択、所望の発現レベルなどのような因子に依存し得ることが当業者により認識される。ベクターを宿主細胞中に導入し、それにより本明細書に記載の核酸によりコードされる転写物、融合タンパク質またはペプチドを含むタンパク質、またはペプチド(例えば、クラスター化等間隔短鎖回分リピート(CRISPR)転写物、タンパク質、酵素、それらの突然変異体、それらの融合タンパク質など)を産生することができる。

有利なベクターとしては、レンチウイルスおよびアデノ随伴ウイルスが挙げられ、そのようなベクターのタイプは、特定のタイプの細胞のターゲティングのために選択することもできる。

一態様において、本発明は、1つ以上の核局在化配列を含むCRISPR酵素をコードする酵素コード配列に作動可能に結合している調節エレメントを含むベクターを提供する。一部の実施形態において、前記調節エレメントは真核細胞中のCRISPR酵素の転写を、前記CRISPR酵素が真核細胞の核中で検出可能な量で蓄積するようにドライブする。一部の実施形態において、調節エレメントは、ポリメラーゼIIプロモーターである。一部の実施形態において、CRISPR酵素は、II型CRISPR系酵素である。一部の実施形態において、CRISPR酵素は、Cas9酵素である。一部の実施形態において、Cas9酵素は、肺炎連鎖球菌(S.pneumoniae)、化膿性連鎖球菌(S.pyogenes)またはS.サーモフィラス(S.thermophilus)Cas9であり、それらの生物に由来する突然変異Cas9を含み得る。一部の実施形態において、CRISPR酵素は、真核細胞中の発現のためにコドン最適化されている。一部の実施形態において、CRISPR酵素は、標的配列の局在における1つまたは2つの鎖の開裂を指向する。一部の実施形態において、CRISPR酵素は、DNA鎖開裂活性を欠く。

一態様において、本発明は、真核細胞の核中の検出可能な量の前記CRISPR酵素の蓄積をドライブするために十分な強度の1つ以上の核局在化配列を含むCRISPR酵素を提供する。一部の実施形態において、CRISPR酵素は、II型CRISPR系酵素である。一部の実施形態において、CRISPR酵素は、Cas9酵素である。一部の実施形態において、Cas9酵素は、肺炎連鎖球菌(S.pneumoniae)、化膿性連鎖球菌(S.pyogenes)またはS.サーモフィラス(S.thermophilus)Cas9であり、それらの生物に由来する突然変異Cas9を含み得る。酵素は、Cas9ホモログまたはオルソログであり得る。一部の実施形態において、CRISPR酵素は、それが結合する標的配列の1つ以上の鎖を開裂する能を欠く。

一態様において、本発明は、(a)tracrメイト配列および1つ以上のガイド配列をtracrメイト配列の上流に挿入するための1つ以上の挿入部位に作動可能に結合している第1の調節エレメント(ガイド配列は、発現された場合、真核細胞中の標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含む);ならびに/または(b)核局在化配列を含む前記CRISPR酵素をコードする酵素コード配列に作動可能に結合している第2の調節エレメントを含む真核宿主細胞を提供する。一部の実施形態において、宿主細胞は、成分(a)および(b)を含む。一部の実施形態において、成分(a)、成分(b)、または成分(a)および(b)は、宿主真核細胞のゲノム中に安定的にインテグレートされている。一部の実施形態において、成分(a)は、第1の調節エレメントの制御下でtracrメイト配列の下流のtracr配列をさらに含む。一部の実施形態において、成分(a)は、第1の調節エレメントに作動可能に結合している2つ以上のガイド配列をさらに含み、2つ以上のガイド配列のそれぞれは、発現された場合、真核細胞中の異なる標的配列へのCRISPR複合体の配列特異的結合を指向する。一部の実施形態において、真核宿主細胞は、前記tracr配列に作動可能に結合している第3の調節エレメント、例えば、ポリメラーゼIIIプロモーターをさらに含む。一部の実施形態において、tracr配列は、最適にアラインされた場合にtracrメイト配列の長さに沿って少なくとも50%、60%、70%、80%、90%、95%、または99%の配列相補性を示す。一部の実施形態において、CRISPR酵素は、真核細胞の核中の検出可能な量の前記CRISPR酵素の蓄積をドライブするために十分な強度の1つ以上の核局在化配列を含む。一部の実施形態において、CRISPR酵素は、II型CRISPR系酵素である。一部の実施形態において、CRISPR酵素は、Cas9酵素である。一部の実施形態において、Cas9酵素は、肺炎連鎖球菌(S.pneumoniae)、化膿性連鎖球菌(S.pyogenes)またはS.サーモフィラス(S.thermophilus)Cas9であり、それらの生物に由来する突然変異Cas9を含み得る。酵素は、Cas9ホモログまたはオルソログであり得る。一部の実施形態において、CRISPR酵素は、真核細胞中の発現のためにコドン最適化されている。一部の実施形態において、CRISPR酵素は、標的配列の局在における1つまたは2つの鎖の開裂を指向する。一部の実施形態において、CRISPR酵素は、DNA鎖開裂活性を欠く。一部の実施形態において、第1の調節エレメントは、ポリメラーゼIIIプロモーターである。一部の実施形態において、第2の調節エレメントは、ポリメラーゼIIプロモーターである。一部の実施形態において、ガイド配列は、少なくとも15、16、17、18、19、20、25ヌクレオチド、または10〜30、もしくは15〜25、もしくは15〜20ヌクレオチド長である。一態様において、本発明は、記載の実施形態のいずれかによる真核宿主細胞を含む非ヒト真核生物;好ましくは、多細胞真核生物を提供する。他の態様において、本発明は、記載の実施形態のいずれかによる真核宿主細胞を含む真核生物;好ましくは、多細胞真核生物を提供する。これらの態様の一部の実施形態における生物は、動物;例えば、哺乳動物であり得る。また、生物は、節足動物、例えば、昆虫であり得る。生物は、植物でもあり得る。さらに、生物は、真菌であり得る。

一態様において、本発明は、本明細書に記載の成分の1つ以上を含むキットを提供する。一部の実施形態において、キットは、ベクター系およびキットの使用指示書を含む。一部の実施形態において、ベクター系は、(a)tracrメイト配列および1つ以上のガイド配列をtracrメイト配列の上流に挿入するための1つ以上の挿入部位に作動可能に結合している第1の調節エレメント(ガイド配列は、発現された場合、真核細胞中の標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含む);ならびに/または(b)核局在化配列を含む前記CRISPR酵素をコードする酵素コード配列に作動可能に結合している第2の調節エレメントを含む。一部の実施形態において、キットは、系の同一または異なるベクター上にある成分(a)および(b)を含む。一部の実施形態において、成分(a)は、第1の調節エレメントの制御下でtracrメイト配列の下流のtracr配列をさらに含む。一部の実施形態において、成分(a)は、第1の調節エレメントに作動可能に結合している2つ以上のガイド配列をさらに含み、2つ以上のガイド配列のそれぞれは、発現された場合、真核細胞中の異なる標的配列へのCRISPR複合体の配列特異的結合を指向する。一部の実施形態において、系は、前記tracr配列に作動可能に結合している第3の調節エレメント、例えば、ポリメラーゼIIIプロモーターをさらに含む。一部の実施形態において、tracr配列は、最適にアラインされた場合にtracrメイト配列の長さに沿って少なくとも50%、60%、70%、80%、90%、95%、または99%の配列相補性を示す。一部の実施形態において、CRISPR酵素は、真核細胞の核中の検出可能な量の前記CRISPR酵素の蓄積をドライブするために十分な強度の1つ以上の核局在化配列を含む。一部の実施形態において、CRISPR酵素は、II型CRISPR系酵素である。一部の実施形態において、CRISPR酵素は、Cas9酵素である。一部の実施形態において、Cas9酵素は、肺炎連鎖球菌(S.pneumoniae)、化膿性連鎖球菌(S.pyogenes)またはS.サーモフィラス(S.thermophilus)Cas9であり、それらの生物に由来する突然変異Cas9を含み得る。酵素は、Cas9ホモログまたはオルソログであり得る。一部の実施形態において、CRISPR酵素は、真核細胞中の発現のためにコドン最適化されている。一部の実施形態において、CRISPR酵素は、標的配列の局在における1つまたは2つの鎖の開裂を指向する。一部の実施形態において、CRISPR酵素は、DNA鎖開裂活性を欠く。一部の実施形態において、第1の調節エレメントは、ポリメラーゼIIIプロモーターである。一部の実施形態において、第2の調節エレメントは、ポリメラーゼIIプロモーターである。一部の実施形態において、ガイド配列は、少なくとも15、16、17、18、19、20、25ヌクレオチド、または10〜30、もしくは15〜25、もしくは15〜20ヌクレオチド長である。

一態様において、本発明は、真核細胞中の標的ポリヌクレオチドを改変する方法を提供する。一部の実施形態において、方法は、CRISPR複合体を標的ポリヌクレオチドに結合させて前記標的ポリヌクレオチドの開裂を生じさせ、それにより標的ポリヌクレオチドを改変することを含み、CRISPR複合体は、前記標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列と複合体形成しているCRISPR酵素を含み、前記ガイド配列は、次いでtracr配列にハイブリダイズするtracrメイト配列に結合している。一部の実施形態において、前記開裂は、前記CRISPR酵素により標的配列の局在における1つまたは2つの鎖を開裂することを含む。一部の実施形態において、前記開裂は、標的遺伝子の転写の減少をもたらす。一部の実施形態において、方法は、外因性テンプレートポリヌクレオチドとの相同組換えにより前記開裂標的ポリヌクレオチドを修復することをさらに含み、前記修復は、前記標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失、または置換を含む突然変異をもたらす。一部の実施形態において、前記突然変異は、標的配列を含む遺伝子から発現されるタンパク質中の1つ以上のアミノ酸変化をもたらす。一部の実施形態において、方法は、1つ以上のベクターを前記真核細胞に送達することをさらに含み、1つ以上のベクターは、CRISPR酵素、tracrメイト配列に結合しているガイド配列、およびtracr配列の1つ以上の発現をドライブする。一部の実施形態において、前記ベクターを対象中の真核細胞中に送達する。一部の実施形態において、前記改変を、細胞培養物中の前記真核細胞中で行う。一部の実施形態において、方法は、前記改変前に前記真核細胞を対象から単離することをさらに含む。一部の実施形態において、方法は、前記真核細胞および/またはそれに由来する細胞を前記対象に戻すことをさらに含む。

一態様において、本発明は、真核細胞中のポリヌクレオチドの発現を改変する方法を提供する。一部の実施形態において、方法は、CRISPR複合体をポリヌクレオチドに結合させ、その結果、前記結合が前記ポリヌクレオチドの発現の増加または減少をもたらすことを含み;CRISPR複合体は、前記ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列と複合体形成しているCRISPR酵素を含み、前記ガイド配列は、次いでtracr配列にハイブリダイズするtracrメイト配列に結合している。一部の実施形態において、方法は、1つ以上のベクターを前記真核細胞に送達することをさらに含み、1つ以上のベクターは、CRISPR酵素、tracrメイト配列に結合しているガイド配列、およびtracr配列の1つ以上の発現をドライブする。

一態様において、本発明は、突然変異疾患遺伝子を含むモデル真核細胞を生成する方法を提供する。一部の実施形態において、疾患遺伝子は、疾患を有し、または発症するリスクの増加に関連する任意の遺伝子である。一部の実施形態において、方法は、(a)1つ以上のベクターを真核細胞に導入すること(1つ以上のベクターは、CRISPR酵素、tracrメイト配列に結合しているガイド配列、およびtracr配列の1つ以上の発現をドライブする)および(b)CRISPR複合体を標的ポリヌクレオチドに結合させて前記疾患遺伝子内の標的ポリヌクレオチドの開裂を生じさせ(CRISPR複合体は、(1)標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含む)、それにより、突然変異疾患遺伝子を含むモデル真核細胞を生成することを含む。一部の実施形態において、前記開裂は、前記CRISPR酵素により標的配列の局在における1つまたは2つの鎖を開裂することを含む。一部の実施形態において、前記開裂は、標的遺伝子の転写の減少をもたらす。一部の実施形態において、方法は、外因性テンプレートポリヌクレオチドとの相同組換えにより前記開裂標的ポリヌクレオチドを修復することをさらに含み、前記修復は、前記標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失、または置換を含む突然変異をもたらす。一部の実施形態において、前記突然変異は、標的配列を含む遺伝子から発現されるタンパク質中の1つ以上のアミノ酸変化をもたらす。

一態様において、本発明は、疾患遺伝子に関連する細胞シグナリングイベントをモジュレートする生物活性剤を開発する方法を提供する。一部の実施形態において、疾患遺伝子は、疾患を有し、または発症するリスクの増加に関連する任意の遺伝子である。一部の実施形態において、方法は、(a)試験化合物を、記載の実施形態のいずれか1つのモデル細胞と接触させること;および(b)前記疾患遺伝子中の前記突然変異に関連する細胞シグナリングイベントの低減または増大を示すリードアウトの変化を検出し、それにより、前記疾患遺伝子に関連する前記細胞シグナリングイベントをモジュレートする前記生物活性剤を開発することを含む。

一態様において、本発明は、tracrメイト配列の上流のガイド配列を含む組換えポリヌクレオチドであって、ガイド配列は、発現された場合、真核細胞中に存在する対応する標的配列へのCRISPR複合体の配列特異的結合を指向する組換えポリヌクレオチドを提供する。一部の実施形態において、標的配列は、真核細胞中に存在するウイルス配列である。一部の実施形態において、標的配列は、原癌遺伝子または癌遺伝子である。

一態様において、本発明は、1つ以上の原核細胞中の遺伝子中の1つ以上の突然変異を導入することにより1つ以上の原核細胞を選択する方法であって、1つ以上のベクターを原核細胞中に導入すること(1つ以上のベクターは、CRISPR酵素、tracrメイト配列に結合しているガイド配列、tracr配列、および編集テンプレートの1つ以上の発現をドライブし;編集テンプレートは、CRISPR酵素開裂を停止させる1つ以上の突然変異を含む);編集テンプレートと、選択すべき細胞中の標的ポリヌクレオチドとを相同組換えさせること;CRISPR複合体を標的ポリヌクレオチドに結合させて前記遺伝子内の標的ポリヌクレオチドの開裂を生じさせ(CRISPR複合体は、(1)標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含み、標的ポリヌクレオチドへのCRISPR複合体の結合は、細胞死を誘導する)、それにより、1つ以上の突然変異が導入された1つ以上の原核細胞の選択を可能とすることを含む方法を提供する。好ましい実施形態において、CRISPR酵素は、Cas9である。本発明の別の態様において、選択すべき細胞は、真核細胞であり得る。本発明の態様により、選択マーカーもカウンターセレクション系を含み得る2ステッププロセスも要求しない規定の細胞の選択が可能となる。

一部の態様において、本発明は、CRISPR−Cas系キメラRNA(chiRNA)ポリヌクレオチド配列を含み、ポリヌクレオチド配列は、(a)真核細胞中の標的配列にハイブリダイズし得るガイド配列、(b)tracrメイト配列、および(c)tracr配列を含み、(a)、(b)および(c)は、5’から3’配向で配置されており、転写されるとtracrメイト配列vtracr配列にハイブリダイズし、かつガイド配列が標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含む天然に存在しないまたはエンジニアリングされた組成物 または I.CRISPR−Cas系キメラRNA(chiRNA)ポリヌクレオチド配列に作動可能に結合している第1の調節エレメント(ポリヌクレオチド配列は、(a)真核細胞中の1つ以上の標的配列にハイブリダイズし得る1つ以上のガイド配列、(b)tracrメイト配列、および(c)1つ以上のtracr配列を含む)、およびII.少なくとも1つ以上の核局在化配列を含むCRISPR酵素をコードする酵素コード配列に作動可能に結合している第2の調節エレメントを含み、(a)、(b)および(c)は、5’から3’配向で配置されており、成分IおよびIIは、系の同一または異なるベクター上にあり、転写されるとtracrメイト配列がtracr配列にハイブリダイズし、かつガイド配列が標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含む1つ以上のベクターを含むベクター系によりコードされるCRISPR酵素系、またはI.(a)細胞中の標的配列にハイブリダイズし得る1つ以上のガイド配列、および(b)少なくとも1つ以上のtracrメイト配列に作動可能に結合している第1の調節エレメント、II.CRISPR酵素をコードする酵素コード配列に作動可能に結合している第2の調節エレメント、ならびにIII.tracr配列に作動可能に結合している第3の調節エレメントを含み、成分I、IIおよびIIIは、系の同一または異なるベクター上にあり、転写されるとtracrメイト配列がtracr配列にハイブリダイズし、かつガイド配列が標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含み、多重化系において、複数のガイド配列および単一のtracr配列が使用される1つ以上のベクターを含むベクター系によりコードされる多重化CRISPR酵素系(ガイド、tracrおよびtracrメイト配列の1つ以上は、安定性を改善するように改変されている)を提供する。

本発明の態様において、改変は、エンジニアリングされた二次構造を含む。例えば、改変は、tracrメイト配列とtracr配列との間のハイブリダイゼーションの領域の低減を含み得る。例えば、改変は、人工ループを通すtracrメイト配列およびtracr配列の融合も含み得る。改変は、40〜120bpの長さを有するtracr配列を含み得る。本発明の実施形態において、tracr配列は、40bpから全長のtracrである。ある実施形態において、tracRNAの長さは、野生型tracRNAの少なくともヌクレオチド1〜67を含み、一部の実施形態において、少なくともヌクレオチド1〜85を含む。一部の実施形態において、少なくとも野生型化膿性連鎖球菌(S.pyogenes)Cas9tracRNAのヌクレオチド1〜67または1〜85に対応するヌクレオチドを使用することができる。CRISPR系がCas9以外、またはSpCas9以外の酵素を使用する場合、関連野生型tracRNA中の対応するヌクレオチドが存在し得る。一部の実施形態において、tracRNAの長さは、野生型tracRNAのヌクレオチド1〜67または1〜85以下を含む。改変は、配列最適化を含み得る。ある態様において、配列最適化は、tracrおよび/またはtracrメイト配列中のポリT配列の出現率の低減を含み得る。配列最適化は、tracrメイト配列とtracr配列との間のハイブリダイゼーションの領域の低減;例えば、tracr配列の長さの低減と組み合わせることができる。

一態様において、本発明は、改変が、tracrおよび/またはtracrメイト配列中のポリT配列の低減を含むCRISPR−Cas系またはCRISPR酵素系を提供する。本発明の一部の態様において、関連野生型配列のポリT配列中に存在する1つ以上のT(すなわち、3、4、5、6つ、またはそれよりも多い数を超える連続T塩基のストレッチ;一部の実施形態において、10、9、8、7、6つ以下の連続T塩基のストレッチ)を、非Tヌクレオチド、例えば、Aにより置換することができ、したがって、ストリングがTのより小さいストレッチに分解され、それぞれのストレッチは、4つ、または4つ未満(例えば、3または2つ)の連続Tを有する。A以外の塩基、例えば、CもしくはG、または天然に存在しないヌクレオチドもしくは修飾ヌクレオチドを置換に使用することができる。Tのストリングがヘアピン(またはステムループ)の形成に関与する場合、非T塩基についての相補的塩基を非Tヌクレオチドの相補鎖に変えることが有利である。例えば、非T塩基がAである場合、その相補鎖をTに変え、例えば、二次構造を保存し、またはその保存を支援することができる。例えば、5’−TTTTTを5’−TTTATになるように変更し、相補的な5’−AAAAAを5’−ATAAAに変えることができる。

一態様において、本発明は、改変が、ポリTターミネーター配列を付加することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、tracrおよび/またはtracrメイト配列中のポリTターミネーター配列を付加することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、ガイド配列中のポリTターミネーター配列を付加することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。ポリTターミネーター配列は、5つの連続T塩基、または5つを超える連続T塩基を含み得る。

一態様において、本発明は、改変が、ループおよび/またはヘアピンを変更することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、ガイド配列中の最少の2つのヘアピンを提供することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、tracrとtracrメイト(ダイレクトリピート)配列との間の相補性により形成されるヘアピンを提供することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、tracrRNA配列の3’末端における、またはそれに向かう1つ以上のさらなるヘアピンを提供することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。例えば、ヘアピンは、ヘアピンが自己フォールディング時に形成されるように、ループにより結合しているtracRNA配列内の自己相補的配列を提供することにより形成することができる。一態様において、本発明は、改変が、ガイド配列の3’に付加される追加のヘアピンを提供することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、ガイド配列の5’末端を伸長させることを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、ガイド配列の5’末端中の1つ以上のヘアピンを提供することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、配列(5’−AGGACGAAGTCCTAA)をガイド配列の5’末端に追加することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。ヘアピンの形成に好適な他の配列は、当業者に公知であり、本発明のある態様において使用することができる。本発明の一部の態様において、少なくとも2、3、4、5つ、またはそれよりも多い追加のヘアピンが提供される。本発明の一部の態様において、10、9、8、7、6つ以下の追加のヘアピンが提供される。一態様において、本発明は、改変が、2つのヘアピンを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、3つのヘアピンを含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、改変が、多くとも5つのヘアピンを含むCRISPR−Cas系またはCRISPR酵素系を提供する。

一態様において、本発明は、改変が、架橋を提供すること、またはポリヌクレオチド配列中の1つ以上の修飾ヌクレオチドを提供することを含むCRISPR−Cas系またはCRISPR酵素系を提供する。修飾ヌクレオチドおよび/または架橋は、tracr、tracrメイト、および/もしくはガイド配列のいずれかもしくは全てにおいて、ならびに/または酵素コード配列において、ならびに/またはベクター配列において提供することができる。改変は、少なくとも1つの天然に存在しないヌクレオチド、または修飾ヌクレオチド、またはそれらのアナログの包含を含み得る。修飾ヌクレオチドは、リボース、ホスフェート、および/または塩基部分において修飾されていてよい。修飾ヌクレオチドとしては、2’−O−メチルアナログ、2’−デオキシアナログ、または2’−フルオロアナログを挙げることができる。核酸骨格を修飾することができ、例えば、ホスホロチオエート骨格を使用することができる。ロックド核酸(LNA)または架橋核酸(BNA)の使用も可能であり得る。修飾塩基のさらなる例としては、限定されるものではないが、2−アミノプリン、5−ブロモ−ウリジン、シュードウリジン、イノシン、7−メチルグアノシンが挙げられる。

上記の改変のいずれかまたは全てを、単独で、または組合せで所与のCRISPR−Cas系またはCRISPR酵素系において提供することができることが理解される。このような系は、前記改変の1、2、3、4、5つ、またはそれよりも多い数を含み得る。

一態様において、本発明は、CRISPR酵素がII型CRISPR系酵素、例えば、Cas9酵素であるCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、CRISPR酵素が1000未満のアミノ酸、または4000未満のアミノ酸を含むCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、Cas9酵素がStCas9もしくはStlCas9であり、またはCas9酵素が、ストレプトコッカス属(Streptococcus)、カンピロバクター属(Campylobacter)、ニトラティフラクター属(Nitratifractor)、スタフィロコッカス属(Staphylococcus)、パービバキュラム属(Parvibaculum)、ロゼブリア属(Roseburia)、ネイセリア属(Neisseria)、グルコンアセトバクター属(Gluconacetobacter)、アゾスピリラム属(Azospirillum)、スフェロケタ属(Sphaerochaeta)、ラクトバシラス属(Lactobacillus)、ユーバクテリウム属(Eubacterium)またはコリネバクター属(Corynebacter)の属からなる群から選択される生物からのCas9酵素であるCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、CRISPR酵素が標的配列の局在における両方の鎖の開裂を指向するヌクレアーゼであるCRISPR−Cas系またはCRISPR酵素系を提供する。

一態様において、本発明は、第1の調節エレメントがポリメラーゼIIIプロモーターであるCRISPR−Cas系またはCRISPR酵素系を提供する。一態様において、本発明は、第2の調節エレメントがポリメラーゼIIプロモーターであるCRISPR−Cas系またはCRISPR酵素系を提供する。

一態様において、本発明は、ガイド配列が少なくとも15ヌクレオチドを含むCRISPR−Cas系またはCRISPR酵素系を提供する。

一態様において、本発明は、改変が、最適化tracr配列ならびに/または最適化ガイド配列RNAならびに/またはtracr配列および/もしくはtracrメイト配列の同時フォールド(co−fold)構造ならびに/またはtracr配列の安定化二次構造ならびに/または塩基対形成の低減した領域を有するtracr配列ならびに/またはtracr配列融合RNAエレメントを含み;および/または多重化系において、tracerを含み、複数のガイドを含む2つのRNAまたは複数のキメラを含む1つのRNAが存在するCRISPR−Cas系またはCRISPR酵素系を提供する。

本発明の態様において、キメラRNAアーキテクチャーは、突然変異導入試験の結果に従ってさらに最適化される。2つ以上のヘアピンを有するキメラRNAにおいて、ヘアピンを安定化するための近位ダイレクトリピート中の突然変異は、CRISPR複合体活性の停止をもたらし得る。ヘアピンを短縮または安定化するための遠位ダイレクトリピート中の突然変異は、CRISPR複合体活性に対する影響を有さないことがある。近位リピートと遠位リピートとの間のバルジ領域中の配列ランダム化は、CRISPR複合体活性を顕著に低減させ得る。ヘアピン間のリンカー領域中の単一の塩基対変化または配列ランダム化は、CRISPR複合体活性の完全な損失をもたらし得る。ガイド配列後の第1のヘアピンに続く遠位ヘアピンのヘアピン安定化は、CRISPR複合体活性の維持または改善をもたらし得る。したがって、本発明の好ましい実施形態において、キメラRNAアーキテクチャーは、治療送達の任意選択および他の使用に有益であり得るより小さいキメラRNAを生成することによりさらに最適化することができ、このことは、ヘアピンを短縮または安定化するように遠位ダイレクトリピートを変更することにより達成することができる。本発明のさらに好ましい実施形態において、キメラRNAアーキテクチャーは、遠位ヘアピンの1つ以上を安定化することによりさらに最適化することができる。ヘアピンの安定化は、ヘアピンの形成に好適な配列の改変を含み得る。本発明の一部の態様において、少なくとも2、3、4、5つ、またはそれよりも多い追加のヘアピンが提供される。本発明の一部の態様において、10、9、8、7、6つ以下の追加のヘアピンが提供される。本発明の一部の態様において、安定化は、架橋および他の改変であり得る。改変は、少なくとも1つの天然に存在しないヌクレオチド、または修飾ヌクレオチド、またはそれらのアナログの包含を含み得る。修飾ヌクレオチドは、リボース、ホスフェート、および/または塩基部分において修飾されていてよい。修飾ヌクレオチドとしては、2’−O−メチルアナログ、2’−デオキシアナログ、または2’−フルオロアナログを挙げることができる。核酸骨格を修飾することができ、例えば、ホスホロチオエート骨格を使用することができる。ロックド核酸(LNA)または架橋核酸(BNA)の使用も可能であり得る。修飾塩基のさらなる例としては、限定されるものではないが、2−アミノプリン、5−ブロモ−ウリジン、シュードウリジン、イノシン、7−メチルグアノシンが挙げられる。

一態様において、本発明は、CRISPR酵素が真核細胞中の発現のためにコドン最適化されているCRISPR−Cas系またはCRISPR酵素系を提供する。

したがって、本発明の一部の態様において、本発明の構築物、例えば、キメラ構築物において要求されるtracRNAの長さは、必ずしも固定する必要はなく、本発明の一部の態様において、それは40〜120bpであり得、本発明の一部の態様において、最大で全長のtracrであり、例えば、本発明の一部の態様において、細菌ゲノム中の転写終結シグナルにより中断されるtracrの3’末端までである。ある実施形態において、tracRNAの長さは、野生型tracRNAの少なくともヌクレオチド1〜67を含み、一部の実施形態において、少なくともヌクレオチド1〜85を含む。一部の実施形態において、少なくとも野生型化膿性連鎖球菌(S.pyogenes)Cas9tracRNAのヌクレオチド1〜67または1〜85に対応するヌクレオチドを使用することができる。CRISPR系がCas9以外、またはSpCas9以外の酵素を使用する場合、関連野生型tracRNA中の対応するヌクレオチドが存在し得る。一部の実施形態において、tracRNAの長さは、野生型tracRNAのヌクレオチド1〜67または1〜85以下を含む。配列最適化(例えば、ポリT配列の低減)に関して、例えば、tracrメイト(ダイレクトリピート)またはtracrRNA内部のTのストリングに関して、本発明の一部の態様において、関連野生型配列のポリT配列中に存在する1つ以上のT(すなわち、3、4、5、6つ、またはそれよりも多い数を超える連続T塩基のストレッチ;一部の実施形態において、10、9、8、7、6つ以下の連続T塩基のストレッチ)を、非Tヌクレオチド、例えば、Aにより置換することができ、したがって、ストリングがTのより小さいストレッチに分解され、それぞれのストレッチは、4つ、または4つ未満(例えば、3または2つ)の連続Tを有する。Tのストリングがヘアピン(またはステムループ)の形成に関与する場合、非T塩基についての相補的塩基を非Tヌクレオチドの相補鎖に変えることが有利である。例えば、非T塩基がAである場合、その相補鎖をTに変え、例えば、二次構造を保存し、またはその保存を支援することができる。例えば、5’−TTTTTを5’−TTTATになるように変更し、相補的な5’−AAAAAを5’−ATAAAに変えることができる。tracr+tracrメイト転写物中のポリTターミネーター配列、例えば、ポリTターミネーター(TTTTTまたはそれより多い数のT)の存在に関して、本発明の一部の態様において、2つのRNA(tracrおよびtracrメイト)であろうと単一ガイドRNA形態であろうと、このようなものを転写物の末端に付加することが有利である。tracrおよびtracrメイト転写物中のループおよびヘアピンに関して、本発明の一部の態様において、最少の2つのヘアピンがキメラガイドRNA中に存在することが有利である。第1のヘアピンは、tracrとtracrメイト(ダイレクトリピート)配列との間の相補性により形成されるヘアピンであり得る。第2のヘアピンは、tracrRNA配列の3’末端におけるものであり得、これは、Cas9との相互作用のための二次構造を提供し得る。追加のヘアピンは、ガイドRNAの3’に付加し、例えば、本発明の一部の態様において、ガイドRNAの安定性を増加させることができる。さらに、ガイドRNAの5’末端は、本発明の一部の態様において、伸長させることができる。本発明の一部の態様において、5’末端中の20bpをガイド配列とみなすことができる。5’部分は伸長させることができる。1つ以上のヘアピンは、5’部分中で提供することができ、例えば、本発明の一部の態様において、これは、ガイドRNAの安定性も改善し得る。本発明の一部の態様において、規定のヘアピンは、配列(5’−AGGACGAAGTCCTAA)をガイド配列の5’末端に追加することにより提供することができ、本発明の一部の態様において、これは、安定性の改善に役立ち得る。ヘアピンの形成に好適な他の配列は、当業者に公知であり、本発明のある態様において使用することができる。本発明の一部の態様において、少なくとも2、3、4、5つ、またはそれよりも多い追加のヘアピンが提供される。本発明の一部の態様において、10、9、8、7、6つ以下の追加のヘアピンが提供される。上記のものは、ガイド配列中の二次構造を含む本発明の態様も提供する。本発明の一部の態様において、例えば、安定性を改善するための架橋および他の改変が存在し得る。改変は、少なくとも1つの天然に存在しないヌクレオチド、または修飾ヌクレオチド、またはそれらのアナログの包含を含み得る。修飾ヌクレオチドは、リボース、ホスフェート、および/または塩基部分において修飾されていてよい。修飾ヌクレオチドとしては、2’−O−メチルアナログ、2’−デオキシアナログ、または2’−フルオロアナログを挙げることができる。核酸骨格を修飾することができ、例えば、ホスホロチオエート骨格を使用することができる。ロックド核酸(LNA)または架橋核酸(BNA)の使用も可能であり得る。修飾塩基のさらなる例としては、限定されるものではないが、2−アミノプリン、5−ブロモ−ウリジン、シュードウリジン、イノシン、7−メチルグアノシンが挙げられる。このような改変または架橋は、ガイド配列またはガイド配列に隣接する他の配列中に存在し得る。

したがって、本発明の目的は、任意の既に公知の生成物、その生成物の作製方法、またはその生成物の使用方法を本発明に包含することではなく、したがって、本出願人らは、その権利を保有し、任意の既に公知の生成物、作製方法、または使用方法の放棄を本明細書に開示する。本発明は、USPTO(米国特許法第112条、第1段落)またはEPO(欧州特許条約第83条)の記載要件および実施可能要件を満たさない任意の生成物、方法、または生成物の作製または生成物の使用方法を、本発明の範囲に包含しないものとし、したがって、本出願人らは、その権利を保有し、任意の既に記載の生成物、その生成物の作製方法、またはその生成物の使用方法の放棄を本明細書に開示することがさらに留意される。

本開示および特に特許請求の範囲および/または段落において、「含む(comprises)」、「含んだ(comprised)」、「含む(comprising)」などのような用語は、米国特許法に帰属する意味を有し得;例えば、それらは、「含む(includes)」、「含んだ(included)」、「含む(including)」などを意味し得;「本質的に〜からなる(consisting essentially of)」および「本質的に〜からなる(consists essentially of)」のような用語は、米国特許法に帰属する意味を有し、例えば、それらは、明示的に記述されない構成要素を許容するが、先行技術に見出され、または本発明の基本もしくは新規特徴に影響する構成要素を排除することが留意される。これらのおよび他の実施形態は、以下の詳細な説明により開示され、またはそれから明らかであり、それにより包含される。

本発明の新規特徴を、特に添付の特許請求の範囲を用いて記載する。本発明の特徴および利点のより良好な理解は、本発明の原理が利用される説明的な実施形態を記載する以下の詳細な説明、および付属の図面を参照することにより得られる。

CRISPR系の模式的モデルを示す。化膿性連鎖球菌(Streptococcus pyogenes)からのCas9ヌクレアーゼ(黄色)を、20ntガイド配列(青色)および足場(赤色)からなる合成ガイドRNA(sgRNA)によりゲノムDNAにターゲティングする。必要な5’−NGGプロトスペーサー隣接モチーフ(PAM;マゼンタ)のすぐ上流のDNA標的(青色)とのガイド配列塩基対、およびCas9は、PAMの約3bp上流の二本鎖切断(DSB)(赤色三)を媒介する。

例示的CRISPR系、考えられる作用機序、真核細胞中の発現の例示的適応、ならびに核局在化およびCRISPR活性を評価する試験の結果を示す。

例示的CRISPR系、考えられる作用機序、真核細胞中の発現の例示的適応、ならびに核局在化およびCRISPR活性を評価する試験の結果を示す。

例示的CRISPR系、考えられる作用機序、真核細胞中の発現の例示的適応、ならびに核局在化およびCRISPR活性を評価する試験の結果を示す。

例示的CRISPR系、考えられる作用機序、真核細胞中の発現の例示的適応、ならびに核局在化およびCRISPR活性を評価する試験の結果を示す。

例示的CRISPR系、考えられる作用機序、真核細胞中の発現の例示的適応、ならびに核局在化およびCRISPR活性を評価する試験の結果を示す。

例示的CRISPR系、考えられる作用機序、真核細胞中の発現の例示的適応、ならびに核局在化およびCRISPR活性を評価する試験の結果を示す。

真核細胞中のCRISPR系エレメントの発現のための例示的発現カセット、例示的ガイド配列の予測構造、ならびに真核および原核細胞中で計測されたCRISPR系活性を示す。

例示的標的についてのSpCas9特異性の評価の結果を示す。

例示的標的についてのSpCas9特異性の評価の結果を示す。

例示的標的についてのSpCas9特異性の評価の結果を示す。

例示的標的についてのSpCas9特異性の評価の結果を示す。

例示的ベクター系および真核細胞中の相同組換えの指向におけるその使用についての結果を示す。

例示的ベクター系および真核細胞中の相同組換えの指向におけるその使用についての結果を示す。

例示的ベクター系および真核細胞中の相同組換えの指向におけるその使用についての結果を示す。

例示的ベクター系および真核細胞中の相同組換えの指向におけるその使用についての結果を示す。

例示的ベクター系および真核細胞中の相同組換えの指向におけるその使用についての結果を示す。

例示的ベクター系および真核細胞中の相同組換えの指向におけるその使用についての結果を示す。

例示的ベクター系および真核細胞中の相同組換えの指向におけるその使用についての結果を示す。

Cas9媒介遺伝子ターゲティングについての異なるtracrRNA転写物の比較を説明する。

Cas9媒介遺伝子ターゲティングについての異なるtracrRNA転写物の比較を説明する。

Cas9媒介遺伝子ターゲティングについての異なるtracrRNA転写物の比較を説明する。

例示的CRISPR系、真核細胞中の発現のための例示的適応、およびCRISPR活性を評価する試験の結果を説明する。

例示的CRISPR系、真核細胞中の発現のための例示的適応、およびCRISPR活性を評価する試験の結果を説明する。

例示的CRISPR系、真核細胞中の発現のための例示的適応、およびCRISPR活性を評価する試験の結果を説明する。

例示的CRISPR系、真核細胞中の発現のための例示的適応、およびCRISPR活性を評価する試験の結果を説明する。

哺乳動物細胞中のゲノム遺伝子座をターゲティングするためのCRISPR系の例示的操作を説明する。

哺乳動物細胞中のcrRNAプロセシングのノザンブロット分析の結果を説明する。

キメラRNAの模式的表示および真核細胞中のCRISPR系活性についてのSURVEYORアッセイの結果を説明する。

キメラRNAの模式的表示および真核細胞中のCRISPR系活性についてのSURVEYORアッセイの結果を説明する。

キメラRNAの模式的表示および真核細胞中のCRISPR系活性についてのSURVEYORアッセイの結果を説明する。

真核細胞中のCRISPR系活性についてのSURVEYORアッセイの結果のグラフ表示を説明する。

ガイド配列、tracrメイト配列、およびtracr配列を含む例示的キメラRNAについての予測二次構造を説明する。

Cas遺伝子の系統発生樹である。

Cas遺伝子の系統発生樹である。

Cas遺伝子の系統発生樹である。

Cas遺伝子の系統発生樹である。

大型Cas9(約1400アミノ酸)の3つの群および小型Cas9(約1100アミノ酸)の2つの群を含むCas9の5つのファミリーを明らかにする系統発生分析を示す。

大型Cas9(約1400アミノ酸)の3つの群および小型Cas9(約1100アミノ酸)の2つの群を含むCas9の5つのファミリーを明らかにする系統発生分析を示す。

大型Cas9(約1400アミノ酸)の3つの群および小型Cas9(約1100アミノ酸)の2つの群を含むCas9の5つのファミリーを明らかにする系統発生分析を示す。

大型Cas9(約1400アミノ酸)の3つの群および小型Cas9(約1100アミノ酸)の2つの群を含むCas9の5つのファミリーを明らかにする系統発生分析を示す。

大型Cas9(約1400アミノ酸)の3つの群および小型Cas9(約1100アミノ酸)の2つの群を含むCas9の5つのファミリーを明らかにする系統発生分析を示す。

大型Cas9(約1400アミノ酸)の3つの群および小型Cas9(約1100アミノ酸)の2つの群を含むCas9の5つのファミリーを明らかにする系統発生分析を示す。

異なる最適化ガイドRNAの機能を示すグラフを示す。

異なるガイドキメラRNAの配列および構造を示す。

tracrRNAおよびダイレクトリピートの同時フォールド構造を示す。

インビトロでのSt1Cas9キメラガイドRNA最適化からのデータを示す。

インビトロでのSt1Cas9キメラガイドRNA最適化からのデータを示す。

SpCas9細胞溶解物による非メチル化またはメチル化標的のいずれかの開裂を示す。

SpCas9媒介哺乳動物ゲノム編集のためのガイドRNAアーキテクチャーの最適化を示す。(a)全ての後続の実験において使用されたU6プロモーターによりドライブされる単一ガイドRNA(sgRNA)およびCBhプロモーターによりドライブされるヒトコドン最適化化膿性連鎖球菌(Streptococcus pyogenes)Cas9(hSpCas9)のためのバイシストロニック発現ベクター(PX330)の模式図。sgRNAは、示される種々の位置においてトランケートされた20ntガイド配列(青色)および足場(赤色)からなる。(b)ヒトEMX1およびPVALB遺伝子座におけるSpCas9媒介インデルについてのSURVEYORアッセイ。矢印は、予測SURVEYOR断片を示す(n=3)。(c)ローディング対照としてU1を用いる4つのsgRNAトランケーションアーキテクチャーについてのノザンブロット分析。(d)SpCas9の野生型(wt)またはニッカーゼ突然変異体(D10A)の両方が、ヒトEMX1遺伝子中へのHindIII部位の挿入を促進した。一本鎖オリゴヌクレオチド(ssODN)を、ゲノム配列に対してセンスまたはアンチセンス方向のいずれかで配向させ、相同組換えテンプレートとして使用した。(e)ヒトSERPINB5遺伝子座の模式図。sgRNAおよびPAMを配列上部の色付きバーにより示し;メチルシトシン(Me)を強調し(桃色)、転写開始部位(TSS、+1)に対してナンバリングする。(f)16個のクローンのバイサルファイトシーケンシングによりアッセイされたSERPINB5のメチル化状態。黒色丸、メチル化CpG;白色丸、非メチル化CpG。(g)ディープシーケンシングによりアッセイされたSERPINB5のメチル化領域をターゲティングする3つのsgRNAによる改変効率(n=2)。エラーバーは、Wilson区間(オンライン法)を示す。

CRISPR−Cas sgRNAアーキテクチャーのさらなる最適化を示す。(a)4つの追加のsgRNAアーキテクチャーI〜IVの模式図。それぞれ、tracrRNA(赤色)にハイブリダイズするダイレクトリピート(DR、灰色)に結合している20ntガイド配列(青色)からなる。DR−tracrRNAハイブリッドは、示されるとおり+12または+22においてトランケートされており、人工GAAAステムループを有する。tracrRNAトランケーション位置を、既に報告されているtracrRNAについての転写開始部位に従ってナンバリングする。sgRNAアーキテクチャーIIおよびIVは、早期転写ターミネーターとして機能し得るそれらのポリUトラクト内の突然変異を担持する。(b)標的部位1〜3についてのヒトEMX1遺伝子座におけるSpCas9媒介インデルについてのSURVEYORアッセイ。矢印は、予測SURVEYOR断片を示す(n=3)。

ヒトゲノム中の一部の標的部位の可視化を説明する。

(A)sgRNAの模式図および(B)最大開裂効率を有する最適なトランケートアーキテクチャーについてのSaCas9についての5つのsgRNAバリアントのSURVEYOR分析を示す。

本明細書における図面は、説明目的のためのものにすぎず、必ずしも一定の縮尺で描画されるものではない。

用語「ポリヌクレオチド」、「ヌクレオチド」、「ヌクレオチド配列」、「核酸」および「オリゴヌクレオチド」は、互換的に使用される。これらは、任意の長さのヌクレオチド、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれか、またはそれらのアナログのポリマー形態を指す。ポリヌクレオチドは、任意の三次元構造を有し得、既知または未知の任意の機能を遂行し得る。以下のものは、ポリヌクレオチドの非限定的な例である:遺伝子または遺伝子断片のコードまたは非コード領域、連鎖分析から定義される遺伝子座(遺伝子座)、エキソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、短鎖干渉RNA(siRNA)、短鎖ヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分枝鎖ポリヌクレオチド、プラスミド、ベクター、任意配列の単離DNA、任意配列の単離RNA、核酸プローブ、およびプライマー。ポリヌクレオチドは、1つ以上の改変ヌクレオチド、例えば、メチル化ヌクレオチドまたはヌクレオチドアナログを含み得る。ヌクレオチド構造の改変は、存在する場合、ポリマーの集合前または後に与えることができる。ヌクレオチドの配列は、非ヌクレオチド成分により中断することができる。ポリヌクレオチドは、重合後に例えば標識成分とのコンジュゲーションによりさらに改変することができる。

本発明の態様において、用語「キメラRNA」、「キメラガイドRNA」、「ガイドRNA」、「単一ガイドRNA」および「合成ガイドRNA」は、互換的に使用され、ガイド配列、tracr配列およびtracrメイト配列を含むポリヌクレオチド配列を指す。用語「ガイド配列」は、標的部位を規定するガイドRNA内の約20bp配列を指し、用語「ガイド」または「スペーサー」と互換的に使用することができる。用語「tracrメイト配列」も、用語「ダイレクトリピート」と互換的に使用することができる。

本明細書において使用される用語「野生型」は、当業者により理解される当技術分野の用語であり、突然変異体またはバリアント形態から区別される天然状態で生じるままの生物、株、遺伝子または特徴の典型的な形態を意味する。

本明細書において使用される用語「バリアント」は、天然状態で生じるものから逸脱するパターンを有する品質の提示を意味すると解釈すべきである。

用語「天然に存在しない」または「エンジニアリングされた」は、互換的に使用され、人工の関与を示す。この用語は、核酸分子またはポリペプチドを指す場合、核酸分子またはポリペプチドが、それらが天然状態で天然に会合し、または天然状態で見出される少なくとも1つの他の成分を少なくとも実質的に含まないことを意味する。

「相補性」は、古典的ワトソン−クリック塩基対形成または他の非古典的タイプのいずれかによる別の核酸配列との素結合を形成する核酸の能力を指す。相補性パーセントは、第2の核酸配列との水素結合(例えば、ワトソン−クリック塩基対形成)を形成し得る核酸分子中の残基の割合を示す(例えば、10のうち5、6、7、8、9、10は、50%、60%、70%、80%、90%、および100%の相補性である)。「完全に相補的」は、核酸配列の全ての連続残基が第2の核酸配列中の同一数の連続残基と水素結合することを意味する。本明細書において使用される「実質的に相補的」は、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、またはそれよりも多いヌクレオチドの領域に対して少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、もしくは100%である相補性の程度を指し、またはストリンジェントな条件下でハイブリダイズする2つの核酸を指す。

本明細書において使用されるハイブリダイゼーションのための「ストリンジェントな条件」は、標的配列に対する相補性を有する核酸が、標的配列と優位にハイブリダイズし、非標的配列と実質的にハイブリダイズしない条件を指す。ストリンジェントな条件は、一般に、配列依存的であり、多数の因子に応じて変動する。一般に、配列が長ければ、配列がその標的配列と特異的にハイブリダイズする温度が高い。ストリンジェントな条件の非限定的な例は、Tijssen(1993),Laboratory Techniques In Biochemistry And Molecular Biology−Hybridization With Nucleic Acid Probes Part I,Second Chapter“Overview of principles of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N.Y.に詳述されている。

「ハイブリダイゼーション」は、1つ以上のポリヌクレオチドが反応してヌクレオチド残基の塩基間の水素結合を介して安定化される複合体を形成する反応を指す。水素結合は、ワトソン・クリック塩基対形成、フーグスティーン結合により、または任意の他の配列特異的様式で生じ得る。複合体は、二本鎖構造を形成する2つの鎖、多重鎖複合体を形成する3つ以上の鎖、単一の自己ハイブリダイズする鎖、またはそれらの任意の組合せを含み得る。ハイブリダイゼーション反応は、より広範なプロセス、例えば、PCRの開始、または酵素によるポリヌクレオチドの開裂におけるステップを構成し得る。所与の配列とハイブリダイズし得る配列は、所与の配列の「相補鎖」と称される。

CRISPR系の成分に関して本明細書において使用される「安定化」または「安定性を増加させること」は、分子の構造を確保または定常化することに関する。このことは、単一または複数の塩基対変化、ヘアピン数の増加、架橋、ヌクレオチドの特定のストレッチの破壊および他の改変を含む1つまたは突然変異の導入により達成することができる。改変は、少なくとも1つの天然に存在しないヌクレオチド、または修飾ヌクレオチド、またはそれらのアナログの包含を含み得る。修飾ヌクレオチドは、リボース、ホスフェート、および/または塩基部分において修飾されていてよい。修飾ヌクレオチドとしては、2’−O−メチルアナログ、2’−デオキシアナログ、または2’−フルオロアナログを挙げることができる。核酸骨格を修飾することができ、例えば、ホスホロチオエート骨格を使用することができる。ロックド核酸(LNA)または架橋核酸(BNA)の使用も可能であり得る。修飾塩基のさらなる例としては、限定されるものではないが、2−アミノプリン、5−ブロモ−ウリジン、シュードウリジン、イノシン、7−メチルグアノシンが挙げられる。これらの改変は、CRISPR系の任意の成分に当てはまり得る。好ましい実施形態において、これらの改変は、RNA成分、例えば、ガイドRNAまたはキメラポリヌクレオチド配列になされる。

本明細書において使用される「発現」は、ポリヌクレオチドがDNAテンプレートから(例えば、mRNAまたは他のRNA転写物に)転写されるプロセスおよび/または転写されたmRNAが続いてペプチド、ポリペプチド、またはタンパク質に翻訳されるプロセスを指す。転写物およびコードされるポリペプチドは、集合的に「遺伝子産物」と称することができる。ポリヌクレオチドがゲノムDNAに由来する場合、発現は、真核細胞中のmRNAのスプライシングを含み得る。

用語「ポリペプチド」、「ペプチド」および「タンパク質」は、本明細書において、任意の長さのアミノ酸のポリマーを指すために互換的に使用される。ポリマーは、直鎖または分枝鎖であり得、それは、改変アミノ酸を含み得、それは、非アミノ酸により中断されていてよい。この用語は、改変、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、または任意の他の操作、例えば、標識成分とのコンジュゲーションを受けたアミノ酸ポリマーも包含する。本明細書において使用される用語「アミノ酸」は、グリシンおよびDまたはL光学異性体の両方を含む天然および/または非天然または合成アミノ酸、ならびにアミノ酸アナログおよびペプチド模倣体を含む。

用語「対象」、「個体」、および「患者」は、本明細書において脊椎動物、好ましくは、哺乳動物、より好ましくは、ヒトを指すために互換的に使用される。哺乳動物としては、限定されるものではないが、ネズミ、サル、ヒト、家畜、競技動物、および愛玩動物が挙げられる。インビボで得られ、またはインビトロで培養される生物学的実体の組織、細胞およびそれらの子孫も包含される。一部の実施形態において、対象は、無脊椎動物、例えば、昆虫または線形動物であり得;他方、対象は、植物または真菌であり得る。

用語「治療剤(therapeutic agent)」、「治療可能薬剤」または「治療剤(treatment agent)」は、互換的に使用され、対象への投与時にいくつかの利益効果を付与する分子または化合物を指す。利益効果としては、診断測定の使用可能性;疾患、症状、障害、または病的状態の改善;疾患、症状、障害または病態の軽減またはその発症の予防;および一般には疾患、症状、障害または病的状態の中和が挙げられる。

本明細書において使用される「治療」もしくは「治療する」または「緩和する」または「改善する」は、互換的に使用される。これらの用語は、利益または所望の結果、例として、限定されるものではないが、治療利益および/または予防利益を得るためのアプローチを指す。治療利益は、治療中の1つ以上の疾患、病態、または症状の任意の治療関連改善またはそれらに対する効果を意味する。予防利益については、疾患も、病態も、症状もこれまで顕在化し得なかった場合であっても、組成物を特定の疾患、病態、もしくは症状の発症リスクのある対象に、または疾患の生理学的症状の1つ以上を報告する対象に投与することができる。

用語「有効量」または「治療有効量」は、利益または所望の結果を生じさせるために十分な薬剤の量を指す。治療有効量は、治療される対象および病状、対象の体重および年齢、病状の重症度、投与様式などの1つ以上に応じて変動し得、それらは当業者が容易に決定することができる。この用語は、本明細書に記載のイメージング法のいずれか1つによる検出のための画像を提供する用量にも当てはまる。規定の用量は、選択される特定の薬剤、遵守すべき投与レジメン、他の化合物との組合せで投与するか否か、投与のタイミング、イメージングすべき組織、およびそれが担持される物理的送達系の1つ以上に応じて変動し得る。

本発明の実施は、特に記載のない限り、当業者の技能の範囲内である免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクスおよび組換えDNAの慣用の技術を用いる。Sambrook,Fritsch and Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL,2nd edition(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel,et al.eds.,(1987));シリーズMETHODS IN ENZYMOLOGY(Academic Press,Inc.):PCR 2:A PRACTICAL APPROACH(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995))、Harlow and Lane,eds.(1988)ANTIBODIES,A LABORATORY MANUAL、およびANIMAL CELL CULTURE(R.I.Freshney,ed.(1987))参照。

本発明のいくつかの態様は、1つ以上のベクターを含むベクター系、またはベクター自体に関する。ベクターは、原核または真核細胞中のCRISPR転写物(例えば、核酸転写物、タンパク質、または酵素)の発現のために設計することができる。例えば、CRISPR転写物は、細菌細胞、例えば、大腸菌(Escherichia coli)、昆虫細胞(バキュロウイルス発現ベクターを使用)、酵母細胞、または哺乳動物細胞中で発現させることができる。好適な宿主細胞は、Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)にさらに考察されている。あるいは、組換え発現ベクターをインビトロで、例えばT7プロモーター調節配列およびT7ポリメラーゼを使用して転写および翻訳させることができる。

ベクターは、原核細胞中に導入し、その中で増殖させることができる。一部の実施形態において、原核生物を使用して真核細胞中に導入すべきベクターのコピーを増幅し、または真核細胞中に導入すべきベクターの産生における中間ベクターとして使用される(例えば、ウイルスベクターパッケージング系の一部としてプラスミドを増幅)。一部の実施形態において、原核生物を使用してベクターのコピーを増幅し、1つ以上の核酸を発現させ、例えば、宿主細胞または宿主生物への送達のための1つ以上のタンパク質の資源を提供する。原核生物中のタンパク質の発現は、大腸菌(Escherichia coli)中で、融合または非融合タンパク質のいずれかの発現を指向する構成的または誘導的プロモーターを含有するベクターを用いて実施されることが最も多い。融合ベクターは、多数のアミノ酸をそれにコードされるタンパク質に、例えば、組換えタンパク質のアミノ末端に付加する。このような融合ベクターは、1つ以上の目的、例えば、(i)組換えタンパク質の発現の増加;(ii)組換えタンパク質の溶解度の増加;および(iii)親和性精製におけるリガンドとして作用することによる組換えタンパク質の精製の支援を果たし得る。融合発現ベクターにおいて、タンパク質分解開裂部位を融合部分および組換えタンパク質の接合部に導入して融合タンパク質の精製後に融合部分からの組換えタンパク質の分離を可能とすることが多い。このような酵素、およびそのコグネート認識配列としては、Xa因子、トロンビンおよびエンテロキナーゼが挙げられる。例示的融合発現ベクターとしては、pGEX(Pharmacia Biotech Inc;Smith and Johnson,1988.Gene 67:31−40)、pMAL(New England Biolabs,Beverly,Mass.)およびpRIT5(Pharmacia,Piscataway,N.J.)が挙げられ、それぞれ、グルタチオンS−トランスフェラーゼ(GST)、マルトースE結合タンパク質、またはプロテインAを標的組換えタンパク質に融合する。

好適な誘導的非融合大腸菌(E.coli)発現ベクターの例としては、pTrc(Amrann et al.,(1988)Gene 69:301−315)およびpET 11d(Studier et al.,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)60−89)が挙げられる。

一部の実施形態において、ベクターは、酵母発現ベクターである。酵母の出芽酵母(Saccharomyces cerivisae)中の発現のためのベクターの例としては、pYepSec1(Baldari,et al.,1987.EMBO J.6:229−234)、pMFa(Kuijan and Herskowitz,1982.Cell 30:933−943)、pJRY88(Schultz et al.,1987.Gene 54:113−123)、pYES2(Invitrogen Corporation,San Diego,Calif.)、およびpicZ(InVitrogen Corp,San Diego,Calif.)が挙げられる。

一部の実施形態において、ベクターは、バキュロウイルス発現ベクターを使用して昆虫細胞中のタンパク質発現をドライブする。培養昆虫細胞(例えば、SF9細胞)中のタンパク質の発現に利用可能なバキュロウイルスベクターとしては、pAcシリーズ(Smith,et al.,1983.Mol.Cell.Biol.3:2156−2165)およびpVLシリーズ(Lucklow and Summers,1989.Virology 170:31−39)が挙げられる。

一部の実施形態において、ベクターは、哺乳動物発現ベクターを使用して哺乳動物細胞中の1つ以上の配列の発現をドライブし得る。哺乳動物発現ベクターの例としては、pCDM8(Seed,1987.Nature 329:840)およびpMT2PC(Kaufman,et al.,1987.EMBO J.6:187−195)が挙げられる。哺乳動物細胞中で使用される場合、発現ベクター制御機能は、典型的には、1つ以上の調節エレメントにより提供される。例えば、一般に使用されるプロモーターは、ポリオーマ、アデノウイルス2型、サイトメガロウイルス、シミアンウイルス40、ならびに本明細書に開示の他のものおよび当技術分野において公知のものに由来する。原核および真核細胞の両方のために他の好適な発現系については、例えば、Chapters 16 and 17 of Sambrook,et al.,MOLECULAR CLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989参照。

一部の実施形態において、組換え哺乳動物発現ベクターは、特定の細胞タイプ中の核酸の発現を優先的に指向し得る(例えば、組織特異的調節エレメントを使用して核酸を発現させる)。組織特異的調節エレメントは、当技術分野において公知である。好適な組織特異的プロモーターの非限定的な例としては、アルブミンプロモーター(肝臓特異的;Pinkert,et al.,1987.Genes Dev.1:268−277)、リンパ系特異的プロモーター(Calame and Eaton,1988.Adv.Immunol.43:235−275)、特にT細胞受容体のプロモーター(Winoto and Baltimore,1989.EMBO J.8:729−733)および免疫グロブリン(Baneiji,et al.,1983.Cell 33:729−740;Queen and Baltimore,1983.Cell 33:741−748)、神経細胞特異的プロモーター(例えば、ニューロフィラメントプロモーター;Byrne and Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473−5477)、膵臓特異的プロモーター(Edlund,et al.,1985.Science 230:912−916)、および乳腺特異的プロモーター(例えば、乳清プロモーター;米国特許第4,873,316号明細書および欧州特許出願公開第264,166号明細書)が挙げられる。発生制御プロモーター、例えば、ネズミhoxプロモーター(Kessel and Gruss,1990.Science 249:374−379)およびα−フェトタンパク質プロモーター(Campes and Tilghman,1989.Genes Dev.3:537−546)も包含される。

一部の実施形態において、調節エレメントは、CRISPR系の1つ以上のエレメントの発現をドライブするようにCRISPR系の1つ以上のエレメントに作動可能に結合している。一般に、CRISPR(クラスター化等間隔短鎖回分リピート)は、SPIDR(スペーサー散在型ダイレクトリピート(SPacer Interspersed Direct Repeat))としても公知であり、通常、特定の細菌種に特異的であるDNA遺伝子座のファミリーを構成する。CRISPR遺伝子座は、大腸菌(E.coli)中で認識された区別されるクラスの散在型短鎖配列リピート(SSR)(Ishino et al.,J.Bacteriol.,169:5429−5433[1987];およびNakata et al.,J.Bacteriol.,171:3553−3556[1989])および関連遺伝子を含む。類似の散在型SSRが、ハロフェラックス・メディテラネイ(Haloferax mediterranei)、化膿性連鎖球菌(Streptococcus pyogenes)、アナベナ属(Anabaena)、および結核菌(Mycobacterium tuberculosis)中で同定されている(Groenen et al.,Mol.Microbiol.,10:1057−1065[1993];Hoe et al.,Emerg.Infect.Dis.,5:254−263[1999];Masepohl et al.,Biochim.Biophys.Acta 1307:26−30[1996];およびMojica et al.,Mol.Microbiol.,17:85−93[1995]参照)。CRISPR遺伝子座は、典型的には他のSSRとリピートの構造が異なり、それは短鎖等間隔リピート(SRSR)と称されている(Janssen et al.,OMICS J.Integ.Biol.,6:23−33[2002];およびMojica et al.,Mol.Microbiol.,36:244−246[2000])。一般に、リピートは、実質的に一定の長さを有するユニーク介入配列により等間隔とされているクラスターで生じる短いエレメントである(Mojica et al.,[2000]、前掲)。リピート配列は株間で高度に保存されているが、散在型リピートの数およびスペーサー領域の配列は、典型的には、株ごとに異なる(van Embden et al.,J.Bacteriol.,182:2393−2401[2000])。CRISPR遺伝子座は、40を超える原核生物中で同定されており(例えば、Jansen et al.,Mol.Microbiol.,43:1565−1575[2002];およびMojica et al.,[2005]参照)、例として、限定されるものではないが、アエロパイラム属(Aeropyrum)、パイロバキュラム属(Pyrobaculum)、スルフォロバス属(Sulfolobus)、アーケオグロバス属(Archaeoglobus)、ハロカーキュラ属(Halocarcula)、メタノバクテリウム属(Methanobacterium)、メタノコッカス属(Methanococcus)、メタノサルシナ属(Methanosarcina)、メタノパイラス属(Methanopyrus)、パイロコッカス属(Pyrococcus)、ピクロフィラス属(Picrophilus)、サーモプラズマ属(Thermoplasma)、コリネバクテリウム属(Corynebacterium)、マイコバクテリウム属(Mycobacterium)、ストレプトマイセス属(Streptomyces)、アキフェックス属(Aquifex)、ポーフィロモナス属(Porphyromonas)、クロロビウム属(Chlorobium)、サーマス属(Thermus)、バシラス属(Bacillus)、リステリア属(Listeria)、スタフィロコッカス属(Staphylococcus)、クロストリジウム属(Clostridium)、サーモアナエロバクター属(Thermoanaerobacter)、マイコプラズマ属(Mycoplasma)、フソバクテリウム属(Fusobacterium)、アザーカス属(Azarcus)、クロモバクテリウム属(Chromobacterium)、ネイセリア属(Neisseria)、ニトロソモナス属(Nitrosomonas)、デスルフォビブリオ属(Desulfovibrio)、ジオバクター属(Geobacter)、ミクソコッカス属(Myxococcus)、カンピロバクター属(Campylobacter)、ウォリネラ属(Wolinella)、アシネトバクター属(Acinetobacter)、エルウィニア属(Erwinia)、エシェリキア属(Escherichia)、レジオネラ属(Legionella)、メチロコッカス属(Methylococcus)、パスツレラ属(Pasteurella)、フォトバクテリウム属(Photobacterium)、サルモネラ属(Salmonella)、キサントモナス属(Xanthomonas)、エルシニア属(Yersinia)、トレポネーマ属(Treponema)、およびサーモトガ属(Thermotoga)である。

一般に、「CRISPR系」は、集合的に、CRISPR関連(「Cas」)遺伝子の発現またはその活性の指向に関与する転写物および他のエレメント、例として、Cas遺伝子をコードする配列、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性部分tracrRNA)、tracrメイト配列(内因性CRISPR系に関して「ダイレクトリピート」およびtracrRNAによりプロセシングされる部分ダイレクトリピートを包含)、ガイド配列(内因性CRISPR系に関して「スペーサー」とも称される)、またはCRISPR遺伝子座からの他の配列および転写物を指す。一部の実施形態において、CRISPR系の1つ以上のエレメントは、I型、II型、またはIII型CRISPR系に由来する。一部の実施形態において、CRISPR系の1つ以上のエレメントは、内因性CRISPR系を含む特定の生物、例えば、化膿性連鎖球菌(Streptococcus pyogenes)に由来する。一般に、CRISPR系は、標的配列(内因性CRISPR系に関してプロトスペーサーとも称される)におけるCRISPR複合体の形成を促進するエレメントを特徴とする。CRISPR複合体の形成に関して、「標的配列」は、ガイド配列が相補性を有するように設計される配列を指し、標的配列とガイド配列との間のハイブリダイゼーションがCRISPR複合体の形成を促進する。完全相補性は必ずしも要求されず、但し、ハイブリダイゼーションを引き起こし、CRISPR複合体の形成を促進するために十分な相補性が存在することを条件とする。標的配列は、任意のポリヌクレオチド、例えば、DNAまたはRNAポリヌクレオチドを含み得る。一部の実施形態において、標的配列は、細胞の核または細胞質中に局在している。一部の実施形態において、標的配列は、真核細胞のオルガネラ、例えば、ミトコンドリアまたはクロロプラスト内に存在し得る。標的配列を含むターゲティングされる遺伝子座中への組換えに使用することができる配列またはテンプレートは、「編集テンプレート」または「編集ポリヌクレオチド」または「編集配列」と称される。本発明の態様において、外因性テンプレートポリヌクレオチドを編集テンプレートと称することができる。本発明の一態様において、組換えは、相同組換えである。

典型的には、内因性CRISPR系に関して、CRISPR複合体の形成(標的配列にハイブリダイズされ、1つ以上のCasタンパク質と複合体形成しているガイド配列を含む)は、標的配列中または付近(例えば、それから1、2、3、4、5、6、7、8、9、10、20、50、またはそれよりも多い塩基対内)の一方または両方の鎖の開裂をもたらす。理論により拘束されるものではないが、tracr配列は、野生型tracr配列の全部または一部(例えば、野生型tracr配列の約または約20、26、32、45、48、54、63、67、85、またはそれよりも多い数を超えるヌクレオチド)を含み得、またはそれからなっていてよく、例えば、ガイド配列に作動可能に結合しているtracrメイト配列の全部または一部とのtracr配列の少なくとも一部に沿うハイブリダイゼーションによりCRISPR複合体の一部も形成し得る。一部の実施形態において、tracr配列は、ハイブリダイズし、CRISPR複合体の形成に関与するためにtracrメイト配列に対する十分な相補性を有する。標的配列と同様に、完全相補性は必要とされず、但し、機能的であるために十分な相補性が存在することを条件とすることが考えられる。一部の実施形態において、tracr配列は、最適にアラインされた場合、tracrメイト配列の長さに沿って少なくとも50%、60%、70%、80%、90%、95%または99%の配列相補性を有する。一部の実施形態において、CRISPR系の1つ以上のエレメントの発現をドライブする1つ以上のベクターを宿主細胞中に導入し、その結果、CRISPR系のエレメントの発現が1つ以上の標的部位におけるCRISPR複合体の形成を指向する。例えば、Cas酵素、tracrメイト配列に結合しているガイド配列、およびtracr配列は、それぞれ別個のベクター上の別個の調節エレメントに作動可能に結合させることができる。あるいは、同一または異なる調節エレメントから発現されるエレメントの2つ以上を単一ベクター中で合わせることができ、CRISPR系の任意の成分を提供する1つ以上の追加のベクターは第1のベクター中に含まれない。単一ベクター中で合わせるCRISPR系エレメントは、任意の好適な配向で配置することができ、例えば、あるエレメントを第2のエレメントに対して5’側(の上流)にまたは3’側(の下流)に局在化することができる。あるエレメントのコード配列は、第2のエレメントのコード配列の同一または逆鎖上で局在化し、同一または逆向きで配向させることができる。一部の実施形態において、単一のプロモーターは、CRISPR酵素をコードする転写物、ならびに1つ以上のイントロン配列内に埋め込まれているガイド配列、tracrメイト配列(場合により、ガイド配列に作動可能に結合している)、およびtracr配列(例えば、それぞれが異なるイントロン中に、2つ以上が少なくとも1つのイントロン中に、または全部が単一のイントロン中に存在する)の1つ以上の発現をドライブする。一部の実施形態において、CRISPR酵素、ガイド配列、tracrメイト配列、およびtracr配列は、同一のプロモーターに作動可能に結合しており、それから発現される。

一部の実施形態において、ベクターは、1つ以上の挿入部位、例えば、制限エンドヌクレアーゼ認識配列(「クローニング部位」とも称される)を含む。一部の実施形態において、1つ以上の挿入部位(例えば、約または約1、2、3、4、5、6、7、8、9、10、またはそれよりも多い数を超える挿入部位)は、1つ以上のベクターの1つ以上の配列エレメントの上流および/または下流に局在している。一部の実施形態において、ベクターは、tracrメイト配列の上流、および場合によりtracrメイト配列に作動可能に結合している調節エレメントの下流の挿入部位を含み、その結果、挿入部位中へのガイド配列の挿入後および発現時にガイド配列が真核細胞中の標的配列へのCRISPR複合体の配列特異的結合を指向する。一部の実施形態において、ベクターは、2つ以上の挿入部位を含み、それぞれの挿入部位は、それぞれの部位におけるガイド配列の挿入を可能とするために2つのtracrメイト配列間に局在している。このような配置において、2つ以上のガイド配列は、単一ガイド配列の2つ以上のコピー、2つ以上の異なるガイド配列、またはそれらの組合せを含み得る。複数の異なるガイド配列を使用する場合、単一発現構築物を使用して細胞内の複数の異なる対応する標的配列に対するCRISPR活性をターゲティングすることができる。例えば、単一ベクターは、約または約1、2、3、4、5、6、7、8、9、10、15、20、またはそれよりも多い数を超えるガイド配列を含み得る。一部の実施形態において、約または約1、2、3、4、5、6、7、8、9、10、またはそれよりも多い数を超えるそのようなガイド配列含有ベクターを提供し、場合により細胞に送達することができる。

一部の実施形態において、ベクターは、CRISPR酵素、例えば、Casタンパク質をコードする酵素コード配列に作動可能に結合している調節エレメントを含む。Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csn1およびCsx12としても公知)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、それらのホモログ、またはそれらの改変バージョンが挙げられる。これらの酵素は公知であり;例えば、化膿性連鎖球菌(S.pyogenes)Cas9タンパク質のアミノ酸配列は、SwissProtデータベース中にアクセッション番号Q99ZW2のもと見出すことができる。一部の実施形態において、非改変CRISPR酵素は、DNA開裂活性を有し、例えば、Cas9である。一部の実施形態において、CRISPR酵素は、Cas9であり、化膿性連鎖球菌(S.pyogenes)または肺炎連鎖球菌(S.pneumoniae)からのCas9であり得る。一部の実施形態において、CRISPR酵素は、標的配列の局在における、例えば、標的配列内および/または標的配列の相補鎖内の一方または両方の鎖の開裂を指向する。一部の実施形態において、CRISPR酵素は、標的配列の最初または最後のヌクレオチドからの約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはそれよりも多い塩基対内の一方または両方の鎖の開裂を指向する。一部の実施形態において、ベクターは、対応する野生型酵素に対して突然変異しているCRISPR酵素をコードし、その結果、突然変異CRISPR酵素は、標的配列を含有する標的ポリヌクレオチドの一方または両方の鎖を開裂する能力を欠く。例えば、化膿性連鎖球菌(S.pyogenes)からのCas9のRuvC I触媒ドメイン中のアスパラギン酸からアラニンへの置換(D10A)は、Cas9を両方の鎖を開裂するヌクレアーゼからニッカーゼ(一本鎖を開裂する)に変換する。Cas9をニッカーゼに変える突然変異の他の例としては、限定されるものではないが、H840A、N854A、およびN863Aが挙げられる。一部の実施形態において、Cas9ニッカーゼは、ガイド配列、例えば、DNA標的のセンスおよびアンチセンス鎖をそれぞれターゲティングする2つのガイド配列との組合せで使用することができる。この組合せにより、両方の鎖をニック形成し、それを使用してNHEJを誘導することが可能となる。本出願人らは、突然変異原性NHEJの誘導における2つのニッカーゼ標的(すなわち、同一局在であるがDNAの異なる鎖にターゲティングされるsgRNA)の効力を実証した(データ示さず)。単一ニッカーゼ(単一sgRNAを有するCas9−D10A)は、NHEJを誘導し、インデルを創成し得ないが、本出願人らは、二重ニッカーゼ(同一局在における異なる鎖にターゲティングされるCas9−D10Aおよび2つのsgRNA)がヒト胚性幹細胞(hESC)中でそれを行い得ることを示した。効率は、hESC中でヌクレアーゼ(すなわち、D10突然変異を有さない通常のCas9)の約50%である。

さらなる例として、Cas9の2つ以上の触媒ドメイン(RuvC I、RuvC II、およびRuvC III)を突然変異させて全てのDNA開裂活性を実質的に欠く突然変異Cas9を産生することができる。一部の実施形態において、D10A突然変異を、H840A、N854A、またはN863A突然変異の1つ以上と組み合わせて全てのDNA開裂活性を実質的に欠くCas9酵素を産生する。一部の実施形態において、CRISPR酵素は、突然変異酵素のDNA開裂活性がその非突然変異形態に対して約25%、10%、5%、1%、0.1%、0.01%、またはそれよりも小さい数未満である場合、全てのDNA開裂活性を実質的に欠くとみなす。他の突然変異は有用であり得;Cas9または他のCRISPR酵素は、化膿性連鎖球菌(S.pyogenes)以外の種からのものである場合、対応するアミノ酸の突然変異は、類似効果を達成するように作製することができる。

一部の実施形態において、CRISPR酵素をコードする酵素コード配列は、特定の細胞、例えば、真核細胞中の発現のためにコドン最適化されている。真核細胞は、特定の生物、例えば、哺乳動物、例として、限定されるものではないが、ヒト、マウス、ラット、ウサギ、イヌ、または非ヒト霊長類のものまたはそれに由来し得る。一般に、コドン最適化は、天然配列の少なくとも1つのコドン(例えば、約または約1、2、3、4、5、10、15、20、25、50、またはそれよりも多い数を超えるコドン)を、その宿主細胞の遺伝子中で使用されるより高頻度または最も高頻度のコドンにより置き換える一方、天然アミノ酸配列を維持することにより目的宿主細胞中の発現の向上のために核酸配列を改変するプロセスを指す。種々の種は、特定のアミノ酸のあるコドンについて特定のバイアスを示す。コドンバイアス(生物間のコドン使用頻度の差)は、メッセンジャーRNA(mRNA)の翻訳の効率と相関することが多く、このことは、次いで、とりわけ、翻訳されるコドンの特性および特定のトランスファーRNA(tRNA)分子の利用可能性に依存的であると考えられる。細胞中で選択されるtRNAの優位性は、一般に、ペプチド合成において最も高頻度で使用されるコドンの反映である。したがって、遺伝子は、コドン最適化に基づき所与の生物中の最適な遺伝子発現のために調整することができる。コドン使用頻度表は、例えば、「コドン使用頻度データベース」において容易に入手可能であり、これらの表は、多数の手法で適応させることができる。Nakamura,Y.,et al.“Codon usage tabulated from the international DNA sequence databases:status for the year 2000”Nucl.Acids Res.28:292(2000)参照。特定の宿主細胞中の発現のために特定の配列をコドン最適化するためのコンピュータアルゴリズムも入手可能であり、例えば、Gene Forge(Aptagen;Jacobus,PA)も入手可能である。一部の実施形態において、CRISPR酵素をコードする配列中の1つ以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50、またはそれよりも多い、または全てのコドン)は、特定のアミノ酸について最も高頻度で使用されるコドンに対応する。

一部の実施形態において、ベクターは、1つ以上の核局在化配列(NLS)、例えば、約また約1、2、3、4、5、6、7、8、9、10、またはそれよりも多い数を超えるNLSを含むCRISPR酵素をコードする。一部の実施形態において、CRISPR酵素は、アミノ末端またはその付近における約または約1、2、3、4、5、6、7、8、9、10、またはそれよりも多い数を超えるNLS、カルボキシ末端またはその付近における約または約1、2、3、4、5、6、7、8、9、10、またはそれよりも多い数を超えるNLS、またはそれらの組合せ(例えば、アミノ末端における1つ以上のNLSおよびカルボキシ末端における1つ以上のNLS)を含む。2つ以上のNLSが存在する場合、それぞれは、単一のNLSが2つ以上のコピーで存在し得るように他のものから独立して、および/または1つ以上のコピーで存在する1つ以上の他のNLSとの組合せで選択することができる。本発明の好ましい実施形態において、CRISPR酵素は、多くとも6つのNLSを含む。一部の実施形態において、NLSは、NLSの最近傍アミノ酸が、NまたはC末端からポリペプチド鎖に沿って約1、2、3、4、5、10、15、20、25、30、40、50、またはそれよりも多いアミノ酸内である場合、NまたはC末端付近に存在するとみなす。典型的には、NLSは、タンパク質表面上で露出される正荷電リジンまたはアルギニンの1つ以上の短い配列からなるが、他のタイプのNLSが公知である。NLSの非限定的な例としては、アミノ酸配列PKKKRKVを有するSV40ウイルスラージT抗原のNLS;ヌクレオプラスミンからのNLS(例えば、配列KRPAATKKAGQAKKKKを有するヌクレオプラスミン二分(bipartite)NLS);アミノ酸配列PAAKRVKLDまたはRQRRNELKRSPを有するc−mycNLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGYを有するhRNPA1 M9 NLS;インポーチンアルファからのIBBドメインの配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;筋腫Tタンパク質の配列VSRKRPRPおよびPPKKARED;ヒトp53の配列POPKKKPL;マウスc−abl IVの配列SALIKKKKKMAP;インフルエンザウイルスNS1の配列DRLRRおよびPKQKKRK;肝炎ウイルスデルタ抗原の配列RKLKKKIKKL;マウスMx1タンパク質の配列REKKKFLKRR;ヒトポリ(ADP−リボース)ポリメラーゼの配列KRKGDEVDGVDEVAKKKSKK;ならびにステロイドホルモン受容体(ヒト)グルココルチコイドの配列RKCLQAGMNLEARKTKKに由来するNLS配列が挙げられる。

一般に、1つ以上のNLSは、真核細胞の核中の検出可能な量のCRISPR酵素の蓄積をドライブするために十分な強度である。一般に、核局在化活性の強度は、CRISPR酵素中のNLSの数、使用される特定のNLS、またはそれらの因子の組合せに由来し得る。核中の蓄積の検出は、任意の好適な技術により実施することができる。例えば、検出可能なマーカーをCRISPR酵素に融合させることができ、その結果、細胞内の局在を、例えば、核の局在を検出する手段(例えば、核に特異的な染色、例えば、DAPI)との組合せで可視化することができる。検出可能なマーカーの例としては、蛍光タンパク質(例えば、緑色蛍光タンパク質、またはGFP;RFP;CFP)、およびエピトープタグ(HAタグ、flagタグ、SNAPタグ)が挙げられる。細胞核を細胞から単離することもでき、次いでその含有物を、タンパク質を検出する任意の好適なプロセス、例えば、免疫組織学的分析、ウエスタンブロット、または酵素活性アッセイにより分析することができる。核中の蓄積は、例えば、CRISPR複合体形成の効果についてのアッセイ(例えば、標的配列におけるDNA開裂もしくは突然変異についてのアッセイ、またはCRISPR複合体形成および/もしくはCRISPR酵素活性により影響される遺伝子発現活性の変化についてのアッセイ)により、CRISPR酵素にも複合体にも曝露されず、または1つ以上のNLSを欠くCRISPR酵素に曝露される対照と比較して間接的に測定することもできる。

一般に、ガイド配列は、標的配列とハイブリダイズし、標的配列へのCRISPR複合体の配列特異的結合を指向するために標的ポリヌクレオチド配列との十分な相補性を有する任意のポリヌクレオチド配列である。一部の実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、好適なアラインメントアルゴリズムを使用して最適にアラインされた場合、約または約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、またはそれよりも大きい数を超える。最適なアラインメントは、配列をアラインするための任意の好適なアルゴリズムを使用して決定することができ、その非限定的な例としては、Smith−Watermanアルゴリズム、Needleman−Wunschアルゴリズム、Burrows−Wheeler Transformをベースとするアルゴリズム(例えば、Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies,ELAND(Illumina,San Diego,CA)、SOAP(soap.genomics.org.cnにおいて入手可能)、およびMaq(maq.sourceforge.netにおいて入手可能)が挙げられる。一部の実施形態において、ガイド配列は、約または約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、またはそれよりも大きい数を超えるヌクレオチド長である。一部の実施形態において、ガイド配列は、約75、50、45、40、35、30、25、20、15、12、またはそれよりも小さい数未満のヌクレオチド長である。標的配列へのCRISPR複合体の配列特異的結合を指向するガイド配列の能力は、任意の好適なアッセイにより評価することができる。例えば、CRISPR複合体を形成するために十分なCRISPR系の成分、例として、試験すべきガイド配列は、対応する標的配列を有する宿主細胞に、例えば、CRISPR配列の成分をコードするベクターによる形質移入により提供することができ、次いで標的配列内の優先的開裂を例えば本明細書に記載のSurveyorアッセイにより評価する。同様に、標的ポリヌクレオチド配列の開裂は、試験管中で標的配列、CRISPR複合体の成分、例として、試験すべきガイド配列および試験ガイド配列とは異なる対照ガイド配列を提供し、試験および対照ガイド配列反応間の標的配列における結合または開裂の比率を比較することにより評価することができる。他のアッセイが考えられ、当業者はそれを認識する。

ガイド配列は、任意の標的配列をターゲティングするように選択することができる。一部の実施形態において、標的配列は、細胞のゲノム内の配列である。例示的な標的配列としては、標的ゲノム中でユニークなものが挙げられる。例えば、化膿性連鎖球菌(S.pyogenes)Cas9について、ゲノム中のユニーク標的配列としては、フォームMMMMMMMMNNNNNNNNNNNNXGGのCas9標的部位を挙げることができ、NNNNNNNNNNNNXGG(Nは、A、G、T、またはCであり;Xは、いずれでもよい)は、ゲノム中の単一発生を有する。ゲノム中のユニーク標的配列としては、フォームMMMMMMMMMNNNNNNNNNNNXGGの化膿性連鎖球菌(S.pyogenes)Cas9標的部位を挙げることができ、NNNNNNNNNNNXGG(Nは、A、G、T、またはCであり;Xは、いずれであってもよい)は、ゲノム中の単一発生を有する。S.サーモフィラス(S.thermophilus)CRISPR1Cas9について、ゲノム中のユニーク標的配列としては、フォームMMMMMMMMNNNNNNNNNNNNXXAGAAWのCas9標的部位を挙げることができ、NNNNNNNNNNNNXXAGAAW(Nは、A、G、T、またはCであり;Xは、いずれであってもよく;Wは、AまたはTである)は、ゲノム中の単一発生を有する。ゲノム中のユニーク標的配列としては、フォームMMMMMMMMMNNNNNNNNNNNXXAGAAWのS.サーモフィラス(S.thermophilus)CRISPR1Cas9標的部位を挙げることができ、NNNNNNNNNNNXXAGAAW(Nは、A、G、T、またはCであり;Xは、いずれであってもよく;Wは、AまたはTである)は、ゲノム中の単一発生を有する。化膿性連鎖球菌(S.pyogenes)Cas9について、ゲノム中のユニーク標的配列としては、フォームMMMMMMMMNNNNNNNNNNNNXGGXGのCas9標的部位を挙げることができ、NNNNNNNNNNNNXGGXG(Nは、A、G、T、またはCであり;Xは、いずれであってもよい)は、ゲノム中の単一発生を有する。ゲノム中のユニーク標的配列としては、フォームMMMMMMMMMNNNNNNNNNNNXGGXGの化膿性連鎖球菌(S.pyogenes)Cas9標的部位を挙げることができ、NNNNNNNNNNNXGGXG(Nは、A、G、T、またはCであり;Xは、いずれであってもよい)は、ゲノム中の単一発生を有する。これらの配列のそれぞれにおいて、「M」は、A、G、T、またはCであり得、配列をユニークと同定するにあたり考慮する必要はない。

一部の実施形態において、ガイド配列は、ガイド配列内の二次構造の程度を低減させるように選択される。二次構造は、任意の好適なポリヌクレオチドフォールディングアルゴリズムにより決定することができる。一部のプログラムは、最小ギブス自由エネルギーの算出をベースとする。1つのこのようなアルゴリズムの例は、mFoldであり、Zuker and Stiegler(Nucleic Acids Res.9(1981),133−148)により記載されている。別の例示的フォールディングアルゴリズムは、セントロイド構造予測アルゴリズムを使用するInstitute for Theoretical Chemistry at the University of Viennaにより開発されたオンラインウェブサーバーRNAfoldである(例えばA.R.Gruber et al.,2008,Cell 106(1):23−24;およびPA Carr and GM Church,2009,Nature Biotechnology 27(12):1151−62参照)。さらなるアルゴリズムは、参照により本明細書に組み込まれる米国特許出願番号TBA(Broad参照番号BI2012/084 44790.11.2022)に見出すことができる。

一般に、tracrメイト配列は、(1)対応するtracr配列を含有する細胞中でtracrメイト配列によりフランキングされているガイド配列の切り出し;および(2)標的配列におけるCRISPR複合体の形成(CRISPR複合体は、tracr配列にハイブリダイズされるtracrメイト配列を含む)の1つ以上を促進するためにtracr配列との十分な相補性を有する任意の配列を含む。一般に、相補性の程度は、2つの配列の短い方の長さに沿うtracrメイト配列およびtracr配列の最適なアラインメントに準拠する。最適なアラインメントは、任意の好適なアラインメントアルゴリズムにより決定することができ、二次構造、例えばtracr配列またはtracrメイト配列内の自己相補性をさらに説明し得る。一部の実施形態において、2つの短い方の長さに沿ったtracr配列とtracrメイト配列との間の相補性の程度は、最適にアラインされた場合、約または約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、またはそれよりも大きい数を超える。tracr配列とtracrメイト配列との間の最適なアラインメントの例示的説明を図12Bおよび13Bに提供する。一部の実施形態において、tracr配列は、約または約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、またはそれよりも大きい数を超えるヌクレオチド長である。一部の実施形態において、tracr配列およびtractメイト配列は、単一転写物内に含有され、その結果、2つの間のハイブリダイゼーションが二次構造、例えば、ヘアピンを有する転写物を産生する。ヘアピン構造において使用される好ましいループ形成配列は、4ヌクレオチド長であり、最も好ましくは、配列GAAAを有する。しかしながら、代替配列であり得るようにより長いまたは短いループ配列を使用することができる。配列は、好ましくは、ヌクレオチドトリプレット(例えば、AAA)、および追加のヌクレオチド(例えば、CまたはG)を含む。ループ形成配列の例としては、CAAAおよびAAAGが挙げられる。本発明の一実施形態において、転写物または転写されるポリヌクレオチド配列は、少なくとも2つ以上のヘアピンを有する。好ましい実施形態において、転写物は、2、3、4または5つのヘアピンを有する。本発明の別のさらなる実施形態において、転写物は、多くとも5つのヘアピンを有する。一部の実施形態において、単一転写物は、転写終結配列をさらに含み;好ましくは、これはポリT配列、例えば、6つのTヌクレオチドである。このようなヘアピン構造の例示的説明を、図13Bの下方位置に提供し、最後の「N」およびループの上流の5’側の配列の部分は、tracrメイト配列に対応し、ループの3’側の配列の部分は、tracr配列に対応する。ガイド配列、tracrメイト配列、およびtracr配列を含む単一ポリヌクレオチドのさらなる非限定的な例は、以下のとおりであり(5’から3’に列記)、「N」は、ガイド配列の塩基を表し、第1の小文字のブロックは、tracrメイト配列を表し、第2の小文字のブロックは、tracr配列を表し、最後のポリT配列は、転写ターミネーターを表す:

一部の実施形態において、配列(1)から(3)は、S.サーモフィラス(S.thermophilus)CRISPR1からのCas9との組合せで使用される。一部の実施形態において、配列(4)から(6)は、化膿性連鎖球菌(S.pyogenes)からのCas9との組合せで使用される。一部の実施形態において、tracr配列は、tracrメイト配列を含む転写物と別個の転写物である(例えば、図13Bの上図に説明されるもの)。

一部の実施形態において、組換えテンプレートも提供される。組換えテンプレートは、本明細書に記載の別のベクターの成分であり、別個のベクター中で含有させ、または別個のポリヌクレオチドとして提供することができる。一部の実施形態において、組換えテンプレートは、例えば、CRISPR複合体の一部としてのCRISPR酵素によりニック形成または開裂される標的配列内またはその付近での相同組換えにおけるテンプレートとして機能するように設計される。テンプレートポリヌクレオチドは、任意の好適な長さ、例えば、約または約10、15、20、25、50、75、100、150、200、500、1000、またはそれよりも大きい数を超えるヌクレオチド長であり得る。一部の実施形態において、テンプレートポリヌクレオチドは、標的配列を含むポリヌクレオチドの一部に相補的である。最適にアラインされた場合、テンプレートポリヌクレオチドは、標的配列の1つ以上のヌクレオチド(例えば、約または約1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、またはそれよりも多い数を超えるヌクレオチド)と重複し得る。一部の実施形態において、テンプレート配列および標的配列を含むポリヌクレオチドが最適にアラインされた場合、テンプレートポリヌクレオチドの最近傍ヌクレオチドは、標的配列から約1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000、またはそれよりも多いヌクレオチド内に存在する。

一部の実施形態において、CRISPR酵素は、1つ以上の異種タンパク質ドメイン(例えば、CRISPR酵素の他の約または約1、2、3、4、5、6、7、8、9、10、またはそれよりも多い数を超えるドメイン)を含む融合タンパク質の一部である。CRISPR酵素融合タンパク質は、任意の追加のタンパク質配列、および場合により任意の2つのドメイン間のリンカー配列を含み得る。CRISPR酵素に融合させることができるタンパク質ドメインの例としては、限定されるものではないが、エピトープタグ、レポーター遺伝子配列、ならびに以下の活性:メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA開裂活性および核酸結合活性の1つ以上を有するタンパク質ドメインが挙げられる。エピトープタグの非限定的な例としては、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV−Gタグ、およびチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例としては、限定されるものではないが、グルタチオン−S−トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)ベータ−ガラクトシダーゼ、ベータ−グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および自己蛍光タンパク質、例として、青色蛍光タンパク質(BFP)が挙げられる。CRISPR酵素は、DNA分子に結合し、または他の細胞分子に結合するタンパク質またはタンパク質の断片、例として、限定されるものではないが、マルトース結合タンパク質(MBP)、S−タグ、Lex A DNA結合ドメイン(DBD)融合物、GAL4DNA結合ドメイン融合物、および単純ヘルペスウイルス(HSV)BP16タンパク質融合物をコードする遺伝子配列に融合させることができる。CRISPR酵素を含む融合タンパク質の一部を形成し得る追加のドメインは、参照により本明細書に組み込まれる米国特許出願公開第20110059502号明細書に記載されている。一部の実施形態において、タグ化CRISPR酵素を使用して標的配列の局在を同定する。

一部の態様において、本発明は、1つ以上のポリヌクレオチド、例えば、または本明細書に記載の1つ以上のベクター、1つ以上のその転写物、および/またはそれから転写された1つまたはタンパク質を宿主細胞に送達することを含む方法を提供する。一部の態様において、本発明は、そのような細胞により産生された細胞、およびそのような細胞を含み、またはそれから産生された生物(例えば、動物、植物、または真菌)をさらに提供する。一部の実施形態において、ガイド配列との組合せの(および場合によりそれと複合体形成している)CRISPR酵素を細胞に送達する。慣用のウイルスおよび非ウイルスベース遺伝子移入法を使用して核酸を哺乳動物細胞または標的組織中に導入することができる。このような方法を使用してCRISPR系の成分をコードする核酸を培養物中の細胞に、または宿主生物中に投与することができる。非ウイルスベクター送達系としては、DNAプラスミド、RNA(例えば、本明細書に記載のベクターの転写物)、ネイキッド核酸、および送達ビヒクル、例えば、リポソームと複合体形成している核酸が挙げられる。ウイルスベクター送達系としては、細胞への送達後にエピソーム性またはインテグレートされるゲノムを有するDNAおよびRNAウイルスが挙げられる。遺伝子療法手順の概要については、Anderson,Science 256:808−813(1992);Nabel &Felgner,TIBTECH 11:211−217(1993);Mitani &Caskey,TIBTECH 11:162−166(1993);Dillon,TIBTECH 11:167−175(1993);Miller,Nature 357:455−460(1992);Van Brunt,Biotechnology 6(10):1149−1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35−36(1995);Kremer &Perricaudet,British Medical Bulletin 51(1):31−44(1995);Haddada et al.,in Current Topics in Microbiology and Immunology Doerfler and Boehm(eds)(1995);およびYu et al.,Gene Therapy 1:13−26(1994)参照。

核酸の非ウイルス送達の方法としては、リポフェクション、ヌクレオフェクション、マイクロインジェクション、遺伝子銃、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸コンジュゲート、ネイキッドDNA、人工ビリオン、および薬剤により向上されるDNAの取り込みが挙げられる。リポフェクションは、例えば、米国特許第5,049,386号明細書、同第4,946,787号明細書;および同第4,897,355号明細書)に記載されており、リポフェクション試薬は、市販されている(例えば、Transfectam(商標)およびLipofectin(商標))。ポリヌクレオチドの効率的な受容体認識リポフェクションに好適なカチオンおよび中性脂質としては、Felgner、国際公開第91/17424号パンフレット;国際公開第91/16024号パンフレットのものが挙げられる。送達は、細胞(例えば、インビトロまたはエクスビボ投与)または標的組織(例えば、インビボ投与)に対するものであり得る。

脂質:核酸複合体、例として、ターゲティングされるリポソーム、例えば、免疫脂質複合体の調製は、当業者に周知である(例えば、Crystal,Science 270:404−410(1995);Blaese et al.,Cancer Gene Ther.2:291−297(1995);Behr et al.,Bioconjugate Chem.5:382−389(1994);Remy et al.,Bioconjugate Chem.5:647−654(1994);Gao et al.,Gene Therapy 2:710−722(1995);Ahmad et al.,Cancer Res.52:4817−4820(1992);米国特許第4,186,183号明細書、同第4,217,344号明細書、同第4,235,871号明細書、同第4,261,975号明細書、同第4,485,054号明細書、同第4,501,728号明細書、同第4,774,085号明細書、同第4,837,028号明細書、および同第4,946,787号明細書参照)。

核酸の送達のためのRNAまたはDNAウイルスベース系の使用は、ウイルスを体内の規定の細胞にターゲティングし、ウイルスペイロードを核に輸送する高度に進化したプロセスを利用する。ウイルスベクターは、患者に直接投与することができ(インビボ)、またはそれらを使用してインビトロで細胞を治療することができ、場合により、改変された細胞を患者に投与することができる(エクスビボ)。慣用のウイルスベース系としては、遺伝子移入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴および単純ヘルペスウイルスベクターを挙げることができる。宿主ゲノム中のインテグレーションは、レトロウイルス、レンチウイルス、およびアデノ随伴ウイルス遺伝子移入法について考えられ、挿入されたトランス遺伝子の長期発現をもたらすことが多い。さらに、高い形質導入効率が多くの異なる細胞タイプおよび標的組織において観察されている。

レトロウイルスの向性は、外来エンベロープタンパク質を取り込むことにより変え、標的細胞の潜在的な標的集団を拡大することができる。レンチウイルスベクターは、非分裂細胞に形質導入または感染し、典型的には、高ウイルス力価を産生し得るレトロウイルスベクターである。したがって、レトロウイルス遺伝子移入系の選択は、標的組織に依存する。レトロウイルスベクターは、6〜10kbまでの外来配列のためのパッケージング能を有するシス作用長鎖末端リピートを含む。最小シス作用LTRは、ベクターの複製およびパッケージングに十分であり、次いでそれを使用して治療遺伝子を標的細胞中にインテグレートして恒久的なトランス遺伝子発現を提供する。広く使用されるレトロウイルスベクターとしては、ネズミ白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)をベースとするもの、またはそれらの組合せが挙げられる(例えば、Buchscher et al.,J.Virol.66:2731−2739(1992);Johann et al.,J.Virol.66:1635−1640(1992);Sommnerfelt et al.,Virol.176:58−59(1990);Wilson et al.,J.Virol.63:2374−2378(1989);Miller et al.,J.Virol.65:2220−2224(1991);PCT/US94/05700号明細書参照)。

一過的発現が好ましい用途においては、アデノウイルスベース系を使用することができる。アデノウイルスベースベクターは、多くの細胞タイプにおいて極めて高い形質導入効率を示し得、細胞分裂を要求しない。このようなベクターについて、高い力価および発現のレベルが得られている。このベクターは、比較的単純な系で大量に産生することができる。例えば、核酸およびペプチドのインビトロ産生において、ならびにインビボおよびエクスビボ遺伝子療法手順のためにアデノ随伴ウイルス(「AAV」)ベクターを使用して細胞に標的核酸を形質導入することもできる(例えば、West et al.,Virology 160:38−47(1987);米国特許第4,797,368号明細書;国際公開第93/24641号パンフレット;Kotin,Human Gene Therapy 5:793−801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)参照。組換えAAVベクターの構築は、多数の刊行物、例として、米国特許第5,173,414号明細書;Tratschin et al.,Mol.Cell.Biol.5:3251−3260(1985);Tratschin,et al.,Mol.Cell.Biol.4:2072−2081(1984);Hermonat&Muzyczka,PNAS 81:6466−6470(1984);およびSamulski et al.,J.Virol.63:03822−3828(1989)に記載されている。

典型的には、パッケージング細胞を使用して宿主細胞に感染し得るウイルス粒子を形成する。このような細胞としては、アデノウイルスをパッケージングする293細胞、およびレトロウイルスをパッケージングするψ2細胞またはPA317細胞が挙げられる。遺伝子療法において使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子中にパッケージングする細胞系を産生することにより生成する。ベクターは、典型的には、パッケージングおよび後続の宿主中へのインテグレーションに要求される最小ウイルス配列を含有し、他のウイルス配列は、発現させるべきポリヌクレオチドのための発現カセットにより置き換えられている。欠損ウイルス機能は、典型的には、パッケージング細胞系によりトランスで供給する。例えば、遺伝子療法において使用されるAAVベクターは、典型的には、宿主ゲノム中へのパッケージングおよびインテグレーションに要求されるAAVゲノムからのITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子、すなわち、repおよびcapをコードするが、ITR配列を欠くヘルパープラスミドを含有する細胞系中にパッケージングされる。細胞系は、ヘルパーとしてのアデノウイルスにより感染させることもできる。ヘルパーウイルスは、AAVベクターの複製およびヘルパープラスミドからのAAV遺伝子の発現を促進する。ヘルパープラスミドは、ITR配列の欠如に起因して顕著な量でパッケージングされない。アデノウイルスによる汚染は、例えば、アデノウイルスがAAVよりも感受性である熱処理により低減させることができる。核酸を細胞に送達する追加の方法は、当業者に公知である。例えば、参照により本明細書に組み込まれる米国特許出願公開第20030087817号明細書参照。

一部の実施形態において、宿主細胞を、本明細書に記載の1つ以上のベクターにより一過的にまたは非一過的に形質移入する。一部の実施形態において、細胞を、それが対象中で天然に生じるままで形質移入する。一部の実施形態において、形質移入される細胞を対象から採取する。一部の実施形態において、細胞は、対象から採取された細胞、例えば、細胞系に由来する。組織培養のための広範な細胞系は、当技術分野において公知である。細胞系の例としては、限定されるものではないが、C8161、CCRF−CEM、MOLT、mIMCD−3、NHDF、HeLa−S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC−3、TF1、CTLL−2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH−77、Calu1、SW480、SW620、SKOV3、SK−UT、CaCo2、P388D1、SEM−K2、WEHI−231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl−1、BC−3、IC21、DLD2、Raw264.7、NRK、NRK−52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS−1、COS−6、COS−M6A、BS−C−1サル腎臓上皮、BALB/3T3マウス胚線維芽細胞、3T3Swiss、3T3−L1、132−d5ヒト胎児線維芽細胞;10.1マウス線維芽細胞、293−T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A−549、ALC、B16、B35、BCP−1細胞、BEAS−2B、bEnd.3、BHK−21、BR293、BxPC3、C3H−10T1/2、C6/36、Cal−27、CHO、CHO−7、CHO−IR、CHO−K1、CHO−K2、CHO−T、CHO Dhfr−/−、COR−L23、COR−L23/CPR、COR−L23/5010、COR−L23/R23、COS−7、COV−434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK−293、HeLa、Hepa1c1c7、HL−60、HMEC、HT−29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma−Mel1−48、MC−38、MCF−7、MCF−10A、MDA−MB−231、MDA−MB−468、MDA−MB−435、MDCK II、MDCK II、MOR/0.2R、MONO−MAC6、MTD−1A、MyEnd、NCI−H69/CPR、NCI−H69/LX10、NCI−H69/LX20、NCI−H69/LX4、NIH−3T3、NALM−1、NW−145、OPCN/OPCT細胞系、Peer、PNT−1A/PNT2、RenCa、RIN−5F、RMA/RMAS、Saos−2細胞、Sf−9、SkBr3、T2、T−47D、T84、THP1細胞系、U373、U87、U937、VCaP、Vero細胞、WM39、WT−49、X63、YAC−1、YAR、およびそれらのトランスジェニック変種が挙げられる。細胞系は、当業者に公知の種々の資源から入手可能である(例えば、American Type Culture Collection(ATCC)(Manassus,Va.)参照)。一部の実施形態において、本明細書に記載の1つ以上のベクターにより形質移入された細胞を使用して1つ以上のベクター由来配列を含む新たな細胞系を樹立する。一部の実施形態において、本明細書に記載のCRISPR系の成分により一過的に形質移入され(例えば、1つ以上のベクターの一過的形質移入、またはRNAによる形質移入により)、CRISPR複合体の活性を通して改変された細胞を使用して改変を含有するがあらゆる他の外因性配列を欠く細胞を含む新たな細胞系を樹立する。一部の実施形態において、本明細書に記載の1つ以上のベクターにより一過的にまたは非一過的に形質移入された細胞、またはそのような細胞に由来する細胞系を、1つ以上の試験化合物の評価において使用する。

一部の実施形態において、本明細書に記載の1つ以上のベクターを使用して非ヒトトランスジェニック動物またはトランスジェニック植物を産生する。一部の実施形態において、トランスジェニック動物は、哺乳動物、例えば、マウス、ラット、またはウサギである。ある実施形態において、生物または対象は、植物である。ある実施形態において、生物または対象または植物は、藻類である。トランスジェニック植物および動物を産生する方法は、当技術分野において公知であり、一般に、例えば、本明細書に記載の細胞形質移入の方法から出発する。トランスジェニック植物、特に作物および藻類と同様にトランスジェニック動物も提供される。トランスジェニック動物または植物は、疾患モデルの提供を除く用途において有用であり得る。これらとしては、例えば、野生型において通常見られるよりも高いタンパク質、炭水化物、栄養素またはビタミンレベルの発現を通しての食物または飼料生産を挙げることができる。これに関して、トランスジェニック植物、特に豆類および塊茎、ならびに動物、特に哺乳動物、例えば家畜(ウシ、ヒツジ、ヤギおよびブタ)、さらには家禽および食用昆虫が好ましい。

トランスジェニック藻類または他の植物、例えば、セイヨウアブラナは、例えば、植物油またはバイオ燃料、例えば、アルコール(特にメタノールおよびエタノール)の生産において特に有用であり得る。これらは、油またはバイオ燃料産業において使用される高レベルの油またはアルコールを発現または過剰発現するようにエンジニアリングすることができる。

一態様において、本発明は、真核細胞中の標的ポリヌクレオチドを改変する方法を提供する。一部の実施形態において、方法は、CRISPR複合体を標的ポリヌクレオチドに結合させて前記標的ポリヌクレオチドの開裂を生じさせ、それにより、標的ポリヌクレオチドを改変することを含み、CRISPR複合体は、前記標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列と複合体形成しているCRISPR酵素を含み、前記ガイド配列は、次いでtracr配列にハイブリダイズするtracrメイト配列に結合している。

一態様において、本発明は、真核細胞中のポリヌクレオチドの発現を改変する方法を提供する。一部の実施形態において、方法は、CRISPR複合体をポリヌクレオチドに結合させ、その結果、前記結合が前記ポリヌクレオチドの発現の増加または減少をもたらすことを含み;CRISPR複合体は、前記標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列と複合体形成しているCRISPR酵素を含み、前記ガイド配列は、次いでtracr配列にハイブリダイズするtracrメイト配列に結合している。

作物ゲノミクスの近年の進歩とともに、CRISPR−Cas系を使用して効率的でコスト効率の良い遺伝子編集および操作を実施する技能により、産生の改善および形質の向上のためにそのようなゲノムを形質転換するための単一および多重化遺伝子操作の迅速な選択および比較が可能となる。これに関して、米国特許および刊行物:米国特許第6,603,061号明細書−Agrobacterium−Mediated Plant Transformation Method;米国特許第7,868,149号明細書−Plant Genome Sequences and Uses Thereofおよび米国特許出願公開第2009/0100536号明細書−Transgenic Plants with Enhanced Agronomic Traitsが参照され、これらのそれぞれの全ての内容および開示は、参照により全体として本明細書に組み込まれる。本発明の実施において、Morrell et al“Crop genomics:advances and applications”Nat Rev Genet.2011 Dec 29;13(2):85−96の内容および開示も参照により全体として本明細書に組み込まれる。本発明の有利な実施形態において、CRISPR/Cas9系を使用して微細藻類をエンジニアリングする(実施例14)。したがって、本明細書における動物細胞への言及は、必要な変更を加え、特に明らかでない限り植物細胞にも当てはまり得る。

一態様において、本発明は、インビボ、エクスビボまたはインビトロであり得る真核細胞中の標的ポリヌクレオチドを改変する方法を提供する。一部の実施形態において、方法は、ヒトまたは非ヒト動物または植物(微細藻類を含む)から細胞または細胞の集団をサンプリングし、1つまたは複数の細胞を改変することを含む。培養は、任意の段階においてエクスビボで行うことができる。1つまたは複数の細胞は、非ヒト動物または植物(微細藻類を含む)中に再導入することもできる。

一態様において、本発明は、上記方法および組成物に開示のエレメントのいずれか1つ以上を含有するキットを提供する。一部の実施形態において、キットは、ベクター系およびキットの使用指示書を含む。一部の実施形態において、ベクター系は、(a)tracrメイト配列およびガイド配列をtracrメイト配列の上流に挿入するための1つ以上の挿入部位に作動可能に結合している第1の調節エレメント(ガイド配列は、発現された場合、真核細胞中の標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、および(2)tracr配列にハイブリダイズされるtracrメイト配列と複合体形成しているCRISPR酵素を含む);ならびに/または(b)核局在化配列を含む前記CRISPR酵素をコードする酵素コード配列に作動可能に結合している第2の調節エレメントを含む。エレメントは、個々にまたは組合せで提供することができ、任意の好適な容器、例えば、バイアル、ボトル、またはチューブ中で提供することができる。一部の実施形態において、キットは、1つ以上の言語の、例えば、2つ以上の言語の指示書を含む。

一部の実施形態において、キットは、本明細書に記載のエレメントの1つ以上を利用するプロセスにおいて使用される1つ以上の試薬を含む。試薬は、任意の好適な容器中で提供することができる。例えば、キットは、1つ以上の反応または貯蔵緩衝液を提供し得る。試薬は、特定のアッセイにおいて使用可能な形態で、または使用前に1つ以上の他の成分の添加を要求する形態(例えば、濃縮物または凍結乾燥形態)で提供することができる。緩衝液は、任意の緩衝液、例として、限定されるものではないが、炭酸ナトリウム緩衝液、重炭酸ナトリウム緩衝液、ホウ酸緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液、およびそれらの組合せであり得る。一部の実施形態において、緩衝液はアルカリ性である。一部の実施形態において、緩衝液は、約7から約10のpHを有する。一部の実施形態において、キットは、ガイド配列および調節エレメントを作動可能に結合させるためのベクター中への挿入のためのガイド配列に対応する1つ以上のオリゴヌクレオチドを含む。一部の実施形態において、キットは、相同組換えテンプレートポリヌクレオチドを含む。

一態様において、本発明は、CRISPR系の1つ以上のエレメントを使用する方法を提供する。本発明のCRISPR複合体は、標的ポリヌクレオチドを改変する有効な手段を提供する。本発明のCRISPR複合体は、広範な有用性、例として、非常に多数の細胞タイプ中の標的ポリヌクレオチドの改変(例えば、欠失、挿入、転座、不活性化、活性化)を有する。したがって、本発明のCRISPR複合体は、例えば、遺伝子療法、薬物スクリーニング、疾患診断、および予後における幅広い用途範囲を有する。例示的CRISPR複合体は、標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列と複合体形成しているCRISPR酵素を含む。ガイド配列は、次いでtract配列にハイブリダイズするtracrメイト配列に結合している。

CRISPR複合体の標的ポリヌクレオチドは、真核細胞に対して内因性または外因性である任意のポリヌクレオチドであり得る。例えば、標的ポリヌクレオチドは、真核細胞の核中に残留するポリヌクレオチドであり得る。標的ポリヌクレオチドは、遺伝子産物(例えば、タンパク質)をコードする配列または非コード配列(例えば、調節ポリヌクレオチドまたはジャンクDNA)であり得る。理論により拘束されるものではないが、標的配列がPAM(プロトスペーサー隣接モチーフ);すなわち、CRISPR複合体により認識される短い配列と会合するはずであることが考えられる。PAMについての正確な配列および長さの条件は、使用されるCRISPR酵素に応じて異なるが、PAMは、典型的には、プロトスペーサー(すなわち、標的配列)に隣接する2〜5塩基対配列である。PAM配列の例を以下の実施例セクションに挙げ、当業者は、所与のCRISPR酵素について使用されるさらなるPAM配列を同定することができる。

CRISPR複合体の標的ポリヌクレオチドとしては、それぞれBroad参照番号BI−2011/008/WSGR整理番号44063−701.101およびBI−2011/008/WSGR整理番号44063−701.102を有する米国仮特許出願第61/736,527号明細書および同第61/748,427号明細書(両方とも、標題SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION、それぞれ2012年12月12日および2013年1月2日に出願、これらの全ての内容は参照により全体として本明細書に組み込まれる)に列記の多数の疾患関連遺伝子およびポリヌクレオチドならびにシグナリング生化学経路関連遺伝子およびポリヌクレオチドを挙げることができる。

標的ポリヌクレオチドの例としては、シグナリング生化学経路に関連する配列、例えば、シグナリング生化学経路関連遺伝子またはポリヌクレオチドが挙げられる。標的ポリヌクレオチドの例としては、疾患関連遺伝子またはポリヌクレオチドが挙げられる。「疾患関連」遺伝子またはポリヌクレオチドは、非疾患対照の組織または細胞と比較して患部組織に由来する細胞中で異常なレベルにおいてまたは異常な形態で転写または翻訳産物を生じさせている任意の遺伝子またはポリヌクレオチドを指す。これは、異常に高いレベルにおいて発現されるようになる遺伝子であり得;これは、異常に低いレベルにおいて発現されるようになる遺伝子であり得、発現の変化は、疾患の発生および/または進行と相関する。疾患関連遺伝子は、疾患の病因を直接担い、または疾患の病因を担う遺伝子と連鎖不平衡をなす突然変異または遺伝子変異を有する遺伝子も指す。転写または翻訳される産物は、既知または未知のものであり得、正常または異常レベルにおけるものであり得る。

疾患関連遺伝子およびポリヌクレオチドの例は、McKusick−Nathans Institute of Genetic Medicine,Johns Hopkins University(Baltimore,Md.)およびNational Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.)から入手可能であり、ワールドワイドウェブから入手可能である。

疾患関連遺伝子およびポリヌクレオチドの例を表AおよびBに列記する。疾患特異的情報は、McKusick−Nathans Institute of Genetic Medicine,Johns Hopkins University(Baltimore,Md.)およびNational Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.)から入手可能であり、ワールドワイドウェブから入手可能である。シグナリング生化学経路関連遺伝子およびポリヌクレオチドの例を表Cに列記する。

これらの遺伝子および経路中の突然変異は、不適切なタンパク質の産生または機能に影響する不適切な量のタンパク質をもたらし得る。遺伝子、疾患およびタンパク質のさらなる例は、米国仮特許出願第61/736,527号明細書および同第61/748,427号明細書から参照により本明細書に組み込まれる。このような遺伝子、タンパク質および経路は、CRISPR複合体の標的ポリヌクレオチドであり得る。

本発明の実施形態は、遺伝子のノックアウト、遺伝子の増幅ならびにDNAリピート不安定性および神経学的疾患に関連する特定の突然変異の修復に関連する方法および組成物にも関する(Robert D.Wells,Tetsuo Ashizawa,Genetic Instabilities and Neurological Diseases,Second Edition,Academic Press,Oct 13,2011−Medical)。規定の態様のタンデムリピート配列が20を超えるヒト疾患を担うことが見出されている(New insights into repeat instability:role of RNA・DNA hybrids.McIvor EI,Polak U,Napierala M.RNA Biol.2010 Sep−Oct;7(5):551−8)。CRISPR−Cas系を利用してゲノム不安定性のこれらの異常を補正することができる。

本発明のさらなる態様は、ラフォラ病に関連することが同定されているEMP2AおよびEMP2B遺伝子の異常の補正のためのCRISPR−Cas系の利用に関する。ラフォラ病は、青年期において癲癇性発作として始まり得る進行性ミオクローヌス癲癇を特徴とする常染色体劣性病態である。この疾患の数例は、未だ同定されていない遺伝子の突然変異により引き起こされ得る。この疾患は、発作、筋痙攣、歩行困難、認知症、および最終的に死亡を引き起こす。現在、疾患進行に対して有効であることが証明されている治療は存在しない。癲癇に関連する他の遺伝子異常を、CRISPR−Cas系によりターゲティングすることもでき、基礎となる遺伝学は、Genetics of Epilepsy and Genetic Epilepsies,Giuliano Avanzini,Jeffrey L.Noebelsにより編集,Mariani Foundation Paediatric Neurology:20;2009)にさらに記載されている。

本発明のさらに別の態様において、CRISPR−Cas系を使用し、Genetic Diseases of the Eye,Second Edition,Elias I.Traboulsiにより編集,Oxford University Press,2012にさらに記載されているいくつかの遺伝子突然変異から生じる眼の異常を補正することができる。

本発明のいくつかのさらなる態様は、米国国立衛生研究所のウェブサイト上にトピックサブセクションGenetic Disordersのもとでさらに記載されている広範な遺伝子疾患に関連する異常の補正に関する。遺伝子脳疾患としては、限定されるものではないが、副腎白質ジストロフィー、脳梁欠損症、アイカルディ症候群、アルパース病、アルツハイマー病、バース症候群、バッテン病、CADASIL、小脳変性症、ファブリー病、ゲルストマン−ストロイスラー−シャインカー病、ハンチントン病および他のトリプレットリピート病、リー病、レッシュ−ナイハン症候群、メンケス病、ミトコンドリアミオパチーならびにNINDSコルポセファリーが挙げられる。これらの疾患は、米国国立衛生研究所のウェブサイト上にサブセクションGenetic Brain Disordersのもとでさらに記載されている。

一部の実施形態において、病態は、新形成である。病態が新形成であり得る一部の実施形態において、ターゲティングすべき遺伝子は、表Aに列記のもののいずれかであり得る(この場合、PTENなど)。一部の実施形態において、病態は、加齢黄斑変性症であり得る。一部の実施形態において、病態は、統合失調症であり得る。一部の実施形態において、病態は、トリヌクレオチドリピート障害であり得る。一部の実施形態において、病態は、脆弱性X症候群であり得る。一部の実施形態において、病態は、セクレターゼ関連障害であり得る。一部の実施形態において、病態は、プリオン関連障害であり得る。一部の実施形態において、病態は、ALSであり得る。一部の実施形態において、病態は、薬物嗜好であり得る。一部の実施形態において、病態は、自閉症であり得る。一部の実施形態において、病態は、アルツハイマー病であり得る。一部の実施形態において、病態は、炎症であり得る。一部の実施形態において、病態は、パーキンソン病であり得る。

パーキンソン病に関連するタンパク質の例としては、限定されるものではないが、α−シヌクレイン、DJ−1、LRRK2、PINK1、パーキン、UCHL1、シンフィリン−1、およびNURR1が挙げられる。

嗜好関連タンパク質の例としては、例えば、ABATを挙げることができる。

炎症関連タンパク質の例としては、例えば、Ccr2遺伝子によりコードされる単球走化性タンパク質−1(MCP1)、Ccr5遺伝子によりコードされるC−Cケモカイン受容体5型(CCR5)、Fcgr2b遺伝子によりコードされるIgG受容体IIB(FCGR2b、CD32とも称される)、またはFcer1g遺伝子によりコードされるFcイプシロンR1g(FCER1g)タンパク質を挙げることができる。

心血管疾患関連タンパク質の例としては、例えば、IL1B(インターロイキン1、ベータ)、XDH(キサンチンデヒドロゲナーゼ)、TP53(腫瘍タンパク質p53)、PTGIS(プロスタグランジンI2(プロスタサイクリン)シンターゼ)、MB(ミオグロビン)、IL4(インターロイキン4)、ANGPT1(アンジオポエチン1)、ABCG8(ATP結合カセット、サブファミリーG(WHITE)、メンバー8)、またはCTSK(カテプシンK)を挙げることができる。

アルツハイマー病関連タンパク質の例としては、例えば、VLDLR遺伝子によりコードされる超低密度リポタンパク質受容体タンパク質(VLDLR)、UBA1遺伝子によりコードされるユビキチン様修飾因子活性化酵素1(UBA1)、またはUBA3遺伝子によりコードされるNEDD8活性化酵素E1触媒サブユニットタンパク質(UBE1C)を挙げることができる。

自閉症スペクトラム障害に関連するタンパク質の例としては、例えば、BZRAP1遺伝子によりコードされるベンゾジアゼピン受容体(末梢性)関連タンパク質1(BZRAP1)、AFF2遺伝子(MFR2とも称される)によりコードされるAF4/FMR2ファミリーメンバー2タンパク質(AFF2)、FXR1遺伝子によりコードされる脆弱性X精神遅滞常染色体ホモログ1タンパク質(FXR1)、またはFXR2遺伝子によりコードされる脆弱性X精神遅滞常染色体ホモログ2タンパク質(FXR2)を挙げることができる。

黄斑変性症に関連するタンパク質の例としては、例えば、ABCR遺伝子によりコードされるATP結合カセットサブファミリーA(ABC1)メンバー4タンパク質(ABCA4)、APOE遺伝子によりコードされるアポリポタンパク質Eタンパク質(APOE)、またはCCL2遺伝子によりコードされるケモカイン(C−Cモチーフ)リガンド2タンパク質(CCL2)を挙げることができる。

統合失調症に関連するタンパク質の例としては、NRG1、ErbB4、CPLX1、TPH1、TPH2、NRXN1、GSK3A、BDNF、DISC1、GSK3B、およびそれらの組合せを挙げることができる。

腫瘍抑制に関与するタンパク質の例としては、例えば、ATM(毛細血管拡張性運動失調症変異)、ATR(毛細血管拡張性運動失調症およびRad3関連)、EGFR(上皮成長因子受容体)、ERBB2(v−erb−b2赤芽球性白血病ウイルス癌遺伝子ホモログ2)、ERBB3(v−erb−b2赤芽球性白血病ウイルス癌遺伝子ホモログ3)、ERBB4(v−erb−b2赤芽球性白血病ウイルス癌遺伝子ホモログ4)、Notch1、Notch2、Notch3、またはNotch4を挙げることができる。

セクレターゼ障害に関連するタンパク質の例としては、例えば、PSENEN(プレセニリンエンハンサー2ホモログ(線虫(C.elegans)))、CTSB(カテプシンB)、PSEN1(プレセニリン1)、APP(アミロイドベータ(A4)前駆体タンパク質)、APH1B(咽頭前部欠損1ホモログB(線虫(C.elegans)))、PSEN2(プレセニリン2(アルツハイマー病4))、またはBACE1(ベータ部位APP開裂酵素1)を挙げることができる。

筋萎縮性側索硬化症に関連するタンパク質の例としては、SOD1(スーパーオキシドジスムターゼ1)、ALS2(筋萎縮性側索硬化症2)、FUS(fused in sarcoma)、TARDBP(TAR DNA結合タンパク質)、VAGFA(血管内皮成長因子A)、VAGFB(血管内皮成長因子B)、およびVAGFC(血管内皮成長因子C)、およびそれらの任意の組合せを挙げることができる。

プリオン疾患に関連するタンパク質の例としては、SOD1(スーパーオキシドジスムターゼ1)、ALS2(筋萎縮性側索硬化症2)、FUS(fused in sarcoma)、TARDBP(TAR DNA結合タンパク質)、VAGFA(血管内皮成長因子A)、VAGFB(血管内皮成長因子B)、およびVAGFC(血管内皮成長因子C)、およびそれらの任意の組合せを挙げることができる。

プリオン障害における神経変性病態に関連するタンパク質の例としては、例えば、A2M(アルファ−2−マクログロブリン)、AATF(アポトーシス拮抗転写因子)、ACPP(前立腺酸性ホスファターゼ)、ACTA2(大動脈平滑筋アクチンアルファ2)、ADAM22(ADAMメタロペプチダーゼドメイン)、ADORA3(アデノシンA3受容体)、またはADRA1D(アルファ−1Dアドレナリン受容体についてのアルファ−1Dアドレナリン作動性受容体)を挙げることができる。

免疫不全症に関連するタンパク質の例としては、例えば、A2M[アルファ−2−マクログロブリン];AANAT[アリールアルキルアミンN−アセチルトランスフェラーゼ];ABCA1[ATP結合カセットサブファミリーA(ABC1)、メンバー1];ABCA2[ATP結合カセットサブファミリーA(ABC1)、メンバー2];またはABCA3[ATP結合カセットサブファミリーA(ABC1)、メンバー3]を挙げることができる。

トリヌクレオチドリピート障害に関連するタンパク質の例としては、例えば、AR(アンドロゲン受容体)、FMR1(脆弱性X精神遅滞1)、HTT(ハンチントン)、またはDMPK(筋緊張性異栄養症タンパク質キナーゼ)、FXN(フラタキシン)、ATXN2(アタキシン2)が挙げられる。

神経伝達障害に関連するタンパク質の例としては、例えば、SST(ソマトスタチン)、NOS1(一酸化窒素シンターゼ1(神経型))、ADRA2A(アドレナリン作動性アルファ−2A受容体)、ADRA2C(アドレナリン作動性アルファ−2C受容体)、TACR1(タキキニン受容体1)、またはHTR2c(5−ヒドロキシトリプタミン(セロトニン)受容体2C)が挙げられる。

神経発達関連配列の例としては、例えば、A2BP1[アタキシン2結合タンパク質1]、AADAT[アミノアジピン酸アミノトランスフェラーゼ]、AANAT[アリールアルキルアミンN−アセチルトランスフェラーゼ]、ABAT[4−アミノ酪酸アミノトランスフェラーゼ]、ABCA1[ATP結合カセットサブファミリーA(ABC1)メンバー1]、またはABCA13[ATP結合カセットサブファミリーA(ABC1)メンバー13]が挙げられる。

本発明の系により治療可能な好ましい病態のさらなる例は、以下のものから選択することができる:アルカルディ−グティエール症候群;アレキサンダー病;アラン−ハーンドン−ダッドリー症候群;POLG関連障害;アルファ−マンノシドーシス(IIおよびIII型);アルストレム症候群;アンジェルマン症候群;毛細血管拡張性運動失調症;神経セロイドリポフスチン症;ベータ−セラサミア;両側性視神経委縮症および(幼児型)視神経委縮症1型;網膜芽腫(両側性);カナバン病;脳・眼・顔・骨格症候群1[COFS1];脳黄色腫症;コルネリア・デ・ラング症候群;MAPT関連障害;遺伝性プリオン病;ドラベ症候群;早期発症型家族性アルツハイマー病;フリードライヒ運動失調症[FRDA];フリンス症候群;フコシドーシス;福山型先天性筋ジストロフィー;ガラクトシアリドーシス;ゴーシェ病;有機酸血症;血球貪食性リンパ組織球症;ハッチンソン−ギルフォード早老症候群;ムコリピドーシスII型;幼児遊離シアル酸蓄積症;PLA2G6関連神経変性症;ジャーベル・ランゲ−ニールセン症候群;接合型表皮水疱症;ハンチントン病;クラッベ病(幼児型);ミトコンドリアDNA関連リー症候群およびNARP;レッシュ−ナイハン症候群;LIS1関連滑脳症;ロウ症候群;メープルシロップ尿症;MECP2重複症候群;ATP7A関連銅輸送障害;LAMA2関連筋ジストロフィー;アリールスルファターゼA欠損症;ムコ多糖症I、IIまたはIII型;ペルオキシソーム形成異常症、ツェルウェーガー症候群スペクトラム;脳の鉄蓄積症を伴う神経変性症;酸性スフィンゴミエリナーゼ欠損症;ニーマン−ピック病C型;グリシン脳症;ARX関連障害;尿素サイクル異常症;COL1A1/2関連骨形成不全症;ミトコンドリアDNA欠失症候群;PLP1関連障害;ペリー症候群;フェラン−マクダーモット症候群;グリコーゲン蓄積症II型(ポンペ病)(幼児型);MAPT関連障害;MECP2関連障害;肢根型点状軟骨異形成症1型;ロバーツ症候群;サンドホフ病;シンドラー病1型;アデノシンデアミナーゼ欠損症;スミス−レムリ−オピッツ症候群;脊髄性筋萎縮症;幼児期発症型脊髄小脳失調症;ヘキソサミニダーゼA欠損症;致死性異形成1型;コラーゲンVI型関連障害;アッシャー症候群I型;先天性筋ジストロフィー;ウォルフ−ヒルシュホーン症候群;リソソーム酸リパーゼ欠損症;ならびに色素性乾皮症。

タンパク質治療剤の慢性投与は、特異的タンパク質に対する許容され得ない免疫応答を誘発し得る。タンパク質薬物の免疫原性は、数個の免疫優勢ヘルパーTリンパ球(HTL)エピトープに起因し得る。これらのタンパク質内に含有されるこれらのHTLエピトープのMHC結合親和性の低減は、より低い免疫原性を有する薬物を生成し得る(Tangri S,et al.(“Rationally engineered therapeutic proteins with reduced immunogenicity”J Immunol.2005 Mar 15;174(6):3187−96)。本発明において、CRISPR酵素の免疫原性は、特に、エリスロポエチンに関してTangri et alに最初に記載され、続いて開発されたアプローチに従って低減させることができる。したがって、指向進化または合理的設計を使用して宿主種(ヒトまたは他の種)中のCRISPR酵素(例えば、Cas9)の免疫原性を低減させることができる。

植物において、病原体は宿主特異的であることが多い。例えば、トマト萎凋病菌(Fusarium oxysporum f.sp.lycopersici)は、トマト萎凋病を引き起こすが、トマトのみを攻撃し、カーネーション萎凋病菌(F.oxysporum f.dianthii)コムギ黒さび病菌(Puccinia graminis f.sp.tritici)はコムギのみを攻撃する。植物は、ほとんどの病原体に抵抗するための既存および誘導的防御を有する。植物世代にわたる突然変異および組換えイベントは、特に病原体が植物よりも高頻度で繁殖する場合に感受性を生じさせる遺伝子変異をもたらす。植物において、非宿主耐性が存在し得、例えば、宿主および病原体は不適合性である。水平耐性、例えば、典型的には、多くの遺伝子により制御される病原体の全ての種に対する部分耐性および垂直耐性、例えば、典型的には、少数の遺伝子により制御される病原体の一部の種に対するが他の種に対するものでない完全耐性も存在し得る。遺伝子対遺伝子レベルにおいて、植物および病原体は、一緒に進化し、あるものの遺伝子変化は他の変化と均衡を保つ。したがって、自然変動を使用して、育種者は、収穫高、品質、均一性、耐寒性、耐性に最も有用な遺伝子を組み合わせる。耐性遺伝子の資源としては、天然または外来種、在来種、野生植物類縁種、および誘導突然変異、例えば、植物材料を突然変異誘発剤により処理することが挙げられる。本発明を使用して、植物育種者に、突然変異を誘導するための新たなツールを提供する。したがって、当業者は、耐性遺伝子の資源のゲノムを分析し、所望の特徴または形質を有する品種において本発明を用いて耐性遺伝子の出現を従来の突然変異誘発剤よりも正確に誘導し、したがって、植物育種プログラムを加速および改善することができる。

明らかなとおり、本発明の系を使用して任意の目的ポリヌクレオチド配列をターゲティングすることができることが想定される。本発明の系を使用して有用に治療することができる病態または疾患の一部の例を上記表に含め、それらの病態に現在関連する遺伝子の例もその表に提供する。しかしながら、例示される遺伝子は排他的なものではない。

以下の実施例を、本発明の種々の実施形態を説明する目的のために挙げ、それらは本発明をいかなる様式にも限定することを意味しない。本実施例は、本明細書に記載の方法とともに、目下好ましい実施形態の代表例であり、例示であり、本発明の範囲に対する限定を意図するものではない。特許請求の範囲の範囲により定義される本発明の趣旨に包含されるその変更および他の使用は、当業者が行う。

実施例1:真核細胞の核中のCRISPR複合体活性 例示的なII型CRISPR系は、4つの遺伝子Cas9、Cas1、Cas2、およびCsn1のクラスター、ならびに2つの非コードRNAエレメント、tracrRNAおよび非反復配列の短いストレッチ(スペーサー、それぞれ約30bp)により間隔が空いている反復配列の特徴的アレイ(ダイレクトリピート)を含有する化膿性連鎖球菌(Streptococcus pyogenes)SF370からのII型CRISPR遺伝子座である。この系において、ターゲティングされるDNA二本鎖切断(DSB)を4つの連続ステップにおいて生成する(図2A)。第1に、2つの非コードRNA、プレcrRNAアレイおよびtracrRNAがCRISPR遺伝子座から転写される。第2に、tracrRNAがプレcrRNAのダイレクトリピートにハイブリダイズし、次いでそれが個々のスペーサー配列を含有する成熟crRNAにプロセシングされる。第3に、成熟crRNA:tracrRNA複合体がCas9を、crRNAのスペーサー領域とプロトスペーサーDNAとの間のヘテロ二本鎖形成を介してプロトスペーサーおよび対応するPAMからなるDNA標的に指向する。最後に、Cas9は、PAMの上流の標的DNAの開裂を媒介してプロトスペーサー内でDSBを創成する(図2A)。この例は、このRNAプログラマブルヌクレアーゼ系を適応させて真核細胞の核中のCRISPR複合体活性を指向する例示プロセスを記載する。

哺乳動物細胞中のCRISPR成分の発現を改善するため、化膿性連鎖球菌(Streptococcus pyogenes(S.pyogenes))SF370遺伝子座1からの2つの遺伝子Cas9(SpCas9)およびRNアーゼIII(SpRNアーゼIII)をコドン最適化した。核局在化を促進するため、核局在化シグナル(NLS)をSpCas9およびSpRNアーゼIIIの両方のアミノ(N)またはカルボキシル(C)末端に含めた(図2B)。タンパク質発現の可視化を促進するため、蛍光タンパク質マーカーも両方のタンパク質のNまたはC末端に含めた(図2B)。NおよびC末端の両方に付着しているNLSを有するSpCas9のバージョン(2×NLS−SpCas9)も生成した。NLS融合SpCas9およびSpRNアーゼIIIを含有する構築物を293FTヒト胚腎臓(HEK)細胞中に形質移入し、SpCas9およびSpRNアーゼIIIに対するNLSの相対的位置決めが、それらの核局在化効率に影響することが見出された。C末端NLSは標的SpRNアーゼIIIを核にターゲティングするために十分であった一方、SpCas9のNまたはC末端のいずれかへのこれらの特定のNLSの単一コピーの付着は、この系中の適切な核局在化を達成し得なかった。この例において、C末端NLSは、ヌクレオプラスミンのもの(KRPAATKKAGQAKKKK)であり、C末端NLSは、SV40ラージT抗原のもの(PKKKRKV)であった。試験されたSpCas9のバージョンのうち、2×NLS−SpCas9のみが核局在化を示した(図2B)。

化膿性連鎖球菌(S.pyogenes)SF370のCRISPR遺伝子座からのtracrRNAは、2つの転写開始部位を有し、89ヌクレオチド(nt)および171ntの2つの転写物を生じさせ、それは続いて同一の75nt成熟tracrRNAにプロセシングされる。より短い89ntのtracrRNAを哺乳動物細胞中の発現のために選択した(図6に説明される発現構築物、図6Bに示されるSurveryorアッセイの結果により決定された機能性を有する)。転写開始部位を+1として標識し、転写ターミネーターおよびノザンブロットによりプロ—ビングされる配列も示す。プロセシングされたtracrRNAの発現もノザンブロットにより確認した。図7Cは、長鎖または短鎖tracrRNA、ならびにSpCas9およびDR−EMX1(1)−DRを担持するU6発現構築物により形質移入された293FT細胞から抽出されたトータルRNAのノザンブロット分析の結果を示す。左および右側のパネルは、それぞれSpRNアーゼIIIを用いず、または用いて形質移入された293FT細胞からのものである。U6は、ヒトU6snRNAをターゲティングするプローブによりブロットされたローディング対照を示す。短鎖tracrRNA発現構築物の形質移入は、十分なレベルのプロセシング形態のtracrRNA(約75bp)をもたらした。極めて少量の長鎖tracrRNAがノザンブロット上で検出される。

正確な転写開始を促進するため、RNAポリメラーゼIIIベースU6プロモーターを選択してtracrRNAの発現をドライブした(図2C)。同様に、U6プロモーターベース構築物を開発して2つのダイレクトリピート(DR、用語「tracrメイト配列」にも包含される;図2C)によりフランキングされている単一スペーサーからなるプレcrRNAアレイを発現させた。最初のスペーサーは、大脳皮質の発達におけるキー遺伝子であるヒトEMX1遺伝子座中の33塩基対(bp)標的部位(30bpのプロトスペーサーと、Cas9のNGG認識モチーフを満たす3bpのCRISPRモチーフ(PAM)配列)をターゲティングするように設計した(図2C)。

哺乳動物細胞中のCRISPR系(SpCas9、SpRNアーゼIII、tracrRNA、およびプレcrRNA)の異種発現がターゲティングされる哺乳動物染色体の開裂を達成し得るか否かを試験するため、HEK293FT細胞をCRISPR成分の組合せにより形質移入した。哺乳動物核中のDSBは部分的には、インデルの形成をもたらす非相同末端結合(NHEJ)経路により修復されるため、Surveyorアッセイを使用して標的EMX1遺伝子座における潜在的な開裂活性を検出した(例えば、Guschin et al.,2010,Methods Mol Biol 649:247参照)。4つ全てのCRISPR成分の同時形質移入は、プロトスペーサーの最大5.0%の開裂を誘導し得た(図2D参照)。SpRNアーゼIIIを除く全てのCRISPR成分の同時形質移入も、プロトスペーサーの最大4.7%のインデルを誘導し、このことはcrRNA成熟を支援し得る内因性哺乳動物RNアーゼ、例えば、関連DicerおよびDrosha酵素などが存在し得ることを示唆した。残り3つの成分のいずれかを除去すると、CRISPR系のゲノム開裂活性は停止する(図2D)。標的遺伝子座を含有するアンプリコンのサンガーシーケンシングにより開裂活性を確認し;43個のシーケンシングされたクローンのうち5つの突然変異アレル(11.6%)が見出された。種々のガイド配列を使用する同様の実験は、29%と高いインデル割合を生じさせた(図4〜8、10、および11参照)。これらの結果は、哺乳動物細胞中の効率的なCRISPR媒介ゲノム改変のための3成分系を定義する。

開裂効率を最適化するため、本出願人らは、tracrRNAの異なるアイソフォームが開裂効率に影響するか否かも試験し、この例示的系において、短鎖(89bp)転写物形態のみがヒトEMX1ゲノム遺伝子座の開裂を媒介し得ることを見出した。図9は、哺乳動物細胞中のcrRNAプロセシングの追加のノザンブロット分析を提供する。図9Aは、2つのダイレクトリピートによりフランキングされている単一スペーサー(DR−EMX1(1)−DR)についての発現ベクターを示す模式図を説明する。ヒトEMX1遺伝子座プロトスペーサー1をターゲティングする30bpのスペーサーおよびダイレクトリピート配列を、図9Aの下方の配列中に示す。線は、逆相補配列を使用してEMX1(1)crRNA検出のためのノザンブロットプローブを生成する領域を示す。図9Bは、DR−EMX1(1)−DRを担持するU6発現構築物により形質移入された293FT細胞から抽出されたトータルRNAのノザンブロット分析を示す。左および右側のパネルは、それぞれSpRNアーゼIIIを用いず、または用いて形質移入された293FT細胞からのものである。DR−EMX1(1)−DRは、SpCas9が存在する場合のみ成熟crRNAにプロセシングされ、短鎖tracrRNAはSpRNアーゼIIIの存在に依存的でなかった。形質移入293FTトータルRNAから検出された成熟crRNAは、約33bpであり、化膿性連鎖球菌(S.pyogenes)からの39〜42bpの成熟crRNAよりも短かった。これらの結果は、CRISPR系を真核細胞中に移植し、リプログラミングして内因性哺乳動物標的ポリヌクレオチドの開裂を促進することができることを実証する。

図2は、本実施例に記載の細菌CRISPR系を説明する。図2Aは、化膿性連鎖球菌(Streptococcus pyogenes)SF370からのCRISPR遺伝子座1およびこの系によるCRISPR媒介DNA開裂の提案される機序を示す模式図を説明する。ダイレクトリピート−スペーサーアレイからプロセシングされた成熟crRNAは、Cas9を、相補的プロトスペーサーおよびプロトスペーサー隣接モチーフ(PAM)からなるゲノム標的に指向する。標的−スペーサー塩基対形成時、Cas9は標的DNA中の二本鎖切断を媒介する。図2Bは、化膿性連鎖球菌(S.pyogenes)Cas9(SpCas9)およびRNアーゼIII(SpRNアーゼIII)の、哺乳動物核中への輸送を可能とするための核局在化シグナル(NLS)によるエンジニアリングを説明する。図2Cは、構成的EF1aプロモーターによりドライブされるSpCas9およびSpRNアーゼIIIならびに正確な転写開始および終結を促進するためのRNAPol3プロモーターU6によりドライブされるtracrRNAおよびプレcrRNAアレイ(DR−スペーサー−DR)の哺乳動物発現を説明する。十分なPAM配列を有するヒトEMX1遺伝子座からのプロトスペーサーを、プレcrRNAアレイ中のスペーサーとして使用する。図2Dは、SpCas9媒介少数挿入および欠失についてのsurveyorヌクレアーゼアッセイを説明する。SpCas9を、SpRNアーゼIII、tracrRNA、およびEMX1標的スペーサーを担持するプレcrRNAアレイを用いてまたは用いずに発現させた。図2Eは、標的遺伝子座とEMX1ターゲティングcrRNAとの間の塩基対形成の模式的表示、ならびにSpCas9開裂部位に隣接する微小欠失を示す例示的クロマトグラムを説明する。図2Fは、種々の微小挿入および欠失を示す43個のクローンアンプリコンのシーケンシング分析から同定された突然変異アレルを説明する。点線は、欠失塩基を示し、アラインされず、またはミスマッチの塩基は挿入または突然変異を示す。スケールバー=10μm。

3成分系をさらに簡略化するため、ステム−ループを介して成熟crRNA(ガイド配列を含む)を部分tracrRNAに融合させて天然crRNA:tracrRNA二本鎖を模倣するキメラcrRNA−tracrRNAハイブリッド設計を適応させた(図3A)。

ガイド配列は、アニールされたオリゴヌクレオチドを使用してBbsI部位間に挿入することができる。センスおよびアンチセンス鎖上のプロトスペーサーを、それぞれDNA配列の上方および下方に示す。ヒトPVALBおよびマウスTh遺伝子座についてそれぞれ6.3%および0.75%の改変比率が達成され、このことは複数の生物にわたる異なる遺伝子座の改変におけるCRISPR系の幅広い適用可能性を実証した。開裂はキメラ構築物を使用してそれぞれの遺伝子座について3つのスペーサーのうち1つについてのみ検出された一方、同時発現されるプレcrRNA配置を使用した場合、全ての標的配列が27%に達するインデル生成の効率で開裂された(図4および5)。

図5は、SpCas9をリプログラミングして哺乳動物細胞中の複数のゲノム遺伝子座をターゲティングすることができることのさらなる説明を提供する。図5Aは、下線付き配列により示される5つのプロトスペーサーの局在を示すヒトEMX1遺伝子座の模式図を提供する。図5Bは、プレcrRNAおよびtracrRNAのダイレクトリピート領域間のハイブリダイゼーションを示すプレcrRNA/trcrRNA複合体の模式図(上図)および20bpのガイド配列、ならびにヘアピン構造にハイブリダイズしている部分ダイレクトリピートおよびtracrRNA配列からなるtracrメイトおよびtracr配列を含むキメラRNA設計の模式図(下図)を提供する。ヒトEMX1遺伝子座中の5つのプロトスペーサーにおけるCas9媒介開裂の効力を比較するSurveyorアッセイの結果を、図5Cに説明する。プロセシングされたプレcrRNA/tracrRNA複合体(crRNA)またはキメラRNA(chiRNA)のいずれかを使用してそれぞれのプロトスペーサーをターゲティングする。

RNAの二次構造は分子間相互作用に重要であり得るため、最小自由エネルギーおよびボルツマン加重構造アンサンブルに基づく構造予測アルゴリズムを使用して本出願人らのゲノムターゲティング実験に使用される全てのガイド配列の推定二次構造を比較した(図3B)(例えば、Gruber et al.,2008,Nucleic Acids Research,36:W70参照)。分析により、ほとんどの場合、キメラcrRNAコンテクスト中の有効なガイド配列は二次構造モチーフを実質的に含まない一方、無効なガイド配列は標的プロトスペーサーDNAとの塩基対形成を妨害し得る内部二次構造を形成する可能性がより高いことが明らかになった。したがって、スペーサー二次構造の変動性は、キメラcrRNAを使用する場合にCRISPR媒介干渉の効率に影響し得ることが考えられる。

図3は、例示的発現ベクターを説明する。図3Aは、合成crRNA−tracrRNAキメラ(キメラRNA)およびSpCas9の発現をドライブするためのバイシストロニックベクターの模式図を提供する。キメラガイドRNAは、ゲノム標的部位中のプロトスペーサーに対応する20bpのガイド配列を含有する。図3Bは、ヒトEMX1、PVALB、およびマウスTh遺伝子座をターゲティングするガイド配列、ならびにそれらの予測二次構造を示す模式図を提供する。それぞれの標的部位における改変効率をRNA二次構造図の下方に示す(EMX1、n=216アンプリコンシーケンシングリード;PVALB、n=224リード;Th、n=265リード)。フォールディングアルゴリズムは、図3Bにグレースケールで再現されるレインボースケールにより示されるとおり、それぞれの塩基が予測二次構造を仮定するその確率に従って着色されたアウトプットを生じさせた。SpCas9のためのさらなるベクター設計が図3Aに示され、ガイドオリゴのための挿入部位に結合しているU6プロモーター、およびSpCas9コード配列に結合しているCbhプロモーターを取り込む単一発現ベクターが含まれる。

CRISPRが天然に作動する原核細胞中で二次構造を含有するスペーサーが機能し得るか否かを試験するため、プロトスペーサー担持プラスミドの形質転換干渉を、化膿性連鎖球菌(S.pyogenes)SF370CRISPR遺伝子座1を異種発現する大腸菌(E.coli)株中で試験した(図3C)。CRISPR遺伝子座を低コピー大腸菌(E.coli)発現ベクター中にクローニングし、crRNAアレイをDRのペアによりフランキングされている単一スペーサーにより置き換えた(pCRISPR)。異なるpCRISPRプラスミドを保有する大腸菌(E.coli)株を、対応するプロトスペーサーおよびPAM配列を含有するチャレンジプラスミドにより形質転換した(図3C)。細菌アッセイにおいて、全てのスペーサーが効率的なCRISPR干渉を促進した(図3C)。これらの結果は、哺乳動物細胞中のCRISPR活性の効率に影響する追加の因子が存在し得ることを示唆する。

CRISPR媒介開裂の特異性を調査するため、哺乳動物ゲノム中のプロトスペーサー開裂に対するガイド配列中の単一ヌクレオチド突然変異の効果を、単一点突然変異を有する一連のEMX1ターゲティングキメラcrRNAを使用して分析した(図4A)。図4Bは、異なる突然変異体キメラRNAと対形成した場合のCas9の開裂効率を比較するSurveyorヌクレアーゼアッセイの結果を説明する。PAMの5’側の最大12bpの単一塩基ミスマッチは、SpCas9によるゲノム開裂を実質的に停止させた一方、さらなる上流位置に突然変異を有するスペーサーは元のプロトスペーサー標的に対する活性を保持した(図4B)。PAMの他、SpCas9は、スペーサーの最後の12bp内の単一塩基特異性を有する。さらに、CRISPRは、同一EMX1プロトスペーサーをターゲティングするTALEヌクレアーゼ(TALEN)のペアと同程度に効率的にゲノム開裂を媒介し得る。図4Cは、EMX1をターゲティングするTALENの設計を示す模式図を提供し、図4Dは、TALENおよびCas9の効率を比較するSurveyorゲルを示す(n=3)。

エラープローンNHEJ機序を通した哺乳動物細胞中のCRISPR媒介遺伝子編集を達成するための成分のセットを樹立したため、相同組換え(HR)、ゲノム中の正確な編集を作製するための高フィデリティ遺伝子修復経路を刺激するCRISPRの能力を試験した。野生型SpCas9は、NHEJおよびHRの両方を通して修復され得る部位特異的DSBを媒介し得る。さらに、SpCas9のRuvC I触媒ドメイン中のアスパラギン酸からアラニンへの置換(D10A)をエンジニアリングしてヌクレアーゼをニッカーゼに変換し(SpCas9n;図5Aに説明)(例えば、Sapranausaks et al.,2011,Cucleic Acids Research,39:9275;Gasiunas et al.,2012,Proc.Natl.Acad.Sci.USA,109:E2579参照)、その結果、ニック形成されたゲノムDNAが高フィデリティ相同性組換え修復(HDR)を受ける。Surveyorアッセイにより、SpCas9nはEMX1プロトスペーサー標的におけるインデルを生成しないことを確認した。図5Bに説明されるとおり、EMX1ターゲティングキメラcrRNAとSpCas9との同時発現は標的部位中のインデルを生じさせた一方、SpCas9nとの同時発現は生じさせなかった(n=3)。さらに、327個のアンプリコンのシーケンシングは、SpCas9nにより誘導されるいかなるインデルも検出しなかった。同一の遺伝子座を選択し、HEK293FT細胞をEMX1をターゲティングするキメラRNA、hSpCas9またはhSpCas9n、およびプロトスペーサー付近に制限部位のペア(HindIIIおよびNheI)を導入するためのHRテンプレートにより同時形質移入することによりCRISPR媒介HRを試験した。図5Cは、HR方針の模式的説明を、組換え場所の相対局在およびプライマーアニーリング配列(矢印)とともに提供する。SpCas9およびSpCas9nは、実際、EMX1遺伝子中へのHRテンプレートのインテグレーションを触媒した。標的領域のPCR増幅とそれに続くHindIIIによる制限消化により、予測断片サイズ(図5Dに示される制限断片長多型ゲル分析中の矢印)に対応する開裂産物が明らかになり、SpCas9およびSpCas9nは類似レベルのHR効率を媒介した。本出願人らは、ゲノムアンプリコンのサンガーシーケンシングを使用してHRをさらに確認した(図5E)。これらの結果は、哺乳動物ゲノム中のターゲティングされる遺伝子挿入を促進するためのCRISPRの有用性を実証する。野生型SpCas9の14bp(スペーサーからの12bpおよびPAMからの2bp)の標的特異性を考慮すると、ニッカーゼの利用可能性は、一本鎖分解物がエラープローンNHEJ経路のための基質でないため、オフターゲット改変の可能性を顕著に低減させ得る。

アレイスペーサーを有するCRISPR遺伝子座の天然アーキテクチャーを模倣する発現構築物(図2A)を構築して多重化配列ターゲティングの可能性を試験した。EMX1およびPVALBターゲティングスペーサーのペアをコードする単一のCRISPRアレイを使用して、両方の遺伝子座における効率的な開裂が検出された(図4F、crRNAアレイの模式的設計および開裂の効率的な媒介を示すSurveyorブロットの両方を示す)。119bpにより間隔が空いているEMX1内の2つの標的に対するスペーサーを使用する同時DSBを通したより大きいゲノム領域のターゲティングされる欠失も試験し、1.6%の欠失効力(182個のアンプリコンのうち3つ;図5G)が検出された。このことは、CRISPR系が単一ゲノム内の多重化編集を媒介し得ることを実証する。

実施例2:CRISPR系改変および代替例 配列特異的DNA開裂をプログラミングするためにRNAを使用する技能は、種々の研究および産業用途のための新たなクラスのゲノムエンジニアリングツールを定義する。CRISPR系のいくつかの態様は、CRISPRターゲティングの効率および多用途性を増加させるようにさらに改善することができる。最適なCas9活性は、哺乳動物核中に存在するものよりも高いレベルにおけるフリーMg2+の利用可能性に依存し得(例えば、Jinek et al.,2012,Science,337:816参照)、プロトスペーサーのすぐ下流のNGGモチーフについての優先性は、ヒトゲノム中で平均12bpごとでターゲティング能を制限する。これらの拘束の一部は、微生物メタゲノムにわたるCRISPR遺伝子座の多様性を利用することにより克服することができる(例えば、Makarova et al.,2011,Nat Rev Microbiol,9:467参照)。他のCRISPR遺伝子座を、実施例1に記載のものと同様の方法により哺乳動物細胞環境中に移植することができる。それぞれの標的部位における改変効率をRNA二次構造の下方に示す。この構造を生成するアルゴリズムは、それぞれの塩基を予測二次構造を仮定するその確率に従って着色する。RNAガイドスペーサー1および2は、それぞれ14%および6.4%を誘導した。これらの2つのプロトスペーサー部位における生物学的複製物にわたる開裂活性の統計的分析も図7に提供する。

実施例3:試料標的配列選択アルゴリズム 規定のCRISPR酵素についての所望のガイド配列長およびCRISPRモチーフ配列(PAM)に基づきインプットDNA配列の両方の鎖上の候補CRISPR標的配列を同定するためのソフトウェアプログラムを設計する。例えば、化膿性連鎖球菌(S.pyogenes)からのCas9についての標的部位は、PAM配列NGGを用いて、インプット配列およびインプットの逆相補鎖の両方の上の5’−Nx−NGG−3’を探索することにより同定することができる。同様に、S.サーモフィラス(S.thermophilus)CRISPR1のCas9についての標的部位は、PAM配列NNAGAAWを用いて、インプット配列およびインプットの逆相補鎖の両方の上の5’−Nx−NNAGAAW−3’を探索することにより同定することができる。同様に、S.サーモフィラス(S.thermophilus)CRISPR3のCas9についての標的部位は、PAM配列NGGNGを用いて、インプット配列およびインプットの逆相補鎖の両方の上の5’−Nx−NGGNG−3’を探索することにより同定することができる。Nx中の値「x」は、プログラムにより固定し、または使用者により規定することができ、例えば、20である。

DNA標的部位のゲノム中の複数の発生は、非特異的ゲノム編集をもたらし得るため、全ての潜在的な部位を同定した後、プログラムは配列が関連参照ゲノム中で出現する回数に基づき配列をフィルタリング除去する。配列特異性が「シード」配列、例えば、PAM配列自体を含め、PAM配列から5’側の11〜12bpにより決定されるそれらのCRISPR酵素について、フィルタリングステップはシード配列に基づき得る。したがって、追加のゲノム遺伝子座における編集を回避するため、結果を関連ゲノム中のシード:PAM配列の発生数に基づきフィルタリングする。使用者に、シード配列の長さを選択させることができる。使用者に、フィルタ通過の目的のためにゲノム中のシード:PAM配列の発生数を規定させることもできる。デフォルトは、ユニーク配列をスクリーニングすることである。フィルトレーションレベルは、シード配列の長さおよびゲノム中の配列の発生数の両方を変えることにより変更する。プログラムは、さらにまたは代替的に、同定された標的配列の逆相補鎖を提供することにより、報告された標的配列に相補的なガイド配列の配列を提供し得る。

配列選択を最適化する方法およびアルゴリズムのさらなる詳細は、参照により本明細書に組み込まれる米国特許出願番号TBA(Broad参照番号BI−2012/084 44790.11.2022)に見出すことができる。

実施例4:複数のキメラcrRNA−tracrRNAハイブリッドの評価 本実施例は、異なる長さの野生型tracrRNA配列を取り込むtracr配列を有するキメラRNA(chiRNA;ガイド配列、tracrメイト配列、およびtracr配列を単一転写物中で含む)について得られた結果を記載する。図18aは、キメラRNAおよびCas9のためのバイシストロニック発現ベクターの模式図を説明する。Cas9はCBhプロモーターによりドライブされ、キメラRNAはU6プロモーターによりドライブされる。キメラガイドRNAは、からなる。示される種々の位置においてトランケートされたtracr配列(下方の鎖の最初の「U」から転写物の末端に及ぶ)に結合している20bpのガイド配列(N)からなる。ガイドおよびtracr配列は、tracrメイト配列GUUUUAGAGCUAと、それに続くループ配列GAAAにより離隔している。ヒト遺伝子座EMX1およびPVALB遺伝子座におけるCas9媒介インデルについてのSURVEYORアッセイの結果を、それぞれ図18bおよび18cに説明する。矢印は、予測SURVEYOR断片を示す。chiRNAをそれらの「+n」表記により示し、crRNAは、ガイドおよびtracr配列が別個の転写物として発現されるハイブリッドRNAを指す。トリプリケートで実施されたこれらの結果の定量を、図11aおよび11bにヒストグラムにより示し、それぞれ図10bおよび10cに対応する(「N.D.」は、インデルが検出されなかったことを示す)。プロトスペーサーIDおよびそれらの対応するゲノム標的、プロトスペーサー配列、PAM配列、および鎖局在を表Dに提供する。ガイド配列は、ハイブリッド系における別個の転写物の場合、プロトスペーサー配列全体に相補的であるように、またはキメラRNAの場合、下線部にのみ相補的であるように設計した。

細胞培養および形質移入 ヒト胚腎臓(HEK)細胞系293FT(Life Technologies)を、10%のウシ胎仔血清(HyClone)、2mMのGlutaMAX(Life Technologies)、100U/mLのペニシリン、および100μg/mLのストレプトマイシンが補給されたダルベッコ改変イーグル培地(DMEM)中で37℃において5%のCO2インキュベーションで維持した。293FT細胞を24ウェルプレート(Corning)上に、形質移入24時間前に1ウェル当たり150,000個の細胞の密度において播種した。Lipofectamine2000(Life Technologies)を製造業者の推奨プロトコルに従って使用して細胞を形質移入した。24ウェルプレートのそれぞれのウェルについて、合計500ngのプラスミドを使用した。

ゲノム改変についてのSURVEYORアッセイ 293FT細胞を上記プラスミドDNAにより形質移入した。細胞を37℃において形質移入後72時間インキュベートしてからゲノムDNAを抽出した。ゲノムDNAは、QuickExtract DNA Extraction Solution(Epicentre)を製造業者のプロトコルに従って使用して抽出した。手短に述べると、ペレット化細胞をQuickExtract溶液中で再懸濁させ、65℃において15分間および98℃において10分間インキュベートした。それぞれの遺伝子についてのCRISPR標的部位をフランキングするゲノム領域を、PCR増幅し(表Eに列記のプライマー)、QiaQuick Spin Column(Qiagen)を製造業者のプロトコルに従って使用して産物を精製した。合計400ngの精製PCR産物を2μlの10×Taq DNA Polymerase PCR緩衝液(Enzymatics)と混合し、超純水で20μlの最終容量とし、リアニーリングプロセスに供してヘテロ二本鎖形成を可能とした:95℃において10分間、−2℃/秒における傾斜で95℃から85℃、−0.25℃/秒における85℃から25℃、および25℃において1分間維持。リアニーリング後、産物をSURVEYORヌクレアーゼおよびSURVEYORエンハンサーS(Transgenomics)により製造業者の推奨プロトコルに従って処理し、4〜20%のNovex TBEポリアクリルアミドゲル(Life Technologies)上で分析した。ゲルをSYBR Gold DNA染色(Life Technologies)により30分間染色し、Gel Docゲルイメージングシステム(Bio−rad)によりイメージングした。定量は、相対バンド強度に基づくものであった。

ユニークCRISPR標的部位のコンピュータによる同定 ヒト、マウス、ラット、ゼブラフィッシュ、ミバエ、および線虫(C.elegans)ゲノム中の化膿性連鎖球菌(S.pyogenes)SF370Cas9(SpCas9)酵素についてのユニーク標的部位を同定するため、本出願人らは、DNA配列の両方の鎖をスキャンし、考えられる全てのSpCas9標的部位を同定するためのソフトウェアパッケージを開発した。この実施例について、それぞれのSpCas9標的部位を20bp配列と、それに続くNGGプロトスペーサー隣接モチーフ(PAM)配列として操作上定義し、本出願人らは、全ての染色体上のこの5’−N20−NGG−3’定義を満たす全ての配列を同定した。非特異的ゲノム編集を防止するため、全ての潜在的な部位を同定した後、全ての標的部位をそれらが関連参照ゲノム中で出現する回数に基づきフィルタリングした。例えば、PAM配列から5’側の約11〜12bp配列であり得る「シード」配列により付与されるCas9活性の配列特異性を利用するため、5’−NNNNNNNNNN−NGG−3’配列を関連ゲノム中でユニークであると選択した。全てのゲノム配列をUCSCゲノムブラウザからダウンロードした(ヒトゲノムhg19、マウスゲノムmm9、ラットゲノムrn5、ゼブラフィッシュゲノムdanRer7、キイロショウジョウバエ(D.melanogaster)ゲノムdm4および線虫(C.elegans)ゲノムce10)。全探索結果は、UCSCゲノムブラウザ情報を使用して閲覧利用可能である。ヒトゲノム中の一部の標的部位の例示的可視化を図22に提供する。

最初に、ヒトHEK293FT細胞中のEMX1遺伝子座内の3つの部位をターゲティングした。それぞれのchiRNAのゲノム改変効率は、DNA二本鎖切断(DSB)および非相同末端結合(NHEJ)DNA損傷修復経路によるその後続の修復から生じる突然変異を検出するSURVEYORヌクレアーゼアッセイを使用して評価した。chiRNA(+n)と表記される構築物は、野生型tracrRNAの最大+n個のヌクレオチドがキメラRNA構築物中に含まれることを示し、nについては48、54、67、および85の値が使用される。野生型tracrRNAのより長い断片を含有するキメラRNA(chiRNA(+67)およびchiRNA(+85))は、3つ全てのEMX1標的部位におけるDNA開裂を媒介し、特にchiRNA(+85)は、ガイドおよびtracr配列を別個の転写物中で発現する対応するcrRNA/tracrRNAハイブリッドよりも顕著に高いレベルのDNA開裂を実証した(図10bおよび10a)。ハイブリッド系(別個の転写物として発現されるガイド配列およびtracr配列)を検出可能な開裂を生じなかったPVALB遺伝子座中の2つの部位も、chiRNAを使用してターゲティングした。chiRNA(+67)およびchiRNA(+85)は、2つのPVALBプロトスペーサーにおける顕著な開裂を媒介し得た(図10cおよび10b)。

EMX1およびPVALB遺伝子座中の5つ全ての標的について、tracr配列長さの増加に伴うゲノム改変効率の一貫した増加が観察された。いかなる理論によっても拘束されるものではないが、tracrRNAの3’末端により形成される二次構造は、CRISPR複合体形成の比率の向上における役割を担い得る。本実施例において使用されるキメラRNAのそれぞれについての予測二次構造の説明を、図21に提供する。二次構造は、最小自由エネルギーおよび分配関数アルゴリズムを使用するRNAfold(http://rna.tbi.univie.ac.at/cgi−bin/RNAfold.cgi)を使用して予測した。それぞれの塩基についての疑似カラー(グレースケールで再現)は、対形成の確率を示す。より長いtracr配列を有するchiRNAは、天然CRISPRcrRNA/tracrRNAハイブリッドにより開裂されない標的を開裂し得たため、キメラRNAをCas9上にその天然ハイブリッド相当物よりも効率的にロードすることができることが考えられる。真核細胞および生物中の部位特異的ゲノム編集のためのCas9の適用を促進するため、化膿性連鎖球菌(S.pyogenes)Cas9について予測される全てのユニーク標的部位をヒト、マウス、ラット、ゼブラフィッシュ、線虫(C.elegans)、およびキイロショウジョウバエ(D.melanogaster)ゲノムにおいてコンピュータにより同定した。キメラRNAは、他の微生物からのCas9酵素について設計してCRISPR RNAプログラマブルヌクレアーゼの標的スペースを拡大することができる。

図11および21は、最大+85ヌクレオチドの野生型tracrRNA配列、および核局在化配列を有するSpCas9を含むキメラRNAの発現のための例示的なバイシストロニック発現ベクターを説明する。SpCas9は、CBhプロモーターから発現され、bGHポリAシグナル(bGHpA)により終結される。模式図の直下に説明される拡大配列は、ガイド配列挿入部位を包囲する領域に対応し、5’から3’でU6プロモーターの3’部分(最初の陰影領域)、BbsI開裂部位(矢印)、部分ダイレクトリピート(tracrメイト配列GTTTTAGAGCTA、下線付き)、ループ配列GAAA、および+85tracr配列(ループ配列後の下線付き配列)を含む。例示的なガイド配列インサートを、ガイド配列挿入部位の下方に説明し、選択される標的についてのガイド配列のヌクレオチドを「N」により表す。

上記実施例に記載の配列は、以下のとおりである(ポリヌクレオチド配列は、5’から3’である)。

U6−短鎖tracrRNA(化膿連鎖球菌(Streptococcus pyogenes)SF370):

U6−長鎖tracrRNA(化膿性連鎖球菌(Streptococcus pyogenes)SF370):

U6−DR−BbsI骨格−DR(化膿性連鎖球菌(Streptococcus pyogenes)SF370):

U6−キメラRNA−BbsI骨格(化膿性連鎖球菌(Streptococcus pyogenes)SF370)

NLS−SpCas9−EGFP:

SpCas9−EGFP−NLS:

NLS−SpCas9−EGFP−NLS:

NLS−SpCas9−NLS:

NLS−mCherry−SpRNアーゼ3:

SpRNアーゼ3−mCherry−NLS:

NLS−SpCas9n−NLS(D10Aニッカーゼ突然変異は小文字である):

hEMX1−HRテンプレート−HindII−NheI:

NLS−StCsn1−NLS:

U6−St_tracrRNA(7〜97):

U6−DR−スペーサー−DR(化膿性連鎖球菌(S.pyogenes)SF370)

+48tracrRNAを含有するキメラRNA(化膿性連鎖球菌(S.pyogenes)SF370)

+54tracrRNAを含有するキメラRNA(化膿性連鎖球菌(S.pyogenes)SF370)

+67tracrRNAを含有するキメラRNA(化膿性連鎖球菌(S.pyogenes)SF370)

+85tracrRNAを含有するキメラRNA(化膿性連鎖球菌(S.pyogenes)SF370)

CBh−NLS−SpCas9−NLS

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR1Cas9のための例示的キメラRNA(NNAGAAWのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR3Cas9のための例示的キメラRNA(NGGNGのPAMの場合)

S.サーモフィラス(S.thermophilus)LMD−9CRISPR3遺伝子座からのCas9のコドン最適化バージョン(5’および3’末端の両方においてNLSを有する)

実施例5:化膿性連鎖球菌(Streptococcus pyogenes)Cas9(SpCas9と称される)についてのガイドRNAの最適化 本出願人らは、tracrRNAおよびダイレクトリピート配列を突然変異させ、またはキメラガイドRNAを突然変異させて細胞中のRNAを向上させた。

最適化は、pol3プロモーターによる早期転写終結をもたらし得るtracrRNAおよびガイドRNA中にチミンのストレッチ(T)が存在した観察に基づく。したがって、本出願人らは、以下の最適化配列を生成した。最適化tracrRNAおよび対応する最適化ダイレクトリピートをペアで表す。

最適化tracrRNA1(下線は突然変異):

最適化ダイレクトリピート1(下線は突然変異):

最適化tracrRNA2(下線は突然変異):

最適化ダイレクトリピート2(下線は突然変異):

本出願人らは、真核細胞中の最適な活性のためにキメラガイドRNAも最適化した。

元のガイドRNA:

最適化キメラガイドRNA配列1:

最適化キメラガイドRNA配列2:

最適化キメラガイドRNA配列3:

本出願人らは、最適化キメラガイドRNAが図3に示されるとおり、より良好に機能することを示した。本実験は、293FT細胞をCas9およびU6ガイドRNA DNAカセットにより同時形質移入して上記4つのRNA形態の1つを発現させることにより実施した。ガイドRNAの標的は、ヒトEmx1遺伝子座:「GTCACCTCCAATGACTAGGG」中の同一標的部位である。

実施例6:ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)LMD−9 CRISPR1 Cas9(St1Cas9と称される)の最適化 本出願人らは、図12に示されるガイドキメラRNAを設計した。

St1Cas9ガイドRNAは、ポリチミンのストレッチ(T)を分解することによりSpCas9ガイドRNAに関して同一タイプの最適化を受け得る。

実施例7:インビボ用途のためのCas9系の改善 本出願人らは、小分子量を有するCas9についてメタゲノム検索を実施した。ほとんどのCas9ホモログはかなり大きい。例えば、SpCas9は、約1368aa長であり、送達のためのウイルスベクター中に容易にパッケージングされるには大きすぎる。配列の一部は誤ってアノテートされており、したがって、それぞれの長さについての正確な頻度は、必ずしも的確であるとは限らない。それにもかかわらず、これは、Cas9タンパク質の分布における徴候を提供し、より短いCas9ホモログが存在することを示唆する。

計算分析を通して、本出願人らは、細菌株カンピロバクター属(Campylobacter)において、1000未満のアミノ酸を有する2つのCas9タンパク質が存在することを見出した。カンピロバクター・ジェジュニ(Campylobacter jejuni)からの1つのCas9についての配列を以下に提示する。この長さにおいて、CjCas9をAAV、レンチウイルス、アデノウイルス、および初代細胞中へのおよび動物モデルにおけるインビボでの堅牢な送達のための他のウイルスベクター中に容易にパッケージングすることができる。

>カンピロバクター・ジェジュニ(Campylobacter jejuni)Cas9(CjCas9)

このCjCas9のための推定tracrRNAエレメントは、以下である:

ダイレクトリピート配列は、以下である:

tracrRNAおよびダイレクトリピートの同時フォールド構造を図6に提供する。

CjCas9のためのキメラガイドRNAの一例は、以下である:

本出願人らはまた、インビトロ法を使用してCas9ガイドRNAを最適化した。図18は、インビトロでのSt1Cas9キメラガイドRNA最適化からのデータを示す。

本発明の好ましい実施形態を本明細書において示し、記載したが、そのような実施形態が例として提供されるにすぎないことは当業者に明らかである。当業者は目下、多数のバリエーション、変更、および置換を本発明から逸脱せずに行う。本明細書に記載の本発明の実施形態の種々の代替例を本発明の実施において用いることができることを理解されるべきである。以下の特許請求の範囲は、本発明の範囲を定義し、それらの特許請求の範囲の範囲内の方法および構造ならびにそれらの均等物は、特許請求の範囲により包含されるものとする。

実施例8:Sa sgRNA最適化 本出願人らは、最大開裂効率を有する最適なトランケートアーキテクチャーのためのSaCas9のための5つのsgRNAバリアントを設計した。さらに、天然ダイレクトリピート:tracr二本鎖系をsgRNAと並行して試験した。示される長さを有するガイドをSaCas9と同時形質移入し、HEK293FT細胞中で活性について試験した。合計100ngのsgRNA U6−PCRアンプリコン(または50ngのダイレクトリピートおよび50ngのtracrRNA)および400ngのSaCas9プラスミドを200,000個のHepa1−6マウス肝細胞中に同時形質移入し、SURVEYOR分析のために形質移入から72時間後にDNAを回収した。結果を図23に示す。

参考文献: 1.Urnov,F.D.,Rebar,E.J.,Holmes,M.C.,Zhang,H.S.&Gregory,P.D.Genome editing with engineered zinc finger nucleases.Nat.Rev.Genet.11,636−646(2010). 2.Bogdanove,A.J.&Voytas,D.F.TAL effectors:customizable proteins for DNA targeting.Science 333,1843−1846(2011). 3.Stoddard,B.L.Homing endonuclease structure and function.Q.Rev.Biophys.38,49−95(2005). 4.Bae,T.&Schneewind,O.Allelic replacement in Staphylococcus aureus with inducible counter−selection.Plasmid 55,58−63(2006). 5.Sung,C.K.,Li,H.,Claverys,J.P.&Morrison,D.A.An rpsL cassette,janus,for gene replacement through negative selection in Streptococcus pneumoniae.Appl.Environ.Microbiol.67,5190−5196(2001). 6.Sharan,S.K.,Thomason,L.C.,Kuznetsov,S.G.&Court,D.L.Recombineering:a homologous recombination−based method of genetic engineering.Nat.Protoc.4,206−223(2009). 7.Jinek,M.et al.A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity.Science 337,816−821(2012). 8.Deveau,H.,Garneau,J.E.&Moineau,S.CRISPR−Cas system and its role in phage−bacteria interactions.Annu.Rev.Microbiol.64,475−493(2010). 9.Horvath,P.&Barrangou,R.CRISPR−Cas,the immune system of bacteria and archaea.Science 327,167−170(2010). 10.Terns,M.P.&Terns,R.M.CRISPR−based adaptive immune systems.Curr.Opin.Microbiol.14,321−327(2011). 11.van der Oost,J.,Jore,M.M.,Westra,E.R.,Lundgren,M.&Brouns,S.J.CRISPR−based adaptive and heritable immunity in prokaryotes.Trends.Biochem.Sci.34,401−407(2009). 12.Brouns,S.J.et al.Small CRISPR RNAs guide antiviral defense in prokaryotes.Science 321,960−964(2008). 13.Carte,J.,Wang,R.,Li,H.,Terns,R.M.&Terns,M.P.Cas6 is an endoribonuclease that generates guide RNAs for invader defense in prokaryotes.Genes Dev.22,3489−3496(2008). 14.Deltcheva,E.et al.CRISPR RNA maturation by trans−encoded small RNA and host factor RNase III.Nature 471,602−607(2011). 15.Hatoum−Aslan,A.,Maniv,I.&Marraffini,L.A.Mature clustered,regularly interspaced,short palindromic repeats RNA(crRNA)length is measured by a ruler mechanism anchored at the precursor processing site.Proc.Natl.Acad.Sci.U.S.A.108,21218−21222(2011). 16.Haurwitz,R.E.,Jinek,M.,Wiedenheft,B.,Zhou,K.&Doudna,J.A.Sequence− and structure−specific RNA processing by a CRISPR endonuclease.Science 329,1355−1358(2010). 17.Deveau,H.et al.Phage response to CRISPR−encoded resistance in Streptococcus thermophilus.J.Bacteriol.190,1390−1400(2008). 18.Gasiunas,G.,Barrangou,R.,Horvath,P.&Siksnys,V.Cas9−crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria.Proc.Natl.Acad.Sci.U.S.A.(2012). 19.Makarova,K.S.,Aravind,L.,Wolf,Y.I.&Koonin,E.V.Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR−Cas systems.Biol.Direct.6,38(2011). 20.Barrangou,R.RNA−mediated programmable DNA cleavage.Nat.Biotechnol.30,836−838(2012). 21.Brouns,S.J.Molecular biology.A Swiss army knife of immunity.Science 337,808−809(2012). 22.Carroll,D.A CRISPR Approach to Gene Targeting.Mol.Ther.20,1658−1660(2012). 23.Bikard,D.,Hatoum−Aslan,A.,Mucida,D.&Marraffini,L.A.CRISPR interference can prevent natural transformation and virulence acquisition during in vivo bacterial infection.Cell Host Microbe 12,177−186(2012). 24.Sapranauskas,R.et al.The Streptococcus thermophilus CRISPR−Cas system provides immunity in Escherichia coli.Nucleic Acids Res.(2011). 25.Semenova,E.et al.Interference by clustered regularly interspaced short palindromic repeat(CRISPR)RNA is governed by a seed sequence.Proc.Natl.Acad.Sci.U.S.A.(2011). 26.Wiedenheft,B.et al.RNA−guided complex from a bacterial immune system enhances target recognition through seed sequence interactions.Proc.Natl.Acad.Sci.U.S.A.(2011). 27.Zahner,D.&Hakenbeck,R.The Streptococcus pneumoniae beta−galactosidase is a surface protein.J.Bacteriol.182,5919−5921(2000). 28.Marraffini,L.A.,Dedent,A.C.&Schneewind,O.Sortases and the art of anchoring proteins to the envelopes of gram−positive bacteria.Microbiol.Mol.Biol.Rev.70,192−221(2006). 29.Motamedi,M.R.,Szigety,S.K.&Rosenberg,S.M.Double−strand−break repair recombination in Escherichia coli:physical evidence for a DNA replication mechanism in vivo.Genes Dev.13,2889−2903(1999). 30.Hosaka,T.et al.The novel mutation K87E in ribosomal protein S12 enhances protein synthesis activity during the late growth phase in Escherichia coli.Mol.Genet.Genomics 271,317−324(2004). 31.Costantino,N.&Court,D.L.Enhanced levels of lambda Red−mediated recombinants in mismatch repair mutants.Proc.Natl.Acad.Sci.U.S.A.100,15748−15753(2003). 32.Edgar,R.&Qimron,U.The Escherichia coli CRISPR system protects from lambda lysogenization,lysogens,and prophage induction.J.Bacteriol.192,6291−6294(2010). 33.Marraffini,L.A.&Sontheimer,E.J.Self versus non−self discrimination during CRISPR RNA−directed immunity.Nature 463,568−571(2010). 34.Fischer,S.et al.An archaeal immune system can detect multiple Protospacer Adjacent Motifs(PAMs)to target invader DNA.J.Biol.Chem.287,33351−33363(2012). 35.Gudbergsdottir,S.et al.Dynamic properties of the Sulfolobus CRISPR−Cas and CRISPR/Cmr systems when challenged with vector−borne viral and plasmid genes and protospacers.Mol.Microbiol.79,35−49(2011). 36.Wang,H.H.et al.Genome−scale promoter engineering by coselection MAGE.Nat Methods 9,591−593(2012). 37.Cong,L.et al.Multiplex Genome Engineering Using CRISPR−Cas Systems.Science In press(2013). 38.Mali,P.et al.RNA−Guided Human Genome Engineering via Cas9.Science In press(2013). 39.Hoskins,J.et al.Genome of the bacterium Streptococcus pneumoniae strain R6.J.Bacteriol.183,5709−5717(2001). 40.Havarstein,L.S.,Coomaraswamy,G.&Morrison,D.A.An unmodified heptadecapeptide pheromone induces competence for genetic transformation in Streptococcus pneumoniae.Proc.Natl.Acad.Sci.U.S.A.92,11140−11144(1995). 41.Horinouchi,S.&Weisblum,B.Nucleotide sequence and functional map of pC194,a plasmid that specifies inducible chloramphenicol resistance.J.Bacteriol.150,815−825(1982). 42.Horton,R.M.In Vitro Recombination and Mutagenesis of DNA:SOEing Together Tailor−Made Genes.Methods Mol.Biol.15,251−261(1993). 43.Podbielski,A.,Spellerberg,B.,Woischnik,M.,Pohl,B.&Lutticken,R.Novel series of plasmid vectors for gene inactivation and expression analysis in group A streptococci(GAS).Gene 177,137−147(1996). 44.Husmann,L.K.,Scott,J.R.,Lindahl,G.&Stenberg,L.Expression of the Arp protein,a member of the M protein family,is not sufficient to inhibit phagocytosis of Streptococcus pyogenes.Infection and immunity 63,345−348(1995). 45.Gibson,D.G.et al.Enzymatic assembly of DNA molecules up to several hundred kilobases.Nat Methods 6,343−345(2009). 46.Tangri S,et al.(“Rationally engineered therapeutic proteins with reduced immunogenicity”J Immunol.2005 Mar 15;174(6):3187−96.

本発明の好ましい実施形態を本明細書において示し、記載したが、そのような実施形態が例として提供されるにすぎないことは当業者に明らかである。当業者は目下、多数のバリエーション、変更、および置換を本発明から逸脱せずに行う。本明細書に記載の本発明の実施形態の種々の代替例を本発明の実施において用いることができることが理解されるべきである。

QQ群二维码
意见反馈