ヌクレアーゼプロファイリングシステム

申请号 JP2016533458 申请日 2014-08-08 公开(公告)号 JP2016531569A 公开(公告)日 2016-10-13
申请人 プレジデント アンド フェローズ オブ ハーバード カレッジ; プレジデント アンド フェローズ オブ ハーバード カレッジ; 发明人 リウ,デービッド,アール.; パッタナヤク,ヴィクラム;
摘要 本開示のいくつかの側面は、部位特異的エンドヌクレアーゼのヌクレアーゼターゲット部位選好性および特異性を決定するための戦略、方法、および試薬を提供する。本明細書において提供されるいくつかの方法は、切断されたターゲット部位と隣接しかつ同一の無傷のターゲット部位のシーケンシングによって、目的のヌクレアーゼによって切断されたライブラリーメンバーを同定するために、候補ヌクレアーゼターゲット部位と定常挿入領域とのリピート単位を含むコンカテマーのライブラリーをスクリーニングするための新規の「1回の切断」戦略を利用する。本開示のいくつかの側面は、そのターゲット部位選好性および特異性を決定することに基づく部位特異的エンドヌクレアーゼを選択するための戦略、方法、および試薬を提供する。ターゲット部位選好性および特異性を決定するための方法および試薬もまた提供される。
权利要求

ヌクレアーゼのターゲット部位を同定するための方法であって、 (a)二本鎖核酸ターゲット部位を切断するヌクレアーゼを提供し、ターゲット部位の切断が、5’リン酸部分を含む切断された核酸鎖をもたらすこと、 (b)ヌクレアーゼのターゲット部位を含む候補核酸分子をヌクレアーゼが切断するのに好適な条件下で、候補核酸分子のライブラリーと(a)のヌクレアーゼを接触させ、各核酸分子が、候補ヌクレアーゼターゲット部位と定常挿入配列とを含む配列のコンカテマーを含むこと、および (c)ステップ(b)においてヌクレアーゼによって切断された核酸鎖上の未切断のヌクレアーゼターゲット部位の配列を決定することによって、(b)においてヌクレアーゼによって切断されたヌクレアーゼターゲット部位を同定すること、 を含む、前記方法。ヌクレアーゼが平滑末端を生ずる、請求項1に記載の方法。ヌクレアーゼが5’オーバーハングを生ずる、請求項1に記載の方法。ステップ(c)の決定することが、5’リン酸依存的なライゲーションによって、ステップ(b)においてヌクレアーゼによって切断された核酸鎖の5’末端に最初の核酸アダプターをライゲーションすることを含む、請求項1〜3のいずれか一項に記載の方法。核酸アダプターが二本鎖形態で提供される、請求項4に記載の方法。5’リン酸依存的なライゲーションが平滑末端ライゲーションである、請求項5に記載の方法。ヌクレアーゼによって切断された核酸鎖に最初の核酸アダプターをライゲーションする前に5’オーバーハングを埋めることを含む、請求項4〜6のいずれか一項に記載の方法。ステップ(c)の決定することが、アダプターにハイブリダイゼーションするPCRプライマーおよび定常挿入配列にハイブリダイゼーションするPCRプライマーを用いるPCR反応によって、未切断のターゲット部位を含むヌクレアーゼによって切断されたコンカテマーの断片を増幅することをさらに含む、請求項4〜7のいずれか一項に記載の方法。単一の未切断のターゲット配列を含む分子について、増幅された核酸分子を濃縮することをさらに含む、請求項8に記載の方法。濃縮することがサイズ分画を含む、請求項9に記載の方法。ステップ(c)の決定することが、ステップ(b)においてヌクレアーゼによって切断された核酸鎖またはPCRによって得られたそのコピーをシーケンシングすることを含む、請求項1〜10のいずれか一項に記載の方法。候補核酸分子のライブラリーが、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、または少なくとも1012個の異なる候補ヌクレアーゼ切断部位を含む、請求項1〜11のいずれか一項に記載の方法。ヌクレアーゼが、疾患と関連した遺伝子内の特異的なヌクレアーゼターゲット部位を切断する治療用ヌクレアーゼである、請求項1〜12のいずれか一項に記載の方法。治療用ヌクレアーゼが、特異的なヌクレアーゼターゲット部位を切断し、かつ10よりも多くの追加のヌクレアーゼターゲット部位を切断せず、5よりも多くの追加のヌクレアーゼターゲット部位を切断せず、4よりも多くの追加のヌクレアーゼターゲット部位を切断せず、3よりも多くの追加のヌクレアーゼターゲット部位を切断せず、2よりも多くの追加のヌクレアーゼターゲット部位を切断せず、1よりも多くの追加のヌクレアーゼターゲット部位を切断せず、または全く追加のヌクレアーゼターゲット部位を切断しない治療用ヌクレアーゼの最大濃度を決定することをさらに含む、請求項13に記載の方法。最大濃度と等しいかまたは最大濃度よりも低い終濃度を生成させるのに有効な量で対象に治療用ヌクレアーゼを投与することをさらに含む、請求項14に記載の方法。ヌクレアーゼが、RNA分子との複合体を形成するRNAによってプログラム可能なヌクレアーゼであり、ヌクレアーゼ:RNA複合体が、RNA分子の配列に相補的な核酸配列に特異的に結合する、請求項1〜15のいずれか一項に記載の方法。RNA分子がシングルガイドRNA(sgRNA)である、請求項16に記載の方法。sgRNAが、ターゲット配列に相補的である15〜25、19〜21、または20ヌクレオチドを含む、請求項16に記載の方法。ヌクレアーゼがCas9ヌクレアーゼである、請求項1〜18のいずれか一項に記載の方法。ヌクレアーゼターゲット部位が[sgRNA相補配列]−[プロトスペーサー隣接モチーフ(PAM)]構造を含み、ヌクレアーゼがsgRNA相補配列内でターゲット部位を切断する、請求項16〜19のいずれか一項に記載の方法。sgRNA相補配列が、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む、請求項20に記載の方法。ヌクレアーゼが非特異的核酸切断ドメインを含む、請求項1〜15のいずれか一項に記載の方法。ヌクレアーゼがFokI切断ドメインを含む、請求項22に記載の方法。ヌクレアーゼが、切断ドメイン二量体化時にターゲット配列を切断する核酸切断ドメインを含む、請求項22または23に記載の方法。ヌクレアーゼが、核酸配列に特異的に結合する結合ドメインを含む、請求項22〜24のいずれか一項に記載の方法。結合ドメインがジンクフィンガーを含む、請求項25に記載の方法。結合ドメインが、少なくとも2、少なくとも3、少なくとも4、または少なくとも5つのジンクフィンガーを含む、請求項26に記載の方法。ヌクレアーゼがジンクフィンガーヌクレアーゼである、請求項22〜27のいずれか一項に記載の方法。結合ドメインが転写活性化因子様エレメントを含む、請求項22〜25のいずれか一項に記載の方法。ヌクレアーゼが転写活性化因子様エレメントヌクレアーゼ(TALEN)である、請求項29に記載の方法。ヌクレアーゼが有機化合物を含む、請求項1〜15のいずれか一項に記載の方法。ヌクレアーゼがエンジインを含む、請求項31に記載の方法。ヌクレアーゼが抗生物質である、請求項31または32に記載の方法。化合物がダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン、またはその誘導体である、請求項32または33に記載の方法。ヌクレアーゼがホーミングエンドヌクレアーゼである、請求項1〜15のいずれか一項に記載の方法。複数個の核酸分子を含む核酸分子のライブラリーであって、各核酸分子が、候補ヌクレアーゼターゲット部位および10〜100ヌクレオチドの定常挿入配列を含む配列のコンカテマーを含む、前記ライブラリー。定常挿入配列が、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、または少なくとも95ヌクレオチド長である、請求項36に記載のライブラリー。定常挿入配列が、15以下、20以下、25以下、30以下、35以下、40以下、45以下、50以下、55以下、60以下、65以下、70以下、75以下、80以下、または95以下のヌクレオチド長である、請求項36に記載のライブラリー。候補ヌクレアーゼターゲット部位が、RNAによってプログラム可能なヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、エンジイン、抗生物質ヌクレアーゼ、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、および/またはブレオマイシンによって切断され得る部位である、請求項36〜39のいずれか一項に記載のライブラリー。候補ヌクレアーゼターゲット部位がCas9ヌクレアーゼによって切断され得る、請求項39に記載のライブラリー。少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、または少なくとも1012個の異なる候補ヌクレアーゼターゲット部位を含む、請求項36〜40のいずれか一項に記載のライブラリー。少なくとも0.5kDa、少なくとも1kDa、少なくとも2kDa、少なくとも3kDa、少なくとも4kDa、少なくとも5kDa、少なくとも6kDa、少なくとも7kDa、少なくとも8kDa、少なくとも9kDa、少なくとも10kDa、少なくとも12kDa、または少なくとも15kDaの分子量の核酸分子を含む、請求項36〜41のいずれか一項に記載のライブラリー。目的のヌクレアーゼの既知のターゲット部位の変形である候補ヌクレアーゼターゲット部位を含む、請求項36〜42のいずれか一項に記載のライブラリー。既知のヌクレアーゼターゲット部位の変形が、既知のヌクレアーゼターゲット部位と比較して10個以下、9個以下、8個以下、7個以下、6個以下、5個以下、4個以下、3個以下、または2個以下の変異を含む、請求項43に記載のライブラリー。変形が、目的のヌクレアーゼの既知のターゲット部位とは平均で5%よりも多く、10%よりも多く、15%よりも多く、20%よりも多く、25%よりも多く、または30%よりも多く異なる(二項分布)、請求項43または44に記載のライブラリー。変形が、既知のターゲット部位とは平均で10%以下、15%以下、20%以下、25%以下、30%以下、40%以下、または50%以下異なる(二項分布)、請求項43〜45のいずれか一項に記載のライブラリー。目的のヌクレアーゼがCas9ヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、エンジイン、抗生物質ヌクレアーゼ、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン、またはその誘導体である、請求項43〜46のいずれか一項に記載のライブラリー。候補ヌクレアーゼターゲット部位が、[sgRNA相補配列]−[PAM]構造を含むCas9ヌクレアーゼターゲット部位であり、sgRNA相補配列が、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む、請求項6〜37のいずれか一項に記載のライブラリー。複数個のヌクレアーゼからコンセンサスターゲット部位を特異的に切断するヌクレアーゼを選択する方法であって、 (a)同じコンセンサス配列を切断する複数個の候補ヌクレアーゼを提供すること; (b)ステップ(a)の候補ヌクレアーゼのそれぞれについて、請求項1に記載の方法を用いて、コンセンサスターゲット部位とは異なる候補ヌクレアーゼによって切断されたヌクレアーゼターゲット部位を同定すること; (c)ステップ(b)において同定されたヌクレアーゼターゲット部位(単数または複数)に基づいてヌクレアーゼを選択すること、 を含む、 前記方法。ステップ(c)において選択されたヌクレアーゼが、最高の特異性でコンセンサスターゲット部位を切断するヌクレアーゼである、請求項49に記載の方法。最高の特異性でコンセンサスターゲット部位を切断するヌクレアーゼが、コンセンサス部位とは異なる最低数のターゲット部位を切断する候補ヌクレアーゼである、請求項49に記載の方法。最高の特異性でコンセンサスターゲット部位を切断する候補ヌクレアーゼが、ターゲットゲノムの文脈中で、コンセンサス部位とは異なる最低数のターゲット部位を切断する候補ヌクレアーゼである、請求項49に記載の方法。ステップ(c)において選択された候補ヌクレアーゼが、コンセンサスターゲット部位以外のいずれのターゲット部位も切断しないヌクレアーゼである、請求項49〜52のいずれか一項に記載の方法。ステップ(c)において選択された候補ヌクレアーゼが、ヌクレアーゼの治療有効濃度で対象のゲノム中のコンセンサスターゲット部位以外のいずれのターゲット部位も切断しないヌクレアーゼである、請求項53に記載の方法。ステップ(c)において選択されたヌクレアーゼとゲノムを接触させることをさらに含む、請求項49〜54のいずれか一項に記載の方法。ゲノムが、脊椎動物、哺乳類、ヒト、非ヒト霊長類、げっ歯類、マウス、ラット、ハムスター、ヤギ、ヒツジ、ウシ、イヌ、ネコ、爬虫類、両生類、魚類、線虫、昆虫、またはハエのゲノムである、請求項55に記載の方法。ゲノムが生細胞内にある、請求項55または56に記載の方法。ゲノムが対象内にある、請求項55〜57のいずれか一項に記載の方法。コンセンサスターゲット部位が、疾患または障害と関連したアレル内にある、請求項49〜58のいずれか一項に記載の方法。コンセンサスターゲット部位の切断が、疾患または障害の処置または予防をもたらす、請求項59に記載の方法。コンセンサスターゲット部位の切断が、疾患または障害の症状の緩和をもたらす、請求項59に記載の方法。疾患がHIV/AIDSである、請求項59〜61のいずれか一項に記載の方法。アレルがCCR5アレルである、請求項62に記載の方法。疾患が増殖性疾患である、請求項59〜61のいずれか一項に記載の方法。アレルがVEGFAアレルである、請求項64に記載の方法。請求項49〜65のいずれか一項に従って選択された、単離されたヌクレアーゼ。ヌクレアーゼが、ゲノム中のターゲット部位を切断するように操作された、請求項66に記載の単離されたヌクレアーゼ。ヌクレアーゼが、ゲノム中のターゲット部位に相補的であるsgRNAを含むCas9ヌクレアーゼである、請求項66または請求項67に記載の単離されたヌクレアーゼ。ヌクレアーゼが、ジンクフィンガーヌクレアーゼ(ZFN)もしくは転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼであるか、または有機化合物ヌクレアーゼ、エンジイン、抗生物質ヌクレアーゼ、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン、もしくはその誘導体であるかもしくはそれを含む、請求項66または請求項67に記載の単離されたヌクレアーゼ。ヌクレアーゼが、その既知のヌクレアーゼターゲット部位に加えて、他の候補ターゲット部位を切断しないこと、1個以下の候補ターゲット部位、2個以下の候補ターゲット部位、3個以下の候補ターゲット部位、4個以下の候補ターゲット部位、5個以下の候補ターゲット部位、6個以下の候補ターゲット部位、7個以下の候補ターゲット部位、8個以下の候補ターゲット部位、8個以下の候補ターゲット部位、9個以下の候補ターゲット部位、または10個以下の候補ターゲット部位を切断することに基づいて選択されている、請求項68または69に記載の単離されたヌクレアーゼ。請求項36〜48のいずれか一項に記載のライブラリーを含むキット。請求項66〜70のいずれか一項に記載の単離されたヌクレアーゼを含むキット。ヌクレアーゼがCas9ヌクレアーゼである、請求項72に記載のキット。単離されたヌクレアーゼのターゲット部位を含む核酸分子をさらに含む、請求項72または73に記載のキット。キットが、ヌクレアーゼと核酸を接触させることに好適な組成物を生成させるために、賦形剤ならびに賦形剤およびヌクレアーゼを接触させるための説明書を含む、請求項72〜74のいずれか一項に記載のキット。組成物が、ゲノム中の核酸に接触することに好適である、請求項75に記載のキット。組成物が、細胞内の核酸に接触することに好適である、請求項75または76に記載のキット。組成物が、対象内の核酸に接触することに好適である、請求項75〜77のいずれか一項に記載のキット。賦形剤が薬学的に許容可能な賦形剤である、請求項75〜78のいずれか一項に記載のキット。請求項66〜70のいずれか一項に記載の単離されたヌクレアーゼまたは請求項66〜70のいずれか一項に記載の単離されたヌクレアーゼをコードする核酸および薬学的に許容可能な賦形剤を含む、対象への投与のための医薬組成物。

说明书全文

関連出願 本願は、2014年6月30日出願の米国出願USSN14/320,370および2014年6月30日出願の米国出願USSN14/320,413の米国特許法第365条(c)の下における優先権を主張し、2013年8月9日出願の米国仮特許出願USSN61/864,289の米国特許法第119条(e)の下における優先権をもまた主張し、そのそれぞれは参照によって本明細書に組み込まれる。

政府の援助 本発明は、国防高等研究計画局によって授与された助成金HR0011-11-2-0003号およびN66001-12-C-4207号の下で米国政府の援助によってなされた。米国政府は本発明にある権利を有する。

部位特異的エンドヌクレアーゼは、ゲノム中の単一部位のターゲティングされた操作を理論上可能にし、遺伝子ターゲティングの文脈中で、さらには治療利用に有用である。哺乳動物を包含する様々な生物において、部位特異的エンドヌクレアーゼは、非相同末端結合または相同組み換えのいずれかを刺激することによってゲノム操作に用いられてきた。強な研究ツールを提供することに加えて、部位特異的ヌクレアーゼは遺伝子治療薬としてのポテンシャルもまた有しており、2つの部位特異的エンドヌクレアーゼが最近になって治験に入っている。1つはCCR5-2246であり、抗HIV治療法の一部としてヒトCCR−5アレルをターゲティングし(NCT00842634、NCT01044654、NCT01252641)、もう1つはVF24684であり、抗癌治療法の一部としてヒトVEGF−Aプロモーターをターゲティングする(NCT01082926)。

オフターゲット活性無しのまたは最小限のオフターゲット活性のみを有する目指すヌクレアーゼターゲット部位の特異的切断は、部位特異的エンドヌクレアーゼの臨床利用に、かつ基礎研究利用において高効率のゲノム操作にもまた必要条件である。なぜなら、操作された部位特異的結合ドメインの不完全な特異性は、細胞毒性と目指すターゲット以外のゲノム遺伝子座の望まれない改変とにリンクしているからである。しかしながら、今日利用可能な大部分のヌクレアーゼはかなりのオフターゲット活性を見せ、それゆえに臨床利用に好適でない場合もあり得る。そのため、ヌクレアーゼ特異性を評価するためおよび改善された特異性を有するヌクレアーゼを操作するための技術が必要とされている。

本開示のいくつかの側面は、いくつかの操作された部位特異的エンドヌクレアーゼの報告された毒性が、オフターゲット結合だけではなくオフターゲットDNA切断に基づいているという認識に基づく。本開示のいくつかの側面は、部位特異的ヌクレアーゼ(例えばRNAによってプログラム可能なエンドヌクレアーゼ、例えばCas9エンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZNF)、ホーミングエンドヌクレアーゼ、または転写活性化因子様エレメントヌクレアーゼ(TALEN))の配列特異性を評価およびキャラクタリゼーションするための戦略、組成物、システム、および方法を提供する。

本開示の戦略、方法、および試薬は、いくつかの側面において、ヌクレアーゼ特異性をアッセイするための以前の方法に優る改善をあらわす。例えば、候補ターゲット部位を含む核酸分子のライブラリーをスクリーニングすることによってヌクレアーゼターゲット部位特異性プロファイルを決定するためのいくつかの以前に報告された方法は「2回の切断(two-cut)」インビトロ選択法に依存しており、これは、ライブラリーメンバー核酸のヌクレアーゼの2つの隣接した切断からもたらされる2つのハーフ部位の配列からのターゲット部位の間接的な再構築を要求する(例えば、PCT出願WO2013/066438およびPattanayak, V., Ramirez, C.L., Joung, J.K. & Liu, D.R. Revealing off-target cleavage specificities of zinc-finger nucleases by in vitro selection. Nature methods 8, 765-770 (2011)参照。そのそれぞれの全体的な内容は参照によって本明細書に組み込まれる)。かかる「2回の切断」戦略とは対照的に、本開示の方法は最適化された「1回の切断(one-cut)」スクリーニング戦略を利用し、これは、ヌクレアーゼによって少なくとも1回切断されたライブラリーメンバーの同定を可能にする。本明細書において他所でより詳細に説明される通り、本明細書において提供される「1回の切断」選択戦略はシングルエンドハイスループットシーケンシング法に適合し、切断されたハーフ部位からの切断されたターゲット部位のコンピュータによる再構築を要求せず、それゆえにヌクレアーゼプロファイリングプロセスを合理化する。

本開示のいくつかの側面は、エンドヌクレアーゼの切断特異性を評価するためおよび特異性の望まれるレベルを有するヌクレアーゼを選択するためのインビトロ選択法を提供する。かかる方法は、例えば、目的のエンドヌクレアーゼをキャラクタリゼーションすることに、および特異性の望まれるレベルを見せるヌクレアーゼを同定することに(例えば、臨床利用のための高度に特異的なエンドヌクレアーゼを同定することに)有用である。

本開示のいくつかの側面は、いずれかのまたは少なくとも最小限のオフターゲット切断無しに所与のヌクレアーゼによる特異的切断を達成するために、ゲノム中のいずれかの他の部位とは十分に異なる好適なヌクレアーゼターゲット部位を同定する方法を提供する。かかる方法は、例えば、インビトロまたはインビボのゲノム操作のためのターゲット部位を選択するときに、ゲノムバックグラウンド上で高い特異性で切断され得る候補ヌクレアーゼターゲット部位を同定することに有用である。

本開示のいくつかの側面は、現在のヌクレアーゼと比較して向上した特異性を有する部位特異的ヌクレアーゼを評価、選択、および/または設計する方法を提供する。例えば、最小限のオフターゲット切断活性を有する部位特異的ヌクレアーゼを選択および/または設計することに有用である方法が本明細書において提供され、例えば、減少した結合親和性を有する結合ドメインを有するバリアントヌクレアーゼを設計することにより、ヌクレアーゼの終濃度を低めることにより、ゲノム中のそれらの最も近い近縁配列とは少なくとも3塩基対異なるターゲット部位を選択することにより、ならびに、RNAによってプログラム可能なヌクレアーゼのケースでは、最少のオフターゲット部位が結合および/または切断されることをもたらすガイドRNAを選択することによるものである。

本明細書に記載される方法の実施に有用な組成物およびキットもまた提供される。

本開示のいくつかの側面は、ヌクレアーゼのターゲット部位を同定するための方法を提供する。いくつかの態様において、方法は、(a)二本鎖核酸ターゲット部位を切断するヌクレアーゼを提供し、ターゲット部位の切断が5’リン酸部分を含む切断された核酸鎖をもたらすこと、(b)ヌクレアーゼのターゲット部位を含む候補核酸分子をヌクレアーゼが切断するのに好適な条件下で、候補核酸分子のライブラリーと(a)のヌクレアーゼを接触させ、各核酸分子が、候補ヌクレアーゼターゲット部位と定常挿入配列とを含む配列のコンカテマーを含むこと、および(c)ステップ(b)においてヌクレアーゼによって切断された核酸鎖上の未切断のヌクレアーゼターゲット部位の配列を決定することによって、(b)においてヌクレアーゼによって切断されたヌクレアーゼターゲット部位を同定することを含む。いくつかの態様において、ヌクレアーゼは平滑末端を生ずる。いくつかの態様において、ヌクレアーゼは5’オーバーハングを生ずる。いくつかの態様において、ステップ(c)の決定することは、5’リン酸依存的なライゲーションによって、ステップ(b)においてヌクレアーゼによって切断された核酸鎖の5’末端に最初の核酸アダプターをライゲーションすることを含む。いくつかの態様において、核酸アダプターは二本鎖形態で提供される。いくつかの態様において、5’リン酸依存的なライゲーションは平滑末端ライゲーションである。いくつかの態様において、方法は、ヌクレアーゼによって切断された核酸鎖に最初の核酸アダプターをライゲーションする前に5’オーバーハングを埋めることを含む。いくつかの態様において、ステップ(c)の決定することは、定常挿入配列にハイブリダイゼーションするPCRプライマーとアダプターにハイブリダイゼーションするPCRプライマーとを用いるPCR反応によって、未切断のターゲット部位を含むヌクレアーゼによって切断されたコンカテマーの断片を増幅することをさらに含む。いくつかの態様において、方法は、単一の未切断のターゲット配列を含む分子について増幅された核酸分子を濃縮することをさらに含む。いくつかの態様において、濃縮するステップはサイズ分画を含む。いくつかの態様において、ステップ(c)の決定することは、ステップ(b)においてヌクレアーゼによって切断された核酸鎖、またはPCRによって得られたそのコピーをシーケンシングすることを含む。いくつかの態様において、候補核酸分子のライブラリーは、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、または少なくとも1012個の異なる候補ヌクレアーゼ切断部位を含む。いくつかの態様において、ヌクレアーゼは、疾患と関連した遺伝子内の特異的なヌクレアーゼターゲット部位を切断する治療用ヌクレアーゼである。いくつかの態様において、方法は、治療用ヌクレアーゼが特異的なヌクレアーゼターゲット部位を切断し、かつ10よりも多くの追加のヌクレアーゼターゲット部位を切断せず、5よりも多くの追加のヌクレアーゼターゲット部位を切断せず、4よりも多くの追加のヌクレアーゼターゲット部位を切断せず、3よりも多くの追加のヌクレアーゼターゲット部位を切断せず、2よりも多くの追加のヌクレアーゼターゲット部位を切断せず、1よりも多くの追加のヌクレアーゼターゲット部位を切断せず、または全く追加のヌクレアーゼターゲット部位を切断しない治療用ヌクレアーゼの最大濃度を決定することをさらに含む。いくつかの態様において、方法は、最大濃度よりも低いかまたは等しい終濃度を生成させるのに有効な量で対象に治療用ヌクレアーゼを投与することをさらに含む。いくつかの態様において、ヌクレアーゼは、RNA分子との複合体を形成するRNAによってプログラム可能なヌクレアーゼであり、ヌクレアーゼ:RNA複合体は、RNA分子の配列に相補的な核酸配列に特異的に結合する。いくつかの態様において、RNA分子はシングルガイドRNA(sgRNA)である。いくつかの態様において、sgRNAは、5〜50ヌクレオチド、10〜30ヌクレオチド、15〜25ヌクレオチド、18〜22ヌクレオチド、19〜21ヌクレオチド、例えば10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む。いくつかの態様において、ヌクレアーゼはCas9ヌクレアーゼである。いくつかの態様において、ヌクレアーゼターゲット部位は[sgRNA相補配列]−[プロトスペーサー隣接モチーフ(PAM)]構造を含み、ヌクレアーゼはsgRNA相補配列内でターゲット部位を切断する。いくつかの態様において、sgRNA相補配列は、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む。いくつかの態様において、ヌクレアーゼは非特異的核酸切断ドメインを含む。いくつかの態様において、ヌクレアーゼはFokI切断ドメインを含む。いくつかの態様において、ヌクレアーゼは、切断ドメイン二量体化時にターゲット配列を切断する核酸切断ドメインを含む。いくつかの態様において、ヌクレアーゼは、核酸配列に特異的に結合する結合ドメインを含む。いくつかの態様において、結合ドメインはジンクフィンガーを含む。いくつかの態様において、結合ドメインは、少なくとも2、少なくとも3、少なくとも4、または少なくとも5つのジンクフィンガーを含む。いくつかの態様において、ヌクレアーゼはジンクフィンガーヌクレアーゼである。いくつかの態様において、結合ドメインは転写活性化因子様エレメントを含む。いくつかの態様において、ヌクレアーゼは転写活性化因子様エレメントヌクレアーゼ(TALEN)である。いくつかの態様において、ヌクレアーゼは有機化合物である。いくつかの態様において、ヌクレアーゼはエンジイン官能基を含む。いくつかの態様において、ヌクレアーゼは抗生物質である。いくつかの態様において、化合物はダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン、またはその誘導体である。いくつかの態様において、ヌクレアーゼはホーミングエンドヌクレアーゼである。

本開示のいくつかの側面は核酸分子のライブラリーを提供し、各核酸分子は、10〜100ヌクレオチドの定常挿入配列と候補ヌクレアーゼターゲット部位とを含む配列のコンカテマーを含む。いくつかの態様において、定常挿入配列は少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、または少なくとも95ヌクレオチド長である。いくつかの態様において、定常挿入配列は15以下、20以下、25以下、30以下、35以下、40以下、45以下、50以下、55以下、60以下、65以下、70以下、75以下、80以下、または95以下のヌクレオチド長である。いくつかの態様において、候補ヌクレアーゼターゲット部位は、RNAによってプログラム可能なヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、またはエンジイン抗生物質(例えば、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン)によって切断され得る部位である。いくつかの態様において、候補ヌクレアーゼターゲット部位はCas9ヌクレアーゼによって切断され得る。いくつかの態様において、ライブラリーは少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、または少なくとも1012個の異なる候補ヌクレアーゼターゲット部位を含む。いくつかの態様において、ライブラリーは、少なくとも0.5kDa、少なくとも1kDa、少なくとも2kDa、少なくとも3kDa、少なくとも4kDa、少なくとも5kDa、少なくとも6kDa、少なくとも7kDa、少なくとも8kDa、少なくとも9kDa、少なくとも10kDa、少なくとも12kDa、または少なくとも15kDaの分子量の核酸分子を含む。いくつかの態様において、ライブラリーは、目的のヌクレアーゼの既知のターゲット部位の変形である候補ヌクレアーゼターゲット部位を含む。いくつかの態様において、既知のヌクレアーゼターゲット部位の変形は、既知のヌクレアーゼターゲット部位と比較して10個以下、9個以下、8個以下、7個以下、6個以下、5個以下、4個以下、3個以下、または2個以下の変異を含む。いくつかの態様において、変形は、目的のヌクレアーゼの既知のターゲット部位とは平均で5%よりも多く、10%よりも多く、15%よりも多く、20%よりも多く、25%よりも多く、または30%よりも多く異なる(二項分布)。いくつかの態様において、変形は、既知のターゲット部位とは平均で10%以下、15%以下、20%以下、25%以下、30%以下、40%以下、または50%以下異なる(二項分布)。いくつかの態様において、目的のヌクレアーゼはCas9ヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、またはエンジイン抗生物質(例えば、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン)である。いくつかの態様において、候補ヌクレアーゼターゲット部位は、[sgRNA相補配列]−[PAM]構造を含むCas9ヌクレアーゼターゲット部位であり、sgRNA相補配列は10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む。

本開示のいくつかの側面は、複数個のヌクレアーゼからコンセンサスターゲット部位を特異的に切断するヌクレアーゼを選択するための方法を提供する。いくつかの態様において、方法は、(a)同じコンセンサス配列を切断する複数個の候補ヌクレアーゼを提供すること、(b)ステップ(a)の候補ヌクレアーゼのそれぞれについて、本明細書において提供される方法を用いて、コンセンサスターゲット部位とは異なる候補ヌクレアーゼによって切断されるヌクレアーゼターゲット部位を同定すること、(c)ステップ(b)において同定されるヌクレアーゼターゲット部位(単数または複数)に基づいてヌクレアーゼを選択することを含む。いくつかの態様において、ステップ(c)において選択されるヌクレアーゼは、最高の特異性でコンセンサスターゲット部位を切断するヌクレアーゼである。いくつかの態様において、最高の特異性でコンセンサスターゲット部位を切断するヌクレアーゼは、コンセンサス部位とは異なる最低数のターゲット部位を切断する候補ヌクレアーゼである。いくつかの態様において、最高の特異性でコンセンサスターゲット部位を切断する候補ヌクレアーゼは、ターゲットゲノムの文脈中で、コンセンサス部位とは異なる最低数のターゲット部位を切断する候補ヌクレアーゼである。いくつかの態様において、ステップ(c)において選択される候補ヌクレアーゼは、コンセンサスターゲット部位以外のいずれのターゲット部位も切断しないヌクレアーゼである。いくつかの態様において、ステップ(c)において選択される候補ヌクレアーゼは、ヌクレアーゼの治療有効濃度で対象のゲノム中のコンセンサスターゲット部位以外のいずれのターゲット部位も切断しないヌクレアーゼである。いくつかの態様において、方法は、ステップ(c)において選択されるヌクレアーゼとゲノムを接触させることをさらに含む。いくつかの態様において、ゲノムは脊椎動物、哺乳類、ヒト、非ヒト霊長類、げっ歯類、マウス、ラット、ハムスター、ヤギ、ヒツジ、ウシ、イヌ、ネコ、爬虫類、両生類、魚類、線虫、昆虫、またはハエのゲノムである。いくつかの態様において、ゲノムは生細胞内にある。いくつかの態様において、ゲノムは対象内にある。いくつかの態様において、コンセンサスターゲット部位は、疾患または障害と関連したアレル内にある。いくつかの態様において、コンセンサスターゲット部位の切断は疾患または障害の処置または予防(例えば、疾患または障害の少なくとも1つの兆候および/または症状の回復または予防)をもたらす。いくつかの態様において、コンセンサスターゲット部位の切断は疾患または障害の兆候および/または症状の緩和をもたらす。いくつかの態様において、コンセンサスターゲット部位の切断は疾患または障害の予防をもたらす。いくつかの態様において、疾患はHIV/AIDSである。いくつかの態様において、アレルはCCR5アレルである。いくつかの態様において、疾患は増殖性疾患である。いくつかの態様において、疾患は癌である。いくつかの態様において、アレルはVEGFAアレルである。

本開示のいくつかの側面は、本明細書において提供される方法に従って選択された単離されたヌクレアーゼを提供する。いくつかの態様において、ヌクレアーゼは、ゲノム中のターゲット部位を切断するように操作されている。いくつかの態様において、ヌクレアーゼはCas9ヌクレアーゼであり、ゲノム中のターゲット部位に相補的であるsgRNAを含む。いくつかの態様において、ヌクレアーゼはジンクフィンガーヌクレアーゼ(ZFN)もしくは転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、または有機化合物ヌクレアーゼ(例えば、エンジイン、抗生物質ヌクレアーゼ、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン、またはその誘導体)である。いくつかの態様において、ヌクレアーゼは、その既知のヌクレアーゼターゲット部位に加えて他の候補ターゲット部位も切断しないこと、1個以下の候補ターゲット部位、2個以下の候補ターゲット部位、3個以下の候補ターゲット部位、4個以下の候補ターゲット部位、5個以下の候補ターゲット部位、6個以下の候補ターゲット部位、7個以下の候補ターゲット部位、8個以下の候補ターゲット部位、8個以下の候補ターゲット部位、9個以下の候補ターゲット部位、または10個以下の候補ターゲット部位を切断することに基づいて選択されている。

本開示のいくつかの側面は、本明細書において提供される候補ヌクレアーゼターゲット部位を含む核酸分子のライブラリーを含むキットを提供する。本開示のいくつかの側面は、本明細書において提供される単離されたヌクレアーゼを含むキットを提供する。いくつかの態様において、ヌクレアーゼはCas9ヌクレアーゼである。いくつかの態様において、キットは、単離されたヌクレアーゼのターゲット部位を含む核酸分子をさらに含む。いくつかの態様において、キットは、ヌクレアーゼと核酸を接触させることに好適な組成物を生成させるために賦形剤とヌクレアーゼを接触させるための説明書および賦形剤を含む。いくつかの態様において、組成物は、ゲノム中の核酸と接触することに好適である。いくつかの態様において、組成物は、細胞内の核酸と接触することに好適である。いくつかの態様において、組成物は、対象内の核酸と接触することに好適である。いくつかの態様において、賦形剤は薬学的に許容可能な賦形剤である。

本開示のいくつかの側面は、対象への投与に好適な医薬組成物を提供する。いくつかの態様において、組成物は、本明細書において提供される単離されたヌクレアーゼを含む。いくつかの態様において、組成物は、かかるヌクレアーゼをコードする核酸を含む。いくつかの態様において、組成物は薬学的に許容可能な賦形剤を含む。

本発明の他の利点、特徴、および使用は、本発明のある限定しない態様の詳細な記載、図面(これらは図式的であり、一定の縮尺で描かれることは目指されていない)、および請求項から明らかになろう。

インビトロ選択の概略。(A)ショートガイドRNA(sgRNA)と複合体したCas9は、sgRNA配列に相補的であるターゲットDNA基質の約20塩基を認識し、両方のDNA鎖を切断する。白色三印は切断箇所をあらわす。(B)本発明者の以前に記載されたインビトロ選択の改変されたバージョンが、Cas9特異性を網羅的にプロファイリングするために用いられた。各分子がターゲットDNA配列(白色長方形)の10

12個の別個のバリアントの1つを含有するコンカテマーの選択前DNAライブラリーが、ライゲーションおよびローリングサークル増幅によって合成DNAオリゴヌクレオチドから生成した。このライブラリーは、目的のCas9:sgRNA複合体と一緒にインキュベーションされた。切断されたライブラリーメンバーは5’リン酸基(「P」を有する丸印)を含有し、そのため、アダプターライゲーションおよびPCRのための基質である。もたらされたアンプリコンはハイスループットDNAシーケンシングおよびコンピュータ分析に供された。

Cas9:CLTA1 sgRNAのインビトロ選択結果。ヒートマップ

21は、酵素制限条件下のCas9:CLTA1 sgRNA v2.1(A、B)、酵素飽和条件下のCas9:CLTA1 sgRNA v1.0(C、D)、および酵素飽和条件下のCas9:CLTA1 sgRNA v2.1(E、F)の特異性プロファイルを示している。ヒートマップは、全ての選択後配列(A、C、E)または20塩基対のsgRNAによって規定されるターゲット部位および2塩基対PAM中に単独変異を含有する配列のみ(B、D、F)を示している。1.0および−1.0の特異性スコアは、それぞれ特定の位置の特定の塩基対の肯定的または否定的な100%濃縮に対応する。黒色の欄は目指すターゲットヌクレオチドを表示している。(G)特異性に及ぼすCas9:sgRNA濃度の効果。酵素制限(200nMのDNA、100nMのCas9:sgRNA v2.1)および酵素飽和(200nMのDNA、1000nMのCas9:sgRNA v2.1)条件間の位置特異性の変化(位置特異性の最大の可能な変化に対して正規化されている)がCLTA1について示されている。(H)特異性に及ぼすsgRNA構成の効果。酵素飽和条件下でのsgRNA v1.0とsgRNA v2.1との間の位置特異性の変化(位置特異性の最大の可能な変化に対して正規化されている)がCLTA1について示されている。CLTA2、CLTA3、およびCLTA4の対応するデータについては図6〜8、25、および26参照。配列識別子:(A〜F)に示されているsgRNA配列は配列番号1に対応する。

本研究においてプロファイリングされたターゲット部位。(A)sgRNAの5’末端は、ターゲット部位に相補的である20ヌクレオチドを有する。ターゲット部位は、RNA:DNA相補性の領域に隣接したNGGモチーフ(PAM)を含有する。(B)4つのヒトクラスリン遺伝子(CLTA)ターゲット部位が示されている。(C、D)4つのヒトクラスリン遺伝子(CLTA)ターゲット部位がsgRNAと一緒に示されている。sgRNA v1.0はsgRNA v2.1よりも短い。PAMが各部位について示されている。ターゲット部位の非PAM末端はsgRNAの5’末端に対応している。配列識別子:(B)に示されている配列は、上から下へ、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、および配列番号7である。(C)に示されている配列は、上から下へ、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、および配列番号19である。(D)に示されている配列は、上から下へ、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、および配列番号31である。

インビトロでのオンターゲットDNA配列のCas9:ガイドRNA切断。およそ1kbの直鎖状基質での個々のDNA切断アッセイが、200nMのオンターゲット部位ならびに100nMのCas9:v1.0 sgRNA、100nMのCas9:v2.1 sgRNA、1000nMのCas9:v1.0 sgRNA、および1000nMのCas9:v2.1 sgRNAによって、4つのCLTAターゲット部位のそれぞれについて行われた。CLTA1、CLTA2、およびCLTA4については、Cas9:v2.1 sgRNAはCas9:v1.0 sgRNAよりも高い活性を示す。CLTA3については、Cas9:v1.0 sgRNAおよびCas9:v2.1 sgRNAの活性は同等であった。

4つのターゲット部位のインビトロ選択結果。インビトロ選択は、200nMの選択前ライブラリーで100nMのCas9:sgRNA v2.1、1000nMのCas9:sgRNA v1.0、または1000nMのCas9:sgRNA v2.1によって行われた。(A)選択後PCR産物が、行われた12回の選択について示されている。1.5個のリピートを含有するDNAが各選択について定量され、ゲル精製およびシーケンシング前に等モル量でプールされた。(B〜E)変異の分布が選択前(黒色)および選択後ライブラリー(有色)について示されている。選択後ライブラリーは、選択前ライブラリーよりも少ない変異を有する配列が濃縮されている。変異は、sgRNAによって規定される20塩基対および2塩基対PAMのうちからカウントされる。P値は各パネルの分布間で全てのペアワイズ比較について<0.01である。P値はt検定を用いて算出され、等しくないサイズおよび不等分散を仮定した。

Cas9:CLTA2 sgRNAのインビトロ選択結果。ヒートマップ

24は、酵素制限条件下のCas9:CLTA2 sgRNA v2.1(A、B)、酵素過剰条件下のCas9:CLTA2 sgRNA v1.0(C、D)、および酵素過剰条件下のCas9:CLTA2 sgRNA v2.1(E、F)の特異性プロファイルを示している。ヒートマップは、全ての選択後配列(A、C、E)または20塩基対のsgRNAによって規定されるターゲット部位および2塩基対PAM中に単独変異を含有する配列のみ(B、D、F)を示している。1.0および−1.0の特異性スコアは、それぞれ特定の位置の特定の塩基対の肯定的または否定的な100%濃縮に対応する。黒色の欄は目指すターゲットヌクレオチドを表示している。配列識別子:(A〜F)に示されているsgRNA配列は配列番号32に対応する。

Cas9:CLTA3 sgRNAのインビトロ選択結果。ヒートマップ

24は、酵素制限条件下のCas9:CLTA3 sgRNA v2.1(A、B)、酵素過剰条件下のCas9:CLTA3 sgRNA v1.0(C、D)、および酵素飽和条件下のCas9:CLTA3 sgRNA v2.1(E、F)の特異性プロファイルを示している。ヒートマップは、全ての選択後配列(A、C、E)または20塩基対のsgRNAによって規定されるターゲット部位および2塩基対PAM中に単独変異を含有する配列のみ(B、D、F)を示している。1.0および−1.0の特異性スコアは、それぞれ特定の位置の特定の塩基対の肯定的または否定的な100%濃縮に対応する。黒色の欄は目指すターゲットヌクレオチドを表示している。配列識別子:(A〜F)に示されているsgRNA配列は配列番号32に対応する。

Cas9:CLTA4 sgRNAのインビトロ選択結果。ヒートマップ

24は、酵素制限条件下のCas9:CLTA4 sgRNA v2.1(A、B)、酵素過剰条件下のCas9:CLTA4 sgRNA v1.0(C、D)、および酵素飽和条件下のCas9:CLTA4 sgRNA v2.1(E、F)の特異性プロファイルを示している。ヒートマップは、全ての選択後配列(A、C、E)または20塩基対のsgRNAによって規定されるターゲット部位および2塩基対PAM中に単独変異を含有する配列のみ(B、D、F)を示している。1.0および−1.0の特異性スコアは、それぞれ特定の位置の特定の塩基対の肯定的または否定的な100%濃縮に対応する。黒色の欄は目指すターゲットヌクレオチドを表示している。配列識別子:(A〜F)に示されているsgRNA配列は配列番号33に対応する。

配列ロゴとしてのインビトロ選択結果。情報量が、酵素制限条件下でのCLTA1(A)、CLTA2(B)、CLTA3(C)、およびCLTA4(D)sgRNA v2.1によって規定される各ターゲット部位位置(1〜20)についてプロットされている

25。PAM中の位置は「P1」、「P2」、および「P3」と標識されている。情報量がビットでプロットされている。2.0ビットは絶対的な特異性を示し、0ビットは特異性無しを示す。

CLTA1のPAMに遠位の変異の許容性。各位置における最大の特異性スコアがCas9:CLTA1 v2.1 sgRNA選択について示されている。このとき、灰色のオンターゲット塩基対を有する配列のみを考慮し、一方、最初の1〜12塩基対中の変異を可能にする(A〜L)。オンターゲット塩基対に束縛されない位置は暗色のバーによって示されている。より高い特異性スコア値は所与の位置におけるより高い特異性を示している。いずれかの変異を含有するのが可能でなかった位置(灰色)は、+1の特異性スコアでプロットされた。全てのパネルについて、特異性スコアは、それぞれn≧5,130およびn≧74,538を有する選択前ライブラリー配列および選択後ライブラリー配列から算出された。

CLTA2のPAMに遠位の変異の許容性。各位置における最大の特異性スコアがCas9:CLTA2 v2.1 sgRNA選択について示されている。このとき、灰色のオンターゲット塩基対を有する配列のみを考慮し、一方、最初の1〜12塩基対中の変異を可能にする(A〜L)。オンターゲット塩基対に束縛されない位置は暗色のバーによって示されている。より高い特異性スコア値は所与の位置におけるより高い特異性を示している。いずれかの変異を含有するのが可能でなかった位置(灰色)は、+1の特異性スコアでプロットされた。全てのパネルについて、特異性スコアは、それぞれn≧3,190およびn≧25,365を有する選択前ライブラリー配列および選択後ライブラリー配列から算出された。

CLTA3のPAMに遠位の変異の許容性。各位置における最大の特異性スコアがCas9:CLTA3 v2.1 sgRNA選択について示されている。このとき、灰色のオンターゲット塩基対を有する配列のみを考慮し、一方、最初の1〜12塩基対中の変異を可能にする(A〜L)。オンターゲット塩基対に束縛されない位置は暗色のバーによって示されている。より高い特異性スコア値は所与の位置におけるより高い特異性を示している。いずれかの変異を含有するのが可能でなかった位置(灰色)は、+1の特異性スコアでプロットされた。全てのパネルについて、特異性スコアは、それぞれn≧5,604およびn≧158,424を有する選択前ライブラリー配列および選択後ライブラリー配列から算出された。

CLTA4のPAMに遠位の変異の許容性。各位置における最大の特異性スコアがCas9:CLTA4 v2.1 sgRNA選択について示されている。このとき、灰色のオンターゲット塩基対を有する配列のみを考慮し、一方、最初の1〜12塩基対中の変異を可能にする(A〜L)。オンターゲット塩基対に束縛されない位置は暗色のバーによって示されている。より高い特異性スコア値は所与の位置におけるより高い特異性を示している。いずれかの変異を含有するのが可能でなかった位置(灰色)は、+1の特異性スコアでプロットされた。全てのパネルについて、特異性スコアは、それぞれn≧2,323およびn≧21,819を有する選択前ライブラリー配列および選択後ライブラリー配列から算出された。

CLTA1ターゲット部位のPAMに遠位の変異の許容性。変異の分布が、1000nMのCas9:CLTA1 sgRNA v2.1による200nMの選択前ライブラリーでのインビトロ選択について示されている。示されている変異数は、PAMから最も遠い1〜12塩基対のターゲット部位部分配列中であり(A〜L)、このとき、PAMを包含するターゲット部位の残りはオンターゲット塩基対のみを含有する。選択前および選択後の分布は3塩基対までは類似であり、PAMから最も遠い3塩基対中に変異を有するターゲット部位に対する許容性を証明している。このとき、ターゲット部位の残りはCas9:sgRNAとの最適な相互作用を有する。全てのパネルについて、グラフは、それぞれn≧5,130およびn≧74,538を有する選択前ライブラリー配列および選択後ライブラリー配列から生成した。

CLTA2ターゲット部位のPAMに遠位の変異の許容性。変異の分布が、1000nMのCas9:CLTA2 sgRNA v2.1による200nMの選択前ライブラリーでのインビトロ選択について示されている。示されている変異数は、PAMから最も遠い1〜12塩基対のターゲット部位部分配列中であり(A〜L)、このとき、PAMを包含するターゲット部位の残りはオンターゲット塩基対のみを含有する。選択前および選択後の分布は3塩基対までは類似であり、PAMから最も遠い3塩基対中に変異を有するターゲット部位に対する許容性を証明している。このとき、ターゲット部位の残りはCas9:sgRNAとの最適な相互作用を有する。全てのパネルについて、グラフは、それぞれn≧3,190およびn≧21,265を有する選択前ライブラリー配列および選択後ライブラリー配列から生成した。

CLTA3ターゲット部位のPAMに遠位の変異の許容性。変異の分布が、1000nMのCas9:CLTA3 sgRNA v2.1による200nMの選択前ライブラリーでのインビトロ選択について示されている。示されている変異数は、PAMから最も遠い1〜12塩基対のターゲット部位部分配列中であり(A〜L)、このとき、PAMを包含するターゲット部位の残りはオンターゲット塩基対のみを含有する。選択前および選択後の分布は3塩基対までは類似であり、PAMから最も遠い3塩基対中に変異を有するターゲット部位に対する許容性を証明している。このとき、ターゲット部位の残りはCas9:sgRNAとの最適な相互作用を有する。全てのパネルについて、グラフは、それぞれn≧5,604およびn≧158,424を有する選択前ライブラリー配列および選択後ライブラリー配列から生成した。

CLTA4ターゲット部位のPAMに遠位の変異の許容性。変異の分布が、1000nMのCas9:CLTA4 sgRNA v2.1による200nMの選択前ライブラリーでのインビトロ選択について示されている。示されている変異数は、PAMから最も遠い1〜12塩基対のターゲット部位部分配列中であり(A〜L)、このとき、PAMを包含するターゲット部位の残りはオンターゲット塩基対のみを含有する。選択前および選択後の分布は3塩基対までは類似であり、PAMから最も遠い3塩基対中に変異を有するターゲット部位に対する許容性を証明している。このとき、ターゲット部位の残りはCas9:sgRNAとの最適な相互作用を有する。全てのパネルについて、グラフは、それぞれn≧2,323およびn≧21,819を有する選択前ライブラリー配列および選択後ライブラリー配列から生成した。

100nMのCas9:sgRNA v2.1の位置特異性パターン。位置特異性(ターゲット部位内のある位置において認識された4つの可能な塩基対のそれぞれについて、特異性スコアの大きさの和として定義される)が、sgRNA v2.1の酵素制限条件下での各ターゲット部位についてプロットされている。位置特異性は、ターゲット部位の最大の位置特異性値に対して正規化された値として示されている。位置特異性はPAMに近位のターゲット部位の末端において最高であり、ターゲット部位の中程とPAMに最も遠位の数個のヌクレオチドとにおいて最低である。

1000nMのCas9:sgRNA v1.0の位置特異性パターン。位置特異性(ターゲット部位内のある位置において認識された4つの可能な塩基対のそれぞれについて、特異性スコアの大きさの和として定義される)が、sgRNA v1.0の酵素過剰条件下での各ターゲット部位についてプロットされている。位置特異性は、ターゲット部位の最大の位置特異性値に対して正規化された値として示されている。位置特異性はターゲット部位を通して比較的定常であるが、ターゲット部位の中程とPAMに最も遠位の数個のヌクレオチドとにおいて最低である。

1000nMのCas9:sgRNA v2.1の位置特異性パターン。位置特異性(ターゲット部位内のある位置において認識された4つの可能な塩基対のそれぞれについて、特異性スコアの大きさの和として定義される)が、sgRNA v2.1の酵素過剰条件下での各ターゲット部位についてプロットされている。位置特異性は、ターゲット部位の最大の位置特異性値に対して正規化された値として示されている。位置特異性はターゲット部位を通して比較的定常であるが、ターゲット部位の中程とPAMに最も遠位の数個のヌクレオチドとにおいて最低である。

PAMヌクレオチド選好性。酵素制限または酵素過剰条件下での選択前ライブラリーおよび選択後ライブラリー中の存在比が、CLTA1(A)、CLTA2(B)、CLTA3(C)、およびCLTA4(D)sgRNA v2.1による選択について、全ての16個の可能なPAMジヌクレオチドについて示されている。GGジヌクレオチドは選択後ライブラリー中で存在比が増大し、一方、他の可能なPAMジヌクレオチドは選択後に存在比が減少した。

オンターゲット部位のPAMヌクレオチド選好性。ガイドRNAによって規定される20塩基対中に変異を含有しない選択後ライブラリーメンバーのみが、この分析に包含された。酵素制限および酵素過剰条件下での選択前ライブラリーおよび選択後ライブラリー中の存在比が、CLTA1(A)、CLTA2(B)、CLTA3(C)、およびCLTA4(D)sgRNA v2.1による選択について、全ての16個の可能なPAMジヌクレオチドについて示されている。GGジヌクレオチドは選択後ライブラリー中で存在比が増大し、一方、他の可能なPAMジヌクレオチドは選択後に存在比が一般的に減少したが、Cas9:sgRNAの酵素過剰濃度について、この効果は多くのジヌクレオチドについて軽微または不在であった。

PAMジヌクレオチド特異性スコア。酵素制限および酵素過剰条件下での特異性スコアが、CLTA1(A)、CLTA2(B)、CLTA3(C)、およびCLTA4(D)sgRNA v2.1による選択について、全ての16個の可能なPAMジヌクレオチド(3ヌクレオチドNGG PAMの位置2および3)について示されている。特異性スコアは、選択前ライブラリーと相対的な選択後ライブラリー中のPAMジヌクレオチドの濃縮を示しており、ジヌクレオチドの最大の可能な濃縮に対して正規化されている。+1.0の特異性スコアは、ジヌクレオチドが選択後ライブラリー中で100%濃縮されているということを示しており、−1.0の特異性スコアは、ジヌクレオチドが100%脱濃縮(de-enrich)しているということを示している。GGジヌクレオチドは選択後ライブラリー中で最も濃縮されており、AG、GA、GC、GT、およびTGは他の可能なPAMジヌクレオチドと比較してより少ない相対的な脱濃縮を示す。

オンターゲット部位のPAMジヌクレオチド特異性スコア。ガイドRNAによって規定される20塩基対中に変異を含有しない選択後ライブラリーメンバーのみが、この分析に包含された。酵素制限および酵素過剰条件下での特異性スコアが、CLTA1(A)、CLTA2(B)、CLTA3(C)、およびCLTA4(D)sgRNA v2.1による選択について、全ての16個の可能なPAMジヌクレオチド(3ヌクレオチドNGG PAMの位置2および3)について示されている。特異性スコアは、選択前ライブラリーと相対的な選択後ライブラリー中のPAMジヌクレオチドの濃縮を示しており、ジヌクレオチドの最大の可能な濃縮に対して正規化されている。+1.0の特異性スコアは、ジヌクレオチドが選択後ライブラリー中で100%濃縮されているということを示しており、−1.0の特異性スコアは、ジヌクレオチドが100%脱濃縮されているということを示している。GGジヌクレオチドは選択後ライブラリー中で最も濃縮されており、AGおよびGAヌクレオチドは少なくとも1つの選択条件において濃縮も脱濃縮もされておらず、GC、GT、およびTGは他の可能なPAMジヌクレオチドと比較してより少ない相対的な脱濃縮を示す。

Cas9:sgRNA濃度が特異性に及ぼす効果。酵素制限(200nMのDNA、100nMのCas9:sgRNA v2.1)および酵素過剰(200nMのDNA、1000nMのCas9:sgRNA v2.1)条件間の位置特異性の変化が、CLTA1(A)、CLTA2(B)、CLTA3(C)、およびCLTA4(D)ターゲット部位をターゲティングするsgRNAによる選択について示されている。線は、所与の位置について位置特異性の最大の可能な変化を示す。特異性の最高の変化は、酵素濃度が増大するとPAMに近位で起こる。

sgRNA構成が特異性に及ぼす効果。酵素過剰(200nMのDNA、1000nMのCas9:sgRNA v2.1)条件下のCas9:sgRNA v1.0とCas9:sgRNA v2.1との間の位置特異性の変化が、CLTA1(A)、CLTA2(B)、CLTA3(C)、およびCLTA4(D)ターゲット部位をターゲティングするsgRNAによる選択について示されている。線は、所与の位置について位置特異性の最大の可能な変化を示す。

インビトロのオフターゲットDNA配列のCas9:ガイドRNA切断。96bp直鎖状基質での個々のDNA切断アッセイが、インビトロ選択によって同定されたオンターゲットCLTA4部位(CLTA4−0)および5つのCLTA4オフターゲット部位について、200nMのDNAおよび1000nMのCas9:CLTA4 v2.1 sgRNAによって行われた。示されている濃縮値は1000nMのCas9:CLTA4 v2.1 sgRNAによるインビトロ選択からである。CLTA4−1およびCLTA4−3は、それらの条件下の最も高度に濃縮された配列であった。CLTA4−2a、CLTA4−2b、およびCLTA4−2cは、高度の濃縮〜濃縮無し〜高度の脱濃縮の濃縮値の範囲をあらわす2変異配列である。小文字は、オンターゲットCLTA4部位に相対的な変異を示している。濃縮値は、インビトロの切断の観察された量と定性的に一致している。配列識別子:示されている配列は、上から下へ、配列番号34、配列番号35、配列番号36、配列番号37、配列番号38、および配列番号39である。

ガイドRNA構成およびCas9:sgRNA濃度がオフターゲット部位のインビトロ切断に及ぼす効果。96bp直鎖状基質での個々のDNA切断アッセイが、200nMのDNAおよび100nMのCas9:v1.0 sgRNA、100nMのCas9:v2.1 sgRNA、1000nMのCas9:v1.0 sgRNA、または1000nMのCas9:v2.1 sgRNAによって、CLTA4−3オフターゲット部位(5’GggGATGTAGTGTTTCCACtGGG 3’(配列番号39)。変異は小文字で示されている)について行われた。DNA切断は試験された全ての4つの条件下で観察され、切断率は、酵素過剰条件で、またはv1.0 sgRNAと比較してv2.1 sgRNAでより高度である。

定義 本明細書および請求項において用いられる場合には、単数形「a」、「an」、および「the」は、文脈が別様に明確に示さない限り、単数および複数の参照を包含する。それゆえに、例えば「薬剤」の参照は単一の薬剤および複数個のかかる薬剤を包含する。

用語「Cas9」または「Cas9ヌクレアーゼ」は、Cas9蛋白質またはその断片を含むRNAガイドヌクレアーゼを言う。Cas9ヌクレアーゼは、場合によってはcasn1ヌクレアーゼまたはCRISPR(clustered regularly interspaced short palindromic repeat)関連ヌクレアーゼともまた言われる。CRISPRは、可動性遺伝子エレメント(例えば、ウイルス、転移因子、および接合性プラスミド)に対する防御を提供する適応免疫システムである。CRISPRクラスターは、スペーサー、先行可動性因子に相補的な配列を含有し、侵入核酸をターゲティングする。CRISPRクラスターは転写およびプロセシングされてCRISPR−RNA(crRNA)になる。II型CRISPRシステムにおいては、pre−crRNAの正しいプロセシングはtracrRNA(trans-encoded small RNA)、内在性リボヌクレアーゼ3(rnc)、およびCas9蛋白質を要求する。tracrRNAは、pre−crRNAのリボヌクレアーゼ3によって促進されるプロセシングのガイドとして働く。その後、Cas9/crRNA/tracrRNAはスペーサーに相補的な直鎖状または環状dsDNAターゲットをエンド的に(endonucleolytically)切断する。crRNAに相補的でないターゲット鎖は最初にエンド的に切断され、それから3’から5’にエキソ的に(exonucleolytically)トリミングされる。自然界では、DNA結合および切断は蛋白質および両方のRNA種を典型的には要求する。しかしながら、シングルガイドRNA(「sgRNA」または単に「gNRA」)は、crRNAおよびtracrRNA両方の側面を単一のRNA分子に組み込むように操作され得る。例えば、Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)参照。その全体的な内容は参照によってここに組み込まれる。Cas9はCRISPRリピート配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己対非自己を見分けることを助ける。Cas9ヌクレアーゼの配列および構造は当業者に周知である(例えば、「Complete genome sequence of an M1 strain of Streptococcus pyogenes.」Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L. expand/collapse author list McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001)、「CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.」Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011)、および「A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.」Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)参照。その全体的な内容は参照によって本明細書に組み込まれる)。Cas9オーソログは種々の種(S.pyogenesおよびS.thermophilusを包含するが、これに限定されない)において記載されている。追加の好適なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者には明らかであろう。かかるCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, 「The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems」(2013) RNA Biology 10:5, 726-737(その全体的な内容は参照によって本明細書に組み込まれる)に開示されている生物および遺伝子座からのCas9配列を包含する。いくつかの態様において、Cas9またはその断片蛋白質を含む蛋白質は「Cas9バリアント」と言われる。Cas9バリアントはCas9またはその断片との相同性を共有する。例えば、Cas9バリアントは野生型Cas9と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%である。いくつかの態様において、Cas9バリアントはCas9の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、その結果、断片は野生型Cas9の対応する断片と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%である。いくつかの態様において、野生型Cas9はStreptococcus pyogenesからのCas9に対応する(NCBI参照配列:NC_017053.1、配列番号40(ヌクレオチド)、配列番号41(アミノ酸))。 ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA(配列番号1) MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(配列番号2)

用語「コンカテマー」は、核酸分子の文脈中で本明細書において用いられる場合には、一連でリンクされた同じDNA配列の複数のコピーを含有する核酸分子を言う。例えば、ヌクレオチドの具体的な配列の10コピー(例えば[XYZ]10)を含むコンカテマーは、一連で互いにリンクされた同じ具体的な配列の10コピー、例えば5’-XYZXYZXYZXYZXYZXYZXYZXYZXYZXYZ-3’を含むであろう。コンカテマーは、リピート単位または配列のいずれかのコピー数(例えば、少なくとも2コピー、少なくとも3コピー、少なくとも4コピー、少なくとも5コピー、少なくとも10コピー、少なくとも100コピー、少なくとも1000コピーなど)を含み得る。ヌクレアーゼターゲット部位と定常挿入配列とを含む核酸配列のコンカテマーの例は[(ターゲット部位)−(定常挿入配列)]300であろう。コンカテマーは直鎖状核酸分子であり得るか、または環状であり得る。

用語「コンジュゲーションすること」、「コンジュゲーションされた」、および「コンジュゲーション」は、2つの実体の(例えば、2つの分子、例えば2つの蛋白質、2つのドメイン(例えば、結合ドメインおよび切断ドメイン)、または蛋白質および薬剤、例えば蛋白質結合ドメインおよび小分子の会合を言う。いくつかの側面において、会合は蛋白質(例えば、RNAによってプログラム可能なヌクレアーゼ)と核酸(例えばガイドRNA)との間である。会合は、例えば、直接的または間接的な(例えば、リンカーによる)共有的な結合によるかまたは非共有的な相互作用により得る。いくつかの態様において、会合は共有的である。いくつかの態様において、2つの分子は、両方の分子を繋ぐリンカーによってコンジュゲーションされる。例えば、2つの蛋白質(例えば操作されたヌクレアーゼの結合ドメインおよび切断ドメイン)が互いにコンジュゲーションされて蛋白質融合体を形成するいくつかの態様において、2つの蛋白質はポリペプチドリンカー(例えば、1つの蛋白質のC末端をもう一方の蛋白質のN末端に繋ぐアミノ酸配列)によってコンジュゲーションされ得る。

用語「コンセンサス配列」は、核酸配列の文脈中で本明細書において用いられる場合には、複数個の類似の配列中の各位置において見いだされる最も高頻度のヌクレオチド残基をあらわす、算出された配列を言う。典型的には、コンセンサス配列は配列アラインメントによって決定され、類似の配列が互いに比較されて類似の配列モチーフが算出される。ヌクレアーゼターゲット部位配列の文脈中では、ヌクレアーゼターゲット部位のコンセンサス配列は、いくつかの態様において、所与のヌクレアーゼによって最も高頻度に結合または最高の親和性で結合される配列であり得る。RNAによってプログラム可能なヌクレアーゼ(例えばCas9)のターゲット部位配列に関して、コンセンサス配列は、いくつかの態様において、gRNAまたは複数個のgRNAが(例えば、相補的な塩基対形成に基づいて)結合するように設計または結合すると予想される配列または領域であり得る。

用語「有効量」は、本明細書において用いられる場合には、望まれる生体応答を惹起するのに十分である生物活性薬剤の量を言い得る。例えば、いくつかの態様において、ヌクレアーゼの有効量は、ヌクレアーゼによって特異的に結合および切断されるターゲット部位の切断を誘導するのに十分であるヌクレアーゼの量を言う。当業者によって認められるであろう通り、薬剤(例えばヌクレアーゼ、ハイブリッド蛋白質、またはポリヌクレオチド)の有効量は、種々の因子に(例えば、望まれる生体応答、ターゲティングされる具体的なアレル、ゲノム、ターゲット部位、細胞、または組織、および用いられようとする薬剤に)依存して変わり得る。

用語「エンジイン」は、本明細書において用いられる場合には、二重結合によって離間された2つの三重結合を含有する9および10員環いずれかを特徴とする細菌天然産物のクラスを言う(例えば、K. C. Nicolaou; A. L. Smith; E. W. Yue (1993).「Chemistry and biology of natural and designed enediynes」. PNAS 90 (13): 5881-5888参照。その全体的な内容は参照によって本明細書に組み込まれる)。いくつかのエンジインはバーグマン環化を受けることができ、もたらされるジラジカル(1,4−デヒドロベンゼン誘導体)はDNAの糖バックボーンから原子を引き抜くことができ、これはDNA鎖切断をもたらす(例えば、S. Walker; R. Landovitz; W.D. Ding; G.A. Ellestad; D. Kahne (1992).「Cleavage behavior of calicheamicin gamma 1 and calicheamicin T」. Proc Natl Acad Sci U.S.A. 89 (10): 4608-12参照。その全体的な内容は参照によって本明細書に組み込まれる)。DNAとのそれらの反応性は抗生物質キャラクターを多くのエンジインに付与し、いくつかのエンジインは抗癌抗生物質として臨床研究されている。エンジインの限定しない例はダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシンである(例えば、Adrian L. Smith and K. C. Bicolaou,「The Enediyne Antibiotics」J. Med. Chem., 1996, 39 (11), pp 2103-2117およびDonald Borders,「Enediyne antibiotics as antitumor agents」Informa Healthcare; 1st edition (November 23, 1994, ISBN-10: 0824789385参照。その全体的な内容は参照によって本明細書に組み込まれる)。

用語「ホーミングエンドヌクレアーゼ」は、本明細書において用いられる場合には、イントロンまたはインテインによって典型的にはコードされる制限酵素の型を言う。Edgell DR (February 2009).「Selfish DNA: homing endonucleases find a home」. Curr Biol 19 (3): R115-R117; Jasin M (Jun 1996).「Genetic manipulation of genomes with rare-cutting endonucleases」. Trends Genet 12 (6): 224-8; Burt A, Koufopanou V (December 2004).「Homing endonuclease genes: the rise and fall and rise again of a selfish element」. Curr Opin Genet Dev 14 (6): 609-15(その全体的な内容は参照によって本明細書に組み込まれる)。ホーミングエンドヌクレアーゼ認識配列は、非常に低い確率(およそ7×1010bp毎に1回)でのみランダムに起こるのに足りるだけ長く、通常はゲノムあたり1つのみ見いだされる。

用語「ライブラリー」は、核酸または蛋白質の文脈中で本明細書において用いられる場合には、それぞれ2つまたは3つ以上の異なる核酸または蛋白質の集団を言う。例えば、ヌクレアーゼターゲット部位のライブラリーは、異なるヌクレアーゼターゲット部位を含む少なくとも2つの核酸分子を含む。いくつかの態様において、ライブラリーは、少なくとも101、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、少なくとも1012、少なくとも1013、少なくとも1014、または少なくとも1015個の異なる核酸または蛋白質を含む。いくつかの態様において、ライブラリーのメンバーは、ランダム化された配列、例えば完全にまたは部分的にランダム化された配列を含み得る。いくつかの態様において、ライブラリーは、互いに無関連である核酸分子(例えば、完全にランダム化された配列を含む核酸)を含む。他の態様において、ライブラリーの少なくともいくつかのメンバーは関連し得、例えば、それらはコンセンサスターゲット部位配列などの特定の配列のバリアントまたは誘導体であり得る。

用語「リンカー」は、本明細書において用いられる場合には、2つの隣接した分子または部分(例えば、ヌクレアーゼの結合ドメインおよび切断ドメイン)をリンクする化学基または分子を言う。典型的には、リンカーは2つの基、分子、または他の部分の間に位置またはそれらに隣接して、共有結合によって互いに繋がれ、それゆえに2つを繋ぐ。いくつかの態様において、リンカーは、アミノ酸または複数個のアミノ酸(例えば、ペプチドまたは蛋白質)である。いくつかの態様において、リンカーは有機分子、基、ポリマー、または化学的な部分である。

用語「ヌクレアーゼ」は、本明細書において用いられる場合には、核酸分子中のヌクレオチド残基を繋ぐホスホジエステル結合を切断することができる薬剤(例えば蛋白質または小分子)を言う。いくつかの態様において、ヌクレアーゼは蛋白質(例えば、核酸分子に結合して、核酸分子中のヌクレオチド残基を繋ぐホスホジエステル結合を切断し得る酵素)である。ヌクレアーゼは、ポリヌクレオチド鎖内のホスホジエステル結合を切断するエンドヌクレアーゼ、またはポリヌクレオチド鎖の末端のホスホジエステル結合を切断するエキソヌクレアーゼであり得る。いくつかの態様において、ヌクレアーゼは部位特異的ヌクレアーゼであり、特異的なヌクレオチド配列中の特異的なホスホジエステル結合を結合および/または切断し、これは本明細書において「認識配列」、「ヌクレアーゼターゲット部位」、または「ターゲット部位」ともまた言われる。いくつかの態様において、ヌクレアーゼはRNAガイド(すなわち、RNAによってプログラム可能な)ヌクレアーゼであり、これは、ターゲット部位を相補する配列を有するRNAと複合体化(例えば結合)し、それによってヌクレアーゼの配列特異性を提供する。いくつかの態様において、ヌクレアーゼは一本鎖ターゲット部位を認識し、一方、他の態様において、ヌクレアーゼは二本鎖ターゲット部位(例えば二本鎖DNAターゲット部位)を認識する。多くの天然に存在するヌクレアーゼ(例えば、多くの天然に存在するDNA制限ヌクレアーゼ)のターゲット部位は当業者に周知である。多くのケースでは、DNAヌクレアーゼ(例えばEcoRI、HindIII、またはBamHI)は長さ4〜10塩基対のパリンドローム二本鎖DNAターゲット部位を認識し、ターゲット部位内の特異的な位置において2つのDNA鎖のそれぞれを切断する。いくつかのエンドヌクレアーゼは二本鎖核酸ターゲット部位を対称的に切断し、すなわち、両方の鎖を同じ位置で切断して、その結果、末端は塩基対形成したヌクレオチド(本明細書においては平滑末端ともまた言われる)を含む。他のエンドヌクレアーゼは二本鎖核酸ターゲット部位を非対称的に切断し、すなわち各鎖を異なる位置で切断して、その結果、末端は非対合ヌクレオチドを含む。二本鎖DNA分子の末端の非対合ヌクレオチドは「オーバーハング」(例えば、非対合ヌクレオチド(単数または複数)がそれぞれのDNA鎖の5’または3’末端を形成するかどうかに依存して「5’オーバーハング」または「3’オーバーハング」)ともまた言われる。非対合ヌクレオチド(単数または複数)で終わる二本鎖DNA分子の末端は粘着末端ともまた言われる。なぜなら、それらは、相補的な非対合ヌクレオチド(単数または複数)を含む他の二本鎖DNA分子末端に「粘着」し得るからである。ヌクレアーゼ蛋白質は、「結合ドメイン」(これは、核酸基質との蛋白質の相互作用を媒介し、いくつかのケースではターゲット部位に特異的に結合もまたする)と「切断ドメイン」(これは、核酸バックボーン中のホスホジエステル結合の切断を触媒する)とを典型的には含む。いくつかの態様において、ヌクレアーゼ蛋白質は単量体形態で核酸分子に結合して切断し得、一方、他の態様においては、ヌクレアーゼ蛋白質は、ターゲット核酸分子を切断するために二量体化または多量体化しなくてはならない。天然に存在するヌクレアーゼの結合ドメインおよび切断ドメイン、さらには、特異的なターゲット部位に結合するヌクレアーゼを生ずるために融合され得るモジュール的な結合ドメインおよび切断ドメインは当業者に周知である。例えば、ジンクフィンガーまたは転写活性化因子様エレメントが、望まれるターゲット部位に特異的に結合するための結合ドメインとして用いられ、切断ドメイン(例えば、FokIの切断ドメイン)に融合またはコンジュゲーションされて、ターゲット部位を切断する操作されたヌクレアーゼを生じ得る。

用語「核酸」および「核酸分子」は、本明細書において用いられる場合には、核酸塩基および酸部分を含む化合物、例えばヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーを言う。典型的には、ポリマー核酸、例えば3または4以上のヌクレオチドを含む核酸分子は直鎖状分子であり、その中で隣接したヌクレオチドはホスホジエステル結合によって互いにリンクされている。いくつかの態様において、「核酸」は個体の核酸残基(例えばヌクレオチドおよび/またはヌクレオシド)を言う。いくつかの態様において、「核酸」は、3つまたは4つ以上の個体のヌクレオチド残基を含むオリゴヌクレオチド鎖を言う。本明細書において用いられる場合には、用語「オリゴヌクレオチド」および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば、少なくとも3ヌクレオチドのストリング)を言うために交換可能に用いられ得る。いくつかの態様において、「核酸」は、RNA、さらには一本および/または二本鎖DNAを包摂する。核酸は、例えばゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、クロマチド、または他の天然に存在する核酸分子の文脈中で天然に存在し得る。他方では、核酸分子は天然に存在しない分子、例えば組み換えDNAもしくはRNA、人工染色体、操作されたゲノムもしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッドであり得、または天然に存在しないヌクレオチドもしくはヌクレオシドを包含し得る。なおその上に、用語「核酸」、「DNA」、「RNA」、および/または類似の用語は、核酸アナログ、すなわちホスホジエステルバックボーン以外を有するアナログを包含する。核酸は天然ソースから精製され得、組み換え発現システムを用いて産されて任意に精製され得、化学合成などされ得る。適切なところでは、例えば化学合成された分子のケースでは、核酸はヌクレオシドアナログ(例えば、化学的に改変された塩基または糖を有するアナログ)およびバックボーン改変を含み得る。核酸配列は、別様に示されない限り5’から3’方向に示される。いくつかの態様において、核酸は、天然ヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)、ヌクレオシドアナログ(例えば、2−アミノアデノシン、2−チオチミジン、イノシン、ピロロ−ピリミジン、3−メチルアデノシン、5−メチルシチジン、2−アミノアデノシン、C5−ブロモウリジン、C5−フルオロウリジン、C5−ヨードウリジン、C5−プロピニル−ウリジン、C5−プロピニル−シチジン、C5−メチルシチジン、2−アミノアデノシン、7−デアザアデノシン、7−デアザグアノシン、8−オキソアデノシン、8−オキソグアノシン、O(6)−メチルグアニン、および2−チオシチジン)、化学的に改変された塩基、生物学的に改変された塩基(例えば、メチル化された塩基)、インターカレーション塩基、改変された糖(例えば、2’−フルオロリボース、リボース、2’−デオキシリボース、アラビノース、およびヘキソース)、および/または改変されたリン酸基(例えば、ホスホロチオエートおよび5’−N−ホスホロアミダイト結合)であるか、またはそれを含む。

用語「医薬組成物」は、本明細書において用いられる場合には、疾患または障害の処置の文脈中で対象に投与され得る組成物を言う。いくつかの態様において、医薬組成物は有効成分(例えばヌクレアーゼまたはヌクレアーゼをコードする核酸)と薬学的に許容可能な賦形剤とを含む。

用語「増殖性疾患」は、本明細書において用いられる場合には、細胞または細胞集団が異常に高まった増殖率を見せるという点で、細胞または組織のホメオスタシスが乱されているいずれかの疾患を言う。増殖性疾患は前新生物性の過形成状態および新生物疾患などの増殖亢進性疾患を包含する。新生物疾患は細胞の異常な増殖を特徴とし、良性および悪性新生物を両方とも包含する。悪性新生物は癌ともまた言われる。

用語「蛋白質」、「ペプチド」、および「ポリペプチド」は本明細書において交換可能に用いられ、ペプチド(アミド)結合によって1つにリンクされたアミノ酸残基のポリマーを言う。用語は、いずれかのサイズ、構造、または機能の蛋白質、ペプチド、またはポリペプチドを言う。典型的には、蛋白質、ペプチド、またはポリペプチドは少なくとも3アミノ酸長であろう。蛋白質、ペプチド、またはポリペプチドは、個体の蛋白質または蛋白質の集まりを言い得る。蛋白質、ペプチド、またはポリペプチド中のアミノ酸の1つまたは2つ以上は、例えば化学的実体(例えば、コンジュゲーション、官能化、または他の改変のための炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、リンカーなど)の追加によって改変され得る。蛋白質、ペプチド、またはポリペプチドは単一の分子であり得るか、または多分子複合体であり得る。蛋白質、ペプチド、またはポリペプチドは、天然に存在する蛋白質またはペプチドの単に断片であり得る。蛋白質、ペプチド、またはポリペプチドは、天然に存在する、組み換え、もしくは合成、またはそのいずれかの組み合わせであり得る。蛋白質は異なるドメイン(例えば核酸結合ドメインおよび核酸切断ドメイン)を含み得る。いくつかの態様において、蛋白質は蛋白質性パーツ(例えば、核酸結合ドメインとなるアミノ酸配列)と有機化合物(例えば、核酸切断剤として作用し得る化合物)とを含む。いくつかの態様において、蛋白質は核酸(例えばRNA)と複合体であるか、または会合している。

用語「ランダム化された」は、核酸配列の文脈中で本明細書において用いられる場合には、自由なヌクレオチドの混合物(例えば、全ての4つのヌクレオチドA、T、G、およびCの混合物)を組み込むように合成された配列中の配列または残基を言う。ランダム化された残基は、ヌクレオチド配列中では文字Nによって典型的にはあらわされる。いくつかの態様において、ランダム化された配列または残基は完全にランダム化されており、このケースでは、ランダム化された残基は、それぞれの配列残基の合成ステップ中に、組み込まれるべきヌクレオチドの等量(例えば、25%T、25%A、25%G、および25%C)を追加することによって合成される。いくつかの態様において、ランダム化された配列または残基は部分的にランダム化されており、そのケースでは、ランダム化された残基は、それぞれの配列残基の合成ステップ中に、組み込まれるべきヌクレオチドの非等量(例えば、79%T、7%A、7%G、および7%C)を追加することによって合成される。部分的なランダム化は、所与の配列を鋳型とするが、組み込まれた変異を望まれる頻度で有する配列の生成を可能にする。例えば、既知のヌクレアーゼターゲット部位が合成鋳型として用いられる場合には、各ステップにおいて、それぞれの残基においてあらわされるヌクレオチドが79%で合成に追加され、他の3ヌクレオチドがそれぞれ7%で追加される部分的なランダム化は、部分的にランダム化されたターゲット部位の混合物が合成されることをもたらすであろう。これは、元々のターゲット部位のコンセンサス配列を尚あらわすが、そのように合成された各残基について21%の統計頻度(二項分布)で、各残基において元々のターゲット部位とは異なる。いくつかの態様において、部分的にランダム化された配列は、コンセンサス配列とは平均で5%よりも多く、10%よりも多く、15%よりも多く、20%よりも多く、25%よりも多く、または30%よりも多く異なる(二項分布)。いくつかの態様において、部分的にランダム化された配列は、コンセンサス部位とは平均で10%以下、15%以下、20%以下、25%以下、30%以下、40%以下、または50%以下異なる(二項分布)。

用語「RNAによってプログラム可能なヌクレアーゼ」および「RNAガイドヌクレアーゼ」は本明細書において交換可能に用いられ、切断のターゲットではない1つまたは2つ以上のRNAと複合体を形成する(例えば、結合または会合する)ヌクレアーゼを言う。いくつかの態様において、RNAによってプログラム可能なヌクレアーゼは、RNAとの複合体であるときに、ヌクレアーゼ:RNA複合体と言われ得る。典型的には、結合したRNA(単数または複数)はガイドRNA(gRNA)またはシングルガイドRNA(sgRNA)と言われる。gRNA/sgRNAは、ターゲット部位を相補するヌクレオチド配列を含み、これがそのターゲット部位へのヌクレアーゼ/RNA複合体の結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。いくつかの態様において、RNAによってプログラム可能なヌクレアーゼは(CRISPR関連システム)Cas9エンドヌクレアーゼ、例えばStreptococcus pyogenesからのCas9(Csn1)である(例えば、「Complete genome sequence of an M1 strain of Streptococcus pyogenes.」Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L. expand/collapse author list McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001)、「CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.」Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471 :602-607(2011)、および「A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.」Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)参照。その全体的な内容は参照によって本明細書に組み込まれる)。

RNAによってプログラム可能なヌクレアーゼ(例えばCas9)はRNA:DNAハイブリダイゼーションを用いてターゲットDNA切断部位を決定するので、それらの蛋白質は、原理的には、ガイドRNAによって規定されるいずれかの配列を切断する能力がある。(例えば、ゲノムを改変するための)部位特異的切断のためにCas9などのRNAによってプログラム可能なヌクレアーゼを用いる方法は、当分野において公知である(例えば、Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013)、Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013); Hwang, W.Y. et al. Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013)、Jinek, M. et al. RNA-programmed genome editing in human cells. eLife 2, e00471 (2013)、Dicarlo, J.E. et al. Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013)、Jiang, W. et al. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)参照。その全体的な内容は参照によって本明細書に組み込まれる)。

用語「小分子」および「有機化合物」は本明細書において交換可能に用いられ、天然に存在するかまたは(例えば化学合成によって)人工的に生じたかにかかわらず、比較的低い分子量を有する分子を言う。典型的には、有機化合物は炭素を含有する。有機化合物は複数の炭素−炭素結合、立体中心、および他の官能基(例えば、アミン、ヒドロキシル、カルボニル、またはヘテロ環式環)を含有し得る。いくつかの態様において、有機化合物は単量体であり、約1500g/molよりも少しの分子量を有する。ある態様において、小分子の分子量は約1000g/molよりも少しまたは約500g/molよりも少しである。ある態様において、小分子は薬物(例えば、適切な政府機関または取締団体によってヒトまたは動物への使用について安全で有効だと既に見なされた薬物)である。ある態様において、有機分子は、核酸に結合および/または核酸を切断することが公知である。いくつかの態様において、有機化合物はエンジインである。いくつかの態様において、有機化合物は抗生物質薬物、例えば抗癌抗生物質、例えばダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン、またはその誘導体である。

用語「対象」は、本明細書において用いられる場合には、個体の生物、例えば個体の哺乳動物を言う。いくつかの態様において、対象はヒトである。いくつかの態様において、対象は非ヒト哺乳動物である。いくつかの態様において、対象は非ヒト霊長類である。いくつかの態様において、対象はげっ歯類である。いくつかの態様において、対象はヒツジ、ヤギ、ウシ、ネコ、またはイヌである。いくつかの態様において、対象は脊椎動物、両生類、爬虫類、魚類、昆虫、ハエ、または線虫である。

用語「ターゲット核酸」および「ターゲットゲノム」は、ヌクレアーゼの文脈中で本明細書において用いられる場合には、それぞれ、所与のヌクレアーゼの少なくとも1つのターゲット部位を含む核酸分子またはゲノムを言う。

用語「ターゲット部位」は、本明細書においては用語「ヌクレアーゼターゲット部位」と交換可能に用いられ、ヌクレアーゼによって結合および切断される核酸分子内の配列を言う。ターゲット部位は一本鎖または二本鎖であり得る。二量体化するヌクレアーゼ(例えば、FokI DNA切断ドメインを含むヌクレアーゼ)の文脈中では、ターゲット部位は、左ハーフ部位(ヌクレアーゼの1つの単量体によって結合される)、右ハーフ部位(ヌクレアーゼの第2の単量体によって結合される)、および切断がなされるハーフ部位間のスペーサー配列を典型的には含む。この構造([左ハーフ部位]−[スペーサー配列]−[右ハーフ部位])は本明細書においてLSR構造と言われる。いくつかの態様において、左ハーフ部位および/または右ハーフ部位は10〜18ヌクレオチド長である。いくつかの態様において、いずれかまたは両方のハーフ部位はより短いかまたはより長い。いくつかの態様において、左および右ハーフ部位は異なる核酸配列を含む。ジンクフィンガーヌクレアーゼの文脈中では、ターゲット部位は、いくつかの態様において、それぞれ6〜18bp長である2つのハーフ部位を含み得、それらは4〜8bp長である規定されないスペーサー領域に隣接する。TALENの文脈中では、ターゲット部位は、いくつかの態様において、それぞれ10〜23bp長である2つのハーフ部位部位を含み得、それらは10〜30bp長である規定されないスペーサー領域に隣接する。RNAガイド(例えばRNAによってプログラム可能な)ヌクレアーゼの文脈中では、ターゲット部位は、RNAによってプログラム可能なヌクレアーゼのsgRNAに相補的であるヌクレオチド配列と、sgRNA相補配列に隣接した3’末端のプロトスペーサー隣接モチーフ(PAM)とを典型的には含む。RNAガイドヌクレアーゼCas9については、ターゲット部位は、いくつかの態様において、20塩基対+3塩基対PAM(例えばNNN。Nはいずれかのヌクレオチドをあらわす)であり得る。典型的には、PAMの最初のヌクレオチドはいずれかのヌクレオチドであり得、一方、2つの下流ヌクレオチドは具体的なRNAガイドヌクレアーゼに依存して規定される。Cas9などのRNAガイドヌクレアーゼにの例示的なターゲット部位は当業者に公知であり、限定無しにNNG、NGN、NAG、およびNGGを包含し、Nはいずれかのヌクレオチドをあらわす。加えて、異なる種(例えば、S.pyogenesの代わりにS.thermophilus)からのCas9ヌクレアーゼは、配列NGGNGを含むPAMを認識する。追加のPAM配列が公知であり、NNAGAAWおよびNAARを包含するが、これに限定されない(例えば、Esvelt and Wang, Molecular Systems Biology, 9:641 (2013)参照。その全体的な内容は参照によって本明細書に組み込まれる)。例えば、RNAガイドヌクレアーゼ(例えばCas9など)のターゲット部位は構造[NZ]−[PAM]を含み得、各Nは独立していずれかのヌクレオチドであり、Zは1〜50の整数である。いくつかの態様において、Zは少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、または少なくとも50である。いくつかの態様において、Zは5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48,49、または50である。いくつかの態様において、Zは20である。

用語「転写活性化因子様エフェクター」(TALE)は、本明細書において用いられる場合には、DNA結合ドメインを含む細菌蛋白質を言い、これは、高度に可変の2アミノ酸モチーフ(リピート可変二残基、RVD)を含む高度に保存された33〜34アミノ酸配列を含有する。RVDモチーフは核酸配列に対する結合特異性を決定し、当業者に周知の方法に従って操作されて、望まれるDNA配列に特異的に結合し得る(例えば、Miller, Jeffrey; et.al. (February 2011).「A TALE nuclease architecture for efficient genome editing」. Nature Biotechnology 29 (2): 143-8、Zhang, Feng; et.al. (February 2011).「Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription」. Nature Biotechnology 29 (2): 149-53、GeiBler, R.; Scholze, H.; Hahn, S.; Streubel, J.; Bonas, U.; Behrens, S. E.; Boch, J. (2011), Shiu, Shin-Han. ed. 「Transcriptional Activators of Human Genes with Programmable DNA-Specificity」. PLoS ONE 6 (5): el9509、Boch, Jens (February 2011). 「TALEs of genome targeting」. Nature Biotechnology 29 (2): 135-6、Boch, Jens; et.al. (December 2009).「Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors」. Science 326 (5959): 1509-12、およびMoscou, Matthew J.; Adam J. Bogdanove (December 2009). 「A Simple Cipher Governs DNA Recognition by TAL Effectors」. Science 326 (5959): 1501参照。そのそれぞれの全体的な内容は参照によって本明細書に組み込まれる)。アミノ酸配列とDNA認識との間の単純な関係は、適切なRVDを含有するリピートセグメントの組み合わせを選択することによって、特異的なDNA結合ドメインの操作を可能にした。

用語「転写活性化因子様エレメントヌクレアーゼ」(TALEN)は、本明細書において用いられる場合には、DNA切断ドメイン(例えばFokIドメイン)への転写活性化因子様エフェクターDNA結合ドメインを含む人工ヌクレアーゼを言う。操作されたTALEコンストラクトを生成させるためのいくつものモジュール的なアセンブリスキームが報告されている(例えば、Zhang, Feng; et.al. (February 2011).「Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription」. Nature Biotechnology 29 (2): 149-53、GeiBler, R.; Scholze, H.; Hahn, S.; Streubel, J.; Bonas, U.; Behrens, S. E.; Boch, J. (2011), Shiu, Shin-Han. ed.「Transcriptional Activators of Human Genes with Programmable DNA-Specificity」. PLoS ONE 6 (5): e19509、Cermak, T.; Doyle, E. L.; Christian, M.; Wang, L.; Zhang, Y.; Schmidt, C.; Baller, J. A.; Somia, N. V. et al. (2011). 「Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting」. Nucleic Acids Research、Morbitzer, R.; Elsaesser, J.; Hausner, J.; Lahaye, T. (2011).「Assembly of custom TALE-type DNA binding domains by modular cloning」. Nucleic Acids Research、Li, T.; Huang, S.; Zhao, X.; Wright, D. A.; Carpenter, S.; Spalding, M. H.; Weeks, D. P.; Yang, B. (2011).「Modularly assembled designer TAL effector nucleases for targeted gene knockout and gene replacement in eukaryotes」. Nucleic Acids Research.、Weber, E.; Gruetzner, R.; Werner, S.; Engler, C; Marillonnet, S. (2011)、Bendahmane, Mohammed, ed. 「Assembly of Designer TAL Effectors by Golden Gate Cloning」. PLoS ONE 6 (5): e19722参照。そのそれぞれの全体的な内容は参照によって本明細書に組み込まれる)。

用語「処置」、「処置する」、および「処置すること」は、本明細書に記載される疾患もしくは障害またはその1つもしくは2つ以上の症状を逆転する、緩和する、その開始を遅延させる、またはその進行を阻害することを狙った臨床的なインターベンションを言う。本明細書において用いられる場合には、用語「処置」、「処置する」、および「処置すること」は、本明細書に記載される疾患もしくは障害またはその1つもしくは2つ以上の症状を逆転する、緩和する、その開始を遅延させる、またはその進行を阻害することを狙った臨床的なインターベンションを言う。いくつかの態様において、処置は、1つまたは2つ以上の症状が発生した後および/または疾患が診断された後に投与され得る。他の態様において、処置は、例えば症状を予防するもしくはその開始を遅延させるまたは疾患の開始もしくは進行を阻害するために、症状の非存在下で投与され得る。例えば、処置は、症状の開始に先立って(例えば、症状の既往に照らしておよび/または遺伝子もしくは他の易罹患性因子に照らして)易罹患性個体に投与され得る。処置は、例えばそれらの再発を予防するかまたは遅延させるために、症状が消散した後にもまた継続され得る。

用語「ジンクフィンガー」は、本明細書において用いられる場合には、小さい核酸結合蛋白質構造モチーフを言い、フォールドおよびフォールドを安定化する1つまたは2つ以上の亜鉛イオンの配位を特徴とする。ジンクフィンガーは、多種多様な異なる蛋白質構造を包摂する(例えば、Klug A, Rhodes D (1987). 「Zinc fingers: a novel protein fold for nucleic acid recognition」. Cold Spring Harb. Symp. Quant. Biol. 52: 473-82参照。その全体的な内容は参照によって本明細書に組み込まれる)。ジンクフィンガーはヌクレオチドの特異的な配列に結合するように設計され得、一連のジンクフィンガーの融合体を含むジンクフィンガーアレイが実質的にいずれかの望まれるターゲット配列に結合するように設計され得る。かかるジンクフィンガーアレイは、蛋白質の(例えば、核酸切断ドメインにコンジュゲーションされた場合にはヌクレアーゼの)結合ドメインを形成し得る。ジンクフィンガーモチーフの異なる型は当業者に公知であり、Cys2His2、Gagナックル、Treble clef、ジンクリボン、Zn2/Cys6、およびTAZ2ドメイン様モチーフを包含するが、これに限定されない(例えばKrishna SS, Majumdar I, Grishin NV (January 2003).「Structural classification of zinc fingers: survey and summary」. Nucleic Acids Res. 31 (2): 532-50参照)。典型的には、単一のジンクフィンガーモチーフは核酸分子の3または4ヌクレオチドに結合する。従って、2つのジンクフィンガーモチーフを含むジンクフィンガードメインは6〜8ヌクレオチドに結合し得、3つのジンクフィンガーモチーフを含むジンクフィンガードメインは9〜12ヌクレオチドに結合し得、4つのジンクフィンガーモチーフを含むジンクフィンガードメインは12〜16ヌクレオチドに結合し得るなどである。いずれかの好適な蛋白質操作技術が使用されて、ジンクフィンガーのDNA結合特異性を改変および/または新規のジンクフィンガー融合体を設計し、長さ3〜30ヌクレオチドの実質的にいずれかの望まれるターゲット配列に結合し得る(例えば、Pabo CO, Peisach E, Grant RA (2001).「Design and selection of novel cys2His2 Zinc finger proteins」. Annual Review of Biochemistry 70: 313-340、Jamieson AC, Miller JC, Pabo CO (2003).「Drug discovery with engineered zinc-finger proteins」. Nature Reviews Drug Discovery 2 (5): 361-368、およびLiu Q, Segal DJ, Ghiara JB, Barbas CF (May 1997).「Design of polydactyl zinc-finger proteins for unique addressing within complex genomes」. Proc. Natl. Acad. Sci. U.S.A. 94 (11)参照。そのそれぞれの全体的な内容は参照によって本明細書に組み込まれる)。操作されたジンクフィンガーアレイと核酸を切断する蛋白質ドメインとの間の融合体が用いられて、「ジンクフィンガーヌクレアーゼ」を生成させ得る。ジンクフィンガーヌクレアーゼは、核酸分子内の特異的なターゲット部位に結合するジンクフィンガードメインと、結合ドメインによって結合されたターゲット部位内またはその近位で核酸分子を切断する核酸切断ドメインとを典型的には含む。典型的な操作されたジンクフィンガーヌクレアーゼは、3〜6つの個体のジンクフィンガーモチーフを有して長さ9塩基対〜18塩基対にわたるターゲット部位に結合する結合ドメインを含む。所与のゲノム中でユニークなターゲット部位に結合して切断することが望まれる状況では、より長いターゲット部位は特に魅力的である。

用語「ジンクフィンガーヌクレアーゼ」は、本明細書において用いられる場合には、ジンクフィンガーアレイを含む結合ドメインにコンジュゲーションされた核酸切断ドメインを含むヌクレアーゼを言う。いくつかの態様において、切断ドメインはII型制限エンドヌクレアーゼFokIの切断ドメインである。ジンクフィンガーヌクレアーゼは、切断のために所与の核酸分子中の実質的にいずれかの望まれる配列をターゲティングするように設計され得、複雑なゲノムの文脈中でユニークな部位に結合するようにジンクフィンガー結合ドメインを設計する可能性は、生細胞内の単一のゲノム部位のターゲティングされた切断を可能にし、例えば、治療上の価値があるターゲティングされたゲノム改変を達成する。望まれるゲノム遺伝子座に二本鎖切断をターゲティングすることは、非相同DNA修復経路の誤りがちな性質のため、遺伝子のコード配列中にフレームシフト変異を導入するために用いられ得る。ジンクフィンガーヌクレアーゼは、当業者に周知の方法によって目的の部位をターゲティングするように生成させられ得る。例えば、望まれる特異性を有するジンクフィンガー結合ドメインは、既知の特異性の個体のジンクフィンガーモチーフを組み合わせることによって設計され得る。DNAに結合したジンクフィンガー蛋白質Zif268の構造は、この分野における研究の相当部分に情報を与えた。64個の可能な塩基対トリプレットのそれぞれについてジンクフィンガーを得て、それからそれらのモジュール的なジンクフィンガーを混合およびマッチングし、いずれかの望まれる配列特異性を有する蛋白質を設計するという発想が記載されている(Pavletich NP, Pabo CO (May 1991).「Zinc finger-DNA recognition: crystal structure of a Zif268-DNA complex at 2.1 A」. Science 252 (5007): 809-17。その全体的な内容は本明細書に組み込まれる)。いくつかの態様において、それぞれ3塩基対DNA配列を認識する別々のジンクフィンガーが組み合わせられて、長さ9塩基対〜18塩基対にわたるターゲット部位を認識する3、4、5、または6フィンガーアレイを生成させる。いくつかの態様において、より長いアレイが考えられる。他の態様において、6〜8ヌクレオチドを認識する2フィンガーモジュールが組み合わせられて、4、6、または8ジンクフィンガーアレイを生成させる。いくつかの態様において、細菌またはファージディスプレイが使用されて、望まれる核酸配列(例えば、長さ3〜30bpの望まれるヌクレアーゼターゲット部位)を認識するジンクフィンガードメインを発生する。ジンクフィンガーヌクレアーゼは、いくつかの態様において、リンカー(例えばポリペプチドリンカー)によって互いに融合または別様にコンジュゲーションされたジンクフィンガー結合ドメインおよび切断ドメインを含む。リンカーの長さは、ジンクフィンガードメインによって結合された核酸配列からの切断の距離を決定する。より短いリンカーが用いられる場合には、切断ドメインは、結合された核酸配列により近い核酸を切断するであろう。一方、より長いリンカーは、結合および切断された核酸配列間のより大きい距離をもたらすであろう。いくつかの態様において、ジンクフィンガーヌクレアーゼの切断ドメインは、結合された核酸を切断するために二量体化しなくてはならない。いくつかのかかる態様において、二量体は2つの単量体のヘテロ二量体であり、それぞれは異なるジンクフィンガー結合ドメインを含む。例えば、いくつかの態様において、二量体は、FokI切断ドメインにコンジュゲーションされたジンクフィンガードメインAを含む1つの単量体と、FokI切断ドメインにコンジュゲーションされたジンクフィンガードメインBを含む1つの単量体とを含み得る。この限定しない例において、ジンクフィンガードメインAはターゲット部位の1つの側の核酸配列に結合し、ジンクフィンガードメインBはターゲット部位のもう一方の側の核酸配列に結合し、二量体化FokIドメインはジンクフィンガードメイン結合部位間で核酸を切断する。

本発明のある態様の詳細な記載 序論 部位特異的ヌクレアーゼは、インビトロまたはインビボのターゲティングされたゲノム改変に強力なツールである。いくつかの部位特異的ヌクレアーゼは、いずれかの他のゲノム部位に影響すること無しに、切断のためにゲノム中の単一のユニークな部位をターゲティングすることを可能にするであろうターゲット切断部位に対する特異性のレベルを理論上は達成し得る。生細胞内でのヌクレアーゼ切断がDNA修復機構を誘発し、これが、切断された修復されたゲノム配列の改変を(例えば相同組み換えによって)高頻度にもたらすということが報告されている。従って、ゲノム中の特異的なユニークな配列のターゲティングされた切断は、生細胞(従来の遺伝子ターゲティング法によって操作することが難しい細胞、例えば多くのヒト体性または胚性幹細胞を包含する)における遺伝子ターゲティングおよび遺伝子改変に新たな道を開く。疾患関連配列(例えば、HIV/AIDS患者のCCR−5アレル、または腫瘍の血管新生に必要な遺伝子)のヌクレアーゼによって媒介される改変は臨床的な文脈中で用いられ得、2つの部位特異的ヌクレアーゼが現在治験中である。

部位特異的ヌクレアーゼによって媒介される改変の分野における1つの重要な側面は、オフターゲットヌクレアーゼ効果(例えば、目指すターゲット配列とは1つまたは2つ以上のヌクレオチドが異なるゲノム配列の切断)である。オフターゲット切断の望まれない副作用は、遺伝子ターゲティングイベント中の不要な遺伝子座への挿入から臨床シナリオにおける重度の合併症までにわたる。対象に投与されたエンドヌクレアーゼによる、必須な遺伝子機能または腫瘍抑制遺伝子をコードする配列のオフターゲット切断は、対象の疾患または死亡さえももたらし得る。従って、その有効性および安全性を決定するために、研究室または病院でそれを用いる前にヌクレアーゼの切断選好性をキャラクタリゼーションすることが望ましい。さらに、ヌクレアーゼ切断特性のキャラクタリゼーションは、候補ヌクレアーゼの群からの具体的なタスクに最良に適したヌクレアーゼの選択、または複数個のヌクレアーゼから得られた進化法産物の選択を可能にする。ヌクレアーゼ切断特性のかかるキャラクタリゼーションは、向上した特性(例えば、向上した特異性または効率)を有するヌクレアーゼのデノボ設計にもまた情報を与え得る。

ヌクレアーゼが核酸のターゲティングされた操作に使用される多くのシナリオにおいて、切断特異性は重大な特徴である。いくつかの操作されたヌクレアーゼ結合ドメインの不完全な特異性は、インビトロおよびインビボ両方でオフターゲット切断および望まれない効果に至り得る。部位特異的ヌクレアーゼの特異性を評価する現在の方法(ELISAアッセイ、マイクロアレイ、ワンハイブリッドシステム、SELEX、およびそのバリアント、ならびにRosettaに基づくコンピュータ予測を包含する)は、全て、ヌクレアーゼの結合特異性がそれらの切断特異性と等価または比例的であるという仮定を前提としている。

ヌクレアーゼのオフターゲット結合効果の予測は、望まれない生物学的効果をもたらし得るヌクレアーゼのオフターゲット切断効果の不完全な近似になるということが以前に発見された(PCT出願WO2013/066438およびPattanayak, V., Ramirez, C.L., Joung, J.K. & Liu, D.R. Revealing off-target cleavage specificities of zinc-finger nucleases by in vitro selection. Nature methods 8, 765-770 (2011)参照。そのそれぞれの全体的な内容は参照によって本明細書に組み込まれる)。この知見は、いくつかの部位特異的DNAヌクレアーゼの報告された毒性は、オフターゲット結合単独ではなくオフターゲットDNA切断からもたらされるという見解と一致している。

本開示の方法および試薬は、いくつかの側面において、以前の方法に優る改善をあらわし、所与のヌクレアーゼのターゲット部位特異性の精密な評価を可能にし、好適なユニークなターゲット部位の選択と複雑なゲノムの文脈中の単一部位のターゲティングされた切断のための高度に特異的なヌクレアーゼの設計または選択とのための戦略を提供する。例えば、候補ターゲット部位を含む核酸分子のライブラリーをスクリーニングすることによってヌクレアーゼのターゲット部位特異性プロファイルを決定するためのいくつかの以前に報告された方法は「2回の切断」インビトロ選択法に依存しており、これは、ライブラリーメンバー核酸のヌクレアーゼの2つの隣接した切断からもたらされる2つのハーフ部位の配列からのターゲット部位の間接的な再構築を要求する(例えば、Pattanayak, V. et al., Nature Methods 8, 765-770 (2011)参照)。かかる「2回の切断」戦略とは対照的に、本開示の方法は「1回の切断」スクリーニング戦略を利用しており、これは、ヌクレアーゼによって少なくとも1回切断されたライブラリーメンバーの同定を可能にする。本明細書において提供される「1回の切断」選択戦略はシングルエンドハイスループットシーケンシング法に適合し、切断されたハーフ部位からの切断されたターゲット部位のコンピュータによる再構築を要求しない。なぜなら、いくつかの態様においては、切断されたライブラリーメンバー核酸中の無傷のターゲットヌクレアーゼ配列の直接的なシーケンシングを特徴とするからである。

加えて、本開示の「1回の切断」スクリーニング法は候補ヌクレアーゼターゲット部位と定常挿入領域とのコンカテマーを利用し、これは、2回の切断戦略に用いられる以前に報告されたコンストラクトよりも約10倍短い(約50bpのリピート配列長対以前の報告の約500bpのリピート配列長)。ライブラリーのコンカテマー中のリピート配列長のこの違いは、候補ヌクレアーゼターゲット部位の高度に複雑なライブラリーの(例えば、1012個の異なる候補ヌクレアーゼターゲット配列を含むライブラリーの)生成を可能にする。本明細書に記載される通り、かかる複雑性の例示的なライブラリーが、既知のターゲット部位の配列を変えることによって、既知のCas9ヌクレアーゼターゲット部位を鋳型として生成した。例示的なライブラリーは、既知のターゲット部位の8つまたは7つ以下の変異を有する全ての配列の10倍よりも大きいカバレッジが、本明細書において提供される戦略を用いて達成され得るということを証明した。より短いリピート配列の使用は、シングルエンドシーケンシングの使用をもまた可能にする。なぜなら、同じライブラリーメンバーの切断されたハーフ部位および隣接した未切断の部位は両方とも100ヌクレオチドのシーケンシングリード内に含有されるからである。

本明細書において提供される戦略、方法、ライブラリー、および試薬は、いずれかの部位特異的ヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、およびエンジイン抗生物質(例えば、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン))の配列選好性および特異性を分析するために利用され得る。本明細書に記載されるものに加えて、好適なヌクレアーゼは本開示に基づいて当業者には明らかであろう。

さらに、本明細書において提供される方法、試薬、および戦略は、当業者が、向上した特異性を有するヌクレアーゼを同定、設計、および/または選択し、いずれかの所与のヌクレアーゼ(例えば、ZFNなどの部位特異的ヌクレアーゼ、および粘着末端を有する切断産物を産するTALEN、さらにはRNAによってプログラム可能なヌクレアーゼ、例えばCas9。これは平滑末端を有する切断産物を産する)のオフターゲット効果を最小化することを可能にする。DNAおよびDNA切断ヌクレアーゼに特に関係する一方で、本明細書において提供される本発明発想、方法、戦略、および試薬は、この点に関して限定されず、いずれかの核酸:ヌクレアーゼペアに適用され得る。

部位特異的ヌクレアーゼによって切断されるヌクレアーゼターゲット部位の同定 本開示のいくつかの側面は、いずれかの部位特異的ヌクレアーゼによって切断される核酸ターゲット部位を決定するための改善された方法および試薬を提供する。本明細書において提供される方法は、平滑末端を生ずるヌクレアーゼおよび粘着末端を生ずるヌクレアーゼ両方のターゲット部位選好性および特異性の評価のために用いられ得る。一般的に、かかる方法は、ヌクレアーゼがターゲット部位に結合して切断するのに好適な条件下でターゲット部位のライブラリーと所与のヌクレアーゼを接触させることと、どのターゲット部位をヌクレアーゼが実際に切断するのかを決定することとを含む。実際の切断に基づくヌクレアーゼのターゲット部位プロファイルの決定は、部位特異的ヌクレアーゼの望まれないオフターゲット効果を媒介することにより関係するパラメータを測定するという点において、結合に依存する方法に優る利点を有する。一般的に、本明細書において提供される方法は、5’リン酸依存的なライゲーションによって、目的のヌクレアーゼによって切断された核酸分子に既知の配列のアダプターをライゲーションすることを含む。従って、本明細書において提供される方法は、それらのターゲット部位を切断するときに切断された核酸鎖の5’末端にリン酸部分を残すヌクレアーゼによって切断されるターゲット部位を同定することに、特に有用である。切断された核酸鎖の5’末端にアダプターをライゲーション後に、切断された鎖は、シーケンシングリンカーとしてアダプターを用いて直接的にシーケンシングされ得る。または、切断されたターゲット部位と同一の無傷のターゲット部位を含む切断されたライブラリーメンバーコンカテマーの一部がPCRによって増幅され得、増幅産物はそれからシーケンシングされ得る。

いくつかの態様において、方法は、(a)二本鎖核酸ターゲット部位を切断するヌクレアーゼを提供し、ターゲット部位の切断が、5’リン酸部分を含む切断された核酸鎖をもたらすこと、(b)ヌクレアーゼのターゲット部位を含む候補核酸分子をヌクレアーゼが切断するのに好適な条件下で、候補核酸分子のライブラリーと(a)のヌクレアーゼを接触させ、各核酸分子が、候補ヌクレアーゼターゲット部位と定常挿入配列とを含む配列のコンカテマーを含むこと、および(c)ステップ(b)においてヌクレアーゼによって切断された核酸鎖上の未切断のヌクレアーゼターゲット部位の配列を決定することによって、(b)においてヌクレアーゼによって切断されるヌクレアーゼターゲット部位を同定することを含む。

いくつかの態様において、方法は、ヌクレアーゼを提供することと、候補ターゲット部位を含む候補核酸分子のライブラリーとヌクレアーゼを接触させることとを含む。いくつかの態様において、候補核酸分子は二本鎖核酸分子である。いくつかの態様において、候補核酸分子はDNA分子である。いくつかの態様において、ライブラリー中の各核酸分子は、候補ヌクレアーゼターゲット部位と定常挿入配列とを含む配列のコンカテマーを含む。例えば、いくつかの態様において、ライブラリーは、構造R1−[(候補ヌクレアーゼターゲット部位)−(定常挿入配列)]n−R2を含む核酸分子を含み、R1およびR2は、独立して、[(候補ヌクレアーゼターゲット部位)−(定常挿入配列)]構造の断片を含み得る核酸配列であり、nは2〜yの整数である。いくつかの態様において、yは少なくとも101、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、少なくとも1012、少なくとも1013、少なくとも1014、または少なくとも1015である。いくつかの態様において、yは102よりも少し、103よりも少し、104よりも少し、105よりも少し、106よりも少し、107よりも少し、108よりも少し、109よりも少し、1010よりも少し、1011よりも少し、1012よりも少し、1013よりも少し、1014よりも少し、または1015よりも少しである。

例えば、いくつかの態様において、ライブラリーの候補核酸分子は構造[(NZ)−(PAM)]の候補ヌクレアーゼターゲット部位を含み、それゆえに、ライブラリーの核酸分子は構造R1−[(NZ)−(PAM)−(定常領域)]X−R2を含み、R1およびR2は、独立して、[(NZ)−(PAM)−(定常領域)]リピート単位の断片を含み得る核酸配列であり、各Nは独立していずれかのヌクレオチドをあらわし、Zは1〜50の整数であり、Xは2〜yの整数である。いくつかの態様において、yは少なくとも101、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、少なくとも1012、少なくとも1013、少なくとも1014、または少なくとも1015である。いくつかの態様において、yは102よりも少し、103よりも少し、104よりも少し、105よりも少し、106よりも少し、107よりも少し、108よりも少し、109よりも少し、1010よりも少し、1011よりも少し、1012よりも少し、1013よりも少し、1014よりも少し、または1015よりも少しである。いくつかの態様において、Zは少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、または少なくとも50である。いくつかの態様において、Zは20である。各Nは独立していずれかのヌクレオチドをあらわす。従って、Z=2を有するNZとして提供される配列はNNであり、各Nは独立してA、T、G、またはCをあらわすであろう。従って、Z=2を有するNZはAA、AT、AG、AC、TA、TT、TG、TC、GA、GT、GG、GC、CA、CT、CG、およびCCをあらわし得る。

他の態様において、ライブラリーの候補核酸分子は構造[左ハーフ部位]−[スペーサー配列]−[右ハーフ部位](「LSR」)の候補ヌクレアーゼターゲット部位を含み、それゆえに、ライブラリーの核酸分子は構造R1−[(LSR)−(定常領域)]X−R2を含み、R1およびR2は、独立して、[(LSR)−(定常領域)]リピート単位の断片を含み得る核酸配列であり、Xは2〜yの整数である。いくつかの態様において、yは少なくとも101、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、少なくとも1012、少なくとも1013、少なくとも1014、または少なくとも1015である。いくつかの態様において、yは102よりも少し、103よりも少し、104よりも少し、105よりも少し、106よりも少し、107よりも少し、108よりも少し、109よりも少し、1010よりも少し、1011よりも少し、1012よりも少し、1013よりも少し、1014よりも少し、または1015よりも少しである。定常領域は、いくつかの態様において、単一のリピート単位の効率的なセルフライゲーションを可能にする長さである。好適な長さは当業者には明らかであろう。例えば、いくつかの態様において、定常領域は5〜100塩基対長、例えば、約5塩基対、約10塩基対、約15塩基対、約20塩基対、約25塩基対、約30塩基対、約35塩基対、約40塩基対、約50塩基対、約60塩基対、約70塩基対、約80塩基対、約90塩基対、または約100塩基対長である。いくつかの態様において、定常領域は16塩基対長である。いくつかの態様において、ヌクレアーゼは二本鎖核酸ターゲット部位を切断し、平滑末端を生ずる。他の態様において、ヌクレアーゼは5’オーバーハングを生ずる。いくつかのかかる態様において、ターゲット部位は[左ハーフ部位]−[スペーサー配列]−[右ハーフ部位](LSR)構造を含み、ヌクレアーゼはターゲット部位をスペーサー配列内で切断する。

いくつかの態様において、ヌクレアーゼは二本鎖ターゲット部位を切断し、平滑末端を生ずる。いくつかの態様において、ヌクレアーゼは二本鎖ターゲット部位を切断し、オーバーハングまたは粘着末端(例えば5’オーバーハング)を生ずる。いくつかのかかる態様において、方法は、ヌクレアーゼによって1回切断された核酸分子から産した核酸分子の5’オーバーハングを埋めることを含み、核酸分子は、1つの側の左または右ハーフ部位および切断されたスペーサー配列と、もう一方の側の未切断のターゲット部位配列とによって隣接された定常挿入配列を含み、それによって平滑末端を生ずる。

いくつかの態様において、ステップ(c)の決定することは、5’リン酸依存的なライゲーションによって、ステップ(b)においてヌクレアーゼによって切断された核酸鎖の5’末端に最初の核酸アダプターをライゲーションすることを含む。いくつかの態様において、ヌクレアーゼは平滑末端を生ずる。かかる態様において、アダプターは、5’リン酸化を欠く二本鎖の平滑末端のアダプターと切断されたライブラリーメンバーを接触させることによって、ターゲット部位のヌクレアーゼ切断からもたらされた平滑末端に直接的にライゲーションされ得る。いくつかの態様において、ヌクレアーゼはオーバーハング(粘着末端)を生ずる。いくつかのかかる態様において、アダプターは、適合する粘着末端を有するアダプターの過剰と切断されたライブラリーメンバーを接触させることによって、切断された部位にライゲーションされ得る。可変ハーフ部位間の定常スペーサー配列内で切断するヌクレアーゼが用いられる場合には、粘着末端が、スペーサー配列から生じた5’オーバーハングにマッチするように設計され得る。ヌクレアーゼが可変配列内で切断する態様において、可変オーバーハング配列と定常のアニーリングした配列とを有するアダプターの集団(シーケンシングリンカーまたはPCRプライマーとしての使用のため)が用いられ得、または、5’オーバーハングが埋められてアダプターライゲーション前に平滑末端を形成し得る。

いくつかの態様において、ステップ(c)の決定することは、アダプターにハイブリダイゼーションするPCRプライマーと定常挿入配列にハイブリダイゼーションするPCRプライマーとを用いるPCRによって、未切断のターゲット部位を含むヌクレアーゼによって切断されたコンカテマーの断片を増幅することをさらに含む。典型的には、PCRによるコンカテマーの増幅は、切断されたターゲット部位と同一の少なくとも1つの無傷の候補ターゲット部位を含むアンプリコンを生むであろう。なぜなら、各コンカテマー中のターゲット部位は同一であるからである。単一方向のシーケンシングのためには、1つの無傷のターゲット部位、2つ以下の無傷のターゲット部位、3つ以下の無傷のターゲット部位、4つ以下の無傷のターゲット部位、または5つ以下の無傷のターゲット部位を含むアンプリコンの濃縮が望ましくあり得る。PCRが切断された核酸分子の増幅に用いられる態様において、PCRパラメータは、短い配列の増幅を好み、より長い配列の増幅を好まないように最適化され得、例えば短い伸長時間をPCRサイクルに用いることによる。短いアンプリコンの濃縮のための別の可能性はサイズ分画であり、例えばゲル電気泳動またはサイズ排除クロマトグラフィーによる。サイズ分画は増幅の前および/または後に行われ得る。短いアンプリコンの濃縮のための他の好適な方法は当業者には明らかであろう。本開示はこの点に関して限定されない。

いくつかの態様において、ステップ(c)の決定することは、ステップ(b)においてヌクレアーゼによって切断された核酸鎖または増幅によって(例えばPCRによって)得られたそのコピーをシーケンシングすることを含む。シーケンシング法は当業者に周知である。本開示はこの点に関して限定されない。

いくつかの態様において、本発明システムを用いてプロファイリングされようとするヌクレアーゼは、RNAによってプログラム可能なヌクレアーゼであり、これはRNA分子との複合体を形成し、ヌクレアーゼ:RNA複合体は、RNA分子の配列に相補的な核酸配列に特異的に結合する。いくつかの態様において、RNA分子はシングルガイドRNA(sgRNA)である。いくつかの態様において、sgRNAは5〜50ヌクレオチド、10〜30ヌクレオチド、15〜25ヌクレオチド、18〜22ヌクレオチド、19〜21ヌクレオチド、例えば10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む。いくつかの態様において、sgRNAは、ヌクレアーゼターゲット部位の配列に相補的である5〜50ヌクレオチド、10〜30ヌクレオチド、15〜25ヌクレオチド、18〜22ヌクレオチド、19〜21ヌクレオチド、例えば10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む。いくつかの態様において、sgRNAは、ヌクレアーゼターゲット部位に相補的である20ヌクレオチドを含む。いくつかの態様において、ヌクレアーゼはCas9ヌクレアーゼである。いくつかの態様において、ヌクレアーゼターゲット部位は[sgRNA相補配列]−[プロトスペーサー隣接モチーフ(PAM)]構造を含み、ヌクレアーゼはターゲット部位をsgRNA相補配列内で切断する。いくつかの態様において、sgRNA相補配列は5〜50ヌクレオチド、10〜30ヌクレオチド、15〜25ヌクレオチド、18〜22ヌクレオチド、19〜21ヌクレオチド、例えば10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む。

いくつかの態様において、RNAによってプログラム可能なヌクレアーゼはCas9ヌクレアーゼである。RNAによってプログラム可能なCas9エンドヌクレアーゼは、2塩基対PAMモチーフに隣接しかつガイドRNA配列(sgRNA)に相補的な部位において二本鎖DNA(dsDNA)を切断する。典型的には、ターゲット部位配列に相補的であるsgRNA配列は約20ヌクレオチド長であるが、より短いおよびより長い相補的なsgRNA配列が同じく用いられ得る。例えば、いくつかの態様において、sgRNAは5〜50ヌクレオチド、10〜30ヌクレオチド、15〜25ヌクレオチド、18〜22ヌクレオチド、19〜21ヌクレオチド、例えば10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドを含む。Cas9システムは複数の細胞型のゲノムを改変するために用いられて来ており、手軽なゲノム操作ツールとしてのそのポテンシャルを証明している。

いくつかの態様において、ヌクレアーゼは非特異的核酸切断ドメインを含む。いくつかの態様において、ヌクレアーゼはFokI切断ドメインを含む。いくつかの態様において、ヌクレアーゼは、切断ドメイン二量体化時にターゲット配列を切断する核酸切断ドメインを含む。いくつかの態様において、ヌクレアーゼは、核酸配列に特異的に結合する結合ドメインを含む。いくつかの態様において、結合ドメインはジンクフィンガーを含む。いくつかの態様において、結合ドメインは、少なくとも2、少なくとも3、少なくとも4、または少なくとも5つのジンクフィンガーを含む。いくつかの態様において、ヌクレアーゼはジンクフィンガーヌクレアーゼである。いくつかの態様において、結合ドメインは転写活性化因子様エレメントを含む。いくつかの態様において、ヌクレアーゼは転写活性化因子様エレメントヌクレアーゼ(TALEN)である。いくつかの態様において、ヌクレアーゼはホーミングエンドヌクレアーゼである。いくつかの態様において、ヌクレアーゼは有機化合物である。いくつかの態様において、ヌクレアーゼはエンジイン官能基を含む。いくつかの態様において、ヌクレアーゼは抗生物質である。いくつかの態様において、化合物はダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン、またはその誘導体である。

ライブラリー核酸と一緒のヌクレアーゼのインキュベーションは、ヌクレアーゼによって結合および切断され得るターゲット部位を含むライブラリー中のコンカテマーの切断をもたらすであろう。所与のヌクレアーゼが特異的なターゲット部位を高い効率で切断する場合には、ターゲット部位を含むコンカテマーは例えば1回または複数回切断されて、1つまたは2つ以上のリピート単位に隣接した切断されたターゲット部位を含む断片の生成をもたらすであろう。ライブラリーメンバーの構造に依存して、単一のヌクレアーゼ切断によってライブラリーメンバーコンカテマーから遊離する例示的な切断された核酸分子は例えば構造(切断されたターゲット部位)−(定常領域)−[(ターゲット部位)−(定常領域)]X−R2であり得る。例えば、RNAガイドヌクレアーゼの文脈中では、単一のヌクレアーゼ切断によってライブラリーメンバーコンカテマーから遊離する例示的な切断された核酸分子は例えば構造(PAM)−(定常領域)−[(NZ)−(PAM)−(定常領域)]X−R2であり得る。LSR構造をスペーサー領域内で切断するヌクレアーゼの文脈中では、単一のヌクレアーゼ切断によってライブラリーメンバーコンカテマーから遊離する例示的な切断された核酸分子は例えば構造(切断されたスペーサー領域)−(右ハーフ部位)−(定常領域)−[(LSR)−(定常領域)]X−R2であり得る。ライブラリー候補分子から遊離するかかる切断断片はそれから単離され得、および/またはヌクレアーゼによって切断されたターゲット部位の配列が、無傷のターゲット部位をシーケンシングすることによって同定され得る(例えば、遊離したリピート単位の無傷の(NZ)−(PAM)部位。例示については例えば図1B参照。

核酸分子のライブラリーの暴露のための好適な条件は、当業者には明らかであろう。いくつかの態様において、好適な条件はライブラリー核酸またはヌクレアーゼの変性をもたらさず、ヌクレアーゼがそのヌクレアーゼ活性の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも98%を見せることを可能にする。

加えて、所与のヌクレアーゼが特異的なターゲット部位を切断する場合には、いくつかの切断産物は、切断されたハーフ部位および無傷のまたは未切断のターゲット部位を含むであろう。本明細書に記載される通り、かかる産物は慣例の方法によって単離され得、挿入配列はいくつかの側面において100塩基対よりも少しであるので、かかる単離された切断産物は単一のリードスルーでシーケンシングされ得、例えば切断されたハーフ部位から配列を再構築すること無しにターゲット部位配列の同定を可能にする。

リピート単位の単離およびシーケンシングに好適ないずれかの方法が使用されて、ヌクレアーゼによって切断されたLSR配列を解明し得る。例えば、定常領域の長さは既知であるので、個体の遊離したリピート単位は、それらのサイズに基づいて、より大きい未切断のライブラリー核酸分子から、さらには複数のリピート単位を含むライブラリー核酸分子の断片(ヌクレアーゼによる非効率的なターゲティングされた切断を示している)から分離され得る。それらのサイズに基づいて核酸分子を分離および/または単離するための好適な方法は当業者に周知であり、例えばサイズ分画法(例えばゲル電気泳動、密度勾配遠心分離、および好適な分子カットオフ値を有する半透膜による透析)を包含する。分離/単離された核酸分子は、例えば、PCRおよび/またはシーケンシングアダプターを切断された末端にライゲーションすることと、それぞれの核酸を増幅および/またはシーケンシングすることとによって、それからさらにキャラクタリゼーションされ得る。さらに、定常領域の長さが、個体の遊離したリピート単位のセルフライゲーションを好むように選択される場合には、かかる個体の遊離したリピート単位は、リガーゼとヌクレアーゼによって処置されたライブラリー分子を接触させることと、セルフライゲーションした個体のリピート単位の環状化した性質に基づくその後の増幅および/またはシーケンシングとによって濃縮され得る。

いくつかの態様において、ターゲット核酸を切断する結果として5’オーバーハングを生成させるヌクレアーゼが用いられ、切断された核酸分子の5’オーバーハングは埋められる。5’オーバーハングを埋めるための方法は当業者に周知であり、例えば、エキソヌクレアーゼ活性を欠くDNAポリメラーゼIクレノウ断片(クレノウ(3’−>5’エキソ−))を用いる方法を包含する。5’オーバーハングを埋めることは、陥没鎖のオーバーハングを鋳型とする伸長をもたらし、これは翻って平滑末端をもたらす。ライブラリーコンカテマーから遊離した単一のリピート単位のケースでは、もたらされる構造は平滑末端のS2’R−(定常領域)−LS1’であり、S1’およびS2’は平滑末端を含む。PCRおよび/またはシーケンシングアダプターがそれから平滑末端ライゲーションによって末端に追加され得、それぞれのリピート単位(S2’RおよびLS1’領域を包含する)はシーケンシングされ得る。配列データから、元々のLSR領域が演繹され得る。ヌクレアーゼ切断プロセス中に生じたオーバーハングの平滑化は、それぞれのヌクレアーゼによって妥当に切断されたターゲット部位と例えば物理的剪断などの非ヌクレアーゼ効果に基づいて非特異的に切断されたターゲット部位とを見分けることも可能にする。正しく切断されたヌクレアーゼターゲット部位は相補的なS2’RおよびLS1’領域の存在によって認識され得、これはオーバーハングを埋めることの結果としてオーバーハングヌクレオチドの複製を含み、一方、それぞれのヌクレアーゼによって切断されなかったターゲット部位はオーバーハングヌクレオチドの複製を含みそうにない。いくつかの態様において、方法は、遊離した個体のリピート単位の左ハーフ部位、右ハーフ部位、および/またはスペーサー配列の配列を決定することによって、ヌクレアーゼによって切断されたヌクレアーゼターゲット部位を同定することを含む。増幅および/またはシーケンシングするためのいずれかの好適な方法が用いられて、それぞれのヌクレアーゼによって切断されるターゲット部位のLSR配列を同定し得る。核酸を増幅および/またはシーケンシングするための方法は当業者に周知であり、本開示はこの点に関して限定されない。切断されたハーフ部位および未切断のターゲット部位を含む(例えば、少なくとも約1.5個のリピート配列を含む)ライブラリーコンカテマーから遊離した核酸のケースでは、5’オーバーハングを埋めることは、核酸がヌクレアーゼによって切断されたという保証をもまた提供する。核酸は無傷のまたは未切断のターゲット部位をもまた含むので、その部位の配列は、左ハーフ部位、右ハーフ部位、および/またはスペーサー配列から配列を再構築しなければならないこと無しに決定され得る。

本明細書において提供される方法および戦略のいくつかは、いずれかの所与のヌクレアーゼについて、可能な切断ターゲットとしての複数個の候補ターゲット部位の同時的な評価を可能にする。従って、かかる方法から得られるデータは、所与のヌクレアーゼによって切断されるターゲット部位のリストを作成するために用いられ得、これは本明細書においてターゲット部位プロファイルともまた言われる。定量的なシーケンシングデータの生成を可能にするシーケンシング法が用いられる場合には、それぞれのヌクレアーゼによって切断されるのを検出されるいずれかのヌクレアーゼターゲット部位の相対的な存在比を記録することもまた可能である。ヌクレアーゼによってより効率的に切断されるターゲット部位は、シーケンシングステップにおいてより高頻度に検出されるであろう。一方、効率的に切断されないターゲット部位は候補コンカテマーから個体のリピート単位を稀にのみ遊離させ、それゆえにせいぜい僅かのシーケンシングリードを生成させるのみであろう。かかる定量的なシーケンシングデータはターゲット部位プロファイルに統合されて、高度に選好およびより少なく選好されるヌクレアーゼターゲット部位のランキングリストを生成させ得る。

本明細書において提供されるヌクレアーゼターゲット部位プロファイリングの方法および戦略は、いずれかの部位特異的ヌクレアーゼに適用され得、例えばZFN、TALEN、ホーミングエンドヌクレアーゼ、およびRNAによってプログラム可能なヌクレアーゼ、例えばCas9ヌクレアーゼを包含する。本明細書においてより詳細に記載される通り、ヌクレアーゼ特異性は、増大するヌクレアーゼ濃度によって典型的には減少し、本明細書に記載される方法が用いられて、所与のヌクレアーゼがその目指すターゲット部位を効率的に切断するが、いずれかのオフターゲット配列を効率的に切断しない濃度を決定し得る。いくつかの態様において、治療用ヌクレアーゼの最大濃度が決定され、それにおいては治療用ヌクレアーゼがその目指すヌクレアーゼターゲット部位を切断するが、10よりも多く、5よりも多く、4よりも多く、3よりも多く、2よりも多く、1よりも多く、またはいずれの追加の部位も切断しない。いくつかの態様において、治療用ヌクレアーゼは、上に記載される通り決定された最大濃度よりも低いかまたは等しい終濃度を生成させるのに有効な量で対象に投与される。

いくつかの態様において、本明細書において提供される方法に用いられる候補核酸分子のライブラリーは、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、または少なくとも1012個の異なる候補ヌクレアーゼターゲット部位を含む。

いくつかの態様において、ヌクレアーゼは、疾患と関連した遺伝子内の特異的なヌクレアーゼターゲット部位を切断する治療用ヌクレアーゼである。いくつかの態様において、方法は、治療用ヌクレアーゼが特異的なヌクレアーゼターゲット部位を切断し、かつ10よりも多くの追加のヌクレアーゼターゲット部位を切断せず、5よりも多くの追加のヌクレアーゼターゲット部位を切断せず、4よりも多くの追加のヌクレアーゼターゲット部位を切断せず、3よりも多くの追加のヌクレアーゼターゲット部位を切断せず、2よりも多くの追加のヌクレアーゼターゲット部位を切断せず、1よりも多くの追加のヌクレアーゼターゲット部位を切断せず、または全く追加の部位を切断しない治療用ヌクレアーゼの最大濃度を決定することをさらに含む。いくつかの態様において、方法は、最大濃度よりも低いかまたは等しい終濃度を生成させるのに有効な量で対象に治療用ヌクレアーゼを投与することをさらに含む。

ヌクレアーゼターゲット部位ライブラリー 本開示のいくつかの態様は、ヌクレアーゼターゲット部位プロファイリングのための核酸分子のライブラリーを提供する。いくつかの態様において、ライブラリーの候補核酸分子は構造R1−[(NZ)−(PAM)−(定常領域)]X−R2を含み、R1およびR2は、独立して、[(NZ)−(PAM)−(定常領域)]リピート単位の断片を含み得る核酸配列であり、各Nは独立していずれかのヌクレオチドをあらわし、Zは1〜50の整数であり、Xは2〜yの整数である。いくつかの態様において、yは少なくとも101、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、少なくとも1012、少なくとも1013、少なくとも1014、または少なくとも1015である。いくつかの態様において、yは102よりも少し、103よりも少し、104よりも少し、105よりも少し、106よりも少し、107よりも少し、108よりも少し、109よりも少し、1010よりも少し、1011よりも少し、1012よりも少し、1013よりも少し、1014よりも少し、または1015よりも少しである。いくつかの態様において、Zは少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、または少なくとも50である。いくつかの態様において、Zは20である。各Nは独立していずれかのヌクレオチドをあらわす。従って、Z=2を有するNZとして提供される配列はNNであり、各Nは独立してA、T、G、またはCをあらわすであろう。従って、Z=2を有するNZはAA、AT、AG、AC、TA、TT、TG、TC、GA、GT、GG、GC、CA、CT、CG、およびCCをあらわし得る。

いくつかの態様において、ライブラリーが提供され、部分的にランダム化された左ハーフ部位、部分的にランダム化された右ハーフ部位、および/または部分的にランダム化されたスペーサー配列を有するターゲット部位を含む候補核酸分子を含む。いくつかの態様において、ライブラリーが提供され、部分的にランダム化された左ハーフ部位、完全にランダム化されたスペーサー配列、および部分的にランダム化された右ハーフ部位を有するターゲット部位を含む候補核酸分子を含む。いくつかの態様において、ライブラリーが提供され、部分的にまたは完全にランダム化された配列を有するターゲット部位を含む候補核酸分子を含み、ターゲット部位は、例えば本明細書に記載される構造[NZ−(PAM)]を含む。いくつかの態様において、部分的にランダム化された部位は、コンセンサス部位とは平均で5%よりも多く、10%よりも多く、15%よりも多く、20%よりも多く、25%よりも多く、または30%よりも多く異なる(二項分布)。

いくつかの態様において、かかるライブラリーは複数個の核酸分子を含み、それぞれは候補ヌクレアーゼターゲット部位と定常挿入配列(本明細書においては定常領域ともまた言われる)とのコンカテマーを含む。例えば、いくつかの態様において、ライブラリーの候補核酸分子は構造R1−[(sgRNA相補配列)−(PAM)−(定常領域)]X−R2、または構造R1−[(LSR)−(定常領域)]X−R2を含み、鉤括弧内の構造(「[...]」)はリピート単位またはリピート配列と言われ、R1およびR2は、独立して、リピート単位の断片を含み得る核酸配列であり、Xは2〜yの整数である。いくつかの態様において、yは少なくとも101、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、少なくとも1012、少なくとも1013、少なくとも1014、または少なくとも1015である。いくつかの態様において、yは102よりも少し、103よりも少し、104よりも少し、105よりも少し、106よりも少し、107よりも少し、108よりも少し、109よりも少し、1010よりも少し、1011よりも少し、1012よりも少し、1013よりも少し、1014よりも少し、または1015よりも少しである。定常領域は、いくつかの態様において、単一のリピート単位の効率的なセルフライゲーションを可能にする長さである。いくつかの態様において、定常領域は、2つまたは3つ以上のリピート単位を含む断片からの単一のリピート単位の効率的な分離を可能にする長さである。いくつかの態様において、定常領域は、1つのシーケンシングリード中の完全なリピート単位の効率的なシーケンシングを可能にする長さである。好適な長さは当業者には明らかであろう。例えば、いくつかの態様において、定常領域は5〜100塩基対長、例えば、約5塩基対、約10塩基対、約15塩基対、約20塩基対、約25塩基対、約30塩基対、約35塩基対、約40塩基対、約50塩基対、約60塩基対、約70塩基対、約80塩基対、約90塩基対、または約100塩基対長である。いくつかの態様において、定常領域は1、2、3、4、5、6、7、8、9、0、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、または80塩基対長である。

LSR部位は典型的には[左ハーフ部位]−[スペーサー配列]−[右ハーフ部位]構造を含む。ハーフサイズ(half-size)およびスペーサー配列の長さは、評価されるべき具体的なヌクレアーゼに依存するであろう。一般的に、ハーフ部位は6〜30ヌクレオチド長、好ましくは10〜18ヌクレオチド長であろう。例えば、各ハーフ部位は、個体的に6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド長であり得る。いくつかの態様において、LSR部位は30ヌクレオチドよりも長くあり得る。いくつかの態様において、LSRの左ハーフ部位および右ハーフ部位は同じ長さである。いくつかの態様において、LSRの左ハーフ部位および右ハーフ部位は異なる長さである。いくつかの態様において、LSRの左ハーフ部位および右ハーフ部位は異なる配列である。いくつかの態様において、ライブラリーが提供され、FokI切断ドメイン、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、または有機化合物(例えば、エンジイン抗生物質、例えばダイネミシン、ネオカルジノスタチン、カリケアミシン、およびエスペラミシンl、ならびにブレオマイシン)によって切断され得るLSRを含む候補核酸を含む。

いくつかの態様において、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010、少なくとも1011、少なくとも1012、少なくとも1013、少なくとも1014、または少なくとも1015個の異なる候補ヌクレアーゼターゲット部位を含む候補核酸分子のライブラリーが提供される。いくつかの態様において、ライブラリーの候補核酸分子は、ローリングサイクル(rolling cycle)増幅によって環状化した鋳型から産したコンカテマーである。いくつかの態様において、ライブラリーは、少なくとも5kDa、少なくとも6kDa、少なくとも7kDa、少なくとも8kDa、少なくとも9kDa、少なくとも10kDa、少なくとも12kDa、または少なくとも15kDaの分子量の核酸分子(例えばコンカテマー)を含む。いくつかの態様において、ライブラリー中の核酸分子の分子量は15kDaより大きくあり得る。いくつかの態様において、ライブラリーは具体的なサイズ範囲内の(例えば、5〜7kDa、5〜10kDa、8〜12kDa、10〜15kDa、または12〜15kDa、もしくは5〜10kDaの範囲、またはいずれかの可能な部分範囲内の)核酸分子を含む。本開示のいくつかの側面に従って核酸コンカテマーを生成させることに好適ないくつかの方法は、大いに異なる分子量の核酸分子の生成をもたらし、一方で、核酸分子のかかる混合物がサイズ分画されて、望まれるサイズ分布を得られる。望まれるサイズの核酸分子を濃縮または望まれるサイズの核酸分子を排除するための好適な方法は当業者に周知であり、開示はこの点に関して限定されない。

いくつかの態様において、部分的にランダム化された部位は、コンセンサス部位とは平均で10%以下、15%以下、20%以下、25%以下、30%以下、40%以下、または50%以下異なる(二項分布)。例えば、いくつかの態様において、部分的にランダム化された部位は、コンセンサス部位とは5%よりも多く10%以下、10%よりも多く20%以下、20%よりも多く25%以下、5%よりも多く20%以下など異なる。ライブラリー中に部分的にランダム化されたヌクレアーゼターゲット部位を用いることは、コンセンサス部位に密に関連する(例えば、コンセンサス部位とは1のみ、2のみ、3のみ、4のみ、または5残基のみが異なる)ターゲット部位を含むライブラリーメンバーの濃度を増大させるために有用である。この背後の論理は、所与のヌクレアーゼ(例えば所与のZFNまたはRNAによってプログラム可能なヌクレアーゼ)は、その目指すターゲット部位およびいずれかの密に関連したターゲット部位を切断する可能性は高いが、目指すターゲット部位とは遥かに異なるかまたは完全に無関連であるターゲット部位を切断しそうにないということである。従って、部分的にランダム化されたターゲット部位を含むライブラリーを用いることは、完全にランダム化されたターゲット部位を含むライブラリーを用いることよりも効率的であり得、いずれかの所与のヌクレアーゼについていずれかのオフターゲット切断イベントを検出する際の感度を損なわずにあり得る。それゆえに、部分的にランダム化されたライブラリーの使用は、所与のヌクレアーゼの実質的に全てのオフターゲット部位をカバーする高い見込みを有するライブラリーを産するために要求されるコストおよび労力をかなり削減する。しかしながら、いくつかの態様においては、例えば、所与のヌクレアーゼの特異性が所与のゲノム中のいずれかの可能な部位の文脈中で評価されようとする態様において、ターゲット部位の完全にランダム化されたライブラリーを用いることが望ましくあり得る。

部位特異的ヌクレアーゼの選択および設計 本開示のいくつかの側面は、複雑なゲノムの文脈中で単一のユニークな部位のターゲティングされた切断を可能にする、部位特異的ヌクレアーゼを選択および設計するための方法および戦略を提供する。いくつかの態様において、方法が提供され、同じコンセンサス配列を切断するように設計されたかまたは切断することが既知である複数個の候補ヌクレアーゼを提供することと、各候補ヌクレアーゼによって実際に切断されたターゲット部位をプロファイリングし、それゆえにいずれかの切断されたオフターゲット部位(コンセンサスターゲット部位とは異なるターゲット部位)を検出することと、そのように同定されたオフターゲット部位(単数または複数)に基づいて候補ヌクレアーゼを選択することとを含む。いくつかの態様において、この方法は、候補ヌクレアーゼの群から最も特異的なヌクレアーゼ(例えば、最高の特異性でコンセンサスターゲット部位を切断するヌクレアーゼ、最低数のオフターゲット部位を切断するヌクレアーゼ、ターゲットゲノムの文脈中で最低数のオフターゲット部位を切断するヌクレアーゼ、またはコンセンサスターゲット部位以外のいずれのターゲット部位も切断しないヌクレアーゼ)を選択するために用いられる。いくつかの態様において、この方法は、ヌクレアーゼの治療有効濃度よりも高いかまたはそれに等しい濃度で、対象のゲノムの文脈中のいずれのオフターゲット部位も切断しないヌクレアーゼを選択するために用いられる。

本明細書において提供される方法および試薬は、例えば、同じ目指すターゲット部位をターゲティングする複数個の異なるヌクレアーゼ(例えば、所与の部位特異的ヌクレアーゼ(例えば所与のジンクフィンガーヌクレアーゼ)の複数個の変形)を評価するために用いられ得る。従って、かかる方法は、改善された特異性を有する新規の部位特異的ヌクレアーゼを進化させるかまたは設計する際の選択ステップとして用いられ得る。

ゲノム中のユニークなヌクレアーゼターゲット部位の同定 本開示のいくつかの態様は、ゲノム中のヌクレアーゼターゲット部位を選択するための方法を提供する。本明細書において他所でより詳細に記載される通り、所与のヌクレアーゼによって切断されるオフターゲット部位が、典型的にはコンセンサスターゲット部位に高度に類似であり、例えばコンセンサスターゲット部位とは1のみ、2のみ、3のみ、4のみ、または5ヌクレオチド残基のみが異なるということが驚くべきことに発見された。この発見に基づいて、ゲノム中のヌクレアーゼターゲット部位は、この部位をターゲティングするヌクレアーゼが、ゲノム中のいずれのオフターゲット部位も切断しない見込みを増大させるように選択され得る。例えば、いくつかの態様において、方法が提供され、候補ヌクレアーゼターゲット部位を同定することと、ゲノム中の他の配列と候補ヌクレアーゼターゲット部位を比較することとを含む。ゲノム中の他の配列と候補ヌクレアーゼターゲット部位を比較するための方法は当業者に周知であり、例えば配列アラインメント法を包含し、これは例えば配列アラインメントソフトウェアまたはアルゴリズム(例えばBLAST)を汎用コンピュータ上で用いる。好適なユニークなヌクレアーゼターゲット部位は、それから配列比較の結果に基づいて選択され得る。いくつかの態様において、候補ヌクレアーゼターゲット部位がゲノム中のいずれかの他の配列とは少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ヌクレオチドだけ異なる場合には、ヌクレアーゼターゲット部位はゲノム中のユニークな部位として選択され、しかし部位がこの基準にかなっていない場合には、部位は捨てられ得る。いくつかの態様において、上で略説された通り、ひとたび部位が配列比較に基づいて選択されたら、選択された部位をターゲティングする部位特異的ヌクレアーゼが設計される。例えば、ジンクフィンガーヌクレアーゼは、ターゲット部位に結合するジンクフィンガーアレイを構築することと、ジンクフィンガーアレイをDNA切断ドメインにコンジュゲーションすることとによって、いずれかの選択されたヌクレアーゼターゲット部位をターゲティングするように設計され得る。DNA切断ドメインがDNAを切断するために二量体化する必要がある態様においては、ジンクフィンガーアレイが設計され、それぞれはヌクレアーゼターゲット部位のハーフ部位に結合し、それぞれは切断ドメインにコンジュゲーションされるであろう。いくつかの態様において、ヌクレアーゼ設計および/または生成は組み換え技術によってなされる。好適な組み換え技術は当業者に周知であり、開示はこの点に関して限定されない。

いくつかの態様において、本開示の側面に従って設計されるかまたは生成する部位特異的ヌクレアーゼは、単離および/または精製される。本開示の側面に従って部位特異的ヌクレアーゼを設計するための方法および戦略は、いずれかの部位特異的ヌクレアーゼ(ジンクフィンガーヌクレアーゼ、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、またはエンジイン抗生物質(例えば、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン)を包含するが、これに限定されない)を設計するかまたは生成させるために適用され得る。

単離されたヌクレアーゼ 本開示のいくつかの側面は、本明細書に記載される方法および戦略を用いて設計される向上した特異性を有する単離された部位特異的ヌクレアーゼを提供する。本開示のいくつかの態様は、かかるヌクレアーゼをコードする核酸を提供する。本開示のいくつかの態様は、かかるコードする核酸を含む発現コンストラクトを提供する。例えば、いくつかの態様においては、単離されたヌクレアーゼが提供され、これはゲノム中の望まれるターゲット部位を切断するように操作されており、ヌクレアーゼがその目指すターゲット部位を切断するのに有効な濃度で1個よりも少し、2個よりも少し、3個よりも少し、4個よりも少し、5個よりも少し、6個よりも少し、7個よりも少し、8個よりも少し、9個よりも少し、または10個よりも少しのオフターゲット部位を切断すると、本明細書において提供される方法に従って評価されている。いくつかの態様において、単離されたヌクレアーゼが提供され、これは、ゲノム中のいずれかの他の部位とは少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ヌクレオチド残基だけ異なるように選択された望まれるユニークなターゲット部位を切断するように操作されている。いくつかの態様において、単離されたヌクレアーゼは、RNAによってプログラム可能なヌクレアーゼ、例えばCas9ヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、もしくは転写活性化因子様エフェクターヌクレアーゼ(TALEN)、ホーミングエンドヌクレアーゼ、有機化合物ヌクレアーゼ、またはエンジイン抗生物質(例えば、ダイネミシン、ネオカルジノスタチン、カリケアミシン、エスペラミシン、ブレオマイシン)である。いくつかの態様において、単離されたヌクレアーゼは、疾患または障害と関連したアレル内のターゲット部位を切断する。いくつかの態様において、単離されたヌクレアーゼはターゲット部位を切断し、その切断は疾患または障害の処置または予防をもたらす。いくつかの態様において、疾患はHIV/AIDSまたは増殖性疾患である。いくつかの態様において、アレルはCCR5(HIV/AIDSを処置するため)またはVEGFAアレル(増殖性疾患を処置するため)である。

いくつかの態様において、単離されたヌクレアーゼは医薬組成物の一部として提供される。例えば、いくつかの態様は、本明細書において提供されるヌクレアーゼまたはかかるヌクレアーゼをコードする核酸と薬学的に許容可能な賦形剤とを含む医薬組成物を提供する。医薬組成物は1つまたは2つ以上の追加の治療活性物質を任意に含み得る。

いくつかの態様において、本明細書において提供される組成物は、対象内のターゲティングされたゲノム改変を実行するために対象に(例えばヒト対象に)投与される。いくつかの態様において、細胞が対象から得られ、ヌクレアーゼまたはヌクレアーゼをコードする核酸とエクスビボで接触させられ、望まれるゲノム改変が細胞内で実行または検出された後に対象に再投与される。本明細書において提供される医薬組成物の記載は、ヒトへの投与に好適である医薬組成物に主として向けられているが、かかる組成物が一般的に全ての種類の動物への投与に好適であるということは当業者によって理解されるであろう。組成物を種々の動物への投与に好適にするための、ヒトへの投与に好適な医薬組成物の改変は周知であり、獣医薬理学者は、せいぜい単なる普通の実験法によってかかる改変を設計し得るおよび/または行い得る。医薬組成物の投与が考えられる対象は、ヒトおよび/または他の霊長類、哺乳動物(商業的に関係する哺乳動物、例えばウシ、豚、馬、ヒツジ、ネコ、イヌ、マウス、および/またはラットを包含する)および/または鳥類(商業的に関係する鳥類、例えばニワトリ、鴨類、ガチョウ、および/または七面鳥を包含する)を包含するが、これに限定されない。

本明細書に記載される医薬組成物の製剤は、薬理学の分野において公知のまたは以後発生するいずれかの方法によって調製され得る。一般的に、かかる調製法は、有効成分を賦形剤および/または1つもしくは2つ以上の他の補助的な成分と会合させるステップと、それから、必要なおよび/または望ましい場合には、産物を成形および/またはパッケージングして望まれる単一または複数用量の単位にすることとを包含する。

加えて、医薬製剤は薬学的に許容可能な賦形剤を含み得、これは、本明細書において用いられる場合には、いずれかのおよび全ての溶媒、分散媒、希釈剤、または他の液体基剤、分散もしくは懸濁助剤、界面活性剤、等張化剤、増粘もしくは乳化剤、保存料、固体結合剤、滑剤、ならびに同類を、望まれる特定の剤形に適するように包含する。Remington's The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro(Lippincott, Williams & Wilkins, Baltimore, MD, 2006。参照によって本明細書にその全体が組み込まれる)は、医薬組成物を製剤する際に用いられる種々の賦形剤、およびその調製のための公知技術を開示している。ヌクレアーゼを含む医薬組成物を産するための追加の好適な方法、試薬、賦形剤、および溶媒については、参照によって本明細書にその全体が組み込まれるPCT出願PCT/US2010/055131をもまた参照。いずれかの従来の賦形剤媒質が物質またはその誘導体と不適合である(例えば、いずれかの望ましくない生物学的効果を産すること、または別様には医薬組成物のいずれかの他の構成要素(単数または複数)と有害な様式で相互作用することによる)限りを除いて、その使用は本開示の範囲内であると考えられる。

本発明のこれらおよび他の態様の機能および利点は下の実施例からより完全に理解されるであろう。以下の実施例は、本発明の利益を例示することおよび特定の態様を記載することを目指されているが、本発明の完全な範囲を例証することは目指されていない。従って、実施例は本発明の範囲を限定することは意味されていないということは理解されるであろう。

材料および方法 オリゴヌクレオチド.本研究に用いられた全てのオリゴヌクレオチドはIntegrated DNA Technologiesから購入した。オリゴヌクレオチド配列は表9に列挙されている。

S.pyogenes Cas9の発現および精製.E.coli Rosetta (DE3)細胞を、N末端6×Hisタグ/マルトース結合蛋白質に融合したS.pyogenes cas9遺伝子をコードするプラスミドpMJ80611によって形質転換した。もたらされた発現株を、アンピシリンの100μg/mLおよびクロラムフェニコールの30μg/mLを含有するルリア・ベルターニ(LB)ブロス中に37℃で一晩接種した。細胞を同じ増殖培地中で1:100希釈し、OD600が約0.6まで37℃で育てた。培養物を18℃で30minインキュベーションし、イソプロピルβ−D−1−チオガラクトピラノシド(IPTG)を0.2mMで追加して、Cas9発現を誘導した。約17h後に、細胞を8,000gでの遠心分離によって回収し、リシス緩衝液(20mMのトリス(ヒドロキシメチル)−アミノメタン(Tris)−HCl(pH8.0)、1MのKCl、20%グリセロール、1mMのトリス(2−カルボキシエチル)ホスフィン(TCEP))中に再懸濁した。細胞を音波処理によってリシスし(6W出力で合計10minの、10secのパルスオンおよび30secのパルスオフ)、可溶性のライセートを、30minの20,000gでの遠心分離によって得た。細胞ライセートをニッケル−ニトリロ酢酸(ニッケル−NTA)樹脂(Qiagen)と一緒に4℃で20minインキュベーションして、Hisタグ付けしたCas9を捕獲した。樹脂を20mLカラムに移し、リシス緩衝液の20カラム体積によって洗浄した。Cas9を20mMのTris−HCl(pH8)、0.1MのKCl、20%グリセロール、1mMのTCEP、および250mMイミダゾール中に溶出し、Amicon ultra遠心分離フィルター(Millipore、30kDa分子量カットオフ)によって約50mg/mLまで濃縮した。6×Hisタグおよびマルトース結合蛋白質を20hの4℃でのTEVプロテアーゼ処置によって除去し、第2のNiアフィニティー精製ステップによって捕獲した。Cas9を含有する溶出液を、精製緩衝液(20mMのTris−HCl(pH8)、0.1MのKCl、20%グリセロール、および1mMのTCEPを含有する)中でHiTrap SP FFカラム(GE Healthcare)に注入した。5カラム体積の0.1M〜1Mの直線KCl勾配を含有する精製緩衝液によって、Cas9を溶出した。溶出したCas9を精製緩衝液中でHiLoad Superdex 200カラムによってさらに精製し、液体窒素中で瞬間凍結し、小分けして−80℃で保管した。

インビトロRNA転写.100pmolのCLTA(#) v2.1 fwdおよびv2.1 template revを95℃でインキュベーションし、10μΜのdNTPミックス(Bio-Rad)を補ったNEBuffer 2(50mM塩化ナトリウム、10mMのTris−HCl、10mM塩化マグネシウム、1mMジチオトレイトール(pH7.9))中で、37℃まで0.1℃/sで冷却した。クレノウ断片(3’−>5’エキソ−)(NEB)の10Uを反応混合物に追加して、二本鎖CLTA(#) v2.1 templateを37℃での1hのオーバーラップ伸長によって得た。200nMのCLTA(#) v2.1 template単独または100nMのT7 promoter oligoありの100nMのCLTA(#) templateを、1mMのrNTPミックス(1mMのrATP、1mMのrCTP、1mMのrGTP、1mMのrUTP)を補ったNEB RNAPol緩衝液(40mMのTris−HCl(pH7.9)、6mM塩化マグネシウム、10mMジチオトレイトール、2mMスペルミジン)中のT7 RNAポリメラーゼ(NEB)の0.16U/μLと一緒に、37℃で一晩インキュベーションした。インビトロ転写したRNAをエタノールによって沈殿し、ゲル電気泳動によってCriterion10%ポリアクリルアミドTBE−尿素ゲル(Bio-Rad)で精製した。ゲル精製したsgRNAをエタノールによって沈殿し、水中に再溶解した。

インビトロのライブラリー構築.CLTA(#) libオリゴヌクレオチドの10pmolを、60℃で16時間、20μLの合計の反応体積で、2.5mM塩化マンガンを補った1×CircLigase II反応緩衝液(33mMのTris−酢酸、66mM酢酸カリウム、0.5mMジチオトレイトール(pH7.5))中のCircLigase II ssDNAリガーゼ(Epicentre)の100単位と一緒のインキュベーションによって、別々に環状化した。反応混合物を85℃で10分間インキュベーションして酵素を不活性化した。粗製環状一本鎖DNAの5μL(5pmol)を、製造者のプロトコールに従ってillustra TempliPhi増幅キット(GE Healthcare)によってコンカテマーの選択前ライブラリーに変換した。コンカテマー選択前ライブラリーは、Quant-it PicoGreen dsDNAアッセイキット(Invitrogen)によって定量した。

オンターゲットおよびオフターゲット基質のインビトロ切断.PCRのためのプラスミド鋳型は、HindIII/XbaI二重消化したpUC19(NEB)へのアニーリングしたオリゴヌクレオチドCLTA(#) site fwd/revのライゲーションによって構築した。オンターゲット基質DNAは、プラスミド鋳型ならびにtest fwdおよびtest revプライマーによるPCRによって生成し、それからQIAquick PCR精製キット(Qiagen)によって精製した。オフターゲット基質DNAはプライマー伸長によって生成した。100pmolのoff-target (#) fwdおよびoff-target (#) revプライマーを95℃でインキュベーションし、10μΜのdNTPミックス(Bio-Rad)を補ったNEBuffer2(50mM塩化ナトリウム、10mMのTris−HCl、10mM塩化マグネシウム、1mMジチオトレイトール(pH7.9))中で37℃まで0.1℃/sで冷却した。クレノウ断片(3’−>5’エキソ−)(NEB)の10Uを反応混合物に追加して、二本鎖オフターゲット鋳型を37℃での1hのオーバーラップ伸長、75℃での20minの続く酵素不活性化によって得、それからQIAquick PCR精製キット(Qiagen)によって精製した。200nMの基質DNAを、37℃で10min、Cas9切断緩衝液(200mMのHEPES(pH7.5)、1.5M塩化カリウム、100mM塩化マグネシウム、1mMのEDTA、5mMジチオトレイトール)中の100nMのCas9および100nMの(v1.0またはv2.1)sgRNAまたは1000nMのCas9および1000nMの(v1.0またはv2.1)sgRNAと一緒にインキュベーションした。オンターゲット切断反応はQIAquickPCR精製キット(Qiagen)によって精製し、オフターゲット切断反応はCriterion5%ポリアクリルアミドTBEゲル(Bio-Rad)中での電気泳動の前にQIAquickヌクレオチド除去キット(Qiagen)によって精製した。

インビトロ選択.200nMのコンカテマーの選択前ライブラリーを、37℃で10min、Cas9切断緩衝液(200mMのHEPES(pH7.5)、1.5M塩化カリウム、100mM塩化マグネシウム、1mMのEDTA、5mMジチオトレイトール)中の100nMのCas9および100nMのsgRNAまたは1000nMのCas9および1000nMのsgRNAと一緒にインキュベーションした。選択前ライブラリーは、別々に、37℃で1h、NEBuffer 3(100mMのNaCl、50mMのTris−HCl、10mMのMgCl2、1mMジチオトレイトール(pH7.9))中のBspMI制限エンドヌクレアーゼ(NEB)の2Uと一緒にもまたインキュベーションした。平滑末端の選択後ライブラリーメンバーまたは粘着末端の選択前ライブラリーメンバーをQIAQuick PCR精製キット(Qiagen)によって精製し、一晩(>10h)室温でNEB T4 DNAリガーゼ反応緩衝液(50mMのTris−HCl(pH7.5)、10mM塩化マグネシウム、1mMのATP、10mMジチオトレイトール)中のT4 DNAリガーゼ(NEB)の1,000Uによって、10pmolのadapter 1/2(AACA)(Cas9:v2.1 sgRNA、100nM)、adapter 1/2(TTCA)(Cas9:v2.1 sgRNA、1000nM)、adapter 1/2(Cas9:v2.1 sgRNA、1000nM)、またはlib adapter 1/CLTA(#) lib adapter 2(選択前)とライゲーションした。アダプターライゲーションしたDNAをQIAquick PCR精製キットによって精製し、Buffer HF(NEB)中のPhusion Hot Start Flex DNAポリメラーゼ(NEB)およびプライマーCLTA(#) sel PCR/PE2 short(選択後)またはCLTA(#) lib seq PCR/lib fwd PCR(選択前)によって10〜13サイクルPCR増幅した。増幅されたDNAをゲル精製し、KAPA Library Quantification Kit-Illumina(KAPA Biosystems)によって定量し、Illumina MiSeqでのシングルリードシーケンシングまたはIllumina HiSeq 2500でのRapid Runシングルリードシーケンシングに供した(Harvard University FAS Center for Systems Biology Core facility, Cambridge, MA)。

選択分析.選択前および選択後シーケンシングデータは、以前に記載されている通り21分析した(C++で書いたスクリプトを用いる改変(アルゴリズム)あり)。生配列データは示さない。キュレーションしたサマリーについては表2参照。特異性スコアは、正の特異性スコア=(位置における塩基対の頻度[選択後]−位置における塩基対の頻度[選択前])/(1−位置における塩基対の頻度[選択前])および負の特異性スコア=(位置における塩基対の頻度[選択後]−位置における塩基対の頻度[選択前])/(位置における塩基対の頻度[選択前])の式によって算出した。配列ロゴの正規化は以前に記載されている通りに行った22

細胞の切断アッセイ.HEK293T細胞を転写前にウェルあたり0.8×105の密度(6ウェルプレート)に分割し、5%CO2の37℃加湿インキュベータ中、10%ウシ胎児血清(FBS)を補ったダルベッコ改変イーグル培地(DMEM)中で維持した。1日後に、細胞を、製造者のプロトコールに従ってLipofectamine 2000(Invitrogen)を用いて、一過的にトランスフェクションした。HEK293T細胞を、Cas9発現プラスミド(Cas9-HA-2xNLS-GFP-NLS)の1.0μgおよび一本鎖RNA発現プラスミドpSiliencer-CLTA(バージョン1.0または2.1)の2.5μgによって、6ウェルプレートの各ウェル中の70%コンフルエントでトランスフェクションした。トランスフェクション効率は、蛍光顕微鏡法によって観察されたGFP陽性細胞の割合に基づいて約70%であると見積もられた。トランスフェクションの48h後に、細胞をリン酸緩衝生理食塩水(PBS)によって洗浄し、ペレット化して−80℃で凍結した。ゲノムDNAを、製造者のプロトコールに従ってDNeasy Blood and Tissueキット(Qiagen)を用いて200μLの細胞ライセートから単離した。

オフターゲット部位配列決定.Cas9発現プラスミドおよび一本鎖RNA発現プラスミド(処置細胞)またはCas9発現プラスミド単独(対照細胞)によって処置された細胞から単離した100ngのゲノムDNAを、プライマーCLTA(#)-(#)-(#) fwdおよびCLTA(#)-(#)-(#) revならびに3%DMSOを補ったBuffer GC(NEB)中のPhusion Hot Start Flex DNAポリメラーゼ(NEB)によって、35サイクルの10sの72℃伸長によるPCRによって増幅した。粗製PCR産物の相対的な量をゲルによって定量し、Cas9によって処置(対照)およびCas9:sgRNAによって処置されたPCRは、QIAquick PCR精製キット(Qiagen)による精製の前に等モル濃度で別々にプールした。精製したDNAを、Buffer HF(NEB)中のPhusion Hot Start Flex DNAポリメラーゼ(NEB)によって、7サイクルのプライマーPE1-barcode#およびPE2-barcode#によるPCRによって増幅した。増幅した対照および処置されたDNAプールをQIAquick PCR精製キット(Qiagen)によって精製し、Agencourt AMPure XP(Beckman Coulter)による精製が続いた。精製した対照および処置されたDNAをKAPA Library Quantification Kit-Illumina(KAPA Biosystems)によって定量し、1:1比でプールし、Illumina MiSeqでのペアエンドシーケンシングに供した。

統計分析.統計分析は以前に記載されている通りに行った21。表1および表6のP値は片側のフィッシャーの正確確率検定について算出した。

アルゴリズム 全てのスクリプトはC++で書いた。本研究に用いられたアルゴリズムは以前の報告された(参照)通りであり、改変を有する。

配列ビニング.1)選択後ライブラリーメンバーとして、バーコード「AACA」または「TTCA」で始まる配列ペアを指定する。2)選択後ライブラリーメンバーについて(例示された例あり)、 例のリード:

i)定常配列「CTCGGCAGGT(太字)」(配列番号43)の位置pos1およびpos2について両方のペアリードを検索する。ii)バーコードおよびpos1および直前のpos2間に同一の配列(二重下線)を有する配列のみをキープする。iii)定常配列の2つの間の領域をキープする(バーコードとpos1との間の領域は、切断されたハーフ部位を含有する。定常配列の2つの間の領域は完全な部位を含有する)

ii)配列を選択バーコードについて検索する(CLTA1は「TGTGTTTGTGTT」(配列番号45)、CLTA2は「AGAAGAAGAAGA」(配列番号46)、CLTA3は「TTCTCTTTCTCT」(配列番号47)、CLTA4は「ACACAAACACAA」(配列番号48)) 例:ACTTGCAGATGTAGTCTTTCCACATGGGTCGACACAAACACAA(配列番号49)−CLTA4 iii)バーコードの前の配列は、完全な選択後ライブラリーメンバーである(最初の4および最後の4ヌクレオチドは、完全にランダム化された隣接配列である) 例:ACTT GCAGATGTAGTCTTTCCACATGG GTCG(配列番号50) iv)23ヌクレオチドの選択後ライブラリーメンバーに対応する位置について、品質スコアをパースする 例のリード: AACACATGGGTCGACACAAACACAACTCGGCAGGTACTTGCAGATGTAGTCTTTCCACATGGGTCGACACAAACACAACTCGGCAGGTATCTCGTATGCC(配列番号51) CCCFFFFFHHHHHJJJJJJJJJJJJJJJJJJJJJGIJJJJIJIJJJIIIHIIJJJHHHGHAEFCDDDDDDDDDDDDDDDDDDDDDDD?CDDEDD@DCCCD v)配列の対応する品質スコアストリング(下線付き)FASTQ品質キャラクターがASCIIコードで「?」であるかまたはより高い(Phred品質スコア>=30)場合にのみ、配列をキープする

NHEJ配列コール 例のリード:

例の品質スコア:

1)各ターゲット部位の20塩基対ターゲット部位+3塩基対PAM(太字)の両側に隣接する20塩基対を同定する 例の隣接配列:GCTGGTGCACTGAAGAGCCA(配列番号53) AATATCTTAATCCTACTCAG(配列番号54) 2)隣接配列について全ての配列リードを検索し、潜在的なオフターゲット部位(隣接配列間の配列)を同定する

3)潜在的なオフターゲット部位がインデルを含有する(長さは23よりも少し)場合には、配列について全ての対応するFASTQ品質キャラクターがASCIIコードで「?」であるかまたはより高い場合に(Phred品質スコア>=30)、潜在的なオフターゲット部位として配列をキープする 例の潜在的なオフターゲット部位長=22 例の対応するFASTQ品質キャラクター:HHGHHHHHHHHHHHHHHHHHHH 4)ステップ2および3をパスする全ての配列をビニングおよびマニュアル検査し、それらが、位置16、17、もしくは18(非PAM末端からカウントして20のうち)が関与する少なくとも1つの欠失を有する場合、または、それらが位置17および18間に挿入を有する場合に、潜在的な改変された配列として配列をキープする。これは、目指すターゲット部位について観察された最も高頻度の改変と一致している(図3) 例の潜在的なオフターゲット部位(逆相補。位置が標識されている)と参照配列: 11111111112222 非PAM末端 12345678901234567890123 PAM末端 GCAGATGTAGTGTTTC-ACAGGG(配列番号56) GCAGATGTAGTGTTTCCACAGGG(配列番号57) 4)ステップ1〜3をリード2について繰り返し、配列が同じである場合にのみキープする 5)Cas9単独サンプルとCas9+sgRNAによって処置されたサンプルにおける総合的なカウントを比較して、改変された部位を同定する

切断部位に基づくフィルター(選択後配列) 1)(最初の定常配列の前の)バーコードの後のシーケンシングリード中の最初の位置と同一である、(2つの定常配列間の)完全なシーケンシングされた認識部位内の最初の位置を同定することによって、認識部位を通して切断部位箇所を集計する。 2)集計後にステップ1を繰り返し、シーケンシングリードの少なくとも5%に存在する切断部位箇所を有する配列のみをキープする。

結果 広範囲なオフターゲットDNA切断プロファイリングは、RNAによってプログラムされるCas9ヌクレアーゼ特異性を明らかにする。 ジンクフィンガーヌクレアーゼ(ZFN)および転写活性化因子様エフェクターヌクレアーゼ(TALEN)を包含する配列特異的エンドヌクレアーゼは、人工多能性幹細胞(iPSC)1〜3、多細胞生物4〜8、およびエクスビボの遺伝子治療治験9、10において遺伝子を改変するための重要なツールになった。ZFNおよびTALENはかかる遺伝子操作に有効だと判明しているが、新たなZFNまたはTALEN蛋白質は各DNAターゲット部位について生成しなければならない。対照的に、RNAガイドCas9エンドヌクレアーゼはRNA:DNAハイブリダイゼーションを用いてターゲットDNA切断部位を決定しており、単一の単量体蛋白質がガイドRNAによって規定されるいずれかの配列を原理的には切断することを可能にする11

以前の研究から12〜17、Cas9が、結合したガイドRNA中の20ヌクレオチド配列に相補的な部位におけるゲノム編集を媒介するということが証明された。加えて、ターゲット部位は、20ヌクレオチドターゲット部位に隣接した3’末端にプロトスペーサー隣接モチーフ(PAM)を包含しなくてはならない。Streptococcus pyogenes Cas9については、PAM配列はNGGである。インビトロおよび細胞両方におけるCas9によって媒介されるDNA切断の特異性は、潜在的な単独変異オフターゲット部位の小さい集まりに対するアッセイに基づいて以前に推論されている。これらの研究からは、ガイドRNAとターゲットDNAとの間の完全な相補性が、ターゲット部位のPAM末端(ガイドRNAの3’末端)に隣接した7〜12塩基対中に要求され、ミスマッチは非PAM末端(ガイドRNAの5’末端)において許容されるということが示唆された11、12、17〜19

Cas9:ガイドRNAターゲット認識を規定するヌクレオチドのかかる限定された数は、中程度〜大きいサイズ(>約107bp)のゲノム中のDNA切断の複数の部位を予測するであろうが、Cas9:ガイドRNA複合体は細胞12、13、15および生物14両方を改変するために上首尾に用いられて来た。ゼブラフィッシュ胚を改変するためにCas9:ガイドRNA複合体を用いる研究では、ZFNおよびTALENのものと類似の率の毒性が観察された14。ハイスループットシーケンシングを用いた触媒不活性なCas9変異体のE.coliにおけるDNA結合(転写抑制)の特異性の最近の広範囲の研究では、比較的小さいE.coliトランスクリプトーム中の検出可能なオフターゲット転写抑制は見いだされなかった20。これらの研究はCas9の我々の基礎的な理解をかなり前進させた。一方、関連した変異体ターゲット部位の多数でのCas9切断の測定から生成したCas9:ガイドRNAによって媒介されるDNA切断特異性の体系的で網羅的なプロファイルは、記載されていない。かかる特異性プロファイルは、研究ツールおよび将来の治療薬としてのCas9:ガイドRNA複合体のポテンシャルを理解および改善するために必要とされる。

本発明者は、本発明者の以前に公開したインビトロ選択21を改変し、Cas9によって産した平滑末端の切断産物を加工するために転用し(ZFN切断のオーバーハング含有産物と比較した)、Cas9:シングルガイドRNA(sgRNA)11複合体のオフターゲットDNA切断プロファイルを決定した。各選択実験は、約1012個の配列を含有するDNA基質ライブラリーを用いた。これは、各22塩基対ターゲット配列(2塩基対PAMを包含する)と相対的に8つまたは7つ以下の変異を有する全ての配列の10倍のカバレッジを包含するのに十分に大きいサイズである(図1)。本発明者は、部分的にランダム化されたヌクレオチド混合物を全ての22個のターゲット部位塩基対において用い、ターゲット部位あたり4.62個の変異という予想される平均を有する変異体ターゲット部位の二項分布のライブラリーを生じた。加えて、ターゲット部位ライブラリーメンバーは、各側が4つの完全にランダム化された塩基対によって隣接されており、標準的な20塩基対ターゲット部位およびPAMによって課されるもの以上の特異性パターンについて試験した。

1012個の個体の潜在的なオフターゲット部位の選択前ライブラリーを、ヒトクラスリン軽鎖A(CLTA)遺伝子内の4つの異なるターゲット配列のそれぞれについて生成させた(図3)。合成5’リン酸化53塩基オリゴヌクレオチドをセルフライゲーションしてインビトロで環状一本鎖DNAにし、それからローリングサークル増幅によってコンカテマーの53塩基対リピートに変換した。もたらされた選択前ライブラリーを、それらの対応するCas9:sgRNA複合体と一緒にインキュベーションした。自由な5’リン酸を含有する切断されたライブラリーメンバーを、未リン酸化二本鎖シーケンシングアダプターの5’リン酸依存的なライゲーションによって無傷のライブラリーメンバーから分離した。ライゲーションによってタグ付けした選択後ライブラリーをPCRによって増幅した。PCRステップは、Cas9によって切断されたライブラリーメンバーの0.5、1.5、または2.5個などのリピートを含有する選択後DNA断片の混合物を生成させ、1つまたは2つ以上の隣接した対応する完全な部位を有するかまたは有さないアダプターライゲーションされた切断されたハーフ部位の増幅をもたらした(図1)。1.5個のターゲット配列リピートを有する選択後ライブラリーメンバーをゲル精製によって単離し、ハイスループットシーケンシングによって分析した。DNA増幅またはシーケンシング中のエラーの影響を最小化するための最後のコンピュータによる選択ステップにおいては、リピートである切断されたハーフ部位の2つの同一のコピーを有する配列のみを分析した。

選択前ライブラリーを、酵素制限条件(200nMのターゲット部位ライブラリー、100nMのCas9:sgRNA v2.1)または酵素飽和条件(200nMのターゲット部位ライブラリー、1000nMのCas9:sgRNA v2.1)下で、試験した4つのガイドRNAターゲット(CLTA1、CLTA2、CLTA3、およびCLTA4)のそれぞれについてインキュベーションした(図3Cおよび3D)。第2のガイドRNAコンストラクトsgRNA v1.0はsgRNA v2.1よりも活性でなく、試験した4つのガイドRNAターゲットのそれぞれについて単独の酵素飽和条件下でアッセイした(200nMのターゲット部位ライブラリー、1000nMのCas9:sgRNA v1.0)。2つのガイドRNAコンストラクトはそれらの長さ(図3)および選択条件下でのそれらのDNA切断活性レベルが異なり、これは以前の報告と一致している15(図4)。選択前および選択後ライブラリーは両方ともハイスループットDNAシーケンシングおよびコンピュータ分析によってキャラクタリゼーションされた。予想された通り、より少ない変異を有するライブラリーメンバーは、選択前ライブラリーと相対的に選択後ライブラリー中でかなり濃縮されていた(図5)。

選択前および選択後ライブラリー組成物。選択前ライブラリーは、CLTA1、CLTA2、CLTA3、およびCLTA4について、2塩基対PAMを包含する22塩基対ターゲット部位あたりそれぞれ4.82(n=1,129,593)、5.06(n=847,618)、4.66(n=692,997)、および5.00(n=951,503)個の変異という観察された平均変異率を有した。Cas9+CLTA1、CLTA2、CLTA3、またはCLTA4 v.2.1 sgRNAによって酵素制限条件下で処置した選択後ライブラリーは、22塩基対ターゲット部位あたり1.14(n=1,206,268)、1.21(n=668,312)、0.91(n=1,138,568)、および1.82(n=560,758)個の変異という平均を含有した。酵素過剰条件下では、選択を通過した配列のうちの平均変異数は、CLTA1、CLTA2、CLTA3、またはCLTA4 v2.1 sgRNAについて、22塩基対ターゲット部位あたりそれぞれ1.61(n=640,391)、1.86(n=399,560)、1.46(n=936,414)、および2.24(n=506,179)個の変異まで増大した。これらの結果は、選択が、試験された全てのCas9:sgRNA複合体についてより少ない変異を有するライブラリーメンバーをかなり濃縮したということと、酵素過剰条件が、酵素制限条件と比較してより高度に変異したライブラリーメンバーの推定される切断をもたらしたということとを明らかにしている(図5)。

本発明者は、選択前ライブラリーと相対的な、選択後ライブラリー中の各位置における各塩基対の濃縮レベルを定量するために特異性スコアを算出し、その塩基対の最大の可能な濃縮に対して正規化した。正の特異性スコアは、選択後ライブラリー中で濃縮されていた塩基対を示し、負の特異性スコアは、選択後ライブラリー中で脱濃縮されていた塩基対を示す。例えば、+0.5のスコアは塩基対が最大濃縮値の50%まで濃縮されているということを示し、一方、−0.5のスコアは塩基対が最大脱濃縮値の50%まで脱濃縮されているということを示す。

PAMによって規定される2つの塩基対に加えて、ガイドRNAによってターゲティングされる全ての20塩基対は、CLTA1およびCLTA2選択からの配列中に濃縮されていた(図2、図6および9、ならびに表2)。CLTA3およびCLTA4選択については(図7および8、ならびに表2)、それぞれ、ガイドRNAによって規定される塩基対は、PAMからの2つの最も遠位の塩基対(ガイドRNAの5’末端)を除いて全ての位置において濃縮された。PAMから最も遠い規定されない位置においては、3つの代わりの塩基対のうちの少なくとも2つが、規定される塩基対とほぼ同じくらい濃縮されていた。全体的な20塩基対ターゲット部位および2塩基対PAMがCas9:sgRNAのDNA切断特異性に寄与し得るという本発明者の知見は、7〜12塩基対および2塩基対PAMのみが規定されるということを示唆する以前の単一基質アッセイからの結果とは対照をなす11、12、15

全ての単独変異体選択前(n≧14,569)および選択後ライブラリーメンバー(n≧103,660)をコンピュータ分析し、各可能な単独変異体配列について選択濃縮値を提供した。この分析の結果(図2ならびに図6および8)からは、単独変異体配列のみが考慮されるときには、酵素制限条件下ではPAMに最も近い6〜8塩基対が一般的に高度に規定され、非PAM末端は不良に規定されるということが示されており、これは以前の知見と一致している11、12、17〜19。しかしながら、酵素飽和条件下では、PAMに最も近位の6〜8塩基対の単独変異さえ許容されており、酵素濃度が基質と相対的に高いときにはDNAターゲット部位のPAM末端における高い特異性が損なわれ得るということを示唆している(図2)。PAMに近い単独変異に対する高い特異性の観察は、単独変異を有する配列のみに適用され、選択結果からは、変異のいずれかの組み合わせがPAMから最も遠いターゲット部位の領域において許容されるモデルは支持されない(図10〜15)。選択前および選択後ライブラリー組成の分析は本明細書において他所で記載されており、位置依存的な特異性パターンは図18〜20に例示されており、PAMヌクレオチド特異性は図21〜24に例示されており、Cas9:sgRNA濃度が特異性に及ぼすより詳細な効果は図2Gおよび図25に記載されている)。

ターゲット部位の非PAM末端における特異性.PAMに遠位の複数の変異を酵素過剰条件下でCas9:v2.1 sgRNAが許容する能力を評価するために、本発明者は、PAMから最も遠位のターゲット部位の末端の1〜12塩基対の領域中にのみ変異を含有する配列の各位置における最大の特異性スコアを算出した(図10〜17)。

この分析の結果は、配列の残りが変異を含有しないときのPAMから最も遠い分子の末端においては、ターゲット部位に依存して、3変異までを有する配列に対して選択が無い(最大の特異性スコアは約0)ということを示している。例えば、PAMから最も遠い3塩基対のみがCLTA2ターゲット部位中において変わることが可能であるときには(図11Cの暗色のバーによって示されている)、3つの可変位置のそれぞれにおける最大の特異性スコアは0に近く、3つの可変位置のそれぞれにおける4つの可能な塩基対のいずれかについて選択が無かったということを示している。しかしながら、PAMから最も遠い8塩基対が変わることが可能であるときには(図11H)、位置4〜8における最大の特異性スコアは全て+0.4よりも大きい。これは、選好されるオンターゲット塩基対を基質の残りが含有するときであっても、Cas9:sgRNAがこれらの位置における配列選好性を有するということを示している。

本発明者は、ターゲット部位の最初の1〜12塩基対のみが変わることが可能であるときの、酵素過剰条件下での選択前およびv2.1 sgRNAによって処置された選択後ライブラリー両方における変異の分布をもまた算出した(図15〜17)。データの部分集合のみについては選択前および選択後ライブラリー間にかなりのオーバーラップがあり(図15〜17、a〜c)、ターゲット部位の最初の3塩基対中のみに変異を有する配列について、選択後ライブラリーでは最小限の選択〜選択無しを証明している。これらの結果は、あわせて、ターゲット部位の残りにおいて最大のsgRNA:DNA相互作用が提供されるときには、Cas9:sgRNAが、PAMから最も遠い配列の末端における小さい変異数(約1〜3)を許容し得るということを示している。

ターゲット部位のPAM末端の特異性.本発明者は、各ターゲット部位の各位置において全ての4つの塩基対について特異性スコアの大きさの和として位置特異性をプロットし、最も高度に規定される位置の同じ和に対して正規化した(図18〜20)。酵素制限および酵素過剰条件下では両方とも、ターゲット部位のPAM末端が高度に規定される。酵素制限条件下では、分子のPAM末端は、CLTA1、CTLA2、およびCLTA3ガイドRNAによってほとんど絶対的に規定され(ガイドRNAによって規定される塩基対の特異性スコア≧+0.9)(図2および図6〜9)、CLTA4ガイドRNAによって高度に規定される(+0.7〜+0.9の特異性スコア)。高い特異性のこの領域内では、ガイドRNAとターゲットDNAとの間のゆらぎ対合と一致している特異的な単独変異が許容される。例えば、単独変異体配列の酵素制限条件下では、dA:dTオフターゲット塩基対およびガイドRNAによって規定されるdG:dC塩基対は、CLTA3ターゲット部位の(ターゲット部位の非PAM末端と相対的に)20のうち位置17において平等に許容される。この位置においては、切断活性の最小限の見かけ上の損失で、rG:dTゆらぎRNA:DNA塩基対が形成され得る。

重要なことに、選択結果からは、ガイドRNAヘアピンの選択が特異性に影響するということもまた明らかになっている。細胞の文脈中の基質と相対的な酵素の過剰を反映する同一の酵素飽和条件下でアッセイされたときには、より短くより活性でないsgRNA v1.0コンストラクトは、より長くより活性なsgRNA v2.1コンストラクトよりも特異的である(図2および図5〜8)。sgRNA v2.1に優るsgRNA v1.0のより高い特異性は、CLTA3およびCLTA4(<40%の違い)よりもCLTA1およびCLTA2(約40〜90%の違い)について高かった。興味深いことに、この特異性の違いは、各ターゲット配列についてターゲット部位の異なる領域に局在している(図2Hおよび26)。あわせて、これらの結果からは、異なるガイドRNA構成が異なるDNA切断特異性をもたらすということ、特異性のガイドRNA依存的な変化が平等にターゲット部位の全ての位置に影響してはいないということが示される。上に記載されているCas9:sgRNA濃度と特異性との間の逆の関係からして、本発明者は、ガイドRNA構成間の特異性の違いはDNA切断活性のそれらの総合的なレベルの違いからもたらされていると推測する。

Cas9:sgRNA濃度がDNA切断特異性に及ぼす効果.試験した4つのターゲット部位について特異性のパターンに酵素濃度が及ぼす効果を評価するために、本発明者は、位置特異性の濃度依存的な違いを算出し、それを位置特異性の最大の可能な変化と比較した(図25)。一般的に、特異性は酵素過剰条件よりも酵素制限条件下で高かった。酵素過剰から酵素制限条件への変化によって、特異性の最大の可能な変化の≧80%だけターゲットのPAM末端における特異性が一般的に増大した。酵素濃度の減少によって、PAMから最も遠いターゲット部位の末端において特異性の小さい(約30%の)増大が一般的に誘導されるが、濃度減少によって、PAMに最も近いターゲット部位の末端における特異性の相当により大きい増大が誘導される。CLTA4については、酵素濃度の減少は、PAMから最も遠いターゲット部位の末端に近いいくつかの塩基対における特異性の小さい(約30%の)減少を伴う。

PAMヌクレオチドの特異性.特異性へのPAMの寄与を評価するために、本発明者は、選択前および選択後ライブラリー中の全ての16個の可能なPAMジヌクレオチドの存在比を算出した。全ての観察された選択後ターゲット部位配列を考慮するか(図21)、または、ガイドRNAによって規定される20塩基対中に変異を含有しない選択後ターゲット部位配列のみを考慮した(図22)。全ての観察された選択後ターゲット部位配列を考慮すると、酵素制限条件下では、GGジヌクレオチドは、それぞれCLTA1、CLTA2、CLTA3、およびCLTA4 v2.1 sgRNAによる選択について、選択後PAMジヌクレオチドの99.8%、99.9%、99.8%、および98.5%をあらわした。対照的に、酵素過剰条件下では、GGジヌクレオチドは、それぞれCLTA1、CLTA2、CLTA3、およびCLTA4 v2.1 sgRNAによる選択について、選択後PAMジヌクレオチドの97.7%、98.3%、95.7%、および87.0%をあらわした。これらのデータは、酵素濃度の増大が、非標準的なPAMジヌクレオチドを含有する基質の増大した切断に至るということを証明している。

PAMジヌクレオチドの選択前ライブラリー分布を説明するために、本発明者はPAMジヌクレオチドの特異性スコアを算出した(図23)。オンターゲット選択後配列のみが酵素過剰条件下で考慮されるときには(図24)、2つのGではなく単一のGを有する非標準的なPAMジヌクレオチドが比較的許容される。酵素過剰条件下では、Cas9:CLTA4 sgRNA 2.1は、試験した全てのCas9:sgRNAの組み合わせのうちで非標準的なPAMジヌクレオチドの最高の許容性を見せた。AGおよびGAジヌクレオチドは最も許容され、GT、TG、およびCG PAMジヌクレオチドが続いた。酵素過剰条件下でのCas9:CLTA1、2、または3 sgRNA 2.1による選択においては、AGが優位な非標準的なPAMであった(図23および24)。本発明者の結果はPAM特異性の別の最近の研究(これは、Cas9:sgRNAがAG PAMジヌクレオチドを認識し得るということを示している)と一致している23。加えて、本発明者の結果からは、酵素制限条件下ではGG PAMジヌクレオチドが高度に規定され、酵素過剰条件下では単一のGを含有する非標準的なPAMジヌクレオチドが許容され得、これはガイドRNAの文脈に依存するということが示されている。

インビトロ選択結果がインビトロのCas9の切断挙動を精密に反映するということを確かめるために、本発明者は、ターゲット部位内に1〜3つの変異を含有する6つのCLTA4オフターゲット基質の個々の切断アッセイを行った。本発明者は、選択前ライブラリー中の算出された存在比によって選択後ライブラリー中の各配列の存在比を除算することによって、酵素飽和条件下でのCas9:CLTA4 v2.1 sgRNAについて、選択後ライブラリー中の全ての配列の濃縮値を算出した。酵素飽和条件下では、最高の濃縮値(27.5、43.9、および95.9)を有する単一の1、2、および3変異配列は、≧71%の完了まで切断された(図27)。1.0の濃縮値を有する2配列は35%まで切断され、0に近い濃縮値(0.064)を有する2配列は切断されなかった。CLTA4 v2.1 sgRNAによって77%まで切断された3配列は、CLTA4 v1.0 sgRNAによって53%というより低い効率まで切断された(図28)。これらの結果は、個体の配列の選択濃縮値がインビトロ切断効率を予測するということを示している。

インビトロ選択およびインビトロ切断アッセイの結果がヒト細胞におけるCas9:ガイドRNA活性に直接関係するかどうかを決定するために、本発明者は、インビトロ選択において濃縮されかつヒトゲノム中に存在した、8つの変異までを含有する51個のオフターゲット部位(CLTA1では19、CLTA4では32)を同定した(表3〜5)。本発明者はCas9:CLTA1 sgRNA v1.0、Cas9:CLTA1 sgRNA v2.1、Cas9:CLTA4 sgRNA v1.0、Cas9:CLTA4 sgRNA v2.1、またはsgRNA無しのCas9をHEK293T細胞内で一過的なトランスフェクションによって発現し、ゲノムPCRおよびハイスループットDNAシーケンシングを用いて、51個のオフターゲット部位のうち46個における、さらにはオンターゲット遺伝子座におけるCas9:sgRNA改変の証拠を探した。特異的な増幅されたDNAは、51個の予測されたオフターゲット部位のうち5つ(CLTA1では3、CLTA4では2)については得られなかった。

Cas9:CLTA1 sgRNAまたはCas9:CLTA4 sgRNAによって処置されたHEK293T細胞から単離されたゲノムDNAのディープシーケンシングから、オンターゲット部位および49個の試験したオフターゲット部位のうち5つ(CLTA1−1−1、CLTA1−2−2、CLTA4−3−1、CLTA4−3−3、およびCLTA4−4−8)において、非相同末端結合(NHEJ)の明白な配列が同定された(表1および6〜8)。CLTA4ターゲット部位はCas9:CLTA4 v2.1 sgRNAによって76%の頻度で改変され、一方、オフターゲット部位CLTA4−3−1、CLTA4−3−3、およびCLTA4−4−8はそれぞれ24%、0.47%、および0.73%の頻度で改変された。CLTA1ターゲット部位はCas9:CLTA1 v2.1 sgRNAによって0.34%の頻度で改変され、一方、オフターゲット部位CLTA1−1−1およびCLTA1−2−2はそれぞれ0.09%および0.16%の頻度で改変された。

v2.1 sgRNAによる酵素飽和条件下では、2つの検証されたCLTA1オフターゲット部位(CLTA1−1−1およびCLTA1−2−2)は、インビトロ選択において同定された3つの最も高度に濃縮された配列のうちの2つであった。CLTA4−3−1およびCLTA4−3−3は、ゲノム中にもまた存在するインビトロ選択において濃縮された7つのCLTA4の3変異配列のうち、最高および3番目の最高の濃縮された配列であった。4変異配列のインビトロ選択濃縮値は算出しなかった。なぜなら、4つの変異を含有するゲノム中の14個のCLTA4配列のうち12個(CLTA4−4−8を包含する)は、選択後ライブラリー中で1配列カウントのみのレベルで観察されたからである。まとめると、これらの結果から、ヒトゲノム中に存在するインビトロ選択において同定されたオフターゲット基質の数個が、ヒト細胞内のCas9:sgRNA複合体によって本当に切断されるということが確かめられ、選択における最も高度に濃縮されたゲノムオフターゲット配列が細胞内で最大の度合まで改変されるということもまた示唆される。

本発明者が同定した細胞内のオフターゲット部位は、本発明者のインビトロ選択において最も高度に濃縮されたもののうちの1つであり、目指すターゲット部位と相対的に4つの変異までを含有する。一方、へテロクロマチンまたは共有的なDNA修飾によって、Cas9:ガイドRNA複合体が細胞内のゲノムオフターゲット部位にアクセスする能力が損され得るということはあり得る。0または多くではなく、本研究の49個の試験した細胞のオフターゲット部位のうち5つの同定からは、Cas9によって媒介されるDNA切断は、最近の研究11、12、19によって示唆された通り、7〜12塩基対のターゲット配列のみの特異的なターゲティングに限定されないということが強く示唆される。

細胞のゲノム改変データは、インビトロ選択データおよび個々のアッセイにおいて観察された、sgRNA v2.1 sgRNAと比較したsgRNA v1.0の特異性の増大ともまた一致している。CLTA1−2−2、CLTA4−3−3、およびCLTA4−4−8部位はCas9−sgRNA v2.1複合体によって改変されたが、それらの3つの部位のいずれかの改変の証拠は、Cas9:sgRNA v1.0によって処置された細胞においては検出されなかった。CLTA4−3−1部位(これは、Cas9:v2.1 sgRNAによって処置された細胞においてオンターゲットCLTA4部位改変の頻度の32%で改変された)は、v1.0 sgRNAによって処置された細胞のオンターゲット改変頻度の0.5%でのみ改変された。これは選択性の62倍の変化をあらわしている。まとめると、これらの結果は、ガイドRNA構成が細胞内のCas9特異性に対してかなりの影響を有し得るということを証明している。本発明者の特異性プロファイリングの知見は、ガイドRNAの操作によってCas9:ガイドRNA複合体の総合的なDNA改変活性を改善するための最近および現行の労力に対して重要な忠告を示している11、15

総合的に、Cas9のオフターゲットDNA切断プロファイリングおよびその後の分析から、(i)Cas9:ガイドRNA認識が、試験した4つのターゲット部位について18〜20個の規定されたターゲット部位塩基対および2塩基対PAMに拡張され、(ii)Cas9:ガイドRNA濃度を増大させることによって、インビトロのDNA切断特異性が減少し得、(iii)より活性なsgRNA構成を用いることによって、インビトロおよび細胞内の両方でDNA切断特異性が増大し得るが、インビトロおよび細胞内の両方でDNA切断特異性が害され得、(iv)本発明者のインビトロの結果から予測される通り、Cas9:ガイドRNAによって、オンターゲット部位と相対的に4つの変異まで、細胞内のオフターゲット部位が改変され得るということが示されている。本発明者の知見は、RNAによってプログラムされるCas9特異性の我々の理解への鍵となる知識を提供し、DNA切断特異性におけるsgRNA構成の以前に未知の役割を明らかにしている。本研究において明らかにされた原理は、DNA切断以上の機能を媒介するように操作されたCas9に基づくエフェクターにもまた適用され得る。

均等物および範囲 当業者は、本明細書に記載される本発明の具体的な態様の多くの均等物を認識するか、または慣例以下の実験法を用いて確認する能力があるであろう。本発明の範囲は上の記載に限定されることを目指されているのではなく、添付の請求項において示される通りとする。

請求項において、反対に指示されないかまたは文脈から別様に明白でない限り、「a」、「an」、および「the」などの冠詞は1つまたは1つよりも多くを意味し得る。反対に示されないかまたは文脈から別様に明白でない限り、群の1つまたは2つ以上のメンバー間に「または」を包含する請求項または記載は、群のメンバーの1つ、1つよりも多く、または全てが所与の産物またはプロセスにおいて存在する、使用される、または別様に関係する場合に満たされていると考慮される。本発明は、群の厳密に1つのメンバーが所与の産物またはプロセスにおいて存在する、使用される、または別様に関係する態様を包含する。本発明は、群のメンバーの1つよりも多くまたは全てが所与の産物またはプロセスにおいて存在する、使用される、または別様に関係する態様をもまた包含する。

なおその上に、本発明は、請求項の1つもしくは2つ以上または記載の関係する部分からの1つまたは2つ以上の限定、要素、節、説明用語などが別の請求項中に導入される全ての変形、組み合わせ、および入れ替えを包摂するということが理解されるべきである。例えば、別の請求項に依存的であるいずれかの請求項が改変されて、同じ基礎請求項に依存的であるいずれかの他の請求項中に見いだされる1つまたは2つ以上の限定を包含し得る。なおその上に、請求項が組成物を記述しているところでは、別様に示されない限り、または矛盾または不一致がもたらされるであろうということが当業者に明白でない限り、本明細書において開示される目的のいずれかのために組成物を用いる方法が包含され、本明細書において開示される作る方法または当分野において公知の他の方法のいずれかに従って組成物を作る方法が包含されるということが理解されるべきである。

要素がリストとして(例えばマーカッシュ群形式で)示されているところでは、要素の各下位群もまた開示され、いずれかの要素(単数または複数)が群から除去され得るということは理解されるべきである。用語「含む」は開放的であることが目指されており、追加の要素またはステップの包含を許可するということもまた注記される。一般的に、本発明または本発明の側面が特定の要素、特徴、ステップなどを含むと言われるところでは、本発明のある態様または本発明の側面がかかる要素、特徴、ステップなどからなるかまたは本質的になるということは理解されるべきである。単純の目的のために、それらの態様は本明細書においては一々具体的に示されなかった。それゆえに、1つまたは2つ以上の要素、特徴、ステップなどを含む本発明の各態様について、本発明は、それらの要素、特徴、ステップなどからなるかまたは本質的になる態様をもまた提供する。

範囲が与えられているところでは、エンドポイントは包含される。なおその上に、別様に示されないかまたは文脈および/もしくは当業者の理解から別様に明白でない限り、範囲として表現されている値は、本発明の異なる態様において記された範囲内のいずれかの具体的な値を、文脈が明確に別様に述べていない限り、範囲の下限の単位の1/10までとり得るいうことが理解されるべきである。別様に示されないかまたは文脈および/もしくは当業者の理解から別様に明白でない限り、範囲として表現される値は所与の範囲内のいずれかの部分範囲をとり得、部分範囲のエンドポイントは範囲の下限の単位の1/10と同じ精度で表現されるということもまた理解されるべきである。

加えて、本発明のいずれかの特定の態様は請求項のいずれかの1つまたは2つ以上からはっきりと排除され得るということは、理解されるべきである。範囲が与えられているところでは、範囲内のいずれかの値は請求項のいずれかの1つまたは2つ以上からはっきりと排除され得る。本発明の組成物および/または方法のいずれかの態様、要素、特徴、利用、または側面は、いずれかの1つまたは2つ以上の請求項から排除され得る。簡潔さの目的のために、1つまたは2つ以上の要素、特徴、目的、または側面が排除される態様の全てが本明細書においてはっきりと示されてはいない。

表 表1.Cas9:CLTA4 sgRNAによって誘導された細胞の改変。酵素制限または酵素飽和条件下でのCas9:CLTA4 v2.1 sgRNAインビトロ選択において濃縮された、33個のヒトゲノムDNA配列が同定された。下線によって示されている部位は、HEK293T細胞におけるかなりのCas9:sgRNAによって媒介される改変と一致する挿入または欠失(インデル)を含有する。Cas9:CLTA4 v1.0 sgRNAまたはCas9:CLTA4 v2.1 sgRNAによる選択のインビトロ濃縮値は、3つまたは2つ以下の変異を有する配列について示されている。インビトロ選択配列カウントの少数のため、濃縮値は、4つまたは5つ以上の変異を有する配列については算出しなかった。sgRNA無しのCas9(「sgRNA無し」)、CLTA4 v1.0 sgRNA有りのCas9、またはCLTA4 v2.1 sgRNA有りのCas9によって処置されたHEK293T細胞における改変頻度(合計の配列数によって除算されたインデルを有する配列数)。P値が、sgRNA無しのCas9によって処置した細胞と比較してv1.0 sgRNAまたはv2.1 sgRNAによって処置された細胞においてかなりの改変を示す部位について列挙されている。「試験せず(n.t.)」は、ゲノム配列のPCRが特異的な増幅産物を提供できなかったということを示す。

表2:生の選択配列カウント。位置−4〜−1は、20塩基対ターゲット部位の直前の4ヌクレオチドである。PAM1、PAM2、およびPAM3はターゲット部位の直後のPAM位置である。位置+4〜+7はPAMの直後の4ヌクレオチドである。

表3:CLTA1ゲノムオフターゲット配列。酵素制限または酵素過剰条件下でのCas9:CLTA1 v2.1 sgRNAインビトロ選択において濃縮された、20個のヒトゲノムDNA配列が同定された。「m」は、小文字で示されている変異を有するオンターゲット配列からの変異数を言う。下線によって示されている部位は、HEK293T細胞におけるかなりのCas9:sgRNAによって媒介される改変と一致する挿入または欠失(インデル)を含有する。ヒトゲノム座標が各部位について示されている(アセンブリGRCh37)。CLTA1−0−1は2つの遺伝子座に存在しており、配列カウントは両方の遺伝子座からプールした。配列カウントは、sgRNA無しのCas9(「sgRNA無し」)、CLTA1 v1.0 sgRNA有りのCas9、またはCLTA1 v2.1 sgRNA有りのCas9によって処置されたHEK293T細胞からの各部位について増幅およびシーケンシングされたDNAについて示されている。

表4:CLTA4ゲノムオフターゲット配列。酵素制限または酵素過剰条件下でのCas9:CLTA4 v2.1 sgRNAインビトロ選択において濃縮された、33個のヒトゲノムDNA配列が同定された。「m」は、小文字で示されている変異を有するオンターゲット配列からの変異数を言う。下線によって示されている部位は、HEK293T細胞におけるかなりのCas9:sgRNAによって媒介される改変と一致する挿入または欠失(インデル)を含有する。ヒトゲノム座標が各部位について示されている(アセンブリGRCh37)。配列カウントが、sgRNA無しのCas9(「sgRNA無し」)、CLTA4 v1.0 sgRNA有りのCas9、またはCLTA4 v2.1 sgRNA有りのCas9によって処置されたHEK293T細胞からの各部位について、増幅およびシーケンシングされたDNAについて示されている。

表5:CLTA1およびCLTA4オフターゲット部位のゲノム座標。酵素制限または酵素過剰条件下でのCas9:CLTA1 v2.1 sgRNAおよびCas9:CLTA4 v2.1 sgRNAインビトロ選択において濃縮された54個のヒトゲノムDNA配列が同定された。ヒトゲノム座標が各部位について示されている(アセンブリGRCh37)。

表6:Cas9:CLTA1 sgRNAによって誘導された細胞の改変。酵素制限または酵素過剰条件下でのCas9:CLTA1 v2.1 sgRNAインビトロ選択において濃縮された20個のヒトゲノムDNA配列が同定された。下線によって示されている部位は、HEK293T細胞におけるかなりのCas9:sgRNAによって媒介される改変と一致する挿入または欠失(インデル)を含有する。Cas9:CLTA1 v1.0 sgRNAまたはCas9:CLTA1 v2.1 sgRNAによる選択のインビトロ濃縮値が、3つまたは2つ以下の変異を有する配列について示されている。インビトロ選択配列カウントの少数のため、濃縮値は、4つまたは5つ以上の変異を有する配列については算出しなかった。sgRNA無しのCas9(「sgRNA無し」)、CLTA1 v1.0 sgRNA有りのCas9、またはCLTA1 v2.1 sgRNA有りのCas9によって処置されたHEK293T細胞における改変頻度(合計の配列数によって除算されたインデルを有する配列数)。sgRNA無しのCas9によって処置された細胞と比較してv1.0 sgRNAまたはv2.1 sgRNAによって処置された細胞においてかなりの改変を示す部位のP値は、CLTA1−0−1について1.1E−05(v1.0)および6.9E−55(v2.1)、CLTA1−1−1について2.6E−03(v1.0)および2.0E−10(v2.1)、CLTA1−2−2について4.6E−08(v2.1)であった。P値は、片側フィッシャーの正確確率検定を用いて算出した。「試験せず(n.t.)」は、部位が試験されなかったか、またはゲノム配列のPCRが特異的な増幅産物を提供できなかったということを示す。

表7:CLTA1ゲノムオフターゲットインデル配列。sgRNA無しのCas9(「sgRNA無し」)、CLTA1 v1.0 sgRNA有りのCas9、またはCLTA1 v2.1 sgRNA有りのCas9によって処置したHEK293T細胞からの、オンターゲットゲノム配列(CLTA1−0−1)および各改変されたオフターゲット部位について増幅およびシーケンシングされたDNAによる、処置した細胞からの挿入および欠失含有配列。「ref」は各部位のヒトゲノム参照配列を言い、改変された部位は下で列挙されている。オンターゲットゲノム配列に相対的な変異は小文字で示されている。挿入および欠失が、それぞれ下線付きの太字またはダッシュで示されている。改変のパーセンテージが、対照(sgRNA無し)と比較して改変された配列の統計的にかなりの濃縮を示す条件(v1.0 sgRNAまたはv2.1 sgRNA)について示されている。

表8:CLTA4ゲノムオフターゲットインデル配列。sgRNA無しのCas9(「sgRNA無し」)、CLTA4 v1.0 sgRNA有りのCas9、またはCLTA4 v2.1 sgRNA有りのCas9によって処置したHEK293T細胞からの、オンターゲットゲノム配列(CLTA4−0−1)および各改変されたオフターゲット部位について増幅およびシーケンシングされたDNAによる、処置した細胞からの挿入および欠失含有配列。「ref」は各部位のヒトゲノム参照配列を言い、改変された部位は下で列挙されている。オンターゲットゲノム配列に相対的な変異は小文字で示されている。挿入および欠失は、それぞれ下線付きの太字またはダッシュで示されている。改変のパーセンテージが、対照(sgRNA無し)と比較して改変された配列の統計的にかなりの濃縮を示す条件(v1.0 sgRNAまたはv2.1 sgRNA)について示されている。

表9:本研究に用いられたオリゴヌクレオチド。全てのオリゴヌクレオチドはIntegrated DNA Technologiesから購入した。星印(*)は、直前のヌクレオチドが、直前のヌクレオチドに対応するホスホロアミダイトの79mol%と他の3つの標準的なホスホロアミダイトのそれぞれの4mol%とからなるホスホロアミダイトのハンドミックスとして組み込まれたということを示している。「/5Phos/」は、合成中に取り付けられた5’リン酸基を表示している。

本明細書に挙げられた全ての刊行物、特許、および配列データベースエントリー(上に列挙されたアイテムを包含する)は、各個体の刊行物または特許が参照によって組み込まれるのを具体的に個体的に示された場合と同じく、それらの全体が参照によってここに組み込まれる。相反のケースでは、本願(本明細書のいずれかの定義を包含する)がコントロールする。

QQ群二维码
意见反馈