首页 / 国际专利分类库 / 化学;冶金 / 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程 / / 作用于酯键的水解酶 (3.1) / CRISPRハイブリッドDNA/RNAポリヌクレオチドおよび使用方法

CRISPRハイブリッドDNA/RNAポリヌクレオチドおよび使用方法

申请号 JP2017539643 申请日 2016-01-27 公开(公告)号 JP2018503386A 公开(公告)日 2018-02-08
申请人 パイオニア ハイ−ブレッド インターナショナル, インコーポレイテッド; 发明人 アンドリュー・ピー・メイ; ポール・ディー・ドノヒュー;
摘要 本開示は、DNAに誘導されるCRISPR系;CRISPR系で使用するためのDNA、RNAおよびそれらの混合物を含むポリヌクレオチド;ならびにかかるポリヌクレオチドおよびDNAに誘導されるCRISPR系を含む使用方法を提供する。
权利要求

単一ポリヌクレオチドであって、 デオキシリボ核酸(DNA)を含むターゲティング領域と; リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域と; を含み、 ここで、前記単一ポリヌクレオチドは、クラス2 CRISPR系で使用するためのものである、前記単一ポリヌクレオチド。活性化領域はDNAを含む、請求項1に記載のポリヌクレオチド。ターゲティング領域は、DNAおよびRNAの混合物を含む、請求項1に記載のポリヌクレオチド。ターゲティング領域は、DNAおよびRNAの混合物を含み、活性化領域は、DNAおよびRNAの混合物を含む、請求項1に記載のポリヌクレオチド。前記活性化領域は、前記ターゲティング領域の下流にある、請求項1に記載のポリヌクレオチド。前記活性化領域は、下方ステム、バルジ、上方ステム、ネクサス、およびヘアピンからなる群から選択される構造を含む、請求項5に記載のポリヌクレオチド。前記活性化領域は、前記ターゲティング領域の上流にある、請求項1に記載のポリヌクレオチド。前記活性化領域は、ステムループ構造を含む、請求項7に記載のポリヌクレオチド。前記活性化領域は、Cas9タンパク質と相互作用する、請求項1に記載のポリヌクレオチド。前記活性化領域は、Cpf1タンパク質と相互作用する、請求項1に記載のポリヌクレオチド。クラス2 CRISPR系であって、 デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域を含む単一ポリヌクレオチドと; リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域と; 部位特異的ポリペプチドと を含む、前記クラス2 CRISPR系。前記活性化領域は、前記ターゲティング領域の下流にあり、前記部位特異的ポリペプチドは、Cas9を含む、請求項11に記載のクラス2 CRISPR系。前記活性化領域は、下方ステム、バルジ、上方ステム、ネクサス、およびヘアピンからなる群から選択される構造を含む、請求項12に記載のクラス2 CRISPR系。前記活性化領域は、前記ターゲティング領域の上流にあり、前記部位特異的ポリペプチドは、Cpf1を含む、請求項11に記載のクラス2 CRISPR系。前記活性化領域は、ステムループ構造を含む、請求項14に記載のクラス2 CRISPR系。前記部位特異的ポリペプチドは、前記活性化領域と相互作用する、請求項11に記載のクラス2 CRISPR系。前記ターゲティング領域は、DNAおよびRNAの混合物を含む、請求項11に記載のクラス2 CRISPR系。前記活性化領域は、DNAおよびRNAの混合物を含む、請求項11に記載のクラス2 CRISPR系。前記ターゲティング領域は、DNAおよびRNAの混合物を含み、前記活性化領域は、DNAおよびRNAの混合物を含む、請求項11に記載のクラス2 CRISPR系。ドナーポリヌクレオチドをさらに含む、請求項11に記載のクラス2 CRISPR系。クラス2 CRISPR系であって、 (i)デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域および(ii)リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域を含む第1のポリヌクレオチドと; 前記第1のポリヌクレオチドの前記活性化領域における配列に相補的な配列を含む第2のポリヌクレオチドと; 部位特異的ポリペプチドと を含む、前記クラス2 CRISPR系。前記活性化領域および前記第2のポリヌクレオチドは、下方ステム、バルジ、上方ステム、ネクサス、および二本鎖からなる群から選択される1つまたはそれ以上の構造を形成するようにハイブリダイズする、請求項21に記載のクラス2 CRISPR系。前記部位特異的ポリペプチドは、Cas9およびCpf1からなる群から選択される、請求項21に記載のクラス2 CRISPR系。前記部位特異的ポリペプチドは、前記活性化領域と相互作用する、請求項21に記載のクラス2 CRISPR系。前記活性化領域は、DNAをさらに含む、請求項21に記載のクラス2 CRISPR系。前記第2のポリヌクレオチドは、RNAを含む、請求項21に記載のクラス2 CRISPR系。前記第2のポリヌクレオチドは、DNAをさらに含む、請求項26に記載のクラス2 CRISPR系。2つのポリヌクレオチドであって、 (i)デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域および(ii)リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域を含む第1のポリヌクレオチドと; 前記第1のポリヌクレオチドの前記活性化領域における配列に相補的な配列を含む第2のポリヌクレオチドと を含み、ここで、前記2つのポリヌクレオチドは、クラス2 CRISPR系で使用するためのものである、前記2つのポリヌクレオチド。前記活性化領域および前記第2のポリヌクレオチドは、下方ステム、バルジ、上方ステム、ネクサス、および二本鎖からなる群から選択される1つまたはそれ以上の構造を形成するようにハイブリダイズする、請求項28に記載の2つのポリヌクレオチド。前記ターゲティング領域は、DNAおよびRNAの混合物を含み、前記活性化領域は、DNAおよびRNAの混合物を含み、前記第2のポリヌクレオチドは、DNAおよびRNAの混合物を含む、請求項28に記載の2つのポリヌクレオチド。標的核酸分子を修飾する方法であって、標的配列を有する前記標的核酸分子を、請求項11〜19または請求項21〜27のいずれか1項に記載のクラス2 CRISPR系と接触させることを含み、ここで、前記標的核酸分子が切断されるか、または前記標的核酸分子によりコードされる少なくとも1つの遺伝子の転写が調節される、前記方法。前記標的核酸分子は、DNAを含む、請求項31に記載の方法。前記標的核酸分子は、RNAを含む、請求項31に記載の方法。前記標的核酸分子は、DNAおよびRNAの混合物を含む、請求項31に記載の方法。ドナーポリヌクレオチドを供給することをさらに含む、請求項31に記載の方法。クラス2 CRISPR系を使用してオフターゲットの修飾を低減させる方法であって、標的配列を有する標的核酸分子を、請求項11〜19または請求項21〜27のいずれか1項に記載のクラス2 CRISPR系と接触させることを含み、ここで、前記標的核酸分子が、該標的核酸における他の配列よりも優先的に該標的配列で切断されるかまたは編集されて、それによりオフターゲットの修飾を低減させる、前記方法。前記標的核酸分子は、DNAを含む、請求項36に記載の方法。前記標的核酸分子は、RNAを含む、請求項36に記載の方法。前記標的核酸分子は、DNAおよびRNAの混合物を含む、請求項36に記載の方法。クラス2 CRISPR系で使用するためのポリヌクレオチドのターゲティング領域は、ウラシルを含まない、請求項36に記載の方法。ドナーポリヌクレオチドを供給することをさらに含む、請求項36に記載の方法。クラス2 CRISPR系を使用して標的特異的な修飾を増加させる方法であって、標的配列を有する標的核酸分子を、請求項11〜19または請求項21〜27のいずれか1項に記載のクラス2 CRISPR系と接触させることを含み、ここで、前記標的核酸分子が、該標的核酸における他の配列よりも優先的に該標的配列で切断されるかまたは編集されて、それにより標的特異的な修飾を増加させる、前記方法。前記標的核酸分子は、DNAを含む、請求項42に記載の方法。前記標的核酸分子は、RNAを含む、請求項42に記載の方法。前記標的核酸分子は、DNAおよびRNAの混合物を含む、請求項42に記載の方法。ドナーポリヌクレオチドを供給することをさらに含む、請求項42に記載の方法。クラス2 CRISPR系を使用して、ドナーポリヌクレオチドを細胞または生物のゲノムへ導入する方法であって、標的配列を有する標的核酸分子を、請求項11〜19または請求項21〜27のいずれか1項に記載のクラス2 CRISPR系と接触させることを含み、ここで、前記標的核酸分子が、該標的配列で、またはその付近で切断されて、また該切断部位で該細胞または生物の該ゲノムへ導入されるドナーポリヌクレオチドを供給することを含む前記方法。前記標的核酸分子は、DNAを含む、請求項47に記載の方法。前記標的核酸分子は、RNAを含む、請求項47に記載の方法。前記標的核酸分子は、DNAおよびRNAの混合物を含む、請求項47に記載の方法。ドナーポリヌクレオチドは、相同組換えによって核酸へ導入される、請求項47に記載の方法。ドナーポリヌクレオチドは、非相同末端結合によって核酸へ導入される、請求項47に記載の方法。

说明书全文

関連出願の相互参照 本出願は、全てが参照によって本明細書に組み入れられている、2015年1月28日に出願した米国仮特許出願第62/108,931号および2015年11月5日に出願した米国仮特許出願第62/251548号の利益を主張する。

配列表 本出願は、その全体が参照によって本明細書に組み入れられている、ASCIIフォーマットで電子的に提出した配列表を含有する。2016年1月26日に作成した上記ASCIIコピーは、0198470101PTWO_SL.txtと名付けられ、サイズが83,522バイトである。

Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)およびCRISPR関連(Cas)系は、Ishinoによって大腸菌において最初に発見された原核生物免疫系である。非特許文献1。この免疫系は、配列特異的な様式でウイルスおよびプラスミドの核酸を標的とすることによって、ウイルスおよびプラスミドに対する免疫性を提供する。

この免疫系に関与する2つの主要な段階が存在し、第1の段階は獲得であり、第2の段階は干渉である。第1のステージは、侵入しているウイルスおよびプラスミドのゲノムを切断することと、このセグメントを生物のCRISPR遺伝子座に組み込むこととを含む。ゲノムに組み込まれるセグメントは、プロトスペーサーとして公知であり、同じウイルスまたはプラスミドによる続く攻撃から生物を保護するのを助長する。第2の段階は、侵入しているウイルスまたはプラスミドを攻撃することを含む。この段階は、プロトスペーサーがRNAに転写されること、このRNAが、幾つかのプロセシング後に、続いて進入しているウイルスまたはプラスミドのDNAにおいて相補的な配列とハイブリダイズすると同時にDNAを効果的に切断するタンパク質、またはタンパク質複合体とも結合することに依存する。

幾つかの異なるCRISPR/Cas系および命名法が存在し、これらの分類は、系がさらに特徴付けられると変化した。タイプII系では、CRISPR/Cas系の一部であるCRISPR RNA(crRNA)およびトランス活性化CRISPR RNA(tracrRNA)のRNAの2つの鎖が存在する。tracrRNAは、crRNAへのpre−crRNAの成熟を引き起こすpre−crRNAの相補領域にハイブリダイズする。tracrRNAおよびcrRNAによって形成される二本鎖は、標的核酸における配列に相補的であるか、またはハイブリダイズするcrRNAの配列によって標的核酸に誘導されるタンパク質Cas9によって認識されて、それと結合する。RNAベースの免疫系のこれらの最小の構成成分が、単一タンパク質および2つのRNAガイド配列または単一RNA分子を使用することによって、部位特異的な様式でDNAを標的とするよう再プログラムすることができることが立証された。CRISPR/Cas系は、あらゆる新たな標的遺伝子座には新生タンパク質工学を必要とする可能性がある、エンドヌクレアーゼ、メガヌクレアーゼ、Znフィンガーヌクレアーゼ、および転写活性因子様エフェクターヌクレアーゼ(TALEN)を含むゲノム編集の他の方法よりも優れている。

RNAに誘導される系である場合、CRISPR/Cas系は、RNA鎖のRNase A分解およびRNA−DNAミスマッチの高い蓋然性のようなRNA−DNAハイブリッド構造に関する問題を起こしやすい傾向があり得る。さらに、DNAオリゴヌクレオチドの合成は、RNAオリゴヌクレオチドの合成よりも経済的で、かつ頑強である。DNAに誘導されるCRISPR系はまた、天然に存在するRNAに誘導されるRISPR系と比較して、特異的な標的にさらなる機構を補充することもできる。RNAベースのCRISPR/Cas系と関連した課題を克服して、DNA合成のコストの減少および頑強性の増加を得る機会を提供して、CRISPR/Cas系の特異性を改善する、系の改善に対する要求が存在する。

Ishinoら、1987(Journal of Bacteriology 169(12):5429〜5433頁(1987年))

幾つかの実施形態では、本開示は、クラス2 CRISPR系で使用するための単一ポリヌクレオチドであって、デオキシリボ核酸(DNA)を含むターゲティング領域と;リボ核酸(RNA)を含む活性化領域とを含む単一ポリヌクレオチドを提供する。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含み、活性化領域は、DNA、RNAまたはDNAおよびRNAの混合物を含む。

幾つかの実施形態では、本開示は、クラス2 CRISPR系で使用するための単一ポリヌクレオチドであって、デオキシリボ核酸(DNA)を含むターゲティング領域と;リボ核酸(RNA)を含む前記ターゲティング領域に隣接したポリヌクレオチド領域を含む活性化領域とを含む単一ポリヌクレオチドを提供する。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含み、活性化領域は、DNA、RNAまたはDNAおよびRNAの混合物を含む。幾つかの実施形態では、活性化領域は、ターゲティング領域の下流にある。幾つかの実施形態では、活性化領域は、ターゲティング領域の上流にある。幾つかの実施形態では、活性化領域は、下方ステム、バルジ、上方ステム、ネクサス、およびヘアピンからなる群から選択される構造を含む。幾つかの実施形態では、活性化領域は、ステムループ構造を含む。幾つかの実施形態では、活性化領域は、Cas9タンパク質と相互作用する。幾つかの実施形態では、活性化領域は、Cpf1タンパク質と相互作用する。

幾つかの実施形態では、本開示は、クラス2 CRISPR系であって、デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域を含む単一ポリヌクレオチドと;リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域と;部位特異的ポリペプチドとを含むクラス2 CRISPR系を提供する。幾つかの実施形態では、核酸はDNAであり、幾つかの実施形態では、核酸はRNAであり、幾つかの実施形態では、核酸は、DNAおよびRNAの混合物である。幾つかの実施形態では、活性化領域は、ターゲティング領域の下流にある。幾つかの実施形態では、活性化領域は、ターゲティング領域の上流にある。幾つかの実施形態では、部位特異的ポリペプチドはCas9タンパク質である。幾つかの実施形態では、部位特異的ポリペプチドはCpf1タンパク質である。幾つかの実施形態では、活性化領域は、下方ステム、バルジ、上方ステム、ネクサス、およびヘアピンからなる群から選択される構造を含む。幾つかの実施形態では、活性化領域は、ステムループ構造を含む。幾つかの実施形態では、活性化領域は、部位特異的ポリペプチドと相互作用する。幾つかの実施形態では、活性化領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、クラス2 CRISPR系は、ドナーポリヌクレオチドをさらに含む。

幾つかの実施形態では、本開示は、クラス2 CRISPR系であって、(i)デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域および(ii)リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域を含む第1のポリヌクレオチドと;前記第1のポリヌクレオチドの前記活性化領域における配列に相補的な配列を含む第2のポリヌクレオチドと;部位特異的ポリペプチドとを含むクラス2 CRISPR系を提供する。幾つかの実施形態では、活性化領域および第2のポリヌクレオチドは、下方ステム、バルジ、上方ステム、ネクサス、および二本鎖からなる群から選択される1つまたはそれ以上の構造を形成するようにハイブリダイズする。幾つかの実施形態では、部位特異的ポリペプチドは、Cas9タンパク質である。幾つかの実施形態では、部位特異的ポリペプチドは、Cpf1タンパク質である。幾つかの実施形態では、部位特異的ポリペプチドは、活性化領域と相互作用する。幾つかの実施形態では、活性化領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、第2のポリヌクレオチドは、RNA、DNAまたはDNAおよびRNAの混合物を含む。

幾つかの実施形態では、本開示は、クラス2 CRISPR系で使用するための2つのポリヌクレオチドであって、(i)デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域および(ii)リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域を含む第1のポリヌクレオチドと;前記第1のポリヌクレオチドの前記活性化領域における配列に相補的な配列を含む第2のポリヌクレオチドとを含む2つのポリヌクレオチドを提供する。幾つかの実施形態では、活性化領域および第2のポリヌクレオチドは、下方ステム、バルジ、上方ステム、ネクサス、および二本鎖からなる群から選択される1つまたはそれ以上の構造を形成するようにハイブリダイズする。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含み、活性化領域は、DNAおよびRNAの混合物を含み、第2のポリヌクレオチドは、DNAおよびRNAの混合物を含む。

幾つかの実施形態では、本開示は、標的核酸分子を修飾する方法であって、標的配列を有する標的核酸分子を、デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域と;リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域と;部位特異的ポリペプチドとを含む単一ポリヌクレオチドと接触させることを含み、ここで、単一ポリヌクレオチドは、部位特異的ポリペプチドと複合体を形成し、前記標的核酸分子が切断されるか、または標的核酸分子によりコードされる少なくとも1つの遺伝子の転写が調節される方法を提供する。幾つかの実施形態では、標的核酸は、DNAであり、幾つかの実施形態では、標的核酸は、RNAであり、幾つかの実施形態では、標的核酸は、RNAおよびDNAの混合物である。幾つかの実施形態では、活性化領域は、ターゲティング領域の下流にある。幾つかの実施形態では、活性化領域は、ターゲティング領域の上流にある。幾つかの実施形態では、部位特異的ペプチドはCas9タンパク質である。幾つかの実施形態では、部位特異的ペプチドはCpf1タンパク質である。幾つかの実施形態では、活性化領域は、下方ステム、バルジ、上方ステム、ネクサス、およびヘアピンからなる群から選択される構造を含む。幾つかの実施形態では、活性化領域は、ステムループ構造を含む。幾つかの実施形態では、活性化領域は、部位特異的ポリペプチドと相互作用する。幾つかの実施形態では、活性化領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、上記方法は、ドナーポリヌクレオチドを供給することをさらに含む。

幾つかの実施形態では、本開示は、標的核酸分子を修飾する方法であって、標的配列を有する標的核酸分子を、(i)デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域および(ii)リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域を含む第1のポリヌクレオチドと接触させることと、前記第1のポリヌクレオチドの前記活性化領域における配列に相補的な配列を含む第2のポリヌクレオチドおよび部位特異的ポリペプチドを供給することとを含み、ここで、第1および第2のポリヌクレオチドは、部位特異的ポリペプチドと複合体を形成し、前記標的核酸分子が切断されるか、または標的核酸分子によりコードされる少なくとも1つの遺伝子の転写が調節される方法を提供する。幾つかの実施形態では、活性化領域および第2のポリヌクレオチドは、下方ステム、バルジ、上方ステム、ネクサス、および二本鎖からなる群から選択される1つまたはそれ以上の構造を形成するようにハイブリダイズする。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含み、活性化領域は、DNAおよびRNAの混合物を含み、第2のポリヌクレオチドは、DNAおよびRNAの混合物を含む。幾つかの実施形態では、上記方法は、ドナーポリヌクレオチドを供給することをさらに含む。

幾つかの実施形態では、本開示は、クラス2 CRISPR系を使用してオフターゲットの修飾を低減させる方法であって、標的配列を有する標的核酸分子を、デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域と;リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域と;部位特異的ポリペプチドとを含む単一ポリヌクレオチドと接触させることを含み、ここで、単一ポリヌクレオチドは、部位特異的ポリペプチドと複合体を形成し、前記標的核酸分子が、該標的核酸における他の配列よりも優先的に該標的配列で切断されるかまたは編集されて、それによりオフターゲットの修飾を低減させる方法を提供する。幾つかの実施形態では、標的核酸は、DNAであり、幾つかの実施形態では、標的核酸は、RNAであり、幾つかの実施形態では、標的核酸は、RNAおよびDNAの混合物である。幾つかの実施形態では、活性化領域は、ターゲティング領域の下流にある。幾つかの実施形態では、活性化領域は、ターゲティング領域の上流にある。幾つかの実施形態では、部位特異的ポリペプチドはCas9タンパク質である。幾つかの実施形態では、部位特異的ポリペプチドはCpf1タンパク質である。幾つかの実施形態では、活性化領域は、下方ステム、バルジ、上方ステム、ネクサス、およびヘアピンからなる群から選択される構造を含む。幾つかの実施形態では、活性化領域は、ステムループ構造を含む。幾つかの実施形態では、活性化領域は、部位特異的ポリペプチドと相互作用する。幾つかの実施形態では、活性化領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、前記ターゲティング領域は、ウラシルを含まない。幾つかの実施形態では、上記方法は、ドナーポリヌクレオチドを供給することをさらに含む。

幾つかの実施形態では、本開示は、クラス2 CRISPR系を使用してオフターゲットの修飾を低減させる方法であって、標的配列を有する標的核酸分子を、(i)デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域および(ii)リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域を含む第1のポリヌクレオチドと接触させることと、前記第1のポリヌクレオチドの前記活性化領域における配列に相補的な配列を含む第2のポリヌクレオチドおよび部位特異的ポリペプチドを供給することとを含み、ここで、第1および第2のポリヌクレオチドは、部位特異的ポリペプチドと複合体を形成し、前記標的核酸分子が、該標的核酸における他の配列よりも優先的に該標的配列で切断されるかまたは編集されて、それによりオフターゲットの修飾を低減させる方法を提供する。幾つかの実施形態では、標的核酸はDNAであり、幾つかの実施形態では、標的核酸はRNAであり、幾つかの実施形態では、標的核酸は、RNAおよびDNAの混合物である。幾つかの実施形態では、活性化領域および第2のポリヌクレオチドは、下方ステム、バルジ、上方ステム、ネクサス、および二本鎖からなる群から選択される1つまたはそれ以上の構造を形成するようにハイブリダイズする。幾つかの実施形態では、部位特異的ペプチドはCas9タンパク質である。幾つかの実施形態では、部位特異的ペプチドはCpf1タンパク質である。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含み、活性化領域は、DNAおよびRNAの混合物を含み、第2のポリヌクレオチドは、DNAおよびRNAの混合物を含む。幾つかの実施形態では、前記ターゲティング領域は、ウラシルを含まない。幾つかの実施形態では、上記方法は、ドナーポリヌクレオチドを供給することをさらに含む。

幾つかの実施形態では、本開示は、クラス2 CRISPR系を使用して標的特異的な修飾を増加させる方法であって、標的配列を有する標的核酸分子を、デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域と;リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域と;部位特異的ポリペプチドとを含む単一ポリヌクレオチドと接触させることを含み、ここで、単一ポリヌクレオチドは、部位特異的ポリペプチドと複合体を形成し、前記標的核酸分子が、該標的核酸における他の配列よりも優先的に該標的配列で切断されるかまたは編集されて、それにより標的特異的な修飾を増加させる方法を提供する。幾つかの実施形態では、標的核酸は、DNAであり、幾つかの実施形態では、標的核酸は、RNAであり、幾つかの実施形態では、標的核酸は、RNAおよびDNAの混合物である。幾つかの実施形態では、活性化領域は、ターゲティング領域の下流にある。幾つかの実施形態では、活性化領域は、ターゲティング領域の上流にある。幾つかの実施形態では、部位特異的ポリペプチドはCas9タンパク質である。幾つかの実施形態では、部位特異的ポリペプチドはCpf1タンパク質である。幾つかの実施形態では、活性化領域は、下方ステム、バルジ、上方ステム、ネクサス、およびヘアピンからなる群から選択される構造を含む。幾つかの実施形態では、活性化領域は、ステムループ構造を含む。幾つかの実施形態では、活性化領域は、部位特異的ポリペプチドと相互作用する。幾つかの実施形態では、活性化領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、上記方法は、ドナーポリヌクレオチドを供給することをさらに含む。

幾つかの実施形態では、本開示は、クラス2 CRISPR系を使用して標的特異的な修飾を増加させる方法であって、標的配列を有する標的核酸分子を、(i)デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域および(ii)リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域を含む第1のポリヌクレオチドと接触させることと、前記第1のポリヌクレオチドの前記活性化領域における配列に相補的な配列を含む第2のポリヌクレオチドおよび部位特異的ポリペプチドを供給することとを含み、ここで、第1および第2のポリヌクレオチドは、部位特異的ポリペプチドと複合体を形成し、前記標的核酸分子が、該標的核酸における他の配列よりも優先的に該標的配列で切断されるかまたは編集されて、それにより標的特異的な修飾を増加させる方法を提供する。幾つかの実施形態では、標的核酸はDNAであり、幾つかの実施形態では、標的核酸はRNAであり、幾つかの実施形態では、標的核酸は、RNAおよびDNAの混合物である。幾つかの実施形態では、活性化領域および第2のポリヌクレオチドは、下方ステム、バルジ、上方ステム、ネクサス、および二本鎖からなる群から選択される1つまたはそれ以上の構造を形成するようにハイブリダイズする。幾つかの実施形態では、部位特異的ポリペプチドはCas9タンパク質である。幾つかの実施形態では、部位特異的ポリペプチドはCpf1タンパク質である。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含み、活性化領域は、DNAおよびRNAの混合物を含み、第2のポリヌクレオチドは、DNAおよびRNAの混合物を含む。幾つかの実施形態では、前記ターゲティング領域は、ウラシルを含まない。幾つかの実施形態では、上記方法は、ドナーポリヌクレオチドを供給することをさらに含む。

幾つかの実施形態では、本開示は、クラス2 CRISPR系を使用して、ドナーポリヌクレオチドを細胞または生物のゲノムへ導入する方法であって、標的配列を有する標的核酸分子を、デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域と;リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域と;部位特異的ポリペプチドとを含む単一ポリヌクレオチドと接触させることを含み、ここで、単一ポリヌクレオチドは、部位特異的ポリペプチドと複合体を形成し、前記標的核酸分子が、該標的配列で、またはその付近で切断されて、また該切断部位で該細胞または生物の該ゲノムへ導入されるドナーポリヌクレオチドを供給することを含む方法を提供する。幾つかの実施形態では、標的核酸は、DNAであり、幾つかの実施形態では、標的核酸は、RNAであり、幾つかの実施形態では、標的核酸は、RNAおよびDNAの混合物である。幾つかの実施形態では、活性化領域は、ターゲティング領域の下流にある。幾つかの実施形態では、活性化領域は、ターゲティング領域の上流にある。幾つかの実施形態では、部位特異的ポリペプチドはCas9タンパク質である。幾つかの実施形態では、部位特異的ポリペプチドはCpf1タンパク質である。幾つかの実施形態では、活性化領域は、下方ステム、バルジ、上方ステム、ネクサス、およびヘアピンからなる群から選択される構造を含む。幾つかの実施形態では、活性化領域は、ステムループ構造を含む。幾つかの実施形態では、活性化領域は、部位特異的ポリペプチドと相互作用する。幾つかの実施形態では、活性化領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、ドナーポリヌクレオチドは、相同組換えによって核酸へ導入される。幾つかの実施形態では、ドナーポリヌクレオチドは、非相同末端結合によって核酸へ導入される。

幾つかの実施形態では、本開示は、クラス2 CRISPR系を使用して、ドナーポリヌクレオチドを細胞または生物のゲノムへ導入する方法であって、標的配列を有する標的核酸分子を、(i)デオキシリボ核酸(DNA)を含み、核酸における標的配列とハイブリダイズするように構成されるターゲティング領域および(ii)リボ核酸(RNA)を含む前記ターゲティング領域に隣接した活性化領域を含む第1のポリヌクレオチドと接触させることと;前記第1のポリヌクレオチドの前記活性化領域における配列に相補的な配列を含む第2のポリヌクレオチドおよび部位特異的ポリペプチドを供給することとを含み、ここで、第1および第2のポリヌクレオチドは、部位特異的ポリペプチドと複合体を形成し、前記標的核酸分子が、該標的配列で、またはその付近で切断されて、また該切断部位で該細胞または生物の該ゲノムへ導入されるドナーポリヌクレオチドを供給することを含む方法を提供する。幾つかの実施形態では、標的核酸はDNAであり、幾つかの実施形態では、標的核酸はRNAであり、幾つかの実施形態では、標的核酸は、RNAおよびDNAの混合物である。幾つかの実施形態では、活性化領域および第2のポリヌクレオチドは、下方ステム、バルジ、上方ステム、ネクサス、および二本鎖からなる群から選択される1つまたはそれ以上の構造を形成するようにハイブリダイズする。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含み、活性化領域は、DNAおよびRNAの混合物を含み、第2のポリヌクレオチドは、DNAおよびRNAの混合物を含む。幾つかの実施形態では、活性化領域は、部位特異的ポリペプチドと相互作用する。幾つかの実施形態では、活性化領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、ターゲティング領域は、DNAおよびRNAの混合物を含む。幾つかの実施形態では、部位特異的ポリペプチドはCas9タンパク質である。幾つかの実施形態では、部位特異的ポリペプチドはCpf1タンパク質である。幾つかの実施形態では、ドナーポリヌクレオチドは、相同組換えによって核酸へ導入される。幾つかの実施形態では、ドナーポリヌクレオチドは、非相同末端結合によって導入される。幾つかの実施形態では、ドナーポリヌクレオチドは、マイクロホモロジー媒介末端結合によって核酸へ導入される。幾つかの実施形態では、ドナーポリヌクレオチドは、一本鎖アニーリングによって導入される。

図1Aは、タイプII CRISPR系のcrD(R)NAおよびtracrRNAを示す図である。図1Bは、互いにハイブリダイズした本開示の2つのポリヌクレオチド(crD(R)NAおよびtracrRNAまたはtracrD(R)NA)(「二重ガイド」系とも称される)を示す図である。

活性化領域に連結されたターゲティング領域を含む本開示の単一ポリヌクレオチド(「単一ガイド」系または「単一ガイドD(R)NA」または「sg D(R)NA」とも称される)を示す図である。

本開示の核酸ターゲティングポリヌクレオチドを使用したタイプII CRISPR/Cas系を用いた標的DNA配列の切断を示す図である。

図4AおよびBは、本開示の核酸ターゲティングポリヌクレオチドを使用したタイプII CRISPR/Cas系による様々な標的配列の切断の量を決定するためのin vitro生化学アッセイの結果を示す図である。

本開示の核酸ターゲティングポリヌクレオチドを使用したタイプII CRISPR/Cas系による標的配列の切断の量を決定するためのin vivoアッセイの結果を示す図である。

本開示の核酸ターゲティングポリヌクレオチドを使用したタイプII CRISPR/Cas系による標的配列のオフターゲットの切断の量を決定するためのin vitro生化学アッセイの結果を示す図である。

本開示の核酸ターゲティングポリヌクレオチドを使用したタイプII CRISPR/Cas系による標的配列の切断の量を決定するためのin vivoアッセイの結果を示す図である。

in vitroでプラスミド標的に対するCas9−D10Aタンパク質によるcrD(R)NAまたはsgD(R)NAのニッキング活性の結果を示す図である。

タイプV CRISPR系由来のcrRNAの典型的な構造を示す図である。

図10A〜Cは、タイプV CRISPR系で使用するための本開示の単一ガイドD(R)NAの考え得る構造を示す図である。

図11A〜Eは、タイプV CRISPR系で使用するための本開示の単一ガイドD(R)NAの考え得る構造を示す図である。

図11−1の続き。

図12A〜Iは、タイプV CRISPR系で使用するためのcrRNAおよび/またはcrD(R)NAを含む本開示の二重ガイドの考え得る構成成分を示す図である。

図13A〜Hは、タイプV CRISPR系で使用するためのcrRNAおよび/またはcrD(R)NAを含む本開示の二重ガイドの考え得る形を示す図である。

本開示の核酸ターゲティングポリヌクレオチドを使用したタイプII CRISPR/Cas系による標的配列の切断の量を決定するためのin plantaアッセイのシーケンシングの結果を示す図である。

本開示の核酸ターゲティングポリヌクレオチドを使用したタイプII CRISPR/Cas系による標的配列の切断の量を決定するためのin plantaアッセイのシーケンシングの結果を示す図である。

CRISPR/Cas系は、5個のタイプおよび16個のサブタイプを含む2つのクラスに最近再分類された。Makarovaら(Nature Reviews Microbiology 13:1〜15頁(2015年))。この分類は、CRISPR/Cas遺伝子座における全てのcas遺伝子を同定すること、続いて各CRISPR/Cas遺伝子座におけるシグネチャー遺伝子を決定すること、最終的にCRISPR/Cas系を、エフェクターモジュール、即ち、干渉段階に関与するタンパク質をコードする遺伝子に基づいてクラス1またはクラス2のいずれかに配置させることができることを決定することに基づく。

クラス1系は、多サブユニットcrRNA−エフェクター複合体を有するのに対して、クラス2系は、Cas9、Cpf1、C2c1、C2c2、C2c3またはcrRNA−エフェクター複合体のような単一タンパク質を有する。クラス1系は、タイプI、タイプIIIおよびタイプIV系を含む。クラス2系は、タイプIIおよびタイプV系を含む。

タイプI系は全て、ヘリカーゼ活性および切断活性を有するCas3タンパク質を有する。タイプI系は、7個のサブタイプ(I−A〜I−FおよびI−U)に、さらに分けられる。タイプIサブタイプはそれぞれ、シグネチャー遺伝子の規定の組合せおよびオペロン機構の異なった特徴を有する。例えば、サブタイプI−AおよびI−Bは2つまたはそれ以上のオペロンにおいて組織化されるcas遺伝子を有するように見えるのに対して、サブタイプI−C〜I−Fは、単一オペロンによってコードされるcas遺伝子を有するように見える。タイプI系は、CRISPR/Cas免疫系のプロセシングおよび干渉段階に関与している多タンパク質crRNA−エフェクター複合体を有する。この多タンパク質複合体は、抗ウイルス性防御(カスケード)に関するCRISPR関連複合体として公知である。サブタイプI−Aは、小さなサブユニットタンパク質をコードするcsa5ならびに分解される大きなサブユニットおよび小さなサブユニットをコードする2つに分割され、また分断cas3遺伝子も有するcas8遺伝子を含む。サブタイプI−A CRISPR/Cas系を有する微生物の例は、アーケオグロブス・フルギダス(Archaeoglobus fulgidus)である。

サブタイプI−Bは、cas1−cas2−cas3−cas4−cas5−cas6−cas7−cas8遺伝子配置を有し、csa5遺伝子を欠如している。サブタイプI−Bを有する微生物の例は、クロストリジウム・クライベリ(Clostridium kluyveri)である。サブタイプI−Cは、cas6遺伝子を有さない。サブタイプI−Cを有する微生物の例は、バチルス・ハロデュランス(Bacillus halodurans)である。サブタイプI−Dは、Cas8の代わりにCas10dを有する。サブタイプI−Dを有する微生物の例は、シアノセイス属種(Cyanothece sp.)である。サブタイプI−Eは、cas4を有さない。サブタイプI−Eを有する微生物の例は、大腸菌(Escherichia coli)である。サブタイプI−Fは、cas4を有さず、cas3に融合されたcas2を有する。サブタイプI−Fを有する微生物の例は、エルシニア・シュードツベルクローシス(Yersinia pseudotuberculosis)である。サブタイプI−Uを有する微生物の例は、ジオバクター・サルフレドゥセンス(Geobacter sulfurreducens)である。

タイプIII系は全て、cas10遺伝子を保有して、それは、多数の核酸ポリメラーゼおよびシクラスのコアドメインに相同性であり、タイプIII crRNA−エフェクター複合体の最も大きなサブユニットであるPalmドメインを含有する多ドメインタンパク質(RNA認識モチーフ(RRM)の変異体)をコードする。また、タイプIII遺伝子座は全て、小さなサブユニットタンパク質、1個のCas5タンパク質および通常幾つかのCas7タンパク質をコードする。タイプIIIは、4つのサブタイプ、III−A〜III−Dにさらに分けられる。サブタイプIII−Aは、小さなサブユニットをコードいるcsm2遺伝子を有し、またcas1、cas2およびcas6遺伝子を有する。サブタイプIII−Aを有する微生物の例は、表皮ブドウ球菌(Staphylococcus epidermidis)である。サブタイプIII−Bは、小さなサブユニットをコードするcmr5遺伝子を有し、また典型的にcas1、cas2およびcas6遺伝子を欠如している。サブタイプIII−Bを有する微生物の例は、パイロコッカス・フリオサス(Pyrococcus furiosus)である。サブタイプIII−Cは、不活性シクラーゼ様ドメインを有するCas10タンパク質を有し、cas1およびcas2遺伝子を欠如している。サブタイプIII−Cを有する微生物の例は、メタノサーモバクター・サームオートトロフィカス(Methanothermobacter thermautotrophicus)である。サブタイプIII−Dは、HDドメインを欠如しているCas10タンパク質を有し、それはcas1およびcas2遺伝子を欠如していて、csx10として公知のcas5様遺伝子を有する。サブタイプIII−Dを有する微生物の例は、ロセイフレキサス属種(Roseiflexus sp.)である。

タイプIV系は、部分的に分解される大きなサブユニット、Csf1、Cas5、Cas7、および場合によっては、推定小さなサブユニットを含む最小多サブユニットcrRNA−エフェクター複合体をコードする。タイプIV系は、cas1およびcas2遺伝子を欠如している。タイプIV系は、サブタイプを有さないが、2つの別個の変異体が存在する。1つのタイプIV変異体は、DinGファミリーヘリカーゼを有するのに対して、第2のタイプIV変異体は、DinGファミリーヘリカーゼを欠如するが、小さなα−ヘリックスタンパク質をコードする遺伝子を有する。タイIV系を有する微生物の例は、アシディチオバチルス・フェロオキシダン(Acidithiobacillus ferrooxidans)である。

タイプII系は、cas1、cas2およびcas9遺伝子を有する。cas9は、crRNA−エフェクター複合体の機能を標的DNA切断と組み合わせる多ドメインタンパク質をコードする。タイプII系はまた、tracrRNAもコードする。タイプII系は、3つのサブタイプ、サブタイプII−A、II−BおよびII−Cにさらに分けられる。サブタイプII−Aは、さらなる遺伝子、csn2を含有する。サブタイプII−A系を有する微生物の例は、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)である。サブタイプII−Bは、csn2を欠如しているが、cas4を有する。サブタイプII−B系を有する微生物の例は、レジオネラ・ニューモフィラ(Legionella pneumophila)である。サブタイプII−Cは、細菌で見出される最も一般的なタイプII系であり、3つのタンパク質、Cas1、Cas2およびCas9のみを有する。サブタイプII−C系を有する微生物の例は、ナイセリア・ラクタミカ(Neisseria lactamica)である。

タイプV系は、cpf1遺伝子ならびにcas1およびcas2遺伝子を有する。cpf1遺伝子は、Cas9の各々のドメインに相同的であるRuvC様ヌクレアーゼドメインを有するが、Cas9タンパク質中に存在するHNHヌクレアーゼドメインを欠如しているタンパク質、Cpf1をコードする。タイプV系は、パルクバクテリア・バクテリウム(Parcubacteria bacterium)GWC2011_GWC2_44_17(PbCpf1)、ラクノスピラセアエ・バクテリウム(Lachnospiraceae bacterium)MC2017(Lb3Cpf1)、ブチリビブリオ・プロテオクラスチクス(Butyrivibrio proteoclasticus)(BpCpf1)、ペレグリニバクテリア・バクテリウム(Peregrinibacteria bacterium)GW2011_GWA_33_10(PeCpf1)、アシダミノコッカス属種(Acidaminococcus sp.)BV3L6(AsCpf1)、ポルフィロモナス・マカカエ(Porphyromonas macacae)(PmCpf1)、ラクノスピラセアエ・バクテリウム(Lachnospiraceae bacterium)ND2006(LbCpf1)、ポルフィロモナス・クレビオリカニス(Porphyromonas crevioricanis)(PcCpf1)、プレボテーラ・ディシエンス(Prevotella disiens)(PdCpf1)、モラクセラ・ボボクリ(Moraxella bovoculi)237(MbCpf1)、スミセラ属種(Smithella sp.)SC_K08D17(SsCpf1)、レプトスピラ・イナダイ(Leptospira inadai)(LiCpf1)、ラクノスピラセアエ・バクテリウム(Lachnospiraceae bacterium)MA2020(Lb2Cpf1)、フランシセラ・ノビシダ(Francisella novicida)U112(FnCpf1)、カンジダツス・メタノプラズマ・テルミツム(Candidatus methanoplasma termitum)(CMtCpf1)、およびユーバクテリウム・エリゲンス(Eubacterium eligens)(EeCpf1)を含む幾つかの細菌において同定された。

クラス1系では、発現および干渉段階は、多サブユニットCRISPR RNA(crRNA)−エフェクター複合体を含む。クラス2系では、発現および干渉段階は、単一大きなタンパク質、例えば、Cas9、Cpf1、C2C1、C2C2またはC2C3を含む。

クラス1系では、pre−crRNAは、多サブユニットcrRNA−エフェクター複合体に結合して、成熟crRNAへとプロセシングされる。タイプIおよびIII系では、これは、RNAエンドヌクレアーゼ、例えば、Cas6を含む。クラス2 タイプII系では、pre−crRNAは、RNase IIIおよびtracrRNAを含む工程において、Cas9に結合して、成熟crRNAにプロセシングされる。しかしながら、髄膜炎菌(Neisseria meningitidis)のものである少なくとも1つのタイプII CRISPR−Cas系では、成熟5’末端を伴うcrRNAは、内部プロモーターから直接転写され、crRNAプロセシングは、起こらない。

クラス1系では、crRNAは、crRNA−エフェクター複合体と関連付けられ、ヌクレアーゼ活性を、RNA結合ドメインおよびcrRNAと標的核酸との間の塩基対形成と組み合わせることによって干渉を達成する。

タイプI系では、crRNA−エフェクター複合体のcrRNAおよび標的結合は、小さなサブユニットタンパク質に融合されたCas7、Cas5およびCas8を含む。タイプI系の標的核酸切断は、HDヌクレアーゼドメインを含み、それはスーパーファミリー2ヘリカーゼCas3’に融合されるか、または別々の遺伝子、cas3”によってコードされる。

タイプIII系では、crRNA−エフェクター複合体のcrRNAおよびターゲット結合は、Cas7、Cas5、Cas10および小さなサブユニットタンパク質を含む。タイプIII系の標的核酸切断は、Cas10に融合された別個のHDヌクレアーゼドメインとの、Cas7およびCas10タンパク質の複合作用を含み、それは、干渉中に一本鎖DNAを切断すると考えられる。

クラス2系では、crRNAは、単一タンパク質と関連付けられ、ヌクレアーゼ活性を、RNA結合ドメインおよびcrRNAと標的核酸との間の塩基対形成と組み合わせることによって、干渉を達成する。

タイプII系では、crRNAおよび標的結合は、標的核酸切断と同様にCas9を含む。タイプII系では、Cas9のRuvC様ヌクレアーゼ(RNase Hフォールド)ドメインおよびHNH(McrA様)ヌクレアーゼドメインはそれぞれ、標的核酸の鎖の1つを切断する。タイプII系のCas9切断活性はまた、Cas9によるcrRNAおよび標的結合を容易とする二本鎖を形成するのに、crRNAの、tracrRNAへのハイブリダイゼーションを必要とする。

タイプV系では、crRNAおよび標的結合は、標的核酸切断と同様にCpf1を含む。タイプV系では、Cpf1のRuvC様ヌクレアーゼドメインは、ねじれ型立体配置で標的核酸の両方の鎖を切断して、Cas9切断によって生成される平滑末端とは対照的である5’オーバーハングを生じる。これらの5’オーバーハングは、非相同的な末端結合方法によりDNAの挿入を容易にし得る。

タイプV系のCpf1切断活性はまた、二本鎖を形成するのに、crRNAの、tracrRNAへのハイブリダイゼーションを必要とせず、むしろタイプV系のcrRNAは、内部二本鎖を形成するステムループ構造を有する単一crRNAを使用する。Cpf1は、配列および構造特異的な様式でcrRNAを結合して、ステムループおよびステムループに隣接する配列、最も注目すべきは、標的核酸にハイブリダイズするスペーサー配列のヌクレオチド5’を認識する。このステムループ構造は通常、15〜19ヌクレオチド長の範囲である。このステムループ二本鎖を破壊する置換は、切断活性を無効にするのに対して、ステムループ二本鎖を破壊しない他の置換は、切断活性を無効にしない。タイプV系では、crRNAは、5’末端でステムループ構造を形成して、3’末端にある配列は、標的核酸における配列に相補的である。

タイプV crRNAおよび標的結合ならびに切断と関連付けられる他のタンパク質として、クラス2候補1(C2c1)およびクラス2候補3(C2c3)が挙げられる。C2c1およびC2c3タンパク質は、長さの点でCas9およびCpf1タンパク質に類似しており、およそ1,100個のアミノ酸〜およそ1,500個のアミノ酸の範囲である。C2c1およびC2c3タンパク質はまた、RuvC様ヌクレアーゼドメインを含有し、Cpf1に類似した構築物を有する。C2c1タンパク質は、標的結合および切断に関してcrRNAおよびtracrRNAを必要とする際に、Cas9タンパク質に類似しているが、最適切断温度50℃を有する。C2c1タンパク質は、ATリッチPAMを標的とし、それは、Cpf1に類似して、標的配列の5’である。例えば、Shmakovら(Molecular Cell;60(3):385〜397頁(2015年))を参照されたい。

クラス2候補2(C2c2)は、他のCRISPRエフェクタータンパク質に対して配列類似性を共有せず、したがって、推定タイプVI系中に存在してもよい。C2c2タンパク質は、2つのHEPNドメインを有して、RNase活性を有すると予測され、したがって、mRNAを標的として、切断し得る。C2c2タンパク質は、標的結合および切断に関してcrRNAを必要とする際にCpf1タンパク質に類似して見える一方で、tracrRNAを必要としない。また、Cpf1のように、C2c2タンパク質に関するcrRNAは、C2c2タンパク質との結合に役立ち得る安定なヘアピン、またはステムループ構造を形成する。

本明細書で使用する場合、「部位特異的ポリペプチド」は、本明細書で開示するポリヌクレオチドとともにCRISPR系で使用される単一タンパク質またはタンパク質複合体を指す。部位特異的ポリペプチドは、1つまたはそれ以上のヌクレアーゼドメインを含むことができる。本開示の部位特異的ポリペプチドは、HNHまたはHNH様ヌクレアーゼドメイン、RuvCまたはRuvC様ヌクレアーゼドメイン、および/またはHEPN−スーパーファミリー様ヌクレアーゼを含むことができる。HNHまたはHNH様ドメインは、McrA様フォールドを含むことができる。HNHまたはHNH様ドメインは、2つの逆平行β鎖およびα−ヘリックスを含むことができる。HNHまたはHNH様ドメインは、金属結合部位(例えば、二価陽イオン結合部位)を含むことができる。HNHまたはHNH様ドメインは、標的核酸の1つの鎖(例えば、crRNA標的鎖の相補鎖)を切断することができる。HNHまたはHNH様ドメインを含むタンパク質として、エンドヌクレアーゼ、コリシン、制限エンドヌクレアーゼ、トランスポザーゼおよびDNAパッケージング因子を挙げることができる。

部位特異的ポリペプチドは、使用されている特定のCRISPR系に依存して、Cas9タンパク質、Cpf1タンパク質、C2c1タンパク質、C2c2タンパク質、C2c3タンパク質、Cas3、Cas5、Cas7、Cas8、Cas10、またはこれらの複合体であり得る。幾つかの実施形態では、部位特異的ポリペプチドは、Cas9またはCpf1タンパク質であり得る。幾つかの実施形態では、ヌクレアーゼ活性が低減された部位特異的ポリペプチドは、ニッカーゼであり得る。即ち、それを、標的核酸二本鎖の1つの鎖を切断するように修飾することができる。幾つかの実施形態では、部位特異的ポリペプチドを、ヌクレアーゼ活性を有さないように修飾することができる。即ち、それは、標的核酸二本鎖のいかなる鎖も、標的核酸のいかなる単一鎖も切断しない。ヌクレアーゼ活性が低減されたか、またはヌクレアーゼ活性を有さない部位特異的ポリペプチドの例として、HNHおよび/またはRuvCヌクレアーゼドメインに対して修飾を伴うCas9、およびRuvCヌクレアーゼドメインに対して修飾を伴うCpf1を挙げることができる。かかる修飾の非限定的な例として、F.ノビシダ(F.novicida)Cpf1のRuvCヌクレアーゼドメインに対するD917A、E1006AおよびD1225A、ならびにS.ピオゲネス(S. pyogenes)Cas9の残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986および/またはA987の変更、ならびに他のCpf1およびCas9タンパク質におけるそれらの相当するアミノ酸残基を挙げることができる。

幾つかの実施形態では、部位特異的ポリペプチドを修飾することができる。かかる修飾は、部位特異的ポリペプチドへの、別のポリペプチド由来のドメインの取り込みもしくは融合、または別のポリペプチドのドメインによる、部位特異的ポリペプチドのドメインの置き換えを含むことができる。例えば、修飾された部位特異的ポリペプチドは、Cas9またはCpf1タンパク質由来の第1のドメインおよびCas9またはCpf1以外のタンパク質由来の第2のドメインを含有することができる。修飾された部位特異的ポリペプチドにおいてかかるドメインを含むための修飾は、修飾された部位特異的ポリペプチドに、さらなる活性を付与することができる。かかる活性として、標的核酸(例えば、ヒストン)と結合するポリペプチドを修飾するヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性または脱ミリストイル化活性を挙げることができる。

幾つかの実施形態では、部位特異的ポリペプチドは、核酸配列(例えば、ゲノムDNA)において二本鎖切断または一本鎖切断導入することができる。ある特定の実施形態では、核酸配列は、標的核酸であり得る。本開示のある特定部位特異的ポリペプチドは、平滑末端切断部位を導入することができる一方で、ある特定の実施形態は、付着末端、即ち、5’または3’オーバーハングを有する切断部位を生じる。例えば、Cpf1は、約4つまたは5つのヌクレオチド(nt)5’オーバーハングを有するスタガー型DNA二本鎖切断を導入し得る。二本鎖切断は、細胞の内因性DNA修復経路(例えば、相同組換えおよび非相同末端結合(NHEJ)または代替的非相同末端結合(A−NHEJ))を刺激することができる。NHEJは、相同的な鋳型を必要とすることなく切断された標的核酸を修復することができる。これは、標的核酸の欠失をもたらし得る。相同組換え(HR)は、相同的な鋳型を用いて行うことができる。相同的な鋳型は、標的核酸切断部位に隣接している配列相同的である配列を含むことができる。標的核酸が、部位特異的ポリペプチドによって切断された後、切断の部位を破壊することができる(例えば、部位は、核酸ターゲティングポリヌクレオチドおよび部位特異的ポリペプチドによる別のラウンドの切断に利用可能でない場合がある)。

場合によっては、相同組換えは、外因性ポリヌクレオチド配列を標的核酸切断部位に挿入することができる。外因性ポリヌクレオチド配列を、ドナーポリヌクレオチドまたはドナー配列と呼ぶことができる。幾つかの実施形態では、ドナーポリヌクレオチド、ドナーポリヌクレオチドの一部、ドナーポリヌクレオチドのコピー、またはドナーポリヌクレオチドのコピーの一部を、標的核酸切断部位に挿入することができる。ドナーポリヌクレオチドは、外因性ポリヌクレオチド配列であり得る。ドナーポリヌクレオチドは、一本鎖DNAであり得る。ドナーポリヌクレオチドは、二本鎖DNAであり得る。ドナーポリヌクレオチドは、RNAであり得る。ドナーポリヌクレオチドは、RNAおよびDNAの二本鎖であり得る。ドナーポリヌクレオチドは、標的核酸切断部位で天然に存在しない配列であり得る。幾つかの実施形態では、NHEJおよび/またはHRに起因する標的核酸の修飾は、例えば、突然変異、欠失、変更、組込み、遺伝子修正、遺伝子置換、遺伝子タギング、導入遺伝子挿入、ヌクレオチド欠失、遺伝子破壊、および/または遺伝子突然変異を引き起こすことができる。非自然核酸(複数可)をゲノムDNAに組み込むプロセスは、「ゲノム工学」と称することができる。

本開示のCRISPR系は、「DNAに誘導されるCRISPR系」と称してもよい。本開示のCRISPR系は、2つの核酸ターゲティングポリヌクレオチド(「二重ガイド」)を使用して標的核酸を切断するようにプログラムすることができる。幾つかの実施形態では、二重ガイドCRISPR系は、CRISPR−D(R)NA(crD(R)NA)およびトランス活性化CRISPR RNA(tracrRNA)、例えば、DNAおよびRNAの両方を含む1つのポリヌクレオチドならびにRNAを含む第2のポリヌクレオチドを含むことができる。幾つかの実施形態では、二重ガイド系は、crD(R)NAおよびtracrD(R)NA、例えば、DNAおよびRNAの両方を含む1つのポリヌクレオチドならびにDNAおよびRNAの両方を含む第2のポリヌクレオチドを含むことができる。crD(R)NAおよびtracrD(R)NAまたはtracrRNA要素は、図2に示すよう融合領域(例えば、リンカー)により接続されて、単一要素(例えば、sgD(R)NA)として合成することができる(「単一ガイド」)。

本明細書で使用する場合、「crD(R)NA」という用語は、ターゲティング領域および活性化領域を含むポリヌクレオチドを指し、ここで、ターゲティング領域は、DNA、またはDNAおよびRNAを含み、活性化領域は、RNA、もしくはDNA、またはDNAおよびRNAの混合物を含む。ある特定の実施形態では、ターゲティング領域は、活性化領域の上流にある。ある特定の実施形態では、活性化領域は、ターゲティング領域の上流にある。幾つかの実施形態では、tracrRNAは、crD(R)NAの活性化領域における配列に相補的な配列を含む。

本明細書中で使用する場合、「tracrD(R)NA」という用語は、crD(R)NAの活性化領域における配列に相補的な配列を有するポリヌクレオチドを指し、ここで、ポリヌクレオチドは、DNAまたはDNAおよびRNAの混合物を含む。

本明細書中で使用する場合、「ターゲティング領域」という用語は、標的核酸における配列に相補的なDNA、またはDNAおよびRNAの混合物を含むポリヌクレオチドの領域を指す。ある特定の実施形態では、ターゲティング領域はまた、他の核酸、もしくは核酸の類似体、またはそれらの組合せを含んでもよい。ある特定の実施形態では、この形状が宿主細胞内部で分解する可能性が低い場合があるので、ターゲティング領域は、単にDNAだけから成ってもよい。幾つかの実施形態では、この形状は、標的配列認識の特異性を増加させてもよく、および/またはオフターゲットの結合/ハイブリダイゼーションの発生を低減させてもよい。

本明細書中で使用する場合、「活性化領域」という用語は、部位特異的ポリペプチドと相互作用するか、または会合もしくは結合することが可能であるRNA、またはDNA、またはDNAおよびRNAの混合物を含むポリヌクレオチドの一部を指す。ある特定の実施形態では、活性化領域はまた、他の核酸、もしくは核酸の類似体、またはそれらの組合せを含んでもよい。ある特定の実施形態では、活性化領域は、ターゲティング領域に隣接している。ある特定の実施形態では、活性化領域は、ターゲティング領域から下流にある。ある特定の実施形態では、活性化領域は、ターゲティング領域から上流にある。

本明細書で使用する場合、「sgD(R)NA」または「単一ガイドD(R)NA」という用語は、ターゲティング領域および活性化領域を含むポリヌクレオチドを指し、ここで、ターゲティング領域は、標的核酸における配列に相補的なDNA、RNA、またはDNAまたはRNAの混合物を含み、ここで、活性化領域は、RNA、またはDNA、またはDNAおよびRNAの混合物を含み、ターゲティング領域もしくは活性化領域または両方は、少なくとも1つのDNAヌクレオチドを含み、活性化領域は、自己相補的な配列を有し、ハイブリダイズして、二本鎖を形成し、二次構造を含有し得る。単一ガイドD(R)NAの例は、crD(R)NAおよびtracrD(R)NAまたはtracrRNAから構築することができ、ここで、crD(R)NAおよびtracrD(R)NA、またはcrD(R)NAおよびtracrRNAは、ヌクレオチドの配列により接続され、このようなヌクレオチドは、DNA、RNA、またはDNAおよびRNAの混合物であり得る。

本明細書中で使用する場合、「下流」という用語は、ヌクレオチド配列の3’方向での基準点から遠位である点を指す。本明細書中で使用する場合、「上流」という用語は、ヌクレオチド配列の5’方向での基準点から遠位である点を指す。

本開示のポリヌクレオチド、例えば、crD(R)NA、tracrD(R)NA、または単一ガイドD(R)NAは、DNAおよび他の核酸、例えば、ペプチド核酸(PNA)、または他の核酸の類似体の混合物を含んでもよい。

本開示は、部位特異的ポリペプチドによって標的核酸のプログラム可能な切断および/または修飾を支持する、本明細書中に開示するような任意長の単一ガイドD(R)NA、crD(R)NA、tracrD(R)NAおよび/またはtracrRNAならびにポリヌクレオチドの組合せの使用を提供する。

図1Aは、タイプII CRISPR系における使用のためのポリヌクレオチドを示す。この実施形態では、101は、crD(R)NAであってもよく、102は、tracrD(R)NAまたはtracrRNAであってもよい。

図1Bは、相補性の領域に沿って互いにハイブリダイズされる図1Aのポリヌクレオチドを示す。ハイブリダイゼーションは、バルジ105、ターゲティング領域103、ネクサス107、ならびにヘアピン108および109などの二次構造を生成し得る。図1Bはまた、上方二本鎖領域106および下方二本鎖領域104を含む実施形態も示す。上部二本鎖領域は、上方ステムを含み得る。下方二本鎖領域は、下方ステムを含み得る。ある特定の実施形態では、ハイブリダイズして、領域104を形成するポリヌクレオチドは、ターゲティング領域103の下流の領域において、同じポリヌクレオチド鎖上のDNAおよびRNAの混合物、例えば、102を含んでもよい。ある特定の実施形態では、図1Bに示すような領域104は、同じポリヌクレオチド鎖上のDNAおよびRNAの混合物、例えば、102を含んでもよい。ターゲティング領域のすぐ下流のヌクレオチド配列は、様々な比率のDNAおよびRNAを含み得る。ある特定の実施形態では、この割当ては、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%のRNAおよびその間の範囲であってもよい。本明細書中に記載するように、ターゲティング領域103の下流のヌクレオチド配列(例えば、図1Bに示すようなターゲティング領域103とバルジ105との間の領域)は、配列番号19〜26に示すようなDNAおよびRNAの混合物を含み得る。

図2は、タイプII CRISPR系とともに使用するための単一ガイドD(R)NAの例を示す。図2を参照すると、実施形態は、ターゲティング領域201、下方二本鎖領域202、上方二本鎖領域203、融合領域204、二次構造(例えば、バルジ)205、ネクサス206、ならびにヘアピン207および208を含む。上方二本鎖領域は、上方ステムを含み得る。下方二本鎖領域は、下方ステムを含み得る。幾つかの実施形態は、上方二本鎖領域および下方二本鎖領域を含む活性化領域を含み得る。幾つかの実施形態では、領域202は、DNAおよびRNAの混合物を含んでもよく、それは、ターゲティング領域201のすぐ下流にある。ターゲティング領域のすぐ下流のヌクレオチド配列は、様々な比率のDNAおよびRNAを含み得る。ある特定の実施形態では、この割当ては、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%のRNAおよびその間の範囲であってもよい。本明細書中に記載するように、ターゲティング領域201の下流のヌクレオチド配列(例えば、図2に示すようなターゲティング領域201とバルジ205との間の領域)は、配列番号127〜132に示すようなDNAおよびRNAの混合物を含み得る。幾つかの実施形態では、領域203は、DNAおよびRNAの混合物を含んでもよく、それは、ターゲティング領域201の下流にある。ターゲティング領域の下流のヌクレオチド配列は、様々な比率のDNAおよびRNAを含み得る。ある特定の実施形態では、この割当ては、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%のRNAおよびその間の範囲であってもよい。本明細書中に記載するように、ターゲティング領域201の下流のヌクレオチドの領域は、配列番号44〜47および129に示すようなDNAおよびRNAの混合物を含み得る。

ある特定の実施形態では、活性化領域は、少なくとも1つの二次構造を含み得る。二次構造は、下方ステム、上方ステム、バルジ、ネクサス、ヘアピン、これらの1つまたはそれ以上、およびそれらの組合せであり得る。ある特定の実施形態では、活性化領域は、バルジを含む。図1Bは、下方ステム104、バルジ105、上方ステム106、ネクサス107、およびヘアピン、例えば、108を含む、二重ガイド系、即ち、tracrD(R)NAにハイブリダイズしているcrD(R)NAまたはtracrRNAにハイブリダイズしているcrD(R)NAによって創出される二次構造を示す。二次構造はまた、さらなるタイプの構造を含んでもよい。二次構造の位置決めおよび数は、特に限定されず、どの部位特異的ポリペプチドがCRISPR系で使用されるかに依存して変更させてもよい。

ある特定の実施形態では、活性化領域は、下方ステム、上方ステム、およびバルジを含むヌクレオチド領域を含み得る。ある特定の実施形態では、バルジのみが存在し得る。ある特定の実施形態では、バルジは、下方ステムと上方ステムとの間に存在し得る。特定の実施形態は、上方ステムを省略し得る。「上方ステム」および「下方ステム」という用語は、活性化領域の示した位置について言及するためにだけ、本明細書中で使用してもよく、これらの領域をいかなる特定の構造、二次構造、または位置決めに限定すると必ずしも意図されない。例えば、図1Bは、バルジとスペーサーの間に配置される下方ステム、104を示す。ある特定の実施形態では、ターゲティング領域は、スペーサーを含んでもよい。

幾つかの実施形態では、下方ステムにおけるターゲティング領域から下流のヌクレオチド配列は、5’GYYYUR(式中、YはCまたはU/Tであり、RはAまたはGである)配列を有することができる。幾つかの実施形態では、下方ステムにおけるターゲティング領域から下流のヌクレオチド配列は、5’GUUUUUGUである配列を有することができる。幾つかの実施形態では、下方ステムにおけるターゲティング領域から下流のヌクレオチド配列は、5’GUUUUAである配列を有することができる。幾つかの実施形態では、下方ステムにおけるヌクレオチドは、RNAもしくはDNAまたはDNAおよびRNAの混合物であり得る。

ある種の実施形態では、二次構造は、バルジを含むことができる。バルジは、二本鎖内のヌクレオチドの不対領域を指すことができる。ある特定の実施形態では、単一ガイドD(R)NAは、バルジを含んでもよい。CRISPR系における使用のためのポリヌクレオチドのある特定の実施形態は、二次構造を含んでもよく、上記二次構造は、テトラループである。バルジを含む単一ガイドD(R)NAは、二本鎖の5’側および3’側を含んでもよい。図2を参照すると、例えば、二本鎖の5’側は、204の上流にある(即ち、5’方向の)領域を指すことができ、二本鎖の3’側は、204の下流にある(即ち、3’方向の)領域を指すことができる。ある特定の実施形態では、活性化領域は、バルジを含む。幾つかの実施形態では、バルジは、部位特異的ポリペプチドに結合すること、またはそれと相互作用することに関与し得る。バルジは、二本鎖の片側に、不対5’−RRRZ−3’(式中、Rは、任意のプリンであり、Zは、反対鎖上のヌクレオチドとゆらぎ対を形成することができるヌクレオチドであり得る)を、また二本鎖の他方の側に、不対ヌクレオチド領域を含むことができる。バルジは、DNA、RNA、およびそれらの混合物を含み得る。バルジは、バルジ二本鎖の5’側に、DNA、RNA、またはその混合物を含んでもよく、バルジ3’側に、DNA、RNA、またはその混合物を含んでもよい。ある特定の実施例では、CRISPR系における使用のためのポリヌクレオチドは、ターゲティング領域および活性化領域を含むことができ、バルジ二本鎖のターゲティング領域側は、DNA、RNA、およびそれらの混合物を含んでもよく、バルジ二本鎖の活性化領域側は、DNA、RNA、およびそれらの混合物を含有してもよい。例えば、一実施形態では、ポリヌクレオチドの5’末端により近いバルジの側は、RNAを含んでもよく、ポリヌクレオチドの3’末端により近いバルジの側は、RNAを含んでもよい。ある特定の実施形態では、バルジの側は、バルジの別の側よりも少ないヌクレオチドを含んでもよい。ある特定の実施形態では、CRISPR系で使用するためのポリヌクレオチドは、5’方向および3’方向を有するポリヌクレオチドを含み、5’側を有するバルジを含み、3’側および5’側は、DNAおよび/またはRNAを含んでもよく、3’側は、RNAを含んでもよい。ある特定の実施形態では、CRISPR系で使用するためのポリヌクレオチドは、5’方向および3’方向を有するポリヌクレオチドを含み、5’側および3’側を有するバルジを含み、5’側は、DNAおよび/またはRNAを含んでもよく、3’側は、RNAを含んでもよく、3’側は、上記バルジの5’側よりも多くのヌクレオチドを有し得る。幾つかの実施形態では、CRISPR系における使用のためのポリヌクレオチドは、crD(R)NAおよびtracrD(R)NAを含んでもよく、バルジ二本鎖のcrD(R)NA側は、2つのヌクレオチドを含むDNA、RNA、およびそれらの混合物を含んでもよく、バルジ二本鎖のtracrD(R)NA側は、DNA、RNA、およびそれらの混合物を含有し得る。幾つかの実施形態では、CRISPR系における使用のためのポリヌクレオチドは、crD(R)NAおよびtracrRNAを含んでもよく、バルジ二本鎖のcrD(R)NA側は、2つのヌクレオチドを含むDNA、RNA、およびそれらの混合物を含んでもよく、バルジ二本鎖のtracrRNA側は、2つよりも多いヌクレオチドを含有し得る。

例えば、バルジは、バルジの側に、不対プリン(例えば、アデニン)を含むことができる。幾つかの実施形態では、バルジは、バルジの側に、不対5’−AAGZ−3’(式中、Zは、バルジの別の側上のヌクレオチドとゆらぎ対形成を形成することができるヌクレオチドであり得る)を含むことができる。

二本鎖の第1の側(例えば、CRISPR系における使用のためのポリヌクレオチドの5’末端に向かう側)上のバルジは、少なくとも1個、2個、3個、4個、もしくは5個またはそれよりも多い不対ヌクレオチドを含むことができる。二本鎖の第1の側(例えば、CRISPR系における使用のためのポリヌクレオチドの5’末端に向かう側)上のバルジは、多くても1個、2個、3個、4個、もしくは5個またはそれよりも多い不対ヌクレオチドを含むことができる。二本鎖の第1の側(例えば、CRISPR系における使用のためのポリヌクレオチドの5’末端に向かう側)上のバルジは、1個の不対ヌクレオチドを含むことができる。

二本鎖の第2の側(例えば、二本鎖のtracrRNAまたはtracrD(R)NA側)上のバルジは、少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、もしくは10個またはそれよりも多い不対ヌクレオチドを含むことができる。二本鎖の第2の側(例えば、二本鎖のtracrRNAまたはtracrD(R)NA側)上のバルジは、1個、2個、3個、4個、5個、6個、7個、8個、9個、もしくは10個またはそれよりも多い不対ヌクレオチドを含むことができる。二本鎖の第2の側(例えば、二本鎖のtracrRNAまたはtracrD(R)NA側)上のバルジは、4個の不対ヌクレオチドを含むことができる。

二本鎖の各鎖上の異なる数の不対ヌクレオチドの領域は、一緒に対形成することができる。ある特定の実施形態は、バルジを含む二次構造を含んでもよく、ここで、上記バルジは、二本鎖を形成していない。バルジは、第1の鎖からの5個の不対ヌクレオチドおよび第2の鎖からの1個の不対ヌクレオチドを含むことができる。バルジは、第1の鎖からの4個の不対ヌクレオチドおよび第2の鎖からの1個の不対ヌクレオチドを含むことができる。バルジは、第1の鎖からの3個の不対ヌクレオチドおよび第2の鎖からの1個の不対ヌクレオチドを含むことができる。バルジは、第1の鎖からの2個の不対ヌクレオチドおよび第2の鎖からの1個の不対ヌクレオチドを含むことができる。バルジは、第1の鎖からの1個の不対ヌクレオチドおよび第2の鎖からの1個の不対ヌクレオチドを含むことができる。バルジは、第1の鎖からの1個の不対ヌクレオチドおよび第2の鎖からの2個の不対ヌクレオチドを含むことができる。バルジは、第1の鎖からの1個の不対ヌクレオチドおよび第2の鎖からの3個の不対ヌクレオチドを含むことができる。バルジは、第1の鎖からの1個の不対ヌクレオチドおよび第2の鎖からの4個の不対ヌクレオチドを含むことができる。バルジは、第1の鎖からの1個の不対ヌクレオチドおよび第2の鎖からの5個の不対ヌクレオチドを含むことができる。

ある特定の実施形態では、不対二次構造は、ポリヌクレオチドのcrD(R)NA側上に形成される。ある特定の実施形態では、不対二次構造は、ポリヌクレオチドのcrD(R)NA側の上に形成され、tracrRNAまたはtracrD(R)NA側上に不対二次構造をさらに含んでもよい。かかる実施形態では、これらの二次構造は、バルジであってもよい。ある特定の実施形態では、「不対」という用語は、二次構造について言及する場合、二次構造が二本鎖の形態で存在しないことを意味することができる。

場合によっては、バルジは、少なくとも1つのゆらぎ対形成を含むことができる。場合によっては、バルジは、多くても1つのゆらぎ対形成を含むことができる。バルジ配列は、少なくとも1つのプリンヌクレオチドを含むことができる。バルジ配列は、少なくとも3つのプリンヌクレオチドを含むことができる。バルジ配列は、少なくとも5つのプリンヌクレオチドを含むことができる。バルジ配列は、少なくとも1つのグアニンヌクレオチドを含むことができる。バルジ配列は、少なくとも1つのアデニンヌクレオチドを含むことができる。バルジ配列は、ウラシルを含むことができる。二次構造は、DNA、RNA、およびそれらの組合せを含んでもよい。ある特定の実施形態では、二次構造は、二本鎖構造を形成してもよく、上記二本鎖構造は、DNAおよびRNAを含むバルジを含んでもよい。

tracrD(R)NA配列は、約6個のヌクレオチド〜約150個のヌクレオチドの長さを有することができる。例えば、tracrD(R)NA配列は、約6個のヌクレオチド(nt)〜約50nt、約6nt〜約40nt、約6nt〜約30nt、約6nt〜約25nt、約6nt〜約20nt、約6nt〜約15nt、約8nt〜約40nt、約8nt〜約30nt、約8nt〜約25nt、約8nt〜約20ntまたは約8nt〜約15nt、約15nt〜約150nt、約15nt〜約130nt、約15nt〜約100nt、約15nt〜約80nt、約15nt〜約50nt、約15nt〜約40nt、約15nt〜約30ntまたは約15nt〜約25ntの長さを有することができる。幾つかの実施形態では、tracrD(R)NA配列は、およそ14個のヌクレオチドの長さを有する。ある特定の実施形態では、tracrD(R)NAは、単にDNAで構成される。tracrD(R)NA配列は、一連の少なくとも6個、7個、または8個の近接するヌクレオチドにわたって参照tracrRNA配列(例えば、S.ピオゲネス(S. pyogenes)由来の野生型tracrRNA配列)に対して少なくとも約60%同一であり得る。例えば、tracrD(R)NA配列は、一連の少なくとも6個、7個、または8個の近接するヌクレオチドにわたって参照tracrRNA配列(例えば、S.ピオゲネス(S. pyogenes)由来の野生型tracrRNA配列)に対して、少なくとも約60%同一、少なくとも約65%同一、少なくとも約70%同一、少なくとも約75%同一、少なくとも約80%同一、少なくとも約85%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、または100%同一であり得る。

tracrD(R)NA配列は、1つよりも多い二重領域(例えば、ヘアピン、ハイブリダイズされた領域)を含むことができる。tracrD(R)NA配列は、2つの二重領域を含むことができる。tracrD(R)NAは、二次構造を含んでもよい。tracrD(R)NAは、1つよりも多い二次構造を含有し得る。ある特定の実施形態では、tracrD(R)NA配列は、第1の二次構造および第2の二次構造を含んでもよく、第1の二次構造は、第2の二次構造よりも多いヌクレオチドを含む。ある特定の実施形態では、tracrD(R)NAは、第1の二次構造、第2の二次構造、および第3の二次構造を含んでもよく、上記第1の二次構造は、上記第2の二次構造よりも少ないヌクレオチドを含み、上記第2の二次構造は、上記第3の二次構造よりも多いヌクレオチドを含む。二次構造の数および相当するヌクレオチド長は、特に限定されない。

tracrRNA配列は、約6個のヌクレオチド〜約150個のヌクレオチドの長さを有することができる。例えば、tracrRNA配列は、約6nt〜約50nt、約6nt〜約40nt、約6nt〜約30nt、約6nt〜約25nt、約6nt〜約20nt、約6nt〜約15nt、約8nt〜約40nt、約8nt〜約30nt、約8nt〜約25nt、約8nt〜約20ntまたは約8nt〜約15nt、約15nt〜約150nt、約15nt〜約130nt、約15nt〜約100nt、約15nt〜約80nt、約15nt〜約50nt、約15nt〜約40nt、約15nt〜約30ntまたは約15nt〜約25ntの長さを有することができる。幾つかの実施形態では、tracrRNA配列は、およそ14個のヌクレオチドの長さを有する。tracrRNA配列は、一連の少なくとも6個、7個、または8個の近接するヌクレオチドにわたって参照tracrRNA配列(例えば、S.ピオゲネス(S. pyogenes)由来の野生型tracrRNA配列)に対して少なくとも約60%同一であり得る。例えば、tracrRNA配列は、一連の少なくとも6個、7個、または8個の近接するヌクレオチドにわたって参照tracrRNA配列(例えば、S.ピオゲネス(S. pyogenes)由来の野生型tracrRNA配列)に対して、少なくとも約60%同一、少なくとも約65%同一、少なくとも約70%同一、少なくとも約75%同一、少なくとも約80%同一、少なくとも約85%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、または100%同一であり得る。

tracrRNA配列は、1つよりも多い二重領域(例えば、ヘアピン、ハイブリダイズされた領域)を含むことができる。tracrRNA配列は、2つの二重領域を含むことができる。tracrRNAは、二次構造を含んでもよい。tracrRNAは、1つよりも多い二次構造を含有してもよい。ある特定の実施形態では、tracrRNA配列は、第1の二次構造および第2の二次構造を含んでもよく、第1の二次構造は、第2の二次構造よりも多いヌクレオチドを含む。ある特定の実施形態では、tracrRNAは、第1の二次構造、第2の二次構造、および第3の二次構造を含んでもよく、上記第1の二次構造は、上記第2の二次構造よりも少ないヌクレオチドを含み、上記第2の二次構造は上記第3の二次構造よりも多いヌクレオチドを含む。二次構造の数および相当するヌクレオチド長は、特に限定されない。

天然に存在するタイプV CRISPR系は、タイプII CRISPR系と異なり、標的核酸のcrRNA成熟および切断にtracrRNAを必要としない。図9は、タイプV CRISPR系からcrRNAの典型的な構造を示し、ここで、DNA標的結合配列は、Cpf1タンパク質と相互作用するステムループ構造の下流にある。ループ領域におけるヌクレオチドの変更は、Cpf1切断活性に影響を及ぼさない。

図10A〜Cは、タイプV CRISPR系で使用するための本開示の単一ガイドD(R)NAの考え得る構造を示す。これらの形状では、黒の実線の領域はRNAを表すのに対して、チェックの領域はDNAを表す。図10Aは、単一ガイドD(R)NAを表し、ここで、ターゲティング領域はRNAを含み、3’ステムはDNAを含み、ループおよび5’ステムは、RNAを含む。図10Bは、単一ガイドD(R)NAを示し、ここで、ターゲティング領域RNAを含み、5’ステムはDNAを含み、ループおよび3’ステムは、RNAを含む。図10Cは、単一ガイドD(R)NAを示し、ここで、ターゲティング領域およびループは、RNAを含み、5’および3’ステムは、DNAを含む。図10A〜Cにおける3’および5’ステムは、集合的または個々に、本明細書中で、タイプV系で使用するためのポリヌクレオチドの「活性化領域」と称してもよい。

図11A〜Eは、タイプV CRISPR系で使用するための本開示の単一ガイドD(R)NAの考え得る構造を示す。これらの形状では、黒の実線の領域は、DNAを表すのに対して、チェックの領域はRNAを表す。図11Aは、単一ガイドD(R)NAを示し、ここで、ターゲティング領域はDNAを含み、3’ステムはDNAを含み、ループおよび5’ステムは、RNAを含む。図11Bは、単一ガイドD(R)NAを示し、ここで、ターゲティング領域はDNAを含み、5’ステムはDNAを含み、ループおよび3’ステムは、RNAを含む。図11Cは、単一ガイドD(R)NAを示し、ここで、ターゲティング領域、5’ステムおよび3’ステムは、DNAを含み、ループはRNAを含む。図11Dは、単一ガイドD(R)NAを示し、ここで、ターゲティング領域は、DNAおよび5’ステムを含み、3’ステムおよびループは、DNAを含む。図11Eは、単一ガイドD(R)NAを含み、ここで、ターゲティング領域は、DNAおよびRNAの混合物ならびに5’ステムを示し、3’ステムおよびループは、DNAを含む。図11A〜Eにおける3’および5’ステムは、集合的または個々に、本明細書中で、タイプV系で使用するためのポリヌクレオチドの「活性化領域」と称してもよい。

図12A〜Iは、タイプV CRISPR系で使用するための本開示のcrRNAおよびcrD(R)NAの考え得る形状を示し、ここで、3’要素および5’要素は、別々のポリヌクレオチド上に存在し、素塩基対相互作用を通じて結合して、二本鎖またはステム構造を形成する。図12Aは、タイプV CRISPR系における使用のための二重ガイド系を示し、ここで、ターゲティング領域は、3’要素に連結されている。第2のポリヌクレオチドもまた、5’要素として図12Aに示される。5’要素は、ターゲティング領域に連結されている3’要素にハイブリダイズして、二本鎖またはステムを形成するように構成される。図12Aでは、ターゲティング領域、3’要素、および5’要素は、RNAを含む。図12Bは、RNAを含む5’要素を示す。図12Cは、DNAを含む5’要素を示す。図12Dは、RNAを含むターゲティング領域およびRNAを含む3’要素を示す。図12Eは、RNAを含むターゲティング領域およびDNAを含む3’要素を示す。図12Fは、DNAを含むターゲティング領域およびRNAを含む3’要素を示す。図12Gは、DNAを含むターゲティング領域およびDNAを含む3’要素を示す。図12Hは、RNAおよびDNAを含むターゲティング領域ならびにDNAを含む3’要素を示す。図12Iは、RNAおよびDNAの代替的混合物を含むターゲティング領域ならびにDNAを含む3’要素を示す。図12A〜Iにおける3’要素は、本明細書中で、タイプV系で使用するためのポリヌクレオチドの「活性化領域」と称してもよい。

図13A〜Hは、タイプV CRISPR系で使用するための本開示のcrRNAおよびcrD(R)NAの考え得る形状を示し、ここで、3’要素および5’要素は、別々のポリヌクレオチド上に存在し、水素塩基対相互作用を通じて結合して、二本鎖またはステム構造を形成する。図10A〜図13Hに示すポリヌクレオチドの幾つかの実施形態では、DNAの領域はまた、RNAを含んでもよい。幾つかの実施形態では、RNAの領域はまた、DNAを含んでもよい。幾つかの実施形態では、DNAの領域はまた、RNAを含んでもよく、RNAの領域はまた、DNAを含んでもよい。図13A〜Hにおける3’要素は、本明細書中で、タイプV系で使用するためのポリヌクレオチドの「活性化領域」と称してもよい。図10A〜図13Hに示すポリヌクレオチドの様々な領域におけるDNAおよびRNAの比率は多様であり得る。ある特定の実施形態では、この割当ては、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または100%のRNAおよびその間の範囲であってもよい。タイプV CRISPR系で使用することができるポリヌクレオチドの例を、配列番号168〜203で提供する。

核酸−ターゲティングポリヌクレオチドの活性化領域は、部位特異的ポリペプチドの領域と相互作用することができる。活性化領域は、部位特異的ポリペプチドの複数の領域と相互作用することができる。活性化領域は、領域の少なくとも1つが標的核酸のPAMと相互作用する部位特異的ポリペプチドの複数の領域と相互作用することができる。これらの領域の例として、S.ピオゲネス(S. pyogenes)におけるCas9のアミノ酸1096〜1225および1105〜1138を挙げることができる。

不対ヌクレオチドに隣接したヌクレオチドは、ゆらぎ塩基対形成相互作用を形成するヌクレオチドであり得る。ゆらぎ塩基対形成相互作用は、グアニン−ウラシル、ヒポキサンチン−ウラシル、ヒポキサンチン−アデニンおよびヒポキサンチン−シトシンを含むことができる。ゆらぎ塩基対形成相互作用は、低減された標的および/または切断特異性を引き起こし得る。非対ヌクレオチドに隣接した少なくとも1個、2個、3個、4個、もしくは5個またはそれよりも多いヌクレオチドは、ゆらぎ対形成を形成することができる。不対ヌクレオチドに隣接した多くても1個、2個、3個、4個、もしくは5個またはそれよりも多いヌクレオチドは、ゆらぎ対形成を形成することができる。ある特定の実施形態では、ターゲティング領域は、リボヌクレオチドウラシルに対する代用として、デオキシリボヌクレオチドチミン(「dT」)を含んでもよい。Uの代わりにdTを使用することにより、ゆらぎ対形成を低減して、オフターゲットの塩基対合を低減させて、したがって、ある特定の実施形態において標的特異性の増加を引き起こす。

標的核酸は、DNA、RNA、またはそれらの組合せで構成することができ、二本鎖核酸または一本鎖核酸であり得る。ターゲティング領域配列は、使用されるべき特定の部位特異的ポリペプチドに応じて、プロトスペーサー隣接モチーフ(PAM)の5’または3’に位置する標的核酸にハイブリダイズすることができる。PAMは、使用されるべき部位特異的ポリペプチドに応じて多様であり得る。例えば、S.ピオゲネス(S. pyogenes)由来のCas9を使用する場合、PAMは、配列5’−NRR−3’(式中、Rは、AまたはGのいずれかであってもよく、Nは、任意のヌクレオチドであり、Nは、ターゲティング領域配列によって標的とされる標的核酸配列のすぐ3’である)を含む標的核酸における配列であり得る。部位特異的ポリペプチドを、PAMが未修飾部位特異的ポリペプチドに関するPAMと比較して異なり得るように修飾してもよい。例えば、S.ピオゲネス(S. pyogenes)由来のCas9を使用する場合、PAMがもはや、配列5’−NRR−3’を含まないが、代わりに、配列5’−NNR−3’(式中、Rは、AまたはGのいずれかであってもよく、Nは、任意のヌクレオチドであり、Nは、ターゲティング領域配列によって標的とされる標的核酸配列のすぐ3’である)を含むように、Cas9を修飾してもよい。他の部位特異的ポリペプチドは、他のPAMを認識してもよく、当業者は、任意の特定の部位特異的ポリペプチドに関するPAMを決定することが可能である。例えば、フランシセラ・ノビシダ(Francisella novicida)由来のCpf1は、5’−TTN−3’PAMを有すると同定された(Zetscheら(Cell;163(3):759〜71頁(2015年)))が、これは、in vivoで標的核酸の部位特異的切断を支持することはできなかった。フランシセラ・ノビシダ(Francisella novicida)と、5’−TTTN−3’PAMを利用するアシダミノコッカス属種(Acidaminococcus sp)BV3L6由来のCpf1などの他のCpf1タンパク質との間でのガイド配列における類似性を考慮すると、フランシセラ・ノビシダ(Francisella novicida)Cpf1タンパク質は、Zetscheらにより誤認された切断型5’−TTN−3’PAMに近位の標的核酸上の部位よりも高い特異性および活性で、5’−TTTN−3’PAMに近位の標的核酸上の部位を認識および切断する可能性がより高い。本出願に記載するポリヌクレオチドおよびCRISPR系を、5’−TTTN−3’PAMに近位の標的核酸上の部位に誘導されるCpf1タンパク質(例えば、フランシセラ・ノビシダ(Francisella novicida)由来)とともに使用してもよい。

標的核酸配列は、20個のヌクレオチドであり得る。標的核酸は、20個未満のヌクレオチドであり得る。標的核酸は、少なくとも5個、10個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、30個またはよりも多いヌクレオチドであり得る。標的ヌクレオチドは、約5〜30の範囲のヌクレオチドを含むことができる。例えば、5’−NNNNNNNNNNNNNNNNNNNNXRR−3’を含む配列において、標的核酸は、Nに相当する配列であってもよく、ここで、Nは、任意のヌクレオチドであり、Xは、S.ピオゲネス(S. pyogenes)によって認識されるPAMの第1のヌクレオチドである。特異的なPAMの選択は、所定の場合で使用されるべき特定の部位特異的ポリペプチドに基づいて、当業者の知識の範囲内である。

同じ鎖上にDNAおよびRNAを含む本開示のポリヌクレオチドは、発現ベクターを使用して、in vivoで作製することができないが、in vitroで化学的に合成することができる。ポリヌクレオチドの化学合成は、当業者に十分理解されている。本開示のポリヌクレオチドの化学合成は、溶液中で、または、固体支持体上で実行することがきる。溶液中の合成は、中間体が各工程後に精製されるため、大量およびより高い純度のポリヌクレオチドに好ましい。より少ない量に関して、配列純度がそれほど重要でない場合、固相合成は好ましい方法である。本開示のポリヌクレオチドはまた、ポリヌクレオチドの自動化学合成を提供する商業的供給源から得ることができる。

DNAの化学合成は、RNAの化学合成よりも容易で、速く、安価であり得る。DNAを含むポリヌクレオチドの生成および試験は、RNAを含む配列と比較して、より迅速で、費用効率が良い可能性がある。DNAを含有する配列は、DNAのような標的核酸を標的とする特異性の増加の利点を提供し得る。本明細書中で論述されるような特異的な領域においてDNAを含むポリヌクレオチドは、リボ核酸塩基と比較して、デオキシリボ核酸塩基(例えば、RNAにおけるウラシル塩基と比較して、DNAにおけるチミジン塩基)と関連したゆらぎ塩基対形成の傾向の低減のため、オフターゲットの結合を低減させる利点をさらに提供し得る。

幾つかの実施形態では、本開示のポリヌクレオチドはまた、例えば、ポリヌクレオチドの安定性を増加させる修飾を含んでもよい。かかる修飾は、正常な3’−5’結合、2−5’連結類縁体、および1つまたはそれ以上のヌクレオチド間結合が3’から3’への、5’から5’へのまたは2’から2’への結合である反転極性を有するものを有する、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、ホスホン酸メチルならびにホスホン酸3’−アルキレン、ホスホン酸5’−アルキレンのような他のホスホン酸アルキル、キラルホスホネート、ホスフィネート、3’−アミノホスホルアミデートおよびアミノアルキルホスホルアミデートを含むホスホルアミデート、ホスホロジアミデート、チオノホスホルアミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、セレノホスホフェートおよびボラノホスフェートを含み得る。反転極性を有する適切な核酸−ターゲティングポリヌクレオチドは、3’−最も多いヌクレオチド間結合で単一3’から3’への結合(即ち、核酸塩基が欠損しているか、またはその代わりに水酸基を有する単一反転ヌクレオシド残基)を含むことができる。各種塩(例えば、塩化カリウムまたは塩化ナトリウム)、混合塩および遊離酸形態もまた、含むことができる。

幾つかの実施形態では、本開示のポリヌクレオチドはまた、他の核酸、または核酸類似体を含有してもよい。核酸の類似体の例は、ペプチド核酸(PNA)である。

in vitroまたはin vivoでの本開示のポリヌクレオチドの細胞への送達は、当業者に公知の多数の方法によって達成してもよい。これらの方法としては、リポフェクション、エレクトロポーレーション、ヌクレオフェクション、マイクロインジェクション、バイオリスティック、リポソーム、免疫リポソーム、ポリカチオンまたは脂質:核酸コンジュゲートが挙げられる。リポフェクションは周知であり、例えば、米国特許第5,049,386号、同第4,946,787号および同第4,897,355号に記載されており、リポフェクション試薬は、商業的に販売されている。ポリヌクレオチドの効率的な受容体−認識リポフェクションに適している陽イオン性および中性の脂質は、国際公開第91/17424号および同第91/16024号に記載されている。

免疫脂質複合体のような目的とされるリポソームを含む脂質:核酸複合体、およびかかる複合体の製造は、当業者にとって周知である(例えば、Crystal,Science 270:404〜410頁(1995年);Blaeseら、Cancer Gene Ther.2:291〜297頁(1995年):Behrら、Bioconjugate Chem.5:382〜389頁(1994年);Remyら、Bioconjugate Chem.5:647〜654頁(1994年);Gaoら、Gene Therapy2:710〜722頁(1995年);Ahmadら、Cancer Res.52:4817〜4820頁(1992年);米国特許第4,186,183号;同第4,217,344号;同第4,235,871号;同第4,261,975号;同第4,485,054号;同第4,501,728号;同第4,774,085号;同第4,837,028号;同第4,946,787号を参照)。

エレクトロポーレーションは、本開示のポリヌクレオチドを送達するのに使用することができる。エレクトロポーレーションはまた、部位特異的ポリペプチドおよび本開示のポリヌクレオチドの複合体を送達することに使用してもよい。これらの方法では、ポリヌクレオチド、または部位特異的ポリペプチドおよびポリペプチドの複合体は、エレクトロポーレーション緩衝液中で標的細胞と混合されて、懸濁液を形成する。続いて、この懸濁液を、最適化された電圧で電気的パルスに付して、それは、細胞膜のリン脂質二重層中に一時的な孔を創出して、DNAおよびタンパク質のような荷電分子が、孔を通って細胞へと駆動されるのを可能にする。エレクトロポーレーションを実行する試薬および機器は、商業的に販売される。

バイオリスティック、またはマイクロプロジェクタイル送達は、本開示のポリヌクレオチドを送達するのに使用することができる。これらの方法では、金またはタングステンのようなマイクロプロジェクタイルは、塩化カルシウム、スペルミジンまたはポリエチレングリコールによる沈殿によって、ポリヌクレオチドでコーティングされている。マイクロプロジェクタイル粒子は、BIOLISTIC(登録商標)PDS−1000/He Particle Delivery System(Bio−Rad;ハーキュリーズ、カリフォルニア)などの装置を使用して、高速で細胞へ加速される。

幾つかの実施形態では、本開示は、細胞における標的遺伝子を修飾する方法を提供する。細胞は、任意の生物由来であってもよい(例えば、細菌細胞、古細菌細胞、単細胞真核生物の細胞、植物細胞、藻類細胞、真菌細胞(例えば、酵母細胞)、無脊椎動物由来の細胞、脊椎動物由来の細胞またはヒト由来の細胞を含む哺乳類由来の細胞)。

幾つかの実施形態では、本開示は、植物における標的遺伝子を修飾する方法を提供する。本明細書中では、「植物」という用語は、植物全体、植物器官、植物組織、種子、植物細胞、種子およびその子孫を指す。植物細胞として、種子、懸濁培養液、胚、分裂組織領域、カルス組織、葉、根、苗条、配偶体、胞子体、花粉および花粒粉から細胞が挙げられるが、限定的でない。植物部位は、根、茎、苗条、葉、花粉、種子、腫瘍組織ならびに細胞および培養液の様々な形態(例えば、単細胞、原形質体、胚およびカルス組織)を含むがこれらに限定されない分化および未分化組織を含む。

下記実施例は、発明者が本発明の様々な態様と考えるものの範囲を限定すると意図されない。

ガイドRNA構成成分の産生 ガイドRNA(例えば、sgRNAおよびtracrRNA)は、DNA配列の5’末端でT7プロモーターを組み込んでいる二本鎖DNA鋳型からのin vitro転写(例えば、T7 Quick High Yield RNA合成キット、New England Biolabs、イプスウィッチ、MA)によって産生した。

RNA構成成分に関する二本鎖DNA鋳型は、相当するDNA配列を含有する3’重複プライマーを使用してPCRによって、RNA構成成分へと構築した。構築において使用するオリゴヌクレオチドを表1に示す。

オリゴヌクレオチド配列(例えば、配列番号63〜122に示すプライマー配列)を、合成のために商業的な製造業者に供給した(Integrated DNA Technologies、コーラルビル、IA;またはEurofins、ルクセンブルク)。

DNAプライマーは、それぞれ2nMの濃度で存在した。T7プロモーター(フォワードプライマー:配列番号63、表1)、およびRNA配列の3’末端(リバースプライマー:配列番号67および74、表1)に相当する2つの外側DNAプライマーを640nMで使用して、増幅反応を駆動した。PCR反応は、製造業者の指示書に倣って、Q5 Hot Start High−Fidelity 2×マスターミックス(New England Biolabs、イプスウィッチ、MA)を使用して実行した。PCR構築反応は、下記熱循環条件を使用して行った:98℃で2分間、98℃で15秒、62℃で15秒、72℃で15秒を35サイクル、および72℃での最終伸長を2分間。DNAの品質は、アガロースゲル電気泳動(1.5%、SYBR(登録商標)Safe、Life Technologies、グランドアイランド、NY)によって評価した。

ガイドRNA構成成分に関するDNA鋳型0.25〜0.5μgを、T7 High Yield RNA合成キット(New England Biolabs、イプスウィッチ、MA)を使用して37℃でおよそ16時間転写した。転写反応を、DNase I(New England Biolabs、イプスウィッチ、MA)で処理して、GeneJet RNA精製および濃縮キット(Life Technologies、グランドアイランド、NY)を使用して精製した。RNA収率は、Nanodrop(商標)2000システム(Thermo Scientific、ウィルミントン、DE)を使用して定量化した。転写されたRNAの品質は、アガロースゲル電気泳動(2%、SYBR(登録商標)Safe、Life Technologies、グランドアイランド、NY)によって調べた。

ガイドRNA構成成分配列を表2に示す。

ガイドRNA構成成分に関する上述の方法は、本明細書中に記載するような他のRNA構成成分の産生に当てはめることができる。

Cas9切断アッセイでの使用のための二本鎖DNA標的領域の産生 in vitroでのCas切断アッセイにおける使用のための標的二本鎖DNAを、ゲノムDNAからの標的領域のPCR増幅を使用して産生した。

生化学アッセイのための二本鎖DNA標的領域(例えば、AAVS−1)は、フェノール−クロロホルム製造ヒト細胞株K562(ATCC、マナッサス、VA)ゲノムDNA(gDNA)からPCRによって増幅した。PCR反応は、製造業者の指示書に倣って、Q5 Hot Start High−Fidelity 2×マスターミックス(New England Biolabs、イプスウィッチ、MA)を使用して実行した。最終25μl中の20ng/μL gDNAを使用して、下記条件下で、選択した標的領域を増幅させた:98℃で2分間、98℃で20秒、60℃で20秒、72℃で20秒を35サイクル、および72℃での最終伸長を2分間。PCR産物は、Spin Smart(商標)PCR精製チューブ(Denville Scientific、サウスプレインフィールド、NJ)を使用して精製して、Nanodrop(商標)2000 UV−Vis分光光度計(Thermo Scientific、ウィルミントン、DE)を使用して定量化した。

gDNA由来の選択した標的配列の増幅に使用するフォワードおよびリバースプライマーは、下記の通りだった。プライマー、アンプリコンサイズ、およびCas媒介性切断から生成される断片のサイズを表3に示す。

他の適切な二本鎖DNA標的領域は、本質的に同じ方法を使用して得られる。非ヒト標的領域に関しては、ヒト細胞に由来するDNAに代わって、選択した生物(例えば、植物、細菌、酵母、藻類)由来のゲノムDNAを使用する。さらに、ゲノムDNA以外のポリヌクレオチド供給源を使用することができる(例えば、ベクターおよびゲル分離DNA断片)。

Cas9切断アッセイ この実施例は、選択したcrD(R)NA/tracrRNA/Cas9タンパク質複合体の切断パーセントを評価して、選択した二本鎖DNA標的配列に対して比較するための、in vitroでのCas9切断アッセイにおける本開示のcrD(R)NAの使用を示す。

二本鎖DNA標的(AAVS−1;実施例2、表3)に対して、crD(R)NA変異体(配列番号:38〜62)の一群に関して、切断活性を決定した。

sgRNA、crDNAまたはcrD(R)NAはそれぞれ、アニーリング緩衝液(1.25mM HEPES、0.625mM MgCl2、9.375mM KCl、pH7.5にて)中で等モル量で、tracrRNA(適切である場合)と混合して、95℃で2分間インキュベートして、サーモサイクラーから取り出して、室温に平衡化させた。

sgRNA、crDNA/tracrRNA、およびcrD(R)NA/tracrRNAを、Cas9反応ミックスに添加した。Cas9反応ミックスは、反応緩衝液(20mM HEPES、100mM KCl、5mM MgCl2、1mM DTTおよび5%グリセリン、pH 7.4にて)中に、最終濃度200μMに希釈したCas9タンパク質を含んでいた。反応ミックスにおいて、各crD(R)NA/tracrRNAの最終濃度は、各反応ミックス中で500nMであった。反応ミックスはそれぞれ、37℃で10分間インキュベートした。切断反応は、最終濃度15nMへの標的DNAの添加によって開始した。サンプルを混合して、手短に遠心分離した後、37℃で15分間インキュベートした。切断反応は、最終濃度0.2μg/μLでのプロテイナーゼK(Denville Scientific、サウスプレインフィールド、NJ)および0.44mg/μlのRNase A溶液(SigmaAldrich、セントルイス、MO)の添加によって終結させた。

サンプルを37℃で25分間および55℃で25分間インキュベートした。反応全体12μlを、アガロースゲル電気泳動(2%、SYBR(登録商標)Gold、Life Technologies、グランドアイランド、NY)によって切断活性に関して評価した。AAVS−1二本鎖DNA標的に関して、およそ316bpおよびおよそ179bpでのDNAバンドの出現は、標的DNAの切断が起きたことを示した。切断の百分率は、各切断断片および標的DNAに関してFIJI(ImageJ;オープンソースJava(登録商標)画像処理プログラム)によって算出される曲線下面積値を使用して、切断断片の合計を、切断断片および標的DNAの両方の合計で除算して算出した。

図3は、sgRNA、crDNA/tracrRNA、およびcrD(R)NA/tracrRNAのAAVS−1標的二本鎖DNAを使用したCas9切断アッセイの結果を示す。各パネルの上部に、使用するガイドRNA構成成分に相当するレーン番号が見られ、各構成成分に相当する配列番号を表4に示す。

切断の百分率は、各レーンの底部に示す。切断活性が観察されなかったcrDNAまたはcrD(R)NA(例えば、図3の3;図3の5;図3の15;図3の33;図3の34;図3の35)に関しては、切断活性は、n/d(切断活性が検出されなかったことを 示す)と表す。

図3に提示するデータは、本開示のcrD(R)NAが、標的二本鎖DNAのCas9媒介性部位特異的切断を促進することを実証している。

多重標的に対するcrD(R)NA活性 この実施例は、特異的な配列を標的とするようにプログラムされた種々の空間を含むcrD(R)NAのin vitroでの生化学活性を実証する。

crDNA、crRNA、およびcrD(R)NAの配列(表5に示す)は、合成のために商業的な製造業者に供給した。

tracrRNAは、実施例1に記載するように構築した。

二本鎖DNA標的は、適切な標的配列に相当する表3に示すオリゴヌクレオチドを使用して、実施例2に記載するように生成した。

crDNA/tracrRNA、crRNA/tracrRNA、およびcrD(R)NA/tracrRNAをハイブリダイズして、生化学的切断は、実施例3に記載するように実行する。

図4Aおよび図4Bは、各種スペーサーの生化学的切断に関する結果を示す。図4Aは、生化学的切断の百分率を示す。EMX標的1に関する活性を、群1に示す:ここで、「A」は、Cas9のみの対照であり、「B」は、crDNA/tracrRNA/Cas9であり、「C」は、crRNA/tracrRNA/Cas9であり、「D」は、crD(R)NA/tracrRNA/Cas9である。VEGFA標的1に関する活性を、群2に示す:ここで、「A」は、Cas9のみの対照であり、「B」は、crDNA/tracrRNA/Cas9であり、「C」は、crRNA/tracrRNA/Cas9であり、「D」は、crD(R)NA/tracrRNA/Cas9である。CD34標的1に関する活性を、群3に示す:ここで、「A」は、Cas9のみの対照であり、「B」は、crDNA/tracrRNA/Cas9であり、「C」は、crRNA/tracrRNA/Cas9であり、「D」は、crD(R)NA/tracrRNA/Cas9である。CD34標的2に関する活性を、群4に示す:ここで、「A」は、Cas9のみの対照であり、「B」は、crDNA/tracrRNA/Cas9であり、「C」は、crRNA/tracrRNA/Cas9であり、「D」は、crD(R)NA/tracrRNA/Cas9である。STAT5a標的1に関する活性を、群5に示す:ここで、「A」は、Cas9のみの対照であり、「B」は、crDNA/tracrRNA/Cas9であり、「C」は、crRNA/tracrRNA/Cas9であり、「D」は、crD(R)NA/tracrRNA/Cas9である。STAT5a標的2に関する活性を、群6に示す:ここで、「A」は、Cas9のみの対照であり、「B」は、crDNA/tracrRNA/Cas9であり、「C」は、crRNA/tracrRNA/Cas9であり、「D」は、crD(R)NA/tracrRNA/Cas9である。JAK1標的1に関する活性を、群7に示す;ここで、「A」は、Cas9のみの対照であり、「B」は、crDNA/tracrRNA/Cas9であり、「C」は、crRNA/tracrRNA/Cas9であり、「D」は、crD(R)NA/tracrRNA/Cas9である。JAK1標的2に関する活性を、群8に示す;ここで、「A」は、Cas9のみの対照であり、「B」は、crDNA/tracrRNA/Cas9であり、「C」は、crRNA/tracrRNA/Cas9であり、「D」は、crD(R)NA/tracrRNA/Cas9である。全てのCas9のみのサンプル(図4A、「A」)およびcrDNA/tracrRNA/cas9サンプル(図4B、「B」)については、切断活性が検出されなかった(図4A、「n/d」)。

図4Bでは、切断パーセントは、グラフのy軸上に示され、標的は、x軸上に示される。EMX標的1に関する活性は、群1の棒で示される。VEGFA標的1に関する活性は、群2の棒で示される。CD34標的1に関する活性は、群3の棒で示される。CD34標的2に関する活性は、群4の棒で示される。STAT5a標的1に関する活性は、群5の棒で示される。STAT5a標的2に関する活性は、群6の棒で示される。JAK1標的1に関する活性は、群7の棒で示される。JAK1標的2に関する活性は、群8の棒で示される。「C」および「D」は、図4Aと同じ反応を指す。

図4は、本開示のcrD(R)NAを使用した二本鎖DNA標的のCas9媒介性の生化学的切断が、種々の標的配列を移行可能であることを実証する。

真核細胞における標的修飾の検出に関するT7E1アッセイ この実施例は、選択した二本鎖DNA標的配列に対して、crD(R)NAのin vivoでの切断パーセントを評価するためのT7E1アッセイの使用を示す。

A.Casポリヌクレオチド構成成分を使用した細胞トランスフェクション AAVS−1ターゲティング配列を含むsgRNAおよびcrD(R)NA/tracrRNAを、Nucleofector(登録商標)96ウェルShuttle System(Lonza、アレンデール、NJ)および下記プロトコールを使用して、SpyCas9−GFP融合(HEK293−Cas9−GFP)を構成的に発現するHEK293細胞へトランスフェクトした。等モル量のガイドRNA構成成分は、アニーリング緩衝液(1.25mM HEPES、0.625mM MgCl2、9.375mM KCl、pH7.5にて)中で製造して、95℃で2分間インキュベートして、サーモサイクラーから取り出して、室温に平衡化させて、96ウェルプレートにおいて三連で、最終容量10μLで分配した。培養培地を、HEK293−Cas9−GFP細胞から吸引し、カルシウムおよびマグネシウムを含まないPBSで一度、細胞を洗浄して、続いて、TrypLE(Life Technologies、グランドアイランド、NY)の添加によってトリプシン処理した後、37℃で3〜5分間インキュベートした。トリプシン処理した細胞を、穏やかに上下にピペットで採取して、単一細胞懸濁液を形成し、10%のFBS(Fisher Scientific、ピッツバーグ、PA)を含有し、ペニシリンおよびストレプトマイシン(Life Technologies、グランドアイランド、NY)を補充したDMEM培養培地(Life Technologies、グランドアイランド、NY)で構成されるDMEM完全培養培地に添加した。

続いて、200×gで3分間の遠心分離によって、細胞をペレット化して、吸引した培養培地および細胞を、PBS中に再懸濁させた。Countess(登録商標)II Automated Cell Counter(Life Technologies、グランドアイランド、NY)を使用して、細胞を計数した。2.2×107個の細胞を、50mlチューブへ移して、ペレット化した。PBSを吸引して、Nucleofector(商標)SF(Lonza、アレンデール、NJ)溶液中に、1×107個の細胞/mLの密度になるように細胞を再懸濁した。次に、細胞懸濁液20μLを、Casポリヌクレオチド構成成分10μLを含有する個々のウェルに添加して、容量全体を、96ウェルNucleocuvette(商標)プレート(Lonza、アレンデール、NJ)のウェルに移した。プレートを、Nucleofector(商標)96ウェルShuttle(商標)(Lonza、アレンデール、NJ)上に載せて、96−CM−130 Nucleofector(商標)プログラム(Lonza、アレンデール、NJ)を使用してヌクレオフェクトした。ヌクレオフェクション後、DMEM完全培養培地70μLを各ウェルに添加して、細胞懸濁液50μLを、予熱したDMEM完全培養培地150μLを含有するコラーゲンでコーティングされた96ウェル細胞培養プレートに移した。続いて、プレートは、組織培養インキュベーターへ移して、37℃にて5%CO2中で48時間、プレートを維持した。

B.T7E1アッセイのための標的二本鎖DNA生成 ウェル1つ当たりQuickExtract DNA Extraction溶液(Epicentre、マディソン、WI)50μLを使用して、Casポリヌクレオチド構成成分トランスフェクションの48時間後に、gDNAを、HEK−293−SpyCas9細胞から単離して、続いて37℃で10分間、65℃で6分間および95℃で3分間インキュベートして、反応を停止させた。次に、gDNAは、水150μL水で希釈して、サンプルを−80℃で保管した。

T7E1に関するDNAは、単離したgDNAからの標的二本鎖DNA配列(例えば、AAVS−1)のPCR増幅によって生成させた。PCR反応は、KAPA HiFi Hot Startポリメラーゼともに鋳型としてgDNA 8μLを使用して、また総容量25μL中に0.5Uのポリメラーゼ、1×反応緩衝液、0.4mM dNTPおよび標的二本鎖DNA(例えば、AAVS−1、配列番号:75、76(表3))に対する300nMフォワードおよびリバースプライマーを含有して、PCR反応を設定した。標的DNAは、下記条件を使用して増幅した:95℃で5分間、98℃で20秒、70℃の20秒、−2℃/サイクル、72℃で30秒を4サイクル、続いて98℃で15秒、62℃で20秒、72℃で20秒を30サイクル、および72℃での最終伸長を1分間。

C.T7E1アッセイ T7E1アッセイのためのPCR増幅した標的二本鎖DNAを、95℃で10分間変性させた後、サーマルサイクラーで−0.5℃/秒で25℃まで冷却することによって再アニーリングさせた。再アニーリングしたDNAを、総容量15mL中で1×NEBuffer2緩衝液中のT7エンドヌクレアーゼI(New England Biolabs、イプスウィッチ、MA)0.5mLとともに、37℃で25分間インキュベートした。T7E1反応は、Fragment Analyzer(商標)システム(Advanced Analytical Technologies,Inc.、エームズ、IA)およびDNF−910二本鎖DNA試薬キット(Advanced Analytical Technologies,Inc.、エームズ、IA)を使用して分析した。Fragment Analyzer(商標)システムは、各切断断片の、および切断後に残存する標的二本鎖DNAの濃度を提供する。

標的二本鎖DNAの切断の百分率は、下記方程式を使用して、各切断断片および切断が行われた後に残存する標的二本鎖DNAの濃度から算出した:

方程式1において、「frag1」および「frag2」の濃度は、二本鎖DNA標的のCas切断断片の濃度に相当し、「親」は、切断が行われた後に残存する標的二本鎖DNAに相当する。

図5は、様々な濃度でcrD(R)NAでトランスフェクトした細胞から準備したgDNAのT7E1アッセイの結果を示す。検出されるインデル頻度の平均パーセントを、各棒グラフ上に示した(方程式1を使用して算出)。パーセントは、図5の棒4(ここでは、活性が2つのサンプルで検出されたに過ぎなかった)および図5の棒5(ここでは、活性が1つのサンプルで検出されたに過ぎなかった)を除いて、3つのサンプルの平均値である。細胞へヌクレオフェクトしたcrD(R)NA/tracrRNAまたはsgRNのいずれかの濃度を、表6に示す。

真核細胞における標的修飾の検出に関するT7E1アッセイは、本明細書中に記載するようなcrD(R)NA/tracrRNA/Cas9系が標的二本鎖DNAのCas媒介性の部位特異的なin vivo切断を促進することを実証するデータを提供する。

本明細書中に記載するガイダンスを受けて、この実施例で記載するT7E1アッセイは、当業者によって実行されて、crD(R)NAを含むように本明細書中に記載するように修飾されたそれらの同族ポリヌクレオチド構成成分と組み合わせて、Cas9、Cas9様、Cas1、Csn2、Cas4、Cpf1、C2c1、C2c2、C2c3、Cas9オルソログによってコードされるタンパク質、Cas9様合成タンパク質、Cas9融合、ならびにそれらの変異体および修飾を含むがこれらに限定されない他のCRISPR−Cas系で修飾された細胞由来の活性を測定することができる。

オン/オフターゲットのcrD(R)NA切断活性 この実施例は、意図する標的部位(「オンターゲット」)および予測される最も近隣接(オフターゲットの)部位の標的の切断活性を評価するためのcrD(R)NAの使用を示す。オン/オフターゲットの部位の標的配列を、表7に示す:

crRNAおよびcrD(R)NA配列を、合成のために商業的な製造業者に供給した。tracrRNAは、実施例1に記載するように構築した。

二本鎖DNA標的は、適切な標的配列に相当する表8に示すオリゴヌクレオチドを使用して、実施例2に記載するように生成した。

crRNA/tracrRNAおよびcrD(R)NA/tracrRNAをハイブリダイズして、生化学的切断は、実施例3に記載するように実行した。

図6は、意図するオンターゲット部位および4つの計算的に予測されるオフターゲットの部位でのcrRNA/tracrRNAおよびcrD(R)NA/tracrRNAの生化学活性の比較を示す。切断パーセントは、グラフのy軸上に示され、サンプルは、x軸上に示される。表9にサンプルを列挙する:

図7に提示するデータは、crRNAと比較した場合に、crD(R)NAが高いオンターゲット活性を維持することを示す。crD(R)NAは、オフターゲットの活性を支持しないのに対して、crRNAは、望ましくないオフターゲットの活性を有する。

真核細胞における標的修飾の検出に関するディープシーケンシング分析 この実施例は、選択した二本鎖DNA標的配列に対して、選択したsgD(R)NA/Cas9タンパク質複合体のin vivoでの切断パーセントを評価および比較するためのディープシーケンシング分析の使用を示す。

A.sgD(R)NAの合成 ヒトAAVS−1遺伝子座を標的とし、種々のDNA/RNA組成およびホスホロチオエート保護結合を含む6つのsgD(R)NA配列を、合成のために商業的な製造業者に供給した。これらの配列を、表10に示す。

B.sgD(R)NA/Cas9タンパク質のRNP複合体の形成 Cas9タンパク質は、Jinekら(Science;337(6096):816〜21頁(2012年))に記載されている方法に従って、大腸菌(E. coli)(BL21(DE3))における細菌発現ベクターから発現させて、アフィニティーイオン交換およびサイズ排除クロマトグラフィーを使用して精製した。ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)Cas9に関するコード配列は、C末端に2つの核局在配列(NLS)を含んでいた。リボ核タンパク質(RNP)複合体は、2つの濃度20pmolのCas9:60pmolのsgD(R)NAおよび200pmolのCas9:600pmolのsgD(R)NAで、三連で構築した。sgD(R)NA構成成分は、最終容量5μL中で望ましい濃度(60pmolまたは600pmol)になるように、アニーリング緩衝液(1.25mM HEPES、0.625mM MgCl2、9.375mM KCl、pH7.5にて)中で等モル量で混合して、95℃で2分間インキュベートして、サーモサイクラーから取り出して、室温に平衡化させた。Cas9タンパク質は、最終容量5μLになるように、結合緩衝液(20mM HEPES、100mM KCl、5mM MgCl2、1mM DTTおよび5%グリセリン、pH 7.4にて)中で適切な濃度へ希釈して、熱変性させたcrD(R)NA 5μLと混合して、続いて37℃で30分間インキュベートした。

C.sgD(R)NA/Cas9タンパク質RNPを使用した細胞トランスフェクション Nucleofector(登録商標)96ウェルShuttle System(Lonza、アレンデール、NJ)および下記プロトコールを使用して、RNP複合体を、K562細胞(ATCC、マナッサス、VA)にトランスフェクトした。RNP複合体を、最終容量10μLで96ウェルプレートの個々のウェルに分配した。培地中に懸濁したK562細胞を、培養フラスコから50mLコニカルチューブへ移した。200×gで3分間の遠心分離によって、細胞をペレット化して、培養培地を吸引して、カルシウムおよびマグネシウムを含まないPBSで一度、細胞を洗浄した。続いて、200×gで3分間の遠心分離によって、K562細胞をペレット化して、PBSを吸引して、細胞ペレットを、カルシウムおよびマグネシウムを含まないPBS 10mL中に再懸濁させた。

Countess(登録商標)II Automated Cell Counter(Life Technologies、グランドアイランド、NY)を使用して、細胞を計数した。2.2×107個の細胞を、50mlのチューブへ移して、ペレット化した。PBSを吸引して、1×107個の細胞/mLの密度になるように、Nucleofector(商標)SF(Lonza、アレンデール、NJ)溶液中に細胞を再懸濁させた。細胞懸濁液20μLを、RNP複合体10μLを含有する個々のウェルに添加して、容量全体を、96ウェルNucleocuvette(商標)プレート(Lonza、アレンデール、NJ)のウェルへ移した。プレートを、Nucleofector(商標)96ウェルShuttle(商標)(Lonza、アレンデール、NJ)上に載せて、96−FF−120 Nucleofector(商標)プログラム(Lonza、アレンデール、NJ)を使用して、細胞をヌクレオフェクトした。ヌクレオフェクション後に、10%FBS(Fisher Scientific、ピッツバーグ、PA)、ペニシリンおよびストレプトマイシン(Life Technologies、グランドアイランド、NY)を補充したイスコフ改変ダルベッコ培地(IMDM;Life Technologies、グランドアイランド、NY)70μLを各ウェルに添加して、細胞懸濁液50μLを、予熱したIMDM完全培養培地150μLを含有する96ウェル細胞培養プレートへ移した。次に、プレートを、組織培養インキュベーターへ移して、37℃にて5%CO2中で48時間維持した。

D.ディープシーケンシングのための標的二本鎖DNA生成 ウェル1つ当たりQuickExtract DNA Extraction溶液(Epicentre、マディソン、WI)50μLを使用して、RNPトランスフェクションの48時間後に、gDNAを、K562細胞から単離して、続いて37℃で10分間、65℃で6分間および95℃で3分間インキュベートして、反応を停止させた。単離したgDNAは、水50μL水で希釈して、サンプルを−80℃で保管した。

単離したgDNAを使用して、第1のPCRは、最終容量10μL中で、1×濃度でのQ5 Hot Start High−Fidelity 2×マスターミックス(New England Biolabs、イプスウィッチ、MA)、それぞれ0.5μMでのプライマー(配列番号93、94)、gDNA 3.75μLを使用して実行し、98℃で1分間、98℃で10秒、60℃で20秒、72℃で30秒を35サイクル、および72℃での最終伸長を2分間増幅させた。PCR反応は、水中に1:100希釈した。

「バーコーディング」PCRは、マルチプレックスシーケンシングを容易とするために各サンプルにつき特有のプライマーを使用して設定した。サンプルおよび相当するプライマー対を、表11に示す。

バーコーディングPCRは、最終容量10μL中で、1×濃度でのQ5 Hot Start High−Fidelity 2×マスターミックス(New England Biolabs、イプスウィッチ、MA)、それぞれ0.5μMでのプライマー、1:100希釈した第1のPCR 1μLを使用して実行し、98℃で1分間、98℃で10秒、60℃で20秒、72℃で30秒を12サイクル、および72℃での最終伸長を2分間増幅させた。

E.SPRIselectによる浄化 PCR反応を、シーケンシング用のアンプリコンのSPRIselect(Beckman Coulter、パサデナ、CA)ビーズベースの浄化用の単一マイクロチューブにプールした。

プールしたアンプリコンに、0.9倍容量のSPRIselectビーズを添加して、混合して、室温(RT)で10分間インキュベートした。溶液が透明になるまで、マイクロチューブを、磁気チューブスタンド(Beckman Coulter、パサデナ、CA)に配置した。上清を除去して、廃棄して、残留ビーズは、1容量の85%エタノールで洗浄して、RTで30秒間インキュベートした。インキュベーション後、エタノールを吸引して、ビーズをRTで10分間風乾させる。続いて、マイクロチューブを磁気スタンドから取り外して、0.25倍容量のQiagen EB緩衝液(Qiagen、フェンロ、リンブルフ)をビーズに添加して、激しく混合して、室温で2分間インキュベートした。マイクロチューブを磁石に戻して、溶液が透明になるまでインキュベートして、精製アンプリコンを含有する上清を、きれいなマイクロチューブに分配した。精製アンプリコンライブラリーは、Nanodrop(商標)2000システム(Thermo Scientific、ウィルミントン、DE)を使用して定量化して、ライブラリーの品質は、Fragment Analyzer(商標)システム(Advanced Analytical Technologies,Inc.、エームズ、IA)およびDNF−910二本鎖DNA試薬キット(Advanced Analytical Technologies,Inc.、エームズ、IA)を使用して分析した。

F.ディープシーケンシング設定 アンプリコンライブラリーは、Nanodrop値およびアンプリコンのサイズから算出される場合に4nmolar濃度に標準化させた。ライブラリーは、MiSeq Sequencer(Illumina、サンディエゴ、CA)で、MiSeq試薬キットv2(Illumina、サンディエゴ、CA)を用いて、2つの151サイクルペアードエンドラン+2つの8サイクルインデックス読取りで300サイクルに関して分析した。

G.ディープシーケンシングデータ分析 シーケンシングデータにおける産物の独自性は、PCRのバーコーディングラウンドにおいてアンプリコン上に適応させたインデックスバーコード配列に基づいて決定した。コンピュータースクリプトを使用して、下記タスクを実行することによってMiSeqデータを処理した:

・Bowtie(http://bowtie−bio.sourceforge.net/index.shtml)ソフトウェアを使用して、読取りを、ヒトゲノム(ビルドGRCh38/38)に整列させた。

・整列させた読取りを、予測される野生型AAVS−1遺伝子座配列と比較して、AAVS−1遺伝子座のいかなる部分にも整列しない読取りは廃棄した。

・野生型AAVS−1配列に適合する読取りを集計した。

・インデル(塩基の挿入または欠失)を伴う読取りは、indel型で分類して、集計した。

・総計indel読取りを、野生型読取りの合計で除算して、インデル読取りは、検出されるインデルパーセントを付与する。

図7は、AAVS−1遺伝子座における領域を標的とするsgD(R)NA/Cas9でヌクレオフェクトしたヒトK562細胞由来のAAVS−1標的遺伝子座の分析の結果を示す。x軸は、配列番号を示す。使用するsgD(R)NAに関して、y軸は、MiSeqデータから検出されるインデルパーセントを示す。シリーズAは、20pmolのCas9:120pmolのsgD(R)NAで所定のsgD(R)NAに関して、3つの独立複製について検出されるインデル平均パーセントを示し、シリーズBは、100pmolのCas9:600pmolのsgD(R)NAで所定のsgD(R)NAに関して、3つの独立した複製について検出されるインデル平均パーセントを示す。3つの複製の平均パーセントの標準偏差は、垂直黒線で表される。棒の下の数字は、トランスフェクションで使用するsgD(R)NAの配列番号に相当し、sgD(R)NAの配列を、表10に示す。このデータは、様々なタイプのsgD(R)NAの、配列特異的および用量依存性様式でヒト細胞における標的領域にて修飾を誘導する能を示す。

本明細書中に記載する方法は、ディープシーケンシングの分析によってsgD(R)NA/Cas9のin vivo活性を実証するために、当業者によって実行された。

DNA標的結合配列を含む多重crD(R)NAのスクリーニング この実施例は、ヒトゲノムDNA中に存在する標的を修飾して、それらの部位での切断活性のレベルを測定するための、本開示のcrD(R)NAの使用を示す。標的部位はまず、ゲノムDNAから選択することができ、次に、crD(R)NAを、それらの選択した配列を標的とするように設計することができる。続いて、測定を実行して、起こった標的切断のレベルを決定することができる。下記工程が全て、あらゆるスクリーニングに必要とされるわけでなく、また工程の順序が提示するようでなくてはならないわけでもなく、スクリーニングは、他の実験と連結させることができるか、またはより大規模な実験の一部を成すことができる。

A.DNA標的領域をゲノムDNAから選択する 選択したゲノム領域内の全てのPAM配列(例えば、「NGG」)を同定する。

PAM配列に5’で隣接している1つまたはそれ以上の20ヌクレオチド配列長の配列(標的DNA配列)を同定および選択する。

選択基準として、ゲノム中の他の領域に対する相同性;G−C含有量パーセント;融解温度;スペーサー内のホモポリマーの存在;および当業者に公知の他の基準が挙げることができるが、これらに限定されない。

同定した標的DNA配列の3’末端に、適切なcrD(R)NA配列を付加する。crD(R)NA構築物は通常、商業的な製造業者によって合成されて、同族のtracrRNAは、in vitro転写によって実施例1に記載するように産生される。

本明細書に記載するcrD(R)NAは、同族tracrRNAとともに使用して、同族Casタンパク質で使用するためのcrD(R)NA/tracrRNA系を完成することができる。

B.切断の百分率および特異性の決定 crD(R)NA/tracrRNA系と関連付けられるin vitro切断の百分率および特異性を、例えば、下記の通りに、実施例3のCas切断アッセイを使用して比較する:

(a)単一標的DNA配列のみが同定または選択される場合、DNA標的領域に関する切断の百分率および特異性を決定することができる。そのように望まれる場合、切断の百分率および/または特異性は、crD(R)NAを修飾すること、エフェクタータンパク質/エフェクタータンパク質結合配列またはリガンド/リガンド結合部分を導入することを含むがこれらに限定されない本開示の方法を使用して、さらなる実験において変更させることができる。

(b)切断アッセイから得られる切断の百分率データおよび部位特異性データを、標的結合配列を含む種々のDNA間で比較して、最良の切断の百分率および最高の特異性を有する標的DNA配列を同定することができる。切断の百分率データおよび特異性データは、様々な用途に関する選択の基礎となる基準を提供する。例えば、幾つかの状況では、crD(R)NAの活性は、最も重要な因子であり得る。他の状況では、切断部位の特異性は、切断の百分率よりも比較的重要であり得る。そのように望まれる場合、切断の百分率および/または特異性は、crD(R)NAを修飾すること、エフェクタータンパク質/エフェクタータンパク質結合配列またはリガンド/リガンド結合部分を導入することを含むがこれらに限定されない本開示の方法を使用して、さらなる実験において変更させる。

場合により、またはin vitroでの分析に代わって、crD(R)NA系と関連付けられるin vivoでの切断の百分率および特異性は、例えば、下記の通りに、実施例5に記載するT7E1アッセイを使用して比較する:

(a)標的DNA配列のみが同定される場合、DNA標的領域に関する切断の百分率および特異性を決定することができる。そのように望まれる場合、切断の百分率および/または特異性は、crD(R)NAを修飾すること、エフェクタータンパク質/エフェクタータンパク質結合配列またはリガンド/リガンド結合部分を導入することを含むがこれらに限定されない本開示の方法を使用して、さらなる実験において変更させる。

(b)切断アッセイから得られる切断の百分率データおよび部位特異性データを、種々の標的DNA間で比較して、標的DNAの最高の切断の百分率および標的DNAに関する最高の特異性をもたらすcrD(R)NA配列を同定することができる。切断の百分率データおよび特異性データは、様々な用途に関する選択の基礎となる基準を提供する。例えば、ある特定の実施形態では、crD(R)NAの活性に依存する場合があり、最も重要な要因であり得る。ある特定の実施形態では、切断部位の特異性は、切断の百分率よりも比較的重要であり得る。ある特定の実施形態では、切断の百分率および/または特異性は、RNAを修飾すること、エフェクタータンパク質/エフェクタータンパク質結合配列またはリガンド/リガンド結合部分を導入することを含むがこれらに限定されない本開示の方法を使用して、変更させることができる。

本明細書および実施例のガイダンスを受けて、この実施例に記載するスクリーニングは、crD(R)NAを含むように本明細書中に記載するように修飾されたそれらの同族ポリヌクレオチド構成成分と組み合わせて、Cas9、Cas9様、Cas、Cas3、Csn2、Cas4、Cas9オルソログによってコードされるタンパク質、Cas9様合成タンパク質、Cas9融合、Cpf1、Cpf1様、C2c1、C2c2、C2c3、ならびにそれらの変異体および修飾を含むがこれらに限定されない他のClass II CRISPR Casタンパク質を用いて、当業者によって実行することができる。

crD(R)NA:tracrRNAおよびsgD(R)NA媒介性ニッキング この実施例は、本開示のcrD(R)NA:tracrRNA複合体またはsgD(R)NAを使用して、RuvCヌクレアーゼの突出部を不活性にするD10A突然変異(Cas9〜D10A)を含有するS.ピオゲネス(S. pyogenes)Cas9と併せて、二本鎖DNA(dsDNA)プラスミド標的のニックを誘導してもよい方法を示す。下記工程が全て、必要とされるわけでなく、また工程の順序が提示するようでなくてはならないわけでもない。

S.ピオゲネス(S. pyogenes)Cas9は、2つの活性なヌクレアーゼドメインRuvCおよびHNHドメイン域を有する。アスパラギン酸をアラニンに変換する、S.ピオゲネス(S. pyogenes)Cas9の10番目のアミノ酸位置にあるアスパラギン酸の突然変異は、RuvCドメインのヌクレアーゼ能力を低減する。HNHドメインは、依然として活性のままであるが、Cas9−D10A部位特異的ポリペプチドは、スペーサー配列に相補的なDNA標的鎖のホスホジエステル骨格におけるニックを引き起こすことができるに過ぎない。

適切なベクター、培地、培養条件などの例が記載される。これらの構成成分および条件の改変は、本明細書の教示を考慮して当業者により理解される。

ガイド試薬は、本明細書の実施例1に従って生成した。

dsDNA標的は、配列番号133および134を使用して、実施例2に記載するように生成した。続いて、増幅させた断片を、適切なLIC適合性ベクターにクローニングした。かかる適切なベクターの1つは、市販のpET His6 LICクローニングベクター(Addgene、ケンブリッジ、MA)である。プラスミドを、市販のXL1−Blu細菌細胞(Agilent、サンタクララ、CA)を使用して、プラスミド発現用の細菌株に形質転換した。

LICベクターを含有する細菌細胞を、37℃で18時間、100ug/mLのアンピシリン(Sigma−Aldrich、セントルイス、MO)を補充したLB培地中で成長させた。細胞を5,000rpmで15分間遠心分離して、その後、プラスミドは、Qiagenプラスミドキット(Qiagen、フェンロ、オランダ)を使用して抽出した。

精製したプラスミドの生化学的切断は、DNA標的が反応において1nMの最終濃度で精製されたプラスミドと置き換える修飾を用いて、本明細書の実施例3で詳述するように実行した。crD(R)NAは、実施例3に記載する様式で、tracrRNA(配列番号2)とハイブリダイズさせた。

生化学的反応は、SYBR gold(Life Technologies、グランドアイランド、NY)で染色した1%のアガロースゲルに流すことによって分析した。ニッキング効率は、スーパーコイル状プラスミド形態の消失およびプラスミドの切れ目の入った開環状形態(切れ目の入ったプラスミド)の出現に基づいて算出して、それは、ゲル上のプラスミドの遊走率におけるシフトによって識別可能であった。

切れ目の入ったプラスミドの百分率は、切れ目の入ったプラスミドおよび超らせん状プラスミドを含有するゲル上の染色バンドの強度から算出した。強度は、FIJI(ImageJ;オープンソースJava(登録商標)画像処理プログラム)によって算出されるような曲線下面積値を使用して測定した。ニッキングの百分率は、切れ目の入ったプラスミドの染色強度を、切れ目の入ったプラスミド種および超らせん状プラスミド種の両方の染色強度の合計で除算することによって算出した。

この実験で使用するcrD(R)NAおよびsgD(R)NAに関する配列番号を表12に示す。

図8は、プラスミド標的に対するCas9−D10Aタンパク質を有するcrD(R)NAまたはsgD(R)NAの生化学的ニッキング活性の結果を示す。ニッキングの百分率をy軸に示す。crD(R)NAおよびsgD(R)NAサンプルは、x軸に示し、表12に示すサンプルIDに相当する。データは、crD(R)NAおよびsgD(R)NAの、プラスミド標的に対するCas9−D10Aタンパク質のニッキング活性を支持する能力を示す。データはまた、スペーサーの5’末端からのスペーサー配列(配列番号135、136および137)のトランケーションがニッキング活性の能力があることを示す。

本明細書および本明細書中の実施例のガイダンスを受けて、crD(R)NA:tracrRNAおよびsgD(R)NAのニッキング活性の設計ならびに検証は、当業者によって実行することができる。

CRISPR RNAおよびトランス活性化CRISPR RNAの同定ならびにスクリーニング この実施例は、CRISPR−Cas タイプII系のCRISPR RNA(crRNA)およびトランス活性化CRISPR RNA(tracrRNA)を同定し得る方法を示す。本明細書で提示する方法は、Chylinskiらの方法(RNA Biol;10(5):726〜37頁(2013年))を適合させたものである。下記工程の全てが必ずしもスクリーニングに必要でなはく、また示された工程の順序通りでなくてもよい。

A.CRISPR−Cas9 タイプII系を含有する細菌種を同定する Basic Local Alignment Search Tool(BLAST、blast.ncbi.nlm.nih.gov/Blast.cgi)を使用して、様々な種のゲノムの検索を行って、Cas9またはCas9様のタンパク質を同定した。タイプII CRISPR−Cas9系は、細菌種の至るところで配列における高い多様性を示すが、Cas9オルソログは、中心的なHNHエンドヌクレアーゼドメインおよび分断RuvC/RNase Hドメインの保存ドメイン構造を示した。主要なBLAST結果は、同定された領域に関してフィルタリングされて、不完全な、または切断型配列を廃棄して、Cas9オルソログを同定した。

Cas9オルソログが種において同定される場合、CRISPR−Cas遺伝子座に属する全ての配列を同定するために、Cas9オルソログのコード配列に隣接している配列を、他のCasタンパク質および関連繰り返し−スペーサーアレイに関してプロービングした。これは、密接に関連した種が類似のCRISPR−Cas9遺伝子座構造(即ち、Casタンパク質組成、サイズ、配向、アレイの位置、tracrRNAの位置など)を示すという見解で、公的ドメインですでに公知である他のCRISPR−Cas タイプII遺伝子座に対するアラインメントによって実行された。

B.推定crRNAおよびtracrRNAの同定 遺伝子座内で、crRNAは、外来DNAの断片によって間が空いているそれらの繰り返し配列の性質によって容易に同定可能であり、繰り返し−スペーサーアレイを作り上げる。繰り返し配列が、公知の種由来である場合、それは、CRISPRdbデータベース(crispr.u−psud.fr/crispr/)において同定されて、それから検索された。繰り返し配列が、種と関連付けられることが公知でない場合、繰り返し配列は、上述するように種に関するCRISPR−Cas タイプII遺伝子座と同定された配列を使用して、CRISPRfinderソフトウェア(crispr.u−psud.fr/Server/)を使用して予測された。

繰り返し配列の配列が、いったん種に関して同定されると、tracrRNAは、繰り返し−スペーサーアレイにおける繰り返し配列(tracr抗繰り返し配列)に対するその配列相補性によって同定された。in silicoでの予測的スクリーニングを使用して、関連tracrRNAを同定するために抗繰り返し配列を抽出した。推定抗繰り返しは、例えば、下記の通りにスクリーニングされた。

所定の種に関して同定した繰り返し配列を使用して、抗繰り返し配列に関するCRISPR−Cas9遺伝子座をプロービングした(例えば、BLASTpアルゴリズムなどを使用して)。検索はCRISPR−Cas9遺伝子座のイントロン領域に、典型的に制限された。

同定した抗繰り返し領域は、同定した繰り返し配列に対する相補性に関して検証した。

推定抗繰り返し領域は、Rho独立転写ターミネーターに関して推定抗繰り返しの5’および3’の両方でプロービングした(TransTerm HP、transterm.cbcb.umd.edu/)。

したがって、抗繰り返し要素およびRho独立転写ターミネーターを含む同定した配列は、所定の種の推定tracrRNAであると決定された。

C.RNA−Seqライブラリーの製造 in silicoで同定された推定crRNAおよびtracrRNAは、RNAシーケンシング(RNAseq)を使用してさらに検証された。

推定crRNAおよびtracrRNAが同定された種由来の細胞は、商業的な貯蔵所(例えば、ATCC、マナッサス、VA;DSMZ、ブラウンシュヴァイク、ドイツ)から調達した。

細胞は、対数期の中間にまで成長させて、総RNAは、トリゾール試薬(Sigma−Aldrich、セントルイス、MO)を使用して準備して、DNase I(Fermentas、ヴィリニュス、リトアニア)で処理した。

総RNA 10μgは、Ribo−Zero rRNA Removalキット(Illumina、サンディエゴ、CA)で処理して、残存するRNAを、RNA Clean and Concentrators(Zymo Research、アーバイン、CA)を使用して精製した。

続いて、製造業者の指示書に倣って、TruSeq Small RNA Library Preparationキット(Illumina、サンディエゴ、CA)を使用して、ライブラリーを製造して、それが、cDNAと関連付けられるアダプター配列の存在をもたらした。

得られたcDNAライブラリーは、MiSeq Sequencer(Illumina、サンディエゴ、CA)を使用してシーケンシングした。

D.シーケンシングデータの処理 cDNAライブラリーのシーケンシングの読取りは、下記方法を使用して処理することができる。

アダプター配列は、cutadapt 1.1(pypi.python.org/pypi/cutadapt/1.1)を使用して除去され、15ntは、読取りの3’末端から切り取られて、読取りの品質を改善させた。

読取りは、2個のヌクレオチドのミスマッチ許容度で、各々の種のゲノム(推定tracrRNAが同定されたもの)に戻して整列させた。

読取り範囲は、BedTools(bedtools.readthedocs.org/en/latest/)を使用して算出した。

Integrative Genomics Viewer(IGV、www.broadinstitute.org/igv/)を使用して、読取りの開始(5’)および終了(3’)位置をマッピングした。推定tracrRNAに関して検索される読取り全体は、アラインメントのSAMファイルから算出した。

RNA−seqデータを使用して、推定crRNAおよびtracrRNA要素がin vivoで能動的に転写されることを検証した。in silicoでの、およびRNA−seqスクリーンの複合材料からの確認したヒットは、本明細書中に概要する方法(実施例1、2および3を参照)を使用して、同定したcrRNAおよびtracrRNA配列の、二本鎖DNA標的のCas9媒介性切断を支持する機能的な能力に関して検証した。

本明細書および本明細書中の実施例のガイダンスを受けて、新規crRNAおよびtracrRNA配列の同定は、当業者によって実行することができる。

crD(R)NAおよびsgD(R)NAの設計 この実施例は、crD(R)NAおよびsgD(R)NAが、それぞれcrRNAおよびtracrRNAから設計される方法を示す。下記工程が全て、スクリーニングに必要とされるわけでなく、また工程の順序が提示するようでなくてはならないわけでもない。

所定の種に関するcrRNAおよびtracrRNAガイド配列の同定は、実施例10に記載するように実行した。

同定したcrRNAおよびtracrRNA配列を、in silicoでDNAに逆転写した。上方ステム、下方ステムおよびバルジ要素は、crRNAおよびtracrRNAの配列から同定された。RNA塩基を、crDNAのDNA配列、ならびにそれぞれcrD(R)NAおよびsgD(R)NAを創出するtracrDNA配列に導入した。crDNAおよびtracrRNA内のRNA塩基の配置、数および分布は、計算的または実験的スクリーニング方法のいずれかを使用して選択することができる。crD(R)NAの一群は、分子内の多数の異なる位置に置かれるリボヌクレオチドを用いて設計された。好ましくは、下方ステム内のデオキシリボヌクレオチドは、幾つかのcrD(R)NA配列におけるリボヌクレオチドと置換された。リボヌクレオチドは、幾つかのcrD(R)NA配列のスペーサー配列の3’末端で置換された。さらなるcrD(R)NAおよびsgD(R)NA配列は、例えば、下記の通りに設計された。

パブリックドメインで、三次元タンパク質構造の保存場所(例えば、RCSB PDB;rcsb.org)を検索して、Casエンドヌクレアーゼ構造を同定した。保存場所を、それらの同族crRNAおよびtracrRNAに結合されたCasエンドヌクレアーゼの高解像度座標ファイルに関して検索した。所定のCasエンドヌクレアーゼに対する配列または三次構造類似性によって規定される構造隣接物は、所定のCasエンドヌクレアーゼに関して解析された構造が存在しない場合に使用された。蓄積された座標ファイルは、ダウンロードされた。PyMOL(PyMOL Molecular Graphics System、バージョン1.7.4 Schroginger、LLC)などの可視化ソフトウェアを使用して、座標を分析して、Casエンドヌクレアーゼタンパク質とcrRNAおよびtracrRNAのヌクレオチドとの間のリボース特異的相互作用を同定した。タンパク質が、crRNAおよびtracrRNAのヌクレオチドと直接的または間接的に(即ち、水または金属中間体による)接触する位置を使用して、デオキシリボヌクレオチドをリボヌクレオチドまたは他のヌクレオチド変異体で置き換えるためのガイド配列内の望ましい位置を同定した。

crRNAおよびtracrRNA配列は、関連種由来のCas9タンパク質と比較した場合に保存された。類似した種由来の他の公知のガイド配列を有するガイド配列のアラインメントは、リボヌクレオチドに関する優先度を付与する保存塩基に関するさらなる情報を提供した。crRNAまたはtracrRNAの多重配列アラインメントは、ウェブベースのソフトウェアMUSCLE(ebi.ac.uk/Tools/mas/muscle/)を使用して実行された。次に、アラインメントは、主鎖に沿って保存ヌクレオチド配列位置に関して評価された。

核酸二次構造予測ソフトウェア(例えば、RNAfold;rna.tbi.univie.ac.at/cgi−bin/RNAfold.cgi)を使用して、ガイド主鎖のフォールディングを分析した。RNA特異的ねじれが望ましい領域を使用して、crDNAおよび/またはtracrDNAの両方におけるリボヌクレオチド位置の配置の情報を与えた。

二次構造、タンパク質−核酸相互作用、および配列保存の組合せを使用して、crD(R)NA、tracrD(R)NAおよびsgD(R)NA配列内のリボヌクレオチドの位置決めの情報を与えた。crD(R)NAおよびtracrD(R)NAの多重設計は、異なる立体配置が異なる所望の特性(即ち、活性、特異性、安定性など)を支持し得るという理解の下で試験された。crD(R)NAおよびtracrD(R)NAは、リンカーによって単一分子に接続されて、sgD(R)NAを形成することができる。crD(R)NAおよびtracrD(R)NAの結合は、上方ステムを一緒に形成するcrD(R)NAの3’末端およびtracrD(R)NAの5’末端にあるヌクレオチドの総数の低減を伴う可能性がある。配列番号138〜142、147〜150、154〜157および161〜164は、crD(R)NAおよびtracrD(R)NAに関する設計を示す。配列番号143〜146、151〜153、158〜160および165〜167は、sgD(R)NAに関する設計を示す。表13は、配列の独自性を付与する。

配列を、合成のための商業的な製造業者(例えば、Integrated DNA Technologies、コーラルビル、IA)に供給した。

crD(R)NA、tracrD(R)NAおよびsgD(R)NAを実験的に試験して、本明細書中に記載する方法(実施例1、2および3を参照)を使用して、種々の配列の、二本鎖DNA標的のCas9媒介性切断を支持する活性を決定した。

本明細書および本明細書中の実施例のガイダンスを受けて、新規crD(R)NA、tracrD(R)NAおよびsgD(R)NA配列の設計ならびに検証は、当業者によって実行することができる。

タイプV Cpf1 crD(R)NAおよびsgD(R)NA要素の設計ならびにDNAを修飾するためのCpf1での使用 以下の表14および15は、タイプV CRISPR系で使用するための例示的な二重ガイドcrD(R)NAsおよびsgD(R)NAsを提供する。例示的な図および配列番号への言及は、いかなる場合であっても限定的であるとは意図されず、表14、表15ならびに関連する配列番号および例示的な図における開示に基づいて、タイプV CRISPR系で使用するための二重ガイドcrD(R)NAおよびsgD(R)NAを、標的核酸内の任意の所望の配列を標的とするように設計することができることは、当業者によって理解されよう。

A.タイプV Cpf1 crD(R)NAおよびsgD(R)NA要素の設計 Cpf1オルソログは、PSI−BLAST、PHI−BLASTおよびHMMerなどの配列分析プログラムを使用して同定された。Cpf1オルソログがいったん同定されると、近くの配列が検索されて、関連CRISPRアレイを同定する。crRNA配列は、Zetscheら(Cell;163(3):759〜71頁(2015年))に記載されるように、CRISPRアレイ内に位置する繰り返し配列として同定された。タイプV crRNA配列は、ターゲティング領域配列に対して5’に位置する繰り返し配列内のステムループを含有した。ステムループは、5’要素および3’要素を含んでいた。crRNAの5’要素、3’要素の両方ならびにループの配列が同定された。これらのcrRNA要素の配列は、in silicoでDNAに逆転写された。リボヌクレオチドおよびデオキシリボヌクレオチドの混合物を含有する5’要素が設計された。5’要素の例を、図12、図13および表14に示す。リボヌクレオチドおよびデオキシリボヌクレオチドの混合物を含有する3’要素が設計された。3’要素の例を、図12、図13および表14に示す。ターゲティング領域配列は、所定のDNA中のPAM配列に隣接するように選択されて、3’crRNA要素の3’末端に付加された。DNA、DNAおよびRNA、またはRNAヌクレオチドを含有するターゲティング領域配列が設計された。crD(R)NA 3’要素およびcrD(R)NA 5’要素を一緒に組み合わせて(表14、図12、図13)、二重ガイドタイプV crD(R)NAを形成することによって、Cpf1は、所定の標的核酸中の標的核酸配列を切断するよう誘導された。実験用のcrD(R)NAの一群は、crD(R)NA配列内の多数の異なる位置に置かれるリボヌクレオチドを用いて設計された。好ましくは、3’ステムおよび5’ステム内のデオキシリボヌクレオチドは、幾つかのcrD(R)NA配列におけるリボヌクレオチドと置換された。リボヌクレオチドは、幾つかのcrD(R)NA配列中のターゲティング領域配列の5’末端で置換された。

ターゲティング領域、ループ配列より接続される3’要素、および5’要素の組合せを使用して、種々のバージョンのsgD(R)NAが設計された。sgD(R)NA内のRNA塩基の配置、数および分布は、計算的または実験的スクリーニング方法のいずれかを使用して選択することができる。sgD(R)NAの一群は、sgD(R)NA内の多数の異なる位置に置かれるリボヌクレオチドを用いて設計された。好ましくは、3’ステムおよび5’ステム内のデオキシリボヌクレオチドは、幾つかのsgD(R)NA配列におけるリボヌクレオチドと置換された。リボヌクレオチドは、幾つかのsgD(R)NA配列中のターゲティング領域配列の5’末端で置換された。設計したsgD(R)NAの例を、表15に列挙して、図10A〜Cおよび図11A〜Eに示す。

下記において、sgD(R)NA配列を使用するが、3’および5’crD(R)NA要素(その例は、表14に示す)の対を、sgD(R)NAの代わりに使用することができることが理解されよう。

B.Cpf1およびsgD(R)NAを有する核酸配列の消化 Cpf1 sgD(R)NAをCpf1と一緒に使用して、核酸配列を標的として、切断することができる。標的核酸は、RNA、ゲノムDNA、プラスミドDNA、または増幅DNAのいずれかであった。増幅標的DNAは、実施例2に記載するように製造することができる。標的DNA中に所定の配列を標的とするスペーサー配列を含有するsgD(R)NA配列が合成された。切断アッセイは、Zetscheら(2015年)に記載されるように実行して、実施例3に記載する方法を使用して分析した。要約すると、標的核酸を、Cpf1活性を支持するように選択される適切な緩衝液中でCpf1およびsgD(R)NA配列(単数または複数)とともにインキュベートした。核酸を分析して、実施例3に記載するように消化が起きたかどうか決定した。2つまたはそれ以上のCpf1/sgD(R)NA複合体を使用して、標的DNA由来のDNAの切片を切断することができる。DNAの切片は、オーバーハング末端を有し、それが親DNAから分離された後に、相補的な配列アダプターまたはベクターにライゲーションすることができる。

C.Cpf1 sgD(R)NAリボ核タンパク質複合体を用いたゲノム編集 大腸菌(E. coli)発現ベクターは、Cpf1をコードするコドン最適化オープンリーディングフレームを合成すること、およびオープンリーディングフレームを発現プラスミド(例えば、pET27b)へクローニングすることによって構築された。コード配列は、タンパク質の精製用のアフィニティータグ、および真核細胞において核局在化を駆動させるためのC末端にあるNLS配列を含むことができる。Cpf1タンパク質を、大腸菌(E. coli)において発現ベクターから発現させることができ、アフィニティー、イオン交換およびサイズ排除クロマトグラフィーの組合せを使用して精製することができる。精製タンパク質を、10mg/mlまで濃縮して、sgD(R)NAと組み合わせて、リボ核タンパク複合体を作製した。200pmolのCpf1を、別々の反応チューブ中で、50pmol、100pmol、200pmol、400pmol、600pmol、800pmol、1000pmolのsgD(R)NAおよび反応緩衝液と組み合わせた。Cpf1−sgD(R)NA複合体は、実施例7に記載する方法に従って、反復でHEK293細胞に電気穿孔した。細胞を37℃で成長させて、ゲノムDNAを、4、8、16、24、48、および72時間後に各反応から収集した。ゲノムDNAをPCRおよびIlluminaシーケンシングを使用して分析して、実施例7に記載する方法に従って、ゲノムが編集されたことを決定した。

D.真核細胞におけるCpf1発現ベクターおよびsgD(R)NAを使用したゲノム編集 哺乳動物発現ベクターは、Cpf1をコードするコドン最適化オープンリーディングフレームを合成すること、およびオープンリーディングフレームを適切な哺乳動物発現プラスミド(例えば、pcDNA3.1)へクローニングすることによって構築することができる。コード配列は、タンパク質の精製または検出用のアフィニティータグ、および真核細胞において核局在化を駆動させるためのC末端にあるNLS配列を含むことができる。コード配列は、プラスミド中のCMVプロモーターに操作可能に連結させることができる。Cpf1発現プラスミドを、別々の反応チューブ中で、50pmol、100pmol、200pmol、400pmol、600pmol、800pmol、1000pmolのsgD(R)NAおよび反応緩衝液と組み合わせた。反応混合物は、実施例7に記載する方法に従って、反復でHEK293細胞に電気穿孔した。細胞を37℃で成長させて、ゲノムDNAを、4、8、16、24、48、および72時間後に各反応から収集した。ゲノムDNAをPCRおよびIlluminaシーケンシングを使用して分析して、実施例7に記載する方法に従って、ゲノムが編集されたことを決定した。

トウモロコシ胚のin plantaでの修飾 この実施例は、単一ガイドD(R)NAを使用して、トウモロコシ胚を修飾することができる方法を示す。本明細書に提示する方法は、Svitashevら(Plant Physiol;169(2):931〜945頁(2015年))から脚色される。下記工程が全て、スクリーニングに必要とされるわけでなく、また工程の順序が提示するようでなくてはならないわけでもない。

この実施例は、Casエンドヌクレアーゼを導いて、トウモロコシ胚中の染色体DNAを切断するための単一ガイドD(R)NAの使用を示す。liguleless 1遺伝子および稔性遺伝子Ms45(表16)付近の領域を標的とする6つの単一ガイドD(R)NA(sgD(R)NA)を設計して、予め組み込まれた構成的に発現するS.ピオゲネス(S. pyogenes)Cas9遺伝子を含有するトウモロコシ系統に送達させた。トウモロコシliguleless 1およびMs45ゲノム遺伝子座は、sgD(R)NA/Cas9媒介性切断により誘導される突然変異の存在に関して、ディープシーケンシングによって検査した。

予め組み込まれた構成的に発現するS.ピオゲネス(S. pyogenes)Cas9トウモロコシ系統は、Svitashevら(2015年)に記載されるように生成させた。

sgD(R)NA設計を、合成のための商業的な製造業者(Eurofins Scientific、ハンツビル、AL)に供給した。

sgRNA(配列番号207および227)は、実施例1に記載するように構築した。

構成的に発現するS.ピオゲネス(S. pyogenes)Cas9系統に由来する未熟トウモロコシ胚(IME)の、sgD(R)NAによるバイオリスティック媒介性形質転換は、Svitashevら(2015年)に記載されるように実行した。簡潔に述べると、Ananievら(Chromosoma;118(2):157〜77頁(2009年))に記載されるように、各sgD(R)NA 100ngを、細胞分裂刺激遺伝子であるZmODP2(米国特許公開番号第20050257289号)およびZmWUS2(米国特許第7,256,322号)の存在下で、60〜90個のIMEに送達した。粒子銃形質転換は、非常に可変的であり得るため、視覚的な選択可能なマーカーDNA表現カセットであるMoPAT−DsREDもまた、Svitashevら(2015年)に記載されるように、細胞分裂促進遺伝子とともに同時送達させた。切断に関して同じ領域を標的とするT7転写された単一ガイドRNA(sgRNA)100ngで形質転換させた胚(配列番号207および227)は、陽性対照として機能を果たし、ZmODP2、ZmWUS2およびMo−PAT−DsRED発現カセットのみで形質変換させた胚は、陰性対照として機能を果たした。3日後、各処理由来の20〜30個のほとんど一様に形質転換された胚を、DsRED蛍光に基づいて選択して、プールして、総ゲノムDNAを抽出した。意図した標的部位を取り囲む領域を、Phusion(登録商標)HighFidelity PCRマスターミックス(M0531L、New England Biolabs、イプスウィッチ、MA)を道いてPCR増幅させて、アンプリコン特異的バーコードに必要な配列を付け加えて、Illumniaシーケンシングは、2ラウンドのPCRによって「テイルド」プライマーを使用した。一次PCR反応で使用するプライマーを表17に示し、二次PCR反応で使用するプライマーは、配列番号214および215であった。

得られたPCR増幅を、Qiagen PCR精製スピンカラムで精製して、等モル比で組み合わせてHoechst色素ベースの蛍光定量的なアッセイで濃度を測定して、単一読取り100ヌクレオチド長ディープシーケンシングを、配列の偏りを相殺するためにPhiX制御v3の25%(v/v)のスパイクを有するIllumina MiSeq Personal Sequencer(Illumina、FC−110−3001)で実行した。切断の予測部位上に中心があり、陰性対照において類似したレベルで見出されない10ヌクレオチドウィンドウ内に生じる1個以上のヌクレオチドインデルを有する読取りのみを、突然変異体と分類した。同じ突然変異を有する突然変異体の読取りを計数して、単一読取りへとし、切断の予測部位内に生じる突然変異を有するとして視覚的に確認した。次に、視覚的に確認した突然変異の総数を使用して、バーコードおよびフォワードプライマーへの完全な適合を含有する適当な長さの読取りの総数に基づいて、突然変異体パーセント読取り算出した。

表18に示すように、sgD(R)NAを使用して、トウモロコシ細胞染色体DNAを切断するようにCasエンドヌクレアーゼを誘導し得ることを示す全ての処理において、突然変異が回収された。さらに、ある特定のsgD(R)NA設計(配列番号205および226)は、T7転写されたsgRNA(配列番号207および227)の突然変異頻度付近で突然変異頻度を示した。sgD(R)NAによって回収される突然変異の例を、図14A(配列番号217〜223に相当する、ここで、配列216は、liguleless1標的遺伝子座を含む参照トウモロコシ配列である)および図14B(配列番号235〜254に相当する、ここで、配列番号234は、Ms45標的遺伝子座を含む参照トウモロコシ配列である)に示す。

上述の開示は、本発明の特定の実施形態の説明および実施例を提供するが、それは、いかなる場合であっても限定的であるとは意図されず、本発明の範囲内で所望の結果を達成するように特定の方法、組成物または工程を適応させるために、開示する実施例を変更させることは、当業者の知識の範囲内である。かかる変更は全て、本発明の範囲内であると意図される。

QQ群二维码
意见反馈