CRISPRに基づくゲノム修飾および制御

申请号 JP2017115672 申请日 2017-06-13 公开(公告)号 JP2017192392A 公开(公告)日 2017-10-26
申请人 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー; Sigma−Aldrich Co., LLC; 发明人 フチアン・チェン; グレゴリー・ディ・デイビス; チャオホア・カン; スコット・ダブリュー・ナイト;
摘要 【課題】真核細胞において 染色 体配列を修飾するための方法の提供。 【解決手段】a)真核細胞に、(i)核局在化シグナルを含むRNA誘導型エンドヌクレアーゼ、又は核局在化シグナルを含むRNA誘導型エンドヌクレアーゼをコードするコドン最適化された核酸、(ii)ガイドRNA又はガイドRNAをコードするDNA、及び(iii)ドナー配列を含むドナーポリヌクレオチドを導入すること、及びb)真核細胞を、ガイドRNAが、RNA誘導型エンドヌクレアーゼを染色体配列中の標的部位へ誘導し、そこでRNA誘導型エンドヌクレアーゼが、標的部位にて二本鎖の切断を誘導し、二本鎖の切断が、染色体配列が、ドナー配列の染色体配列への挿入又は置換により修飾されるようにDNA修復過程により修復されるように培養すること、を含む、ドナー配列を組み込むことによる、染色体配列を修飾するための方法。 【選択図】なし
权利要求

少なくとも1つの核局在化シグナル、少なくとも1つのヌクレアーゼドメイン、および切断のために特定のヌクレオチド配列にエンドヌクレアーゼを標的化するためのガイドRNAと相互作用する少なくとも1つのドメインを含む、単離されたエンドヌクレアーゼ。該エンドヌクレアーゼがCas9タンパク質に由来する、請求項1に記載の単離されたエンドヌクレアーゼ。エンドヌクレアーゼが、少なくとも1つの機能的ヌクレアーゼドメインを欠失するように修飾されている、請求項1または2に記載の単離されたエンドヌクレアーゼ。細胞透過性ドメイン、マーカードメイン、または両方をさらに含む、請求項1から3のいずれか一項に記載の単離されたエンドヌクレアーゼ。ガイドRNAを含むタンパク質−RNA複合体の一部である、請求項1から4のいずれか一項に記載の単離されたエンドヌクレアーゼ。ガイドRNAが、標的部位に相補的である5’領域を含む単一分子である、請求項5に記載の単離されたエンドヌクレアーゼ。請求項1から4のいずれか一項に記載のエンドヌクレアーゼをコードする単離された核酸。核酸が、哺乳動物細胞における翻訳に最適なコドンである、請求項7に記載の単離された核酸。核酸が、ヒト細胞における翻訳に最適なコドンである、請求項7に記載の単離された核酸。プロモーター調節配列に操作可能に連結されている、請求項7から9のいずれか一項に記載の単離された核酸。請求項10に記載の単離された核酸を含むベクター。プロモーター調節配列に操作可能に連結されているガイドRNAをコードする配列をさらに含む、請求項11に記載のベクター。真核細胞または胚において染色体配列を修飾するための方法であって、 a)真核細胞または胚に、(i)少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼ、または少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼをコードする核酸、(ii)少なくとも1つのガイドRNAまたは少なくとも1つのガイドRNAをコードするDNA、および任意に、(iii)少なくとも1つのドナーポリヌクレオチドを導入し、 b)真核細胞または胚を、各ガイドRNAが、RNA誘導型エンドヌクレアーゼを染色体配列中の標的部位へ誘導し、そこでRNA誘導型エンドヌクレアーゼが、該標的部位にて二本鎖の切断を誘導し、該二本鎖の切断が、染色体配列が修飾されるようにDNA修復過程により修復されるように培養することを含む、 方法。RNA誘導型エンドヌクレアーゼがCas9タンパク質に由来する、請求項13に記載の方法。RNA誘導型エンドヌクレアーゼをコードする核酸がmRNAである、請求項13または14に記載の方法。RNA誘導型エンドヌクレアーゼをコードする核酸がDNAである、請求項13または14に記載の方法。DNAが、ガイドRNAをコードする配列をさらに含むベクターの一部である、請求項16に記載の方法。真核細胞が、ヒト細胞、非ヒト哺乳動物細胞、幹細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物である、請求項13から17のいずれか一項に記載の方法。胚が、非ヒト単一細胞動物胚である、請求項13から17のいずれか一項に記載の方法。CRISPR/Cas様タンパク質またはそのフラグメントおよびエフェクタードメインを含む、融合タンパク質。CRISPR/Cas様タンパク質が、Cas9タンパク質に由来する、請求項20に記載の融合タンパク質。Cas9タンパク質が、少なくとも1つの機能的ヌクレアーゼドメインを欠失するように修飾されている、請求項21に記載の融合タンパク質。Cas9タンパク質が、全てのヌクレアーゼ活性を欠失するように修飾されている、請求項21に記載の融合タンパク質。エフェクタードメインが切断ドメインである、請求項20から23のいずれか一項に記載の融合タンパク質。切断ドメインが、FokIエンドヌクレアーゼドメインまたは修飾FokI切断ドメインである、請求項24に記載の融合タンパク質。融合タンパク質が、第二の融合タンパク質と二量体を形成する、請求項25に記載の融合タンパク質。融合タンパク質が、FokIエンドヌクレアーゼドメインまたは修飾FokI切断ドメインを含むジンクフィンガーヌクレアーゼとヘテロ二量体を形成する、請求項25に記載の融合タンパク質。CRISPR/Cas様タンパク質が、全てのヌクレアーゼ活性を欠失するように修飾されたCas9タンパク質に由来し、エフェクタードメインが、FokIエンドヌクレアーゼドメインまたは修飾FokI切断ドメインである、請求項20に記載の融合タンパク質。エフェクタードメインが、転写活性化ドメイン、転写リプレッサードメイン、および後成的修飾ドメインから選択される、請求項20から23のいずれか一項に記載の融合タンパク質。融合タンパク質が、核局在化シグナル、細胞透過性ドメイン、およびマーカードメインから選択される少なくとも1つのさらなるドメインをさらに含む、請求項20から29のいずれか一項に記載の融合タンパク質。請求項20から30のいずれか一項に記載の融合タンパク質をコードする単離された核酸。染色体配列を修飾する方法、または細胞もしくは胚における染色体配列の発現を調節する方法であって、該細胞または胚に、(a)少なくとも1つの融合タンパク質または少なくとも1つの融合タンパク質をコードする核酸(ここで、該融合タンパク質は、CRISPR/Cas様タンパク質またはそのフラグメントおよびエフェクタードメインを含む。)、および(b)少なくとも1つのガイドRNAまたは少なくとも1つのガイドRNAをコードするDNA(ここで、該1つのガイドRNAは、融合タンパク質のCRISPR/Cas様タンパク質を染色体配列の標的部位へ誘導し、融合タンパク質のエフェクタードメインは、該染色体配列を修飾するか、または該染色体配列の発現を制御する。)を導入することを含む、方法。CRISPR/Cas様タンパク質が、Cas9タンパク質に由来する、請求項32に記載の方法。cas9タンパク質が、少なくとも1つの機能的ヌクレアーゼドメインを欠失するように修飾される、請求項33に記載の方法。cas9タンパク質が、全てのヌクレアーゼ活性を欠失するように修飾される、請求項33に記載の方法。融合タンパク質が、核局在化シグナル、細胞透過性ドメイン、およびマーカードメインから選択される少なくとも1つのさらなるドメインをさらに含む、請求項32から35のいずれか一項に記載の方法。エフェクタードメインが切断ドメインである、請求項32から36のいずれか一項に記載の方法。1つの融合タンパク質または1つの融合タンパク質をコードする核酸および2つのガイドRNAまたは2つのガイドRNAをコードするDNAが、細胞または胚に導入される、請求項37に記載の方法。融合タンパク質が、Cas9タンパク質またはそのフラグメントおよびFokI切断ドメインまたは修飾FokI切断ドメインを含む、請求項38に記載の方法。2つの融合タンパク質または2つの融合タンパク質をコードする核酸および2つのガイドRNAまたは2つのガイドRNAをコードするDNAが、細胞または胚に導入される、請求項37に記載の方法。各融合タンパク質が、異なるCas9タンパク質もしくはそのフラグメントおよび/またはFokI切断ドメインもしくは修飾FokI切断ドメインを含む、請求項40に記載の方法。1つの融合タンパク質または1つの融合タンパク質をコードする核酸、1つのガイドRNAまたは1つのガイドRNAをコードするDNA、ならびに1つのジンクフィンガーヌクレアーゼまたは1つのジンクフィンガーヌクレアーゼをコードする核酸が、細胞または胚に導入される、請求項37に記載の方法。融合タンパク質が、Cas9タンパク質またはそのフラグメントおよびFokI切断ドメインまたはその誘導体を含み、ジンクフィンガーヌクレアーゼが、FokI切断ドメインまたは修飾FokI切断ドメインを含む、請求項42に記載の方法。細胞または胚に少なくとも1つのドナーポリヌクレオチドを導入することをさらに含む、請求項37から43のいずれか一項に記載の方法。エフェクタードメインが、後成的修飾ドメイン、転写活性化ドメイン、または転写リプレッサードメインから選択される、請求項32から36のいずれか一項に記載の方法。1つの融合タンパク質または1つの融合タンパク質をコードする核酸、および1つのガイドRNAまたは1つのガイドRNAをコードするDNAが、細胞または胚に導入される、請求項45に記載の方法。細胞が、ヒト細胞、非ヒト哺乳動物細胞、幹細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物である、請求項32から46のいずれか一項に記載の方法。胚が非ヒト単一細胞動物胚である、請求項32から46のいずれか一項に記載の方法。

ドナー配列を組み込むことにより、真核細胞において染色体配列を修飾するための方法であって、 a)真核細胞に、(i)少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼ、または少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼをコードするコドン最適化された核酸、(ii)少なくとも1つのガイドRNAまたは少なくとも1つのガイドRNAをコードするDNA、および(iii)ドナー配列を含む少なくとも1つのドナーポリヌクレオチドを導入すること、および b)真核細胞を、ガイドRNAが、RNA誘導型エンドヌクレアーゼを染色体配列中の標的部位へ誘導し、そこでRNA誘導型エンドヌクレアーゼが、該標的部位にて二本鎖の切断を誘導し、該二本鎖の切断が、染色体配列が、ドナー配列の染色体配列への挿入または置換により修飾されるようにDNA修復過程により修復されるように培養すること、 を含む、方法。RNA誘導型エンドヌクレアーゼが、クラスタ化調節的散在型短パリンドローム反復配列(CRISPR)/CRISPR−関連(Cas)(CRISPR/Cas)II型システムタンパク質に由来する、請求項1に記載の方法。CRISPR/CasII型システムタンパク質がCas9タンパク質である、請求項2に記載の方法。RNA誘導型エンドヌクレアーゼが、マーカードメインをさらに含む、請求項1〜3のいずれか一項に記載の方法。ガイドRNAが、染色体配列中の標的部位に相補的な第一の領域を含む、請求項1〜4のいずれか一項に記載の方法。ガイドRNAが、RNA誘導型エンドヌクレアーゼと相互作用する第二の領域を含む、請求項1〜5のいずれか一項に記載の方法。染色体配列中の標的部位が、プロトスペーサー近接モチーフ(PAM)の直前に位置する、請求項1〜6のいずれか一項に記載の方法。RNA誘導型エンドヌクレアーゼをコードする核酸がmRNAである、請求項1〜7のいずれか一項に記載の方法。RNA誘導型エンドヌクレアーゼをコードする核酸がDNAである、請求項1〜7のいずれか一項に記載の方法。RNA誘導型エンドヌクレアーゼをコードする核酸が、ガイドRNAをコードする配列をさらに含むベクターの一部である、請求項1〜7のいずれか一項に記載の方法。ガイドRNAが、少なくとも部分的に化学的に合成される、請求項1〜9のいずれか一項に記載の方法。ドナーポリヌクレオチド中のドナー配列が、染色体配列中の標的部位の近位の染色体配列での少なくとも1つのヌクレオチド変化を有する、請求項1〜11のいずれか一項に記載の方法。ドナーポリヌクレオチド中のドナー配列が、外来配列に相当する、請求項1〜11のいずれか一項に記載の方法。ドナーポリヌクレオチド中のドナー配列が、染色体配列中の標的部位の上流および下流に位置する配列と実質的に同一な配列を有する配列により挟まれている、請求項1〜13のいずれか一項に記載の方法。ドナーポリヌクレオチドが、RNA誘導型エンドヌクレアーゼにより認識される標的切断部位をさらに含む、請求項1〜13のいずれか一項に記載の方法。真核細胞が、ヒト細胞、非ヒト哺乳動物細胞、非ヒト哺乳動物胚、幹細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物である、請求項1〜15のいずれか一項に記載の方法。真核細胞がインビトロである、請求項1〜16のいずれか一項に記載の方法。真核細胞がインビボである、請求項1〜16のいずれか一項に記載の方法。

说明书全文

発明の分野 本発明は、標的ゲノム修飾に関する。特に、本発明は、RNA誘導型エンドヌクレアーゼまたはCRISPR/Cas様タンパク質を含む融合タンパク質、および標的染色体配列を修飾または調節するための該タンパク質の使用方法に関する。

発明の背景 標的ゲノム修飾は、真核細胞、胚、および動物の遺伝子操作のための強なツールである。例えば、外来性配列は、標的ゲノム部位に組み込まれ、および/または特定の内在性染色体配列は、欠失、不活性化または修飾され得る。現在の方法は、例えば、ジンクフィンガーヌクレアーゼ(ZFN)または転写アクティベーター様エフェクターヌクレアーゼ(TALEN)のような人工ヌクレアーゼの使用に依存している。これらのキメラヌクレアーゼは、非特異的DNA切断ドメインに連結したプログラム可能な配列特異的DNA結合分子を含む。しかしながら、それぞれの新規ゲノム標的は、新規の配列特異的DNA結合分子を含む新規ZFNまたはTALENの設計を必要とする。従って、これらのカスタム設計されたヌクレアーゼは、割高な費用が掛かり、製造に時間を要する傾向がある。さらに、ZFNおよびTALENの特異性は、それらがオフターゲット(off−target)の切断を仲介し得る程度のものである。

従って、それぞれの新しい標的ゲノム部位に対する新しいヌクレアーゼの設計を必要としない標的ゲノム修飾技術が必要とされている。さらに、オフターゲット作用が殆どまたは全くない、向上した特異性を有する技術が必要とされている。

発明の概要 本開示の種々の面には、単離されたRNA誘導型エンドヌクレアーゼの提供であって、該エンドヌクレアーゼが、少なくとも1つの核局在化シグナル、少なくとも1つのヌクレアーゼドメイン、および切断のために特定のヌクレオチド配列にエンドヌクレアーゼを標的化するガイドRNAと相互作用する少なくとも1つのドメインを含む、エンドヌクレアーゼの提供が含まれる。一態様において、エンドヌクレアーゼは、Cas9タンパク質に由来し得る。別の態様において、エンドヌクレアーゼは、少なくとも1つの機能的ヌクレアーゼドメインを欠失するように修飾され得る。他の態様において、エンドヌクレアーゼは、細胞透過性ドメイン、マーカードメイン、または両方をさらに含み得る。別の態様において、エンドヌクレアーゼは、ガイドRNAを含むタンパク質−RNA複合体の一部であり得る。いくつかの例において、ガイドRNAは、標的部位に相補的な5’領域を含む単一分子であり得る。また、本明細書に記載のRNA誘導型エンドヌクレアーゼの何れかをコードする単離された核酸も提供する。いくつかの態様において、核酸は、例えばヒト細胞のような哺乳動物細胞における翻訳に最適化されているコドンであり得る。他の態様において、RNA誘導型エンドヌクレアーゼをコードする核酸配列は、プロモーター調節配列に操作可能に連結されていてよく、要すれば、ベクターの一部であってよい。他の態様において、プロモーター調節配列に操作可能に連結されていてよいRNA誘導型エンドヌクレアーゼをコードする配列を含むベクターはまた、プロモーター調節配列に操作可能に連結されていてよいガイドRNAをコードする配列も含み得る。

本発明の別の面は、真核細胞または胚において染色体配列を修飾するための方法を包含する。該方法は、真核細胞または胚に、(i)本明細書に記載の、少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼまたは少なくとも1つのRNA誘導型エンドヌクレアーゼをコードする核酸、(ii)少なくとも1つのガイドRNAまたは少なくとも1つのガイドRNAをコードするDNA、および要すれば、(iii)ドナー配列を含む少なくとも1つのドナーポリヌクレオチド、を導入することを含む。該方法はさらに、細胞または胚を、各ガイドRNAが、RNA誘導型エンドヌクレアーゼを染色体配列中の標的部位に誘導され、そこでRNA誘導型エンドヌクレアーゼが、標的部位に二本鎖の切断を導入し、二本鎖の切断が、染色体配列が修飾されるようなDNA修復過程により修復されるように培養することを含む。一態様において、RNA誘導型エンドヌクレアーゼは、Cas9タンパク質に由来し得る。別の態様において、細胞または胚に導入されているRNA誘導型エンドヌクレアーゼをコードする核酸は、mRNAであり得る。さらなる態様において、細胞または胚に導入されているRNA誘導型エンドヌクレアーゼをコードする核酸はDNAであり得る。さらなる態様において、RNA誘導型エンドヌクレアーゼをコードするDNAは、ガイドRNAをコードする配列をさらに含むベクターの一部であり得る。ある態様において、真核細胞は、ヒト細胞、非ヒト哺乳動物細胞、幹細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物であり得る。ある他の態様において、胚は、非ヒト単一細胞動物胚である。

本開示のさらなる面は、1つのCRISPR/Cas様タンパク質またはそのフラグメントおよび1つのエフェクタードメインを含む融合タンパク質を提供する。一般的に、融合タンパク質は、少なくとも1つの核局在化シグナルを含む。融合タンパク質のエフェクタードメインは、切断ドメイン、後成的修飾ドメイン、転写活性化ドメイン、または転写リプレッサードメインであり得る。一態様において、融合タンパク質のCRISPR/Cas様タンパク質は、Cas9タンパク質に由来し得る。一例(iteration)において、Cas9タンパク質は、少なくとも1つの機能的ヌクレアーゼドメインを欠失するように修飾され得る。別の例(iteration)において、Cas9タンパク質は、全てのヌクレアーゼ活性を欠くように修飾され得る。一態様において、エフェクタードメインは、例えば、FokIエンドヌクレアーゼドメインまたは修飾FokIエンドヌクレアーゼドメインのような切断ドメインであり得る。別の態様において、一融合タンパク質は、別の融合タンパク質と二量体を形成し得る。二量体は、ホモ二量体またはヘテロ二量体であり得る。別の態様において、融合タンパク質は、ジンクフィンガーヌクレアーゼとヘテロ二量体を形成してよく、ここで、融合タンパク質およびジンクフィンガーヌクレアーゼの両方の切断ドメインは、FokIエンドヌクレアーゼドメインまたは修飾FokIエンドヌクレアーゼドメインである。さらに別の態様において、融合タンパク質は、全てのヌクレアーゼ活性を欠くように修飾されたCas9タンパク質に由来するCRISPR/Cas様タンパク質を含み、エフェクタードメインは、FokIエンドヌクレアーゼドメインまたは修飾FokIエンドヌクレアーゼドメインである。さらに別の態様において、融合タンパク質は、全てのヌクレアーゼ活性を欠くように修飾されたCas9タンパク質に由来するCRISPR/Cas様タンパク質を含み、エフェクタードメインは、後成的修飾ドメイン、転写活性化ドメイン、または転写リプレッサードメインであり得る。さらなる態様において、本開示の融合タンパク質の何れかは、核局在化シグナル、細胞透過性ドメイン、およびマーカードメインから選択される、少なくとも1つのさらなるドメインを含み得る。また、本明細書に記載の融合タンパク質の何れかをコードする単離された核酸も提供する。

本開示のさらに別の面は、染色体配列を修飾するか、または細胞もしくは胚において染色体配列の発現を制御するための方法を含む。該方法は、細胞または胚に、(a)少なくとも1つの融合タンパク質または少なくとも1つの融合タンパク質をコードする核酸(ここで、該融合タンパク質は、CRISPR/Cas様タンパク質またはそのフラグメントおよびエフェクタードメインを含む。)、および(b)少なくとも1つのガイドRNAまたは少なくとも1つのガイドRNAをコードするDNA(ここで、該ガイドRNAは、融合タンパク質のCRISPR/Cas様タンパク質を染色体配列の標的部位へ誘導し、融合タンパク質のエフェクタードメインは、該染色体配列を修飾するか、または該染色体配列の発現を制御する。)を導入することを含む。一態様において、融合タンパク質のCRISPR/Cas様タンパク質は、Cas9タンパク質に由来し得る。別の態様において、融合タンパク質のCRISPR/Cas様タンパク質は、少なくとも1つの機能的ヌクレアーゼドメインを欠くように修飾され得る。さらに別の態様において、融合タンパク質のCRISPR/Cas様タンパク質は、全てのヌクレアーゼ活性を欠くように修飾され得る。一態様において、融合タンパク質が、全てのヌクレアーゼ活性を欠くように修飾されているCas9タンパク質およびFokI切断ドメインまたは修飾FokI切断ドメインを含むとき、該方法は、細胞または胚に、1つの融合タンパク質または1つの融合タンパク質をコードする核酸および2つのガイドRNAまたは2つのガイドRNAをコードするDNAを導入することを含んでいてよく、ここで、1カ所の二本鎖の切断が染色体配列に導入される。融合タンパク質が、全てのヌクレアーゼ活性を欠くように修飾されたCas9タンパク質およびFokI切断ドメインまたは修飾されたFokI切断ドメインを含む別の態様において、該方法は、細胞または胚に、2つの融合タンパク質または2つの融合タンパク質をコードする核酸および2つのガイドRNAまたは2つのガイドRNAをコードするDNAを導入することを含んでいてよく、ここで、2カ所の二本鎖の切断が染色体配列に導入される。融合タンパク質が、全てのヌクレアーゼ活性を欠くように修飾されたCas9タンパク質およびFokI切断ドメインまたは修飾されたFokI切断ドメインを含むさらに別の一態様において、該方法は、細胞または胚に、1つの融合タンパク質または1つの融合タンパク質をコードする核酸、1つのガイドRNAまたは1つのガイドRNAをコードする核酸、および1つのジンクフィンガーヌクレアーゼまたは1つのジンクフィンガーヌクレアーゼをコードする核酸を導入することを含んでいてよく、ここで、該ジンクフィンガーヌクレアーゼは、FokI切断ドメインまたは修飾されたFokI切断ドメインを含み、1カ所の二本鎖の切断が染色体配列に導入される。融合タンパク質が切断ドメインを含む任意の態様において、該方法は、細胞または胚に、少なくとも1つのドナーポリヌクレオチドを導入することをさらに含んでいてよい。融合タンパク質が、後成的修飾ドメイン、転写活性化ドメイン、または転写リプレッサードメインから選択されるエフェクタードメインを含む態様において、融合タンパク質は、全てのヌクレアーゼ活性を欠くように修飾されたCas9タンパク質を含んでいてよく、該方法は、細胞または胚に、1つの融合タンパク質または1つの融合タンパク質をコードする核酸、および1つのガイドRNAまたは1つのガイドRNAをコードする核酸を導入することを含み、ここで、標的染色体配列の構造または発現は修飾されている。ある態様において、真核細胞は、ヒト細胞、非ヒト哺乳動物細胞、幹細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物であり得る。任意の他の態様において、胚は、非ヒト細胞動物胚である。

本開示の他の面および例(iteration)は、下記で詳しく説明する。

図1は、タンパク質二量体を用いるゲノム修飾の図である。(A)は、各々がDNA結合のためのCas様タンパク質およびFokI切断ドメインを含む2つの融合タンパク質からなる二量体によって生じる二本鎖切断を示す。(B)は、Cas様タンパク質およびFokI切断ドメインおよびジンクフィンガー(ZF)DNA結合ドメインを含むジンクフィンガーヌクレアーゼおよびFokI切断ドメインを含む融合タンパク質からなる二量体によって生じる二本鎖切断を示す。

図2は、遺伝子調節ドメインを含むRNA誘導型融合タンパク質を用いる遺伝子発現の制御を図示する。(A)は、DNA結合のために用いるCas様タンパク質および遺伝子発現を活性化または抑制する“A/R”ドメインを含む融合タンパク質を示す。(B)は、DNA結合のためのCas様タンパク質および近位DNAまたはタンパク質の共有結合修飾によって後成的影響を受ける後成的修飾ドメイン(“Epi−mod”)を含む融合タンパク質を示す。

図3は、2つのRNA誘導型エンドヌクレアーゼを用いるゲノム修飾を示す。(A)は、ニッカーゼ(nickase)に変換された2つのRNA誘導型エンドヌクレアーゼによって生じる二本鎖切断を示す。(B)は、エンドヌクレアーゼ活性を有する2つのRNA誘導型エンドヌクレアーゼによって生じる2つの二本鎖切断を示す。

図4は、Cas9核酸、Cas9ガイドRNA、およびAAVS1−GFP DNAドナーで形質転換したヒト K562細胞の蛍光活性化細胞選別(FACS)を示す。Y軸は、赤色蛍光チャネルでの自己蛍光強度を示し、X軸は緑色蛍光強度を示す。(A)アンチリバースキャップアナログ(Anti−Reverse Cap Analog)を用いて転写されたCas9 mRNAを10μg、0.3nmolの予めアニーリングさせたcrRNA−tracrRNA二本鎖、および10μgのAAVS1−GFPプラスミドDNAでトランスフェクトされたK562細胞;(B)アンチリバースキャップアナログを用いて転写されたCas9 mRNAを10μg、0.3nmolのキメラ RNA、および10μgのAAVS1−GFP プラスミド DNAでトランスフェクトされたK562細胞;(C)転写後キャッピング反応によりキャップされたCas9 mRNAを10μg、0.3nmolのキメラRNA、および10μgのAAVS1−GFP プラスミド DNAでトランスフェクトされたK562細胞;(D)10μgのCas9 プラスミド DNA、5μgのU6−キメラ RNA プラスミド DNA、および10μgのAAVS1−GFP プラスミド DNAでトランスフェクトされたK562細胞;(E)10μgのAAVS1−GFP プラスミド DNAでトランスフェクトされたK562細胞;(F)トランスフェクション試薬のみでトランスフェクトされたK562細胞。

図5は、ヒト細胞におけるAAVS1領域へのGFPの特異的挿入を証明するジャンクションPCR分析を示す。レーンM:1kb DNA分子マーカー;レーンA:アンチリバースキャップアナログを用いて転写されたCas9 mRNAを10μg、0.3nmolの予めアニーリングさせたcrRNA−tracrRNA二本鎖、および10μgのAAVS1−GFPプラスミドDNAでトランスフェクトされたK562細胞;レーンB:アンチリバースキャップアナログを用いて転写されたCas9 mRNAを10μg、0.3nmolのキメラ RNA、および10μgのAAVS1−GFP プラスミド DNAでトランスフェクトされたK562細胞;レーンC:転写後キャッピング反応によりキャップされたCas9 mRNAを10μg、0.3nmolのキメラRNA、および10μgのAAVS1−GFP プラスミド DNAでトランスフェクトされたK562細胞;レーンD:10μgのCas9 プラスミド DNA、5μgのU6−キメラ RNA プラスミド DNA、および10μgのAAVS1−GFP プラスミド DNAでトランスフェクトされたK562細胞;レーンE:10μgのCas9 プラスミド DNA、5μgのU6−キメラ RNA プラスミド DNA、および10μgのAAVS1−GFP プラスミド DNAでトランスフェクトされたK562細胞;レーンF:トランスフェクション試薬のみでトランスフェクトされたK562細胞。

発明の詳細な説明 本発明は、少なくとも1つの核局在化シグナル、少なくとも1つのヌクレアーゼドメイン、および切断のためにエンドヌクレアーゼを特定のヌクレオチド配列に標的化するガイドRNAと相互作用する少なくとも1つのドメインを含む、RNA誘導型エンドヌクレアーゼを提供する。また、RNA誘導型エンドヌクレアーゼをコードする核酸、ならびに真核細胞または胚の染色体配列を修飾するための該RNA誘導型エンドヌクレアーゼの使用方法を提供する。RNA誘導型エンドヌクレアーゼは、それぞれがエンドヌクレアーゼを特定の標的部位に誘導し、その部位で、RNA誘導型エンドヌクレアーゼが、染色体配列が修飾されるようにDNA修復過程により修復され得る二本鎖の切断を導入する、複数の特定のガイドRNAと相互作用する。特異性がガイドRNAにより提供されるため、RNAベースのエンドヌクレアーゼが汎用され、異なるガイドRNAを用いて異なるゲノム配列を標的とするために使用され得る。本明細書に記載の方法は、特定の染色体配列を標的とし、修飾するため、および/または細胞または胚のゲノムにおける標的領域に内在性配列を導入するために使用され得る。さらに、標的化は、特異的であり、オフターゲット作用は制限されている。

本開示は、CRISPR/Cas様タンパク質またはそのフラグメントおよびエフェクタードメインを含む融合タンパク質を提供する。好適なエフェクタードメインは、切断ドメイン、後成的修飾ドメイン、転写活性化ドメイン、および転写リプレッサードメインを含むが、これらに限定されない。各融合タンパク質は、特定のガイドRNAによって特定の染色体配列に誘導され、ここで、エフェクタードメインは、標的ゲノム修飾または遺伝子制御を仲介する。一面において、融合タンパク質は、二量体として機能することが可能であり、故に、標的部位の長さを延長し、ゲノムにおけるその特異性の可能性を高め得る(故に、オフターゲット作用を低減する)。例えば、内在性CRISPRシステムは、およそ13−20塩基対(bp)長のDNA結合に基づくゲノムの位置を修飾する(Cong et al., Science, 339:819−823)。このbp長にて、標的部位の5−7%のみが、ゲノム内でユニークである(Iseli et al, PLos One 2(6):e579)。対照的に、ジンクフィンガーヌクレアーゼのためのDNA結合の塩基対長は、典型的に、30−36bpであり、その結果、ヒトゲノム内で約85−87%がユニークである標的部位を生じる。CRISPRベースのシステムで利用される小さなDNA結合部位は、所望の位置、例えば疾患SNP、スモールエクソン、開始コドン、および停止コドンなど、ならびに複合体ゲノム内の他の位置の近くに標的化されたCRISPベースのヌクレアーゼの設計を限定し、複雑にしている。本開示は、CRISPR DNA結合の塩基対長を延長する(すなわち、オフターゲット活性を制限する)ための手段を提供するのみでなく、修飾された機能を有するCRISPR 融合タンパク質をさらに提供する。従って、本明細書に記載のCRISPR 融合タンパク質は、標的特異性および独特の機能性(複数可)が増大している。また、本発明は、標的化染色体配列の発現を変更または調節する融合タンパク質を使用する方法を提供する。

(I)RNA誘導型エンドヌクレアーゼ 本明細書に記載の一面は、真核細胞および胚、例えば、非ヒト単一細胞胚などの核へのエンドヌクレアーゼの移入を可能にする、少なくとも1つの核局在化シグナルを含むRNA誘導型エンドヌクレアーゼを提供する。RNA誘導型エンドヌクレアーゼはまた、少なくとも1つのヌクレアーゼドメインおよびガイドRNAと相互作用する少なくとも1つのドメインを含む。RNA誘導型エンドヌクレアーゼは、ガイドRNAによって特定の核酸配列(または標的部位)に誘導される。ガイドRNAは、一旦標的部位に誘導されると、RNA誘導型エンドヌクレアーゼが標的部位の核酸配列に二本鎖の切断を導入し得るように、RNA誘導型エンドヌクレアーゼならびに標的部位を相互作用させる。ガイドRNAは標的化切断のための特異性を提供するため、RNA誘導型エンドヌクレアーゼのエンドヌクレアーゼは汎用性であり、異なる標的核酸配列を切断するために異なるガイドRNAと共に用いることができる。本発明は、単離されたRNA誘導型エンドヌクレアーゼ、RNA誘導型エンドヌクレアーゼをコードする単離された核酸(すなわち、RNAまたはDNA)、RNA誘導型エンドヌクレアーゼをコードする核酸を含むベクター、およびRNA誘導型エンドヌクレアーゼ+ガイドRNAを含むタンパク質−RNA複合体を提供する。

RNA誘導型エンドヌクレアーゼは、クラスタ化調節的散在型短パリンドローム反復配列(clustered regularly interspersed short palindromic repeats:CRISPR)/CRISPR−関連(Cas)システムに由来し得る。CRISPR/Casシステムは、I型、II型、またはIII型システムとすることができる。適当なCRISPR/Casタンパク質の非限定的な例には、Cas3、Cas4、Cas5、Cas5e(または、CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(または、CasA)、Cse2(または、CasB)、Cse3(または、CasE)、Cse4(または、CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3,Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csz1、Csx15、Csf1、Csf2、Csf3、Csf4、およびCu1966が含まれる。

一態様において、RNA誘導型エンドヌクレアーゼは、II型CRISPR/Casシステム由来である。特定の態様において、RNA誘導型エンドヌクレアーゼは、Cas9タンパク質に由来する。Cas9タンパク質は、化膿連鎖球菌、ストレプトコッカス・サーモフィルス、ストレプトコッカス属、ノカルジオプシス・ダッソンビエイ、ストレプトマイセス・プリスチナエスピラリス、ストレプトマイセス・ビリドクロモゲネス(Streptomyces viridochromogenes)、ストレプトスポランギウム・ロセウム、アリサイクロバチルス・アシドカルダリウス、バチルス・シュードマイコイデス、バチルス・セレニティレドセンス、イグジォバクテリウム・シビリカム(Exiguobacterium sibiricum)、、ラクトバチラス・デルブリッキー、ラクトバチルス・サリヴァリゥス、マイクロシーラ・マリナ、バークホルデリア細菌、ポラロモナス・ナフタレニボランス、ポラロモナス種、クロコスファエラ・ワストニイ(Crocosphaera watsonii)、シアノセイス属、ミクロシスティス・アエルギノーサ(Microcystis aeruginosa)、シネココッカス属、アセトハロビウム・アラバチカム、アモニフェクス・デジェンシー(Ammonifex degensii)、カルジセルロシルプトル・ベクシ(Caldicellulosiruptor becscii)、カンジダ・デスルフォルディス(Candidatus Desulforudis)、クロストリジウム・ボツリヌス、クロストリジウム・ディフィシル、フィネゴルディア・マグナ、ナトラナエロビウス・テルモフィルスム(Natranaerobius thermophilusm)、ペロトマキュラム・サーモプロピオニカム、アシディチオバチルス・カルダス、アシディチオバチルス・フェロオキシダンス、アロクロマチウム・ビノスム、マリノバクター属、ニトロソコッカス・ハロフィルス(Nitrosococcus halophilus)、ニトロソコッカス・ワッソニ(Nitrosococccus watsoni)、シュードアルテロモナス・ハロプランクティス、クテドノバクテル・ラセミファー(Ktedonobacter racemifer)、メタノハロビウム・エベスチガタム(Methanohalbium evestigatum)、アナベナ・バリアビリス、ノジュラリア・スプミゲナ、ノストック属、アルスロスピラ・マキシマ、アルスロスピラ・プラテンシス、アルスロスピラ属、リングビア属、ミクロコレス・クソノプラステス(Microcoleus chthonoplastes)、オシラトリア属、ペトロトガ・モビリス、サーモシホ・アフリカヌス、またはアカリオクロリス・マリーナに由来していてよい。

一般的に、CRISPR/Casタンパク質は、少なくとも1つのRNA認識ドメインおよび/またはRNA結合ドメインを含む。RNA認識ドメインおよび/またはRNA結合ドメインは、ガイドRNAと相互作用する。CRISPR/Casタンパク質はまた、ヌクレアーゼドメイン(すなわち、DNaseまたはRNaseドメイン)、DNA結合ドメイン、ヘリカーゼドメイン、RNAseドメイン、タンパク質−タンパク質相互作用ドメイン、二量体化ドメイン、ならびに他のドメインを含んでいてよい。

CRISPR/Cas様タンパク質は、野生型CRISPR/Casタンパク質、修飾型CRISPR/Casタンパク質、または野生型もしくは修飾型CRISPR/Casタンパク質のフラグメントであり得る。CRISPR/Cas様タンパク質は、核酸結合親和性および/または特異性を増大し、酵素活性を変更し、および/またはタンパク質の別の特性を変更するために修飾されていてよい。例えば、CRISPR/Cas様タンパク質のヌクレアーゼ(すなわち、DNase、RNase)ドメインは、修飾、欠失または不活性化されていてよい。あるいは、CRISPR/Cas様タンパク質は、融合タンパク質の機能に必須ではないドメインを除去するために切断されていてよい。CRISPR/Cas様タンパク質はまた、融合タンパク質のエフェクタードメインの活性を最適化するために切断または修飾されていてもよい。

いくつかの態様において、CRISPR/Cas様タンパク質は、野生型Cas9タンパク質またはそのフラグメント由来であり得る。他の態様において、CRISPR/Cas様タンパク質は、修飾型Cas9タンパク質由来であり得る。例えば、Cas9タンパク質のアミノ酸配列は、タンパク質の1つまたはそれ以上の特性(例えば、ヌクレアーゼ活性、親和性、安定性など)を改変するために修飾されていてよい。あるいは、RNA誘導型切断に関与しないCas9タンパク質のドメインは、修飾型Cas9タンパク質が野生型Cas9タンパク質よりも小さいように、タンパク質から除かれ得る。

一般的に、Cas9タンパク質は、少なくとも2つのヌクレアーゼ(すなわち、DNase)ドメインを含む。例えば、Cas9タンパク質は、RuvC様ヌクレアーゼドメインおよびHNH様ヌクレアーゼドメインを含み得る。RuvCおよびHNHドメインは、DNA中に二本鎖の切断を行うために、一本鎖を切断するのに協働する(Jinek et al., Science, 337: 816−821)。ある態様において、Cas9由来のタンパク質は、1つの機能的ヌクレアーゼドメイン(RuvC様またはHNH様ヌクレアーゼドメインのいずれか)のみを含むように修飾されていてよい。例えば、Cas9由来のタンパク質は、ヌクレアーゼドメインの1つが、それがもはや機能しない(すなわち、ヌクレアーゼ活性が存在しない)ように欠失または変異するように修飾されていてよい。ヌクレアーゼドメインの1つが不活性である態様において、Cas9由来のタンパク質は、二本鎖核酸にニックを導入することができるが(かかるタンパク質は、“ニッカーゼ”と呼ばれる)、二本鎖DNAを切断することはできない。例えば、RuvC様ドメインにおけるアスパラギン酸からアラニンへの変換(D10A)は、Cas9由来のタンパク質をニッカーゼに変換する。同様に、HNHドメインにおけるヒスチジンからアラニンへの変換(H840AまたはH839A)は、Cas9由来のタンパク質をニッカーゼに変換する。各ヌクレアーゼドメインは、部位特異的突然変異誘発法、PCR仲介性突然変異誘発法、および全遺伝子合成、ならびに当技術分野で公知の他の方法のような周知の方法を用いて修飾され得る。

本明細書に記載のRNA誘導型エンドヌクレアーゼは、少なくとも1つの核局在化シグナルを含む。一般に、NLSは、一続きの塩基性アミノ酸を含む。核局在化シグナルは当技術分野で公知である(例えば、Lange et al., J. Biol. Chem., 2007, 282:5101−5105を参照のこと)。例えば、一態様において、NLSは、PKKKRKV(配列番号1)またはPKKKRRV(配列番号2)のような、単一のクラスタを含む単極型(monopartite)配列であり得る。別の態様において、NLSは、二極型(bipartite)配列であり得る。さらに別の態様において、NLSは、KRPAATKKAGQAKKKK(配列番号3)であってよい。NLSは、N末端、C末端、またはRNA誘導型エンドヌクレアーゼの内部に位置してよい。

ある態様において、RNA誘導型エンドヌクレアーゼは、少なくとも1つの細胞透過性ドメインをさらに含み得る。一態様において、細胞透過性ドメインは、HIV−1 TATタンパク質由来の細胞透過性ペプチド配列である。一例として、TAT細胞透過性配列は、GRKKRRQRRRPPQPKKKRKV(配列番号4)であり得る。別の態様において、細胞透過性ドメインは、TLM(PLSSIFSRIGDPPKKKRKV;配列番号5)、ヒトのB型肝炎ウイルス由来の細胞透過性ペプチド配列であり得る。さらに別の態様において、細胞透過性ドメインは、MPG(GALFLGWLGAAGSTMGAPKKKRKV;配列番号6またはGALFLGFLGAAGSTMGAWSQPKKKRKV;配列番号7)であり得る。さらなる態様において、細胞透過性ドメインは、Pep−1(KETWWETWWTEWSQPKKKRKV;配列番号8)、VP22、ヘルペス単純ウイルス由来の細胞透過性ペプチド、またはポリアルギニンペプチド配列であり得る。細胞透過性ドメインは、C末端、またはRNA誘導型エンドヌクレアーゼの内部に位置していてよい。

さらに他の態様において、RNA誘導型エンドヌクレアーゼは、少なくとも1つのマーカードメインも含んでいてよい。マーカードメインの非限定的例には、蛍光タンパク質、精製タグ、およびエピトープタグが含まれる。ある態様において、マーカードメインは、蛍光タンパク質であり得る。好適な蛍光タンパク質の非限定的例には、緑色蛍光タンパク質(例えば、GFP、GFP−2、タグGFP、turboGFP、EGFP、Emerald、Azami Green、単量体Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色蛍光タンパク質(例えば、YFP、EYFP、Citrine、Venus、YPet、PhiYFP、Zs黄色1)、青色蛍光タンパク質(例えば、EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T−sapphire)、青緑色蛍光タンパク質(例えば、ECFP、Cerulean、CyPet、AmCyan1、Midoriishi−Cyan)、赤色蛍光タンパク質(mKate、mKate2、mPlum、DsRed単量体、mCherry、mRFP1、DsRed−Express、DsRed2、DsRed−Monomer、HcRed−Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)、および橙色蛍光タンパク質(mOrange、mKO、Kusabira−Orange、Monomeric Kusabira−Orange、mTangerine、tdTomato)、または何れかの他の好適な蛍光タンパク質が含まれる。他の態様において、マーカードメインは、精製タグおよび/またはエピトープタグであり得る。タグの例には、グルタチオン−S−トランスフェラーゼ(GST)、キチン結合タンパク質(CBP)、マルトース結合タンパク質、チオレドキシン(TRX)、ポリ(NANP)、タンデムアフィニティー精製(TAP)タグ、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu−Glu、HSV、KT3、S、S1、T7、V5、VSV−G、6×ヒス、ビオチンカルボキシルキャリアタンパク質(BCCP)、およびカルモジュリンが含まれるが、これらに限定されない。

任意の態様において、RNA誘導型エンドヌクレアーゼは、ガイドRNAを含むタンパク質−RNA複合体の一部であり得る。ガイドRNAは、RNA誘導型エンドヌクレアーゼと相互作用して、エンドヌクレアーゼを、特定の標的部位(ガイドRNA塩基対の5’末端にある特定のプロトスペーサー配列)へ誘導する。

(II)融合タンパク質 本開示の別の面は、CRISPR/Cas様タンパク質またはそのフラグメントおよびエフェクタードメインを含む融合タンパク質を提供する。CRISPR/Cas様タンパク質は、ガイドRNAによって標的部位へ誘導され、その部位で、エフェクタードメインは、標的化核酸配列を修飾するか、またはそれに作用し得る。エフェクタードメインは、切断ドメイン、後成的修飾ドメイン、転写活性化ドメイン、または転写リプレッサードメインであり得る。融合タンパク質は、核局在化シグナル、細胞透過性ドメイン、またはマーカードメインから選択される少なくとも1つのさらなるドメインをさらに含み得る。

(a)CRISPR/Cas様タンパク質 融合タンパク質は、CRISPR/Cas様タンパク質またはそのフラグメントを含む。CRISPR/Cas様タンパク質は、上記のセクション(I)に詳述している。CRISPR/Cas様タンパク質は、N末端、C末端、または融合タンパク質の内部に位置していてよい。

ある態様において、融合タンパク質のCRISPR/Cas様タンパク質は、Cas9タンパク質由来であり得る。Cas9由来のタンパク質は、野生型、修飾型、またはそのフラグメントであり得る。ある態様において、Cas9由来のタンパク質は、1個の機能的ヌクレアーゼドメイン(RuvC様またはHNH様ヌクレアーゼドメインの何れか)のみを含むように修飾されていてよい。例えば、Cas9由来のタンパク質は、ヌクレアーゼドメインの1つが、もはや機能しない(すなわち、ヌクレアーゼ活性が存在しない)ように欠失または変異するように修飾されていてよい。ヌクレアーゼドメインの1つが不活性であるある態様において、Cas9由来のタンパク質は、二本鎖核酸にニックを導入することができるが(かかるタンパク質は、“ニッカーゼ”と呼ばれる)、二本鎖DNAを切断することはできない。例えば、RuvC様ドメインにおけるアスパラギン酸からアラニンへの変換(D10A)は、Cas9由来のタンパク質をニッカーゼに変換する。同様に、HNHドメインにおけるヒスチジンからアラニンへの変換(H840AまたはH839A)は、Cas9由来のタンパク質をニッカーゼに変換する。他の態様において、RuvC様ヌクレアーゼドメインおよびHNH様ヌクレアーゼドメインの両方は、Cas9由来のタンパク質が、二本鎖核酸にニックを挿入することができず、それを切断することができないように、修飾または排除されていてよい。さらに他の態様において、Cas9由来のタンパク質の全てのヌクレアーゼドメインは、Cas9由来のタンパク質が全てのヌクレアーゼ活性を欠くように、修飾または排除されていてよい。

上記の態様のいずれかにおいて、何れかまたは全てのヌクレアーゼドメインは、部位特異的突然変異誘発、PCR仲介性突然変異誘発、および全遺伝子合成、ならびに当技術分野で公知の他の方法を含む周知の方法を用いて、1またはそれ以上の欠失、変異、変異挿入および/または置換により不活性化され得る。一つの例示的態様において、融合タンパク質のCRISPR/Cas様タンパク質は、全てのヌクレアーゼドメインが不活性化または欠失している、Cas9タンパク質に由来する。

(b)エフェクタードメイン 融合タンパク質は、エフェクタードメインもまた含む。エフェクタードメインは、切断ドメイン、後成的修飾ドメイン、転写活性化ドメイン、または転写リプレッサードメインであり得る。エフェクタードメインは、N末端、C末端、または融合タンパク質の内部に位置していてよい。

(i)切断ドメイン ある態様において、エフェクタードメインは切断ドメインである。本明細書で用いられている“切断ドメイン”は、DNAを切断するドメインを意味する。切断ドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼから得られ得る。切断ドメインが由来し得るエンドヌクレアーゼの非限定的例には、制限エンドヌクレアーゼおよびホーミングエンドヌクレアーゼが含まれるが、これに限定されない。例えば、New England Biolabs Catalog or Belfort et al. (1997) Nucleic Acids Res. 25:3379−3388を参照のこと。DNAを切断するさらなる酵素が公知である(例えば、S1ヌクレアーゼ;マングビーンヌクレアーゼ;膵臓由来のDNase I;ミクロコッカルヌクレアーゼ;酵母のHO エンドヌクレアーゼ)。また、Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993を参照のこと。これらの酵素(またはその機能的フラグメント)の1つまたはそれ以上は、切断ドメインの供給源として使用可能である。

ある態様において、切断ドメインは、II−S型エンドヌクレアーゼに由来し得る。II−S型エンドヌクレアーゼは、典型的に、認識部位から数塩基対離れた部位でDNAを切断し、それゆえ、分離可能な認識ドメインおよび切断ドメインを有する。これらの酵素は、一般的に、互い違いの位置でDNA鎖を切断する二量体を形成するために一時的に結合する単量体である。好適なII−S型エンドヌクレアーゼの非限定的例には、BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MboII、およびSapIが含まれる。例示的態様において、融合タンパク質の切断ドメインは、FokI切断ドメインまたはその誘導体である。

任意の態様において、II−S型エンドヌクレアーゼによる切断は、2つの異なる切断ドメイン(それぞれが、CRISPR/Cas様タンパク質またはそのフラグメントに結合している)の二量体化を促進するために修飾され得る。例えば、FokIの切断ドメインは、任意のアミノ酸残基を変異させることにより修飾され得る。非限定的な例として、FokI切断ドメインの位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537、および538のアミノ酸残基は、修飾のための標的である。例えば、強制的な(obligate)ヘテロ二量体化が行われるFokIの修飾された切断ドメインは、第一の修飾された切断ドメインが、アミノ酸位置490および538での変異を含み、第二の修飾された切断ドメインが、アミノ酸位置486および499での変異を含む、対を含む(Miller et al., 2007, Nat. Biotechnol, 25:778−785; Szczpek et al., 2007, Nat. Biotechnol, 25:786−793)。例えば、1つのドメインにおいて、位置490のGlu(E)は、Lys(K)に変換可能であり、位置538のIle(I)は、Kに変換可能であり(E490K、I538K)、別の切断ドメインにおいて、位置486のGln(Q)は、Eに変換可能であり、位置499のIは、Leu(L)に変換可能である(Q486E、I499L)。他の態様において、修飾されたFokI切断ドメインは、3つのアミノ酸変更を含んでいてよい(Doyon et al. 2011, Nat. Methods, 8:74−81)。例えば、1つの修飾されたFokIドメイン(ELDと言われる)は、Q486E、I499L、N496D変異を含んでいてよく、他の修飾されたFokIドメイン(KKRと言われる)は、E490K、I538K、H537R変異を含んでいてよい。

例示的態様において、融合タンパク質のエフェクタードメインは、FokI切断ドメインまたは修飾されたFokI切断ドメインである。

エフェクタードメインが切断ドメインであり、CRISPR/Cas様タンパク質がCas9 タンパク質に由来する態様において、Cas9由来のタンパク質は、本明細書に記載の通り、そのエンドヌクレアーゼ活性が排除されるように修飾されていてよい。例えば、Cas9由来のタンパク質は、それらがもはやヌクレアーゼ活性を有しないように、RuvCおよびHNHドメインを変異させることにより修飾されていてよい。

(ii)後成的修飾ドメイン 他の態様において、融合タンパク質のエフェクタードメインは、後成的修飾ドメインであってよい。一般的に、後成的修飾ドメインは、DNA配列を改変することなく、ヒストン構造および/または染色体構造を変化させる。変化したヒストンおよび/またはクロマチン構造は、遺伝子発現の変化をもたらすことができる。後成的修飾の例には、ヒストンタンパク質中のリシン残基のアセチル化またはメチル化、およびDNA中のシトシン残基のメチル化が含まれるが、これらに限定されない。好適な後成的修飾ドメインの非限定的な例には、ヒストンアセチルトランスフェラーゼドメイン、ヒストン脱アセチル化酵素ドメイン、ヒストンメチルトランスフェラーゼドメイン、ヒストン脱メチル化酵素ドメイン、DNAメチルトランスフェラーゼドメイン、およびDNA脱メチル化酵素ドメインが含まれる。

エフェクタードメインが、ヒストンアセチルトランスフェラーゼ(HAT)ドメインである態様において、HATドメインは、EP300(すなわち、E1A結合タンパク質 p300)、CREBBP(すなわち、CREB結合タンパク質)、CDY1、CDY2、CDYL1、CLOCK、ELP3、ESA1、GCN5(KAT2A)、HAT1,KAT2B、KAT5、MYST1、MYST2、MYST3、MYST4、NCOA1、NCOA2、NCOA3、NCOAT、P/CAF、Tip60、TAFII250、またはTF3C4に由来し得る。1つのかかる態様において、HATドメインはp300である。

エフェクタードメインが後成的修飾ドメインであり、CRISPR/Cas様タンパク質がCas9タンパク質に由来する態様において、Cas9由来のタンパク質は、本明細書に記載の通り、そのエンドヌクレアーゼ活性が排除されるように修飾されていてよい。例えば、Cas9由来のタンパク質は、それらがもはやヌクレアーゼ活性を有さないように、RuvCおよびHNHドメインを変異させることにより修飾されていてよい。

(iii)転写活性化ドメイン 他の態様において、融合タンパク質のエフェクタードメインは転写活性化ドメインであってよい。一般的に、転写活性化ドメインは、転写調節因子および/または転写調節タンパク質(すなわち、転写因子、RNAポリメラーゼなど)と相互作用して、遺伝子の転写を増加および/または活性化する。ある態様において、転写活性化ドメインは、ヘルペス単純ウイルス VP16 活性化ドメイン、VP64(VP16の四量体誘導体である)、NFκB p65 活性化ドメイン、p53 活性化ドメイン1および2、CREB(cAMP応答因子結合タンパク質)活性化ドメイン、E2A活性化ドメイン、およびNFAT(活性化T細胞の核因子)活性化ドメインであり得るが、これに限定されない。他の態様において、転写活性化ドメインは、Gal4、Gcn4、MLL、Rtg3、Gln3、Oaf1、Pip2、Pdr1、Pdr3、Pho4、およびLeu3であり得る。転写活性化ドメインは野生型であってよく、または、オリジナルの転写活性化ドメインの改変体であってもよい。ある態様において、融合タンパク質のエフェクタードメインは、VP16またはVP64転写活性化ドメインである。

エフェクタードメインが転写活性化ドメインであり、CRISPR/Cas様タンパク質がCas9タンパク質に由来する態様において、Cas9由来のタンパク質は、本明細書に記載の通り、そのエンドヌクレアーゼ活性が排除されるように修飾されていてよい。例えば、Cas9由来のタンパク質は、それらがもはやヌクレアーゼ活性を有さないように、RuvCおよびHNHドメインを変異させることにより修飾されていてよい。

(iv)転写リプレッサードメイン さらに他の態様において、融合タンパク質のエフェクタードメインは、転写リプレッサードメインであってよい。一般的に、転写リプレッサードメインは、転写調節因子および/または転写調節タンパク質(すなわち、転写因子、RNAポリメラーゼなど)に相互作用して、遺伝子の転写を減少および/または終了させる。好適な転写リプレッサードメインの非限定的な例には、cAMP誘導性初期リプレッサー(ICER)ドメイン、Kruppel付随ボックスA(KRAB−A)リプレッサードメイン、YY1 グリシン富化リプレッサードメイン、Sp1様リプレッサー、E(spl)リプレッサー、IκBリプレッサー、およびMeCP2が含まれる。

エフェクタードメインが転写リプレッサードメインであり、CRISPR/Cas様タンパク質がCas9タンパク質に由来する態様において、Cas9由来のタンパク質は、本明細書に記載の通り、そのエンドヌクレアーゼ活性が排除されるように修飾されていてよい。例えば、cas9由来のタンパク質は、それらがもはやヌクレアーゼ活性を有さないように、RuvCおよびHNHドメインを変異させることにより修飾されていてよい。

(c)さらなるドメイン ある態様において、融合タンパク質は、少なくとも1つのさらなるドメインをさらに含む。好適なさらなるドメインの非限定的な例には、核局在化シグナル、細胞透過性ドメインまたは転移ドメイン、およびマーカードメインが含まれる。好適な核局在化シグナル、細胞透過性ドメイン、およびマーカードメインの非限定的な例は、上記のセクション(I)に記載されている。

(d)融合タンパク質二量体 融合タンパク質のエフェクタードメインが切断ドメインである態様において、少なくとも1つの融合タンパク質を含む二量体を形成可能である。該二量体は、ホモ二量体またはヘテロ二量体であり得る。ある態様において、ヘテロ二量体は、2つの異なる融合タンパク質を含む。他の態様において、ヘテロ二量体は、1つの融合タンパク質とさらなるタンパク質を含む。

ある態様において、二量体は、2つの融合タンパク質単量体が一次アミノ酸配列に関して同一である、ホモ二量体である。二量体がホモ二量体である一態様において、Cas9由来のタンパク質は、それらのエンドヌクレアーゼ活性が排除されるように、すなわち、それらがもはや機能的ヌクレアーゼドメインを有しないように修飾される。Cas9由来のタンパク質が、それらのエンドヌクレアーゼ活性が排除されるように修飾されている任意の態様において、各融合タンパク質単量体は、同一のCas9様タンパク質および同一の切断ドメインを含む。切断ドメインは、何れかの切断ドメインであってよく、そのような例示的切断ドメインのいくつかを本明細書に記載する。1つの特定の態様において、切断ドメインはFokI切断ドメインまたは修飾されたFokI切断ドメインである。かかる態様において、特定のガイドRNAは、二量体形成により、2つの単量体のヌクレアーゼドメインが標的DNAにおいて二本鎖切断を作成し得るように、融合タンパク質単量体を異なるが近位の隣接部位へ誘導し得る。

他の態様において、二量体は、2つの異なる融合タンパク質のヘテロ二量体である。例えば、各融合タンパク質のCRISPR/Cas様タンパク質は、異なるCRISPR/Casタンパク質または異なる細菌種由来のオーソロガスCRISPR/Casタンパク質に由来していてよい。例えば、各融合タンパク質は、異なる細菌種に由来するCas9様タンパク質を含んでいてよい。これらの態様において、各融合タンパク質は、異なる標的部位を認識し得る(すなわち、プロトスペーサーおよび/またはPAM配列により特定される)。例えば、ガイドRNAは、そのヌクレアーゼドメインが標的DNAにおいて二本鎖切断を効率的に行うように、ヘテロ二量体を異なるが近位の隣接部位へ配置し得る。ヘテロ二量体はまた、ニック挿入位置が異なるように、ニック挿入活性を有するCas9タンパク質を修飾されていてよい。

あるいは、ヘテロ二量体の2つの融合タンパク質は、異なるエフェクタードメインを有していてよい。エフェクタードメインが切断ドメインである態様において、各融合タンパク質は、異なる修飾された切断ドメインを含み得る。例えば、各融合タンパク質は、上記のセクション(II)(b)(i)に詳述する通り、異なる修飾されたFokI切断ドメインを含み得る。これらの態様において、Cas−9タンパク質は、そのエンドヌクレアーゼ活性が排除されるように修飾されていてよい。

当業者により理解され得る通り、ヘテロ二量体を形成する2つの融合タンパク質は、CRISPR/Cas様タンパク質ドメインおよびエフェクタードメインの両方で異なっていてよい。

上記の態様の何れかにおいて、ホモ二量体またはヘテロ二量体は、上記に詳述の通り、核局在化シグナル(NLS)、細胞透過性ドメイン、転移ドメインおよびマーカードメインから選択される少なくとも1つのさらなるドメインを含み得る。

上記の態様の何れかにおいて、Cas9由来のタンパク質の1つまたは両方は、そのエンドヌクレアーゼ活性が排除または修飾されるように修飾されていてよい。

さらに別の態様において、ヘテロ二量体は、1つの融合タンパク質および1つのさらなるタンパク質を含む。例えば、さらなるタンパク質は、ヌクレアーゼであり得る。一態様において、ヌクレアーゼはジンクフィンガーヌクレアーゼである。ジンクフィンガーヌクレアーゼは、ジンクフィンガーDNA結合ドメインおよび切断ドメインを含む。ジンクフィンガーは、3ヌクレオチドを認識して結合する。ジンクフィンガーDNA結合ドメインは、約3から約7個のジンクフィンガーを含んでいてよい。ジンクフィンガーDNA結合ドメインは、天然に存在するタンパク質に由来するか、または作製されてもよい。例えば、Beerli et al. (2002) Nat. Biotechnol. 20:135−141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313−340; Isalan et al. (2001) Nat. Biotechnol. 19:656−660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632−637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411−416; Zhang et al. (2000) J. Biol. Chem. 275(43):33850−33860; Doyon et al. (2008) Nat. Biotechnol. 26:702−708; および、Santiago et al. (2008) Proc. Natl. Acad. Sci. USA 105:5809−5814を参照のこと。ジンクフィンガーヌクレアーゼの切断ドメインは、上記のセクション(II)(b)(i)に詳述した何れかの切断ドメインであり得る。例示的態様において、ジンクフィンガーヌクレアーゼの切断ドメインは、FokI切断ドメインまたは修飾されたFokI切断ドメインである。そのようなジンクフィンガーヌクレアーゼは、FokI切断ドメインまたは修飾されたFokI切断ドメインを含む融合タンパク質と二量体を形成する。

ある態様において、ジンクフィンガーヌクレアーゼは、核局在化シグナル、細胞透過性ドメインまたは転移ドメイン(上記で詳述される)から選択される少なくとも1つのさらなるドメインを含んでいてよい。

ある種の態様において、上記の融合タンパク質の何れかまたは少なくとも1つの融合タンパク質を含む二量体は、少なくとも1つのガイドRNAを含む、タンパク質−RNA複合体の一部であり得る。ガイドRNAは、融合タンパク質のCRISPR−Cas0様タンパク質と相互作用して、融合タンパク質を特定の標的部位である特定のプロトスペーサー配列を有するガイドRNA塩基対の5’末端に誘導する。

(III)RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードする核酸 本開示の別の面は、上記セクション(I)および(II)にそれぞれ詳述したRNA誘導型エンドヌクレアーゼまたは融合タンパク質の何れかをコードする核酸を提供する。該核酸は、RNAまたはDNAであり得る。一態様において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードする核酸は、mRNAである。mRNAは、5’キャップ付加および/または3’ポリアデニル化されていてよい。別の態様において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードする核酸はDNAである。DNAはベクター中に存在していてよい(下記参照)。

RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードする核酸は、目的の真核細胞または動物においてタンパク質に効率的に翻訳されるために最適化されたコドンであり得る。例えば、コドンは、ヒト、マウス、ラット、ハムスター、ウシ、ブタ、ネコ、イヌ、魚、両生類、植物、酵母、昆虫などにおける発現のために最適化されていてよい(www.kazusa.or.jp/codon/のコドン使用頻度データベースを参照のこと)。コドンの最適化のためのプログラムは、フリーウェアとして利用可能である(例えば、genomes.urv.es/OPTIMIZERのOPTIMIZER; GenScript at www.genscript.com/codon_opt.htmlのOptimumGene(商標))。市販のコドン最適化プログラムもまた利用可能である。

ある態様において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードするDNAは、少なくとも1つのプロモーター調節配列と操作可能に連結されていてよい。ある例(iteration)において、DNAコーディング配列は、目的の真核細胞または動物において発現するためにプロモーター調節配列に操作可能に連結されていてよい。プロモーター調節配列は、構成的、調節的、または組織特異的であってよい。好適な構成的プロモーター調節配列には、サイトメガロウイルス最初期プロモーター(CMV)、シミアンウイルス(SV40)プロモーター、アデノウイルス主要後期プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、マウス乳腺腫瘍ウイルス(MMTV)プロモーター、ホスホグリセレートキナーゼ(PGK)プロモーター、伸張因子(ED1)−αプロモーター、ユビキチンプロモーター、アクチンプロモーター、チューブリンプロモーター、免疫グロブリンプロモーター、それらのフラグメント、または上記の何れかの組み合わせが含まれるが、これらに限定されない。好適な調節されたプロモーター調節配列の例には、熱ショック、金属、ステロイド、抗生物質、またはアルコールにより調節されるものが含まれるが、これに限定されない。組織特異的プロモーターの非限定的な例には、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ−1プロモーター、エンドグリンプロモーター、フィブロネクチンプロモーター、Flt−1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM−2プロモーター、INF−βプロモーター、Mbプロモーター、NphsIプロモーター、OG−2プロモーター、SP−Bプロモーター、SYN1プロモーター、およびWASPプロモーターが含まれる。プロモーター配列は、野生型であっても、またはより効率的または有効な発現のために修飾されていてもよい。1つの例示的態様において、コーディングDNAは、哺乳動物細胞における構成的発現のためのCMVプロモーターに操作可能に連結されていてよい。

任意の態様において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードする配列は、インビトロでのmRNA合成のためにファージRNAポリメラーゼにより認識されるプロモーター配列に操作可能に連結されていてよい。かかる態様において、インビトロで転写されたRNAは、以下のセクション(IV)および(V)に詳述する方法における使用のために精製され得る。例えば、該プロモーター配列は、T7、T3、もしくはSP6プロモーター配列またはT7、T3、もしくはSP6プロモーター配列の変異体であり得る。1つの例示的態様において、融合タンパク質をコードするDNAは、T7RNAポリメラーゼを用いるインビトロでのmRNA合成のためのT7プロモーターと操作可能に連結される。

別の態様において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードする配列は、細菌または真核細胞におけるRNA誘導型エンドヌクレアーゼまたは融合タンパク質のインビトロでの発現のためにプロモーター配列に操作可能に連結されていてよい。かかる態様において、発現されたタンパク質は、以下のセクション(IV)および(V)に詳述される方法にける使用のために精製され得る。好適な細菌プロモーターには、T7プロモーター、lacオペロンプロモーター、trpプロモーター、それらの変形、およびそれらの組み合わせが含まれるが、これに限定されない。1つの例示的細菌プロモーターは、trpおよびlacプロモーターのハイブリッドであるtacである。好適な真核プロモーターの非限定的な例は上記される。

さらなる面において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードするDNAはまた、ポリアデニル化シグナル(例えば、SV40ポリAシグナル、ウシ成長ホルモン(BGH)ポリAシグナルなど)および/または少なくとも1つの転写終結配列に連結されていてよい。さらに、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードする配列はまた、上記のセクション(I)に詳述する、少なくとも1つの核局在化シグナル、少なくとも1つの細胞透過性ドメイン、および/または少なくとも1つのマーカードメインをコードする配列に連結されていてよい。

種々の態様において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードするDNAは、ベクター中に存在していてよい。好適なベクターには、プラスミドベクター、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン、およびウイルスベクター(例えば、レンチウイルスベクター、アデノ随伴ウイルスベクターなど)が含まれる。一態様において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードするDNAは、プラスミドベクター中に存在していてよい。好適なプラスミドベクターの非限定的な例には、pUC、pBR322、pET、pBluescript、およびそれらの変異体が含まれる。ベクターは、さらなる発現調節配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、抗生物質耐性遺伝子)、複製起点などを含み得る。さらなる情報は、“Current Protocols in Molecular Biology” Ausubel et al., John Wiley & Sons, New York, 2003 または“Molecular Cloning: A Laboratory Manual” Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001に見出すことができる。

ある態様において、RNA誘導型エンドヌクレアーゼまたは融合タンパク質をコードする配列を含む発現ベクターは、ガイドRNAをコードする配列をさらに含み得る。ガイドRNAをコードする配列は、一般に、目的の細胞または胚におけるガイドRNAの発現のために少なくとも1つの転写調節配列に操作可能に連結されている。例えば、ガイドRNAをコードするDNAは、RNAポリメラーゼIII(Pol III)により認識されるプロモーター配列に操作可能に連結されていてよい。好適なPol IIIプロモーターの例には、哺乳動物のU6、U3、H1、および7SL RNAプロモーターが含まれるが、これに限定されない。

(IV)RNA誘導型エンドヌクレアーゼを用いる染色体配列の修飾のための方法 本開示の別の面は、真核細胞または胚において染色体配列を修飾するための方法を包含する。該方法は、真核細胞または胚に、(i)少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼまたは少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼをコードする核酸、(ii)少なくとも1つのガイドRNAまたは少なくとも1つのガイドRNAをコードするDNA、および、要すれば(iii)ドナー配列を含む少なくとも1つのドナーポリヌクレオチドを導入することを含む。該方法は、各ガイドRNAが、染色体配列中の標的部位にRNA誘導型エンドヌクレアーゼを誘導し、そこでRNA誘導型エンドヌクレアーゼが、標的部位における二本鎖の切断を誘導し、二本鎖の切断が、染色体配列が修飾されるようにDNA修復過程により修復されるように、細胞または胚を培養することをさらに含む。

ある態様において、該方法は、1つのRNA誘導型エンドヌクレアーゼ(またはコーディング核酸)および1つのガイドRNA(またはコーディングDNA)を細胞または胚に導入することを含み得る(ここで、RNA誘導型エンドヌクレアーゼは、標的化染色体配列に1つの二本鎖切断を導入する)。任意のドナーポリヌクレオチドが存在しない態様において、染色体配列における二本鎖の切断は、非相同末端結合(NHEJ)修復過程により修復され得る。NHEJはエラー発生率が高いため、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが、該切断の修復中に起こり得る。従って、標的化染色体配列は、修飾または不活性化され得る。例えば、単一塩基多形(single nucleotide change:SNP)は、改変されたタンパク質生成をもたらし得るか、またはコーディング配列のリーディングフレームにおけるシフトは、タンパク質生成が起こらないように、該配列を不活性化または“ノックアウト”し得る。任意のドナーポリヌクレオチドが存在する態様において、ドナーポリヌクレオチドにおけるドナー配列は、二本鎖の切断の修復中に標的部位において染色体配列で置換されるか、または染色体配列中に挿入され得る。例えば、ドナー配列が、染色体配列中の標的部位の上流および下流配列のそれぞれと実質的に同一の配列を有する上流および下流配列に挟まれている態様において、該ドナー配列は、相同組み換え修復過程により仲介される修復中に標的部位において染色体配列で置換されるか、または染色体配列に挿入され得る。あるいは、ドナー配列が互換性の重複により挟まれている(または互換性の重複がRNA誘導型エンドヌクレアーゼによりインサイチュウで生じる)態様において、該ドナー配列は、二本鎖の切断の修復中に非相同修復過程により切断された染色体配列と直接的に結合され得る。染色体配列へのドナー配列の交換または挿入は、標的化染色体配列を修飾し、または細胞または胚の染色体配列へ外来配列を導入する。

他の態様において、該方法は、2つのRNA誘導型エンドヌクレアーゼ(またはコーディング核酸)および2つのガイドRNA(またはコーディングDNA)を細胞または胚に導入することを含んでいてよく、ここで、RNA誘導型エンドヌクレアーゼは、染色体配列中に2つの二本鎖切断を導入する。図3Bを参照のこと。該2つの切断は、数塩基対中、10塩基対中に存在していてよく、または数千塩基対により分離されていてよい。任意のドナーポリヌクレオチドが存在しない態様において、生じた二本鎖の切断は、2つの切断部位間の配列が欠失される、および/または少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが、該切断(複数可)の修復中に起こるように、非相同修復過程により修復され得る。任意のドナーポリヌクレオチドが存在する態様において、ドナーポリヌクレオチド中のドナー配列は、相同塩基対修復過程(例えば、染色体配列中の標的配列の上流および下流配列のそれぞれと実質的に同一の配列を有する上流および下流配列により挟まれている態様において)または非相同修復過程(例えば、ドナー配列が適合性のオーバーハングにより連結されている態様において)のいずれかにより、二本鎖切断の修復中に染色体配列で置換され、または染色体配列に挿入され得る。

さらに他の態様において、該方法は、細胞または胚に、二本鎖配列の一本鎖を切断するように修飾された1つのRNA誘導型エンドヌクレアーゼ(またはコーディング核酸)および2つのガイドRNA(またはコーディングDNA)を導入することを含み得て、ここで、各ガイドRNAは、RNA誘導型エンドヌクレアーゼを特定の標的部位に導き、その部位で、修飾されたエンドヌクレアーゼが二本鎖染色体配列の一本鎖を切断し(すなわち、ニック挿入)、そして2つのニックが、対向する鎖中、二本鎖の切断を構成するのに十分な近さで存在する。図3Aを参照のこと。任意のドナーポリヌクレオチドが存在しない態様において、生じた二本鎖の切断は、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが切断の修復中に起こり得るように非相同修復過程により修復されてよい。任意のドナーポリヌクレオチドが存在する態様において、ドナーポリヌクレオチド中のドナー配列は、相同塩基対修復過程(例えば、染色体配列中の標的配列の上流および下流配列のそれぞれと実質的に同一の配列を有する上流および下流配列により挟まれている態様において)または非相同修復過程(例えば、ドナー配列が適合性のオーバーハングにより連結されている態様において)のいずれかにより二本鎖切断の修復中に染色体配列で置換されるか、または染色体配列に挿入されてよい。

(a)RNA誘導型エンドヌクレアーゼ 本方法は、細胞または胚に、少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼまたは少なくとも1つの核局在化シグナルを含む少なくとも1つのRNA誘導型エンドヌクレアーゼをコードする核酸を導入することを含む。かかるRNA誘導型エンドヌクレアーゼおよびRNA誘導型エンドヌクレアーゼをコードする核酸は、上記のセクション(I)および(III)にそれぞれ記載されている。

ある態様において、RNA誘導型エンドヌクレアーゼは、細胞または胚に単離されたタンパク質として導入されてよい。かかる態様において、RNA誘導型エンドヌクレアーゼは、タンパク質の細胞内取り込みを促進する少なくとも1つの細胞透過性ドメインをさらに含んでいてよい。他の態様において、RNA誘導型エンドヌクレアーゼは、細胞または胚にmRNA分子として導入され得る。さらに他の態様において、RNA誘導型エンドヌクレアーゼは、細胞または胚にDNA分子として導入され得る。一般的に、融合タンパク質をコードするDNA配列は、目的の細胞または胚において機能し得るプロモーター配列に操作可能に連結されている。DNA配列は直鎖であってよく、またはDNA配列はベクターの一部であってよい。さらに他の態様において、融合タンパク質は、細胞または胚に、融合タンパク質およびガイドRNAを含むRNA−タンパク質複合体として導入され得る。

別の態様において、RNA誘導型エンドヌクレアーゼをコードするDNAは、ガイドRNAをコードする配列をさらに含み得る。一般的に、RNA誘導型エンドヌクレアーゼおよびガイドRNAをコードする配列はそれぞれ、RNA誘導型エンドヌクレアーゼおよびガイドRNAそれぞれの細胞または胚での発現を可能にする適当なプロモーター調節配列に操作可能に連結されている。RNA誘導型エンドヌクレアーゼおよびガイドRNAをコードするDNA配列は、さらなる発現調節配列、調節配列、および/またはプロセシング配列(複数可)をさらに含み得る。RNA誘導型エンドヌクレアーゼおよびガイドRNAをコードするDNA配列は、直鎖であるか、またはベクターの一部であってよい。

(b)ガイドRNA 本方法はまた、細胞または胚に、少なくとも1つのガイドRNAまたは少なくとも1つのガイドRNAをコードするDNAを導入することも含む。ガイドRNAは、RNA誘導型エンドヌクレアーゼと相互作用して、エンドヌクレアーゼを、染色体配列中の特定のプロトスペーサー配列を有するガイドRNA塩基対の5’末端である特定の標的部位へ導く。

各ガイドRNAは、3つの領域:染色体配列中の標的部位に相補的である5’末端における第一の領域、ステムループ構造を形成する第二の内部領域、および本質的に一本鎖のままである第三の3’領域を含む。各ガイドRNAの第一の領域は、各ガイドRNAが融合タンパク質を特定の標的部位へ誘導するように異なっている。各ガイドRNAの第二および第三の領域は、全てのガイドRNAで同じであってよい。

ガイドRNAの第一の領域は、ガイドRNAの第一の領域が標的部位と塩基対を形成し得るように、染色体配列中の標的部位で配列(すなわち、プロトスペーサー配列)に相補的である。種々の態様において、ガイドRNAの第一の領域は、約10のヌクレオチドから約25以上のヌクレオチドを含み得る。例えば、ガイドRNAの第一の領域と染色体配列中の標的部位の間の塩基対形成領域は、約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25、または25以上のヌクレオチド長であり得る。例示的態様において、ガイドRNAの第一の領域は、約19、20、または21のヌクレオチド長である。

ガイドRNAはまた、二次構造を形成する第二の領域を含む。ある態様において、該二次構造は、ステム(またはヘアピン)およびループを含む。ループおよびステムの長さは可変である。例えば、ループは、約3から約10ヌクレオチド長の範囲であってよく、ステムは、約6から約20塩基対長であってよい。ステムは、1から約10ヌクレオチドの1またはそれ以上のバルジ(bulge)を含んでいてよい。従って、第二の領域の全体の長さは、約16から約60ヌクレオチド長の範囲であり得る。例示的態様において、ループは、約4ヌクレオチド長であり、ステムは、約12塩基対を含む。

ガイドRNAはまた、本質的に一本鎖のままである第三の領域を3’末端に含む。従って、第三の領域は、目的の細胞内の染色体配列に相補性を有しておらず、ガイドRNAの残りの部分に相補性を有していない。第三の領域の長さは可変である。一般的に、第三の領域は、約4ヌクレオチド長以上である。例えば、第三の領域の長さは、約5から約60ヌクレオチド長の範囲である。

ガイドRNAの第二および第三領域の合わせた長さ(ユニバーサル領域または骨格領域とも言われる)は、約30から約120ヌクレオチド長の範囲であり得る。一面において、ガイドRNAの第二および第三領域を合わせた長さは、約70から約100ヌクレオチド長の範囲である。

ある態様において、ガイドRNAは、全ての3つの領域を含む単一分子からなる。他の態様において、ガイドRNAは、2つの別個の分子を含み得る。第一のRNA分子は、ガイドRNAの第一の領域およびガイドRNAの第二の領域の“ステム”の半分を含んでいてよい。第二のRNA分子は、ガイドRNAの第二の領域の“ステム”の他の半分およびガイドRNAの第三の領域を含んでいてよい。従って、この態様において、第一および第二のRNA分子はそれぞれ、互いに相補的なヌクレオチド配列を含む。例えば、一態様において、第一および第二のRNA分子はそれぞれ、他の配列と塩基対をつくって機能的ガイドRNAを形成する配列(約6から約20ヌクレオチド)を含む。

ある態様において、ガイドRNAは、RNA分子として細胞または胚に導入され得る。RNA分子は、インビトロで転写され得る。あるいは、RNA分子は、化学的に合成され得る。

他の態様において、ガイドRNAは、DNA分子として細胞または胚に導入され得る。かかる場合において、ガイドRNAをコードするDNAは、目的の細胞または胚においてガイドRNAを発現させるためにプロモーター調節配列に操作可能に連結されていてよい。例えば、配列をコードするRNAは、RNAポリメラーゼIII(Pol III)によって認識されるプロモーター配列に操作可能に連結されていてよい。好適なPol IIIプロモーターの例には、哺乳動物のU6またはH1プロモーターが含まれるが、これに限定されない。例示的態様において、配列をコードするRNAは、マウスまたはヒトU6プロモーターに連結されている。他の例示的態様において、配列をコードするRNAは、マウスまたはヒトH1プロモーターに連結されている。

ガイドRNAをコードするDNA分子は、直鎖または環状であり得る。ある態様において、ガイドRNAをコードするDNA配列は、ベクターの一部であり得る。好適なベクターには、プラスミドベクター、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン、およびウイルスベクターが含まれる。例示的態様において、RNA誘導型エンドヌクレアーゼをコードするDNAは、プラスミドベクター中に存在する。好適なプラスミドベクターの非限定的例には、pUC、pBR322、pET、pBluescript、およびそれらの変異体が含まれる。ベクターは、さらなる発現調節配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、抗生物質耐性遺伝子)、複製起点などを含み得る。

RNA誘導型エンドヌクレアーゼおよびガイドRNAの両方がDNA分子として細胞に導入される態様において、それぞれが、別個の分子の一部であるか(例えば、融合タンパク質コーディング配列を含む第一のベクターおよびガイドRNAコーディング配列を含む第二のベクター)、または両方が同じ分子の一部(例えば、第一のベクターが、融合タンパク質およびガイドRNAの両方のためのコーディング(および制御)配列を含む)であってよい。

(c)標的部位 ガイドRNAと結合させたRNA誘導型エンドヌクレアーゼは、染色体配列中の標的部位に導かれ、そこで、RNA誘導型エンドヌクレアーゼは、染色体配列中に二本鎖の切断を導入する。標的部位は、配列がコンセンサス配列の直前(上流)に位置することを除いて、配列に何らの制限もない。このコンセンサス配列は、プロトスペーサー近接モチーフ(PAM)としても知られている。PAMの例には、NGG、NGGNG、およびNNAGAAW(ここで、Nは何れかのヌクレオチドを意味し、WはAまたはTを意味する)が含まれるが、これに限定されない。上記のセクション(IV)(b)に詳述の通り、ガイドRNAの第一の領域(5’末端)は、標的配列のプロトスペーサーに相補的である。典型的に、ガイドRNAの第一の領域は、約19から21ヌクレオチド長である。従って、ある面において、染色体配列中の標的部位の配列は、5’−N19−21−NGG−3’である。PAMは、イタリック体(NGG)である。

標的部位は、遺伝子のコーディング領域内、遺伝子のイントロン内、遺伝子の制御領域内、遺伝子間の非コーディング領域内などに存在してよい。遺伝子は、タンパク質コーディング遺伝子またはRNAコーディング遺伝子であってよい。遺伝子は、目的に沿う如何なる遺伝子であってもよい。

(d)任意のドナーポリヌクレオチド ある態様において、本方法は、胚内に少なくとも1つのドナーポリヌクレオチドを導入することをさらに含む。ドナーポリヌクレオチドは、少なくとも1つのドナー配列を含む。ある面において、ドナーポリヌクレオチドのドナー配列は、内在性または天然の染色体配列に相当する。例えば、ドナー配列は、標的部位で、またはその近位で染色体配列の一部と実質的に同一であり得るが、少なくとも1つのヌクレオチド変化を含む。従って、ドナー配列は、天然の配列への組み込みまたはその置換によって、標的染色体位置での配列が少なくとも1つのヌクレオチド変更を含むように、標的部位で野生型配列の変形を含み得る。例えば、該変更は、1またはそれ以上のヌクレオチドの挿入、1またはそれ以上のヌクレオチドの欠失、1またはそれ以上のヌクレオチドの置換、またはそれらの組み合わせであり得る。修飾された配列の挿入の結果として、細胞または胚/動物は、標的の染色体配列から改変された遺伝子産物を生成し得る。

他の面において、ドナーポリヌクレオチドのドナー配列は、外来配列に相当する。本明細書で用いる“外来”配列は、細胞または胚にとって天然に存在しない配列、または細胞または胚のゲノム中の天然の位置とは異なる位置に存在する配列を意味する。例えば、外来配列は、ゲノム中に挿入されることにより、細胞または胚/動物が、挿入された配列によりコードされるタンパク質を発現することが可能となるように、外来プロモーター調節配列に操作可能に連結されていてよいタンパク質コーディング配列を含み得る。あるいは、外来配列は、その発現が内在性プロモーター調節配列により制御され得るように、染色体配列中に組み込まれ得る。他の例(iteration)において、外来配列は、転写調節配列、別の発現調節配列、RNAコーディング配列などであってよい。外来配列の染色体配列への組み込みは、“ノックイン”と言われる。

当業者には認められる通り、ドナー配列の長さは、可変である。例えば、ドナー配列は、数ヌクレオチド長から数百ヌクレオチド長から、数百から数千ヌクレオチド長の長さで可変である。

上流および下流の配列を含むドナーポリヌクレオチド ある態様において、ドナーポリヌクレオチド中のドナー配列は、染色体配列中の標的部位の、それぞれ上流および下流に位置する配列と実質的に同一の配列を有する、上流配列および下流配列により挟まれている。これらの配列が類似であるため、ドナーポリヌクレオチドの上流および下流配列は、ドナー配列が染色体配列中に組み込まれ得る(または置換可能な)ように、ドナーポリヌクレオチドと標的染色体配列の相同組換えを可能にする。

本明細書で用いる上流配列は、標的部位の上流の染色体配列と実質的に同一の配列を共有する核酸配列を意味する。同様に、下流配列は、標的部位の下流の染色体配列と実質的に同一の配列を共有する核酸配列を意味する。本明細書で用いる用語“実質的に同一の配列”は、少なくとも約75%の配列同一性を有する配列を意味する。従って、ドナーポリヌクレオチド中の上流および下流配列は、標的部位の上流または下流の配列と約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有し得る。例示的態様において、ドナーポリヌクレオチド中の上流および下流配列は、標的部位の上流または下流の染色体配列と約95%または100%の配列同一性を有し得る。一態様において、上流配列は、標的部位のすぐ上流に位置する(すなわち、標的部位に隣接する)染色体配列と実質的に同一の配列を共有する。他の態様において、上流配列は、標的部位から約100ヌクレオチド上流以内に位置する染色体配列と実質的に同一の配列を有する。従って、例えば、上流配列は、標的部位から約1から約20、約21から約40、約41から約60、約61から約80、または約81から約100ヌクレオチド上流に位置する染色体配列と実質的に同一の配列を共有し得る。一態様において、下流配列は、標的部位のすぐ下流に位置する(すなわち、標的部位に隣接する)染色体配列と実質的に同一の配列を共有する。 他の態様において、下流配列は、標的部位から約100ヌクレオチド下流以内に位置する染色体配列と実質的に同一の配列を共有する。従って、例えば、下流配列は標的部位から約1から約20、約21から約40、約41から約60、約61から約80、または約81から約100ヌクレオチド下流に位置する染色体配列と実質的に同一の配列を共有し得る。

各上流または下流配列は、約20ヌクレオチドから約5000ヌクレオチド長の範囲であり得る。ある態様において、上流および下流配列は、約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、または5000ヌクレオチドを含み得る。例示的態様において、上流および下流配列は、約50から約1500ヌクレオチド長の範囲であり得る。

標的染色体配列と配列類似性を有する上流および下流配列を含むドナーポリヌクレオチドは、直鎖または環状であり得る。ドナーポリヌクレオチドが環状である態様において、それは、ベクターの一部であり得る。例えば、ベクターは、プラスミドベクターであり得る。

標的切断部位(複数可)を含むドナーポリヌクレオチド 他の態様において、ドナーポリヌクレオチドは、RNA誘導型エンドヌクレアーゼにより認識される少なくとも1つの標的切断部位をさらに含み得る。ドナーポリヌクレオチドに付加された標的切断部位は、ドナー配列の上流もしくは下流またはその上流および下流の両方に位置し得る。例えば、ドナー配列は、標的切断部位に隣接することが可能であり、すなわち、RNA誘導型エンドヌクレアーゼによる切断によって、該ドナー配列が、RNA誘導型エンドヌクレアーゼによる切断によって生じる染色体配列中のドナー配列と適合性のオーバーハングにより連結されている。従って、ドナー配列は、非相同的修復過程による二本鎖切断の修復中に切断された染色体配列と結合され得る。一般的に、標的切断部位(複数可)を含むドナーポリヌクレオチドは、環状であり得る(例えば、プラスミドベクターの一部であってよい)。

任意のオーバーハングを有する短いドナー配列を含むドナーポリヌクレオチド さらに別の態様において、ドナーポリヌクレオチドは、RNA誘導型エンドヌクレアーゼによって生じるオーバーハングと適合する任意の短いオーバーハングを有する短いドナー配列を含む直鎖状分子であり得る。かかる態様において、ドナー配列は、二本鎖の切断の修復中に切断された染色体配列と直接結合され得る。ある例において、ドナー配列は、約1,000未満、約500未満、約250未満、または約100ヌクレオチド未満であり得る。ある場合には、ドナーポリヌクレオチドは、平滑末端を有する短いドナー配列を含む直鎖状分子であり得る。他の例(iteration)において、ドナーポリヌクレオチドは、5’および/または3’オーバーハングを有する短いドナー配列を含む直鎖状分子であり得る。オーバーハングは、1、2、3、4または5ヌクレオチドを含んでいてよい。

典型的に、ドナーポリヌクレオチドはDNAであり得る。DNAは、一本鎖もしくは二本鎖および/または直鎖もしくは環状であり得る。ドナーポリヌクレオチドは、DNAプラスミド、細菌の人工染色体(BAC)、酵母の人工染色体(YAC)、ウイルスベクター、DNAの直鎖状断片、PCRフラグメント、裸の(naked)核酸、またはリポソームまたはポロキサマーのような送達ビークルと複合体を形成した核酸であり得る。ある態様において、ドナー配列を含むドナーポリヌクレオチドは、プラスミドベクターの一部であり得る。これらの状況の何れかにおいて、ドナー配列を含むドナーポリヌクレオチドは、少なくとも1つのさらなる配列をさらに含み得る。

(e)細胞または胚への導入 RNA標的化エンドヌクレアーゼ(複数可)(またはそれをコード化する核酸)、ガイドRNA(複数可)(またはそれをコード化するDNA)、および任意のドナーポリヌクレオチド(複数可)は、種々の手段により細胞または胚に導入され得る。ある態様において、該細胞または胚は、トランスフェクトされる。好適なトランスフェクション法には、リン酸カルシウム仲介性トランスフェクション、ヌクレオフェクション(または、エレクトロポレーション)、陽イオン性ポリマーを用いるトランスフェクション(例えば、DEAE−デキストランまたはポリエチレンイミン)、ウイルス形質導入、ビロソーム(virosome)を用いるトランスフェクション、ビリオンを介するトランスフェクション、リポソームトランスフェクション、陽イオン性リポソームを用いるトランスフェクション、免疫リポソーム(immunoliposome)を用いるトランスフェクション、非リポソーム系脂質を用いるトランスフェクション、デンドリマートランスフェクション、熱ショックトランスフェクション、マグネトフェクション、リポフェクション、遺伝子銃送達、インペールフェクション、ソノポレーション、光学トランスフェクション、および特殊薬物存在下の核酸取り込みが含まれる。トランスフェクション法は、当技術分野で公知である(例えば、“Current Protocols in Molecular Biology” Ausubel et al., John Wiley & Sons, New York, 2003 または “Molecular Cloning: A Laboratory Manual” Sambrook & Russell、Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001を参照のこと)。他の態様において、分子は、マイクロインジェクションにより細胞または胚に導入される。典型的に、胚は、目的の種の受精後の1細胞期胚である。例えば、分子は、注入によって1細胞胚の前核に注入することができる。

RNA標的化エンドヌクレアーゼ(複数可)(またはコード化核酸)、ガイドRNA(複数可)(またはガイドRNAをコード化するDNA)、および任意のドナーポリヌクレオチド(複数)は、細胞または胚内に同時にまたは連続して導入され得る。RNA標的化エンドヌクレアーゼ(複数化)(またはコード化核酸)のガイドRNA(複数可)(またはコード化DNA)に対する比率は、一般的に、それらがRNA−タンパク質複合体を形成し得るような化学量論量的であり得る。一態様において、RNA標的化エンドヌクレアーゼをコード化するDNAおよびガイドRNAをコード化するDNAは、プラスミドベクター内に共に送達される。

(f)細胞または胚の培養 本方法は、ガイドRNA(複数可)がRNA誘導型エンドヌクレアーゼ(複数可)を染色体配列中の標的部位(複数可)に導き、RNA誘導型エンドヌクレアーゼ(複数可)が染色体配列中に少なくとも1つの二本鎖の切断を導入するのに適当な条件下で、細胞または胚を維持することをさらに含む。二本鎖切断は、染色体配列が、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせにより修飾されるように、DNA修復過程により修復され得る。

ドナーポリヌクレオチドが細胞または胚に導入されない態様においては、二本鎖の切断は、非相同末端結合(NHEJ)修復過程を介して修復され得る。NHEJ過程はエラーを起こしやすいため、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが、切断の修復中に起こり得る。従って、染色体配列中の配列は、コーディング領域のリーディングフレームがシフトし得て、染色体配列が不活性化または“ノックアウト”されるように修飾され得る。不活性化されたタンパク質をコードする染色体配列は、野生型染色体配列によりコード化されるタンパク質には生じない。

上流および下流配列を含むドナーポリヌクレオチドが細胞または胚に導入される態様において、二本鎖の切断は、ドナー配列が該染色体配列内に導入されるように、相同組換え修復(HDR)過程により修復され得る。従って、外来性配列は、細胞または胚のゲノム中に挿入されてよく、または標的染色体配列は、野生型染色体配列との修飾された配列の交換により修飾されてよい。

標的切断部位を含むドナーポリヌクレオチドが細胞または胚に導入される態様において、RNA誘導型エンドヌクレアーゼは、標的染色体配列およびドナーポリヌクレオチドの両方を切断し得る。直鎖状ドナーポリヌクレオチドは、ドナーポリヌクレオチドと切断された染色体配列の間にNHEJプロセスを介して結合されることにより、染色体配列中に二本鎖の切断部位にて挿入され得る。

短いドナー配列を含む直鎖状ドナーポリヌクレオチドが細胞または胚に導入される態様において、該短いドナー配列は、NHEJプロセスにより二本鎖切断部位にて染色体配列中に挿入され得る。該挿入は、短いドナー配列と染色体配列の二本鎖切断部位の平滑末端の結合により行われ得る。あるいは、挿入は、切断された染色体配列中にRNA標的化エンドヌクレアーゼにより生じる付着末端に適合可能なオーバーハングによって挟まれた短いドナー配列間の付着末端(すなわち、5’または3’オーバーハングを有する)のライゲーションを介して行われ得る。

概して、細胞は、細胞増殖および/または維持に適当な条件下で維持される。好適な細胞培養条件は、当技術分野で公知であり、例えば、Santiago et al, (2008) PNAS 105:5809−5814; Moehle et al, (2007) PNAS 104:3055−3060; Urnov et al, (2005) Nature 435:646−651; and Lombardo et al (2007) Nat, Biotechnology 25:1298−1306に記載されている。当業者は、細胞培養法が当技術分野で周知であり、細胞タイプによって変わり得ることを理解する。あらゆる場合において、常套の最適化を使用して、特定の細胞タイプにとって最良の手段を決定することができる。

胚は、インビトロ(例えば、細胞培養物中)で培養され得る。通常、胚は、適当な温度および適当な培地で、必要なとき、RNAエンドヌクレアーゼおよびガイドRNAの発現を可能にする必要なO2/CO2比で培養される。好適な培地の非限定的例には、M2、M16、KSOM、BMOC、およびHTF培地が含まれる。当業者は、培養条件が胚の種類に応じて異なり得ること、また異なるであろうことを理解するであろう。あらゆる場合において、常套の最適化を使用して、特定の種の胚にとって最良の培養条件を決定することができる。ある例において、細胞株は、インビトロで培養された胚(例えば、胚性幹細胞)に由来し得る。

あるいは、胚は、該胚をメス宿主の子宮中に移すことによりインビボで培養され得る。一般的には、該メス宿主は、胚と同じかまたは類似の種に由来する。好ましくは、メス宿主は、偽妊娠している。偽妊娠したメス宿主を作製する方法は、当技術分野で既知である。さらに、胚をメス宿主中に移す方法も既知である。胚をインビボで培養することは、胚の発達を可能にし、その胚に由来する動物の出生をもたらし得る。かかる動物は、すべての体細胞中に修飾された染色体配列を含み得る。

(g)細胞および胚のタイプ 広範囲の真核細胞および胚が、本方法における使用に好適である。例えば、細胞は、ヒト細胞、非ヒト哺乳動物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、昆虫細胞、植物細胞、酵母細胞、または単細胞真核生物であり得る。一般的に、胚は、非ヒト哺乳動物胚である。特定の態様において、胚は、1つの細胞の非ヒト哺乳動物胚であり得る。1つの細胞胚を含む哺乳動物胚の例には、マウス胚、ラット胚、ハムスター胚、げっ歯動物胚、ウサギ胚、ネコ胚、ヒツジ胚、ブタ胚、ウシ胚、ウマ胚、および霊長動物胚が含まれるが、これに限定されない。さらに他の態様において、細胞は幹細胞であり得る。好適な幹細胞には、胚性幹細胞、ES様幹細胞、胎生幹細胞、成体幹細胞、多能性幹細胞、誘導多能性幹細胞、多能性(multipotent)幹細胞、少能性(oligopotent)幹細胞、および単能性(unipotent)幹細胞等が含まれるが、これらに限定されない。例示的態様において、細胞は哺乳動物細胞である。

好適な哺乳動物細胞の非限定的例には、チャイニーズハムスター卵巣(CHO)細胞、ベビーハムスター腎臓(BHK)細胞;マウスミエローマNS0細胞、マウス胚線維芽細胞3T3細胞(NIH3T3)、マウスBリンパ腫A20細胞;マウス黒色腫B16細胞;マウス筋芽C2C12細胞;マウスミエローマSP2/0細胞;マウス胚間葉性C3H−10T1/2細胞;マウス癌腫CT26細胞、マウス前立腺DuCuP細胞;マウス乳癌EMT6細胞;マウスヘパトーマHepa1c1c7細胞;マウスミエローマJ5582細胞;マウス上皮性MTD−1A細胞;マウス心筋MyEnd細胞;マウス腎臓RenCa細胞;マウス膵臓RIN−5F細胞;マウス黒色腫X64細胞;マウスリンパ腫YAC−1細胞;ラットグリオーマ9L細胞;ラットBリンパ腫RBL細胞;ラット神経芽腫B35細胞;ラットヘパトーマ細胞(HTC);バッファロー ラット肝臓BRL 3A細胞;イヌ腎臓細胞(MDCK);イヌ乳癌(CMT)細胞;ラット骨肉腫D17細胞;ラット単球/マクロファージDH82細胞;サル腎臓SV−40により形質転換した線維芽細胞(COS7)細胞;サル腎臓CVI−76細胞;アフリカミドリザル腎臓(VERO−76)細胞;ヒト胚性腎臓細胞(HEK293、HEK293T);ヒト頚部癌腫細胞(HELA);ヒト細胞(W138);ヒト肝臓細胞(Hep G2);ヒトU2−OS骨肉腫細胞、ヒトA549細胞、ヒトA−431細胞、およびヒトK562細胞が含まれる。哺乳動物細胞株の広範な一覧については、American Type Culture Collection catalog (ATCC, Mamassas, VA)に見出すことができる。

(V)染色体配列を修飾するか、または染色体配列の発現を制御するための融合タンパク質の使用方法 本開示の別の面は、細胞または胚において、染色体配列を修飾するか、または染色体配列の発現を制御するための方法を包含する。本方法は、細胞または胚へ、(a)少なくとも1つの融合タンパク質または少なくとも1つの融合タンパク質をコード化する核酸(ここで、該融合タンパク質は、CRISPR/Cas様タンパク質またはそのフラグメントおよびエフェクタードメインを含む)、および(b)少なくとも1つのガイドRNAまたはガイドRNAをコード化するDNA(ここで、該ガイドRNAは、融合タンパク質のCRISPR/Cas様タンパク質を染色体配列中の標的部位に誘導し、融合タンパク質のエフェクタードメインが染色体配列を修飾するか、または染色体配列の発現を制御する。)を導入することを含む。

CRISPR/Cas様タンパク質またはそのフラグメントおよびエフェクタードメインを含む融合タンパク質は、上記のセクション(II)に詳述される。一般的に、本明細書に記載の融合タンパク質は、少なくとも1つの核局在化シグナルをさらに含む。融合タンパク質をコード化する核酸は、上記のセクション(III)に記載される。ある態様において、融合タンパク質は、細胞または胚内に単離されたタンパク質として導入され得る(それは、細胞透過性ドメインをさらに含み得る)。さらに、単離された融合タンパク質は、ガイドRNAを含むタンパク質−RNA複合体の一部であり得る。他の態様において、融合タンパク質は、細胞または胚内にRNA分子として導入され得る(それは、キャップ付加および/またはポリアデニル化されていてよい)。さらに他の態様において、融合タンパク質は、細胞または胚内にDNA分子として導入され得る。例えば、融合タンパク質およびガイドRNAは、細胞または胚内に個別のDNA分子または同じDNA分子の一部として導入され得る。かかるDNA分子は、プラスミドベクターであり得る。

ある態様において、本方法は、細胞または胚内に少なくとも1つのジンクフィンガーヌクレアーゼを導入することをさらに含む。ジンクフィンガーヌクレアーゼは、上記のセクション(II)(d)に記載される。さらに他の態様において、本方法は、細胞または胚内に少なくとも1つのドナーポリヌクレオチドを導入することをさらに含む。ドナーポリヌクレオチドは、上記のセクション(IV)(d)に詳述される。分子を細胞または胚に導入する手段、ならびに細胞または胚を培養する手段は、上記のセクション(IV)(e)および(IV)(f)にそれぞれ記載される。適切な細胞および胚は、上記のセクション(IV)(g)に記載される。

融合タンパク質のエフェクタードメインが切断ドメイン(例えば、FokI切断ドメインまたは修飾されたFokI切断ドメイン)であるいくつかの態様において、本方法は、細胞または胚内に1つの融合タンパク質(または1つの融合タンパク質をコード化する核酸)および2つのガイドRNA(または2つのガイドRNAをコード化するDNA)を導入することを含み得る。2つのガイドRNAは、融合タンパク質を染色体配列中の2つの異なる標的部位に誘導し、ここで、融合タンパク質は、2つの切断ドメインが染色体配列中に二本鎖切断を導入し得るように二量体化する(例えば、ホモ二量体を形成する)。図1Aを参照のこと。任意のドナーポリヌクレオチドが存在しない態様において、染色体配列における二本鎖の切断は、非相同末端結合(NHEJ)修復過程により修復され得る。NHEJはエラー発生率が高いため、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが、該切断の修復中に起こり得る。従って、標的染色体配列は、修飾または不活性化され得る。例えば、単一塩基多型(SNP)は、改変されたタンパク質生成をもたらし得るか、またはコーディング配列のリーディングフレームにおけるシフトは、タンパク質生成が起こらないように、該配列を不活性化または“ノックアウト”し得る。任意のドナーポリヌクレオチドが存在する態様において、ドナーポリヌクレオチドにおけるドナー配列は、二本鎖の切断の修復中に標的部位において染色体配列で置換されるか、または染色体配列中に挿入され得る。例えば、ドナー配列が、染色体配列中の標的部位の上流および下流配列のそれぞれと実質的に同一の配列を有する上流および下流配列に挟まれている態様において、該ドナー配列は、相同組み換え修復過程により仲介される修復中に標的部位において染色体配列で置換されるか、または染色体配列に挿入され得る。あるいは、ドナー配列が互換性の重複により連結されている(または互換性の重複がRNA誘導型エンドヌクレアーゼによりインサイチュウで生じる)態様において、該ドナー配列は、二本鎖の切断の修復中に非相同修復過程により切断された染色体配列を直接的に結合させることができる。染色体配列へのドナー配列の交換または挿入は、標的染色体配列を修飾し、または細胞または胚の染色体配列へ外来配列を導入する。

融合タンパク質のエフェクタードメインが切断ドメイン(例えば、FokI切断ドメインまたは修飾されたFokI切断ドメイン)である他の態様において、方法は、細胞または胚内に2つの異なる融合タンパク質(または2つの異なる融合タンパク質をコード化する核酸)および2つのガイドRNA(または2つのガイドRNAをコード化するDNA)を導入することを含み得る。融合タンパク質は、上記のセクション(II)に詳述される通り異なり得る。各ガイドRNAは、染色体配列中の特定の標的部位に融合タンパク質を誘導し、ここで、融合タンパク質は、2つの切断ドメインが染色体配列中に二本鎖切断を導入し得るように、二量体化する(例えば、ヘテロ二量体を形成する)。任意のドナーポリヌクレオチドが存在しない態様において、結果生じた二本鎖の切断は、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが、該切断の修復中に起こり得るように、非相同修復過程により修復され得る。任意のドナーポリヌクレオチドが存在する態様において、ドナーポリヌクレオチドにおけるドナー配列は、相同組み換え修復過程(例えば、ドナー配列が、染色体配列中の標的部位の上流および下流配列のそれぞれと実質的に同一の配列を有する上流および下流配列に挟まれている態様において)または非相同組み換え修復過程(例えば、ドナー配列が互換性の重複により連結されている態様において)のいずれかにより、二本鎖の切断の修復中に標的部位において染色体配列で置換されるか、または染色体配列中に挿入され得る。

融合タンパク質のエフェクタードメインが切断ドメイン(例えば、FokI切断ドメインまたは修飾されたFokI切断ドメイン)であるさらに他の態様において、本方法は、細胞または胚内に1つの融合タンパク質(または1つの融合タンパク質をコード化する核酸)、1つのガイドRNA(または1つのガイドRNAをコード化するDNA)、および1つのジンクフィンガーヌクレアーゼ(またはジンクフィンガーヌクレアーゼをコード化する核酸)を導入することを含んでいてよく、ここで、該ジンクフィンガーヌクレアーゼは、FokI切断ドメインまたは修飾されたFokI切断ドメインを含む。ガイドRNAは、融合タンパク質を特定の染色体配列に誘導し、ジンクフィンガーヌクレアーゼは、別の染色体配列に誘導し、ここで、融合タンパク質およびジンクフィンガーヌクレアーゼは、融合タンパク質の切断ドメインおよびジンクフィンガーヌクレアーゼの切断ドメインが染色体配列中に二本鎖切断を導入し得るように、二量体を形成する。図1Bを参照のこと。任意のドナーポリヌクレオチドが存在しない態様において、結果生じた二本鎖の切断は、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが該切断の修復中に起こり得るように、非相同修復過程によって修飾され得る。任意のドナーポリヌクレオチドが存在する態様において、ドナーポリヌクレオチド中のドナー配列は、相同組み換え修復過程(例えば、ドナー配列が、染色体配列中の標的部位の上流および下流配列のそれぞれと実質的に同一の配列を有する上流および下流配列に挟まれている態様において)または非相同組み換え修復過程(例えば、ドナー配列が互換性の重複により連結されている態様において)のいずれかにより、二本鎖の切断の修復中に置換されるか、または染色体配列中に挿入され得る。

融合タンパク質のエフェクタードメインが転写活性化ドメインまたは転写リプレッサードメインであるさらに他の態様において、本方法は、細胞または胚内に1つの融合タンパク質(または1つの融合タンパク質をコード化する核酸)および1つのガイドRNA(または1つのガイドRNAをコード化するDNA)を導入することを含み得る。ガイドRNAは、融合タンパク質を特定の染色体配列に誘導し、ここで、転写活性化ドメインまたは転写リプレッサードメインは、標的染色体配列の発現をそれぞれ活性化または抑制する。図2Aを参照のこと。

融合タンパク質のエフェクタードメインが後成的修飾ドメインである別の態様において、本方法は、細胞または胚内に1つの融合タンパク質(または1つの融合タンパク質をコード化する核酸)および1つのガイドRNA(または1つのガイドRNAをコードするDNA)を導入することを含み得る。ガイドRNAは、融合タンパク質を特定の染色体配列に誘導し、ここで、後成的修飾ドメインは、標的染色体配列の構造を修飾する。図2Aを参照のこと。後成的修飾には、アセチル化、ヒストンタンパク質のメチル化および/またはヌクレオチドのメチル化が含まれる。ある例において、染色体配列の構造的修飾は、染色体配列の発現変化をもたらす。

(VI)遺伝子的に修飾された細胞および動物 本開示は、RNA誘導型エンドヌクレアーゼにより仲介されるか、または融合タンパク質により仲介される過程を用いて、例えば、本明細書に記載の方法を用いて修飾されている、少なくとも1つの染色体配列を含む遺伝子的に修飾された細胞、非ヒト胚および非ヒト動物を包含する。本開示は、目的の染色体配列または融合タンパク質、少なくとも1つのガイドRNA、および所望により、1つまたはそれ以上のドナーポリヌクレオチド(複数可)に対して標的化されたRNA誘導型エンドヌクレアーゼまたは融合タンパク質をコード化する少なくとも1つのDNAまたはRNA分子を含む細胞を提供する。本開示はまた、目的の染色体配列、少なくとも1つのガイドRNA、および所望により、1つまたはそれ以上のドナーポリヌクレオチド(複数可)に対して標的化されたRNA誘導型エンドヌクレアーゼまたは融合タンパク質をコード化する少なくとも1つのDNAまたはRNA分子を含む非ヒト胚を提供する。

本開示は、少なくとも1つの修飾された染色体配列を含む遺伝子的に修飾された非ヒト動物、非ヒト胚、または動物細胞を提供する。修飾された染色体配列は、それが、(1)不活性化される、(2)改変された発現または改変されたタンパク質生成を生じる、または(3)挿入された配列を含むように、修飾されていてよい。該染色体配列は、RNAにより誘導されるエンドヌクレアーゼにより仲介されるか、または融合タンパク質により仲介される過程により、本明細書に記載の方法を用いて修飾される。

記載される通り、本開示の一面は、少なくとも1つの染色体配列が修飾されている遺伝子的に修飾された動物を提供する。一態様において、遺伝子的に修飾された動物は、少なくとも1つの不活性化された染色体配列を含む。修飾された染色体配列は、該配列が転写されない、および/または機能的タンパク質生成が生じないように不活性化されていてよい。従って、不活性化された染色体配列を含む遺伝子的に修飾された動物は、“ノックアウト”または“条件付きノックアウト”と称され得る。不活性化された染色体配列は、欠失変異(すなわち、1つまたはそれ以上のヌクレオチドの欠失)、挿入変異(すなわち、1つまたはそれ以上のヌクレオチドの挿入)、またはナンセンス変異(すなわち、停止コドンが挿入されるように単一のヌクレオチドを別のヌクレオチドに置換すること)を含み得る。該変異の結果、標的化された染色体配列は不活性化され、機能的タンパク質は生成されない。不活性化された染色体配列は、外来的に挿入された配列を含まない。また、本発明には、2、3、4、5、6、7、8、9、または10またはそれ以上の染色体配列が不活性化されている遺伝子的に修飾された動物も包含される。

別の態様において、修飾された染色体配列は、それが変異体タンパク質産物をコードするように改変されていてよい。例えば、修飾された染色体配列を含む遺伝子的に修飾された動物は、改変されたタンパク質産物を生産するように、標的点変異(複数可)または他の修飾を含み得る。一態様において、染色体配列は、少なくとも1つのヌクレオチドが変化し、発現されたタンパク質が1つの変化したアミノ酸残基(ミスセンス変異)を含むように修飾され得る。別の態様において、染色体配列は、2つ以上のアミノ酸が変化するように、2つ以上のミスセンス変異を含むように修飾され得る。さらに、染色体配列は、発現されたタンパク質が単一のアミノ酸欠失または挿入を含むように、3ヌクレオチド欠失または挿入を有するように修飾され得る。改変または変異タンパク質は、改変された基質特異性、改変された酵素活性、改変された反応速度などの、野生型タンパク質と比較して、改変された特性または活性を有し得る。

別の態様において、遺伝子的に修飾された動物は、少なくとも1つの染色体に組み込まれた配列を含み得る。組み込まれた配列を含む遺伝子的に修飾された動物は、“ノックイン”または“条件付きノックイン”と称され得る。染色体に組み込まれた配列は、例えば、オルソログタンパク質、内在性タンパク質、またはその両方の組み合わせをコード化し得る。一態様において、オルソログタンパク質または内在性タンパク質をコード化する配列は、染色体配列は不活性化されるが、外来性配列は発現されるように、タンパク質をコード化する染色体配列中に挿入され得る。そのような場合において、オルソログタンパク質または内在性タンパク質をコード化する配列は、プロモーター調節配列に操作可能に連結されていてよい。あるいは、オルソログタンパク質または内在性タンパク質をコード化する配列は、染色体配列の発現に影響を与えることなく、該染色体配列中に挿入され得る。例えば、タンパク質をコード化する配列は、Rosa26遺伝子座、HPRT遺伝子座、またはAAV遺伝子座のような“セーフハーバー”遺伝子座内に挿入され得る。本開示は、タンパク質(複数可)をコード化する配列を含む、2、3、4、5、6、7、8、9、または10またはそれ以上の配列が、ゲノムに組み込まれている遺伝子的に修飾された動物も含み得る。

タンパク質をコード化する染色体に組み込まれた配列は、目的のタンパク質の野生型をコード化するか、またはタンパク質の改変体が生産されるように、少なくとも1つの修飾を含むタンパク質をコード化していてよい。例えば、疾患または障害に関係するタンパク質をコード化する染色体に組み込まれた配列は、生産されたタンパク質の改変体が、関連障害の原因となるか、またはそれを増強するように、少なくとも1つの修飾を含み得る。あるいは、疾患または障害に関連するタンパク質をコードする染色体に組み込まれた配列は、タンパク質の改変体が、関連障害の発症から保護するように、少なくとも1つの修飾を含み得る。

さらなる態様において、遺伝子的に修飾された動物は、機能的ヒトタンパク質をコード化する少なくとも1つの染色体に組み込まれた配列を含む“ヒト化”動物であってよい。機能的ヒトタンパク質は、遺伝子的に修飾された動物において対応するオルソログを有し得ない。あるいは、遺伝子的に修飾された動物が由来する野生型動物は、機能的ヒトタンパク質に対応するオルソログを含んでいてよい。この場合において、“ヒト化”動物におけるオルソログ配列は、機能的タンパク質が生成されないように不活性化されるか、または“ヒト化”動物は、ヒトタンパク質をコード化する少なくとも1つの染色体に組み込まれた配列を含む。

さらに別の態様において、遺伝子的に修飾された動物は、タンパク質の発現パターンが変化するように、タンパク質をコード化する少なくとも1つの修飾された染色体配列を含み得る。例えば、プロモーターまたは転写因子結合部位のようなタンパク質の発現を制御する調節領域は、タンパク質が過剰に生産されるか、またはタンパク質の組織特異的もしくは時間的発現が変わるか、またはその組み合わせのように、改変され得る。あるいは、タンパク質の発現パターンは、条件付きノックアウトシステムを用いて改変され得る。条件付きノックアウトシステムの非限定的な例には、Cre−lox組換えシステムが含まれる。Cre−lox組換えシステムは、Creリコンビナーゼ酵素、核酸分子中の特定の部位(lox部位)間の核酸配列の組み換えを触媒し得る部位特異的DNAリコンビナーゼを含む。時間的および組織特異的発現を生じるためにこのシステムを使用する方法は、当技術分野で公知である。一般に、遺伝子的に修飾された動物は、染色体配列を挟むlox部位を生じる。次いで、lox−挟持染色体配列を含む遺伝子的に修飾された動物は、Creリコンビナーゼを発現する他の遺伝子的に修飾された動物と交配され得る。その後、lox−挟持染色体配列およびCreリコンビナーゼを含む子孫動物が生まれ、lox−挟持染色体配列が組み換えられて、タンパク質をコード化する染色体配列の欠失または逆位がもたらされる。Creリコンビナーゼの発現は、染色体配列の時間的および条件的調節組換えを行うために、時間的および条件的に調節され得る。

これらの態様のいずれかにおいて、本明細書に記載の遺伝子的に修飾された動物は、修飾された染色体配列に対してヘテロ接合性であり得る。あるいは、遺伝子的に修飾された組み換え動物は、修飾された染色体配列に対してホモ接合性であり得る。

本明細書に記載の遺伝子的に修飾された組み換え動物は、2以上の修飾された染色体配列を含む動物を作製するため、または1もしくはそれ以上の修飾された染色体配列に対してホモ接合性である動物を作製するために、交配することができる。例えば、同じ修飾がされた染色体配列を含む2匹の動物を、修飾された染色体配列の動物ホモ接合体を作製するために交配させ得る。あるいは、異なる修飾がされた染色体配列を有する動物は、両方の修飾がされた染色体配列を含む動物を作製するために交配することができる。

例えば、不活性化された染色体配列遺伝子“x”を含む第一の動物は、ヒト遺伝子“X”タンパク質をコード化する染色体に組み込まれた配列を含む第二の動物と交配して、不活性化された遺伝子“x”染色体配列および染色体に組み込まれたヒト遺伝子“X”配列の両方を含む“ヒト化”遺伝子“X”子孫を生じ得る。また、ヒト化遺伝子“X”動物は、ヒト化遺伝子“Y”動物と交配して、ヒト化遺伝子X/遺伝子Y子孫を生じ得る。当業者は、多くの組み合わせが可能であることを理解し得る。

他の態様において、修飾された染色体配列を含む動物は、修飾された染色体配列を他の遺伝的背景と組み合わせるために交配し得る。非限定的な例として、他の遺伝的背景は、野生型遺伝的背景、欠失変異を有する遺伝的背景、別の標的組み換えを有する遺伝的背景、および非標的組み換えを有する遺伝的背景を含んでいてよい。

本明細書で用いる用語“動物”は、非ヒト動物を意味する。該動物は、胚、幼若、または成熟であってよい。好適な動物には、哺乳動物、鳥類、は虫類、両生類、甲殻類、および魚類のような脊椎動物が含まれる。好適な哺乳動物の例には、げっ歯動物、愛玩動物、家畜動物、および霊長動物が含まれるが、これらに限定されない。げっ歯動物の非限定的例には、マウス、ラット、ハムスター、スナネズミ(gerbil)、およびモルモットが含まれる。好適な愛玩動物には、ネコ、イヌ、ウサギ、ハリネズミ、およびフェレットが含まれるが、これらに限定されない。家畜動物の非限定的例には、ウマ、ヤギ、ヒツジ、ブタ、ウシ、ラマ、およびアルパカが含まれる。好適な霊長動物には、オマキザル属、チンパンジー、キツネザル、マカク、マーモセット、タマリン、クモザル、リスザル、およびベルベット・モンキーが含まれるが、これに限定されない。鳥類の非限定的例には、ニワトリ、七面鳥、カモ、およびガチョウが含まれる。あるいは、動物は、昆虫類、線虫類などのような無脊椎動物であり得る。昆虫の非限定的例には、ショウジョウバエおよび蚊が含まれる。例示的動物はラットである。好適なラット系統の非限定的例には、食塩感受性ダールラット、Fischer 344、ルイス、ロングエバンスラット、スプラーグドーリーラット、およびウィスターラットが含まれる。一態様において、動物は遺伝子的に修飾されたマウスではない。本発明に好適な動物の上記例(iteration)のそれぞれにおいて、動物は、外来的に導入された、染色体上にランダムに挿入されたトランスポゾン配列を含まない。

本開示のさらなる面は、少なくとも1つの修飾された染色体配列を含む遺伝子的に修飾された細胞または細胞株を提供する。遺伝子的に修飾された細胞または細胞株は、本明細書に記載の遺伝子的に修飾された組み換え動物の何れかに由来し得る。あるいは、染色体配列は、本明細書に記載の方法を用いて、本明細書中、上記の通り(動物における染色体配列修飾を記載するパラグラフ)細胞において修飾され得る。本開示はまた、該細胞または細胞株の溶解物を包含する。

一般的に、細胞は真核細胞である。好適な宿主細胞には、菌類または酵母、例えばピキア属、サッカロミセス属、またはシゾサッカロミセス属;昆虫細胞、例えばスポドプテラ・フルギペルダ由来のSF9細胞またはキイロショウジョウバエ由来のS2細胞;および、動物細胞、例えばマウス、ラット、ハムスター、非ヒト霊長動物、またはヒト細胞が含まれる。例示的細胞は哺乳動物細胞である。哺乳動物細胞は、初代細胞であってもよい。一般的に、二本鎖切断に感受性の初代細胞を使用することができる。該細胞は、種々の細胞タイプ、例えば、線維芽細胞、筋芽細胞、TまたはB細胞、マクロファージ、上皮性細胞などであり得る。

哺乳動物細胞株を用いるとき、細胞株は、任意の確立された細胞株または未だ記載されていない初代細胞株であり得る。細胞株は、付着性または非付着性であり得るか、または細胞株は、当業者に公知の標準的技術を用いて付着性、非付着性または器官型増殖(organotypic growth)を促進する条件下で増殖させることができる。好適な哺乳動物細胞および細胞株の非限定的例は、本明細書中、セクション(IV)(g)に提供される。更に他の態様において、細胞は幹細胞であり得る。好適な幹細胞の非限定的例は、セクション(IV)(g)に提供される。

本開示はまた、少なくとも1つの修飾された染色体配列を含む遺伝子的に修飾された非ヒト胚を提供する。染色体配列は、本明細書に記載の方法を用いて(動物における染色体配列の改変を記載する段落において)本明細書中上記の通り、胚において修飾され得る。一態様において、胚は、目的の動物種の非ヒトの受精後の1細胞期胚である。1細胞期胚を含む哺乳動物の胚の例には、マウス、ラット、ハムスター、げっ歯動物、ウサギ、ネコ、イヌ、ヒツジ、ブタ、ウシ、ウマ、および霊長動物の胚が含まれるが、これに限定されない。

定義 特に他に定義されない限り、本明細書で用いる全ての技術用語および科学用語は、本発明の属する分野の当業者に通常理解される意味を有する。以下の参考文献は、本発明に使用される多くの用語の一般的定義を当業者に提供する:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); および、 Hale & Marham, The Harper Collins Dictionary of Biology (1991)。本明細書で用いる通り、以下の用語は、他に特に記載されない限り、それらの有する普通の意味を有する。

本開示の要素またはそれら好ましい態様(複数可)を導入するとき、冠詞“a”、“an”、“the”、および“said”は、1つまたはそれ以上の要素が存在することを意味することが意図される。用語“含む(comprising)”、“含む(including)”、および“有する(having)”は、包括的であることが意図され、列挙された要素以外の付加的な要素が存在し得ることを意味する。

本明細書で用いる用語“内在性配列”は、その細胞の天然の染色体配列を意味する。

本明細書で用いる用語“外来性の”とは、細胞に天然に存在しない配列、または細胞のゲノム中の天然の位置とは異なる染色体上の位置に存在する染色体配列を意味する。

本明細書で用いる“遺伝子”は、遺伝子産物をコードするDNA領域(エクソンおよびイントロンを含む)、ならびに遺伝子産物の産生を制御する全てのDNA領域を意味し、かかる制御配列がコーディング配列および/または転写配列に隣接するか否かを問わない。従って、遺伝子は、プロモーター配列、ターミネーター、リボソーム結合部位および内部リボソーム進入部位等の転写制御配列、エンハンサー、サイレンサー、インスレーター、境界エレメント、複製起点、マトリックス付着部位、ならびに遺伝子座調節領域を含むが、必ずしもそれらに限定されない。

用語“異種の”は、目的の細胞に内在しないか、または天然に存在しない成分を意味する。例えば、異種タンパク質は、導入外来核酸配列のような外来性起源に由来するか、または元々はそれに由来していたタンパク質を意味する。ある例において、異種タンパク質は、目的の細胞により通常生産されない。

用語“核酸”および“ポリヌクレオチド”は、直鎖状または環状の構造であって、一本鎖または二本鎖の形態のデオキシリボヌクレオチドポリマーまたはリボヌクレオチドポリマーを意味する。本開示の目的で、これらの用語は、ポリマーの長さに関して限定的であるものとして解釈されるべきではない。これらの用語は、天然ヌクレオチドの既知の類似体、ならびに塩基部分、糖部分および/またはリン酸部分(例えば、ホスホロチオエート骨格)において修飾されたヌクレオチドを包含し得る。一般的に、特定のヌクレオチドの類似体は、同じ塩基対形成特異性を有し、すなわち、Aの類似体は、Tと塩基対形成し得る。

用語“ヌクレオチド”は、デオキシリボヌクレオチドまたはリボヌクレオチドを意味する。ヌクレオチドは、標準ヌクレオチド(すなわち、アデノシン、グアノシン、シチジン、チミジン、およびウリジン)またはヌクレオチド類似体であり得る。ヌクレオチド類似体とは、修飾されたプリン塩基もしくはピリミジン塩基または修飾されたリボース部分を有するヌクレオチドを意味する。ヌクレオチド類似体は、天然に存在するヌクレオチド(例えば、イノシン)または天然に存在しないヌクレオチドであり得る。ヌクレオチドの糖部分または塩基部分の修飾の非限定的な例には、アセチル基、アミノ基、カルボキシル基、カルボキシメチル基、ヒドロキシル基、メチル基、ホスホリル基、およびチオール基の付加(または除去)、ならびに塩基の炭素原子および窒素原子の他の原子との置換(例えば、7−デアザプリン)が含まれる。またヌクレオチド類似体には、ジデオキシヌクレオチド、2’−O−メチルヌクレオチド、ロックド核酸(LNA)、ペプチド核酸(PNA)、およびモルホリノも含まれる。

用語“ポリペプチド”および“タンパク質”は、互換的に使用されて、アミノ酸残基のポリマーを意味する。

核酸およびアミノ酸の配列同一性を決定するための技術は、当技術分野において既知である。通常は、そのような技術には、遺伝子のmRNAのヌクレオチド配列を決定すること、および/またはそれによりコードされるアミノ酸配列を決定すること、ならびにこれらの配列を第2のヌクレオチドまたはアミノ酸配列と比較することが含まれる。ゲノム配列もこれと同様に決定し、比較することができる。一般的に、同一性は、2つのポリヌクレオチド配列またはポリペプチド配列のそれぞれのヌクレオチドとヌクレオチド、またはアミノ酸とアミノ酸の正確な一致を意味する。2つまたはそれ以上の配列(ポリヌクレオチドまたはアミノ酸)は、それらのパーセント同一性を決定することによって比較することができる。2つの配列のパーセント同一性は、核酸であるかアミノ酸配列であるかを問わず、2つのアラインメントされた配列間の正確な一致の数を短い方の配列の長さで除し、100を乗じたものである。核酸配列の近似アラインメントは、Smith and Waterman, Advances in Applied Mathematics 2:482−489 (1981) の局所相同性アルゴリズムによって提供される。このアルゴリズムは、Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 suppl. 3:353−358, National Biomedical Research Foundation, Washington, D.C., USAによって開発され、Gribskov, Nucl. Acids Res. 14(6):6745−6763 (1986) によって正規化されたスコアリング行列を用いることによって、アミノ酸配列に適用することができる。配列のパーセント同一性を決定するためのこのアルゴリズムの例示的な実施は、Genetics Computer Group(Madison, Wis.)により、「BestFit」ユーテリティアプリケーションにおいて提供される。配列間のパーセント同一性または類似性を算出するために好適な他のプログラムは、一般に当該技術分野で既知であり、例えば、別のアラインメントプログラムは、デフォルトパラメータで使用されるBLASTである。例えば、BLASTNおよびBLASTPは、以下のデフォルトパラメータを用いて使用することができる:遺伝コード(genetic code)=標準(standard);フィルター(filter)=なし(none);鎖(strand)=両方(both);カットオフ(cutoff)=60;期待値(expect)=10;行列(Matrix)=BLOSUM62;表示(Descriptions)=50配列;分類方法(sort by)=高スコア(HIGH SCORE);データベース(Databases)=非重複(non−redundant)、GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+Swiss protein+Spupdate+PIR。これらのプログラムの詳細は、GenBankウェブサイト上に見出すことができる。

種々の変更が、本発明の範囲から逸脱することなく上記の細胞および方法において可能であるように、上記の説明および以下の実施例に含まれる全ての事項は、例示として解釈されるべきであり、限定するものと解されるべきではないことが意図される。

実施例 以下の実施例は、本発明のある面を説明する。

実施例1:哺乳動物発現のためのCas9遺伝子の修飾 化膿性連鎖球菌株MGAS15252(受託番号YP_005388840.1)由来のCas9遺伝子を、哺乳動物細胞におけるその翻訳を強化するためにヒト(ホモ・サピエンス)のコドンで優先的に最適化した。Cas9遺伝子はまた、哺乳動物細胞の核に該タンパク質を標的化するためにC末端に核局在化シグナルPKKKRKV(配列番号1)を付加することにより修飾された。表1は、修飾されたCas9アミノ酸配列を示し、核局在化配列は下線で示される。表2は、コドンを最適化した修飾されたCas9 DNA配列を示す。

修飾されたCas9 DNA配列を、哺乳動物細胞における構成的発現のために、サイトメガロウイルス(CMV)プロモーターの制御下に置いた。修飾されたCas9 DNA配列はまた、T7 RNAポリメラーゼを用いるインビトロでのmRNA合成のためにT7プロモーターの制御下に置いた。インビトロでのRNA転写を、MessageMAX T7 ARCA−キャップド メッセージ転写キットおよびT7 mScriptスタンダードmRNA生産システム(Cellscript)を用いて行った。

実施例2:Cas9のターゲティング アデノ随伴ウイルス挿入部位1(AAVS1)遺伝子座を、Cas9仲介性ヒトゲノム修飾のための標的として用いた。ヒト AAVS1遺伝子座は、タンパク質ホスファターゼ1、調節サブユニット12C(PPP1R12C)のイントロン1(4427bp)に位置する。表3は、PPP1R12Cの第一エクソン(網掛け灰色部分)および第一イントロンを示す。イントロン内の下線を付した配列は、標的修飾部位(すなわち、AAVS1遺伝子座)である。

Cas9 ガイドRNAは、ヒトAAVS1遺伝子座を標的とするために設計された。標的認識配列(すなわち、標的配列の非コーディング鎖に相補的な配列)およびプロトスペーサー配列を含む42ヌクレオチドのRNA(本明細書中、“crRNA”配列と言う)(5’から3’);crRNAの3’配列に相補的な5’配列および付加的ヘアピン配列を含む85ヌクレオチドのRNA(本明細書中、“tracrRNA”配列と言う);ならびに、crRNAのヌクレオチド1−32、GAAAループおよびtracrRNAのヌクレオチド19−45を含むキメラRNAを調製した。crRNAを、Sigma−Aldrich社により化学的に合成した。tracrRNAおよびキメラRNAを、T7−Scribe Standard RNA IVT Kit(Cellscript)を用いてT7 RNA ポリメラーゼを用いるインビトロ転写により合成した。キメラRNAコーディング配列はまた、ヒト細胞におけるインビボ転写のためのヒトU6プロモーターの制御下に置いた。表4は、ガイドRNAの配列を示す。

実施例3:ゲノム修飾をモニターするためのドナーポリヌクレオチドの調製 PPP1R12CのN末端へのGFPタンパク質の特異的挿入を、Cas9仲介性ゲノム修飾をモニターするために用いた。相同組換えによる挿入を仲介するために、ドナーポリヌクレオチドを調製した。AAVS1−GFP DNA ドナーは、5’(1185bp)のAAVS1遺伝子座の相同アーム、RNAスプライシング受容体、ターボGFPコーディング配列、3’転写ターミネーター、および3’(1217bp)のAAVS1遺伝子座の相同アームを含んでいた。表5は、RNAスプライシング受容体の配列および3’転写ターミネーターが続くGFPコーディング配列を示す。プラスミドDNAを、GenEluteエンドトキシンフリープラスミドMaxiprep Kit(Sigma)を用いて調製した。

特異的遺伝子導入は、PPP1R12Cの最初の107アミノ酸とターボGFPの融合タンパク質をもたらし得る。予期される融合タンパク質は、PPP1R12Cの第一エクソンと設計されたスプライス受容体の間のRNAスプライシングからPPP1R12Cの最初の107アミノ酸残基(網掛け灰色部分)を含む(表6参照)。

実施例4:Cas9仲介性特異的導入 トランスフェクションをヒトK562細胞で行った。K562細胞株をAmerican Type Culture Collection (ATCC)より入手し、10%FBSおよび2mMのL−グルタミンを添加したイスコフ改変ダルベッコ培地中で増殖させた。全ての培地および添加物は、Sigma−Aldrichより入手した。培養物をトランスフェクションの1日前に(1mL当たり約50万個の細胞で)分割した。細胞を、T−016プログラムを用いてNucleofector (Lonza)のNucleofector ソリューションV(Lonza)を用いてトランスフェクションした。各ヌクレオフェクション(nucleofection)溶液は、約60万個の細胞を含んだ。トランスフェクション処理を表7に詳述する。細胞を、ヌクレオフェクション直後に37℃および5% CO2で増殖させた。

蛍光活性化細胞選別(FACS)をトランスフェクションの4日後に行った。FACSデータを図4に示す。4つの実験処理群(A−D)のそれぞれで検出されたGFPの割合は、対照処理群(E、F)よりも多く、ドナー配列の挿入および融合タンパク質の発現が確認された。

実施例5:標的組み換えのPCR確認 ゲノムDNAを、トランスフェクションの12日後にGenElute Mammalian Genomic DNA Miniprep Kit (Sigma)を用いてトランスフェクション細胞から抽出した。その後、ゲノムDNAを、AAVS1−GFPプラスミドドナーの5’相同アームの外側に位置するフォワードプライマーおよびGFPの5’領域に位置するリバースプライマーを用いて、PCR増幅させた。フォワードプライマーは、5’−CCACTCTGTGCTGACCACTCT−3’(配列番号18)であり、リバースプライマーは、5’−GCGGCACTCGATCTCCA−3’(配列番号19)であった。ジャンクションPCRから予期されるフラグメントサイズは、1388bpであった。増幅を、以下のサイクル条件を用いてJumpStart Taq ReadyMix (Sigma)を用いて行った:最初の変性のために98℃で2分間;98℃で15秒間、62℃で30秒間、および72℃で1分30秒を35サイクル;そして、最後の伸張を72℃で5分間。PCR産物を1%アガロースゲル上で分離した。

アンチリバースキャップアナログ(ARCA)を用いて転写されたCas9 mRNA(10μg)、0.3nmolのプレアニーリングされたcrRNA−tracrRNAの二本鎖、および10μgのAAVS1−GFP プラスミドDNAをトランスフェクトされた細胞は、予期されたサイズのPCR産物を示した(図5のレーンAを参照のこと)。

実施例6:マウス胚におけるCas9ベースのゲノム編集 マウスRosa26遺伝子座を、ゲノム編集のための標的とし得る。表8は、マウスRosa26配列の一部を示し、そこで、可能性のある標的部位を太字で示す。各標的部位は、プロトスペーサーを含む。

ガイドRNAを、マウスRosa26遺伝子座における標的部位の各々を標的とするように設計した。配列を表9に示し、各々が42ヌクレオチド長であり、5’領域は、表8に示されていない鎖(すなわち、表8に示される鎖に相補的な鎖)に相補的である。

crRNAは化学的に合成され、tracrRNA(配列番号13;実施例2参照)にプレアニーリングされている。プレアニーリングされたcrRNA/tracrRNAおよび修飾されたCas9タンパク質をコード化するインビトロで転写されたmRNA(配列番号9;実施例1参照)は、受精後マウス胚の前核にマイクロインジェクションされ得る。crRNAにより設定された標的へのガイダンスにより、Cas9タンパク質は標的部位を切断し、その結果生じた二本鎖の切断は非相同末端結合(NHEJ)修復過程により修復され得る。挿入された胚を、37℃、5%CO2で一晩または4日間までインキュベートし、その後、遺伝子型解析を行うか、または挿入された胚は、生産(live-born)動物が遺伝子型解析が可能なように、レシピエント雌マウスに移植することができる。生産動物由来のインビトロでインキュベートされた胚または組織を、標準的方法を用いてRosa遺伝子座においてCas9誘導性変異の存在についてスクリーニングすることができる。例えば、胎仔または生産動物由来の胚または組織を、DNA抽出および分析のために収集することができる。DNAを標準的方法を用いて単離することができる。Rosa26遺伝子座の標的領域は、適当なプライマーを用いてPCR増幅することができる。NHEJはエラーが起こりやすいため、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが、二本鎖切断の修復中に起こり得る。変異は、Cel−IのミスマッチアッセイおよびDNA配列決定等のPCRに基づく遺伝子型決定法を用いて検出することができる。

実施例7:マウス胚におけるCas9に基づくゲノム修飾 Rosa26遺伝子座は、上記のセクション(IV)(d)に詳述した通り、ドナーポリヌクレオチドを上記の実施例6に記載のプレアニーリングしたcrRNA/tracrRNAおよび修飾されたCas9タンパク質をコード化するmRNAと共にインジェクションすることによりマウス胚において修飾され得る。生産動物由来のインビトロでインキュベートされた胚または組織(実施例6に記載)を、PCRに基づく遺伝子型決定法、例えばRFLPアッセイ、ジャンクションPCR、およびDNA配列決定等を用いて修飾されたRosa26遺伝子座についてスクリーニングすることができる。

実施例8:ラット胚におけるCas9に基づくゲノム編集 ラットRosa26遺伝子座を、ゲノム修飾の標的とすることができる。表10は、ラット配列の一部を示し、そこで、可能性のある標的部位は太字で示される。各標的部位はプロトスペーサーを含む。

ガイドRNAは、ラットRosa26遺伝子座における標的部位の各々を標的とするように設計された。配列は表11に示されており、各々が42ヌクレオチド長であり、5’領域は表10に示されていない鎖(すなわち、表10に示される鎖に相補的な鎖)に相補的である。

crRNAは、化学的に合成され、tracrRNAにプレアニーリングされた(配列番号13;実施例2参照)。プレアニーリングされたcrRNA/tracrRNAおよび修飾されたCas9タンパク質をコード化するインビトロで転写されたmRNA(配列番号9;実施例1参照)は、受精後ラット胚の前核にマイクロインジェクションされ得る。crRNAによる標的部位へのガイダンスにより、Cas9タンパク質は標的部位を切断し、その結果生じた二本鎖の切断は非相同末端結合(NHEJ)修復過程により修復され得る。挿入された胚を、37℃、5%CO2で一晩または4日間までインキュベートし、その後、遺伝子型解析を行うか、または挿入された胚は、生産動物が遺伝子型解析が可能なように、レシピエント雌ラットに移植することができる。生産動物由来のインビトロでインキュベートされた胚または組織を、標準的方法を用いてRosa遺伝子座においてCas9誘導性変異の存在についてスクリーニングすることができる。例えば、胎仔または生産動物由来の胚または組織を、DNA抽出および分析のために収集することができる。DNAを標準的方法を用いて単離することができる。Rosa26遺伝子座の標的領域は、適当なプライマーを用いてPCR増幅することができる。NHEJはエラーが起こりやすいため、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、またはそれらの組み合わせが、二本鎖切断の修復中に起こり得る。変異は、Cel−IのミスマッチアッセイおよびDNA配列決定等のPCRに基づく遺伝子型決定法を用いて検出することができる。

実施例9:ラット胚におけるCas9に基づくゲノム修飾 Rosa26遺伝子座は、上記のセクション(IV)(d)に詳述した通り、ドナーポリヌクレオチドを上記の実施例8に記載のプレアニーリングしたcrRNA/tracrRNAおよび修飾されたCas9をコード化するmRNAと共にインジェクションすることによりラット胚において修飾され得る。生産ラット由来のインビトロでインキュベートされた胚または組織(実施例8に記載)を、PCRに基づく遺伝子型決定法、例えばRFLPアッセイ、ジャンクションPCR、およびDNA配列決定等を用いて修飾されたRosa26遺伝子座についてスクリーニングすることができる。

QQ群二维码
意见反馈