首页 / 专利库 / 农用建筑及设备 / 挤奶厅 / 挤奶机 / 集乳器 / 細胞系譜の多重定量分析のための組成物及び方法

細胞系譜の多重定量分析のための組成物及び方法

阅读:616发布:2020-05-08

专利汇可以提供細胞系譜の多重定量分析のための組成物及び方法专利检索,专利查询,专利分析的服务。并且同じ個体の複数のクローン細胞集団について集団の大きさを測定するための、例えば、同じ個体内の複数のクローン的に無関係の腫瘍について腫瘍の大きさを測定するための組成物及び方法が提供される。主題の方法は、(a)個体を、遺伝性であり、互いに区別可能である複数の細胞マーカーと 接触 させて、遺伝的に特徴がある細胞の複数の区別可能な系譜を生成することと、(b)遺伝的に特徴がある細胞が少なくとも1回の分裂を受けるために十分な時間が経過した後、接触させた組織に存在する複数の細胞マーカーのうちの少なくとも2つの量を検出及び測定し、それにより、測定した値のセットを生成することと、(c)測定した値のセットを使用して、存在する遺伝的に特徴がある細胞(例えば、遺伝的に特徴がある細胞の区別可能な系譜のうちの少なくとも2つ)の数を計算することとを含み得る。,下面是細胞系譜の多重定量分析のための組成物及び方法专利的具体信息内容。

同じ組織内の複数のクローン細胞集団について集団の大きさを測定するための方法であって、 (a)生体組織を、遺伝性であり、互いに区別可能である複数の細胞マーカーと接触させて、接触させた組織内の遺伝的に特徴がある細胞の複数の区別可能な系譜を生成することと、 (b)前記遺伝的に特徴がある細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後、接触させた組織に存在する前記複数の細胞マーカーのうちの少なくとも2つの量を検出及び測定し、それにより、測定した値のセットを生成することと、 (c)前記測定した値のセットを入として使用して、前記遺伝的に特徴がある細胞の区別可能な系譜のうちの少なくとも2つについての、接触させた組織に存在する遺伝的に特徴がある細胞の数を計算することと を含む、方法。接触させた組織内の前記遺伝的に特徴がある細胞は、新生細胞である、請求項1に記載の方法。前記組織は、ステップ(a)の前に新生細胞及び/または腫瘍を含む、請求項1または請求項2に記載の方法。ステップ(b)の検出及び測定は、前記組織から回収された生体試料で行われる、請求項1〜3のいずれか一項に記載の方法。ステップ(b)の検出及び測定は、接触させた組織の組織試料で行われる、請求項1〜3のいずれか一項に記載の方法。前記複数の細胞マーカーの各細胞マーカーは、遺伝的に特徴がある細胞の系譜の既知の細胞遺伝子型に対応する、請求項1〜5のいずれか一項に記載の方法。前記接触させることは、前記組織の細胞を遺伝的に改変して、遺伝的に特徴がある細胞を生成することを含む、請求項1〜6のいずれか一項に記載の方法。前記同じ組織の複数の腫瘍について腫瘍の大きさを測定する方法である、請求項1〜7のいずれか一項に記載の方法。前記組織を接触させるステップは、新生細胞を誘導することを含む、請求項1〜8のいずれか一項に記載の方法。前記細胞マーカーは、新生細胞形成及び/または腫瘍形成を誘導する薬剤である、請求項1〜9のいずれか一項に記載の方法。検出及び測定は、接触の結果として、接触させた組織内で腫瘍が形成されるために十分な時間が経過した後に行われる、請求項1〜10のいずれか一項に記載の方法。前記複数の細胞マーカーは、バーコード化された核酸を含む、請求項1〜11のいずれか一項に記載の方法。検出及び測定は、各検出されたバーコードについての、ハイスループットシーケンシン グ、及び配列リードの数の定量化を含む、請求項12に記載の方法。前記複数の細胞マーカーは、新生細胞形成を誘導するバーコード化された核酸を含む、請求項1〜13のいずれか一項に記載の方法。前記バーコード化された核酸は、新生細胞形成を誘導し、相同組換え修復(HDR)DNAドナーテンプレート、1つ以上のがん遺伝子をコードする核酸、1つ以上の野生型タンパク質をコードする核酸、1つ以上の変異タンパク質をコードする核酸、1つ以上のCRISPR/CasガイドRNAをコードする核酸、1つ以上の短ヘアピンRNA(shRNA)をコードする核酸、及び1つ以上のゲノム編集タンパク質をコードする核酸のうちの1つ以上を含む、請求項12〜14のいずれか一項に記載の方法。前記ゲノム編集タンパク質は、CRISPR/Cas RNAガイドタンパク質、転写活性化因子または抑制因子ポリペプチドに融合したCRISPR/Cas RNAガイドタンパク質、Cas9タンパク質、転写活性化因子または抑制因子ポリペプチドに融合したCas9タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)、TALEN、ファージ由来インテグラーゼ、Creタンパク質、Flpタンパク質、及びメガヌクレアーゼタンパク質から選択される、請求項15に記載の方法。前記バーコード化された核酸は、線状または環状DNA分子である、請求項12〜16のいずれか一項に記載の方法。前記バーコード化された核酸は、プラスミド、合成核酸断片、及びミニサークルから選択される、請求項12〜16のいずれか一項に記載の方法。前記バーコード化された核酸は、RNA分子である、請求項12〜16のいずれか一0項に記載の方法。前記バーコード化された核酸は、RNA/DNAハイブリッドまたは核酸/タンパク質複合体である、請求項12〜16のいずれか一項に記載の方法。前記組織は、無脊椎動物組織である、請求項1〜19のいずれか一項に記載の方法。前記組織は、脊椎動物組織である、請求項1〜19のいずれか一項に記載の方法。前記組織は、哺乳類または魚の組織である、請求項1〜19のいずれか一項に記載の方法。前記組織は、ラット組織、マウス組織、ブタ組織、非ヒト霊長類組織、またはヒト組織である、請求項1〜19のいずれか一項に記載の方法。前記組織は、生きている動物の一部である、請求項1〜24のいずれか一項に記載の方法。前記組織は、動物の体外で成長した操作された組織である、請求項1〜24のいずれか一項に記載の方法。前記組織は、筋肉、、気管支、膵臓、乳房、肝臓、胆管、胆嚢、腎臓、脾臓、血液、腸、脳、骨、膀胱、前立腺、卵巣、眼、鼻、舌、口、咽頭、喉頭、甲状腺、脂肪、食道、胃、小腸、結腸、直腸、副腎、軟組織、平滑筋、脈管構造、軟骨、リンパ管、前立腺、心 臓、皮膚、網膜、生殖器系、及び性器系から選択される、請求項1〜26のいずれか一項に記載の方法。前記遺伝的に特徴がある細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後、(i)前記遺伝的に特徴がある細胞のバイオマーカーを検出及び/または測定することと、(ii)前記バイオマーカーの検出及び/または測定の結果に基づいて前記遺伝的に特徴がある細胞を分類することと をさらに含む、請求項1〜27のいずれか一項に記載の方法。前記バイオマーカーは、細胞増殖状態、細胞型、発達的細胞系譜、細胞死、及び細胞のシグナル伝達状態のうちの1つ以上のバイオマーカーである、請求項28に記載の方法。前記細胞マーカーは、ウイルスベクターを介して前記組織に送達される、請求項1〜29のいずれか一項に記載の方法。前記ウイルスベクターは、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、及びレトロウイルスベクターから選択される、請求項30に記載の方法。同じ組織の複数のクローン的に無関係な腫瘍について腫瘍の大きさを測定する方法であって、 (a)組織を、複数のバーコード化された核酸細胞マーカーと接触させ、それにより、接触させた組織内の遺伝的に特徴がある新生細胞の複数の区別可能な系譜を生成することと、 (b)前記遺伝的に特徴がある新生細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後、ハイスループット核酸シーケンシングを行って、接触させた組織に存在する前記バーコード化された核酸細胞マーカーのうちの少なくとも2つの量を検出及び測定し、それにより、測定した値のセットを生成することと、 (c)前記測定した値のセットを入力として使用して、前記遺伝的に特徴がある新生細胞の区別可能な系譜のうちの少なくとも2つについての、接触させた組織に存在する遺伝的に特徴がある新生細胞の数を計算することと を含む、方法。前記組織は、ステップ(a)の前に新生細胞及び/または腫瘍を含む、請求項32に記載の方法。ステップ(b)の前記ハイスループット核酸シーケンシングは、前記組織から回収された生体試料で行われる、請求項32または請求項33に記載の方法。ステップ(b)の前記ハイスループット核酸シーケンシングは、前記接触させた組織の組織試料で行われる、請求項32または請求項33に記載の方法。前記複数のバーコード化された核酸細胞マーカーの各バーコード化された核酸細胞マーカーは、遺伝的に特徴がある新生細胞の系譜の既知の細胞遺伝子型に対応する、請求項32〜35のいずれか一項に記載の方法。前記接触させることは、前記組織の細胞を遺伝的に改変して、前記遺伝的に特徴がある新生細胞を生成することを含む、請求項32〜36のいずれか一項に記載の方法。バーコード化された核酸は、新生細胞形成を誘導する、請求項32〜37のいずれか一 項に記載の方法。バーコード化された核酸は、新生細胞形成を誘導し、相同組換え修復(HDR)DNAドナーテンプレート、1つ以上のがん遺伝子をコードする核酸、1つ以上の野生型タンパク質をコードする核酸、1つ以上の変異タンパク質をコードする核酸、CRISPR/CasガイドRNAをコードする核酸、短ヘアピンRNA(shRNA)をコードする核酸、及びゲノム編集タンパク質をコードする核酸のうちの1つ以上を含む、請求項32〜37のいずれか一項に記載の方法。前記ゲノム編集タンパク質は、CRISPR/Cas RNAガイドタンパク質、転写活性化因子または抑制因子ポリペプチドに融合したCRISPR/Cas RNAガイドタンパク質、Cas9タンパク質、転写活性化因子または抑制因子ポリペプチドに融合したCas9タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)、TALEN、ファージ由来インテグラーゼ、Creタンパク質、Flpタンパク質、及びメガヌクレアーゼタンパク質から選択される、請求項39に記載の方法。バーコード化された核酸は、線状または環状DNA分子である、請求項32〜40のいずれか一項に記載の方法。バーコード化された核酸は、プラスミド、合成核酸断片、及びミニサークルから選択される、請求項32〜40のいずれか一項に記載の方法。バーコード化された核酸は、RNA/DNAハイブリッドまたは核酸/タンパク質複合体である、請求項32〜42のいずれか一項に記載の方法。前記組織は、無脊椎動物組織である、請求項32〜43のいずれか一項に記載の方法。前記組織は、脊椎動物組織である、請求項32〜43のいずれか一項に記載の方法。前記組織は、哺乳類または魚の組織である、請求項32〜43のいずれか一項に記載の方法。前記組織は、ラット組織、マウス組織、ブタ組織、非ヒト霊長類組織、またはヒト組織である、請求項32〜43のいずれか一項に記載の方法。前記組織は、生きている動物の一部である、請求項32〜47のいずれか一項に記載の方法。前記組織は、動物の体外で成長した操作された組織である、請求項32〜47のいずれか一項に記載の方法。前記組織は、筋肉、肺、気管支、膵臓、乳房、肝臓、胆管、胆嚢、腎臓、脾臓、血液、腸、脳、骨、膀胱、前立腺、卵巣、眼、鼻、舌、口、咽頭、喉頭、甲状腺、脂肪、食道、胃、小腸、結腸、直腸、副腎、軟組織、平滑筋、脈管構造、軟骨、リンパ管、前立腺、心臓、皮膚、網膜、生殖器系、及び性器系から選択される、請求項32〜49のいずれか一項に記載の方法。前記遺伝的に特徴がある新生細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後、(i)前記遺伝的に特徴がある新生細胞のバイオマーカーを検出及び/または測定することと、(ii)前記バイオマーカーの検出及び/または測 定の結果に基づいて前記遺伝的に特徴がある新生細胞を分類することと をさらに含む、請求項32〜50のいずれか一項に記載の方法。前記バイオマーカーは、細胞増殖状態、細胞型、発達的細胞系譜、細胞死、及び細胞のシグナル伝達状態のうちの1つ以上のバイオマーカーである、請求項51に記載の方法。前記核酸細胞マーカーは、ウイルスベクターを介して前記組織に送達される、請求項32〜52のいずれか一項に記載の方法。前記ウイルスベクターは、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、ボカウイルスベクター、泡沫状ウイルスベクター、及びレトロウイルスベクターから選択される、請求項53に記載の方法。

说明书全文

ゲノムシーケンシングは、全ゲノムレベルでヒトがんの体細胞改変をカタログ化し、多くの潜在的に重要な遺伝子(例えば、推定上の腫瘍抑制遺伝子、推定上のがん遺伝子、治療抵抗性または感受性につながり得る遺伝子)を同定してきた。しかしながら、ゲノム改変の同定は、がんにおけるそれらの機能上の重要性を必ずしも示さず、単独でのまたは他の遺伝子改変(体細胞または生殖系列のいずれか)もしくは微小環境の相違と組み合わせた、遺伝子の不活性化または改変の影響を、がんゲノムシーケンシングデータのみから収集することは依然として困難である。

生物成長に対する遺伝子改変の分子及び細胞の影響は、細胞株におけるノックダウン、ノックアウト、及び過剰発現研究、ならびに遺伝子操作されたマウスモデル系を使用して直接調査されてきた。過去数十年にわたって、培養におけるがん細胞株の遺伝子機能の分析は、がんの多くの態様を明らかにしてきた。

しかしながら、培養におけるがん細胞株の近最適成長、広範な既存の遺伝的及び後成的変化、ならびに自発性微小環境の欠如は、異なる遺伝子がどのようにインビボ表現型(例えば、がん成長、転移、治療応答)を制限または駆動するのかを明らかにするこれらの系の能を制限している。対照的に、ヒトがんの遺伝子操作されたマウスモデルは、それらの天然インビボ環境内での腫瘍の発生及び成長をもたらす、定義された遺伝子改変の正常な成人細胞への導入を容易にする。これは、多くの経路がインビボ腫瘍微小環境の特性により影響を受けるため、特に重要である。

CRISPR/Casに基づく遺伝子標的などのインビボシステムは、インビトロ及びインビボ機能分析の規模を増加させたが、インビボ系は、腫瘍成長の比較的粗雑な測定に依存し続けており、最も劇的な作用を有する遺伝子の分析へのそれらの適用を制限する。インビボで遺伝子機能を分析するための厳密な定量的システムの欠如は、腫瘍成長を駆動もしくは制限するか、または他の重要な発がんの態様(例えば、腫瘍抑制経路)のいずれかに影響を及ぼす経路の幅広い理解を妨げてきた。

複数のクローン細胞集団(例えば、異なる同定可能な腫瘍または腫瘍内の異なる同定可能なサブクローンのいずれかである、複数の区別可能な細胞系譜)を有する個体におけるクローン集団の大きさ(例えば、各腫瘍の大きさ、各腫瘍またはサブクローンにおける新生細胞の数など)の正確な定量化を容易にする組成物及び方法が必要である。本開示の組成物及び方法はこの必要性に対処し、異なる個々の遺伝子(例えば、腫瘍抑制因子、がん遺伝子)または遺伝子改変(例えば、挿入、欠失、点変異)、または遺伝子及び/もしくは遺伝子改変の組み合わせが、細胞集団の成長(例えば、腫瘍成長)、ならびに重要な他の表現型(例えば、腫瘍の進化、進行、転移傾向)に対して異なる全体的な作用を有するかを明らかにする能力を提供する。本開示の組成物及び方法は、同じ組織内(例えば、同じ個体内)の複数の異なるクローン細胞集団(例えば、類似の遺伝子型だが異なる発生事象の複数の腫瘍、異なる遺伝子型を有する複数の腫瘍など)の成長に対する潜在的な治療薬、例えば、放射線、化学療法、絶食、化合物、例えば、薬物、生物製剤などの作用を試験する能力も提供し、これは、試料間のばらつき(例えば、動物間のばらつき)により導入される誤差を劇的に低減し得る。これらの方法は合理的な薬物の組み合わせの開発及び試験も容易にする。

同じ組織内(例えば、同じ個体内)または異なる組織内の複数のクローン細胞集団につ いて集団の大きさを測定するための組成物及び方法が提供される。例として、場合によっては、主題の方法は、同じ組織内(例えば、同じ個体内)の複数のクローン的に無関係な腫瘍細胞集団(例えば、異なる腫瘍)について腫瘍の大きさを測定する方法である。

図示的な例として実施例において以下に記載されるように、発明者らは、細胞のバーコード化(例えば、腫瘍のバーコード化)及びハイスループットシーケンシング(実施例において「Tuba−seq」と称される)とヒトがんの遺伝子操作されたマウスモデルとを組み合わせて、前例がない分解能で腫瘍成長を定量化した。個々の腫瘍の大きさの正確な定量化は、異なる腫瘍抑制遺伝子(例えば、既知の腫瘍抑制遺伝子)の不活性化の影響を明らかにすることを可能にした。さらに、発明者らは、これらの方法を、多重CRISPR/Cas9媒介ゲノム編集と統合し、これは、推定上の腫瘍抑制遺伝子のパネルの不活性化及び機能的定量化を並行して行うことを可能にし、機能性腫瘍抑制因子の同定をもたらした。本方法は、インビボでのがん成長に対する遺伝子改変の影響を研究するための、迅速、多重、かつ高度に定量的なプラットホームである。

以下の実施例にも記載されるように、発明者らは、バーコード化されたHDRドナーテンプレートによる多重体細胞相同組換え修復(HDR)を使用して、個々のマウス内の遺伝的に多様なバーコード化された腫瘍(例えば、定義された遺伝子において遺伝的に多様な点変異を有する腫瘍)を産生し、定量的腫瘍分析(ハイスループットシーケンシングを使用する)を用いて、同じ動物において複数の正確な変異(例えば、定義された点変異)の機能を同時に迅速かつ定量的に調べた。

いくつかの実施形態では、主題の方法は、組織(例えば、筋肉、肺、気管支、膵臓、乳房、肝臓、胆管、胆嚢、腎臓、脾臓、血液、腸、脳、骨、膀胱、前立腺、卵巣、眼、鼻、舌、口、咽頭、喉頭、甲状腺、脂肪、食道、胃、小腸、結腸、直腸、副腎、軟組織、平滑筋、脈管構造、軟骨、リンパ管、前立腺、心臓、皮膚、網膜、ならびに生殖器及び性器系、例えば、精巣、生殖組織など)を、遺伝性であり、互いに区別可能である複数の細胞マーカーと接触させて、接触させた組織内の遺伝的に特徴がある細胞の複数の区別可能な系譜を生成するステップを含む。いくつかの実施形態では、組織を接触させるために使用される細胞マーカーは、バーコード化された核酸(例えば、RNA分子、または環状もしくは線状DNA分子、例えば、プラスミド、天然もしくは合成の一本鎖または二本鎖の核酸断片、及びミニサークル)である。いくつかの実施形態では(例えば、細胞マーカーがバーコード化された核酸である場合)、細胞マーカーは、ウイルスベクター(例えば、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、及びレトロウイルスベクター)を介して組織に送達され得る。場合によっては、接触させられる組織は、細胞マーカーと接触させる前に、既に新生細胞を含む。場合によっては、細胞マーカーは、新生細胞形成及び/または腫瘍形成を誘導し得る。場合によっては、細胞マーカーに連結される構成要素は、新生細胞形成及び/または腫瘍形成を誘導し得る。場合によっては、細胞マーカーは、新生細胞形成及び/または腫瘍形成を誘導し得るバーコード化された核酸(例えば、相同組換え修復(HDR)DNAドナーテンプレート、ゲノム編集タンパク質(複数可)をコードする核酸、がん遺伝子をコードする核酸、タンパク質(複数可)、例えば、野生型及び/または変異タンパク質(複数可)をコードする核酸[例えば、成長/増殖以外の何らかの方法で、例えば、腫瘍に有害なタンパク質をコードする野生型または変異cDNA]、CRISPR/CasガイドRNA、短ヘアピンRNA(shRNA)、他のゲノム編集システムの標的構成要素をコードする核酸など)である。

主題の方法はまた、(遺伝的に特徴がある細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後)、接触させた組織に存在する複数の細胞マーカーのうちの少なくとも2つの量を検出及び測定し、それにより、例えば、特徴がある細 胞と遺伝的に関連する、接触させた組織に残存する細胞マーカーの同一性及び量を表す、測定した値のセットを生成するステップも含み得る。場合によっては、(例えば、細胞マーカーがバーコード化された核酸である場合)、検出及び測定は、各検出されたバーコードについての、ハイスループットシーケンシング、及び配列リードの数の定量化を含む方法を介して行われ得る。

場合によっては、測定した値の生成されたセットを入力として使用して、接触させた組織に存在する遺伝的に特徴がある細胞の数(例えば、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも100個、少なくとも1,000個、少なくとも10,000個、または少なくとも100,000個の遺伝的に特徴がある細胞の検出された区別可能な系譜)(例えば、場合によっては、10〜1,000,000個、10〜100,000個、10〜10,000個、または10〜1,000個の範囲の遺伝的に特徴がある細胞の検出された区別可能な系譜)を計算する(例えば、コンピュータを使用して)。遺伝的に特徴がある細胞の計算された数は、絶対的(例えば、存在すると決定された細胞の実際の数)であり得るか、または相対的(例えば、遺伝的に特徴がある細胞の第1の系譜の集団の大きさは、遺伝的に特徴がある細胞の第2の系譜の集団の大きさに対して、いずれの系譜に存在する細胞の実際の数を必ずしも決定することなく決定され得る)であり得る。

いくつかの実施形態では、主題の方法は、例えば、細胞マーカーを導入した後、例えば、組織の複数の細胞マーカーとの接触を介して新生細胞(またはサブクローン)を誘導するステップの後、試験化合物(例えば、薬物)を組織に投与する(例えば、オルガノイドなどの合成エクスビボ組織の接触を介する個体への投与を介して)ステップを含む。いくつかのそのような場合では、試験化合物を投与するステップの後に、複数の特徴がある細胞の系譜/細胞集団について集団の大きさ(例えば、腫瘍の大きさ、各腫瘍における新生細胞の数)を測定するステップが続く。同じ組織内(例えば、同じ動物内)の異なる区別可能な特徴がある細胞の系譜について複数の細胞集団が測定され得る(例えば、複数の腫瘍の大きさが測定され得る)ため、薬物応答の試料間の変動(例えば、動物間の変動)に起因する誤差のリスクは、排除されないとしても、大幅に低減され得る。

本発明は、以下の詳細な説明を添付の図面とあわせて読むことにより、最もよく理解される。一般的な慣例に従い、図面の様々な特徴が縮尺通りではないことを強調する。反対に、様々な特徴の寸法を、明確化のために場合により拡大または縮小させる。図面には、以下の図が含まれる。

Tuba−seqは、腫瘍バーコード化とハイスループットシーケンシングとを組み合わせて、腫瘍の大きさを並行して定量化することを可能にする。Aは、肺腫瘍の大きさの分布を評価するためのTuba−seqパイプラインの図式を示す。ランダムな15−ヌクレオチドDNAバーコード(BC)を含有するウイルスであるLenti−mBC/Creを用いて、KrasLSL−G12D/+;Rosa26LSL−Tomato(KT)、KT;Lkb1flox/flox(KLT)、及びKT;p53flox/flox(KPT)マウスにおいて腫瘍を発生させた。腫瘍の大きさは、腫瘍保有肺からのDNAのバルクバーコードシーケンシングを介して計算された。Bは、Lenti−mBC/Cre発生腫瘍を有するKT、KLT、及びKPTマウスからの肺葉の蛍光解剖スコープ画像を示す。肺葉は、白色の破線で輪郭が描かれている。Lenti−mBC/Creの力価を示す。全体的な腫瘍成長の相違に左右されずにほぼ等しい総腫瘍負荷を生成するために、異なる遺伝的背景において異なる力価が使用された。上のパネルのスケールバー=5mmであり、下のパネルのスケールバー=1mmである。Cは、KT、KLT、及びKPTマウスの腫瘍の大きさの分布(1群当たりのマウスの数を示す)を示す。各点は腫瘍を表す。各点の面積は、各腫瘍のがん細胞の数に比例する。直径1mmの球状腫瘍のがん細胞のおよその数に相当する点は、参照のためデータの右側に示される。

Tuba−seqは、腫瘍の大きさを定量化するための頑強かつ再現性がある方法である。Aでは、アンプリコンデータのディープシーケンシング用に設計されたノイズ除去アルゴリズムであるDADA2は、偽腫瘍として現れる場合がある繰り返し起こるリードエラーを排除する。既知のバーコードを有する細胞株が各マウスからの各肺試料に添加された(各々5×10

5細胞)。これらの既知のバーコードに由来する繰り返し起こるリードエラーは、約5,000個の細胞で偽腫瘍として現れる。DADA2は、これらの繰り返し起こるリード(シーケンシング)エラーを特定し、大幅に低減する。B、Cでは、個々のバルク肺試料から調製された技術的反復シーケンシングライブラリは、個々の病変の大きさ(B)と大きさのプロファイル(C)との間に高い一致を示す(50〜99.9パーセンタイルの腫瘍が示される)。

Tuba−seqは、腫瘍の大きさを定量化するための頑強かつ再現性がある方法である。Dでは、発明者らの分析パイプラインは、リード深度、DNAバーコードのGC含有量、及びバーコードライブラリの多様性の変動に対して頑強である。腫瘍は、シーケンシング深度、腫瘍バーコードのGC含有量、及び推定された固有のバーコードの数の各技術的パラメータの高、中、及び低レベルに対応して3分の1に分配された(方法を参照されたい)。ウィスカーは、1.5IQRでキャップされた。Eは、5匹のKLTマウスにわたる大きさの分布の再現性を示す。マウスは、マウス間の腫瘍の大きさの相違が小さいにもかかわらず、全体的に類似する大きさのプロファイルを有する。個々のマウスにおいて示されるパーセンタイルの腫瘍の大きさは線でつながれる。Fでは、同じマウス内の腫瘍が比較されるとき、大きさのプロファイルの再現性は向上し、腫瘍の大きさにおける有意なマウス間のばらつきを示唆する。各マウスの腫瘍を2つの群に分配し、これらの群のプロファイルを比較した。個々のマウスにおける示されるパーセンタイルの腫瘍の大きさは線でつながれる。Gは、定義されたパーセンタイルの腫瘍の大きさ間の総最小二乗距離に基づいたKT、KPT、及びKLTマウスの教師なし階層的クラスター化(ウォード分散最小アルゴリズムによりクラスター化された)を示す。遺伝子型によるマウスのクラスターにより、Tuba−seqは各遺伝子型の大きさスペクトルにおける再現性がある相違が特定されることを示唆する。

腫瘍の大きさを大規模に並行して定量化することにより、複数の遺伝子型にわたる確率分布適合を可能にする。A、Bは、KLT(n=5)マウス(A)及びKPT(n=3)マウス(B)における示されるパーセンタイルの腫瘍の大きさ対KTマウス(n=7)における示されるパーセンタイルの腫瘍の大きさを示す。各パーセンタイルは、Lenti−mBC/Creを用いて腫瘍発生させた11週間後に各遺伝子型の全マウスからの全ての腫瘍を使用して計算された。Cは、同じパーセンタイルのKT腫瘍に対する各遺伝子型の示されるパーセンタイルの腫瘍の大きさを示す。エラーバーは、ブートストラップを介して得られた95%信頼区間である。対応するKTパーセンタイルとは大幅に異なるパーセンタイルには色が付けられている。

腫瘍の大きさを大規模に並行して定量化することにより、複数の遺伝子型にわたる確率分布適合を可能にする。Dでは、正規分布した成長速度の指数関数的な腫瘍成長に関して予想されるように、腫瘍の大きさの分布は対数正規分布により最もぴったりと適合した。KLTマウスの腫瘍は、それらの大きさスペクトル(中央)全体を通して対数正規分布により最も良く説明される。KTマウス(左)及びKPTマウス(右)の腫瘍の大きさの分布は、より小さいスケールの対数正規分布とより大きいスケールのべき乗則分布との組み合わせによってより良く説明された。これらの相違は、個々の遺伝子(または遺伝子の組み合わせ)がどのように腫瘍成長の増加をもたらすかを考える際に基本的に重要である。べき乗則の関係は、対数−対数軸上で直線的に下に傾き、KTマウスの腫瘍の上位約1%以内の稀であるが非常に大きな腫瘍、及びKPTマウスの約10%の腫瘍と一致する。注記:KPTマウスの腫瘍のみが11週間後に100万個の細胞を常に超え、p53欠損と一致し、発明者らの研究において最も大きな腫瘍の生成を可能にする。

Tuba−seq及び多重CRISPR/Cas9媒介遺伝子の不活性化を使用した、腫瘍抑制因子表現型の迅速な定量化を示す。Aは、各sgRNAに連結した8ヌクレオチド「sgID」配列を有する2構成要素バーコード、ならびにランダムな15ヌクレオチドランダムバーコード(BC)を含有するLenti−sgTS−Pool/Creベクターの図式を示す。Bでは、Lenti−sgTS−Pool/Creは、不活性sgRNAを有する4つのベクターと、既知及び候補腫瘍抑制遺伝子を標的とする11のベクターとを含有する。各sgRNAベクターは、固有のsgID及びランダムなバーコードを含有する。NT=非標的である。Cは、インビボでの肺腫成長に対する各標的遺伝子の機能を評価するための、Tuba−seqと結合された多重CRISPR/Cas9媒介腫瘍抑制因子不活性化の図式を示す。Lenti−sgTS−Pool/Creウイルスを用いて、KT及びKT;H11

LSL−Cas9(KT;Cas9)マウスにおいて腫瘍を発生させた。

Tuba−seq及び多重CRISPR/Cas9媒介遺伝子の不活性化を使用した、腫瘍抑制因子表現型の迅速な定量化を示す。Dは、Lenti−sgTS−Pool/Creを用いて腫瘍を発生させた12週間後のKT及びKT;Cas9マウスからの肺葉の明視野(上)及び蛍光解剖スコープ画像(下)を示す。肺葉は、蛍光画像において白色の破線で輪郭が描かれている。ウイルス力価を示す。スケールバー=5mmである。Eでは、組織診断は、KTマウスが過形成及び小さい腫瘍を有し、一方、KT;Cas9マウスがはるかにより大きい腫瘍を有することを確認する。ウイルス力価を示す。上のスケールバー=3mmであり、下のスケールバー=500μmである。

Tuba−seqは、前例がない分解能で既知及び新規の腫瘍抑制因子を明らかにする。Aでは、Lenti−sgTS−Pool/Creを用いて腫瘍を発生させた12週間後のKT;Cas9マウスの相対的な腫瘍の大きさの分析は、6つの腫瘍成長抑制遺伝子を同定した。示されるパーセンタイルの腫瘍の相対的な大きさは、8匹のマウスからの統合データを表し、sgInert腫瘍の平均の大きさに対して正規化される。95%信頼区間を示す。sgInertよりも有意に大きいパーセンタイルは色が付けられている。Bでは、対数正規の腫瘍の大きさの分布を仮定する平均腫瘍の大きさの推定により、KT;Cas9マウスにおいて成長を大幅に増加させるsgRNAを同定した。ボンフェローニ補正ブートストラップp値を示す。p値<0.05及びそれらの対応する平均は太字である。Cは、腫瘍発生の12週間後のKT及びKT;Cas9マウス、ならびに腫瘍発生の15週間後のKT;Cas9マウスにおける、各sgRNAを有する腫瘍の95パーセンタイルの腫瘍(左)、対数正規(LN)平均(中央)、及び対数正規(LN)p値(右)の相対的大きさを示す。

Tuba−seqは、前例がない分解能で既知及び新規の腫瘍抑制因子を明らかにする。Dでは、KTマウスに対するKT;Cas9マウスの全体的なsgID表示の倍率変化(ΔsgID表示)は、表示が増加するいくつかのsgRNAを同定し、標的腫瘍抑制遺伝子の不活性化による腫瘍の成長の増加と一致した。ΔsgID表示は、KT;Cas9マウス対KTマウスにおける各sgIDを有するリードのパーセントでの倍率変化であり、sgInertのΔsgID表示=1であるように正規化される。平均及び95%信頼区間を示す。E、Fでは、腫瘍抑制作用を検出する能力は、sgRNA表示のみの組み込みと比較して、バーコードシーケンシングからの個々の腫瘍の大きさを組み込むことにより劇的に向上する。現在の全てのアプローチはsgRNA表示に依存し、これはTuba−seqよりもはるかに劣る。95パーセンタイル腫瘍の相対的大きさ及びTuba−seqにより決定された対数正規の統計的有意性は、ΔsgID表示における平均倍率変化及びそれらの関連するp値よりも多い遺伝子を腫瘍抑制因子として同定した。Eのエラーバーは、95%信頼区間である。Fの点線は、0.05有意閾値を示す。点の色は、図4BのsgRNAの色に対応する。

独立した方法は、肺腫瘍成長の強力な抑制因子としてSetd2を同定した。Aでは、標的遺伝子座にインデルを含有するリードのパーセントは、3つの独立したネオマイシン遺伝子座にインデルを含有するリードの平均パーセントに対して正規化された。この値は、3匹の個々のマウスについての各sgRNAの95パーセンタイルの腫瘍の大きさに対してプロットされる。的確なsgRNA切断の選択と一致する、Setd2、Lkb1、及びRb1における高頻度のインデルを示す。各点は、1匹のマウスからのsgRNAを表す。sgNeoの点は黒色であり、他の全ての点は図4Bに従い着色される。Bでは、腫瘍発生の9週間後に分析した、Lenti−sgSetd2#1/Cre、Lenti−sgSetd2#2/Cre、またはLenti−sgNeo2/Creに感染させた(形質導入した)KT;Cas9マウスからの肺葉の蛍光解剖スコープ画像及びH&E。肺葉は、蛍光解剖スコープ画像において白色の破線で輪郭が描かれている。上のスケールバー=5mmであり、下のスケールバー=2mmである。Cでは、組織診断による腫瘍面積パーセントの定量化は、Lenti−sgSetd2#1/CreまたはLenti−sgSetd2#2/Creに感染させた(形質導入した)KTマウスと比較して、同じウイルスに感染させた(形質導入した)KT;Cas9マウスにおける腫瘍負荷において大幅な増加を示す。各点はマウスを表し、バーは平均である。*p値<0.05であり、NS=有意ではない。Dは、Lenti−sgSetd2#1/Cre発生腫瘍対Lenti−sgNeo2/Cre発生腫瘍を有するKT;Cas9マウスからの示されるパーセンタイルの腫瘍の大きさ(N=4匹のマウス/群)を示す。パーセンタイルは、各群の全てのマウスからの全ての腫瘍を使用して計算された。

ヒト肺腺癌におけるゲノム改変の頻度ならびに腫瘍発生及びバーコード化の説明を示す。Aでは、各腫瘍抑制遺伝子において潜在的な不活性化改変(フレームシフトもしくは非同議変異、またはゲノム喪失)を有する腫瘍のパーセントは、全ての腫瘍(All)に関して、ならびに発がん性KRAS変異を有する腫瘍(KRAS

mut)において示される。各データセットにおいてKRASに発がん性変異を有する腫瘍の数及びパーセントが示される。Bでは、バーコード化されたレンチウイルス−Creベクターの吸入は、遺伝子操作されたマウスモデルの肺腫瘍を発生させる。重要なことには、レンチウイルスベクターは、形質導入細胞のゲノムに安定して組み込まれる。各固有にバーコード化された細胞の相対的拡大は、ハイスループットシーケンシングに基づいた方法により決定され得る。Cは、1.7×10

4Lenti−Creウイルスに感染させた(形質導入した)Kras

LSL−G12D/+;R26

LSL−Tomato(KT)マウスからの肺組織切片のヘモトキシリン及びエオジン(H&E)染色を示す。これらのマウスは、新生細胞の小さな拡大、ならびにより大きな腺腫を発達させる。スケールバー=50μmである。

インビボで腫瘍の大きさを定量化するためのTuba−seqパイプラインを示す。Aでは、組み込まれたレンチウイルスベクターのDNAバーコード領域のIllumina(登録商標)シーケンシングは、病変の大きさの正確な測定を可能にする。最初に、不十分なPhred品質スコアまたは予想外の配列を有するリードを廃棄した。次に、リードを固有のバーコードを有する群にまとめた。繰り返し起こるIllumina(登録商標)シーケンシングエラーは、初めは完全なリード長ディープシーケンシングアンプリコンを同定するために設計されたIllumina(登録商標)シーケンシングエラーのモデルであるDADA2を使用して小さい病変から明らかにされた。このクラスター化アルゴリズムにより、大きい腫瘍の増幅されたバーコード領域からの繰り返し起こるシーケンシングエラーであると見なされる小さいバーコードのパイルアップを、これらのより大きいパイルアップと組み合わせた。リードのパイルアップは、ベンチマーク対照を使用して絶対細胞数に変換された。最後に、パイプラインの再現性を最大にするために、シーケンシング情報と絶対細胞数との両方を使用して、病変を呼び出すための最小カットオフを確立した。Bでは、固有のリードのパイルアップは、固有の病変と対応せず、むしろ非常に大きい腫瘍(例えば、はるかにより大きい腫瘍)からのバーコードの繰り返し起こるシーケンシングエラーから生じる場合がある。DADA2を使用して、小さいリードのパイルアップを、十分な大きさ及び配列類似性のより大きい病変と統合した。アルゴリズムは、発明者らのディープシーケンシング領域(すなわち、バーコードに隣接するレンチウイルスベクターの領域)の非縮重領域からシーケンシングエラー率を計算する。

インビボで腫瘍の大きさを定量化するためのTuba−seqパイプラインを示す。Cでは、全ての転位及び転換(A〜Cに示される)の尤度は、各実行に特異的なエラーモデルを生成するために、全てのIllumina(登録商標)Phredスコアについて計算された。公表されたPhredエラー率(赤)は一般的に、観察されたものよりも低い(黒;正則化のために使用されたLOESS回帰)。次に、これらのエラーモデル(各Illumina(登録商標)装置に対して訓練された)を使用して、より小さいリードのパイルアップを、強い配列類似性を有するより大きいパイルアップに束ねられる(より小さいパイルアップが繰り返し起こるリードエラーであることを示唆する)べきか、または別の病変として残すかを決定した。D〜Fでは、発明者らの最初の実験試料(図1のKT、KLT、及びKPT)を3つの異なるIllumina(登録商標)装置でシーケンシングして、入念に調べ、DADA2をパラメータ化した。妥当な病変呼び出しプロトコルは、(D)呼び出した病変の数において強い類似性、(E)バーコードの大きさ間で良好な相関関係、及び(F)3回の実行にわたって各sgIDプールの類似する平均の大きさを示すと予想された。3回の実行は、シーケンシング深度が必然的に異なり(前処理後、40.1×10

6、22.2×10

6、及び34.9×10

6リード)、塩当たりのそれらの予想されるエラー率が必然的に異なり(0.85%、0.95%、及び0.25%)、本方法の一致を入念に調べるために有用な技術的摂動を提供する。病変の大きさを500個の細胞で切り詰め、DADA2クラスター化の確率(オメガ)を10−10(赤色の四)で切り詰めることにより、非常に小さいスケールで病変の大きさのプロファイルを提供し、一方で、発明者らの試験測定基準でのばらつきを尚も最小にすることを発明者らは発見した。

ベンチマーク対照は、各肺試料内の各腫瘍のがん細胞の数を計算することを可能にする。Aは、既知のバーコードを有する3つのベンチマーク対照細胞株を使用したプロトコルの図式を示す。各細胞株の5×10

5細胞を各肺試料に添加した。次いで、DNAを肺と3つ全てのベンチマーク対照とから抽出し、バーコードをPCR増幅し、ディープシーケンシングを行った。次いで、ベンチマークに関連するリード%を各腫瘍から観察されたリード%(固有のバーコード)で除し、5×10

5を乗ずることにより、その肺試料内の各腫瘍のがん細胞の数を計算して、がん細胞数を得た。Bは、非常に異なる腫瘍負荷を有する2つの肺の例を示す。全体的な腫瘍負荷にかかわらず、これらのベンチマーク細胞株を使用して、個々の腫瘍内のがん細胞の数を決定することができる。周囲の「正常な肺」組織は、この組織がレンチウイルスの組み込みがなく、したがってリードに貢献しないため、この計算に影響がないことにも留意されたい。ベンチマーク対照(例えば、5×10

5、5×10

4、5×10

3、5×10

2、または50個の細胞)の滴定の生成は、拡張されるTuba−seqの分解能をより小さいクローンに拡大することを容易にする。

DADA2に基づく腫瘍呼び出しパイプラインは頑強かつ再現可能である。Aでは、腫瘍の大きさは、わずかなGCの偏りを示した。残存腫瘍の大きさのばらつきは、全てのマウスの各sgRNAの平均の大きさにより、大きさの対数変換及び各腫瘍の正規化により最小限に抑えられた。中間GC含有量のバーコードは、最も効率的にPCR増幅されるように見える。残りの偏りへの4次多項式適合は、病変の大きさを最も効率的に補正した。この補正は、計算され、全ての後続の分析に適用され、これは、各病変の大きさを平均5%調整し、各マウスにおける各sgIDの病変の大きさの標準偏差を平均に対して2.9%しか低減せず、測定可能であるが、GCの偏りによってもたらされたばらつきが最小であったことを示唆する。Bでは、ランダムなバーコードは、意図するヌクレオチドにわたって高度のランダム性を示す。Cは、Tuba−seqを使用した、マウス当たりの呼び出された病変の数を示す。2つの異なる細胞数カットオフ(1000及び500)を上回る腫瘍の数は、マウス当たりの腫瘍の平均数±標準偏差として示される。KTマウスは、高力価(6.8×10

5)(本文で使用された)及び低力価(1.7×10

5;KT

low)に曝された。いずれかのカットオフで、カプシド当たりで観察された腫瘍の数に統計的に有意な相違はなく、バーコードの多様性が50万個を上回る腫瘍に尚も限定されず、小さい腫瘍が腫瘍密集により生じないことを示唆する。Dは、定義されたパーセンタイルの腫瘍の大きさ間の総最小二乗距離に基づいたKT、KT

low、KPT、及びKLTマウスの教師なし階層的クラスター化(ウォード増分アルゴリズムにより決定された連結)を示す。同じ遺伝子型であるが、異なるウイルス力価のマウスを一緒にクラスター化し、これは、大きさのプロファイルの相違がウイルス力価の相違ではなく、主に腫瘍遺伝学(遺伝子型)によって決定されることを示唆する。

DADA2に基づく腫瘍呼び出しパイプラインは頑強かつ再現可能である。E、Fでは、病変の大きさは、リード深度の相違によって劇的に影響を受けない。個々のマウスの腫瘍保有肺からのバーコード領域は、非常に高深度でシーケンシングされ、次いで、典型的なリード深度にランダムにダウンサンプリングされた。Eでは、完全(x軸)及びダウンサンプリング(y軸)データセットの腫瘍の大きさの分布は、非常に類似しており、発明者らの分析パラメータがリード深度により偏らず、かなり頑強であることを示す。Fでは、パーセンタイル計算もダウンサンプリングしたときに再現性がある。Gでは、Lenti−mBC/Cre発生腫瘍を有するKT、KLT、及びKPTマウス(図1から)は、6つの固有のLenti−sgID−BC/Creウイルス(各々固有のsgID及び必然的に異なるバーコード多様性を有する)を有する腫瘍を保有する。これは、発明者らに、各マウス内に6つの反復を有するDADA2呼び出し腫瘍の大きさにおける変動を定量化することを可能にした。腫瘍の大きさの分布は、各マウスからの全ての腫瘍を使用するとき、及び所与のsgIDを有する腫瘍の各サブセットを使用するとき、再現性よく呼び出される。示されるパーセンタイルの腫瘍の大きさは、KT(左)、KLT(中央)、及びKPT(右)についてプロットされる。各点は、単一のsgID内の腫瘍を使用して計算されたパーセンタイルの値を表す。パーセンタイルは、灰色のスケールで表される。異なるsgIDを有する腫瘍の大きさの6つの反復パーセンタイル値は、それらの強い相関が各sgIDのマーカーが非常に重複していることを意味するため、区別することが難しい。

H11

LSL−Cas9対立遺伝子を有するマウスにおいてレンチウイルス−sgRNA/Creベクターで発生させた肺腫瘍の効率的なゲノム編集を示す。Aは、Lenti−sgTomato/Cre(Lenti−sgTom/Cre)ウイルスベクター及びH11

LSL−Cas9対立遺伝子を使用して、肺癌モデルにおいて体細胞ゲノム編集を試験するための実験の図式を示す。ホモ接合体欠失の頻度を決定するために、全てのマウスは、R26

LSL−Tomato対立遺伝子に関してホモ接合であった。Bは、Lenti−sgTomato/Cre発生腫瘍を有するKPT;Cas9マウスからの肺葉の蛍光解剖スコープ画像を示す。Tomato陰性腫瘍は、破線で輪郭が描かれている。上のスケールバー=5mmであり、下のスケールバー=1mmである。Cでは、Tomatoタンパク質の免疫組織化学は、Tomato陽性(Pos)、Tomato混合(Mixed)、及びTomato陰性(Neg)腫瘍を明らかにした。腫瘍は、破線で輪郭が描かれている。スケールバー=200μmである。Dでは、Lenti−sgTom/Cre発生腫瘍を有する4匹のKPT;Cas9マウスにおけるTomato発現の定量化は、腫瘍のおよそ半分が少なくともわずかながん細胞において標的遺伝子のCRISPR/Cas9媒介ホモ接合体不活性化を有することを示す。Tomato陽性、混合、及び陰性腫瘍のパーセントは、括弧で示される各群の腫瘍の数とともに示される。Eは、Lenti−sgLkb1/Creウイルス及びH11

LSL−Cas9対立遺伝子を使用して、肺において体細胞ゲノム編集を試験するための実験の図式を示す。Fでは、Lenti−sgLkb1/Creに感染させた(形質導入した)KT及びKT;Cas9マウスの肺葉の蛍光解剖スコープ画像は、KT;Cas9マウスにおける腫瘍負荷の増加を示す。肺葉は、白色の破線で輪郭が描かれている。スケールバー=2mmである。Gでは、肺の重量により表される腫瘍負荷は、KTマウスに対してLenti−sgLkb1/Cre感染(形質導入)KT;Cas9マウスにおいて増加し、腫瘍抑制因子Lkb1の良好な欠失と一致する。正常な肺の重量は、赤色の点線で示される。*p値<0.02である。各点はマウスであり、バーは平均を表す。Hでは、ウエスタンブロットは、KT;Cas9マウスのLenti−sgLkb1/Cre発生腫瘍がCas9を発現し、Lkb1タンパク質を欠くことを示す。Hsp90は、負荷を示す。

11個の既知及び候補腫瘍抑制遺伝子を標的とするsgRNAの選択及び特徴付けを示す。Aでは、sgRNAは、各遺伝子内のそれらの位置、スプライスアクセプター/スプライスドナー(SA/SD)領域に対するそれらの近接、それらは注釈が付けられた機能ドメインの上流(またはその内)であったか否か、それらは記述されるヒト変異の上流(またはそれに隣接する)であったか否か、ならびにそれらの予測された的確な切断効率スコア(最大スコアは1.0である;高いスコア=より大きい活性)及び標的外切断スコア(最大スコアは100.0である;高いスコア=大きい特異性)に基づいて選択された(Doench et al.,Nature Biotechnology,2014;Hsu et al.,2013)。

11個の既知及び候補腫瘍抑制遺伝子を標的とするsgRNAの選択及び特徴付けを示す。Bは、これらの腫瘍抑制遺伝子がKras

G12D駆動肺癌モデルの状況において不活性化された公開研究からのデータの要約を示す。Cでは、各ベクターは固有のsgIDを有し、ランダムなバーコードで多様化された。ベクターの各々のsgID、及び各sgRNAに関連するバーコードの推定数が示される。Dは、Lenti−sgTS−Pool/Cre内の各sgRNAの初期表示を評価するための実験の図式を示す。Eは、3回の反復感染からの試料のシーケンシングにより決定されたときのLenti−sgTS−Pool/Cre内の各sgRNAのパーセントを示す。平均+/−SDを示す。プール内の各ベクターのパーセントは、各ベクターの予想された表示からわずかに外れた(赤色の破線)。

インビトロsgRNA切断効率を示す。Aは、Cas9細胞を各々個々のsgRNAを有するレンチウイルスに感染させることにより、各sgRNAのインビトロ切断効率を評価するための実験の図式を示す。発明者らは各標的遺伝子座の3つの個々のsgRNAを試験し、最良のsgRNAの切断効率を報告する。Bは、各標的腫瘍抑制因子の最良のsgRNAの切断効率を示す。切断効率は、サンガーシーケンシング及びTIDE分析ソフトウェアにより評価された(Brinkman et al.,Nucl.Acids Res.,2014)。Cは、Cas9細胞をLenti−sgTS−Pool/Creに感染させることにより、各sgRNAのインビトロ切断効率を評価するための実験の図式を示す。感染(形質導入)の48時間後に細胞を採取し、ゲノムDNAを抽出し、14個の標的領域をPCR増幅し、産物をシーケンシングした。各領域のインデルの%を計算し、プールにおける表示及びSetd2インデル%の両方に対して正規化し、相対切断効率をプール内の各sgRNAについて決定した。Dでは、各sgRNAの相対切断効率は、不活性Neo標的対照を示す。

Tuba−seqを使用した複数の時間点での腫瘍抑制因子の同定及び検証を示す。Aは、腫瘍発生の12週間後のKTマウスにおける各Lenti−sgRNA/Creベクターのパーセント表示(各sgID/全てのsgIDリードを用いたリード数の100倍として計算された)を示す。KTマウスにおいてCas9媒介遺伝子不活性化はないため、これらのマウスにおける各sgIDのパーセントは、Lenti−sgTS−Pool/Creプール内に各sgRNAを有するウイルスベクターのパーセントを表す。Bでは、Lenti−sgTS−Pool/Creを用いて腫瘍を発生させた12週間後のKTマウス(Cas9を欠く)における相対的な腫瘍の大きさの分析は、基本的に、均一な腫瘍の大きさの分布を特定した。示されるパーセンタイルの相対的な腫瘍の大きさは、10匹のマウスからの統合データを表し、sgInert腫瘍の平均に対して正規化される。95%信頼区間を示す。sgInertとは有意に異なるパーセンタイルは色が付けられている。Cでは、対数正規の腫瘍の大きさの分布を仮定する平均腫瘍の大きさの推定は、KTマウスにおける予想されたわずかなばらつきを示した。ボンフェローニ補正ブートストラップp値を示す。p値<0.05及びそれらの対応する平均は太字である。

Tuba−seqを使用した複数の時間点での腫瘍抑制因子の同定及び検証を示す。Dは、腫瘍発生の12週間後のKT;Cas9マウスにおける各Lenti−sgRNA/Creベクターのパーセント表示(各sgID/全てのsgIDリードを用いたリード数の100倍として計算された)を示す。Eは、同じパーセンタイルのsgInert含有腫瘍の平均に対する各sgRNAの示されるパーセンタイルの腫瘍の大きさを示す。Lenti−sgTS−Pool/Creで腫瘍を発生させた15週間後の3匹のKT;Cas9マウスからの統合データを示す。点線は、Inertから変化がないことを表す。エラーバーは、95%信頼区間を表す。信頼区間が点線と重複しないパーセンタイルは色が付けられている。Fでは、対数正規を仮定する平均腫瘍の大きさの推定は、KT;Cas9マウスにおいて有意な成長利点を有するsgRNAを同定した。ボンフェローニ補正ブートストラップp値を示す。p値<0.05及びそれらの対応する平均推定は太字である。

2つの独立した時間点でLenti−sgTS/Cre発生腫瘍を有するKT;Cas9マウスにおけるp53媒介腫瘍抑制の同定を示す。A、Bでは、Lenti−sgTS−Pool/Creで腫瘍を発生させた12週間後(a)及び15週間後(b)のKT;Cas9マウスにおける相対的な腫瘍の大きさの分析は、両時間点でべき乗則統計を使用して、p53を腫瘍抑制因子として同定する。示されるパーセンタイルの相対的な腫瘍の大きさは、それぞれ、8匹及び3匹のマウスからの統合データであり、sgInert腫瘍の平均に対して正規化される。95%信頼区間を示す。sgInertよりも有意に大きいパーセンタイルは色が付けられている。べき乗則p値を示す。この実験環境では、非常に最大のsgp53発生腫瘍のみがsgInert腫瘍よりも大きさが大きいことに留意する。これは一部、sgp53の比較的切断効率が悪いことにより説明される可能性がある(図13D)。

2つの独立した時間点でLenti−sgTS/Cre発生腫瘍を有するKT;Cas9マウスにおけるp53媒介腫瘍抑制の同定を示す。C〜Fでは、p53遺伝子座の各大きさのインデル(10のヌクレオチド欠失(−10)〜3つのヌクレオチド挿入(+3))のパーセントは、所与の大きさのインデルを有するリード数をインデルを有するリードの総数で除することにより計算された。インフレームインデルは灰色で示される。発明者らは、Lenti−sgTS−Pool/Creに感染させた(形質導入した)Cas9発現細胞株において、感染(形質導入)の48時間後に、インビトロで生成されたp53遺伝子座のインデルのスペクトルを評価した。(C)フレーム外変異に対する優先度はない。次いで、発明者らは、Lenti−sgTS−Pool/Cre発生腫瘍を有する3匹の個々のKT;Cas9マウスを、疾患進行の15週間後に分析した(D〜F)。インフレームインデルがより少なく(−9、−6、−3、及び+3)、拡張する腫瘍におけるフレーム外機能喪失改変の選択と一致し、p53の腫瘍抑制機能と一致する。Tuba−seqの知見と一致するが、これらの種類の分析は、Tuba−seqプラットホームと比べて不正確である。

腫瘍の大きさの分布の分析は、Lkb1及びSetd2欠損が対数正規であることを示す。A、Bは、sgLkb1(a)またはsgSetd2(b)の示されるパーセンタイル(%ile)の腫瘍の大きさ対同じパーセンタイルのsgInert発生腫瘍の大きさを示す。各パーセンタイルは、腫瘍発生の12週間後に分析した、Lenti−sgTS−Pool/Cre発生腫瘍を有する全てのKT;Cas9マウスからの各sgRNAを有する全ての腫瘍を使用して計算された(N=8匹のマウス)。sgInert発生腫瘍に対する大きさは、破線で示される。Cでは、Lenti−sgTS−Pool/Cre発生腫瘍を有するKT;Cas9マウスにおける、Lenti−sgSetd2/Creで発生させた腫瘍の確率密度プロットは、KLTマウスにおいて見られたものと非常に類似する対数正規的に分布された腫瘍の大きさを示す。これは、Setd2欠損が追加の有利な改変の生成またはそれに対する耐性を有意に増加させることなく腫瘍成長を駆動することを示す。

的確なsgRNA作用の確認を示す。A、Bでは、各インデル(10のヌクレオチド欠失(−10)〜4つのヌクレオチド挿入(+4))のパーセントは、所与の大きさのインデルを有するリード数を、各上位の腫瘍抑制遺伝子内にインデルを有するリードの総数で除することにより計算された。(A)Lenti−sgTS−Pool/Cre発生腫瘍を有する3匹のKT;Cas9マウスの平均パーセンテージ及び標準偏差は、Setd2、Lkb1、Rb1、及びNeoの3つの標的部位(Neo1〜3)の平均に関して示される。インフレーム変異は灰色で示される。Neo1〜3の平均及び標準偏差は、単一群として3匹全てのマウス及び3つ全てのNeo標的部位を平均することにより計算された。一般に、インフレームインデルがより少なく(−9、−6、−3、及び+3)、拡張する腫瘍におけるこれらの遺伝子のフレーム外機能喪失改変の選択と一致する。(B)発明者らは、Lenti−sgTS−Pool/Creで感染させた(形質導入した)Cas9発現細胞株において、感染(形質導入)48時間後に、インビトロで生成したインデルのスペクトルも評価した。これらのゲノム位置のいずれかにおいて、インフレーム変異の優先度は検出されず、KT;Cas9マウスにおける偏りがフレーム外インデル(すなわち、ヌル対立遺伝子)を有する腫瘍の有利な拡大に起因する可能性が最も高いことを示唆する。Cは、Lenti−sgSmad4/Cre誘導腫瘍を有するKT及びKT;Cas9マウスのカプラン−マイヤー生存曲線を示す。発がん性Kras

G12Dの存在下でのSmad4のCRISPR/Cas9媒介不活性化は生存率を低減せず、存在する場合、Smad4の不活性化から腫瘍成長の増加が限られることを示唆する。Dでは、Lenti−sgSmad4/Cre感染(形質導入)KT;Cas9マウスの腫瘍の大半は、同じウイルスで感染させた(形質導入した)KTマウスと比較して、Smad4タンパク質発現を失い、Smad4遺伝子座でのインデル創出と一致する。スケールバー=50μmである。Eでは、Lenti−sgTS−Pool/Cre感染(形質導入)KT;Cas9マウスのいくつかの腫瘍は、均一に大きい核の異なる乳頭組織構造を有し、Sox9陽性であり、Apc欠損Kras駆動肺腫瘍の公開された表現型と一致した(Sanchez−Rivera et al.,Nature,2014)。代表的なSox9−陰性及びSox9陽性腫瘍を示す。スケールバー=100μm(上)及び25μm(下)である。

2つの独立したsgRNAの各々を使用して、Setd2のCRISPR/Cas9媒介不活性化を有するマウスの腫瘍負荷の増加を示すさらなる画像である。腫瘍を発生させた9週間後に分析した、Lenti−sgNeo2/Cre(左)、Lenti−sgSetd2#1/Cre(中央)、またはLenti−sgSetd2#2/Cre(右)で発生させた腫瘍を有するKT;Cas9マウスからの肺葉のさらなる代表的な蛍光解剖スコープ画像を示す。肺葉は、白色の破線で輪郭が描かれている。スケールバー=5mmである。

肺腺癌マウスモデルにおける腫瘍抑制遺伝子機能を評価するための系の比較を示す。腫瘍抑制遺伝子不活性化の方法(フロキシング対立遺伝子のCre/LoxP媒介欠失対CRISPR/Cas9媒介ゲノム編集)、個々の腫瘍の遺伝子バーコード化により腫瘍の数及び大きさを定量化する能力、ならびにプールされた形式で複数の遺伝子を不活性化する能力が示される。各系の特に関連がある利点及び欠点、ならびに参考例が示される。膵癌を研究するためにプールしたsgRNAトランスフェクションを使用したMareschらを除いて、強調される研究は全て、肺癌においてである。フロキシング対立遺伝子を使用して肺腺癌モデルにおける腫瘍抑制遺伝子を評価するという現実は、過去15年間にわたって発明者らが疑問を抱いた腫瘍抑制遺伝子のうちの6つのみがKras

LSL−G12Dと組み合わせてフロキシング対立遺伝子を使用して調査されたという事実により最もよく例示される。定量方法の欠如は、既知及び未知の技術的及び生物学的変数(例えば、腫瘍発生の再現性、マウスの性別、年齢、及び系統)に起因して、中程度しかない腫瘍抑制作用を有する遺伝子の同定も著しく妨げる。フロキシング対立遺伝子を有する遺伝子を削除することにより生成されたデータも、異なる研究室で使用される異なる実験環境(例えば、異なるウイルス力価、発生後の時間、定量化の方法、マウス系統)間で比較することが困難であるため制限される。したがって、異なる腫瘍抑制遺伝子の相対的作用は、文献から収集することが困難である。最後に、腫瘍のバーコード化による個々の腫瘍細胞数の定量化は、前例がない精度を提供するだけでなく、腫瘍抑制の異なる機能機序を反映する可能性がある腫瘍の大きさの分布に対する遺伝子特異的作用も明らかにする。

肺腺癌マウスモデルにおける腫瘍抑制遺伝子機能を評価するための系の比較を示す。腫瘍抑制遺伝子不活性化の方法(フロキシング対立遺伝子のCre/LoxP媒介欠失対CRISPR/Cas9媒介ゲノム編集)、個々の腫瘍の遺伝子バーコード化により腫瘍の数及び大きさを定量化する能力、ならびにプールされた形式で複数の遺伝子を不活性化する能力が示される。各系の特に関連がある利点及び欠点、ならびに参考例が示される。膵癌を研究するためにプールしたsgRNAトランスフェクションを使用したMareschらを除いて、強調される研究は全て、肺癌においてである。フロキシング対立遺伝子を使用して肺腺癌モデルにおける腫瘍抑制遺伝子を評価するという現実は、過去15年間にわたって発明者らが疑問を抱いた腫瘍抑制遺伝子のうちの6つのみがKras

LSL−G12Dと組み合わせてフロキシング対立遺伝子を使用して調査されたという事実により最もよく例示される。定量方法の欠如は、既知及び未知の技術的及び生物学的変数(例えば、腫瘍発生の再現性、マウスの性別、年齢、及び系統)に起因して、中程度しかない腫瘍抑制作用を有する遺伝子の同定も著しく妨げる。フロキシング対立遺伝子を有する遺伝子を削除することにより生成されたデータも、異なる研究室で使用される異なる実験環境(例えば、異なるウイルス力価、発生後の時間、定量化の方法、マウス系統)間で比較することが困難であるため制限される。したがって、異なる腫瘍抑制遺伝子の相対的作用は、文献から収集することが困難である。最後に、腫瘍のバーコード化による個々の腫瘍細胞数の定量化は、前例がない精度を提供するだけでなく、腫瘍抑制の異なる機能機序を反映する可能性がある腫瘍の大きさの分布に対する遺伝子特異的作用も明らかにする。

マウスにわたる腫瘍の大きさの分布及びsgRNAの腫瘍の大きさの共分散の統計特性を示す。Aは、Lenti−sgPool/Cre発生腫瘍を有する全てのマウスの各sgID分布の平均及び分散を示す。マウスの遺伝子型は示されるように着色される。一般に、分散は全ての遺伝子型の平均の二乗で増加され、病変の大きさの対数変換は分散を安定させ、不等分散性を回避する。一部の分布は、平均の二乗を超えて増加された分散を示す。B〜Dでは.遺伝子改変に応答するマウス間のばらつきは、12週で屠殺されたKT;Cas9マウスにおいて調べた。各マウスの各sgRNAのLN MLE平均の共分散を調査した。遺伝子型は、マウスにわたって互いに正に相関する大きさを意味する(例えば、より大きいsgLkb1腫瘍を保有するマウスはより大きいsgSetd2腫瘍を有する)。12個全てのsgRNAの間の相関マトリックスのPCA分解(sgInertは強化された)は、単一の主構成要素(PC1)ベクターにより説明可能なマウス間のばらつきの実質的なレベルを明らかにした。各点は、PC1に投影された1匹のマウスを表し、これはsgRNAの平均の大きさのマウス間の観察されたばらつきの75%を説明する。(B)PC1は全体的な肺の重量と相関し、(C)平均の病変の大きさは、より大きい腫瘍を有するマウスが強い駆動物質により駆動される腫瘍成長をより受けやすいことを示す(PC1はsgSetd2及びsgLkb1の大きさと相関した、データ示さず)。(D)マウスは、最初の2つの主構成要素に投影されたとき、異なるクラスターを形成するように見えない。同型マウスは、ほぼ必ず同じケージに収容された同胞であった。Mixture of Principal Componentsモデルを使用して、外部のノイズ源を最小に抑えた(方法を参照されたい)。

腫瘍進行の数学的モデルを示す。

同じマウスの各病変とその最隣接との間の大きさの相違と比較したレンチウイルス感染(形質導入)の頻度を示す。

インビボでの推定上の発がん点変異の迅速な導入及び機能調査を可能にする腫瘍バーコード化及びシーケンシングとAAV/Cas9媒介体細胞HDRとを統合するプラットホームを示す。A〜Dは、定義された点変異のパネルのインビボ発がん性を定量的に測定するためのパイプラインの図式的概観を示す。AAVベクターのライブラリを、各AAVが、遺伝子操作されたマウスにおいて、1)隣接するゆらぎ塩基にコードされた推定上の発がん性点変異及びランダムDNAバーコードを含有する相同組換え修復(HDR)のためのテンプレート、2)HDRの内因性遺伝子座を標的とするsgRNA、ならびに3)条件付きCas9対立遺伝子(H11

LSL−Cas9)及び他のCre依存性対立遺伝子を活性化するためのCreリコンビナーゼを含有するように生成した(A)。AAVライブラリは、目的の組織に送達される(B)。形質導入後、細胞のサブセットは、目的の遺伝子座がsgRNA標的部位でCas9により切断され、AAV HDRテンプレートを使用して修復される、AAV/Cas9媒介HDRを受けた。これにより、所望の点変異及び固有のDNAバーコードが標的の遺伝子座に正確に導入される(C)。点変異で操作された体細胞は、導入された変異が腫瘍形成を発生させるために十分であり、腫瘍成長を駆動する場合、新しい腫瘍に発達し得る。Dでは、2つの独立したアプローチを使用して、腫瘍を分析することができる:1)腫瘍は、標的遺伝子の両方の対立遺伝子を特徴付けるために個々にシーケンシングされ得るか、または2)バルク腫瘍保有組織全体からのバーコード化された変異HDR対立遺伝子は、各変異を有する腫瘍の数及び大きさを定量化するためにディープシーケンシングされ得る。

インビボでの推定上の発がん点変異の迅速な導入及び機能調査を可能にする腫瘍バーコード化及びシーケンシングとAAV/Cas9媒介体細胞HDRとを統合するプラットホームを示す。Eは、内因性Kras遺伝子座内へのCas9媒介HDRのためのAAVベクタープール(AAV−Kras

HDR/sgKras/Cre)を示す。各ベクターは、コドン12及び13に12の非同議Kras変異のうちの1つ(または野生型Kras)、PAM及びsgRNA相同領域(PAM

*)内にサイレント変異、ならびに個々の腫瘍のDNAバーコード化のために下流コドンのゆらぎ位置内に8ヌクレオチドランダムバーコードを有するHDRテンプレートを含有する。Fは、AAV−Kras

HDR/sgKras/Creプラスミドライブラリにおける各Krasコドン12及び13対立遺伝子の表示を示す。Gは、AAV−Kras

HDR/sgKras/Creプラスミドライブラリにおけるバーコード領域の多様性を示す。

AAV/Cas9媒介体細胞HDRは、転移状態に進行しうる発がん性Kras駆動肺腫瘍を発生させる。Aは、AAV−Kras

HDR/sgKras/Creの気管内投与により、Rosa26

LSL−tdTomato;H11

LSL−Cas9(T;H11

LSL−Cas9)、p53

flox/flox;T;H11

LSL−Cas9(PT;H11

LSL−Cas9)、及びLkb1

flox/flox;T;H11

LSL−Cas9(LT;H11

LSL−Cas9)マウスの肺上皮細胞の内因性Kras遺伝子座に点変異及びDNAバーコードを導入するための実験の図式を示す。Bは、AAV−Kras

HDR/sgKras/Cre処置LT;H11

LSL−Cas9、PT;H11

LSL−Cas9、及びT;H11

LSL−Cas9マウスのTomato

陽性肺腫瘍及び組織診断の代表的な画像を示す。スケールバー=5mmである。Cは、示されるAAVベクター(sgKrasを有する、及び有しない)に感染させた(形質導入した)マウスの示される遺伝子型における肺腫瘍の定量化を示す。各点は1匹のマウスを示す。1:10,000希釈のAAV−Kras

HDR/sgKras/Creで形質導入されたKras

LSL−G12D;LT(KLT)及びKras

LSL−G12D;PT(KPT)マウスは、未希釈のウイルスに感染させた(形質導入した)PT;H11

LSL−Cas9及びLT;H11

LSL−Cas9マウスのほぼ半分の腫瘍を発達させた。したがって、AAV−Kras

HDR/sgKras/Creライブラリの全てのKras

HDR対立遺伝子が発がん性であると仮定すると、これは、AAV/Cas9媒介HDRが形質導入細胞のおよそ0.02%において生じることを示唆する。あるいは、AAV−Kras

HDR/sgKras/Creライブラリの変異対立遺伝子の20%のみが腫瘍形成を駆動すると仮定される場合、HDRの割合はおよそ0.1%である。Dは、AAV−Kras

HDR/sgKras/Cre発生肺腫瘍を有するLT;H11

LSL−Cas9マウスの胸膜腔のTomato

陽性播種性腫瘍細胞(DTC)を示す代表的なFACSプロットを示す。Eは、PT;H11

LSL−Cas9マウスのAAV−Kras

HD

R/sgKras/Cre発生肺腫瘍からの転移の組織診断を示す。スケールバー=50μmである。Fは、個々の肺腫瘍における多様なHDR生成発がん性Kras対立遺伝子を示す。各対立遺伝子を有するいくつかの腫瘍を示す。いずれの肺腫瘍においても同定されなかった対立遺伝子は示されない。

AAV/Cas9媒介HDRによる変異Kras変異型の体細胞性膵臓及び筋肉細胞への導入は、侵襲性がんの形成を駆動する。Aは、膵癌を誘導するための、AAV−Kras

HDR/sgKras/CreのPT;H11

LSL−Cas9マウスへの逆行膵管注射の図式を示す。Bは、AAV−Kras

HDR/sgKras/CreのPT;H11

LSL−Cas9マウスへの逆行膵管注射により発生させた膵腫瘍の組織診断を示す。スケールバー=75μmである。Cは、原発性PDACを有するPT;H11

LSL−Cas9マウスにおけるリンパ節(上のパネル)及び横隔膜(下のパネル)の転移の組織診断を示す。スケールバー=50μmである。Dは、膵腫瘍塊におけるHDR生成発がん性Kras対立遺伝子を示す。各対立遺伝子を有するいくつかの腫瘍を示す。いずれの膵腫瘍塊においても同定されなかった対立遺伝子は示されない。Eは、肉腫を誘導するための、AAV−Kras

HDR/sgKras/CreのPT;H11

LSL−Cas9マウスの腓腹筋への筋肉内注射の図式を示す。F、Gは、AAV−Kras

HDR/sgKras/CreのPT;H11

LSL−Cas9マウスの腓腹筋への筋肉内注射により発生させた常同性肉腫(F)及び侵襲性肉腫(G)の組織診断を示す。スケールバー=75μmである。Hは、肉腫におけるHDR生成発がん性Kras対立遺伝子を示す。各対立遺伝子を有するいくつかの腫瘍を示す。いずれの肉腫においても同定されなかった対立遺伝子は示されない。これらのデータは、複数の組織にわたって細胞系譜のクローン作製を記述する。

個々にバーコード化された腫瘍のAAV/Cas9媒介体細胞HDR及びハイスループットシーケンシングを使用した、Kras変異発がん性の多重定量分析を示す。Aは、腫瘍バーコードのハイスループットシーケンシングによるバルク肺試料からの個々の腫瘍の大きさ及び数を定量的に測定するためのパイプラインを示す。Bは、その初期表示(AAVプラスミドライブラリの変異表示/AAVプラスミドライブラリのWT表示)に対して正規化され、かつWT(変異腫瘍#/WT腫瘍#)と比較した、各変異Kras対立遺伝子を保有する肺腫瘍の数を示す。WTよりも有意に多い(p<0.01)腫瘍に存在する変異型は青色に着色される。紺青色はG12Dから有意な相違がない(p>0.05)ことを示す。淡青色はG12Dよりもその変異型を有する腫瘍が有意に少ない(p<0.01)ことを示す。Cは、異なる遺伝子型にわたって各Kras変異型を有する肺腫瘍の数の両側多項カイ二乗検定からのp値を示す。有意なp値(p<0.05)は太字である。

個々にバーコード化された腫瘍のAAV/Cas9媒介体細胞HDR及びハイスループットシーケンシングを使用した、Kras変異発がん性の多重定量分析を示す。D、Eは、全てのLT;H11

LSL−Cas9(D)またはPT;H11

LSL−Cas9(E)マウスにわたって、Bで発がん性と同定された、Kras変異型の肺腫瘍の大きさの分布を示す。各点は、固有のKras変異型−バーコード対を有する1つの腫瘍を表す。各点の大きさは、それが表す腫瘍の大きさに比例し、これは、腫瘍リード計数を正規化対照リード計数に対して正規化することによって推定される。Fは、膵腫瘍塊の腫瘍バーコードシーケンシングによって同定された多様なHDR生成Kras対立遺伝子を示す。各対立遺伝子を有する固有にバーコード化された腫瘍の数を示す。いずれの膵腫瘍塊において同定されなかった対立遺伝子は示されない。Gでは、1匹のAAV−Kras

HDR/sgKras/Cre処置PT;H11

LSL−Cas9マウスからの原発性膵腫瘍塊及び転移のハイスループットシーケンシングは、変異Kras対立遺伝子の多様なスペクトルを明らかにし、原発性腫瘍とそれらの転移性子孫との間のクローン関係の確立を可能にした。各点は、示される試料内の、示されるKras変異型及び固有のバーコードを有する1つの腫瘍を表す。着色線により連結される点は同じバーコードを保有し、それらがクローン的に関係することを示唆する。各点の大きさは、それが表す腫瘍の大きさに従い拡大縮小される(点の直径=相対的大きさ

1/4)。膵腫瘍の大きさは対照に対して正規化されないため、腫瘍の大きさは同じ試料内でのみ比較され得る。したがって、各試料における最大腫瘍は同じ標準の大きさに設定される。

Krasの多重変異のためのAAVライブラリの設計、生成、及び検証を示す。Aは、Krasエクソン2を標的とする3つのsgRNAの配列を示す。各sgRNAの切断効率は、各sgRNAをコードするレンチウイルスベクターを形質導入した48時間後に、Cas9発現MEFからのDNAをシーケンシングすることにより決定された。3つ全てのsgRNAは、標的遺伝子座でインデル形成を誘導した。したがって、Krasコドン12及び13に最も近い配列を標的とするsgRNA(sgKras#3)を全ての後続の実験に使用して、HDRの尤度を増加させた。Bは、野生型(WT)Kras配列+コドン12及び13に12の非同議単一ヌクレオチドKras変異体の各々、PAM及びsgRNA相同領域(PAM

*)内にサイレント変異、ならびに個々の腫瘍のバーコード化のために下流コドンのゆらぎ位置内に8ヌクレオチドランダムバーコードを含有するdsDNA断片の合成ライブラリを示す。各Kras対立遺伝子は、約2.4×10

4の固有のバーコードと関連し得る。断片もクローニングのために制限部位を含有した。Cでは、AAVベクターライブラリを、合成領域を親AAVベクターに大量にライゲートすることにより生成し、Krasコドン12及び13に、WT Kras及び12全ての単一ヌクレオチド非同義変異を有するバーコード化されたプールを創出した。Dは、Kras

HDRテンプレート内のKrasエクソン2の位置を示す。相同アームの長さを示す。Eは、HDRの偏りを試験するための実験の図式を示す。Cas9発現細胞株はAAV−Kras

HDR/sgKras/Creで形質導入され、次いで、HDR事象を定量化するためにシーケンシングされた。

Krasの多重変異のためのAAVライブラリの設計、生成、及び検証を示す。Fでは、Kras

HDR対立遺伝子を特異的に増幅するためのPCR戦略の図式は、HDRを介してゲノムに導入された。フォワードプライマー1(F1)は、3つのPAM

*変異を含有する配列に結合し、一方、リバースプライマー1(R1)は、Kras

HDRテンプレートの相同アームに存在する配列の外の内因性Kras遺伝子座に結合する。F2はF1により付加されたIlluminaアダプターに結合し、R2はエクソン2付近の領域に結合し、R3は、R2により同じ領域に付加されたIlluminaアダプターに結合する。Gでは、内因性Kras遺伝子座内の各Kras対立遺伝子の表示は、培養においてAAV−Kras

HDR/sgKras/Creベクターライブラリで形質導入されたCas9発現細胞のHDRにより生成された。Hでは、各Kras

HDR対立遺伝子のHDR事象の頻度は、ウイルスライブラリを生成するために使用された、AAV−Kras

HDR/sgKras/Creプラスミドライブラリの各Kras変異対立遺伝子の初期頻度に対してプロットされた。初期のプラスミドライブラリとHDR後の変異Kras対立遺伝子の表示との間の高い相関は、HDRの偏りがほとんどまたは全くないことを示唆する。

成体の肺上皮細胞形質導入のための最適なAAV血清型の同定を示す。Aは、成体の肺上皮細胞形質導入のための11のAAV血清型をスクリーニングするための実験の概要を示す。GFPをコードするAAVベクターを、異なるAAVカプシド血清型でパッケージングし、野生型レシピエントマウスに気管内投与した。処置の5日後に、肺を分離し、GFP

陽性上皮細胞のパーセントをフローサイトメトリーで決定した。Bでは、異なるAAV血清型は異なる濃度で産生することができる。発明者らの目的は、DNAテンプレートを肺上皮細胞に送達することが可能なAAV血清型を同定することであり、これは、主に、達成可能なウイルス力価及びビリオン当たりの形質導入効率の両方によって決定づけられる。したがって、感染(形質導入)前にAAV血清型の力価を正規化するのではなく、むしろ60μlの未希釈の精製ウイルスの投与後に感染(形質導入)パーセントを決定した。Cでは、異なるAAV血清型で形質導入された肺上皮細胞のパーセントを評価するために、感染(形質導入)マウスの肺を単一細胞懸濁液に分離し、GFP、ならびに造血細胞(CD45、Ter119及びF4/80)、内皮細胞(CD31)、及び上皮細胞(EpCAM)のマーカーに関してフローサイトメトリーを行った。プロットは、FSC/SSCゲーティングされた生存可能な(DAPI

陰性)肺上皮(CD45/Ter119/F4−80/CD31陰性、EpCAM

陽性)細胞を示す。各試料のGFP

陽性上皮細胞パーセントは、ゲートの上に示される。AAV8、AAV9、及びAAVDJは、全ての他の血清型よりもかなり良好であり(Platt et al.,Cell,2014において効率的なHDRをもたらすことができなかったAAV6を含む)、これらの血清型の高い最大力価と一致する。発明者らは、このデータ、及びAAV8がインビボで効率的に多くの他のマウス細胞型を形質導入する記述される能力に基づいてAAV8を使用することを選択する。

成体の肺上皮細胞形質導入のための最適なAAV血清型の同定を示す。Cでは、異なるAAV血清型で形質導入された肺上皮細胞のパーセントを評価するために、感染(形質導入)マウスの肺を単一細胞懸濁液に分離し、GFP、ならびに造血細胞(CD45、Ter119及びF4/80)、内皮細胞(CD31)、及び上皮細胞(EpCAM)のマーカーに関してフローサイトメトリーを行った。プロットは、FSC/SSCゲーティングされた生存可能な(DAPI

陰性)肺上皮(CD45/Ter119/F4−80/CD31陰性、EpCAM

陽性)細胞を示す。各試料のGFP

陽性上皮細胞パーセントは、ゲートの上に示される。AAV8、AAV9、及びAAVDJは、全ての他の血清型よりもかなり良好であり(Platt et al.,Cell,2014において効率的なHDRをもたらすことができなかったAAV6を含む)、これらの血清型の高い最大力価と一致する。発明者らは、このデータ、及びAAV8がインビボで効率的に多くの他のマウス細胞型を形質導入する記述される能力に基づいてAAV8を使用することを選択する。

肺上皮細胞におけるAAV/Cas9媒介インビボHDRは、進行して転移能力を獲得することができる原発性腫瘍を発生させる。Aは、AAV−Kras

HDR/sgKras/Creの気管内投与により、Lkb1

flox/flox;R26

LSL−Tomato;H11

LSL−Cas9(LT;H11

LSL−Cas9)、p53

flox/flox;R26

LSL−Tomato;H11

LSL−Cas9(PT;H11

LSL−Cas9)、及びR26

LSL−Tomato;H11

LSL−Cas9(T;H11

LSL−Cas9)マウスの内因性Kras遺伝子座及びバーコード肺上皮細胞に点変異を導入するための実験の図式を示す。Bでは、図2Aの蛍光画像に対応する照明画像。高拡大率の組織診断画像は、p53欠損腫瘍の腺癌組織診断及びより大きい核異型を記録する。上のスケールバー=5mmであり、下のスケールバー=50μmである。Cは、LT;H11

LSL−Cas9、PT;H11

LSL−Cas9、及びT;H11

LSL−Cas9マウスにおけるAAV−Kras

HDR/sgKras/Cre誘導肺腫瘍のさらなる例を示す。スケールバー=5mmである。高い形質導入効率に起因して、大半の肺細胞はTomatoを発現するが、腫瘍は、各腫瘍の細胞の数及び密度が大きいため、非常に明るいことに留意する。Dは、AAV−Kras

HDR/sgKras/Creで発生させた腫瘍を有する各遺伝子型のマウスの総肺重量を示す。各点は1匹のマウスを示す。Eは、1:10希釈されたAAV−Kras

HDR/sgKras/Creに感染させた(形質導入した)各遺伝子型のマウスの蛍光解剖スコープ下で同定した表面肺腫瘍の数を示す。各点は1匹のマウスを示す。Fは、AAV−Kras

HDR/sgKras/Cre発生肺腫瘍を有するPT;H11

LSL−Cas9マウスにおいて形成されたリンパ性微転移の組織診断を示す。スケールバー=50μmである。Gは、胸膜腔(DTCs>10)に播種性腫瘍細胞及びリンパ節転移を有した各遺伝子型のマウスの数を示す。数は、DTCまたは転移を有するマウスの数/分析されたマウスの総数を表す。

ヌクレアーゼ不含AAV媒介HDRは、多数の肺腫瘍を発生させるために十分に高い割合で生じない。Aは、12個の単一ヌクレオチド非同義変異及びバーコードを有するが、sgRNA標的Krasを有しない2.5kbのKras HDRテンプレートを含有する対照AAVベクターライブラリの図式を示す。Bは、AAV−Kras

HDR/Creプラスミドプールにおける各Krasコドン12及び13対立遺伝子の表示を示す。パーセンテージは、3つ組シーケンシングの平均である。Cは、AAVベクターライブラリの力価(vg=ベクターゲノム)を示す。重要なことには、対照AAV−Kras

HDR/Creウイルス調製物は、AAV−Kras

HDR/sgKras/Creよりも高い力価である。Dは、60μLの未希釈または1:10希釈のAAV−Kras

HDR/Creプールの投与後に腫瘍を発達させたLT、PT、及びTマウスの数の定量化を示す。

個々の腫瘍の分析は、発がん性Kras対立遺伝子を同定し、非HDR Kras対立遺伝子のインデルを明らかにする。Aは、PAM

*変異、G12D変異、及びバーコードを有するKras

HDR対立遺伝子の例示的なシーケンシングトレースを示す。Bは、サンガーシーケンシングにより個々の肺腫瘍において検出された4つの代表的な発がん性Kras対立遺伝子の配列を示す。分析された各原発性腫瘍は、予想通り、固有の変異型−バーコード対を有し、変異型当たりの可能なバーコードは約2.4×10

4である。この遺伝子座でのAAV−Kras

HDRテンプレート配列の改変された塩基及び野生型Kras配列は、参照のために示される。Cでは、HDR事象は一般的に、2つの操作された制限部位の外で生じる。しかしながら、一部の腫瘍は、エクソン2と制限部位のうちの1つとの間の組換えと一致するKras対立遺伝子を有し、Cas9/sgKras誘導二本鎖DNA破壊に非常に近い組換えを示唆する。Dは、完全なHDRを受けなかった個々の腫瘍における発がん性Kras対立遺伝子の図である。完全及び不完全の両方のHDR事象は、各マウスの遺伝子型において見られる(LT;H11

LSL−Cas9マウスの14/30の腫瘍、及びPT;H11

LSL−Cas9マウスの3/7の腫瘍において完全なHDR)。不完全なHDR事象は、エクソン2の上流のAAV−Kras

HDRテンプレートの5’端の相同組換え、及びAAV−Kras

HDRテンプレートの3’端の、Cas9/sgKras誘導二本鎖DNA破壊のすぐ下流のエクソン2領域へのライゲーションによりKras遺伝子座に組み込まれる可能性がある対立遺伝子を含んだ。この不完全なHDRは、Krasエクソン2の下流のイントロン配列の挿入または欠失をもたらした。挿入及び欠失は、長さが不定であり(サンガーシーケンシングまたはゲル電気泳動により近似される大きさ)、時折、野生型エクソン2の一部もしくは全て、または稀な場合では、AAV−Kras

HDR/sgKras/Creベクターのセグメントを含んだ。これらの部分的HDR事象のいずれも変異エクソン2からエクソン3へのスプライシングを改変させることを予測せず、腫瘍形成のための発がん性Kras対立遺伝子の発現の要件と一致した。

個々の腫瘍の分析は、発がん性Kras対立遺伝子を同定し、非HDR Kras対立遺伝子のインデルを明らかにする。E、Fでは、処置されたPT;H11

LSL−Cas9及びLT;H11

LSL−Cas9マウスからの大きい個々の腫瘍における発がん性Kras対立遺伝子は、ほぼ必ずエクソン2におけるCas9媒介インデル形成による他のKras対立遺伝子の不活性化を伴った。サンガーシーケンシングは、個々の腫瘍の47/48(98%)において、PAM配列に隣接するインデルを同定した。例示的なインデル(E)及び全てのインデルの要約(F)を示す。NDは、野生型対立遺伝子を検出することができないことを示し、これは、ヘテロ接合性の非常に大きいインデルの喪失、またはプライマー結合部位のうちの1つを包含した大きい欠失のいずれかと一致する。

膵細胞における発がん性変異の内因性Kras遺伝子座へのHDR媒介導入は、膵管腺癌の形成をもたらす。Aは、膵癌を誘導するための、AAV−Kras

HDR/sgKras/CreのPT;H11

LSL−Cas9マウスへの逆行膵管注射の図式を示す。Bは、AAV−Kras

HDR/sgKras/Creで形質導入したPT;H11

LSL−Cas9マウスにおいて発達した膵腫瘍の代表的な照明及び蛍光画像を示す。スケールバー=5mmである。Cは、前がん性PanIN病変(左上)、高分化腫瘍領域(右上)、及び低分化PDAC(左下)を含む膵腫瘍進行の異なる段階の組織診断画像を示す。右下は、PDAC内のコラーゲン豊富間質環境の発達(トリクロームで染色された)を示す。スケールバー=75μmである。Dは、AAV−Kras

HDR/sgKras/Cre発生PDACを有するPT;H11

LSL−Cas9マウスの腹膜腔におけるTomato

陽性播種性腫瘍細胞(DTC)を示す代表的なFACSプロットを示す。プロットは、FSC/SSCゲーティングされた生存可能ながん細胞(DAPI/CD45/CD31/F4−80/Ter119

陰性)を示す。Eでは、HDR誘導PDACは、進行して、リンパ節及び横隔膜上に転移を播種する転移能力を獲得することができる。照明及び蛍光解剖スコープ画像を示す。スケールバー=3mmである。Fは、示されるAAVベクターライブラリでの感染(形質導入)3〜13ヶ月後のPDACの発生率、腹膜腔におけるDTC、及びマウスの示される遺伝子型の転移を示す(分析されたマウスの総数のうち、がんDTC、または転移を有するマウスの数として示される)。

骨格筋における発がん性KrasのHDR媒介誘導は肉腫を誘導する。Aは、肉腫を誘導するための、AAV−Kras

HDR/sgKras/CreのPT;H11

LSL−Cas9マウスの腓腹筋への筋肉内注射の図式を示す。Bは、AAV−Kras

HDR/sgKras/Creで注射した後のマウス腓腹筋の代表的なホールマウント照明(上のパネル)及び蛍光解剖スコープ(下のパネル)画像を示す。広範なTomato陽性組織(データ示さず)により証明されるように、効率的な形質導入にもかかわらず、右の腓腹筋は肉腫であるが、左は肉腫ではない。スケールバー=5mmである。Cは、定型的な組織診断、また周囲筋肉への浸潤により肉腫の存在を確認する組織学的H&E切片の画像を示す。スケールバー=75μmである。Dは、AAV−Kras

HDR/sgKras/Creの筋肉内注射の3〜7ヶ月後のPT;H11

LSL−Cas9マウスにおける肉腫の発生率を示す。発生率は、注射されたマウスの総数のうち、肉腫を発達させたマウスの数を表す。処置された7匹のマウスのうち1匹がまだ分析されていなかったが、感染(形質導入)の6ヶ月後に明らかな肉腫を有さなかった。Eでは、肉腫におけるKras

HDR遺伝子座のシーケンシングは、変異Kras対立遺伝子及びバーコードを明らかにする。

各変異Kras対立遺伝子を有する肺腫瘍の大きさ及び数を定量化するためのバルク肺組織のIllumina(登録商標)シーケンシング用の試料及び調製物を示す。Aは、バーコード化されたKras

HDR対立遺伝子のIllumina(登録商標)シーケンシング用の、AV−Kras

HDR/sgKras/Creで気管内投与されたマウスからのバルク肺組織試料を示す。試料名、マウス遺伝子型、及びAAV−Kras

HDR/sgKras/Creの希釈が示される。各試料のIllumina(登録商標)シーケンシングのためにプールされた重量、腫瘍数、解剖された腫瘍の数、ならびに増幅されたDNAの量、及びPCR反応の数が示される。反復試料は技術的反復である。ND=データなしである。Bは、各腫瘍における細胞数の推定を可能にし、別個のマウスからのデータを組み合わせることを可能にする、既知の細胞数のベンチマーク対照からのリードを使用したバルク肺試料からのシーケンシングリードの正規化のための簡易化したパイプラインを示す。

バーコードシーケンシングに基づくバルク組織からの腫瘍遺伝子型、大きさ、及び数の並行分析の再現性を示す。A〜Dは、技術的反復(すなわち、バルク組織ライセートからの独立したDNA抽出及びPCR反応)にわたってハイスループットシーケンシングにより検出される、示されるKras

HDR対立遺伝子及び固有のバーコードを有する個々の腫瘍の回帰プロットを示す。A及びBの反復は、異なる多重タグを有するプライマーを使用してPCR増幅されたが、同じシーケンシングレーンで実行された。C及びDの反復は、同じプライマーを使用してPCR増幅されたが、異なるシーケンシングレーンで実行された。推定されるように、バルク肺重量により測定された上記の平均腫瘍負荷(A、C)及び以下の平均腫瘍負荷(B、D)を有するマウスは、不定の腫瘍数の試料にわたってこのパイプラインの技術的及び計算的再現性を確認するために分析された。

バルク肺組織からの腫瘍のハイスループットバーコードシーケンシングは、腫瘍の多様な数及び大きさを明らかにする。A〜Cは、LT;H11

LSL−Cas9(N=6)(A)、PT;H11

LSL−Cas9(N=7)(B)、またはT;H11

LSL−Cas9(N=3)(C)マウス全てにわたる全てのKras変異型の腫瘍の大きさの分布を示す。各点は、固有のKras変異型−バーコード対を有する腫瘍を表す。各点の大きさは、それが表す腫瘍の大きさに比例し、これは、腫瘍リード計数を正規化対照リード計数に対して正規化することによって推定される。WT Kras

HDR対立遺伝子を保有する病変は、発がん性Kras

HDR対立遺伝子を有する腫瘍においてヒッチハイカーであると考えられる(方法を参照されたい)。

バルク肺組織からの腫瘍のハイスループットバーコードシーケンシングは、腫瘍の多様な数及び大きさを明らかにする。D、Eは、各遺伝子型にわたって各Kras変異型を保有する腫瘍の未加工(D)及び正規化(E)の数の表(個々の腫瘍の解剖及び分析によって同定された各変異型を有する腫瘍を含む)を示す。Eにおいて、各Kras変異型を保有する腫瘍の数は、AAVプラスミドライブラリの各変異型の初期表示、及び同じ遺伝子型内にWT対立遺伝子を有する病変の数に対して正規化される。Eのヒートマップの色強度スケールは、比較を容易にするため、各遺伝子型に固有であることに留意する。

膵腫瘍塊及び転移のハイスループットシーケンシングは、発がん性Kras変異体を同定する。Aは、バーコード化されたKras

HDR対立遺伝子のIlluminaシーケンシングのために逆行膵管注射によりAAV−Kras

HDR/sgKras/Creを投与されたマウスからのバルク膵臓組織及び転移試料を示す。試料名、マウス遺伝子型、ウイルス希釈、及び組織が示される。FSC/SSCゲーティングされた生存可能ながん細胞(DAPI/CD45/CD31/F4−80/Ter119

陰性)をこれらの試料からFACS単離した後、原発性腫瘍塊の異なる領域に存在するKras

HDR対立遺伝子ならびに転移がIllumina(登録商標)シーケンシングにより分析された。Bは、PT;H11

LSL−Cas9マウスの膵臓内のAAV−Kras

HDR/sgKras/Cre発生腫瘍塊においてKras

HDR対立遺伝子を同定するための分析パイプラインを示す。Cでは、1匹のAAV−Kras

HDR/sgKras/Cre処置PT;H11

LSL−Cas9マウスにおける大きい膵腫瘍塊の多領域シーケンシングは、変異Kras対立遺伝子の多様なスペクトルを明らかにし、原発性腫瘍とそれらの転移性子孫とを関係づけた。各点は、示されるKras変異型及び示される試料(1〜4と標識される)に固有のバーコードを有する腫瘍を表す。異なる原発性腫瘍試料(1〜3と標識される)にわたってつながれる点は、同じKras変異型−バーコード対を共有し、したがって、おそらく複数の試料に存在した同じ原発性腫瘍の領域である。着色線は、同じKras変異型−バーコード対を保有する原発性腫瘍及びリンパ節転移を関係づけ、クローン関係を示す。各点の大きさは、それが表す腫瘍の大きさに従い拡大縮小される(点の直径=相対的大きさ

1/2)。膵腫瘍の大きさは対照に対して正規化されないため、腫瘍の大きさは同じ試料内の他の腫瘍と比較され得る。したがって、各試料内の最大腫瘍は同じ標準の大きさに拡大縮小される。g=胆嚢、sto=胃、duo=十二指腸、pan=膵臓、sp=脾臓、ln=腸間膜リンパ節である。

Kras変異体のインビボ発がん性と生化学挙動との間の関係を示す。A〜Cは、Hunter et al.,2015で報告された示される生化学特性の関数としての、AAV−Kras

HDR/sgKras/Creで形質導入されたマウスにおける肺腫瘍の相対数(図4bを参照されたい)を示す。相対的な肺腫瘍数は、AAV−Kras

HDR/sgKras/Creプラスミドプールにおける各Kras変異型の初期表示に対して正規化される。垂直バーは、正規化された相対的な肺腫瘍数の95%信頼区間を表す。平バーは、Hunter et al.,2015に記載される3つの反復実験の平均の標準誤差を表す。P120GAPはGAP刺激GTP加水分解速度を決定するために使用された(Hunter et al.,2015)。D〜Fは、Hunter et al.,2015で報告された示される生化学特性の関数としての、AAV−Kras

HDR/sgKras/Creで形質導入されたマウスにおける膵腫瘍の数を示す(図4Fを参照されたい)。垂直バーは、膵腫瘍数の95%信頼区間を表す。水平バーは、Hunter et al.,2015に記載される3つの反復実験の平均の標準誤差を表す。P120GAPはGAP刺激GTP加水分解速度を決定するために使用された(Hunter et al.,2015)。

組み合わされた遺伝子改変の調査を示し、p53欠損はインビボでのKrasG12D駆動肺腫瘍における腫瘍抑制の成長作用を変化させる。A.インビボで組み合わせ腫瘍抑制因子を研究するためのTuba−seqアプローチを示す。3つの異なる遺伝子操作マウス背景:Kras

LSL−G12D/+;Rosa26

LSL−tdTomato;H11

LSL−Cas9(KT;Cas9)、KT;p53

flox/flox;Cas9(KPT;Cas9)、及びKT;Lkb1

flox/flox;Cas9(KLT;Cas9)において、腫瘍をLenti−sgTS−Pool/Cre(4つの不活性sgRNAベクターと、既知及び候補腫瘍抑制遺伝子を標的とする11のベクターとを含有する)で発生させた。各sgRNAベクターは、固有のsgID及びランダムなバーコードを含有し、ディープシーケンシングを介して個々の腫瘍の大きさを定量化するために使用された。Bは、腫瘍発生の15週間後のKT;Cas9マウスの相対的な腫瘍の大きさの分析を示す。示されるパーセンタイルの腫瘍の相対的な大きさは、10匹のマウスからの統合データであり、sgInert腫瘍の平均の大きさに対して正規化される。この研究を通して、エラーバーは、ブートストラップサンプリングにより決定された95%信頼区間を示す。sgInertとは有意に異なるパーセンタイルは色が付けられている。

組み合わされた遺伝子改変の調査を示し、p53欠損はインビボでのKrasG12D駆動肺腫瘍における腫瘍抑制の成長作用を変化させる。Cでは、対数正規腫瘍の大きさの分布を仮定する平均腫瘍の大きさの推定により、KT;Cas9マウスにおける成長を有意に増加させるsgRNAを同定した。ボンフェローニ補正ブートストラップp値を示す。P値<0.05を有するsgRNAは太字である。D、Eは、12匹のKPT;Cas9マウスからの統合データであることを除き、B、Cと同様である。Fは、ゲノム標的不活性sgRNAs Neo1〜3の中央値に対する標的遺伝子座でのインデルの存在量を示す。Aに従う着色がなされている。Gは、TCGA及びGENIEデータセットからのヒト肺腺癌におけるTP53及びRB1の機能変異(N=1792)を示す。RB1及びTP53の改変が同時に生じる。

組み合わされた遺伝子改変の調査を示し、Lkb1欠損腫瘍における腫瘍抑制因子不活性化の減衰作用は、凸凹の適応度ランドスケープをさらに強調する。Aは、同じパーセンタイルでのsgInert含有腫瘍の平均に対する各sgRNAの示されるパーセンタイルの腫瘍の大きさを示す。Lenti−sgTS−Pool/Creによる腫瘍発生の15週間後の13匹のKT;Lkb1

flox/flox;Cas9(KLT;Cas9)マウスからの統合データを示す。sgInertとは有意に異なるパーセンタイルは色が付けられている。Bでは、対数正規の腫瘍の大きさの分布を仮定する平均の腫瘍の大きさの推定により、KLT;Cas9マウスにおける成長を有意に増加させるsgRNAを同定した。ボンフェローニ補正ブートストラップp値を示す。P値<0.05を有するsgRNAは太字である。Cは、TCGA及びGENIEデータセットからのヒト肺腺癌におけるLKB1(STK11)及びSETD2変異の相互排他性(N=1792)を示す。

組み合わされた遺伝子改変の調査を示し、Lkb1欠損腫瘍における腫瘍抑制因子不活性化の減衰作用は、凸凹の適応度ランドスケープをさらに強調する。Dは、Lenti−sgSetd2/Cre発生腫瘍を有するKPT;Cas9マウス(N=7)対Lenti−sgNeo2/Cre発生腫瘍を有するKPT;Cas9マウス(N=3)の腫瘍の大きさを示す。Lenti−sgSetd2/Cre発生腫瘍は、Lenti−sgNeo2/Cre発生腫瘍よりも2.4倍高いLN平均、及び4.6倍高い95パーセンタイルの腫瘍の大きさを有する。Eは、Lenti−sgSetd2/Cre発生腫瘍を有するKLT;Cas9マウス(N=7)対Lenti−sgNeo2/Cre発生腫瘍を有するKLT;Cas9マウス(N=5)の腫瘍の大きさを示す。相対的なLN平均及び相対的な95パーセンタイルは、2.2及び2.8であり、これは、両方とも図2dよりも有意に低い(それぞれ、P<0.04及びP<0.0001)。Fは、遺伝子背景にわたる腫瘍抑制因子の適応度作用(LN平均により決定される)のピアソン相関を示す。sgp53及びsgLkb1成長速度は、KPT;Cas9及びKLT;Cas9マウスにおいて除外された。*P<0.05、****P<0.0001である。Gは、発がん性Kras駆動肺腫瘍の状況内の、ならびに同時p53−またはLkb1欠損による各腫瘍抑制遺伝子の差次的作用を示す。sgInert腫瘍から有意に外れる95パーセンタイルは青色で示される。Hは、駆動物質として候補腫瘍抑制因子を同定する尤度(gに定義される)対研究された遺伝子背景の数を示す。全ての遺伝学的状況は平均化された。

この研究における推定上の腫瘍抑制因子改変の分析のための肺癌の遺伝子操作されたマウスモデルの現状及びヒト肺腺癌におけるこれらのゲノム改変の頻度を示す。Aは、本明細書で研究される推定上の腫瘍抑制遺伝子がp53またはLkb1の不活性化を伴うまたは伴わない発がん性Kras駆動肺癌モデルの状況において不活性化された、公開研究からのデータの要約を示す。Bは、全ての腫瘍(All)、ならびにTP53(TP53

mut)またはLKB1(LKB1

mut)において潜在的な不活性化改変を有する腫瘍に関する、各腫瘍抑制遺伝子において潜在的な不活性化改変(フレームシフトもしくは非同議変異、またはゲノム喪失)を有する腫瘍のパーセントを示す。各種類の改変を有する腫瘍のパーセントを示す。データは、2つの臨床がんゲノム研究について示される:Cancer Genome Atlas(TCGA,2014)及びGenomics Evidence Neoplasia Information Exchange(GENIE,2017)データベースである。

インビボでの腫瘍の大きさの分布を定量化するための多重レンチウイルスベクター、腫瘍発生、及びTuba−seqパイプラインの説明を示す。Aでは、Lenti−sgTS−Pool/Creは、不活性sgRNAを有する4つのベクターと、sgRNAを標的とする腫瘍抑制遺伝子を有する11のベクターとを含有する。各sgRNAベクターは、固有のsgID及びランダムなバーコードを含有する。NT=非標的である。Bは、Lenti−sgTS−Pool/CreにおけるベクターのsgID−バーコード領域の図式を示す。Lenti−sgTS−Pool/Creは、所与のsgID−バーコードリードを特定のsgRNAに連結する15個の異なる8ヌクレオチド固有識別子(sgID)を有するベクターを含有する。これらのベクターは15−ヌクレオチドランダムバーコード要素も含有する。この二重バーコードシステムは、個々の腫瘍、ならびに各腫瘍を発生させるベクター中のsgRNAの同定を可能にする。Cでは、肺上皮細胞をバーコード化されたLenti−sgTS−Pool/Creプールで形質導入することにより、(1)Cre調節された発がん性KrasG12D(Kras

LSL−G12D/+)対立遺伝子、(2)Creレポーター対立遺伝子(Rosa26

LSL−Tomato)、(3)Cre調節されたCas9対立遺伝子(H11

LSL−Cas9)、ならびに(4)p53またはLkb1のいずれかのホモ接合フロキシング対立遺伝子を有する遺伝子操作されたマウスモデルにおいて肺腫瘍を発生させる。レンチウイルスベクターは形質導入細胞のゲノムに安定して組み込まれる。腫瘍をKT;Cas9,KPT;Cas9及びKLT;Cas9マウスにおいて発生させて、31個の異なる遺伝子型の肺腫瘍を生成した。腫瘍成長の15週間後にマウスを分析した。バーコード化された「ベンチマーク」細胞株を添加した後、ゲノムDNAを全肺から抽出し、sgID−バーコード領域をPCR増幅し、ディープシーケンシングし、Tuba−seqパイプラインを使用して各固有にバーコード化された腫瘍の相対的拡大を決定するために分析した。

インビボでのKras

G12D駆動肺腺癌における腫瘍抑制を示す。Aは、Cas9を欠き、したがって、sgInertと比べて拡張しないKTマウスに対するKT;Cas9マウスのsgID表示(ΔsgID表示)の倍率変化を示す。いくつかのsgRNAs(sgID)は、表示が増加し、標的腫瘍抑制遺伝子の不活性化による腫瘍の成長増加を反映する。平均及び95%信頼区間を示す。B、Cでは、腫瘍抑制作用を検出する能力は、バルクsgRNA表示(ΔsgID表示)と比較して、個々にバーコード化された腫瘍を分析することにより向上した。Bでは、各sgRNAを有する95パーセンタイル腫瘍の相対的な大きさの分析は、バルクΔsgID表示と幾分類似する相対的な腫瘍の大きさの推定を同定し、これはより広い信頼区間を示す。Cは、相対的な腫瘍の大きさの対数正規平均(LN平均)測定のP値対P値ΔsgID表示を示す。個々の腫瘍の大きさが測定され、その後、適切に正規化されて外部のノイズ源を排除したため、95パーセンタイル及びLN平均基準の両方が、より大きい信頼及び精度で機能的腫瘍抑制因子を同定する。p53喪失は、その成長作用が対数正規分布により十分に説明されないため、例外である。全てのP値は、両側であり、調査された腫瘍抑制因子の数に関して、2×10

6ブートストラップ並べ替え検定及びボンフェローニ補正を介して得られた。D〜Fは、KPT;Cas9マウスの成長作用であることを除き、A〜Cと同じである。倍率変化はKTマウスに対してであり、一方、95パーセンタイル及びLN平均大きさ推定はKPT;Cas9内部sgInert対照に対してである。

インビボでのKras

G12D駆動肺腺癌における腫瘍抑制を示す。Aは、Cas9を欠き、したがって、sgInertと比べて拡張しないKTマウスに対するKT;Cas9マウスのsgID表示(ΔsgID表示)の倍率変化を示す。G〜Iは、KLT;Cas9マウスの成長作用であることを除き、A〜Cと同じである。Tuba−seqなしで腫瘍抑制因子は同定されなかった。

肺腺癌におけるRb及びp53腫瘍抑制因子の協同性は、Tuba−seqにより同定され、Cre/lox調節された対立遺伝子を使用してマウスモデルにおいて確認され、ヒト肺腺癌におけるRB1及びTP53変異の同時発生により支持された。Aは、sgSetd2、sgLkb1、及びsgRb1腫瘍の相対的なLNの平均の大きさを示す。Rb1不活性化は、p53能力KT;Cas9背景においてSetd2またはLkb1不活性化よりも腫瘍の大きさを増加させない。逆に、Rb1不活性化は、p53欠損KPT;Cas9背景のSetd2またはLkb1不活性化と類似する程度まで腫瘍の大きさを増加させる。P値は、sgRb1と類似するLN平均の帰無仮説を試験する。P<0.05は太字である。Bは、Adeno−CMV/Creを用いて発生させた腫瘍を有するKP及びKP;Rb1

flox/floxマウスからの代表的な肺葉のH&E染色を示す。腫瘍発生の12週間後にマウスを分析した。スケールバー=500μmである。Cは、KP及びKP;Rb1

flox/floxマウスからの肺の代表的なエクスビボμCT画像を示す。肺葉は、白色の破線で輪郭が描かれている。Dは、K;Rb1

wt/wt、K;Rb1

flox/flox、KP;Rb1

wt/wt、及びKP;Rb1

flox/floxマウスの腫瘍面積パーセントの定量化を示す。組織学的定量化は、Rb1欠失がp53欠損腫瘍においてより劇的に腫瘍負荷を増加させることを確認する。*p値<0.05、n.s.=有意ではないである。Ad−Creの力価を示す。E、Fは、2つのヒト肺腺癌ゲノムデータセットにおけるRB1及びTP53変異の同時発生を示し、(e)TCGA 2014 データセット及び(f)GENIE consortium 2017を示す。P値は、体細胞改変についてのDISCOVER統計的独立性検定を使用して計算された。

標的ゲノム遺伝子座のディープシーケンシングは、全ての標的遺伝子座でのインデルの創出を確認し、最も強い腫瘍抑制遺伝子にインデルを有するがん細胞の選択的拡大を示す。Aは、4匹のKPT;Cas9マウスの標的領域からの全肺DNAのディープシーケンシングにより決定される、sgRNAにより標的とされる各領域のインデルの存在量を示す。インデルの存在量は、sgNeo1、sgNeo2、及びsgNeo3の中央存在量に対して正規化される。エラーバーは、観察された存在量の範囲を表示し、一方、点は中央値を示す。インデルは全ての標的領域において観察された。sgp53は、その標的部位がp53

floxed対立遺伝子のCre媒介組換えにより欠失されるため、示されない。Bは、Aに記載されるインデルの存在量対Tuba−seqにより決定される95パーセンタイルの腫瘍の大きさ(図1dに記載される)を示す。各点は、個々のマウスの単一のsgRNAを表し、各マウスは固有の形で表される。インデルの存在量はTuba−seqの大きさのプロファイルと相関する(予想通り)が、インデルの存在量は個々の腫瘍の大きさを測定せず、より大きい統計的ノイズを示す。Tuba−seqにより決定されるように、この全分析において最も大きい単一の腫瘍は、同様にインデル分析において外れ値のように見えるsgCdkn2a腫瘍であり、Tuba−seqによる遺伝学的事象の正確な分析をさらに実証する。

マウスモデル及びヒト肺腺癌におけるSetd2とLkb1との間の冗長性の検証を示す。Aは、Lenti−sgSetd2#1/CreまたはLenti−sgNeo2/Cre発生腫瘍を有するKPT及びKPT;Cas9マウスからの肺葉の蛍光解剖スコープ画像(上)及びH&E染色部分を示す。腫瘍成長の9週間後にマウスを分析した。肺葉は、蛍光解剖スコープ画像において白色の破線で輪郭が描かれている。上のスケールバー=5mmである。下のスケールバー=4mmである。Bは、Lenti−sgSetd2#1/CreまたはLenti−sgNeo2/Cre発生腫瘍を有するKPT;Cas9マウス、及びLenti−sgSetd2#1/Cre発生腫瘍を有するKPTマウスにおける腫瘍面積パーセントの定量化を示す。各点はマウスを表し、水平バーは平均である。同じウイルスで発生させた腫瘍を有するKPT;Cas9とKPTマウスとの間の腫瘍面積において増加があるが、Lenti−sgSetd2#1/Creで発生させたKPT;Cas9マウス腫瘍とLenti−sgNeo2/Creで発生させた腫瘍との間に相違はなく、おそらく高いマウス間のばらつきに起因する。これらのレンチウイルスベクターはバーコード化されたため、これらのマウスのTuba−seq分析を行い、誘導した腫瘍の大きさを定量化した。sgSetd2は、sgNeo2に対して、KPT;Cas9における腫瘍の大きさを増加させた。**P<0.01、n.s.=有意ではないである。Cは、d.Lenti−sgSetd2#1/CreまたはLenti−sgNeo2/Cre発生腫瘍を有するKLT;Cas9マウスついてであることを除き、A、Bと同じである。腫瘍成長の9週間後にマウスを分析した。上のスケールバー=5mmであり、下のスケールバー=4mmである。E、Fは、2つのヒト肺腺癌ゲノムデータセットにおけるSETD2及びLKB1(HGNC名STK11)の同時発生、(E)TCGA 2014データセット

14(N=229の患者)及び(F)GENIE Consortium(N=1563の患者)を示す。両側P値は、DISCOVER統計的独立性検定を使用して計算された。

ヒトゲノムパターンに対するTuba−seq適応度測定値の対応を示す。Aは、発明者らが調査した19の対相互作用の相対的な適応度測定値及びヒト同時発生率を示す。LN平均比は、目的の背景内の相対的なLN平均(sgTS/sgInert)を3つ全ての背景の平均の相対的なLN平均で除した比率である。背景率は、3つの背景の非加重平均(未加工)またはヒト肺腺癌における発生の各背景率による加重(加重)のいずれかであり得る。*OR=ヒトデータ内の遺伝子対の同時発生率の「オッズ比」である。ヒト同時発生率の片側P値(>0.5は相互排他的を示唆する)は、DISCOVER検定を使用して決定された。組み合わせたP値はスタウファー法(方法)を使用して生成した。P<0.025及びP>0.975は太字である。適応度測定値及び同時発生率は一般に対応する(スピアマンのr=0.50、加重LN平均比率についてはP値=0.03、非加重についてはr=0.4)。Bは、Aからの適応度測定値及び同時発生率のグラフィカルな要約を示す。ヒト遺伝学的協同性は、オッズ比>1及び重複<1の組み合わせにより定義された。Tuba−seqデータの協同性は、LN平均比>1及び重複性<1を示す。Cは、21個の腫瘍の種類の汎がん分析から示唆される統計的に有意な遺伝子相互作用の数を示す。腫瘍の種類の略語はTCGAから拝借する。肺腺癌(LUAD)は黒色であり、中央値に類似する遺伝子相互作用の量を含有すると予測され、本明細書で研究された適応度ランドスケープの凹凸が一般にがんの進化の代表であり得ることを示唆する。

より大きい遺伝学的調査の力分析を示す。対数正規の腫瘍の大きさの分布を仮定することにより、より大きい遺伝学的調査において、駆動物質成長作用及び非加法的駆動物質相互作用を検出するためTuba−seqの統計力を提案することができる。今後の実験は、より大きいマウスコホート及び推定上の腫瘍抑制因子を標的とするより大きいsgRNAのプールを利用することが可能である。全ての仮設に基づいた実験では、Lenti−sgTS−Pool/Cre力価及び(正規化のための)不活性sgRNAを有するプールの画分は、発明者らの最初の実験と一致したままであった。Aでは、P値は、弱い駆動物質を検出する際の信頼度に合う(KT;Cas9マウスのsgCdkn2a分布によりパラメータ化される)。輪郭を超える任意の実験設定は、輪郭のP値以上の信頼度で弱い駆動物質を検出する。B、Cは、それぞれ、中程度及び強い駆動物質であることを除き、Aと同じである(KT;Cas9マウスのsgRb1及びsgLkb1によりパラメータ化される)。これらの作用強度を用いて遺伝子を調査するとき、より大きいスクリーニングが可能であるため、sgRNAプールの大きさは、500の標的(プールの100の標的の代わりに)に拡張される。D〜Fは、駆動物質相互作用であることを除き、A〜Cと同じである。駆動物質の相互作用(LN平均比)は、1つの帰無仮説とは統計的に異なる駆動物質成長速度(背景#1のsgTS/sgInert)/(背景#2のsgTS/sgInert)の比率として定義される。(D)Rbm10−p53によりパラメータ化された弱い駆動物質相互作用(7%効果量)であり、(E)Rb1−p53によりパラメータ化された中程度の駆動部室相互作用(13%効果量)であり、(F)Setd2−Lkb1によりパラメータ化された強い駆動物質相互作用(68%効果量)である。

本方法及び組成物を説明する前に、本発明は、記載される特定の方法または組成物に限定されず、したがって、言うまでもなく、変化し得ることを理解されたい。本明細書に使用される用語が特定の実施形態を単に説明する目的のためであり、本発明の範囲が添付の特許請求の範囲によってのみ限定されるため、限定するよう意図されないことも理解されたい。

値の範囲が提供される場合、文脈が別途明確に指示しない限り、下限値の単位の10分の1までの、その範囲の上限値から下限値の間の各介在値も具体的に開示されることを理解する。いずれかの記載値、または記載範囲内の介在値からいずれかの他の記載値またはその記載範囲内の介在値の間の各々のより小さな範囲が本発明内に包含される。これらのより小さい範囲の上限値及び下限値は、この範囲内に独立して含まれても、含まれなくてもよく、またこれらのより小さい範囲内に、これら限界値のいずれか一方を含む、いかなる限界値も含まない、またはこれらの限界値の両方を含む各範囲も、この記載範囲内のいずれかの具体的に除外された制限に従い、本発明内に包含される。記載範囲がそれらの上限値及び下限値のうちの一方または両方を含む場合、それらの含まれる上限値及び下限値のいずれか一方または両方を除外する範囲も本発明に含まれる。

別途の定めがない限り、本明細書中で使用する全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解される意味と同じ意味を有する。本明細書に記載の方法及び物質と同様もしくは同等の任意の方法及び物質を本発明の実践または試験において使用することができるが、いくつかの可能かつ好ましい方法及び物質が、ここで説明される。本明細書で言及する全ての刊行物は、参照により本明細書に組み込まれ、該刊行物の引用に関連した方法及び/または材料を開示ならびに説明する。矛盾がある限り、本開示が組み込まれた刊行物のいかなる開示にも優先することを理解する。

本開示を読めば当業者には明らかであるように、本明細書に記載及び例示される個々の実施形態の各々は、本発明の範囲または趣旨から逸脱することなく、他のいくつかの実施形態のうちのいずれかの特徴から容易に切り離されるか、または組み合わされ得る別個の構成要素及び特徴を有する。いずれの列挙した方法は、列挙した事象の順序で、または論理的に可能な他の任意の順序で実行することができる。

本明細書及び添付の特許請求の範囲で使用される単数形「a」、「an」、及び「th e」は、文脈が別途明確に指示しない限り、複数指示対象を含むことに留意しなければならない。したがって、例えば、「細胞(a cell)」への言及は、複数のそのような細胞(例えば、そのような細胞の集団)を含み、「このタンパク質(the protein)」への言及は、1つ以上のタンパク質及び当業者に既知のそれらの等価物、例えば、ポリペプチド等への言及を含む。

本明細書で論じられる刊行物は、本出願の出願日前に単独でそれらの開示が提供されている。本明細書におけるいかなる内容も、本発明が先行発明によりそのような刊行物に先行する権利がないことを認めるものと解釈されるべきではない。さらに、提供される刊行物の日付は、実際の刊行日とは異なる場合があり、別々に確認される必要があり得る。

方法及び組成物 上記に要約されるように、組成物及び方法は、同じ個体における複数のクローン細胞集団について集団の大きさを測定するために提供される。例として、場合によっては、主題の方法は、同じ個体の複数のクローン的に無関係な腫瘍細胞集団(例えば、異なる腫瘍)の腫瘍の大きさ(例えば、腫瘍内の新生細胞の数)を測定する方法である。場合によっては、本方法は、(a)個体の組織を、遺伝性であり、互いに区別可能である複数の細胞マーカーと接触させて、接触させた組織内の遺伝的に特徴がある細胞の複数の区別可能な系譜を生成することと、(b)遺伝的に特徴がある細胞が少なくとも1回の分裂を受けるために十分な時間が経過した後、接触させた組織に存在する複数の細胞マーカーのうちの少なくとも2つの量を検出及び測定し、それにより、測定した値のセットを生成することと、(c)測定した値のセットを入力として使用して、遺伝的に特徴がある細胞のこれらの区別可能な系譜のうちの少なくとも2つについての、接触させた組織に存在する遺伝的に特徴がある細胞の数を計算することとを含み得る。

組織の接触 いくつかの実施形態では、主題の方法は、組織(例えば、個々の組織)(例えば、筋肉、肺、気管支、膵臓、乳房、肝臓、胆管、胆嚢、腎臓、脾臓、血液、腸、脳、骨、膀胱、前立腺、卵巣、眼、鼻、舌、口、咽頭、喉頭、甲状腺、脂肪、食道、胃、小腸、結腸、直腸、副腎、軟組織、平滑筋、脈管構造、軟骨、リンパ管、前立腺、心臓、皮膚、網膜、ならびに生殖器及び性器系、例えば、精巣、生殖組織など)を、遺伝性であり、互いに区別可能である複数の細胞マーカーと接触させて、接触させた組織内の遺伝的に特徴がある細胞の複数の区別可能な系譜を生成するステップを含む。場合によっては、組織は、動物の体外で成長した操作された組織(例えば、オルガノイド、培養物中の細胞など)である。場合によっては、組織は生きている動物の一部であり、したがって、組織は個体の組織と考えられ、この接触は細胞マーカーを個体に投与することによって(例えば、注射を介して)行われ得る。

任意の簡便な投与経路(例えば、気管内、鼻腔内、逆行膵管、筋肉内、静脈内、腹腔内、小胞内、関節内、局所的に、皮下、経口的に、腫瘍内など)を使用することができる。場合によっては、投与は注射(例えば、直接標的組織への、ウイルスライブラリなどのライブラリの注射)を介してである。場合によっては、細胞内へのマーカーの移行は、電気穿孔(例えば、ヌクレオフェクション)、トランスフェクション(例えば、リン酸カルシウム、カチオン性ポリマー、カチオン性脂質などを使用して)、水力学的送達、ソノポレーション、微粒子銃送達、またはマグネトフェクションを介してである。任意の簡便な送達ベクター(例えば、ウイルス粒子、ウイルス様粒子、ネイキッド核酸、プラスミド、オリゴヌクレオチド、エクソソーム、リポプレックス、小胞、ポリマーソーム、ポリプレックス、デンドリマー、ナノ粒子、微粒子銃粒子、リボ核タンパク質複合体、デンドリマー、細胞透過性ペプチドなど)を使用することができる。

組織は、任意の所望の動物からの任意の組織型である得る。例えば、いくつかの実施形態では、接触させた組織は、無脊椎動物の組織(例えば、脱皮動物、冠輪動物、海綿動物、刺胞動物、有櫛動物、節足動物、環形動物、軟体動物、扁形動物、輪虫類、節足動物、昆虫、または虫の組織)である。いくつかの実施形態では、接触させた組織は、脊椎動物の組織(例えば、鳥、魚、両生類、爬虫類、または哺乳類の組織)である。好適な組織には、ゲッ歯類(例えば、ラット組織、マウス組織)、有動物、農場動物、ブタ、ウマ、ウシ、ヒツジ、非ヒト霊長類、及びヒトからの組織も含まれるが、これらに限定されない。標的組織には、筋肉、肺、気管支、膵臓、乳房、肝臓、胆管、胆嚢、腎臓、脾臓、血液、腸、脳、骨、膀胱、前立腺、卵巣、眼、鼻、舌、口、咽頭、喉頭、甲状腺、脂肪、食道、胃、小腸、結腸、直腸、副腎、軟組織、平滑筋、脈管構造、軟骨、リンパ管、前立腺、心臓、皮膚、網膜、ならびに生殖器及び性器系、例えば、精巣、生殖組織などが含まれ得るが、これらに限定されない。

場合によっては、組織は新生物となるように細胞を誘導する目的のために接触させられ、例えば、場合によっては、組織は複数の独立した腫瘍を発生させて形成する目的のために接触させられる。例えば、場合によっては、導入された細胞マーカー(及び/または細胞マーカーと連結された構成要素)は、新生物形質転換を引き起こし(新生細胞形成をもたらし)、複数の異なる新生物発生事象の結果は、各事象が同定可能な遺伝性の細胞マーカーで固有に特徴がつけられたため、互いに比較することができる。いくつかのそのような場合では、細胞マーカーは、誘導した腫瘍が同じ型(またはさらには同一)の遺伝的摂動に起因して始まるが、各発生事象の結果が、各個々の細胞マーカーが互いに区別可能であるため追跡することができるように同じ遺伝子変化を発生させる。そのような方法の目的は、例えば、所与の目的の遺伝子型の集団の大きさ(例えば、腫瘍の大きさ、各腫瘍における新生細胞の数)の分布プロファイルを生成するために、同じ組織(及び/または同じ動物)において複数の独立した細胞系譜を追跡するためであり得る。あるいは、場合によっては、異なる遺伝的摂動が使用され(例えば、細胞マーカーは2つ以上の異なる遺伝的摂動を引き起こすことができ、細胞マーカーに連結された構成要素は2つ以上の異なる遺伝的摂動を引き起こすことができる)、同じ組織における(例えば、場合によっては、同じ動物における)異なる遺伝子型からの結果(例えば、同じ組織に存在する異なる遺伝的基盤を有する異なる腫瘍、例えば、肺、筋肉、腎臓などにおける複数の異なる腫瘍)を比較することができる。

いくつかの実施形態では、組織は、細胞マーカーと接触させる前に既に新生細胞(例えば、腫瘍)を既に含有する。場合によっては、腫瘍は細胞マーカーと接触させられる(例えば、細胞マーカーは、腫瘍内に注射され得る、腫瘍(複数可)に接触させるために血流中に注射され得る、腫瘍(複数可)に接触させるために別の臓器または組織に投与され得るなど)。例として、場合によっては、細胞マーカーは、新生物または腫瘍内の異なる細胞など、独立した新生細胞に特徴をつける方法として使用され、次いで、各特徴がある細胞は、別個の系譜として処理され得、1回以上の細胞分裂後に存在する各マーカーを有する細胞の数(存在する各マーカーを有する細胞)を計数することによって各追跡された系譜について産生された細胞の数を追跡することができる。場合によっては、本方法は、細胞マーカーが導入される細胞を遺伝的に修飾することを含む。例えば、組織は、主題の方法を行う前に1つ以上の腫瘍を既に有している場合があり、細胞マーカーを導入する目的は、さらなる遺伝的修飾を腫瘍細胞に導入することの作用(すなわち、新生細胞に既に存在するものに加えた変化)を試験するためである。そのため、各区別可能な細胞マーカーは、(例えば、各ガイドRNA及び、したがって、各遺伝的修飾がDNAバーコードなどの固有の識別子と関連するように、特定の遺伝的標的を標的とするガイドRNAをコードする核酸とDNAバーコードなどの固有の識別子とを対合することによって)異なる遺伝子変化と関連し得る。そのような場合、特徴がある系譜は、互いに遺伝的に異なる(例えば、特定の遺伝子座に変異を有する)細胞のセットを表す。

あるいは、場合によっては、腫瘍の各々は遺伝的に同じであり、細胞マーカーは必ずしも互いに遺伝的に異ならない系譜を追跡する。これは、本方法の実施者が、同じ動物において複数の独立した細胞系譜を追跡し、所与の目的の遺伝子型の集団の大きさ(例えば、腫瘍の大きさ、腫瘍における新生細胞の数)の分布プロファイルを生成することを可能にする。

細胞マーカー 複数の細胞マーカー(すなわち、導入された(異種、人工)細胞マーカー、つまり、マーカーが細胞に既存するものではない場合、例えば、導入されたマーカーは単純に腫瘍内の既存のクローン体細胞変異ではない)は、2つ以上(例えば、3つ以上、5つ以上、10個以上、または15個以上、50個以上、100個以上、200個以上、500個以上、1000個以上、10,000個以上、100,000個以上、1,000,000個以上、1,000,000,000個以上など)の細胞マーカーである。同様に、複数の特徴がある細胞系譜は、2つ以上(例えば、3つ以上、5つ以上、10個以上、または15個以上、100個以上、1,000個以上、10,000個以上、100,000個以上)の特徴がある細胞系譜である。任意の簡便な遺伝性細胞マーカー(互いに区別可能である)を使用することができ、いくつかの遺伝性細胞マーカーは当業者に既知である。場合によっては、細胞マーカー(すなわち、遺伝性であり、互いに区別可能である導入された(異種、人工))は、バーコード化された核酸である。場合によっては、バーコード化された核酸は標的細胞のゲノムに組み込まれ得るか、または場合によっては、バーコード化された核酸はエピソームに保持され得る。バーコード化された核酸は、検出され、定量化/測定される各細胞系譜に固有の識別子を提供するヌクレオチド配列を含む。場合によっては、遺伝性であり、互いに区別可能な複数の細胞マーカーは、バーコードの正確な配列があるランダムな要素を有する場合、バーコード化された核酸のライブラリである。例えば、場合によっては、バーコードは、一連のN(例えば、各ヌクレオチドは定義されないが、基準のまたは非基準のヌクレオチドの全ての可能なまたは定義されたサブセットのうちの1つである核酸配列の位置)で記載され得る。主題のバーコード化され核酸は、任意の簡便な数のNを含み得る。

場合によっては、主題のバーコード化され核酸(複数/ライブラリ)は、5つ以上(例えば、6つ以上、7つ以上、8つ以上、10個以上、12個以上、または15個以上)のランダム化された位置、例えば、ヌクレオチドが予め決められていない5つ以上(例えば、6つ以上、7つ以上、8つ以上、10個以上、12個以上、または15個以上)の位置を含む。場合によっては、バーコード化された核酸のライブラリ(複数)の式は、5つ以上の位置(例えば、6つ以上、7つ以上、8つ以上、10個以上、12個以上、または15個以上の位置)が定義されない(すなわち、塩基同一性がライブラリのメンバー間で異なる)、少なくとも10塩基対(bp)長(例えば、少なくとも12bp、15bp、17bp、または20bp長)のヌクレオチドの伸張を含む。場合によっては、バーコード化された核酸のライブラリ(複数)の式は、5〜40の位置(例えば、5〜30、5〜25、5〜20、5〜18、5〜15、5〜10、8〜40、8〜30、8〜25、8〜20、8〜18、8〜15、8〜10、10〜40、10〜30、10〜25、10〜20、10〜18、10〜15、12〜40、12〜30、12〜25、12〜20、12〜18、または12〜15の位置)が定義されていない(すなわち、塩基同一性がライブラリのメンバー間で異なる)ヌクレオチドの伸張を含む。場合によっては、バーコード化された核酸のライブラリ(複数)の式は、5〜1000の位置(例えば、5〜800、5〜600、5〜500、5〜250、5〜150、5〜100、5〜50、5〜30、5〜25、5〜20、5〜18、5〜15、5〜10、8〜1000、8〜800、8〜600、8〜500、8〜250、8〜150、8〜100、8〜50、8〜40、8〜30、8〜25、8〜20、8〜18、8〜15、8〜10、10〜1000、10〜800 、10〜600、10〜500、10〜250、10〜150、10〜100、10〜50、10〜40、10〜30、10〜25、10〜20、10〜18、10〜15、12〜1000、12〜800、12〜600、12〜500、12〜250、12〜150、12〜100、12〜50、12〜40、12〜30、12〜25、12〜20、12〜18、または12〜15の位置)が定義されていない(すなわち、塩基同一性がライブラリのメンバー間で異なる)ヌクレオチドの伸張を含む。

バーコード化された核酸は、線状(例えば、ウイルス)または環状(例えば、プラスミド)DNA分子であり得る。バーコード化された核酸は、一本鎖または二本鎖DNA分子であり得る。非限定的な例としては、プラスミド、合成核酸断片、合成オリゴヌクレオチド、ミニサークル、及びウイルスDNAが挙げられる。バーコード化された核酸は、RNA分子、DNA(DNA分子)、RNA/DNAハイブリッド、または核酸/タンパク質複合体であり得る。

場合によっては、細胞マーカーは、単独で、または互いに区別可能な、ならびに組み合わせで使用されるとき、複数の他のバイオマーカーと区別可能な同じもしくは異なる型の複数の他のバイオマーカーと組み合わせて、遺伝性であり、互いに区別可能な複数のバイオマーカー(例えば、抗体、蛍光タンパク質、細胞表面タンパク質)を含み得る。そのような場合、バイオマーカーは、予め定義されたまたはランダム化様式で、個々の細胞及び/または細胞系譜内または外に存在し得、当業者に一般的に知られる方法(例えば、ハイスループット/次世代DNAシーケンシング、顕微鏡、フローサイトメトリー、質量分析計など)を使用して定量化及び/または測定され得る。

細胞マーカーは、任意の簡便な方法を使用して細胞に送達され得る。場合によっては、細胞マーカー(例えば、バーコード化された核酸)は、ウイルスベクターを介して組織に送達される。任意の簡便なウイルスベクターを使用することができ、例としては、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、ボカウイルスベクター、泡沫状ウイルスベクター、及びレトロウイルスベクターが挙げられるが、これらに限定されない。

以下の実施例からの一例では(図4Aを参照されたい)、複数の細胞マーカーは、レンチウイルスベクターを介して標的組織に送達された。各ウイルス粒子が、第1の構成要素が各コードされたガイドRNAに固有であり、第2の構成要素が各分子に固有であり、そのため、同時に、検出され、定量化/測定されるべき各細胞系譜に固有である、二構成要素バーコードを含んだ1つのバーコード化された核酸を含んだレンチウイルス粒子のライブラリが使用された。バーコードの第2の構成要素の配列の式は、NNNNNTTNNNNNAANNNNNであった。したがって、19の塩基対の伸張において、それらのうちの15は、定義されなかった(例えば、ランダム化された)。ライブラリの各バーコード化された核酸は、(i)CRISPR/CasガイドRNAをコードした、(ii)第1のバーコード、つまり、各異なるガイドRNA配列がその自身の固有の8ヌクレオチドバーコードに連結されるように、ガイドRNAに連結された固有の識別子である8ヌクレオチドバーコードを含んだ、(iii)第2のバーコード、つまり、15の未定義の位置を有する上記のランダムな19のヌクレオチドバーコードを含んだ[細胞系譜を追跡するため]、及び(iv)その発現が標的組織においてCas9発現をもたらす遺伝子編集タンパク質(CRE)をコードした。したがって、この場合、複数のバーコード化された核酸の複数の異なるメンバーは、同じ第1のバーコードを含み、各第1のバーコードは「対応する」ガイドRNAを有した。しかしながら、第2のバーコードは、検出され、定量化/測定される各細胞系譜が固有の識別子を有するように、ライブラリの各メンバーに固有であった。したがって、一部のメンバーは、共通のガイドRNAを共有したため、第1のバーコード配列を共有したが、ライブラリの各メンバーは、各組み込み(すなわち、系譜) を追跡するために使用され得る固有の第2のバーコード有した。

場合によっては、遺伝性であり、区別可能な複数の細胞マーカーは、遺伝性であり、互いに区別可能な、ならびにそれらが関連する他の複数の細胞マーカーの細胞マーカーと区別可能な、1つ以上(例えば、1つ以上、2つ以上、3つ以上、5つ以上、7つ以上、9つ以上、11個以上、13個以上、15個以上、または20個以上)の複数の細胞マーカーと関連する。例えば、1つのバーコード化された核酸は、第1の構成要素が候補療法(例えば、候補抗がん化合物)に固有であり、第2の構成要素が各個体(例えば、候補療法を受け得る、または受けない場合があるマウス)に固有であり、第3の構成要素がコードされたガイドRNAに固有であり、第4の構成要素が各分子に固有であり、そのため、同時に、バーコード化された核酸が、検出され、定量化/測定されるべき各細胞系譜に固有である、4構成要素バーコードを含み得る。したがって、この例では、各細胞系譜における細胞の数が定量化/測定され得、各細胞系譜はまた、その4構成要素核酸バーコードにより、その細胞系譜におけるガイドRNAにより誘導された特定の遺伝的摂動、その細胞系譜が遭遇する特定の候補療法、及び細胞系譜が存在する特定の個体(例えば、マウス)に直接連結され得る。

場合によっては、バーコードは、相同組換え修復(HDR)、または例えば、定義された核酸配列をゲノムの所望の位置に組み込む任意の他の機序のためのDNAドナーテンプレートに組み込まれる。例えば、HDR修復テンプレートは、同じコード変化(例えば、同じコード対立遺伝子)、またはさらには所望の変化のサブセットを、それが接触する細胞のゲノムに導入するために使用され得るが、各組み込み事象は、HDRテンプレートのライブラリが特定の位置でランダム化されているため独立してタグ付けされ得る。以下の実施例からの一例では(図23Aを参照されたい)、複数の細胞マーカー(各AAV粒子が1つのHDRテンプレートを含んだAAV粒子のライブラリ)は、AAV粒子により標的組織に送達された。各AAVのHDRテンプレートは、HDRを受ける各細胞を固有にタグ付けするために、Krasコドン12及び13に12の可能な非同義単一ヌクレオチド点変異のうちの1つ、または野生型Kras配列ならびに隣接するコドンのゆらぎ位置にランダムな8ヌクレオチドバーコードを含んだ。バーコードは、(N)GG(N)AA(R)TC(N)GC(N)CT(N)AC(N)AT(H)(配列番号1)であり、したがって、8つの位置が定義されなかった22の塩基対の伸張であった。

場合によっては、外部摂動(例えば、候補抗がん療法)に応じて、細胞マーカーを組織に接触させることができる。そのような場合、外部摂動因子の投与は、調節可能な確率で、またはシグナル(例えば、予め定義された細胞の生理学的状態、特定の遺伝子の発現レベル、遺伝子のセット(複数可)、特定の経路(複数可)の活性レベル、及び/または細胞もしくは細胞系譜の内部または外部の他のシグナル[例えば、組織の同一性、血液供給レベル、個体全体の免疫状態、細胞の物理的位置など])の組み合わせ一致の結果として確率的に生じ得る。例えば、組織が存在する個体に投与される化合物に応じて、特定の型の上皮細胞に特異的なエンハンサーの制御下のガイドRNA及びCas9の両方の発現時に、細胞マーカー(例えば、バーコード化されたDNA)を組織に接触させることができる。

場合によっては、細胞マーカーを、個々の生きている生物においてインビボで、または培養物中またはオルガノイド培養物中の細胞集団においてインビトロで、健康なもしくは疾患状態の細胞集団または組織に接触させてもよい。場合によっては、細胞マーカーを、数が増加もしくは減少している、または静止の新生細胞系譜に接触させてもよい。場合によっては、薬物の投与または他の生理学的もしくは環境摂動に応じて、確率的に調節可能な摂動で、あるいは調節可能な手段及び分散ならびに他の時点により、またはシグナルの組み合わせ一致の結果として、正確にまたは確率的に、ある特定の数の細胞分裂の後に組 織に接触させるように細胞マーカーを誘導した計数機序を介して、細胞マーカーを組織に接触させてもよい。

標的細胞の遺伝的修飾(改変) 上述したように、いくつかの実施形態では、本方法は、細胞マーカーが導入される細胞を遺伝的に修飾することを含む。いくつかのそのような場合では、導入された細胞マーカーは、遺伝的修飾の薬剤である。例えば、場合によっては、細胞マーカーは、遺伝的修飾(例えば、ゲノム修飾)を誘導するバーコード化された核酸であり、いくつかのそのような場合では、新生細胞形成を誘導するバーコード化された核酸である。例えば、バーコード化された核酸からのRNA(例えば、ガイドRNA)及び/またはタンパク質(例えば、Cre、CRISPR/Cas RNAガイドタンパク質など)の発現は、1つ以上のゲノム改変をもたらし得、場合によっては、ゲノム改変は、標的細胞の新生細胞への形質転換をもたらす(例えば、場合によっては、腫瘍形成をもたらす場合がある)。

しかしながら、細胞マーカー(例えば、バーコード化された核酸)がゲノム修飾を導入するかは、それが新生細胞形成を誘導することができるかに依存し得る。例えば、場合によっては、バーコード化された核酸は、がん遺伝子(タンパク質として発現されたときに新生細胞形成につながり得る遺伝子)をコードし得る。いくつかのそのような場合では、バーコード化された核酸は、標的細胞においてゲノム変化を誘導しないが、がん遺伝子の発現に起因して新生細胞形成を誘導する。場合によっては、がん遺伝子は、タンパク質が過剰発現されるとき、細胞が新生物になる可能性がある野生型タンパク質をコードする。場合によっては、がん遺伝子は、タンパク質が発現されるとき、細胞が新生物になる可能性がある変異タンパク質(例えば、KRASの変異型)をコードする。場合によっては、細胞マーカー(例えば、バーコード化された核酸)は、標的細胞にゲノム修飾を導入するが、修飾は、細胞マーカー及び関連するゲノム修飾の導入前、導入中、または導入後のある期間に生じ得る1つ以上のさらなるゲノム修飾と組み合わせてのみ新生物形成(例えば、腫瘍/がんの形成)を誘導する。

一方、場合によっては、細胞マーカー(例えば、バーコード化された核酸)は、標的細胞にゲノム修飾を導入するが、修飾は、新生物形成(例えば、腫瘍/がんの形成)を誘導しない。例えば、場合によっては、バーコード化された核酸は、不活性方法で標的細胞のゲノムに組み込まれる。

場合によっては、バーコード化された核酸は、タンパク質が必ずしもがんに関連しないタンパク質(例えば、野生型または変異タンパク質)をコードし、例えば、タンパク質(複数可)は目的の任意の生物学的プロセスに関与し得、その発現は、細胞増殖及び/または新生細胞形成に作用を有しない場合がある(例えば、がん遺伝子または腫瘍抑制因子ではない場合がある)。いくつかのそのような場合では、核酸は標的細胞のゲノムに組み込まれ、他の場合では、核酸はゲノムに組み込まれない(例えば、エピソームに保持され得る)。場合によっては、バーコード化された核酸は、例えば、成長/増殖制御以外の何らかの方法で、腫瘍に有害なタンパク質をコードする野生型または変異タンパク質、例えば、cDNAをコードする。

いくつかの実施形態では、主題の細胞マーカー(例えば、バーコード化された核酸)は、標的細胞にゲノム修飾を導入し、また新生細胞形成(例えば、腫瘍/がんの形成)も導入するという両方である。例えば、場合によっては、バーコード化された核酸は、腫瘍抑制因子を修飾する、がん遺伝子の発現を改変する、新生物誘導対立遺伝子になるように遺伝子(例えば、Kras)を編集するようになど、標的遺伝子座に編集を引き起こし得る。

上述したように、バーコード化された核酸からのRNA(例えば、ガイドRNA)及び/またはタンパク質(例えば、Cre、CRISPR/Cas RNAガイドタンパク質など)の発現は、1つ以上のゲノム改変をもたらし得、場合によっては、ゲノム改変は、標的細胞の新生細胞への形質転換をもたらす(例えば、場合によっては、腫瘍形成をもたらす場合がある)。いくつかの実施形態では、標的細胞のゲノム改変は、新生物特徴の発生(例えば、腫瘍発生)から時間的に分離され得る。例として、ベクター(複数可)は、CRISPR/CasガイドRNAの時間的制御及び/またはCRISPR/Cas核酸ガイドタンパク質活性(例えば、Cas9活性)の時間的制御を可能にするように操作され得る。

場合によっては、遺伝的(例えば、ゲノム)修飾を導入するタンパク質は、標的細胞において発現される。タンパク質は、タンパク質として、またはタンパク質をコードする核酸(RNAまたはDNA)として標的細胞に導入され得る。タンパク質はまた、細胞内の核酸によって既にコードされていてもよく(例えば、細胞内のゲノムDNAによってコードされる)、本方法は、タンパク質の発現を誘導することを含む。場合によっては、標的組織の標的細胞に遺伝的修飾を導入するタンパク質は、ゲノム編集タンパク質/エンドヌクレアーゼ(そのうちの一部は、「プログラム可能」であり、そのうちの一部はそうではない)である。例としては、プログラム可能な遺伝子編集タンパク質(例えば、転写活性化因子様(TAL)エフェクター(TALEs)、TALEヌクレアーゼ(TALEN)、ジンクフィンガータンパク質(ZFP)、ジンクフィンガーヌクレアーゼ(ZFN)、DNAガイドポリペプチド(Natronobacterium gregoryi Argonaute(NgAgo)など)、CRISPR/Cas RNAガイドタンパク質(Cas9、CasX、CasY、Cpf1など)(例えば、Shmakov et al.,Nat Rev Microbiol.2017 Mar;15(3):169−182及びBurstein et al.,Nature.2017 Feb 9;542(7640):237−241)を参照されたい)、トランスポゾン(例えば、クラスIまたはクラスIIトランスポゾン、例えば、piggybac、sleeping beauty、Tc1/mariner、Tol2、PIF/harbinger、hAT、mutator、merlin、transib、helitron、maverick、frog prince、minos、Himar1など)、メガヌクレアーゼ(例えば、I−SceI、I−CeuI、I−CreI、I−DmoI、I−ChuI、I−DirI、I−FlmuI、I−FlmuII、I−Anil、I−SceIV、I−CsmI、I−PanI、I−PanII、I−PanMI、I−SceII、I−PpoI、I−SceIII、I−LtrI、I−GpiI、I−GZeI、I−OnuI、I−HjeMI、I−MsoI、I−TevI、I−TevII、I−TevIII、PI−MleI、PI−MtuI、PI−PspI、PI−Tli I、PI−Tli II、PI−SceVなど)、メガTAL(例えば、Boissel et al.,Nucleic Acids Res.2014 Feb;42(4):2591−2601を参照されたい)、ファージ由来インテグラーゼ、Creタンパク質、Flpタンパク質などが挙げられるが、これらに限定されない。場合によっては、ゲノム編集ヌクレアーゼ(例えば、CRISPR/Cas RNAガイドタンパク質)は、ヌクレアーゼ活性を除去する(ヌクレアーゼ死亡タンパク質である)1つ以上の変異を有し、タンパク質は転写活性化因子または抑制因子ポリペプチド(例えば、CRISPRa/CRISPRi)に融合する。場合によっては、ゲノム編集ヌクレアーゼ(例えば、CRISPR/Cas RNAガイドタンパク質)は、ヌクレアーゼ活性を除去する(ヌクレアーゼ死亡タンパク質である)か、またはヌクレアーゼ活性を部分的に除去する(ニッカーゼタンパク質である)1つ以上の変異を有し、タンパク質の機能または活性を調節する1つ以上のさらなる変異を有し得、タンパク質は、それ自体がタンパク質の機能もしくは活性を調節する1つ以上のさらなる変異を有し得るデアミナーゼドメイン(例えば、ADAR、APOBEC1など)に融合されるか、または同じくタンパク質の機能もしくは活性を調節する1つ 以上のさらなる変異(例えば、RNA塩基エディタ、DNA塩基エディタ)を有し得る、デアミナーゼドメイン及び1つ以上のさらなるタンパク質もしくはペプチド(例えば、バクテリオファージGamタンパク質、ウラシルグリコシラーゼ阻害剤など)に融合される。

場合によっては、CreまたはFlpなどの編集タンパク質は、ゲノムから別のタンパク質(例えば、Cas9などのCRISPR/Cas RNAガイドタンパク質)の発現を誘導する目的のために標的組織に導入され得、例えば、動物は、Cas9のlox−stop−lox対立遺伝子を含有し得、導入されたCreタンパク質(例えば、バーコード化された核酸によりコードされる)は、「stop」の除去をもたらし、したがって、Cas9タンパク質の発現をもたらす。

いくつかの実施形態では、バーコード化された核酸は、新生細胞形成を誘導することができ、相同組換え修復(HDR)DNAドナーテンプレート、がん遺伝子をコードする核酸(タンパク質の野生型及び/または変異対立遺伝子を含む)、CRISPR/CasガイドRNAをコードする核酸、短ヘアピンRNA(shRNA)をコードする核酸、及びゲノム編集タンパク質をコードする核酸のうちの1つ以上を含む(例えば、上記を参照されたい)。

場合によっては、バーコード化された核酸がHDR DNAドナーテンプレートである場合、それらは標的細胞のゲノムに変異を導入することができる。いくつかのそのような場合では、ゲノム編集ヌクレアーゼは、ドナーテンプレートがバーコード化された配列を挿入するために使用されるように標的DNAを切断する細胞に存在する(導入されるか、または主題の方法の一部として誘導するか、または標的細胞において既に発現されているかのいずれか)。場合によっては、HDR DNAドナーテンプレートのライブラリ(複数)は、各分子に対して固有の配列識別子(バーコード)を有するメンバーを含むが、分子は、同じ機能的摂動をもたらす(例えば、それらは全て、例えば、場合によっては、変異アミノ酸配列を有する、同じタンパク質の発現をもたらし得るが、それらは、コドンのゆらぎ位置で異なる場合があり、その結果、同じ変異タンパク質を発現するかにかかわらず、得られた複数の細胞系譜が互いに区別可能であるようにタンパク質をコードする)。場合によっては、HDR DNAドナーテンプレートのライブラリ(複数)は、各分子に対して固有の配列識別子(バーコード)を有するメンバーを含み、分子は、異なる機能的摂動をもたらす(例えば、異なる遺伝子座を標的とすることができる、同じ遺伝子座を標的とするが、異なる対立遺伝子を導入することができるなど)。

場合によっては、バーコード化された核酸は、CRISPR/CasガイドRNAであるか、またはCRISPR/CasガイドRNAをコードするDNA分子である。そのような分子のライブラリは、異なる遺伝子座を標的とする分子及び/または同じ遺伝子座を標的とする分子を含み得る。場合によっては、バーコード化された核酸は、本開示の目的のため、過剰発現されたときに新生細胞形成をもたらし得る野生型タンパク質、ならびに新生細胞形成をもたらし得る変異タンパク質(例えば、KRAS、以下の実施例を参照されたい)を含むがん遺伝子をコードする。そのような分子のライブラリは、同じがん遺伝子を発現する分子、または異なるがん遺伝子を発現する分子のライブラリを含み得る。場合によっては、バーコード化された核酸は、短ヘアピンRNA(shRNA)及び/またはshRNAをコードするDNA分子(複数可)(例えば、任意の所望の遺伝子、例えば、腫瘍抑制因子に標的化され得る)を含む。そのような分子のライブラリは、同じshRNAを発現する分子、または異なるshRNAを発現する分子のライブラリを含み得る。場合によっては、バーコード化された核酸は、1つ以上のゲノム編集タンパク質/エンドヌクレアーゼ(例については上記を参照されたい、例えば、Cas9、Cpf1、CasX、またはCasYなどのCRISPR/Cas RNAガイドタンパク質、Creリコ ンビナーゼ、Flpリコンビナーゼ、ZFN;TALENなど)をコードするRNA及び/またはDNAを含む。そのような分子のライブラリは、同じゲノム編集タンパク質/エンドヌクレアーゼを発現する分子、または異なるゲノム編集タンパク質/エンドヌクレアーゼを発現する分子のライブラリを含み得る。

いくつかの実施形態では、細胞マーカーは、区別可能に標識された粒子(例えば、ビーズ、ナノ粒子など)である。例えば、場合によっては、粒子は、区別可能な質量タグ(質量分析を介して分析され得る)、区別可能な蛍光タンパク質、区別可能な放射線タグなどで標識され得る。

検出/測定/計算 主題の方法は、例えば、遺伝的に特徴がある細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後、接触させた組織に存在する複数の細胞マーカーのうちの少なくとも2つの量を検出及び測定するステップも含み得る。

場合によっては、ステップ(a)と(b)との間[組織を複数の細胞マーカーと接触させることと組織に存在する細胞マーカーを検出/測定することとの間]で経過した時間期間は、遺伝的に特徴がある細胞の少なくとも一部(例えば、区別可能に特徴がある細胞のうちの少なくとも2つ)が少なくとも1回の分裂(例えば、少なくとも2回、4回、6回、8回、10回、または15回の細胞分裂)を受けるために十分な時間期間である。場合によっては、ステップ(a)と(b)との間[組織を複数の細胞マーカーと接触させることと組織に存在する細胞マーカーを検出/測定することとの間]で経過した時間期間は、2時間以上(例えば、4時間以上、6時間以上、8時間以上、10時間以上、12時間以上、15時間以上、18時間以上、24時間以上、または36時間以上)である。場合によっては、ステップ(a)と(b)との間[組織を複数の細胞マーカーと接触させることと組織に存在する細胞マーカーを検出/測定することとの間]で経過した時間期間は、1日間以上(例えば、2日間以上、3日間以上、4日間以上、5日間以上、7日間以上、10日間以上、もしくは15日間以上、20日間以上、または24日間以上)である。場合によっては、ステップ(a)と(b)との間[組織を複数の細胞マーカーと接触させることと組織に存在する細胞マーカーを検出/測定することとの間]で経過した時間期間は、1週間以上(例えば、2週間以上、3週間以上、4週間以上、5週間以上、7週間以上、または10週間以上)である。場合によっては、ステップ(a)と(b)との間[組織を複数の細胞マーカーと接触させることと組織に存在する細胞マーカーを検出/測定することとの間]で経過した時間期間は、2時間〜60週間(例えば、2時間〜40週間、2時間〜30週間、2時間〜20週間、2時間〜15週間、10時間〜60週間、10時間〜40週間、10時間〜30週間、10時間〜20週間、10時間〜15週間、18時間〜60週間、18時間〜40週間、18時間〜30週間、18時間〜20週間、18時間〜15週間、1日間〜60週間、1日間〜40週間、1日間〜30週間、1日間〜20週間、1日間〜15週間、3日間〜60週間、3日間〜40週間、3日間〜30週間、3日間〜20週間、3日間〜15週間、1週間〜60週間、1週間〜40週間、1週間〜30週間、1週間〜20週間、または1週間〜15週間)の範囲である。場合によっては、ステップ(a)と(b)との間[組織を複数の細胞マーカーと接触させることと組織に存在する細胞マーカーを検出/測定することとの間]で経過した時間期間は、2時間〜300週間(例えば、2時間〜250週間、2時間〜200週間、2時間〜150週間、2時間〜100週間、2時間〜60週間、2時間〜40週間、2時間〜30週間、2時間〜20週間、2時〜15週間、10時間〜300週間、10時間〜250週間、10時間〜200週間、10時間〜150週間、10時間〜100週間、10時間〜60週間、10時間〜40週間、10時間〜30週間、10時間〜20週間、10時間〜15週間、18時間〜300週間、18時間〜250週間、18時間〜200週間、18時間〜150週間、18時間〜100週間、18時間〜60週間、18時間〜40週間、18時間〜30週間、 18時間〜20週間、18時間〜15週間、1日間〜300週間、1日間〜250週間、1日間〜200週間、1日間〜150週間、1日間〜100週間、1日間〜60週間、1日間〜40週間、1日間〜30週間、1日間〜20週間、1日間〜15週間、3日間〜300週間、3日間〜250週間、3日間〜200週間、3日間〜150週間、3日間〜100週間、3日間〜60週間、3日間〜40週間、3日間〜30週間、3日間〜20週間、3日間〜15週間、1週間〜300週間、1週間〜250週間、1週間〜200週間、1週間〜150週間、1週間〜100週間、1週間〜60週間、1週間〜40週間、1週間〜30週間、1週間20週間、または1週間〜15週間)の範囲である。

各区別可能な細胞マーカー(例えば、バーコード化された核酸)に関して検出されたシグナルの量(レベル)は、接触させた組織(遺伝性の細胞マーカーが導入された組織)に存在する細胞の数を決定するために使用され得る。任意の簡便な方法は、細胞マーカーを検出/測定するために使用され得、当業者は、測定のためにどの方法が使用されるべきかは使用される細胞マーカーの種類により左右されることを理解する。例えば、質量タグが使用される場合、質量分析が測定のための選択方法であり得る。バーコード化された核酸が細胞マーカーとして使用される場合、シーケンシング(例えば、ハイスループット/次世代シーケンシング)が測定のための選択方法であり得る。場合によっては、ハイスループットシーケンシングが使用され、各検出されたバーコードの配列リードの数は、その特定のバーコードを含有した細胞の数を決定するために使用され得る。場合によっては、重要な基準は、各系譜における細胞の数ではなく、むしろある特定の細胞数を超えるクローン系譜の数である。

場合によっては、シーケンシング(例えば、ハイスループット/次世代シーケンシング)は、PCR産物が細胞内の細胞マーカーから(場合によっては、バーコード化された核酸が組み込まれたゲノム領域から)のバーコード領域を増幅したPCR反応からである場合、PCR産物で行われる(例えば、図1Aを参照されたい)。

場合によっては、腫瘍内の新生細胞の数の定量化、ならびにさらなる表現型決定及び分析は、プールした試料、単一、複数、もしくは組み合わせにより配置されたバイオマーカー(例えば、蛍光タンパク質、細胞表面タンパク質、及び抗体)を介して選別された試料から、または組織、臓器、細胞培養物からの個々の腫瘍の解剖、または他の可能な細胞伝播手段を介して行われる。

場合によっては、「ベンチマーク」が、細胞数の計算を補助するために使用され得る。例えば、場合によっては、対照が、試料中に「スパイク」され得る。例えば、スパイクされた(スパイクイン)対照は、細胞当たりの配列リードの数(例えば、配列リード当たりの細胞の数)を決定するために使用され得る。例えば、場合によっては、スパイクされた(スパイクイン)対照は、測定されたDNAの量をDNAが由来する細胞の数と相関させるためにも使用され得る。例えば、既知の細胞数を使用してDNAを調製することができ、DNAは、接触させた組織(本開示の方法により遺伝性の細胞マーカーと接触させた組織)の細胞から抽出したDNAと並行して処理され得る。そのようなスパイクされた(スパイクイン)対照(「ベンチマーカー」)はそれ自身の固有のバーコードを含み得る。スパイクされた対照からの結果を使用して、シーケンシング反応において検出された配列の数により表される細胞の数を導く/計算することができる(すなわち、スパイクされた(スパイクイン)対照は、測定値の量、例えば、配列リードの数を、細胞数、例えば、絶対細胞数に変換するための係数を提供するために使用され得る)。そのようなプロセスは、「正規化」と呼ばれる場合があり、例えば、シーケンシングの結果は検出される各固有のバーコードのリード数を提供し、この値は、次いで、検出された固有のバーコードを含んだ細胞の絶対数を計算するために、1つ以上の「ベンチマーク」と比較され得る(例えば、図1Aを参照されたい)。

場合によっては、複数のクローン細胞集団は主題の組織を遺伝性の細胞マーカーと接触させることにより検出可能であり、場合によっては、各区別可能な細胞集団は類似する遺伝子型を有するため、主題の方法は、特定の表現型についての集団の大きさの分布(例えば、腫瘍の大きさの分布)を提供するために使用され得る。例えば、初期の接触は全ての接触させた細胞において類似するゲノム改変をもたらす(例えば、全ての細胞が同じ遺伝子座を標的とするガイドRNAを受容する場合、全ての細胞が同じがん遺伝子対立遺伝子をコードする核酸を受容する場合など)が、各細胞集団(例えば、腫瘍)が無関係である場合、得られた細胞集団の大きさは、その特定の遺伝子型についてのクローン細胞集団の大きさの分布を提供することができる。例えば、主題の方法を行うことの目標は、特定の方法で腫瘍の挙動を改変する(例えば、腫瘍本来の数を変化させることなく大きさの分布を変化させる)ゲノム変化を探索することであり得る。例えば、以下の実施例(例えば、実施例1)は、p53欠損を備えた腫瘍を有する動物が最も大きい腫瘍にべき乗則分布された腫瘍の大きさの分布(非常に大きい腫瘍がさらなる稀に獲得される駆動物質変異により生成されるマルコフプロセスと一致する)を生成する証拠を含む。逆に、Lkb1不活性化を有する腫瘍を有する動物は大部分の病変の大きさを増加させ、通常の指数関数的成長プロセスを示唆した(例えば、図10、13、16、及び20を参照されたい)。

大きさの分布の測定値はいくつかの異なる方法で使用され得る。例えば、本明細書に記載される方法を行うことにより、所与の遺伝子型の細胞集団の大きさ(例えば、腫瘍の大きさ)のベースラインの大きさの分布を決定し、それを、同様に処置された動物が試験化合物(例えば、候補抗がん療法)でも処置されたときに測定される大きさの分布と比較することができる。大きさの分布の変化は、試験化合物が効果的であったか否かの基準として使用され得る。図示的な例として、発明者らは、p53欠損を備えた腫瘍を有するマウスの腫瘍の大きさの分布のベースライン測定値を決定し、p53欠損が他の腫瘍と比較してはるかにより大きいいくつかの腫瘍をもたらす傾向があったことを見出した。したがって、p53欠損腫瘍の大きさの分布は、標準分布ではないが、代わりに外れ値腫瘍を含んだ。本明細書に記載される方法を使用して、腫瘍の大きさの分布を変化させるが、動物の腫瘍を必ずしも治癒しない潜在的な治療薬(例えば、小分子、大分子、放射線、化学、絶食、抗体、免疫細胞療法、酵素、ウイルス、生物製剤、化合物など)についてスクリーニングすることが可能である。例えば、全てのp53欠損腫瘍を根絶しないが、代わりに、外れ値が大きい腫瘍が形成されることを阻害する療法(例えば、化合物)が見出される可能性がある。そのような変化は、試験した化合物が全体的な腫瘍数(腫瘍負荷)を必ずしも低減しないか、またはさらには腫瘍の大きさを平均化しないため、標準方法を使用して検出されない場合がある(そしてそのような化合物は、他の方法を使用して、腫瘍成長の阻害に対して効果がない化合物として廃棄される可能性がある)が、そのような療法(例えば、化合物)は、最も進行した腫瘍(例えば、最も大きくより危険な腫瘍)に対して効果的であるため(例えば、外れ値の腫瘍のリスクを低減する)、p53欠損腫瘍を有する患者を治療する臨床環境において非常に有用であり得る。

したがって、場合によっては、主題の方法は、集団の大きさ(例えば、腫瘍の成長/増殖)に対するそれらの効果について候補療法(例えば、小分子、大分子、放射線、化学療法、絶食、抗体、免疫細胞療法、酵素、ウイルス、生物製剤、化合物など)についてスクリーニングするために使用され得る。例えば、主題の方法は、試験療法、例えば、化合物(例えば、薬物)の存在下で行うことができ(例えば、本方法は、例えば、個体への投与を介して、組織を試験化合物と接触させるステップを含み得る)、例えば、薬物が添加されない(例えば、対照ビヒクル)並行実験との比較により、薬物の作用を測定することができる。系譜の特徴がある細胞集団が遺伝的に同じ(または類似する)場合、そのような方法は、化合物が細胞集団の大きさの分布に対して作用があるかを試験することができる。異なる特徴がある細胞が異なる遺伝子型を有する(例えば、異なる遺伝子が変異されて おり、及び/または異なる細胞系譜において発現される)場合、療法(例えば、化合物)は、組織がインビボの生きている動物内にある場合、例えば、同じ動物において同時に複数の異なる遺伝子型に対して試験され得る。場合によっては、そのような実験及び/または療法(例えば、化合物)のスクリーニングは、培養において成長させた組織(例えば、2D培養組織、3D培養組織、オルガノイド培養物)で行うことができる。場合によっては、そのような方法は、ゲッ歯類(例えば、マウス、ラット)、ブタ、モルモット、非ヒト霊長類などの非ヒト動物において行われ得る。

任意の摂動因子(例えば、小分子、大分子[例えば、抗体またはデコイ受容体)、放射線療法、化学療法、炎症誘導因子、ホルモン、ナノ粒子、免疫細胞療法、酵素、ウイルス、環境的介入(例えば、間欠的絶食、急性運動、食事制御)など)が複数の特徴がある細胞集団についての集団の大きさに対するその作用について評価され得る。遺伝的摂動もそれらの影響を評価するために全てのクローン系譜において誘導され得る。全ての系譜が同じ初期の遺伝子型のものである場合、個々のクローン系譜(例えば、腫瘍)の応答が決定され得る。クローン系譜が異なる定義された改変を有するように誘導された場合、異なる改変を有するクローン系譜に対する誘導性の遺伝的摂動の影響が決定され得る。誘導性の遺伝子改変を生成するための系は、Flp/FRTもしくはCre/loxP系(FlpまたはCre調節された対立遺伝子で発生させなかった細胞系譜において)またはテトラサイクリン調節可能な系(例えば、TRE−cDNA(複数可)及び/またはTRE−shRNA(複数可)及び/またはTRE−sgRNA(複数可)を有するtTAまたはrtTA)の使用を含むが、これらに限定されない。調節可能なCRISPR/Cas9ゲノム編集及び新生細胞の二次的形質導入は、一時的な様式でゲノム改変を生成し得る。

場合によっては、複数の特徴がある細胞集団を有する個体による外部摂動因子(例えば、候補抗がん療法)の作用及びそれに対する応答(例えば、薬理学的、化学的、代謝的、薬物動態、免疫原性、毒性学的、行動的など)は、細胞マーカーの測定前、測定中、及び/または測定後に評価される。

いくつかの実施形態では、主題の方法は、遺伝的に特徴がある細胞(例えば、遺伝的に特徴がある腫瘍)を生成した後、特徴がある細胞集団(例えば、腫瘍(複数可)の全てまたは一部)のうちの1つ以上をレシピエント(例えば、二次レシピエント)または複数のレシピエントに移植して、例えば、レシピエント(複数化)に腫瘍を播種することを含む。場合によっては、そのようなステップは、試験化合物に対して多数の動物をスクリーニングすることができ、各動物が同じ開始腫瘍からの細胞から播種される「レプリカ平板培養」に類似すると考えられ得る。したがって、場合によっては、本方法は、例えば、移植した細胞の成長を評価する(及び場合によっては、これは試験化合物の存在及び/または不在下で行われ得る)ために、試験化合物が移植のレシピエント(複数可)に投与される(例えば、本方法は、二次レシピエントに存在する複数の細胞マーカーのうちの少なくとも2つの量を検出及び測定する)ステップを含む。したがって、主題の方法は、初期に生成された遺伝的に特徴がある細胞(例えば、遺伝的に特徴がある腫瘍)が1つ以上のレシピエントに移植され、接触させた組織に存在する遺伝的に特徴がある細胞の数が遺伝的に特徴がある細胞の区別可能な系譜のうちの少なくとも2つについて計算され得る、連続移植研究の一部として使用され得る。上記の場合のいくつかにおいて(例えば、連続移植)、試験化合物は、連続移植レシピエントに投与され得、結果は対照(移植を受けたが、試験化合物を受容しなかった動物、試験化合物を受容したが、移植を受けなかった動物など)と比較され得る。

いくつかの実施形態では、1つ以上の遺伝的に特徴がある細胞は再度特徴をつけられる(例えば、再度バーコード化される)。換言すると、場合によっては、既に遺伝的に特徴がある細胞集団(例えば、腫瘍)は、遺伝性であり、互いに区別可能であり、かつ第1の 複数の細胞マーカーの細胞マーカーと区別可能である第2の複数の細胞マーカーと接触させられる。この方法では、ユーザは、例えば特徴がある細胞集団(例えば、腫瘍)内に存在するばらつきを調査することができる。いくつかの実施形態では、遺伝性のマーカー自体が経時的に変化して、クローン系譜を有する細胞の系統発生(例えば、ヌクレオチドバーコードの進化)を記録する。

遺伝性の系譜マーカーは、特徴がある細胞からのmRNAまたはcDNAの分析を通して細胞系譜を決定することを容易にする発現された遺伝子(内因性または操作されたのいずれか)内にもコードされ得る。場合によっては、細胞マーカーは、異なる種類の細胞マーカー(例えば、バーコード化されたRNAまたはタンパク質として特徴がある細胞により発現されたバーコード化されたDNA)に変換される。そのような場合、当業者は、細胞マーカーを測定するために使用される方法が測定されることが望まれる測定時の細胞マーカーの種類により決定されることを理解する。例えば、バーコード化されたDNAが細胞マーカーとして使用され、バーコード化されたDNAがバーコード化されたRNAとして発現される場合、RNAシーケンシング(例えば、全トランスクリプトームシーケンシング、単一細胞RNAシーケンシングなど)が、RNAバーコードが測定されることが望まれる細胞マーカーの種類である場合に測定に使用される方法であり得るか、またはDNAシーケンシング(例えば、全ゲノムシーケンシング、全エキソームシーケンシング、標的DNAシーケンシングなど)が、DNAバーコードが測定されることが望まれる細胞マーカーの種類である場合に測定に使用される方法であり得る。そのような場合、測定するための細胞マーカーの選択は、調査する、及び細胞マーカーに直接連結する細胞の所望の表現型により導かれてもよい(例えば、バーコード化されたRNA細胞マーカーは、RNA発現パターンが細胞マーカーに直接連結され得るように、単一細胞RNAシーケンシングを使用して測定されてもよい)。場合によっては、細胞系譜マーカーは、各系譜からの個々の細胞が各々他の系譜からの個々の細胞と関連し得るように、単一細胞分析方法(例えば、単一細胞RNA−seq、フローサイトメトリー、マスサイトメトリー(CyTOF)、MERFISH、単一細胞プロテオミクス)を使用して測定され得る。そのような場合、各系譜内の細胞の表現型が調査される。そのような場合、これらの分析は、外部摂動(例えば、薬物治療)に対する異なる系譜の細胞の表現型応答を評価するためにも使用することができる。

遺伝性細胞マーカー(例えば、バーコード化された核酸)を検出及び測定するとき、場合によっては、測定は全組織に由来する。そのため、組織試料は、組織から採取された一部であり得るか、または全組織(例えば、全肺、腎臓、脾臓、血液、膵臓など)であり得る。そのため、細胞マーカー(例えば、核酸)は、残りの細胞を表すように組織試料から抽出され得るか、または全組織から抽出され得る。

場合によっては、生体試料は血液試料である。場合によっては、生体試料は血液試料であるが、接触させた組織は血液ではない。例えば、場合によっては、遺伝的に特徴がある細胞は、血液中に化合物(例えば、タンパク質または核酸などの固有の分泌されたマーカー)を分泌することができ、血液中に存在する化合物の量は、その特定の化合物を分泌する存在する細胞の数を計算するために使用することができる。例えば、遺伝的に特徴がある細胞は、場合によっては、血液中に蛍光タンパク質を分泌することができ、蛍光タンパク質は、検出及び測定され、特定の化合物を分泌する細胞についての細胞集団の大きさを計算するために使用され得る。場合によっては、これらの分泌された遺伝性マーカーは、非摂動の個体において、または外部摂動(例えば、薬物)の投与後に検出される。

場合によっては、生体試料は、体液(例えば、血液、血漿、血清、尿、唾液、腹膜腔からの流体、胸膜腔からの流体、脳脊髄液など)である。場合によっては、生体試料は体液であるが、接触させた組織は体液ではない。例えば、場合によっては、遺伝的に特徴があ る細胞は、分析物(例えば、タンパク質、核酸、または代謝物などの固有のマーカー)を尿中に放出することができ、尿中に存在する化合物の量は、単独で、または外部摂動(例えば、候補抗がん療法)に応じてのいずれかで、その特定の化合物を放出した細胞の数または細胞系譜の数を計算するために使用することができる。

場合によっては、生体試料中の細胞マーカーの測定は、細胞マーカーと直接または間接的に関連し得、同じ生体試料または別個の生体試料に存在し得る、細胞、細胞構成要素(例えば、無細胞DNA、RNA、タンパク質、代謝物など)、または任意の他の分析物(例えば、DNA、RNA、タンパク質、代謝物、ホルモン、溶解酸素、溶解二酸化炭素、ビタミンD、グルコース、インスリン、温度、pH、ナトリウム、カリウム、塩化物、カルシウム、コレステロール、赤血球、ヘマトクリット、ヘモグロビンなど)の分析と並行して行われる。

場合によっては、上述したように、検出及び測定は、個体から収集した生体試料(例えば、血液試料)で行われる。場合によっては、検出及び測定は、場合によっては、接触させた組織の一部であり得るか、または全組織であり得る、接触させた組織の組織試料で行われる。

検出及び測定するとき、バイオマーカー(導入された遺伝性細胞マーカーとは異なる)が考慮され得る。例えば、主題の方法は、遺伝的に特徴がある細胞のバイオマーカーを検出及び/または測定するステップと、バイオマーカー測定の結果に基づいて遺伝的に特徴がある細胞を分類するステップとを含み得る。そのようなバイオマーカーは、いくつかの細胞特徴のいずれか、例えば、増殖状況(例えば、Ki−67タンパク質の検出、BrdU組み込みなど)、細胞型(例えば、様々な細胞型のバイオマーカーを使用して)、発達細胞系譜、幹細胞性(例えば、細胞が幹細胞であるか、及び/またはどんな型の幹細胞か)、細胞死(例えば、アネキシンV染色、切断されたカスパーゼ3、TUNELなど)、及び細胞シグナル伝達状態(例えば、ホスホ特異的抗体を使用して、例えば、シグナル伝達タンパク質のリン酸化状態を検出する)を示し得る。

場合によっては、ある特定の療法または摂動の遺伝子型特異性の理解は、(他の療法または摂動に対する類似性により)その療法または摂動の作用機序を伝えるために使用され得る。遺伝子型特異性を明らかにすることにより、本明細書に開示される方法は、定義された遺伝子型の併用療法の予測を行い、試験するために使用され得る。療法のパネルはそれらの遺伝子型特異性を確立するために試験され得る。

キット及びシステム 例えば、上記の方法のいずれかを実践するためのキット及びシステムも提供される。主題のキット及び/またはシステムの内容は、大きく異なり得る。キット及び/またはシステムは、例えば、(i)互いに区別可能な遺伝性細胞マーカーのライブラリ(例えば、バーコード化された核酸)、(ii)主題の方法を行うための指示、(iii)主題の方法の検出及び測定ステップから生成された値から細胞数を計算するためのソフトウェア、(iv)構成されたコンピュータシステムのうちの1つ以上を含み得る。

上記の構成要素に加えて、主題のキットは、主題の方法を実践するための説明書をさらに含み得る。これらの説明書は、様々な形態で主題のキットに存在し得、そのうちの1つ以上がキットに存在し得る。これらの説明書が存在する1つの形態は、適切な媒体または基材上に印刷された情報として、例えば、情報を印刷する紙(複数可)として、キットのパッケージ中に、添付文書などの中に存在し得る。さらに別の手段は、情報を記録している、コンピュータ可読媒体、例えば、ディスケット、CD、フラッシュドライブなどである。存在し得るさらに別の手段は、インターネットを介して使用され、離れたサイトで情 報にアクセスすることができるウェブサイトアドレスである。任意の簡便な手段がキットに存在し得る。

有用性 本開示の主題の様々な用途の例は、以下を含むが、これらに限定されない。より複雑な遺伝子型の作用の定量化:発明者らは、各腫瘍の2つの標的遺伝子の欠失を容易にする、CRISPR/Cas単一ガイドRNA(sgRNA)の対を発現するレンチウイルスベクターを既に生成し、検証した。腫瘍抑制因子の対の組み合わせを標的とするsgRNAを有するレンチウイルス−Creベクターの生成は、非常に並行な様式で腫瘍抑制因子間の協同性及び拮抗性を明らかにする。

併用療法のスクリーニングを可能にする多重インビボゲノム編集。多くの系の適応能力に起因して、併用療法は、多くの疾患を治療するための効果的な方法として浮上している。非常に多くの潜在的な治療の組み合わせは、全ての組み合わせが患者またはさらには前臨床動物モデルにおいて決して試験されることができない難しい状況をすぐに生み出す。しかしながら、このアッセイできない薬物の組み合わせのマトリックスは、患者に有効である組み合わせを含んでいる可能性がある。薬物治療を、さらなる薬物標的をコードするCRISPR/Cas媒介遺伝子欠失と組み合わせることにより、治療組み合わせの多重モデル化が可能となり得る。>100の対の薬物治療の作用を調べるには、本開示に記載される組成物及び方法を使用して並行して行うことができる。例えば、ヒト肺癌のマウスモデルにおいて3つの肺癌遺伝子型の状況におけるこれらの順列を調査するには、インビボでの対の薬物標的の作用を調べるためにセミハイスループット系を生成する。

他のがんの種類への拡張:本明細書に記載される方法は、細胞成長/増殖(例えば、新生物、例えば、肺腺癌の状況において)のゲノム薬理学的感受性を明らかにするために使用され得、本方法は、区別可能な系譜の集団の大きさが目的のものである、任意の簡便ながんの種類及び/または任意の簡便な状況に適用され得る。例えば、本開示に概要が述べられるアプローチは、例えば、ウイルスベクターを使用して、遺伝子操作されたモデルにおいて誘導され得る任意のがん(例えば、肉腫、膀胱癌、前立腺癌、卵巣癌、膵臓癌、造血性など)に適用することができる。

ヒト肺腺癌内の多種多様な腫瘍遺伝子型及び潜在的な療法の数の増大により、本開示に記載される多重定量的プラットホームは、橋渡しがん生物学の中心となり得る。本明細書に記載されるアプローチは、正しい療法を正しい患者に効率的に一致させるための橋渡し研究を可能にし、臨床における患者ケアに直接影響する。治療に最も応答する可能性がある腫瘍を有する患者の部分集団で臨床試験を実行するためにも役立ち得、したがって、薬物開発の成功率を向上し、またあまり標的とされない臨床試験に失敗した薬物を救うこともできる。

本開示の非限定的な態様の例 上述した本発明の主題の実施形態を含む態様は、単独でも、1つ以上の他の態様または実施形態と組み合わせても有益であり得る。上述の記載を限定することなく、1〜57の番号が付された、本開示のある特定の非限定的態様が以下に提示される。当業者に明らかであるように、本開示を読む際に、各々の個別に番号が付された態様が、任意の先行するまたは後に続く個別の番号の付された態様と共に使用され得るか、または組み合わせ得る。これは、態様の全てのそのような組み合わせのサポートを提供することを意図し、以下に明示的に記載されている態様の組み合わせに限定することを意図しない。

1.同じ組織内の複数のクローン細胞集団について集団の大きさを測定するための方法であって、 (a)生体組織を、遺伝性であり、互いに区別可能である複数の細胞マーカーと接触させて、接触させた組織内の遺伝的に特徴がある細胞の複数の区別可能な系譜を生成することと、 (b)遺伝的に特徴がある細胞の少なくとも一部が少なくとも1回の分裂を受けるため十分な時間が経過した後、接触させた組織に存在する複数の細胞マーカーのうちの少なくとも2つの量を検出及び測定し、それにより、測定した値のセットを生成することと、 (c)測定した値のセットを入力として使用して、遺伝的に特徴がある細胞の区別可能な系譜のうちの少なくとも2つについての、接触させた組織に存在する遺伝的に特徴がある細胞の数を計算することと を含む、方法。 2.接触させた組織内の遺伝的に特徴がある細胞は、新生細胞である、態様1に記載の方法。 3.組織は、ステップ(a)の前に新生細胞及び/または腫瘍を含む、態様1または2に記載の方法。 4.ステップ(b)の検出及び測定は、組織から回収された生体試料で行われる、態様1〜3のいずれか一つに記載の方法。 5.ステップ(b)の検出及び測定は、接触させた組織の組織試料で行われる、態様1〜3のいずれか一つに記載の方法。

6.複数の細胞マーカーの各細胞マーカーは、遺伝的に特徴がある細胞の系譜の既知の細胞遺伝子型に対応する、態様1〜5のいずれか一つに記載の方法。 7.接触は、組織の細胞を遺伝的に改変して、遺伝的に特徴がある細胞を生成することを含む、態様1〜6のいずれか一つに記載の方法。 8.同じ組織の複数の腫瘍について腫瘍の大きさを測定する方法である、態様1〜7のいずれか一つに記載の方法。 9.組織を接触させるステップは、新生細胞を誘導することを含む、態様1〜8のいずれか一つに記載の方法。 10.細胞マーカーは、新生細胞形成及び/または腫瘍形成を誘導する薬剤である、態様1〜9のいずれか一つに記載の方法。

11.検出及び測定は、接触の結果として、接触させた組織内で腫瘍が形成されるために十分な時間が経過した後に行われる、態様1〜10のいずれか一つに記載の方法。 12.複数の細胞マーカーは、バーコード化された核酸を含む、態様1〜11のいずれか一つに記載の方法。 13.検出及び測定は、各検出されたバーコードについての、ハイスループットシーケンシング、及び配列リードの数の定量化を含む、態様12に記載の方法。 14.複数の細胞マーカーは、新生細胞形成を誘導するバーコード化された核酸を含む、態様1〜13のいずれか一つ項に記載の方法。 15.バーコード化された核酸は、新生細胞形成を誘導し、相同組換え修復(HDR)DNAドナーテンプレート、1つ以上のがん遺伝子をコードする核酸、1つ以上の野生型タンパク質をコードする核酸、1つ以上の変異タンパク質をコードする核酸、1つ以上のCRISPR/CasガイドRNAをコードする核酸、1つ以上の短ヘアピンRNA(shRNA)をコードする核酸、及び1つ以上のゲノム編集タンパク質をコードする核酸のうちの1つ以上を含む、態様12〜14のいずれか一つに記載の方法。

16.ゲノム編集タンパク質は、CRISPR/Cas RNAガイドタンパク質、転写活性化因子または抑制因子ポリペプチドに融合したCRISPR/Cas RNAガイドタンパク質、Cas9タンパク質、転写活性化因子または抑制因子ポリペプチドに融合したCas9タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)、TALEN、ファージ由来インテグラーゼ、Creタンパク質、Flpタンパク質、及びメガヌクレアーゼ タンパク質から選択される、態様15に記載の方法。 17.バーコード化された核酸は、線状または環状DNA分子である、態様12〜16のいずれか一つに記載の方法。 18.バーコード化された核酸は、プラスミド、合成核酸断片、及びミニサークルから選択される、態様12〜16のいずれか一つに記載の方法。 19.バーコード化された核酸は、RNA分子である、態様12〜16のいずれか一つに記載の方法。 20.バーコード化された核酸は、RNA/DNAハイブリッドまたは核酸/タンパク質複合体である、態様12〜16のいずれか一つに記載の方法。

21.組織は、無脊椎動物組織である、態様1〜19のいずれか一つに記載の方法。 22.組織は、脊椎動物組織である、態様1〜19のいずれか一つに記載の方法。 23.組織は、哺乳類または魚の組織である、態様1〜19のいずれか一つに記載の方法。 24.組織は、ラット組織、マウス組織、ブタ組織、非ヒト霊長類組織、またはヒト組織である、態様1〜19のいずれか一つに記載の方法。 25.組織は、生きている動物の一部である、態様1〜24のいずれか一つに記載の方法。

26.組織は、動物の体外で成長した操作された組織である、態様1〜24のいずれか一つに記載の方法。 27.組織は、筋肉、肺、気管支、膵臓、乳房、肝臓、胆管、胆嚢、腎臓、脾臓、血液、腸、脳、骨、膀胱、前立腺、卵巣、眼、鼻、舌、口、咽頭、喉頭、甲状腺、脂肪、食道、胃、小腸、結腸、直腸、副腎、軟組織、平滑筋、脈管構造、軟骨、リンパ管、前立腺、心臓、皮膚、網膜、生殖器系、及び性器系から選択される、態様1〜26のいずれか一つに記載の方法。 28.遺伝的に特徴がある細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後、(i)遺伝的に特徴がある細胞のバイオマーカーを検出及び/または測定することと、(ii)バイオマーカーの検出及び/または測定の結果に基づいて遺伝的に特徴がある細胞を分類することとをさらに含む、態様1〜27のいずれか一つに記載の方法。 29.バイオマーカーは、細胞増殖状態、細胞型、発達的細胞系譜、細胞死、及び細胞のシグナル伝達状態のうちの1つ以上のバイオマーカーである態様28に記載の方法。 30.細胞マーカーは、ウイルスベクターを介して組織に送達される、態様1〜29のいずれか一つに記載の方法。

31.ウイルスベクターは、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、及びレトロウイルスベクターから選択される、態様30に記載の方法。 32.同じ組織の複数のクローン的に無関係な腫瘍について腫瘍の大きさを測定する方法であって、 (a)組織を、複数のバーコード化された核酸細胞マーカーと接触させ、それにより、接触させた組織内の遺伝的に特徴がある新生細胞の複数の区別可能な系譜を生成することと、 (b)遺伝的に特徴がある新生細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後、ハイスループット核酸シーケンシングを行って、接触させた組織に存在するバーコード化された核酸細胞マーカーのうちの少なくとも2つの量を検出及び測定し、それにより、測定した値のセットを生成することと、 (c)測定した値のセットを入力として使用して、遺伝的に特徴がある新生細胞の区別可能な系譜のうちの少なくとも2つについての、接触させた組織に存在する遺伝的に特徴 がある新生細胞の数を計算することと を含む、方法。 33.組織は、ステップ(a)の前に新生細胞及び/または腫瘍を含む、態様32に記載の方法。 34.ステップ(b)のハイスループット核酸シーケンシングは、組織から回収された生体試料で行われる、態様32または33に記載の方法。 35.ステップ(b)のハイスループット核酸シーケンシングは、接触させた組織の組織試料で行われる、態様32または33に記載の方法。

36.複数のバーコード化された核酸細胞マーカーの各バーコード化された核酸細胞マーカーは、遺伝的に特徴がある新生細胞の系譜の既知の細胞遺伝子型に対応する、態様32〜35のいずれか一つに記載の方法。 37.接触は、組織の細胞を遺伝的に改変して、遺伝的に特徴がある新生細胞を生成することを含む、態様32〜36のいずれか一つに記載の方法。 38.バーコード化された核酸は、新生細胞形成を誘導する、態様32〜37のいずれか一つに記載の方法。 39.バーコード化された核酸が、新生細胞形成を誘導し、相同組換え修復(HDR)DNAドナーテンプレート、1つ以上のがん遺伝子をコードする核酸、1つ以上の野生型タンパク質をコードする核酸、1つ以上の変異タンパク質をコードする核酸、CRISPR/CasガイドRNAをコードする核酸、短ヘアピンRNA(shRNA)をコードする核酸、及びゲノム編集タンパク質をコードする核酸のうちの1つ以上を含む、態様32〜37のいずれか一つに記載の方法。 40.ゲノム編集タンパク質は、CRISPR/Cas RNAガイドタンパク質、転写活性化因子または抑制因子ポリペプチドに融合したCRISPR/Cas RNAガイドタンパク質、Cas9タンパク質、転写活性化因子または抑制因子ポリペプチドに融合したCas9タンパク質、ジンクフィンガーヌクレアーゼ(ZFN)、TALEN、ファージ由来インテグラーゼ、Creタンパク質、Flpタンパク質、及びメガヌクレアーゼタンパク質から選択される、態様39に記載の方法。

41.バーコード化された核酸は、線状または環状DNA分子である、態様32〜40のいずれか一つに記載の方法。 42.バーコード化された核酸は、プラスミド、合成核酸断片、及びミニサークルから選択される、態様32〜40のいずれか一つに記載の方法。 43.バーコード化された核酸は、RNA/DNAハイブリッドまたは核酸/タンパク質複合体である、態様32〜42のいずれか一つに記載の方法。 44.組織は、無脊椎動物組織である、態様32〜43のいずれか一つに記載の方法。 45.組織は、脊椎動物組織である、態様32〜43のいずれか一つに記載の方法。

46.前記組織が、哺乳類または魚の組織である、32〜43のいずれか一つに記載の方法。 47.組織は、ラット組織、マウス組織、ブタ組織、非ヒト霊長類組織、またはヒト組織である、態様32〜43のいずれか一つに記載の方法。 48.組織は、生きている動物の一部である、態様32〜47のいずれか一つに記載の方法。 49.組織は、動物の体外で成長した操作された組織である、態様32〜47のいずれか一つに記載の方法。 50.組織は、筋肉、肺、気管支、膵臓、乳房、肝臓、胆管、胆嚢、腎臓、脾臓、血液、腸、脳、骨、膀胱、前立腺、卵巣、眼、鼻、舌、口、咽頭、喉頭、甲状腺、脂肪、食道、胃、小腸、結腸、直腸、副腎、軟組織、平滑筋、脈管構造、軟骨、リンパ管、前立腺、心臓、皮膚、網膜、生殖器系、及び性器系から選択される、態様32〜49のいずれか一 つに記載の方法。

51.遺伝的に特徴がある新生細胞の少なくとも一部が少なくとも1回の分裂を受けるために十分な時間が経過した後、(i)遺伝的に特徴がある新生細胞のバイオマーカーを検出及び/または測定することと、(ii)バイオマーカーの検出及び/または測定の結果に基づいて遺伝的に特徴がある新生細胞を分類することとをさらに含む、態様32〜50のいずれか一つに記載の方法。 52.バイオマーカーは、細胞増殖状態、細胞型、発達的細胞系譜、細胞死、及び細胞のシグナル伝達状態のうちの1つ以上のバイオマーカーである、態様51に記載の方法。 53.細胞マーカーは、ウイルスベクターを介して前記組織に送達される、態様32〜52のいずれか一つに記載の方法。 54.ウイルスベクターは、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、ボカウイルスベクター、泡沫状ウイルスベクター、及びレトロウイルスベクターから選択される、態様53に記載の方法。 55.組織を試験化合物(例えば、試験薬物)と接触させ、試験化合物が、細胞集団の大きさ及び/または細胞集団の大きさの分布に作用を有したかを決定することを含む、態様1〜54のいずれか一つに記載の方法。

56.前記遺伝的に特徴がある細胞を生成した後、遺伝的に特徴がある細胞(例えば、1つ以上の腫瘍を移植する)のうちの1つ以上を1つ以上のレシピエント(例えば、二次レシピエント、例えば、二次レシピエントに腫瘍を播種する)に移植することを含む、態様1〜55のいずれか一つに記載の方法。 57.試験化合物は1つ以上のレシピエントに投与され、レシピエント(複数可)に存在する複数の細胞マーカーのうちの少なくとも2つの量を検出及び測定する(例えば、試験化合物の存在に応答して移植した細胞の成長を評価するため)ことを含む、態様56に記載の方法。

以下の実施例は、当業者に本発明の製造方法及び使用方法の完全な開示及び説明を提供するために提示するものであり、発明者らが考える発明の範囲を限定することを意図するものではなく、また、以下の実験が行われた全てまたは唯一の実験であることを表すことを意図するものでもない。使用する数字(例えば、量、温度など)に関して、正確さを確保するための努力を行ってはいるが、いくらかの実験誤差及び偏差は考慮されるべきである。別途示されない限り、部は、重量部であり、分子量は、重量平均分子量であり、温度は、摂氏温度であり、圧力は、大気圧であるか、またはそれに近い。

実施例1:Tuba−seq:インビボでの腫瘍抑制の適応度ランドスケープを明らかにするための定量的及び多重アプローチ がんの成長及び進行は、多段階の確率的な進化プロセスである。がんゲノムシーケンシングはヒト腫瘍で生じるゲノム改変を同定する際の機器であったが、天然組織内の腫瘍成長に対するこれらの改変の結果はほとんど明らかにされないままである。ヒトがんの遺伝子操作されたマウスモデルは、インビボでの腫瘍成長の研究を可能にするが、正確かつ測定可能な様式で得られた腫瘍の大きさを定量化するための方法の欠如により、個々の腫瘍抑制遺伝子の作用の規模及びモードを理解する発明者らの能力が制限されてきた。ここで、発明者らは、腫瘍バーコード化をウルトラディープバーコードシーケンシング(Tuba−seq)と統合して、ヒトがんのマウスモデルにおいて腫瘍抑制因子機能を調べる方法を提示する。Tuba−seqは、肺腫瘍の3つの典型的な遺伝子型における腫瘍の大きさの異なる分布を明らかにする。Tuba−seqを多重CRISPR/Cas9媒介ゲノム編集と組み合わせることにより、発明者らはヒト肺腺癌において最も頻繁に不活性化された腫瘍抑制経路のうちの11種の作用をさらに定量化した。このアプローチは、メ チルトランスフェラーゼSetd2及びスプライシング因子Rbm10を肺腺癌成長の新規抑制因子として同定する。前例がない分解能、並列化、及び精度で、Tuba−seqは腫瘍抑制遺伝子機能の適応度ランドスケープの広範な定量化を可能にする。

結果 ウルトラディープバーコードシーケンシング(Tuba−seq)との腫瘍バーコード化は、腫瘍の大きさの精度及び並列定量化を可能にする。 発がん性KRASはヒト肺腺癌の主要な駆動物質であり、早期肺腫瘍は、肺上皮細胞におけるCreの発現が発がん性KrasG12Dの発現をもたらすLoxP−Stop−LoxP KrasG12Dノックインマウス(KrasLSL−G12D/+)を使用してモデル化することができる。LKB1及びP53は、発がん性KRAS駆動ヒト肺腺癌において頻繁に変異される腫瘍抑制因子であり、Lkb1及びp53の欠損は発がん性KrasG12D駆動肺腫瘍のマウスモデルにおいて腫瘍負荷を増加させる(図7A)。肺癌のウイルス−Cre誘導マウスモデルは、多数の腫瘍の同時発生を可能にし、個々の腫瘍はレンチウイルス媒介DNAバーコード化により安定してタグ付けされ得る。したがって、発明者らは、バルク腫瘍保有肺からのレンチウイルスバーコード領域のハイスループットシーケンシングが各固有にバーコード化された腫瘍内のがん細胞の数を定量することができるかを決定しようとした(図7B)。

発がん性KrasG12D駆動肺腫瘍の成長、ならびに腫瘍成長に対するLkb1及びp53の喪失の影響を調べるために、発明者らは、106個を超える固有のDNA バーコードを含有するレンチウイルス−Creベクターのライブラリ(Lenti−mBC/Cre;図1A及び図7B)を用いて、KrasLSL−G12D/+;Rosa26LSL−Tomato(KT)、KT;Lkb1flox/flox(KLT)、及びKT;p53flox/flox(KPT)マウスにおいて肺腫瘍を発生させた。腫瘍発生の11週間後、KTマウスは、広範な過形成及びいくつかの小さい腫瘍塊を発達させた(図1B及び図7C)。興味深いことに、KLTマウスは比較的均一の大きさの大きい腫瘍を有し、KPTマウスは非常に多様な腫瘍の大きさを有した(図1B)。

ウルトラディープシーケンシングを使用して全ての病変のがん細胞数を定量化するために、発明者らは、各マウスから単離したバルク肺DNAの約1/10の組み込んだレンチウイルスバーコード領域をPCR増幅し、これをマウス当たり107リードを超える平均深度までシーケンシングした(図1A、方法)。マウス内の腫瘍の大きさにおいて1000倍を超える変動が観察された(図1C)。小さい病変からのバーコードリードは、固有の腫瘍を表すか、または大きい腫瘍からの類似するバーコードの繰り返し起こるシーケンシングエラーから生成された可能性がある。これらの偽腫瘍の発生を最小にするために、シーケンシングエラーの統計モデルを生成するアルゴリズムを使用して(DADA2:図2及び図8)、同じ腫瘍バーコードに由来すると予想されるリードを集約した。DADA2集約速度及び最小腫瘍の大きさは、発明者らの呼び出しパイプラインの再現性を最大にするようにも選択された(図8D〜F)。これらのアプローチは非常に限られているが、腫瘍定量化に対する繰り返し起こるシーケンシングエラーの作用をおそらく完全には排除しない(図2A)。

各腫瘍におけるがん細胞の絶対数の定量化により、同じ遺伝子型の個々のマウスからのデータの集約、及び遺伝子型にわたる腫瘍の大きさの比較が可能となる。リード計数のがん細胞数への変換を可能にするために、組織均質化及びDNA抽出の前に、定義された数で、既知のバーコードを有する細胞を各肺の試料に添加した(図1A及び図9)。したがって、腫瘍リード計数を「ベンチマーク」リード計数に対して正規化することにより、各マウスの各腫瘍におけるがん細胞の絶対数を計算することができた(図1A及び図9)。

Tuba−seqは、技術的反復間で非常に再現性があり、シーケンシングエラー、個々のIllumina(登録商標)シーケンシング装置の本質的なエラー率の変動、バーコードGC含有量、バーコードの多様性、マウス内の腫瘍数、及びリード深度を含む腫瘍の大きさの分布を偏らせる可能性がある多くの技術的変数に非感受性である(図2B〜D、図10)。中程度の測定誤差は小さい大きさで存在し、これは全体的な大きさの分布を偏らせない。腫瘍の大きさの分布は、同じ遺伝子型のマウス間でも非常に再現性があった(R2>0.98;図2E、F、図10G)。実際、大きさの分布の教師なし階層的クラスター化は、腫瘍が異なる力価のLenti−mBC/Creで誘導された場合でも、それらの遺伝子型によりマウスを明らかに分離した(図2G及び図10D)。しかしながら、発明者らの方法は、同じ遺伝子型のマウス間の腫瘍の大きさのスペクトルにおいて変動を検出した。この変動は、同じマウス内の腫瘍の2つの画分間で観察されたランダムなノイズよりも非常に大きく、Tuba−seqがマウス間の腫瘍負荷における本質的なばらつきよりも有意により正確であることを示唆する(図2E、G)。したがって、Tuba−seqは、KT、KLT、及びKPTマウスにおける数千の肺病変内のがん細胞の数を迅速かつ正確に定量化した(図1C、図10C)。

腫瘍の大きさの分析は、2つの腫瘍抑制モードを明らかにする。 腫瘍成長に対するp53またはLkb1のいずれかの欠損の作用を評価するために、分布内の異なるパーセンタイルの腫瘍内のがん細胞の数を計算した。興味深いことに、KLTマウスの腫瘍は一貫してKT腫瘍よりも大きく、p53の欠失は、腫瘍の大部分においてがん細胞の数を改変しなかった(図3A〜C)。代わりに、p53欠損腫瘍が小さい画分が例外的な大きさに成長し、マウスのいずれかにおいて最も大きいものであった(図1C)。

p53及びLkb1の欠損により付与された腫瘍成長における相違をより良く理解するために、KT、KLT、及びKPTマウスにおける腫瘍の大きさの分布に最も適合する数学的分布を定義した。Lkb1欠損腫瘍は、分布の全範囲にわたって対数正規的に分布された(図3D)。対数正規分布は、正常に分布される速度で単純指数関数的腫瘍成長から予想される。非常に大きい腫瘍がこの基準を大幅にシフトさせることなく平均の腫瘍の大きさを予測するために、腫瘍の大きさの対数正規分布を所与としてがん細胞の平均数(LN平均)の最尤推定量も計算した。この測定により、KLT腫瘍は、平均して、KT腫瘍よりも7倍多いがん細胞を有し、増殖を制限するLkb1の役割と一致する(図3A、C)。KPTマウスにおけるより大きい腫瘍負荷及び明らかにより大きい腫瘍にもかかわらず、p53欠損は、発明者らの平均の病変の大きさについての推定を増加させなかった。代わりに、p53欠損腫瘍は、大きい大きさでべき乗則分布され、全腫瘍負荷の上昇は、稀な例外的に大きい腫瘍により引き起こされた(図3D)これは、p53欠損腫瘍が、後の迅速な成長を駆動する、稀だが大いに腫瘍原性のさらなる事象を獲得することを示唆する。

腫瘍抑制遺伝子の多重CRISPR/Cas9媒介不活性化のためのバーコード化されたレンチウイルスベクターのライブラリの生成 ヒト肺腺癌は、多様なゲノム改変を有するが、腫瘍成長に対するそれらの影響を説明する定量的データが不足している(図7A及び12B)。多くの既知及び候補腫瘍抑制遺伝子の腫瘍抑制機能を並行して同時に定量化するために、Tuba−seq及び従来のCreに基づくマウスモデルを多重CRISPR/Cas9媒介インビボゲノム編集と組み合わせた(図4A〜C)。単一マウスにおける異なる腫瘍遺伝子型の評価は、マウス間のばらつきの作用を排除することにより、Tuba−seqの分解能も最大にするはずである。発明者らは、最初に、tdTomato受容体またはLkb1のいずれかを標的とするレンチウイルス−sgRNA/Creベクターで腫瘍を発生させることにより、H11LSL−Cas9対立遺伝子を有するマウスにおいて肺腫瘍の効率的なCas9媒介遺伝子 の不活性化を確認した(図11)。tdTomatoのホモ接合不活性化は約40%の腫瘍において達成され、Cas9媒介Lkb1不活性は腫瘍負荷を増加させた(図11)。これらのデータは、発明者らの能力がこれらの方法を使用してKras駆動肺癌モデルにおいて腫瘍を遺伝的に改変することを示す。

発明者らは、クロマチンリモデリング(Setd2及びArid1a)、スプライシング(Rbm10)、DNA損傷応答(Atm及びp53)、細胞周期制御(Rb1及びCdkn2a)、栄養及び酸化ストレス感知(Lkb1及びKeap1)、環境ストレス応答(p53)、ならびにTGF−β及びWntシグナル伝達(それぞれ、Smad4及びApc)に広く関与する遺伝子を含む、多様な経路を表す、11個の既知及び推定上の肺腺癌腫瘍抑制遺伝子を選択した(図4B及び図7A)。転写物の初期、既知の機能ドメインの上流、及びヒト腫瘍に存在する大半の変異の上流においてインデルを生成した効率的なsgRNAが同定された(図12A)。Tuba−seqを使用して各腫瘍内のがん細胞の数の正確な定量化を可能にするために、各腫瘍抑制因子標的Lenti−sgRNA/Creベクター、及び二構成要素バーコードを有する4つのLenti−sgInert/Cre陰性対照ベクターを多様化した。このバーコードは、各腫瘍を固有にタグ付けするために、各sgRNAに特異的な固有の8−ヌクレオチド「sgID」及びランダムな15−ヌクレオチドバーコード(BC)からなった(sgID−BC;図4A、B、及び図12C〜E)。インビトロ切断効率は、個々に及びプール内のsgRNAの各々について決定された(図13)。

インビボでの腫瘍抑制機能の並行定量化 多重様式で肺腫瘍成長に対する各遺伝子の不活性化の作用を定量化するために、11個のバーコード化されたLenti−sgRNA/Creベクター及び4つのバーコード化されたLenti−sgInert/Creベクターのプールを用いてKT及びKT;H11LSL−Cas9(KT;Cas9)マウスにおいて腫瘍を発生させた(Lenti−sgTS−Pool/Cre;図4B、C)。KTマウスと比較して低用量のウイルスを受容したにもかかわらず、KT;Cas9マウスは、腫瘍発生の12週間後、KTマウスに対して巨視的腫瘍の数及び大きさが増加した(図4D、E)。各sgRNAを有する各腫瘍内のがん細胞の数を決定するために、バルク腫瘍保有肺DNAからのsgID−BC領域を増幅し、産物をディープシーケンシングし、発明者らのTuba−seq分析パイプラインを適用した。各マウス内の不活性sgRNAの分布に対して各腫瘍抑制因子についての成長作用の全分布を計算した。各sgRNAについて、分布内の異なるパーセンタイルの腫瘍内のがん細胞の数は、不活性分布において対応するパーセンタイルの大きさによって分割された(図5A)。この相対的及びマウス内比較は、Tuba−seqの精度を最大にした(方法)。一般的にがん成長を抑制する腫瘍抑制因子を同定するために、11個の腫瘍抑制因子標的sgRNAの各々を含有する腫瘍の相対的な対数正規(LN)の平均の大きさも決定した(図5B)。これらの分析は、KrasG12D駆動肺腫瘍成長においてLkb1、Rb1、Cdkn2a、及びApcの既知の腫瘍抑制機能を確認した(図5A、B、及び図12B)。KTマウス(H11LSL−Cas9対立遺伝子を欠く)においてLenti−sgTS−Pool/Creで発生させた腫瘍は、各sgRNAを有する腫瘍の大きさの分布において相違がほんのわずかであった(図14A〜C)。

この方法の再現性を評価するために、Lenti−sgTS−Pool/Creで腫瘍を発生させた15週間後にさらなるKT;Cas9マウスのコホートを分析した。腫瘍発生後12週間で同定された全ての腫瘍抑制因子の腫瘍抑制作用が確認された(図5C及び図14E〜F)。多重レンチウイルス−sgRNA/Cre送達及び腫瘍バーコードシーケンシングを使用して腫瘍抑制因子を検出する発明者らの能力は、95パーセンタイル腫瘍のLNの平均の大きさ及びがん細胞の相対数の両方により評価されるとき、再現性があった(図5C及び図14E、F)。95パーセンタイル腫瘍での成長作用は、非常に良く 相関し(R2=0.953)、LN平均に関連するp値は、15週の時間点で、3匹のマウスしか使用しなかったにもかかわらず、2つの時間点間で類似した(図5C)。

p53媒介腫瘍抑制の同定及び腫瘍抑制因子プール内の腫瘍の大きさの分布の再現 KPTマウスにおける腫瘍の大きさの分布と一致して、LN平均または95パーセンタイルまでの腫瘍の分析のいずれも、Lenti−sgTSPool/Cre発生腫瘍を有するKT;Cas9マウスにおいてp53標的化の作用を明らかにしなかった(図5)。予想どおり、Lenti−sgp53/Cre発生腫瘍はより大きい大きさでべき乗則分布を示し、sgp53はLenti−sgTSPool/Cre誘導腫瘍を有するKT;Cas9マウスにおいて最も大きい腫瘍内で濃縮された(図15A、B)。これは、小さい画分の腫瘍が大きい大きさに成長することを可能にするp53不活性化と一致する。p53標的化の作用は、さらなる改変の進行性蓄積及び腫瘍進行を制限する際の既知のp53の作用と一致する後の15週の時間点でより大きかった(図15A、B)。

重要なことには、Lenti−sgTSPool/Cre発生腫瘍を有するKT;Cas9マウスにおいて、Lkb1欠損腫瘍は、KLTマウスからのデータと一致する腫瘍の大きさの対数正規分布を示した(図16A)。したがって、CRISPR/Cas9媒介ゲノム編集により生成されたp53欠損及びLkb1欠損腫瘍の両方は、従来のフロキシング対立遺伝子を使用して発生させたものと類似する大きさの分布を有する。これは、プールされた環境においても、個々の腫瘍の大きさの定量化が腫瘍抑制因子不活性化時に腫瘍の大きさが異なる特徴的な分布を明らかにすることができることを示唆する。

インビボでの肺腫瘍成長の抑制因子としてのSetd2及びRbm10の同定 興味深いことに、インビボでの肺腫瘍成長に対する既知の作用によりいくつかの腫瘍抑制因子を適切に明らかにすることに加えて、Tuba−seqもメチルトランスフェラーゼSetd2及びスプライシング因子Rbm10を肺腫瘍成長の主な抑制因子として同定した。Setd2は、唯一のヒストンH3K36me3メチルトランスフェラーゼであり、微小管のメチル化を通してゲノム安定性にも影響を及ぼし得る。肺腺癌を含むいくつかの主要ながんの種類において頻繁に変異されるにもかかわらず、インビボでの腫瘍抑制因子としてのその役割についてはほとんど知られていない。Setd2の不活性化は腫瘍の大きさを劇的に増加させ、sgSetd2含有腫瘍は、対照腫瘍よりも5倍超多いがん細胞を有する(図5A、B、及び図16B)。興味深いことに、Lenti−sgSetd2/Creで発生させた腫瘍は、腫瘍の大きさの対数正規分布を示した(図16C)。実際、Lkb1不活性化のみが類似する適応度利点をもたらし、肺腺癌患者において過剰腫瘍成長を駆動する際のSETD2変異の潜在的な重要性を強調する(図16)。

スプライシング因子も多くのがんの種類において潜在的な腫瘍抑制因子として現れている。スプライソソームの構成要素は10〜15%のヒト肺腺癌において変異するが、腫瘍抑制に対するそれらの機能的寄与についてはほとんど知られていない。Rbm10の不活性化は、上位50パーセントの肺腫瘍においてがん細胞の数を大幅に増加させ、LNの平均の大きさを増加させた(図5A、B)。これらのデータは、Setd2媒介リジンメチル化の不在及び異常な前mRNAスプライシングが各々、肺腺癌において顕著な腫瘍原性促進作用を有することを示唆する。

Tuba−seqはインビボでの腫瘍抑制を定量化するための正確かつ高感度な方法である。 同じマウス内に異なる遺伝子改変を保有する多くの腫瘍内のがん細胞の数を定量化することにより、複数の生物学的及び技術的変動源の同定及び排除が可能となった(方法)。マウス当たり多くの病変を発生させ、全ての病変をバーコード化し、複数のsgRNAを各マウス内にプールし、プールとともに不活性sgRNAを含むことにより、腫瘍成長に おけるばらつきの多くの源を同定し、補正することができる。これらの重要な特徴なしには、発明者らの分析は、発生させた腫瘍の数におけるばらつき(CV=27%)、同じ遺伝子型のマウス間の平均腫瘍の大きさ(CV=38%)、ならびに個々のマウス内の異なる腫瘍抑制遺伝子不活性化の平均効果量間のわずかな相関(CV=11%)に困惑する。

全ての腫瘍内のsgRNAの表示などのバルク測定値を使用するよりも、各腫瘍の大きさを計算することにより、異なる腫瘍抑制因子不活性化の成長作用をより正確かつ高感度に確かめた。興味深いことに、発明者らの同定した腫瘍抑制因子(Apc、Rb1、Rbm10、及びCdkn2a)の3分の2は、各バーコード化された腫瘍内のがん細胞の数を考慮したときにのみ同定され、sgID表示の倍率変化のみを考慮したときには同定されなかった(図5D)。実際、効果量、統計的有意性、及び小さい作用で腫瘍抑制因子を検出する能力は全て、sgID表示における変化の単純な分析と比較して、Tuba−seqパイプリンを使用して向上した(図5E、F)。したがって、Tuba−seqは、機能的腫瘍抑制遺伝子の成長抑制作用を正確に捕捉するために必要な分解能レベルを提供する。

的確なCRISPR/Cas9媒介ゲノム編集の確認 腫瘍抑制因子不活性化についての選択を調査し、的確なsgRNA媒介ゲノム編集を確認するための直交アプローチとして、3匹のLenti−sgTS−Pool/Cre感染(形質導入)KT;Cas9マウスのバルク肺DNAからの各sgRNA標的領域をPCR増幅し、ディープシーケンシングした。比較的高画分のSetd2、Lkb1、及びRb1対立遺伝子が、的確なsgRNA活性、及びこれらの遺伝子の不活性化を伴う腫瘍拡大と一致する標的部位で不活性化インデルを有した(図6A及び図15C〜Fならびに17A、B)。

Lenti−sgTS−Pool/Cre感染(形質導入)KT;Cas9マウスのバルク肺DNAからのこれらの遺伝子の標的領域の増幅及びシーケンシングも、全ての標的遺伝子がインデルを含有したことを確認した(図6A)。発明者らのプールに含まれた遺伝子の全てはヒト肺腺癌において繰り返し変異され、発がん性KRASを有する腫瘍において頻繁に変異された(図7A)が、Arid1a、Smad4、Keap1、及びAtmは、いずれの基準によっても腫瘍抑制因子として同定されなかった(図5及び6Aならびに図14D〜F)。Atmの腫瘍抑制機能の欠如は、Atmfloxed対立遺伝子を使用した結果と一致し、Lenti−sgSmad4/Creに感染させた(形質導入した)KT;Cas9マウスにおけるインビボでの発がん性KrasG12D駆動肺腫瘍成長でのSmad4の腫瘍抑制機能の欠如を確認した(図17C、D)。これらの遺伝子について、遺伝子発現もしくは環境状況の変化、追加時間、または同時がん遺伝子及び/もしくは腫瘍抑制因子改変は、肺がん細胞において成長利点を付与するこれらの経路の不活性化に必要であり得る。

Setd2の腫瘍抑制作用をさらに検証し、Setd2欠損腫瘍の組織診断を評価するために、不活性sgRNA(sgNeo2)またはSetd2を標的とする2つの異なるsgRNAのいずれかを含有するレンチウイルスベクターを用いてKT及びKT;Cas9マウスにおいて腫瘍を誘導した。Lenti−sgSetd2/Creベクターのいずれかで発生させた腫瘍を有するKT;Cas9マウスは、大きい腺腫及び腺癌を発達させ、同じウイルスで発生させた腫瘍を有するKTマウスよりも全体的に有意に大きい腫瘍負荷を有した(図6B、C)。これらのマウスの組織学的分析は大きいマウス間のばらつきを明らかにしたが、Tuba−seqによる個々の腫瘍の大きさの分析は、対照腫瘍に対してSetd2欠損腫瘍においてがん細胞の数がほぼ4倍増加したことを確認した(図6C、D、及び図18)。重要なことには、従来の方法によるSetd2腫瘍抑制の検証は、発明者らの初期の11の推定上の腫瘍抑制因子のスクリーニングよりも多いマウスを必 要とし、スループットを増加させ、コストを削減する多重sgRNAの利益を強調する。

考察 多くの推定上の腫瘍抑制因子ががんゲノムシーケンシングから同定されてきたが、限られた戦略が、迅速、系統的、かつ定量的様式で、それらの機能を試験する(例えば、インビボで)ために存在する(図19)。DNAバーコード化、ハイスループットシーケンシング、及びCRISPR/Cas9媒介ゲノム編集を組み合わせることにより、Tuba−seqは、これらの分析のスループットを増加させるだけでなく、インビボでの腫瘍成長の例外的に正確かつ詳細な定量化を可能にする。

興味深いことに、同時に、同じマウスで、同じゲノム改変で発生させた腫瘍は、成長のたった12週間後に大いに異なる大きさに成長した。したがって、さらなる自発的改変、初期の形質転換細胞の状態における相違、または局所微小環境は、どのくらい迅速に腫瘍が成長し、拡大し続ける能力を有するかに影響を及ぼし得る。Tuba−seqは、遺伝子機能の特性を明らかにした腫瘍の大きさの遺伝子型特異的分布を固有に明らかにすることもできた。p53欠損は、最も大きい腫瘍についてべき乗則分布される腫瘍の大きさの分布を生成し、非常に大きい腫瘍がさらなる稀に獲得される駆動物質変異により生成されるマルコフプロセスと一致する。逆に、Lkb1不活性化は、大部分の病変の大きさを増加させ、通常の指数関数的成長プロセスを示唆した。したがって、腫瘍抑制因子は、Tuba−seqを介して同定される、それらの分子機能の兆候となり得る、異なる腫瘍抑制モードを有することができる。興味深いことに、Setd2は、近年、チューブリンをメチル化することが示唆され、Setd2欠損は、微小管における改変に起因して、微小核及び遅滞染色体を含む様々な形態のゲノム不安定性をもたらし得る。ゲノム不安定性は、稀な有利な改変、ならびに非常に確率的であり、べき乗則分布される腫瘍成長を生成することが予想される。しかしながら、発明者らの研究におけるSetd2欠損肺腫瘍の大きさの分布は、厳密に対数正規であり、したがって、Setd2喪失の主な影響が一般的に成長を調節不全にする遺伝子発現プログラムの誘導であると推測する(図6D及び図16B、C)。

数千の個々の腫瘍を評価した発明者らの分析のスケールは、機能的腫瘍抑制遺伝子を同定する発明者らの能力を劇的に向上させた。バルク測定を介した腫瘍成長の推定は、腫瘍成長に対する利点として発明者らが明らかにした腫瘍抑制因子の3分の1しか同定しなかった(図5D〜F)。従来のフロキシングされた対立遺伝子とは異なり、肺におけるCRISPR/Cas9媒介ゲノム編集は、全ての腫瘍のおよそ半分においてホモ接合性ヌル対立遺伝子を生成した(図11D)。したがって、標的遺伝子の均一なホモ接合体欠失の欠如は、各腫瘍のバーコード化及び分析により、バルク測定からの腫瘍抑制シグナルを減少させ、Tuba−seqは、この技術的限界を効果的に克服する。

多数の抑制因子を分析することにより、発明者らのデータは、初期の新生細胞が、多くの腫瘍抑制因子改変が適応性であり、成長利点を付与した、進化的に発生期の状態で存在することを示唆する。対照的に、がん細胞株におけるCRISPR/Cas9スクリーニングは、さらなる腫瘍抑制因子改変があまり利点を提供せず、さらには有害であり得ることを見出した。この知見は、それらの進行期疾患起源、ならびに培養における最適増殖能のための選択に起因して、最適成長適応度に達する、非常に成熟した進化状態において存在するがん細胞株と一致する。さらに、腫瘍抑制とインビボ環境の多くの態様との間の密接な関連は、インビボでの(または例えば、オルガノイド培養物もしくは3D培養組織などの組織の状況において)腫瘍において腫瘍抑制因子喪失の作用を分析する重要性を強調する。

興味深いことに、ヒトがんにおける腫瘍抑制因子改変の頻度は、それらの腫瘍抑制因子 の機能の規模に直接対応しなかった。例えば、SETD2及びRBM10は、類似するパーセンテージのヒト肺腺癌において変異するが、Setd2欠損はRbm10欠損よりも非常に大きい成長利益を付与した(図5A、B)。これは、個々の患者に大いに重要であり得る低頻度の推定上の腫瘍抑制因子の機能上の重要性を決定するために、インビボでの遺伝子機能の迅速かつ定量的分析を可能にする方法の高まる必要性を強調する。

腫瘍抑制因子改変の臨床上の重要性についての理解は非常に限られており、これは依然として主な満たされない必要性であるが、腫瘍成長が強い駆動物質は弱い駆動物質よりも魅力的な臨床標的を表し得る。Tuba−seqは、腫瘍抑制遺伝子喪失のより複雑な組み合わせの調査、ならびに腫瘍成長及び進行の他の態様の分析を可能にする。Tuba−seqは、他のがんの種類を研究するようにも適応可能であり、腫瘍成長を阻害するのではなく、通常促進する遺伝子の調査を可能にするはずである。最後に、本方法は、最終的により正確で個々の患者に合わせた治療をもたらし得る遺伝子型特異的治療応答の調査を可能にする。

本研究における病変の統計特性 腫瘍の大きさの分布は一般的に、マウス−sgRNA対内で見たとき、2次べき乗則に対する傾きと対数正規であった(図20)。発明者らの研究の各腫瘍を、それを保有したマウスmにより定義された対数変換された大きさtmrb、その最初のバーコードにより同定された同族sgRNA r、及び固有のバーコード配列(DADA2クラスターのコンセンサス)bに割り当てた。発明者らのアプローチは、様々なエラー源を調べ、それに対処するように設計された。発明者らは、(i)同じ挿管手順を介して、同じレンチウイルス力価で感染させた(形質導入した)同型マウス(多くの場合、同腹仔)内の引き起こされた腫瘍の数が大いに変動した、(ii)平均の腫瘍の大きさが同型マウス内で変動した、(iii)ある特定のマウスが、特定の腫瘍抑制因子を標的とするsgRNAを有する腫瘍の成長により適していた、及び(iv)同じマウス内で同じsgRNAを有する腫瘍の大きさが劇的に変動したことを見出した。

全体的に、腫瘍負荷に対する腫瘍抑制因子の不活性化の作用は、これらの他の源と比較して小さい。従来のウイルス−Creに基づく遺伝子操作されたマウスモデルは、マウス当たり数百〜数千の腫瘍を発生させることによりばらつきの主な源に対処する。発明者らは、この環境においても同じ遺伝子構築物を有する同じマウス内で引き起こされた腫瘍の大きさにおいて確率的に観察した。これらの実験において個々の腫瘍内のがん細胞の数は決して正確に測定されることはなく、代わりに、平均の腫瘍の大きさ及び引き起こされた腫瘍の数の合体である総腫瘍面積が最もよく測定される。したがって、このアプローチは、(i)サンプリングされた平均の大きさは平均の大きさの最良の推定量ではない、(ii)引き起こされた腫瘍の数は決して直接測定されない(27%の変動係数(CV)で変動する量)、(iii)マウス背景におけるばらつきは無視される、及び(iv)腫瘍面積を評価するために使用される方法もばらつきを導入するため、欠点がある。これらの理由のため、KrasG12D/+背景において最も強力な腫瘍抑制因子(Setd2)でさえ作用の規模は、同型マウス間の分散よりも小さい(図6C)。

個々のマウス内のウイルス−Creベクターにより引き起こされた病変の数におけるばらつきは、腫瘍抑制因子の作用の推定にも影響を与える。各腫瘍を固有にバーコード化し、次いで方法において詳述される発明者らの計算的アプローチを使用して腫瘍を正確に呼び出すことにより、このばらつきの源を最小にする。発明者らのパイプラインにおいて呼び出された病変の数の分散は、反復シーケンシング実行にわたって10.7%のCVを示し、一方で、同型マウス間の呼び出された病変の変動は27%のCVを示した。したがっ て、固有のDNAバーコードに基づいた発明者らの腫瘍数の推定は、腫瘍の数が同型マウス間で一定であると仮定するよりも有意により正確である(感染(形質導入)による技術的ばらつきに起因して、レンチウイルスベクターにより感染させた(形質導入した)上皮細胞の数が異なる可能性がある)。以下に、上記表に列記したばらつきの残りの源を調べ、軽減し、論じる。

sgRNAに依存しないマウス間のばらつき 発明者らの多重アプローチは、(i)CRISPR/Cas9標的腫瘍抑制遺伝子、(ii)個々のマウス、及び(iii)それらの相互作用に起因する成長作用を調べる。これは、単に、各マウス内に多くのsgRNAが含まれ、同じマウスにおいて同じsgRNAを有する多くの病変が測定されるため、可能である。発明者らは、各sgRNAの平均が対数変換され、偏り補正された予想の大きさにおいて表面上同型マウス間で統計的に有意な相違を観察した(ηmr=Emr[tmrb])。これらの相違は、簡潔に要約され、その後、tmrbから差し引いて、各腫瘍抑制因子の強度をより良く決定する。

マウスは、sgRNAに依存しない成長摂動ηm=Ermr](すなわち、腫瘍感受性及び腫瘍抵抗性マウスのスペクトルがあった)及びマウス内でsgRNA依存共分散ηmr(例えば、異常に大きいLkb1欠損腫瘍を保有したマウスは異常に大きいSetd2欠損腫瘍も保有した)の両方を示した。約40%のマウス間のばらつきは、ηmを正しく正規化することによって排除されたが、sgRNAに依存しない要因に起因しないηmrにおけるばらつきは、たった10.7%であると推定された。発明者らは、このηmrのばらつきの5分の1のみを排除することができた(以下に詳述される)。したがって、腫瘍感受性におけるばらつきの大半は、sgRNAに依存しないように見えるが、わずかな遺伝子−マウス共分散は、精度<10%まで平均腫瘍成長の利点を推定するとき、尚も派生的である。

腫瘍発生後、同じ時間点で分析された同型マウス、すなわち、同じ遺伝子操作された要素を有するものは、同腹仔及び同ケージであることが多いが、混合129/BL6背景に由来する。これらのマウスは、実在の患者よりもはるかに同種の遺伝子型及び環境を有する可能性があるが、個々のマウス間の関連がある相違は尚も現れた。これらの傾向は発明者らの前例がない分解能により、発明者らのデータにおいて同定され得るが、変動は小さく、異なるマウス構築物を比較する実験(例えば、目的の遺伝子のフロキシングされた対立遺伝子を有する、または有しないマウスにおいて腫瘍成長を比較する従来のアプローチ、またはLenti−sgSetd2/Cre対Lenti−sgNeo/Creで発生させた腫瘍を有するマウスからの発明者らの結果(図6を参照されたい))に対してさらに大きな作用を有するはずである。

各マウスはいくつかの不活性sgRNAを含有したため(その平均はマウス内で互いにはっきりと異ならない)、集約した不活性sgRNA平均に対して大きさを単純に正規化することによりsgRNAに依存しないマウス作用を差し引くことができた:μmr=Emr[tmrb]−Em,inerts[tmrb]。発明者らのノンパラメトリックアプローチにおいて、LN MLE平均とほぼ同一である傾向がある不活性sgRNA中央値で単純に分割する。

sgRNA特異的なマウス間のばらつき 単一マウスにおける複数の活性sgRNAのばらつきは、発明者らにsgRNA特異的マウス作用を調べることを可能にした。全体的に、μmrマトリックスは、KT;Cas9マウスにおいて活性sgRNA間で非常に正に相関した。発明者らは、主構成要素分析(PCA)を使用してこれらの相関を分解した。第1の主構成要素(PC1)は、同型KT;Cas9マウスにわたってμmrにおける分散の75%を説明した。発明者らはこの 共分散についてのいくつかの仮説を試験した。 1.平均してより大きい腫瘍を保有したマウスは対数スケールでより大きい腫瘍分散も有した。そうであれば、sgLkb1対sgInertの腫瘍の大きさ比は、sgSetd2対sgInertの腫瘍の大きさ比と共変動する。 2.マウスの性別がこれらの異なる成長パターンを駆動する。 3.Cas9エンドヌクレアーゼ切断効率は、H11LSL−Cas9/+のマウス対 H11LSL−Cas9/LSL−Cas9のマウスの間で変動した。 4.マウス内の未知の遺伝的または環境要因は、駆動物質のサブセットの強度を乱す。

PC1と平均腫瘍の大きさとを比較することにより、及び発明者らのKT;Cas9の12週コホートのKT;H11LSL−Cas9/+とKT;H11LSL−Cas9/LSL−Cas9マウスとを比較することにより、これら最初の2つの仮説を調査した。PC1は、平均腫瘍の大きさ(発明者らのパイプラインを介して計算される)及び肺重量(図20B〜D)の両方と良く相関した。肺重量(グラム)は、肺試料の収集時に決定され、腫瘍の数及び平均腫瘍の大きさによって影響される可能性がある。PC1との肺重量の相関は、平均腫瘍の大きさと同様、これらの観察された傾向がパイプライン人工産物ではないことを確実にする。雄のマウスが、より大きい腫瘍、及び強い駆動物質と不活性との間でより大きい大きさ不一致を示したため、マウスの性別もPC1と共変動し(点双列相関r=0.75、データ示さず)、発明者らの最初の仮説と一致する。

H11LSL−Cas9対立遺伝子状態(ヘテロ接合またはホモ接合)は、12週KT;Cas9マウスにおいてPC1(r=0.34、データ示さず)と統計的に有意に相関しなかった。したがって、発明者らは、H11LSL−Cas9対立遺伝子にヘテロ接合またはホモ接合であることが実質的に遺伝子不活性化の有効性に実質的に貢献するとは考えない。

最後に、潜在的な遺伝的または環境要因の仮説は、ここで試験するにはあまりにも制約がない。しかしながら、発明者らの方法論は、これらの要因の研究を前進させることを可能にする。

したがって、発明者らは、腫瘍許容性及びマウス性別が同型マウス間でこれらのsgRNA特異的相違に最も関与し、またCas9エンドヌクレアーゼヘテロ接合性がはっきりと腫瘍成長に影響を及ぼすようには見えず、発明者らの分析パイプラインの結果が他のマウス測定と一致すると結論付ける。

確率的主構成要素モデルの混合は、μmrからηmrを排除するために使用された。このモデルは、その同型のコホートの他と同じ分布から生じるマウスの対数尤度を定義する。本質的に、このモデルは、異常なsgRNAのプロファイルを有するマウスを同定する。しかしながら、マウスを「外れ値」または「許容される」マウスのいずれかに分類するのではなく、単純に外れるその尤度に基づいて各マウスを量った。統計的に、「外れ値」は、そのコホートとは異なる分布から得られるように見える点として定義される。実際、発明者らは、類似する外れ値マウスがマハラノビス距離(多次元データにおいて外れ値を特定するための一般的な基準)を使用して同定されたことを見出した。しかしながら、マハラノビス距離基準は、発明者らの用途においてその場限りである外れ値を分類するためのある閾値を必要とする。発明者らの確率的主構成要素モデルの混合を使用してマウスを量ることにより、KT;Cas9マウスのErmr]のばらつきを2.1%低減した。これはほんの軽度の向上であるが、この値は同定されたばらつきの全ての源を説明するはずであると感じたため、この補正をsgRNAにより付与された平均成長利点の発明者らの最終報告に含めた。同型マウスのコホートにおける各sgRNAの最終的に報告された平均成長作用は、発明者らの混合モデルP(m;μmr)において各マウスmの尤度に よって量られた全てのマウスにわたるμmrの算術平均、すなわち以下であった。

発明者らのパラメトリック及びノンパラメトリックアプローチ、ならびに統計試験 腫瘍成長の大きさスペクトルを包括的に測定し、その後、このスペクトルの背景にある外因的要因全てを同定することは、難問を提示する。成長利点は、全ての既知の定量化された懸念を説明した腫瘍の大きさの高度に処理された手段により要約することができるか、または成長利点は、より少ない仮定を立てる様式でより明確に要約することができる。発明者らは両極端を選択した。定性的な結論は、いずれの場合においてもあまり異ならないが、同意は励みになり、異なるアプローチは異なる感覚を有する読者にアピールし得るため、両アプローチを提示する。

最尤推定に基づいた発明者らのアプローチは上のセクションで詳述される。要約すると、大きさの分布の対数正規形状、ならびに(i)引き起こされた腫瘍の数、(ii)全体的な腫瘍許容性、及び(iii)sgRNA特異的なばらつきにおけるマウス間のばらつきについての発明者らの理解を説明することを試みる。それは、発明者らの大きさ測定の多次元性を活用し、発明者らが見出した全ての既知の外因的要因について補正する。以下に、対数正規を仮定する限界を論じ、パラメトリックアプローチを、べき乗則テールを示す腫瘍抑制因子分布に拡大する。

発明者らのノンパラメトリック要約は、大きさの分布の様々な位置で増加した腫瘍成長についてアッセイするために、t(ノンパラメトリック)mrb(上記に定義される)のパーセンタイルを提示する。腫瘍分布の形状の仮定を立てず、マウス間のばらつきをモデル化しない。しかし、不活性の中央値大きさ及び各マウスに存在する腫瘍の数について補正することによって、マウス間のばらつきの大部分は排除される。この理由のため、最初の実験後に、パーセンタイルは対応する不活性パーセンタイルに対して常に報告された。sgRNAについての異なるパーセンタイル層間の自動補正が予想及び観察される。異なるパーセンタイル層は統計的に独立した値ではなく、それらの独立性を仮定する統計試験は展開されない。

ノンパラメトリックアプローチは一般的に、活性sgRNAの分布の90〜99パーセンタイルが不活性から最大に外れることを見出す。分布が少なくとも対数正規的に歪んでいるという発明者らの知見は、この現象と一致する。さらに、活性sgRNAは、不活性分布を模倣するはずであるインフレーム挿入及び欠失を導入することができるため、インフレーム変異を有する活性sgRNA分布において最小腫瘍または模倣する変異がない不活性の大きさが予想された。最後に、単一のヌル対立遺伝子のハプロ不全は、一般的に不明であるが、ハプロ不全は部分的に優性であるか、または存在しない場合、大きさの分布はより高い(90〜99)パーセンタイルで最も歪む。

したがって、概して、ヌル変異率、接合状態、統計分解能(より高いパーセンタイルで降下する)、及び発明者らの大きさの分布の理解の懸念をおおよそ均衡したため、駆動物質の成長利益のだいたいの要約として95パーセンタイルを使用した。発明者らのデータは、腫瘍抑制因子の喪失が全ての個々の腫瘍にわたって必ずしも成長利点もたらさないことを示唆する(例えば、図1及び2のp53−対Lkb1欠損)。実際、95パーセンタイル測定は、p53喪失及び裾が重い分布の予想される結果と一致する理由のため、発明者らの実験においてp53の検出に失敗する。それにもかかわらず、単純化は有用であり得、大きさの95パーセンタイルは、成長の相違を良好に要約する。

全ての信頼区間及びp値は、tmrbのブートストラップを介して得られた。ブートス トラップサンプリング後、発明者らの分析パイプラインの全ての後続ステップは、全てのブートストラップについて再計算された(不活性への正規化、PCAなど)。ブートストラップ試料は、各実験において大きさが元のtmrbと等しく(例えば、腫瘍発生の12週間後に分析したKT;Cas9マウスの腫瘍)、復元でサンプリングした。200,000個の試料を報告された各95%信頼区間について得、2,000,000個の試料を報告された全てのp値について得た。比率の信頼区間は、活性sgRNA分布及び不活性sgRNA分布の両方において不確かさを反映する。したがって、sgRNA比の信頼区間が1を包含しない場合、sgRNAのこの要約統計が不活性sgRNAと一致するという帰無仮説は、p<0.05(多重仮説について補正なしと仮定する)で棄却される可能性がある。

全てのp値は、sgRNA要約統計が不活性sgRNA要約統計とは異なり、11個の活性sgRNAのうちのいずれか1つが成長利点または欠点を招くという発明者らの多重仮説についてボンフェローニ補正された、両側仮説を報告する。活性sgRNAは常に全sgRNA分布(4つの異なる不活性sgRNA)と比較されたが、不活性sgRNAは他の3つの不活性の分布と比較されたのみであった。p値は、2,000,000個の試料に限定された場合、ブートストラップの分解能の限界であるため、0.0001を超えて報告されなかった。

大きさ分布の包括的なパラメトリック説明 病変の大きさは、いくつかの遺伝子型において過剰量が非常に大きい病変を有して、おおよそ対数正規的に分布された。各遺伝子型及び時間についての観察された病変の大きさの分布に多種多様の2〜3つのパラメータ確率分布を適合する:(対数)−正規、(対数)−ガンマ、(対数)−ロジスティック、指数関数、ベータ、生成された極値(Gumbelを含む)、及びべき乗則(パレートを含む)。全ての病変大きさ分布は、対数正規、対数−ガンマ、または対数−ロジスティック分布のいずれかに最も適合したが、他の全てより優れた単一分布はなかった。コルモゴルフ・スミルノフ検定は、最良適合単一分布を棄却することが多かった、すなわち、最も不適切でない適合のみが多くの場合において見出すことができた。この欠点は、発明者らが初めて測定することができた莫大な量の腫瘍の大きさ、及び腫瘍進行の複雑さを強調する。したがって、集合パラメトリック適合を調査した。

いくつかの分布について対数正規及びべき乗則スケーリングの組み合わせが発明者らのデータを最も良く説明した。対数−ガンマ及び対数−ロジスティック適合は、対数正規適合よりも時折優れていたが、これらの代替え分布は、単にべき乗則挙動を示唆する急成長高次積率を有する。さらに、対数−ガンマ及び対数−ロジスティック分布パラメータの最尤推定量は、集束の保証なしに数値的に解決されなければならない。

べき乗則分布を公平に同定する注意が払われた。潜在的なべき乗則適合は、最大尤度を使用してパラメータ化され、周辺尤度を使用して判定された。 1.正の実数の完全な支持のために、下記の各sgRNA分布の最大尤度対数正規適合が同定された。

2.ドメイン[x(min)r,∞)に対する下記のような腫瘍の最大尤度べき乗則適合を同定した。

ここで、ステップ1からの指数αr及び対数正規適合が使用される。べき乗則は、x(min)=0のとき定義されず、そのため、自由変動が最小の(freely−floating minimum)限られた支持に対してべき乗則を試験することが慣例である。 3.多適合モデルは、周辺尤度を使用して判定された。観察されたデータの尤度はベイズ情報量規準(BIC)を使用してモデルの自由度について補正された。

このアプローチはAlstotらによって推奨され、それらの付随するソフトウェアパッケージがこの分析に使用された。最大尤度適合の詳細は図3に提供される。報告されたp値は、共同対数正規及びべき乗則適合の周辺尤度の変形であり、そのため、p=1/(1+Exp[周辺尤度])である。これらの値は、データがその完全な支持を通して対数正規される帰無仮説を試験する。

発明者らは、大きさが指数関数的に切り詰められたべき乗則に従い分布されるという仮説も試験する。この比較は、通常のべき乗則に対する一般的な対立仮説であり、スケールフリー挙動が有限区間に対してのみ存在することを暗示する。指数関数的に切り詰められたべき乗則挙動についての良好なエビデンスは見られない(データ示さず)。この理由のため、データが以下に論じる遺伝子型において腫瘍進行のスケールフリーモデルを支持すると考える。

p53欠損腫瘍が大規模にべき乗則分布されるという強い反復的エビデンスが観察される。べき乗則力学は、KrasG12D/+/p53Δ遺伝子型(KPT腫瘍、及び両方のKT;Cas9 sgp53腫瘍時間点)の全ての転生物において観察された。これらのべき乗則分布適合の全ての周辺尤度は、良好または優良であった。この一致は、KrasG12D/+/p53Δ遺伝子型が腫瘍の大きさにおいてべき乗則分布されるという仮説を強く支持する。

一般に、べき乗則適合のML指数はおよそ2(αは約2)であった。べき乗則力学は、がん発生率を説明すると仮説されたが、この仮説を試験するための測定が以前はひどく時間がかかり、高価であったため、腫瘍の大きさの分布は十分に研究されておらず、そのため、次のセクションで大きさのべき乗則分布をもたらす単純な進化モデルを探索した。病変の大きさを深く調べることにより、駆動物質の成長利点を正確に同定するだけでなく、それらの根底にある作用モードの態様を明らかにするためにも有用であることが証明された。

さらに稀に獲得される駆動物質変異は、腫瘍の大きさのべき乗則分布を予測する。 p53欠損腫瘍は、それらの最右裾で大きさのべき乗則分布を示す(図3D)。べき乗則分布は一般的に、単一ステップマルコフプロセスから生じず、代わりに、化合物ランダムプロセス、例えば、ランダムウォークまたは降着プロセスから生じる。最も単純で、発明者らが最も可能性があると考える、この観察されたべき乗則分布の説明は、指数関数的プロセスの組み合わせ、つまり、指数関数的拡張における第2の駆動物質事象の稀な取得であるp53欠損腫瘍である。

下記のように、腫瘍の大きさN(t)が最初に時間tにわたって、速度r1で指数関数的に成長すると仮定する。

N(t=0)=1とする、すなわち、t=0と定義される感染(形質導入)時に1つの腫瘍原性細胞がある。さらに、時間t*で、新しい駆動物質を有する新しいクローンが腫 瘍集団に現れ、非常に速い速度r2で成長したため、このクローンが屠殺の時点tFで腫瘍集団を支配する、すなわち、下記であると仮定する。

0≦t*

Fであることに留意する。最後に、この変形させる力を有するクローンが腫瘍の大きさに比例する確率に合わせてランダムに現れる、すなわち、p(t

*)〜μN(t)であると仮定する。このシナリオにおいて、分析時の腫瘍の大きさN(t=t

F)=nは、以下のように示される。

Newman,M.Power laws,Pareto distributions and Zipf’s law.Contemp.Phys.46,323−351(2005)、表題Combinations of exponentials(セクション4.1)に概説される偏差に基づいて、以下であることがわかる。

腫瘍の大きさは下記の指数でべき乗則分布される。

この結果は、観察された指数が2未満でなければならないか、またはさらなる駆動物質が獲得されなければならないかのいずれかであることを暗示する。11週で屠殺されたKPTマウスの指数の最尤推定は、2よりもわずかに大きいが、15週で屠殺されたKT;Cas9マウスのsgp53腫瘍の指数は2よりもわずかに小さい(しかし、これらの値の両方はそれらの95%CIにおいて2を包含する)。

上記仮定の全てが腫瘍進行の他の基本的な数理モデルにおいて立てられた。したがって、マルコフプロセスは観察されたべき乗則の最良の説明であると考える。

最後に、t*での変形させる力を有する事象は特定されない。それは、遺伝子改変、後成的変化、細胞シグナル伝達状態の切り替えなどであり得る。べき乗則分布を生成し得る他のプロセスがあることにさらに留意する。

複数のレンチウイルス感染を伴う腫瘍のエビデンス 大きさの測定は、複数のレンチウイルスベクターにより推定上感染させた(形質導入した)病変を同定するために十分正確である。発明者らの最初の実験(KT、KLT、KPTマウス)は、より大きいウイルス力価(6,000〜22,000カプシド)を使用したため、複数感染がより一般的であると予想した。2つの異なるウイルスベクターが同じ創始細胞を感染させた(形質導入した)場合、両方のレンチウイルスバーコードにより2つの病変として注釈が付けられた単一の腫瘍に拡張する。したがって、個々のマウス内の同じ大きさの2つのバーコード化された腫瘍が観察された場合、これらは単一の病変を発生させた2つのレンチウイルスベクターから生じたと予想され得る。したがって、同じマウスにおいて各病変とその最近傍との間の大きさの相違を調査した。

小さい画分の病変が、予想よりも大きさがほぼ同じであることが観察され、一部の病変 が2つ以上のレンチウイルスベクターでの感染(形質導入)により発生させた場合の細胞から生じた可能性があることを示唆する。発明者ら(ヌル)の予想した分布は、異なる(ランダムに選択された)マウスにおける、観察された病変の大きさとそれらの最近傍との間の大きさの相違を表す。発明者らのデータは、複数感染が約1%の腫瘍において生じることを示唆するが、この稀な発生は、(i)複数感染が稀であるように見える、及び(ii)複数感染が発明者らの推定の駆動物質の成長利益を減衰するはずであるため(複数感染は発明者らのベースラインのsgInert構築物に成長利点を付与すると思われるため)、発明者らの研究の他の結論に実質的に影響を及ぼすとは考えられない。それにもかかわらず、この予備発見は、再度、発明者らのアプローチが従来の技法を使用して新しい生物学を明らかにする能力を図示する。

方法 マウス及び腫瘍発 KrasLSL−G12D(K)、Lkb1flox(L)、p53flox(P)、R26LSL−Tomato(T)、及びH11LSL−Cas9(Cas9)マウスが説明されてきた。肺腫瘍は、前述したように、示される力価でレンチウイルス−Creベクターを使用して、マウスの気管内感染(形質導入)により発生させた。腫瘍負荷は、示されるように、蛍光顕微鏡、肺重量、及び組織診断により評価された。全ての実験は、Stanford University Institutional Animal Care and Use Committeeのガイドラインに従い行われた。

バーコード化されたLenti−mBC/Cre及びLenti−sgPool/Creベクタープールの生成 ハイスループットシーケンシングを使用して、並行して個々の腫瘍内のがん細胞の数の定量化を可能にするために、レンチウイルスベクターを初期の感染させた(形質導入した)肺上皮細胞に安定して組み込むことにより、各腫瘍に固有である短いバーコード配列でレンチウイルス−Creベクターを多様化した。バーコード化されたレンチウイルスベクターの2つの異なるプールを用いて、様々なマウス背景で腫瘍を発生させた。1つ目は、Lenti−PGK−Cre(Lenti−millionBC/Cre;Lenti−mBC/Cre、6つのバーコード化されたLenti−U6−sgRNA/PGK−Creベクターをプールすることにより生成される)の、約106個の固有にバーコード化された変異型のプールであり、これは、KrasLSL−G12D/+;R26LSL−Tomato(KT)、KrasLSL−G12D/+;p53flox/flox;R26LSL−Tomato(KPT)、及びKrasLSL−G12D/+;Lkb1flox/flox;R26LSL−Tomato(KLT)マウスにおいて誘導された腫瘍内のがん細胞の数を分析するために使用した(図1)。2つ目は、15個のバーコード化されたLenti−U6−sgRNA/PGK−Creベクターのプールであり、これは、KT;H11LSL−Cas9(KT;Cas9)及びKTマウスを感染させることにより、3つの異なる遺伝的背景において候補腫瘍抑制遺伝子の腫瘍抑制作用を評価するために使用した。発明者らのLenti−sgInert/Creベクターは、積極的に切断するが、機能的に不活性な陰性対照sgRNAである、Rosa26LSL−Tomato対立遺伝子内のNeoR遺伝子を標的とする3つのsgRNAを含んだ。

sgRNAの設計、生成、及びスクリーニング Cre、ならびに11個の既知及び推定上の肺腺癌腫瘍抑制因子:sgLkb1、sgP53、sgApc、sgAtm、sgArid1a、sgCdkn2a、sgKeap1、sgRb1、sgRbm10、sgSetd2、及びsgSmad4の各々を標的とするsgRNAを有するレンチウイルスベクターを生成した。不活性ガイド:sgNeo1、sgNeo2、sgNeo3、sgNT1、及びsgNT3を有するベクターも生成された。目的の各腫瘍抑制遺伝子を標的とする全ての可能な20−bpのsgRNA(N GG PAMを使用する)が同定され、利用可能なsgRNA設計/スコア化アルゴリズムを使用して、予測された的確な切断効率についてスコア化した。各腫瘍抑制遺伝子について、ヌル対立遺伝子を産生する可能性が最も高いと予測された3つの固有のsgRNAを選択し、最高の予測された切断効率を有するsgRNA、ならびに全ての既知のスプライスアイソフォーム(ENSEMBL)に保存されるエクソンを標的とするもの、スプライスアクセプター/スプライスドナー部位に最も近いもの、遺伝子コード領域において最も初期に位置付けられるもの、注釈が付けられた機能ドメイン(InterPro;UniProt)の上流に生じるもの、及び既知のヒト肺腺癌変異部位の上流に生じるものを優先した。各sgRNAを含有するLenti−U6−sgRNA/Creベクターは、前述したように生成された。簡潔に、Q5部位特異的変異誘発(NEB E0554S)を使用して、sgRNAを、U6プロモータならびにPGK−Creを含有する親レンチウイルスベクターに挿入した。各sgRNAの切断効率は、LSL−YFP;Cas9細胞を各Lenti−sgRNA/Creウイルスに感染させることにより決定された。感染(形質導入)の48時間後に、YFP陽性細胞のフローサイトメトリー定量化を使用して、感染(形質導入)パーセントを決定した。次いで、DNAを全ての細胞から抽出し、標的腫瘍抑制遺伝子座をPCRにより増幅した。

PCRアンプリコンは、サンガーシーケンシングされ、TIDE分析を使用して分析されて、インデル形成パーセントを定量化した。最後に、フローサイトメトリーにより決定される、TIDEにより決定されたインデルパーセントをLSL−YFP;Cas9細胞の感染(形質導入)パーセントで除して、sgRNA切断効率を決定した。目的の各腫瘍抑制遺伝子を標的とする最も効率的なsgRNAは後続の実験に使用された。Tomato及びLkb1を標的とするsgRNAは前述されており、p53を標的とするsgRNAは以前に検討した(未公開データ)。この研究に使用された上位ガイドの標的インデル領域を増幅するために使用されたプライマー配列は以下である。

Lenti−sgRNA/Creのバーコード多様化 目的の各腫瘍抑制因子を標的とする最良のsgRNAを同定した後、各個々のsgRNAに特異的な既知の8−ヌクレオチドID(sgID;太字)及び15−ヌクレオチドランダムバーコード(BC;下線付き)を用いて対応するLenti−sgRNA/Creベクターを多様化した(図10Aを参照されたい)。

これらのプライマーを使用して、PGKプロモータの3’端及びCreの5’部分を含んだLenti−PGK−Creベクターの領域をPCR増幅した。PCRは、PrimeSTAR(登録商標)HS DNAポリメラーゼ(premix)(Clontech,R040A)を使用して行われ、PCR産物はQiagen(登録商標)PCR精製キット(28106)を使用して精製された。PCRインサートをBspEI及びBamHIで消化し、XmaI(BspEI比較可能端を産生する)及びBamHIで切断したLenti−sgRNA−Creベクターでライゲートした。

多数の固有にバーコード化されたベクターを生成するために、T4リガーゼ(NEB,M0202L)及び標準のプロトコル(80μlの総反応体積)を使用して、300ngの各XmaI、BamHI消化Lenti−sgRNA−Creベクターを180ngの各BspEI、BamHI消化PCR産物でライゲートした。ライゲーションは、残留塩を除去するためにQiagen(登録商標)PCR精製キットを使用してPCR精製された。最大可能数の固有にバーコード化されたLenti−sgRNA/Creベクターの プールを得るために、1μlの精製したライゲーションを、20μlのElectroMAX DH10B細胞(Thermo Fisher,18290015)に形質転換した。BD MicroPulser(商標)エレクトロポレーター(Bio−Rad,165−2100)において、1.9kVで、0.1cmのGenePulser/MicroPulserキュベット(Bio−Rad,165−2089)中で細胞を電気穿孔した。次いで、500μlの培地を添加し、37℃で30分間、200rpmで振盪することにより、細胞を解放した。各ライゲーションについて、7つのLB−Ampプレート(1つのプレートは1μl、1つのプレートは10μl、そして5つのプレートは100μl)上で細菌を平板培養した。翌日、1μlまたは10μlのプレート上のコロニーを計数して、100μlのプレート上のコロニー数を推定し、これを、各IDに関連する固有のバーコードの数の初期推定として使用した。

10mlの液体LB−Ampを細菌の各プレートに添加して、コロニーをプールした。コロニーをプレートから液体中にそぎ落とし、各形質転換からの全てのプレートをフラスコ内に合わせた。フラスコを、37℃で30分間、200rpmで振盪させて混合した。Qiagen(登録商標)HiSpeed MidiPrepキット(12643)を使用して、DNAを中間調製した。Qubit dsDNA HSキット(Invitrogen,Q32851)を使用して、DNA濃度を決定した。

品質管理手段として、各Lenti−sgRNA−sgID−BC/Cre プラスミドプールからのsgID−BC領域を、製造業者の指示に従い、GoTaq Greenポリメラーゼ(Promega M7123)でPCR増幅した。これらのPCR産物を、サンガーシーケンシング(Stanford PAN facility)して、予想されたsgID及びランダムBCの存在を確認した。BspEI及びXmaIは比較可能なオーバーハングを有するが、異なる認識部位を有するため、Lenti−sgRNA−sgID−BC/Creベクターは、XmaI部位を欠sgID/BCの良好なライゲーションから生成された。したがって、サンガーシーケンシングにより決定された(>5%)、検出可能な量のバーコード化されていない親Lenti−sgRNA/Creプラスミドを有したプールについて、標準方法を使用して、XmaI(NEB,100μlの反応物)でプールを消化することにより親のバーコード化されていないベクターを破壊した。Qiagen(登録商標)PCR精製キットを使用して、これらの再消化したプラスミドプールを再精製し、NanoDropにより濃度を再決定した。

Lenti−mBC/Cre及びLenti−TS−Pool/Creの生成 H11LSL−Cas9対立遺伝子を欠いたマウスにおいて発明者らの初期の実験に使用するための、およそ106個の関連するバーコードを有するライブラリを得るために、6つのsgID−BCバーコード化されたベクターをプールして、Lenti−millionバーコード/Cre(Lenti−mBC/Cre)を創出した。次いで、バーコード化されたLenti−sgRNA−sgID−BC/Creベクター(sgLkb1、sgp53、sgApc、sgAtm、sgArid1a、sgCdkn2a、sgKeap1、sgNeo1、sgNeo2、sgNeo3、sgNT1、sgRb1、sgRbm10、sgSetd2、及びsgSmad4)をプールして、Lenti−sgTS−Pool/Creを生成した。レンチウイルス産生の前にQubit濃度により決定されるように、全てのプラスミドは等しい比率でプールされた。

レンチウイルスの産生、精製、及び滴定 レンチウイルスベクターは、レンチウイルスベクターならびにデルタ8.2及びVSV−Gパッケージングプラスミドで293T細胞のポリエチレンイミン(PEI)に基づくトランスフェクションを使用して産生された。Lenti−mBC/Cre、Lenti−sgTS−Pool/Cre、Lenti−sgTomato/Cre、Lenti− sgLkb1、Lenti−sgSetd2#1/Cre、Lenti−sgSetd2#3/Cre、Lenti−sgNeo2/Cre、及びLenti−sgSmad4/Creを腫瘍発生のために生成した。トランスフェクションの8時間後に、酪酸ナトリウム(Sigma Aldrich,B5887)を0.2mMの最終濃度で添加して、ウイルス粒子の産生を増加させた。ウイルス含有培地を、トランスフェクションの36、48、及び60時間後に収集し、超遠心分離(1.5〜2時間、25,000rpm)により濃縮し、PBSに一晩再懸濁し、−80℃で凍結した。濃縮したレンチウイルス粒子を、LSL−YFP細胞(Dr.Alejandro Sweet−Corderoからの寄贈)を感染させることにより滴定し、YFP陽性細胞パーセントをフローサイトメトリーにより決定し、感染力価を既知の力価のレンチウイルス調製物と比較した。

「ベンチマーク」細胞株の生成 sgID「TTCTGCCT」を有する3つの固有にバーコード化されたLenti−Creベクターを使用して、既知の細胞数で各バルク肺試料にスパイクされ得るベンチマーク細胞株を生成し、各腫瘍内のがん細胞数の計算を可能にした。個々の細菌コロニーからのプラスミドDNAを、Qiagen(登録商標)QIAprep Spin Miniprepキット(27106)を使用して単離した。クローンをサンガーシーケンシングし、レンチウイルスを上述したように産生し、およそ3%の細胞が48時間後にYFP陽性であるように、LSL−YFP細胞を非常に低い感染(形質導入)多重度で感染させた(形質導入した)。感染させた(形質導入した)細胞を拡張し、BD Aria II(商標)(BD Biosciences)を使用して選別した。YFP陽性選別した細胞を再度平板培養し、拡張して、多数の細胞を得た。拡張後、BD LSR II(商標)分析器(BD Biosciences)で、細胞をYFP陽性細胞パーセントについて再分析した。このパーセンテージを使用して、5×105個の組み込まれたバーコード化されたレンチウイルスベクターを含有する必要がある総細胞数を、3つの細胞株の各々について計算し、この計算に基づいて細胞をアリコートに分け、凍結した。

マウス肺からのゲノムDNAの単離 バーコードシーケンシングを使用して、各腫瘍内のがん細胞の数を定量化する実験について、Fisher TissueMeiserを使用して、各マウスからの全肺を均質化した。3つの個々にバーコード化されたベンチマーク細胞株の各々からの5×105個の細胞を均質化時に添加した。組織を、200μlの20mg/mlプロテイナーゼK(Life Technologies,AM2544)とともに、20mlの溶解緩衝液(100mM NaCl、20mM Tris、10mM EDTA、0.5% SDS)に均質化した。均質化した組織を55℃で一晩インキュベートした。全ての腫瘍の正確な表示を維持するために、標準プロトコルを使用して、DNAをフェノール−クロロホルム抽出し、総肺ライセートの約1/10からエタノール沈殿させた。DNA収量を増加させるために、0.3グラム未満の重量の肺については、DNAは総肺ライセートの約1/5から抽出され、0.2グラム未満の重量のものについては、DNAは総肺ライセートの約3/10から抽出された。

シーケンシングのためのsgID−BCライブラリの調製 マウス当たり32μgのゲノムDNAからsgID−BC領域を増幅することにより、ライブラリを調製した。組み込まれたLenti−sgRNA−BC/CreベクターのsgID−BC領域は、TruSeq Illumina(登録商標)アダプター及び5’多重タグ(TruSeq i7インデックス領域は太字で示される)を含有する24のプライマー対のうちの1つを使用してPCR増幅された。

sgID−BC領域の単一ステップPCR増幅が使用され、これは、各腫瘍内のがん細胞数を決定するために非常に再現性があり、定量的な方法であることが見出された。以下のPCRプログラムで、標準緩衝液(NEB,M0482L)とともにOneTaq 2X Master Mixを使用して、マウス当たり8つの100μl PCR反応(反応当たり4μgのDNA)を行った。 1.94C 10分 2.94C 30秒 3.55C 30秒 4.68C 30秒 5.GO TO 2(34x) 6.68C 7分 7.4C 無限大

ゲル電気穿孔によりプールしたPCR産物を単離し、Qiagen(登録商標)MinElute Gel Extractionキットを使用してゲル抽出した。個々のマウスからの精製したPCR産物の濃度は、Bioanalyzer(Agilent Technologies)により決定され、等しい比率でプールされた。試料をIllumina(登録商標)HiSeqでシーケンシングして、100bpのシングルエンドリードを生成する(ELIM Biopharmaceuticals,Inc)。

ウルトラディープシーケンシングを介した異なるsgRNA及び腫瘍の同定 固有のsgID−BCは腫瘍を同定する。これらのsgID−BCは、Illumina(登録商標)HiSeqで次世代シーケンシングを介して検出された。細胞数に対する各腫瘍の大きさは、各固有のsgID−BC対の存在量にほぼ対応すると予想された。腫瘍の大きさは、リードシーケンシングエラー率よりも大きい倍数分変動するため、真の腫瘍を繰り返し起こるリードエラーと区別するには、ディープシーケンシングデータを慎重に分析する必要があった。

腫瘍及びそれらのそれぞれのsgRNAは3つのステップにおいて同定された。(i)異常及び低品質のリードは、ウルトラディープシーケンシング実行から廃棄され、(ii)固有のバーコードパイルアップは、同じ腫瘍から生じると予想した群に束ねられ、及び(iii)細胞数は、最も再現性があると証明された様式でこれらの束から推定された。

リード前処理 リードは、発明者らのフォワードプライマーの下流の49のヌクレオチドで始まり、発明者らの100−bpのシングルエンドリードの端部の上流の22のヌクレオチドで終わった二構成要素DNAバーコード(8−ヌクレオチドsgID及び15のランダムなヌクレオチドを含有する21−ヌクレオチドバーコード配列)を含有した。異常なリード:脇側レンチウイルス配列を欠くもの、予想外のバーコードを含有したもの、及び高いエラー率を有するものは廃棄された。これは、3つのステップにおいて達成された(図8A)。 1.sgID−BCのすぐ上流及び下流の12個のレンチウイルスヌクレオチドを検査した。これら12個のヌクレオチドは、各6−merが1つのミスマッチを許容することができるように、隣接する6−mer探索文字列の対を使用して同定された。これら12のヌクレオチドがリード内の37位で始まると予想したが、この位置付けを必要としなかったか、またはこの情報を活用しなかった。ネステッド6−merアプローチ(sgID−BCの脇側に位置するレンチウイルス配列を同定するための2つの機会による)を使用して、リード廃棄を最小にした。これは、発明者らのリードの非バーコード化領域がシーケンシングエラー率を推定するために使用され、したがって、リードエラーに対して偏る べきではないため、この最初のステップにおいて特に重要であった。約7〜8%のリードについて、この第2の6−merの一致はリードを復旧させる、すなわち、sgID−BCのすぐ脇側に位置する6−merは予想した通りではなかった(発明者らの1つのミスマッチの許容にもかかわらず)が、これら内部6−mer配列のすぐ外側の6−merは認識され、発明者らにリードを復旧させ、バーコードを同定することを可能にした。 2.次いで、いずれかの方向で、長さが2ヌクレオチドを超えてsgID−BCが外れるリードを廃棄した。発明者らの最初のバーコードは15個のsgIDのうちの1つを含有することが予想されたため、これら15個の配列のうちの1つと一致しなかったリードを廃棄した。1つのミスマッチ及び1つのインデルが整合において許容された。 3.次いで、18bpがsgID−BCのいずれかの端部の脇側に位置するように、各リードの端部を刈り込んだ。次いで、品質スコアに従い刈り込んだリードをフィルタ処理し、2個以下のシーケンシングエラーを含有することが予測されたものを維持した。第2の(ランダム)バーコードに不要な塩基を有するリードも廃棄し、他の箇所の不要な塩基を修正した。

これら3つの段階において、14%のリードが段階1で廃棄され、約7%が段階2で廃棄され、<2%が段階3で廃棄された。

次いで、各段階で不合格であったそれらのリードを検査した。BLAST探索を行うことにより、段階1で廃棄されたそれらのリードが、発明者らの調製物(Phi Xバクテリオファージゲノム及びマウスゲノム)またはレーン上で発明者らのと対にされる他の試料(一般的なプラスミドDNA)のいずれかからの人工産物に対応する情報価値がない配列を含有することが多かったと決定された。段階2において、異常なバーコード長は大きいインデルを含有したか、またはそれらのsgID−BCのうちの1つもしくは両方が完全に欠けていることが多かったことが分かった。最後に、リードの内部領域が対応する末端よりも高い品質スコアを示したという事実に起因して、段階3で廃棄されたリードは非常に少なかった。この傾向の結果として、3つ以上のシーケンシングエラーを含有すると予想されるそれらのリードを廃棄する前に、リードの端部を刈り込むことが一般的な慣例である。

DADA2を介した固有のリードパイルアップのクラスター化 sgID−BCリードは、同一の配列のセットに集約され、計数された。固有のDNAバーコード対の計数は、大きい腫瘍が繰り返し起こるシーケンシングエラーを生成すると予想されるため、固有の腫瘍に直接対応しない(図8B)。したがって、大きい腫瘍から生じる繰り返し起こるシーケンシングエラーから小さい腫瘍を区別するための方法(例えば、Illumina(登録商標)装置が0.1〜1%のエラー率を有する場合、1千万個の細胞の腫瘍が1万〜10万個の細胞の腫瘍を模倣するシーケンシングエラーパイルアップを産生すると考える)を開発するために相当な努力を費やした。DADA2は、ウルトラディープシーケンシングを伴うバーコード化実験においてこの問題に対処するために以前に使用されている。しかしながら、それは完全長Illuminaアンプリコンのウルトラディープシーケンシング用に設計されたため、発明者らの目的に合わせ、較正しなければならなかった。

DADA2において、より大きいパイルアップの繰り返し起こるシーケンシングエラーに起因するバーコードパイルアップの尤度は、以下に依存する。 1.より大きいパイルアップの存在量、 2.より小さいパイルアップとより大きいパイルアップとの間の特定のヌクレオチドの相違、及び 3.可変位置でのより小さいパイルアップの平均品質スコア。

要因1及び2は、最初、発見的に(計算速度を最大にするため)、その後、ニードルマン−ウンシュアルゴリズムを介してより正確(必要な場合)に考えられた。DADA2は、より小さいパイルアップがシーケンシングエラーにより生成された確率がΩ未満である場合、クラスターを2つに分ける。したがって、この値は、より大きいクラスターを分けるための閾値を表す。この閾値が大きい場合、リードパイルアップは許容的に分けられ(呼び出された腫瘍が多い、おそらく大きい腫瘍を分割する)、Ωが小さい場合、リードパイルアップは制限的に分けられる(呼び出された腫瘍が少ない、おそらく異なる小さい腫瘍を集約する)。

シーケンシングエラーの尤度は、発明者らのウルトラディープシーケンシングデータから推測された。Phred品質スコアは、シーケンシングエラー率の理論推定値を提供するが、これらの推定値は、Illumina(登録商標)装置によって異なる傾向があり、発明者らのプロトコルの特質(例えば、高忠実度ポリメラーゼを使用するにもかかわらず、PCR増幅を介して導入される偶発的なエラーを含む)を説明しない。通常、DADA2は、固有のDNAクラスターと同時にシーケンシングエラー率を推定するが、発明者らのレンチウイルス構築物は、シーケンシングエラー率を直接推測するために使用され得る発明者らのsgID−BC領域の外側の非縮重領域を有した。さらに、エラー率及びバーコードクラスターを一緒に推定することは、計算量が多く、発明者らの全データセットをクラスター化し、関連があるクラスター化パラメータを探索するためには20,000を超えるCPU時間を必要とする。

シーケンシングエラーモデルは、各Illumina(登録商標)装置に対して、 1.発明者らのsgID−BCのすぐ上流の18のヌクレオチドとバーコードのすぐ下流の18のヌクレオチドとを連結することにより、訓練偽リードを生成し、次いで 2.DADA2の単一実行を使用してこれらの偽リードをクラスター化し、 3.DADA2の単一実行を使用してsgID−BCをクラスター化するためのこの訓練実行から推定されたエラー率を使用することにより、訓練された。

レンチウイルスsgID−BC脇側配列の1つのクラスターのみを予想したため、訓練実行におけるシーケンシングエラーを推定するために、Ω=10−100の非常に低い値を使用した。この値の改変は発明者らの訓練実行にはっきりと影響を及ぼさないが、それにもかかわらず、この値においても偶発的な非常に小さい派生的クラスターが発明者らのレンチウイルス配列から観察された。これらの派生的クラスターは、おそらく稀なDNA人工産物であり、決して我々の処理したリードの>2%に達しなかった。シーケンシングエラーを推定するために非常に厳密なDADA2実行を使用することが優れたアプローチを表す(ゴルディロックスの原理により)と感じた。より許容された閾値はシーケンシングエラーを過剰適合する可能性があり、シーケンシングエラー率を過少評価し、一方で、エラー率が予想からの各リードの異常から直接推定されるアプローチ(Ω=0であるDADA2実行に似ている)は、発明者らのデータのDNA人工産物の存在を無視し、したがって、シーケンシングエラー率を過大評価する。

我々は、この研究に使用された各Illumina(登録商標)装置(合計7台)でシーケンシングエラー率を訓練した。訓練は、全ての置換の種類(A→C、A→Tなど)の確率が推定されることを可能にする。Phred品質スコアの関数としてのエラー率は、利用可能なデータのLOESS回帰を使用して決定された(図8C)。一般的に、エラー率は、トランスバージョンについてのPhred品質スコアにより予測されるよりもおよそ2〜3倍高かった(移行についての予想とおよそ一致する)。このエラー率の上昇は典型的であり、装置の較正ミス及び/またはPCR中に導入された変異を反映し得る。

DADA2を使用して発明者らの前処理フィルタを通過した2重バーコードをクラスタ ー化した。バーコード内の任意のインデルが同定され得るように(適切な脇側配列、時折、複数点変異としてインデルを間違って呼び出すDNAアライメントアルゴリズムなしで)、非縮重レンチウイルス脇側領域の7つのヌクレオチドをバーコードに与えた。クラスター化中、(i)クラスターが少なくとも2つの塩基分互いから外れる(すなわち、MIN_HAMMING_DISTANCE=2)、(ii)新しいクラスターは、パイルアップの大きさがエラープロセス下で少なくとも2の倍数によって予測を超えたときにのみ形成される(MIN_FOLD=2)、及び(iii)ニードルマン−ウンシュアルゴリズムが最大で4つの正味挿入または欠失とのアライメントのみを考慮する( BAND_SIZE=4、VECTORIZED_ALIGNMENT=FALSE)ことも必要とされた。これらの選択のいずれもはっきりと結果に影響を及ぼさないが、それらは計算性能を増大し、バーコードが妥当な大きさの腫瘍に集約されるさらなる検証を提示した。

パイプラインの調査及び較正 発明者らの最初のPCR増幅された多重DNAライブラリ(KT、KLT、及びKPTの腫瘍から)を3つ組でシーケンシングして調査し、発明者らの腫瘍呼び出しアプローチを設計した。

再現性は3つの方法で調べた。(i)全てのバーコード及び全てのマウスに関する推定された細胞存在量間の相関、(ii)発明者らの最初の実験において各マウスの各sgIDについて呼び出された病変の数における変動、及び(iii)Cas9を発現しないマウスにおいて一定であるべきである各sgIDの平均の大きさにおける変動である。発明者らの3つ組実行のリード深度は必然的に変動するため(前処理後、40.1×106、22.2×106、及び34.9×106リード)、これらの3つの実行は異なるシーケンシングエラー率で異なるIllumina(登録商標)装置で行われ、また発明者らの初期のレンチウイルスプールは様々なレベルのバーコード多様性を有する6つの異なるsgIDを含有したため、発明者らの調査プロセスにおける技術的ばらつきは後の実験の技術的ばらつきを十分に近似した。発明者らの腫瘍大きさ分析パイプラインにおいて、発明者らは以下のことを見出した。 1.発明者らの3つの「ベンチマーク」DNAバーコードの平均存在量は、中央値存在量よりも反復実行間でより再現性があった。したがって、このベンチマークリード存在量の平均値(500,000個の細胞に相当する)を使用して、リード存在量を各腫瘍内のがん細胞の絶対細胞数に変換した(図9)。 2.再現性を向上したクラスターのコンセンサスバーコードからの≧2のエラーを有するリードを無視する。典型的には、バーコードクラスターにおける約80〜90%のリードはコンセンサスバーコードと正確に一致するが、約5%のリードはこのリードからの単一エラーであり、約5〜15%のリードは≧2のエラーで外れた。≧2のエラーを有するこれらのリードは、反復実行間で十分に相関せず、絶対細胞数/腫瘍の大きさを再現性よく推定する発明者らの能力を妨げた。これらのリードはおそらく、それら自身の病変と考えられるには十分なエビデンスがなく、また大きいクラスターに計数されるには十分なエビデンスもない。したがって、これらのリードは除外された。 3.DADA2のクラスターを分ける傾向は、Ω=10−10での閾値であり、反復実行間の再現性を最大にするために、病変が、図1〜3については≧500個の細胞、及び図4〜6については≧1000個の細胞を含有することが必要とされた(図8D〜F)。高特異性(小さいΩ、高最小細胞数)の閾値パラメータは、病変の大きさをより再現性よく呼び出し、一方、高感度(大きいΩ、低最小細胞数)の閾値パラメータは病変量をより再現性良く呼び出した。1様相のみの再現性を過剰に優先することは軽率である。測定誤差が異なる様相を考慮する2つの閾値により、これらの競合優先がより良く平衡化された。

このパイプラインで、発明者らのスクリーニングにおいてバーコードの多様性をいくつ かの方法で調べた。第1に、このバーコードにおいてヌクレオチドがA’s、T’s、C’s、及びG’sの間で等しく分布されたことが確認された(図10B)。第2に、過剰な反復文字列(例えば、配列AAAAA)についてのエビデンスは見出されなかった。第3に、発明者らのレンチウイルスプールにおける各sgIDと対のランダムなバーコードの数を計算した。発明者らのバーコードライゲーションアプローチ(Lenti−sgRNA/Creのバーコード多様化を参照されたい)を通して生成された各ベクターの多数の固有にバーコード化された変異型に起因して、発明者らのレンチウイルスプールに存在する大半のバーコードは、実験のいずれにおいてもいずれの病変で全く検出されなかった(多様性がその総病変数よりも非常に高かったため)。それにもかかわらず、尚も観察されたバーコードからバーコード多様性の量が推測された。これを推測するために、iマウスにおいてバーコードを観察する確率がポアソン分布されると仮定した。P(k=i;λ)=λke−λ/k!、ここで、λr=Lr/Drは、発明者らの全データセット(既知の量)の各sgID rについて呼び出された病変の数の比率Lrを、各sgIDの固有のバーコードの総数Drで除す。λr/(1−e−λr)=μnon−zeroであることに留意し、ここで、μnon−zeroi=1P(k=i;λr)は、単純に、1回以上生じた各バーコードの発生の平均数であり、Drと計算することができる。発明者らの全データセットにわたって、同じマウスにおいて2つの異なる腫瘍を発生させる同じバーコードの平均確率は0.91%であった。

良好なバーコード多様性は、Lenti−mBC/Cre実験において6つのsgIDによっても示される。バーコードの多様性が低く、バーコードがマウス内でしばしば重複する場合、同じバーコードを有する2つの異なる腫瘍が一緒に束ねられるため、あまり多様ではないsgIDの平均の大きさは増加する。しかしながら、各sgIDの平均の大きさは同型マウス内で<1%変動し、したがって、この確率を否定する。生リード配列に基づいてクラスター化する前に各リードの同族sgIDを同定することにより、またはクラスターのコンセンサス配列に基づいてクラスター化した後に同族sgIDを同定することによる2つの方法で、ディープシーケンシング実行を処理することにより、シーケンシングエラーにもかかわらず、sgIDを正確に呼び出す発明者らの能力も評価した。いずれかのアプローチを使用して、99.8%のリードが同じ同族sgIDと対になり、したがって、sgIDが正確に同定される保証を提供する。後者のアプローチを発明者らの最終分析に用いることを選択した。

発明者らの腫瘍呼び出しパイプラインを十分に開発し調査することにより、大きさの解像度の余分な10年間を省いた。発明者らの3つのDNAベンチマーク(DNA調製の初めに肺試料に添加される)(図9)はこの解像度の一見を提示する。DNAベンチマークのシーケンシングエラーは、DNAベンチマークの固有のsgID及び既知の二次バーコードにより容易に同定される。これらのシーケンシングエラーは通常廃棄されるが、それらを通常のリードパイルアップとして処理し、潜在的なシーケンシングエラーの特性を観察することができる。発明者らの較正した分析パイプラインなしでは、シーケンシングエラーは約103個の細胞の病変として現れ、発明者らのパイプラインを用いると、これらのシーケンシングエラーは、発明者らの最小細胞閾値を下回る約102個の細胞の病変として出現する(図2A)。

より重要なことには、発明者らのパイプラインは、技術的摂動に対して頑強である。最初の実験からの2匹の特定のマウスにおいて2つのさらなる技術的摂動を用いて再現性をより集中的にプロファイリングした。第1に、KLT 11週のマウス(JB1349)を大深度でシーケンシングし、次いで、典型的なリード深度に10倍ランダムにダウンサンプリングした(このダウンサンプリングは発明者らの研究を通して実際に検出されたリード深度におけるいずれのばらつきよりも劇的であった)。病変の大きさは、この最初の摂動において非常に高度に相関した(図2B)。加えて、KT 11週のマウス(IW1 301)は、異なる多重タグで2つのPCR反応において増幅された(図2C)。PCR及び多重は、リード深度よりも再現性を妨げるように思えるが、再現性は全体的に良好である。これらのマウスは、2つの有望な再現性の傾向も表す。(i)より大きい病変/腫瘍は、反復間で最も一貫しており、かつ(ii)腫瘍病変の大きさの全体的な形状(ヒストグラム)は、個々の腫瘍よりも反復間で良好に相関した(例えば、IW1301の各病変についてはr=0.89、一方、図8Bの60のヒストグラムビン内の腫瘍の存在量についてはr=0.993)。この2番目の所見は、発明者らの技術的摂動は偏りがないノイズを導入することを暗示する。また、全ての相関は対数の大きさを比較する。より大きい腫瘍が良好に相関するため、この形質転換は、実質的に、ピアソン相関係数を低減する。

腫瘍大きさ呼び出しに対するGC増幅の偏りの影響を最小にする。 発明者らの研究の各腫瘍を、それを保有したマウスmに対応する大きさtmrb、その最初のバーコードにより同定された同族sgRNA r、及び固有のバーコード配列(DADA2クラスターのコンセンサス)bにより定義する。発明者らのデータのおよその対数正規の構造を考慮すると(図3d及びデータ示さず)、τmrb=Ln(Tmrb/Emr[Tmrb])であるように大きさを対数形質転換し、正規化した。ここで、Emr[Tmrb]=Σb Tmrb/Nmrは、所与のマウスm及びsgRNA rについての予想された病変の大きさであり、この表記を期待値に使用する。集約された指数が下付き文字から外されるこの表示は全体を通して使用される。GCの偏りはわずかであった。Emr[Tmrb]の変動係数(CV)は5.0%であった。この周辺分布は、尚も、4次最小二乗多項式適合(Ebmrb]のf4(b))によって最も良く説明された組み合わされたバーコード配列のGC含有量に対するわずかな依存を示した(調整されたr2=0.994)。sgIDは全て十分に平衡化されたGC含有量で設計されたが、第2のバーコードはランダムな配列を含む。バーコードを生成する多項プロセスはGC含有量の中間レベルを最も一般的なものにしたが、GC含有量のある偏差が観察された。f4(b)の最大値は中間GC含有量で生じ、PCRは増幅を中間体融解温度のテンプレートDNAへ偏らせることを示唆する。このGCの偏りの作用を対数形質転換された値から差し引いた:tmrb=Ln[Tmrb]−f4(b)。この補正は平均して5%腫瘍の大きさを改変する。

Lenti−TS−Pool/Creウイルスを使用したインビトロ切断効率の計算 細胞株を発現するCas9をLenti−TS−Pool/Creウイルスに感染させ(形質導入し)、48時間後に採取した。gDNAを抽出し、標的遺伝子座を上記プライマーを使用して増幅した。

標的部位でのインデルの分析 インビボでのCRISPR/Cas9誘導インデル形成を確認するために、GoTaq Greenポリメラーゼ(Promega M7123)、及び以下のペアエンドシーケンシングに適している短いアンプリコンをもたらすプライマー対を使用して、目的の各遺伝子の標的領域を、バルク肺試料から抽出したゲノムDNAからPCR増幅した。

PCR産物は、ゲル抽出されるか、またはQiagen(登録商標)MinEluteキットを使用して直接精製されるかのいずれかであった。DNA濃度は、製造業者の指示に従い、Qubit HSアッセイを使用して決定された。14個全ての精製されたPCR産物を、各マウスについて等しい比率で組み合わせた。TruSeq Illumina(登録商標)シーケンシングアダプターは、標準プロトコルで、SPRIworks(Beckman Coulter,A88267)を使用して、マウス当たり単一の多重 タグとともにプールされたPCR産物上にライゲートされた。シーケンシングは、シングルエンドの150−bpリードを生成するためにIllumina HiSeqで行われた(Stanford Functional Genomics Facility)。

Custom Pythonスクリプトを使用してインデルシーケンシングデータを分析した。14個の標的領域の各々について、8−merは、46の塩基対領域を生成するために、標的領域のいずれかの側で選択された。リードは両方のアンカーを含有することが必要であり、シーケンシングエラーは許容されなかった。次いで、2つのアンカー間の各断片の長さを決定し、予想された長さと比較した。インデルは、挿入または欠失された塩基対の数に従い分類された。

各個々のマウスにおける各個々の遺伝子座のインデルのパーセントは以下のように計算された。

次いで、3つのNeo遺伝子座におけるインデルの平均%が計算され、他の全ての標的遺伝子のインデル%はこの値に対して正規化されて、図6AにプロットされるNeoに対するインデル%を生成した。

Lenti−TS−Pool/Creウイルスを使用したインビトロ切断効率の計算 細胞株を発現するCas9をLenti−TS−Pool/Creウイルスに感染させ(形質導入し)、48時間後に採取した。gDNAを抽出し、標的遺伝子座を上記プライマーを使用して増幅した(標的部位でのインデルの分析を参照されたい)。第1に、全てのプライマーをプールし、GoTaq Greenポリメラーゼ(Promega M7123)を使用して15回のPCRを行った。次いで、上述の個々のプライマー対で、これらの産物を後続の増幅に使用した。シーケンシングライブラリを上述したように調製した。

組織診断、免疫組織化学、及び腫瘍分析 試料を4%ホルマリンで固定し、パラフィン包埋した。ABC Vectastainキット(Vector Laboratories)を用いて、Tomato(Rockland Immunochemicals, 600−401−379)、Smad4(AbCam,AB40759)、及びSox9(EMD Milipore,AB5535)に対する抗体で免疫組織化学を4μmの切片で行った。切片をDABで発色させ、ヘマトキシリンで対比染色した。標準方法を使用してヘマトキシリン及びエオシン染色を行った。

Lenti−sgTomato/Creに感染させた(形質導入した)肺からの切片をTomatoに対して染色し、腫瘍を、陽性(>95% Tomato陽性がん細胞)、陰性(Tomato陽性がん細胞なし)、または混合(全ての他の腫瘍)としてスコア化した。腫瘍を分類し、4匹の独立したマウスからの全ての肺葉を通して単一の切片から計数した。

Lenti−sgSetd2及びLenti−sgNeoで誘導した腫瘍面積の定量化及び腫瘍のバーコードシーケンシング Lenti−sgSetd2#1/Cre、Lenti−sgSetd2#2/Cre、またはLenti−sgNeo2/Creウイルスに感染させた(形質導入した)マウスからの腫瘍保有肺葉をパラフィン包埋し、切片し、ヘマトキシリン及びエオシンで染色 した。腫瘍面積パーセントをImageJを使用して決定した。

Lenti−sgSetd2#1/Cre及びLenti−sgNeo2/Creに感染させた(形質導入した)KT;Cas9マウスにおける個々の腫瘍内のがん細胞の数の分布を、上述したように、それらのそれぞれのレンチウイルスバーコードのIllumina(登録商標)シーケンシング、及び後続の分析により評価した。

Lkb1及びCas9のウエスタンブロッティング Lenti−sgLkb1/Cre発生腫瘍を有するKT及びKT;Cas9マウスからの顕微解剖されたTomato陽性肺腫瘍を、Cas9及びLkb1タンパク質発現について分析した。試料をRIPA緩衝液に溶解し、LDSローディングダイとともに煮沸した。変性試料を4%〜12%Bis−Trisゲル(NuPage)で流し、PVDF膜上に移動させた。Hsp90(BD Transduction Laboratories,610419)、Lkb1(Cell Signaling, 13031P)、Cas9(Novus Biologicals,NBP2−36440)に対する一次抗体、ならびに二次HRPコンジュゲートされた抗マウス(Santa Cruz Biotechnology,sc−2005)及び抗ウサギ(Santa Cruz Biotechnology,sc−2004)抗体を使用して膜を免疫ブロットした。

Smad4のCas9媒介不活性化を伴うマウスの生存分析 Smad4に起因する機能性腫瘍抑制の欠如を確認するために、KT及びKT;Cas9マウスを105 Lenti−sgSmad4/Creで気管内感染させた(形質導入された)。生存を評価するために、マウスが眼に見える窮迫な兆候を示したときに屠殺した。

実施例2:インビボでの発がん性変異型の多重定量分析 ヒトがんの大規模なゲノム分析は、腫瘍発達を発生させ、がん成長を維持すると考えられる体細胞点変異をカタログ化した。しかしながら、特定の改変の機能的意義を決定することは、発明者らのがんの遺伝的決定因子の理解において依然として主な支障となっている。ここで、発明者らは、マウスにおいて新しいがんにおける複数のゲノム改変を同時に調査するために、DNAバーコード化及びハイスループットシーケンシングと多重AAV/Cas9媒介相同組換え修復(HDR)を統合するプラットホームを提示する。このアプローチを使用して、非同議変異のバーコード化されたライブラリを、成体の体細胞のKrasのホットスポットコドン12及び13に導入して、肺、膵臓、及び筋肉において腫瘍を発生させた。バルク肺及び膵臓からのバーコード化されたKrasHDR対立遺伝子のハイスループットシーケンシングは、Kras変異型発がん性において驚くべき多様性を明らかにした。インビボでの正確なゲノム改変の機能を同時に調査するための迅速で対費用効果が高い定量的アプローチは、発がん性についての生物学的及び臨床的にすぐに実行可能な見解を明らかにする。

結果 定量的かつ比較的にハイスループットの様式でインビボでの多様な点変異の発がん性機能を分析するために、いくつかのがんの種類の自発性マウスモデルにおいて、DNAバーコード化及びハイスループットシーケンシングを組み込む体細胞AAV/Cas9媒介HDRのためのプラットホームを開発した(図23A〜D)。多重様式で、全ての可能なKrasコドン12及び13単一ヌクレオチド非同点変異を体細胞マウス細胞に導入するために、AAVベクターのライブラリを設計、生成、及び検証した(図23E〜G及び図27)。各AAVは、Krasの第2のエクソンを標的とするsgRNA、約2kbのKras HDRテンプレート、及びCreリコンビナーゼ(AAV−KrasHDR/sgKras/Cre;図23E及び図27A〜C)を含有した。

KrasHDRテンプレートは、Krasのコドン12及び13に野生型(WT)Krasまたは12個の単一ヌクレオチド非同義変異のうちの1つのいずれか、ならびにKrasの第2のエクソンの脇側に位置するゲノム配列を含有した。各KrasHDRテンプレートは、KrasHDR対立遺伝子のCas9媒介切断を防止するために、sgKras標的配列内にサイレント変異及び関連プロトスペーサ隣接モチーフ(PAM*)も含有した。バルク組織からのDNAのハイスループットシーケンシングにより個々の腫瘍の並行定量化を可能にするために、12及び13の下流のコドンのゆらぎ位置内に操作されたランダムな8−ヌクレオチドバーコードを用いて各KrasHDRテンプレートを多様化した(図23E及び図27B、C)。

AAVベクターもCreリコンビナーゼをコードした。Cre発現は、Cre調節されたCas9対立遺伝子(H11LSL−Cas9)、蛍光Creレポーター対立遺伝子(R26LSL−Tomato)、ならびに周知の腫瘍抑制遺伝子p53(p53flox)またはLkb1(Lkb1flox)のフロキシングされた対立遺伝子を含有するマウスにおける腫瘍発生を可能にした。高力価産生、インビボでのマウス肺上皮細胞の効率的な形質導入(図28)、及び広範な成体マウス組織の形質導入を可能にするAAV8カプシドを使用して、AAV−KrasHDR/sgKras/Creライブラリをパッケージした。

培養においてCas9発現細胞をAAV−KrasHDR/sgKras/Creで形質導入して、AAV/Cas9媒介HDRが点変異を内因性Kras遺伝子座内に操作するための偏りがない方法であるかを決定した(図27E)。KrasHDR特異的PCR増幅、続いて形質導入された細胞のハイスループットシーケンシングは、全ての点変異体Kras対立遺伝子の生成を確認した(図27F、G)。さらに、インビボKrasHDR対立遺伝子頻度は、AAV−KrasHDR/sgKras/Creプラスミドライブラリにおいてそれらの表示と相関した。この結果は、発明者らのAAVベクターを使用するHDRが、KrasHDRテンプレートにおける任意の単一ヌクレオチドKrasコドン12または13の点変異により劇的に偏らないことを確認する。したがって、特定のKras変異対立遺伝子を保有する腫瘍の任意の差次的な拡張は、各Kras対立遺伝子を有するドナーDNAテンプレートを使用するHDRの効率における相違ではなく、Kras変異型間の生化学的な相違に起因し得る(図27H)。

体細胞におけるHDRが腫瘍を発生させることができるかを決定するために、及びKras変異型が腫瘍形成を駆動するそれらの能力において異なるかを調査するために、AAV−KrasHDR/sgKras/Creライブラリを、H11LSL−Cas9対立遺伝子を有するマウスの肺に気管内送達した(図24及び29)。具体的には、腫瘍抑制遺伝子の同時不活性化がKras変異型発がん性を調節するかの見解を得るために、マウスの3つの異なる遺伝子型を形質導入した:1)Rosa26LSL−Tomato;H11LSL−Cas9(T;H11LSL−Cas9)マウス、2)ウイルスにより発生させた腫瘍がp53を欠くp53flox/flox;T;H11LSL−Cas9(PT;H11LSL−Cas9)マウス、及び3)ウイルスにより発生させた腫瘍がLkb1を欠くLkb1flox/flox;T;H11LSL−Cas9(LT;H11LSL−Cas9)マウス(図24A及び図29A)。

LT;H11LSL−Cas9マウスは、AAV投与のおよそ5ヶ月後に、頻呼吸及び体重減少を含む腫瘍発達の兆候を最初に示した。これは、Cre調節されたKrasG12D対立遺伝子及びLkb1の喪失を有するマウスにおける肺腫瘍の迅速な成長と一致する。LT;H11LSL−Cas9マウスは、多くの原発性肺腫瘍に起因する非常に高い腫瘍負荷を有した(図24B、C及び図29B〜D)。これらのマウスの肺の組織学的分 析は、大きい腺腫及び腺癌の存在を確認した(図24B及び図29B)。PT;H11LSL−Cas9マウスも多くの大きい原発性肺腫瘍を発達させた。LT;H11LSL−Cas9マウスと比較して、PT;H11LSL−Cas9マウスにおいて発生した腫瘍は、p53欠損の特有の特徴であるより明白な核異型を有した。最後に、T;H11LSL−Cas9マウスは、後の時間点でも、より小さく、あまり進行していない病変を発達させた(図24B、C及び図29B〜D)。10倍低い用量のAAV−KrasHDR/sgKras/Creを形質導入されたマウスは、比例的に少ない腫瘍を発達させた(図29E)。

AAV−KrasHDR/sgKras/Creを形質導入された数匹のLT;H11LSL−Cas9及びPT;H11LSL−Cas9マウスも、侵襲性の原発性肺腫瘍、胸膜腔に播種性腫瘍細胞(DTC)、及びリンパ節転移を発達させた(図24D、E及び図29F、G)。したがって、AAV−KrasHDR/sgKras/Cre誘導腫瘍は、悪性及び転移性肺癌に進行し得る。

発がん性KrasG12Dが全てのウイルスにより形質導入された細胞において発現されるように、KrasLSL−G12D;PT及びKrasLSL−G12D;LTマウスを1:10,000希釈のAAV−KrasHDR/sgKras/Creに感染させることにより、肺におけるAAV/Cas9媒介体細胞HDRの効率を推定した。これらのマウスは、発がん性Kras対立遺伝子がAAV/Cas9媒介体細胞HDRによって生成されたマウスの腫瘍の数のおよそ半分を発達させた。この結果は0.02%〜0.1%のHDR頻度と一致し、個々のマウスにおいて並行して複数の肺腫瘍を堅固に発生させることができる(図24C)。重要なことには、sgKras(AAV−KrasHDR/Cre)を有しない類似のベクターライブラリのT、PT、及びLTマウスへの送達は、効率的な腫瘍発生をもたらさず、高レベルのAAVベクター形質導入と組み合わされたp53欠損またはLkb1欠損のいずれも肺腫瘍形成を駆動するために十分ではないことを示唆する(図24C及び図30)。

腫瘍がAAV−KrasHDR/sgKras/Cre保有変異KrasHDR対立遺伝子を使用して発生されたことを検証するために、LT;H11LSL−Cas9及びPT;H11LSL−Cas9マウスの大きい個々の肺腫瘍からFACS単離されたTomato陽性がん細胞のKras遺伝子座を分析した。KrasHDR対立遺伝子に特異的なプライマーを使用したPCR増幅は、各腫瘍内に固有のバーコードを有する発がん性Kras対立遺伝子の存在を確認した(図24F及び図31A、B)。興味深いことに、初期のAAVライブラリにおいて任意の検出可能なHDRの偏り及び変異対立遺伝子の比較的均一な表示がないにもかかわらず、13個のKras変異型のうちの5つしか約50個の大きい肺腫瘍において同定されなかった(図24F)。この結果は、肺腫瘍形成におけるKras変異型の差次的な選択と一致する。

個々の腫瘍を分析することにより、腫瘍細胞に存在するKrasHDR対立遺伝子ならびに第2のKras対立遺伝子の両方を注意深く評価することができた(図31)。発がん性KrasHDR対立遺伝子のおよそ半分は、Kras点変異及び固有のバーコードが内因性Kras遺伝子座内にシームレスに組換えられた、完全なHDR事象に起因した。残りのKrasHDR対立遺伝子は、5’端から変異エクソン2までシームレスであったが、イントロン2に小さい重複、挿入、または欠失を含有した(図31D)。重要なことには、これらの改変のいずれも変異エクソン2からエクソン3へのスプライシングを破壊するとは予想されない。加えて、ほぼすべての腫瘍は第2のKras対立遺伝子にCas9誘導されたインデルを保有し、これは、発がん性KRAS駆動ヒト腫瘍における野生型Kras対立遺伝子の頻繁な喪失と一致する(図31E、F)。以前の研究は、マウスにおける野生型Kras対立遺伝子の不活性化後のKrasG12D−及びKrasQ61 L駆動肺腫瘍成長の増強を記述していたが、発明者らの結果は、多くの発がん性Kras変異型が肺腫瘍成長中に野生型Krasによって抑制される可能性があることを示唆する。

ヒト肺癌の駆動に加えて、発がん性KRASは、ヒト膵管腺癌(PDAC)においてほぼ偏在する。KrasG12DまたはKrasG12Vの発現及びp53の不活性化は、マウスモデルにおいてPDACの発達をもたらす。AAV/Cas9媒介体細胞HDRが膵上皮細胞においてがんを発生させる発がん性点変異を誘導することもできるかを決定するために、逆行膵管注射により、PT;H11LSL−Cas9マウスにAAV−KrasHDR/sgKras/Creを形質導入した(図25A及び図32A)。これらのマウスは、前がん性膵上皮内新生物(PanINs)ならびにPDAC(図25B及び図32B、C、F)を発達させた。数匹のマウスも侵襲性及び転移性のPDACを発達させ、ヒト疾患の攻撃的な性質と一致した(図25C及び図32D〜F)。いくつかの大きい膵腫瘍塊からのKrasHDR対立遺伝子のシーケンシングにより、固有のバーコードを有する発がん性Kras対立遺伝子が明らかとなった(図24D)。興味深いことに、4つの試料が分析されただけだが、ヒト膵癌において最も頻繁な2つのKRAS変異であるKrasG12D及びKrasG12Vのみが観察された。発がん性KrasがPDACを発生させる要件と一致し、発明者らの陰性対照AAV−KrasHDR/Creベクターの逆行膵管注射によるPTマウスにおける膵細胞の形質導入は、いずれの膵腫瘍も誘導しなかった(図32F)。

ヒト軟組織肉腫もRAS経路ならびにTP53において頻繁に変異を保有する。肉腫は、KrasG12Dの発現及びp53の不活性化を通して遺伝子操作されたマウスにおいて誘導されてきた。AAV/Cas9媒介体細胞HDRを使用して点変異をKras内に導入し、肉腫形成を駆動することができるかを決定するために、AAV−KrasHDR/sgKras/Creの、PT;H11LSL−Cas9マウスの腓腹筋への筋肉内注射を行った(図25E及び図33A)。これらのマウスは、固有にバーコード化されたKrasG12D、KrasG12A、及びKrasG13R対立遺伝子を保有した迅速に成長する侵襲性の肉腫を発達させた(図25F〜H及び図33)。異なる組織において発生から悪性進行までの腫瘍形成をモデル化するためのこのプラットホームの適用の成功は、広範囲のがんの種類における発がん性駆動物質変異の多重機能分析に対するその広範な適用性を強調する。

自発性がんモデルにおいて遺伝子機能を評価するための現在の方法は、腫瘍の数及び大きさの手動による定量化に大きく依存するが、発明者らは、バルク組織から直接腫瘍細胞数を腫瘍遺伝子型に連結する単純だがハイスループットの多重アプローチを確立した(図23D及び4A)。HDRにより体細胞に導入された固有のDNAバーコードは、細胞が分裂すると数が増加するため、所与の腫瘍内のがん細胞の相対数はバーコード領域のディープシーケンシングにより決定され得る。さらに、各腫瘍内の細胞の絶対数は、ディープシーケンシングの前に正規化対照を各試料に添加することにより推定され得る。AAV−KrasHDR/sgKras/Creを形質導入されたT;H11LSL−Cas9、PT;H11LSL−Cas9、及びLT;H11LSL−Cas9マウスからの全肺の各腫瘍内の遺伝子型を決定し、がん細胞の絶対数を推定するために、既知のバーコードを有する5×105個の細胞からのDNAを各試料に最初に添加した(図26A及び図34)。次いで、バルク肺試料からDNAを抽出し、KrasHDR対立遺伝子をPCR増幅し、各対立遺伝子の変異型−バーコード領域をディープシーケンシングした(図23D及び4A、ならびに図34)。

ハイスループットシーケンシング後、繰り返し起こるシーケンシングエラー及び同一のバーコードを有する個々腫瘍の可能性に対して補正された。次いで、腫瘍バーコードシー ケンシングリード計数を正規化対照DNAからのリード数に対して正規化することにより、各腫瘍内のがん細胞の絶対数を推定した。この分析パイプラインは例外的に再現性があり、技術的反復にわたる腫瘍の大きさの一致度が高かった(図35)。バルク組織からの個々の腫瘍の並行した定量分析を可能にすることにより、このHDRに基づくバーコード化及びディープシーケンシングアプローチは、前例がないインビボ腫瘍ランドスケープ像を提供する。

KrasHDR変異型−バーコード領域のハイスループットシーケンシングは、T;H11LSL−Cas9、PT;H11LSL−Cas9、及びLT;H11LSL−Cas9マウスにおいて多くのAAV−KrasHDR/sgKras/Cre誘導された肺腫瘍を明らかにした(図36A〜C)。腫瘍数を、AAV−KrasHDR/sgKras/Creベクターライブラリの各KrasHDR対立遺伝子の初期表示に対して正規化することにより、各Kras変異型のインビボ発がん性を直接比較することが可能となった(図26B及び図36D、E)。500個を超える腫瘍にわたって、KrasG12Dは最も一般的な変異型であり、KRASG12Dが禁煙者のヒト肺腺癌において最も頻繁なKRAS変異であることと一致した。KrasG12A、KrasG12C及びKrasG12V(ヒト肺腺癌において、KRASG12Dの後に最も頻繁なKRAS変異型)、ならびにKrasG13Sは、肺腫瘍形成の中程度の駆動物質として同定されたが、KrasG12Dよりも顕著に少ない腫瘍に存在した(図26B)。興味深いことに、ヒト肺癌においてあまり頻繁に変異しないにも関わらず、KrasG12R及びKrasG13Rも強力な発がん性変異型として同定された(図26B)。

PT;H11LSL−Cas9及びLT;H11LSL−Cas9マウスにおいて腫瘍を発生させて、同時腫瘍抑制因子改変が異なるKras変異型の腫瘍成長を発生及び駆動する能力を調節するかを直接評価した。興味深いことに、Kras発がん性の全体的なスペクトルがLkb1不活性化により顕著に変化したが、p53またはLkb1の同時不活性化の腫瘍において、個々のKras変異型の相対的腫瘍原性の可能性に劇的な相違は観察されなかった(図26C〜E及び図36)。このデータは、インビボでこれらの発がん性Kras変異型により誘導されたシグナル伝達の強度がp53経路に関与するためは不十分であるモデルと一致し、したがって、p53は腫瘍進行を制限するが、ある特定のKras遺伝子型を有する腫瘍の初期拡大を限定しない。加えて、Lkb1欠損は腫瘍成長を増加させるが、Lkb1欠損により誘導されたシグナル伝達はKrasの特定の変異形態により誘導された下流シグナルと優先的に共同作用しない。

発明者らの腫瘍バーコード化及びシーケンシングプラットホームはバルク肺からの多くの個々の肺腫瘍を並行して同定することを可能にするため、このアプローチを使用して、ヒトPDAC31の自発性マウスモデルにおいて発生させた多源性腫瘍塊における個々の膵腫瘍クローンを同定及び分析する課題を克服することもできると予想した。したがって、AAV−KrasHDR/sgKras/Creを形質導入されたPT;H11LSL−Cas9マウスからのバルク膵腫瘍試料も分析した(図26F及び図37A、B)。膵腫瘍塊のバーコードシーケンシングは、マウス当たりの複数の原発性腫瘍クローンを明らかにし、各々、Krasコドン12または13に点変異を保有するKrasHDR対立遺伝子、ならびに固有のDNAバーコードを保有した。膵腫瘍は発がん性Kras対立遺伝子優先を示し、KrasG12D、KrasG12V、及びKrasG12Rが最も一般的な変異型であった(図26F)。とりわけ、これら3つのKras変異型は、ヒトPDACにおいて最も一般的な発がん性KRAS変異でもある。

特定のKras変異型のインビボ発がん性を決定することに加えて、発明者らのバーコード−シーケンシングアプローチは、PDAC塊の多領域シーケンシングから連続腫瘍クローンを同定し、原発性腫瘍とそれらの転移性子孫との間のクローン関係を明らかにする ことを可能にする(図26G及び37C)。

ヒトがんにおける変異の蔓延は、変異が起こる頻度及び変異が腫瘍形成を駆動する程度の両方の関数である。AAV/Cas9媒介体細胞HDRを使用して、偏らない様式で点変異を内因性Kras遺伝子座に導入することにより、Kras変異型が肺腫瘍形成を駆動するために定量的に異なる能力を有すると決定された(図4B及び図36)。さらに、発明者らのHDRに基づくアプローチを使用してマウスにおいて発生させた膵腫瘍は、ヒトPDACと同じ優性Kras変異型に対する選択を示し、ヒトPDACにおいて観察されたKRAS変異のスペクトルがそれらの変異速度における相違によるのではなく、KRAS変異体間の生化学的相違により駆動される可能性があることを示唆する(図26F及び図37)。

各Kras変異型の生化学的特性がどのようにそのインビボ発がん性に影響を及ぼすかを理解し始めるために、以前に記述されたKras変異型の生化学的挙動と、発明者らの研究の肺または膵腫瘍形成を駆動するそれらの能力との間の関係を調査した(図38)。とりわけ、KRAS変異は、KRAS機能に重要であると考えられる生化学的特徴(例えば、GTPase活性及びRAFキナーゼ親和性)において劇的な相違をもたらすが、1つの生化学的特性もインビボKras変異型発がん性において予想されなかった。この結果は、Kras変異型のインビボ発がん性が、別の生化学的特性により、またはおそらくより高い可能性としては複数の生化学的出力の相互作用を通して最も良く説明され得ることを示唆する。

この作業は、並行した変異のパネルのインビボ発がん性の対費用効果が高くかつ系統的な研究のための、定量的で測定可能なモジュール式アプローチとしての発明者らのAAV/Cas9媒介体細胞HDRアプローチを強調する。インビボでのKras機能の遺伝学的解剖を可能にする多重アプローチは、RASタンパク質の変異形態の進行中の生化学及び細胞培養研究に対して重要な補足を表す。この方法は、多くの一般的ながんの種類にわたって、一般的ながん遺伝子における多様な変異ならびに稀な推定上の発がん性変異の機能の前例がない理解を可能にする。最後に、このプラットホームが正確に定義されたがんの遺伝子サブタイプに対する標的療法の発見及び前臨床検討の両方を劇的に加速することを想定する。

方法 Krasを標的とするsgRNAの設計、生成、及びスクリーニング 体細胞マウス細胞において相同組換え修復(HDR)を強化するためにKrasを標的とするsgRNAを得るために、Krasエクソン2及び脇側のイントロン配列を標的とする全ての可能な20−bp sgRNAを同定し(コンセンサスCas9 PAM:NGGを使用して)、利用可能なsgRNA設計/スコア化アルゴリズムを使用して、予測された的確な切断効率についてそれらをスコア化した。次いで、Krasを標的とする3つのsgRNA(sgKras#1:GCAGCGTTACCTCTATCGTA、sgKras#2:GCTAATTCAGAATCACTTTG、sgKras#3:GACTGAGTATAAACTTGTGG)の切断効率を経験的に決定した(図27A)。簡潔に、Lenti−U6−sgRNA/Creベクターを、前述したように、Krasを標的とする各sgRNAのために生成した。Q5(登録商標)部位特異的変異誘発(NEB)を使用して、sgRNAを、sgRNA転写を駆動するためのU6プロモータならびにCreリコンビナーゼを駆動するPGKプロモータを含有する親レンチウイルスベクターに挿入した。各sgKrasの切断効率は、各Lenti−sgKras/Creウイルスで、培養においてLSL−YFP;Cas9細胞の形質導入を介して決定された。感染(形質導入)の48時間後にFACSによりYFP陽性細胞を単離し、DNAを抽出し、標的Kras遺伝子座をPCR増幅し(フォワードプライマー:TCCCCTCTTG GTGCCTGTGTG、リバースプライマー:AAGCCCTTCCTGCTAATCTCGGAG)、アンプリコンをサンガーシーケンシングした(シーケンシングプライマー:GCACGGATGGCATCTTGGACC)。TIDEによりシーケンシングトレースを分析して、インデル誘導パーセントを決定した。3つ全てのsgRNAが予想された遺伝子座でインデルを誘導したため、Krasコドン12及び13に最も近い配列を標的とするsgKras(sgKras#3)を全ての後続の実験に使用した。これは、所望の遺伝子座でHDRを最良に促進すると予想されたためである(図27A)。

AAV−KrasHDRプラスミドライブラリの設計、構築、及び検証 AAV−KrasHDR/sgKras/Cre骨格の生成 pLL3.3;U6−sgKras/PGK−CreからのU6−sgKras/PGK−Creカセットを、Q5(登録商標)ポリメラーゼ(NEB)でPCR増幅し、TOPOクローニングし(Invitrogen)、シーケンシングにより検証した。AAV−sgKras/Creベクターを生成するために、388−MCS AAVプラスミド骨格のITR間の配列を、XhoI/SpeIを使用して除去した。U6−sgKras/PGK−Creカセットを、XhoI/XbaIでTOPOベクターから消化し、1.9−kb断片をXhoI/SpeI消化された388−MCS骨格にライゲートし、SpeI部位を破壊した。MluI消化後、BGH polyA配列をCreの3’に挿入した。マウスKrasのエクソン2を囲む約2−kbの領域を、ゲノムDNAからPCR増幅した(フォワードプライマー:GCCGCCATGGCAGTTCTTTTGTATCCATTTGTCTCTTTATCTGC、リバースプライマー:GCCGCTCGAGCTCTTGTGTGTATGAAGACAGTGACACTG)。その後、アンプリコンをTOPOベクター(Invitrogen)にクローニングした。Q5(登録商標)部位特異的変異誘発(NEB)を使用して、AvrII/BsiWI部位をTOPOクローニングされた2−kb Kras配列に導入した(AvrIIフォワードプライマー:TGAGTGTTAAAATATTGATAAAGTTTTTG、AvrII リバースプライマー:下記(i)の組成、BsiWI フォワードプライマー:CTTGTAAAGGACGGCAGCC、BsiWI リバースプライマー:下記(ii)の組成、制限部位は下線付きであり、ミスマッチ塩基は小文字である)。AvrII/BsiWI部位を保有するKras断片はNcoI/XhoIでTOPOから放出され、NcoI/XhoI消化されたAAV−sgKras/Creにライゲートされて、AAV−KrasHDR/sgKras/Cre骨格を産生した。

AAV−KrasHDR/Cre骨格の生成 Krasを標的とするsgRNAなしでAAV−KrasHDR骨格を生成するために、PGK−CreをNotI/XbaIでTOPOクローンから切除し、NotI/XbaI消化された388−MCS AAVプラスミド骨格にライゲートした。BGH polyA配列及びマウスKras断片を上述したように付加して、対照AAV−KrasHDR/Cre骨格を産生した。

多様なKras変異型/バーコード領域の設計及び合成 活性化単一点変異及びDNAバーコードのライブラリをAAV骨格のKrasHDR配列に導入するために、Krasコドン12及び13の最初の2つの塩基対の各々で、縮重「N」塩基(A、T、C、及びG)を用いて4つの295−bp Kras断片を合成した(Integrated DNA Technologies)(図27B)。意図的に、4つの断片プールの各々は、対照として機能するように、コドン12及び13に3つの非同義単一ヌクレオチド変異、ならびに野生型Kras配列からなった。したがって、4つのプールの各々は野生型断片を含有したため、野生型Kras対立遺伝子の全体的な 表示は、変異Kras対立遺伝子の各々よりもおよそ4倍高いと予想された。合成された断片は、sgKras標的配列内にサイレント変異及び関連プロトスペーサ隣接モチーフ(PAM*)も含有し、8−ヌクレオチドランダムバーコードは、個々の腫瘍バーコード化のために、縮重塩基を下流Krasコドンのゆらぎ位置に導入することにより創出された(図27B)。最後に、各断片は、AAV−KrasHDR骨格内にクローニングするための脇側AvrII及びBsiWI制限部位を含んだ(図27B)。

Kras変異体/バーコード断片のAAV−KrasHDRベクターへのライゲーション 4つの合成断片プールを等しい比率で混合し、PCR増幅した(フォワードプライマー:CACACCTAGGTGAGTGTTAAAATATTG、リバースプライマー:GTAGCTCACTAGTGGTCGCC)。アンプリコンをAvrII/BsiWIで消化し、エタノール沈殿により精製し、両AAV−KrasHDR骨格内にライゲートした(図27C)。各ライゲートされたプラスミドライブラリをStbl3エレクトロコンピテント細胞(NEB)に形質転換し、20LB−Ampプレート上で平板培養し、これはライブラリ当たり約3×105個の細菌コロニーを生成した。コロニーをLB−Amp液体培地中にそぎ落とし、37℃で6時間拡張させて、プラスミドの収率を増加させ、AAV産生のための十分なプラスミドDNAを得た。次いで、Maxiprepキット(Qiagen)を使用して、プラスミドDNAを細菌培養物から抽出した。

AAV−KrasHDRプラスミドライブラリの検証 各Kras変異型の表示及び各AAVプラスミドライブラリ内のバーコードヌクレオチドの分布を決定するために、精製したAAVプラスミドライブラリを、多重タグ(下線付きN)を含有するIlluminaアダプター(小文字)を付けられたプライマーでPCR増幅し(フォワードプライマー:aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctCTGCTGAAAATGACTGAGTATAAACTAGTAGTC、リバースプライマー:下記(iii)の組成、次いで、MiSeq(Illumina(登録商標))でディープシーケンシングした。

AAVカプシド血清型肺上皮細胞形質導入分析 Ca3(PO4)2トリプルトランスフェクションプロトコルを使用して、以下の目的の9つのカプシドの各々に関してpAd5ヘルパー、ssAAV−RSV−GFP導入ベクター、及びシュードタイピングプラスミドを用いて、組換えAAV−GFPベクターを産生した:AAV1、2、3b、4、5、6、8、9_hu14、及びDJ。前述したように、HEK293T細胞(ATCC)においてウイルスを産生し、その後、二重塩化セシウム密度勾配精製及び透析を行った。rAAVベクター調製物を、GFPについてTaqMan qPCRにより滴定した(フォワードプライマー:GACGTAAACGGCCACAAGTT、リバースプライマー:GAACTTCAGGGTCAGCTTGC、プローブ:6−FAM/CGAGGGCGATGCCACCTACG/BHQ−1)。成体肺上皮細胞形質導入に最適なAAV血清型を同定するために、各マウスは、気管内投与を介して、最大力価の60μlのシュードタイプ化AAV−GFPを受容した。AAV投与の5日後にマウスを分析した。前述したように、肺を単一細胞懸濁液に分離し、GFP陽性細胞のFACS分析用に調製した。GFP陽性パーセンテージを、>10,000個の生存ゲーティングされた細胞を分析することにより決定した(図28を参照されたい)。

AAV−KrasHDRプラスミドライブラリの産生及び滴定 Ca3(PO4)2トリプルトランスフェクションプロトコルを使用して、上述のpA d5ヘルパー、pAAV2/8パッケージングプラスミド、及びバーコード化されたKrasライブラリ導入ベクタープールを用いて、AAVライブラリを産生した。前述したように、HEK293T細胞においてトランスフェクションを行い、その後、二重塩化セシウム密度勾配精製及び透析を行った。AAVライブラリを、CreについてTaqMan qPCRにより滴定した(フォワードプライマー:TTTGTTGCCCTTTATTGCAG、リバースプライマー:CCCTTGCGGTATTCTTTGTT、プローブ:6−FAM/TGCAGTTGTTGGCTCCAACAC/BHQ−1)。

インビトロAAV/Cas9媒介HDR コドン12及び13の変異を囲むヌクレオチド変化(sgRNA認識部位及びPAMモチーフを変異させるコドン12/13の5’の3つのヌクレオチド変化、バーコード配列においては最大10の変化)は、Krasコドン12及び13の点変異がHDRの速度に差次的に影響を及ぼす可能性を低くする。それにもかかわらず、発明者らは、HDR効率が個々のKrasHDR対立遺伝子の配列における相違によって影響を受ける可能性があるかを試験した。インビトロAAV/Cas9媒介HDRを誘導するために、精製したAAV−KrasHDR/sgKras/CreライブラリでLSL−YFP/Cas9細胞を形質導入した(図27E)。非相同末端結合(NHEJ)の阻害剤である10μM SCR7(Xcessbio)を含む細胞培養培地に細胞を維持して、相同組換え修復を促進した。形質導入の96時間後に、フェノール/クロロホルム抽出、続いてエタノール沈殿により、DNAをLSL−YFP/Cas9細胞から単離した。Kras遺伝子座は、内因性Kras遺伝子座に組み込まれたKrasHDR対立遺伝子の特異的な増幅のために発明者らが開発したPCR戦略を使用して、このDNAから増幅された。次いで、インビトロHDR後にこれらのアンプリコンをディープシーケンシングして、KrasHDR対立遺伝子の表示を決定した(PCR及びシーケンシングの詳細については以下の「Illumina(登録商標)ライブラリ調製及びバルク組織からの腫瘍バーコードのシーケンシング」のセクションを参照されたい)。

マウス及び腫瘍発生 Lkb1flox(L)、p53flox(P)、R26LSL−Tomato(T)、H11LSL−Cas9、及びKrasLSL−G12D(K)マウスは以前に説明されている。肺腫瘍を発生させるための気管内吸入によるAAV投与、膵腫瘍を発生させるための逆行膵管注射、及び肉腫を発生させるための筋肉内腓腹筋注射は記載されるように行われた。肺腫瘍は、60μlのAAV−KrasHDR/sgKras/Cre(1.4×1012vg/ml)を用いてPT;H11LSL−Cas9、LT;H11LSL−Cas9、及びT;H11LSL−Cas9マウスにおいて、60μlのAAV−KrasHDR/Cre(2.4×1012vg/ml)を用いてPT、LT、及びTマウスにおいて、または1XPBSに1:10,000希釈された60μlのAAV−KrasHDR/sgKras/Cre(1.4×1012vg/ml)を用いてKPT及びKLTマウスにおいて発生させた。膵腫瘍は、100〜150μlのAAV−KrasHDR/sgKras/Cre(1.4×1012vg/ml)を用いてPT;H11LSL−Cas9マウスにおいて、または100〜150μlのAAV−KrasHDR/Cre(2.4×1012vg/ml)を用いてPTマウスにおいて発生させた。1XPBSへのAAV−KrasHDR/sgKras/Creの1:10希釈は、示される場合、マウスの肺または膵臓にも投与された。肉腫は、30μlのAAV−KrasHDR/sgKras/Cre(5.2×1012vg/ml)を用いてPT;H11LSL−Cas9において発生させた。マウスは、腫瘍発達の症状を表したときに安楽死させた。Institutional Animal Care & Use Committee of Stanford Universityにより全てのマウス手順が承認された。

個々の腫瘍の分析 個々の肺腫瘍の分析 腫瘍発達の症状を表す肺腫瘍保有マウスは、ウイルス投与の4〜10ヶ月後に分析された。肺腫瘍負荷は、肺重量により、及び示される蛍光解剖スコープ下での顕微鏡Tomato陽性腫瘍の定量化により評価された(1匹のLT;H11LSL−Cas9マウスは、1つの肺葉の小さい領域に制限された最小Tomato陽性シグナルを有し、AAVの不適切な気管内投与を示し、研究から外された)。視覚的に多源性ではない最も大きい個々の肺腫瘍は、シーケンシングのために蛍光解剖顕微鏡下でバルク肺から解剖された。いくつかの肺腫瘍に関して、Tomato陽性腫瘍細胞は、Stanford Shared FACS Facility内で、FACS装置(Aria sorter;BD Biosciences)を使用して精製された。個々のマウスからのいくつかの肺葉も組織学的分析のために収集された。

個々の膵腫瘍塊の分析 膵腫瘍保有マウスは腫瘍発達の症状を表し、ウイルス投与の3〜4ヶ月後に分析された。膵腫瘍は主に多源性であるように見えるため、Tomato陽性腫瘍塊を含有する膵臓の個々の領域を解剖し、シーケンシングのためにFACS精製した(AAV−KrasHDR/sgKras/Creライブラリの1:10希釈で処置したマウスも膵腫瘍塊を発達させ、したがって、これらの分析に含まれた)。いくつかの膵臓の領域を組織学的分析のために保持した。

個々の肉腫の分析 明らかな腫瘍発達を有する肉腫保持マウスを、ウイルス投与の3〜7ヶ月後に分析した。各肉腫の領域をシーケンシングのために保持し、隣接領域を組織学的分析のために確保した。

個々の腫瘍におけるKras対立遺伝子の特徴付け DNeasy Blood及びTissue Extractionキット(Qiagen)を用いて、シーケンシングのためのDNAをFACS精製腫瘍細胞及び選別されていない腫瘍試料から抽出した。腫瘍内のKras点変異及びバーコードを同定するために、KrasHDR対立遺伝子を、アニーリング温度、伸張時間、及びプライマー配列(プロトコル1−フォワードプライマー:CTGCTGAAAATGACTGAGTATAAACTAGTAGTC、リバースプライマー:AGCAGTTGGCCTTTAATTGGTT、シーケンシングプライマー:AATGATACGGCGACCACCGAGATCTACAC、アニーリング温度66℃;プロトコル2−フォワードプライマー:GCTGAAAATGACTGAGTATAAACTAGTAGTC、リバースプライマー:TTAGCAGTTGGCCTTTAATTGG、シーケンシングプライマー:GCACGGATGGCATCTTGGACC;アニーリング温度:64℃)を含むいくつかの変数にわたって最適化した2つのプロトコルを使用してPCR増幅及びシーケンシングした。各々がコドン12及び13の上流のPAM領域に操作された変異と重複するフォワードプライマー、及び相同アームの外側にリバースプライマーを組み込んだため、これらのプロトコルを使用して、個々の腫瘍から組み込んだKrasHDR対立遺伝子を特異的に増幅した。長い伸張時間(2〜3分間)を使用して、全てのKrasHDR対立遺伝子(Kras遺伝子座のイントロン2に挿入または重複を含有するものでも)の増幅を可能にした(図31D)。

HDRを介して所望の点変異を内因性Kras遺伝子座に導入することとは別に、CRISPR/Cas9を使用したKrasエクソン2を標的とすることにより、HDRではなくNHEJによるDNA修復後に、切断部位でインデルをもたらすことも予想された。これらの修飾を特徴付けるために、一般的なPCRプロトコルを使用して、両方のKras対立遺伝子を増幅した(フォワードプライマー:TCCCCTCTTGGTGCCTG TGTG、リバースプライマー:GGCTGGCTGCCGTCCTTTAC、シーケンシングプライマー:CAAGCTCATGCGGGTGTGTC、アニーリング温度:72℃)。DNA切断部位での挿入及び欠失のスペクトルは、このアプローチにより同定された(図31E、F)。いくつかの個々の腫瘍試料に関して、両方のKras対立遺伝子の配列は、上記のPCR及びシーケンシング戦略後すぐに明らかにならなかった。これらの試料からのPCR産物は、TOPOクローニング(Invitrogen)及び形質転換され、各試料からのいくつかのコロニーをプラスミド調製し、シーケンシングして、各腫瘍の両方のKras対立遺伝子を特徴付けた。このアプローチは、生物学的及び技術的反復の両方にわたって再現性及び信頼性があり、様々なHDR誘導された発がん性Kras対立遺伝子が同定された。インデル含有Kras対立遺伝子は約50個の腫瘍において同定された(図31A、B)。

これらの分析は、個々の肺腫瘍からのKras対立遺伝子のいくつかにおいて、いくつかの他の予想外の特徴も明らかにした。コドン24(I24L、I24N、I24M)での3つの異なるミスセンス変異が分析した個々の肺腫瘍の小さいサブセットにおいて観察された。これらの改変の機能は、存在する場合、不明である。

さらに、発明者らは、KrasHDRテンプレートの内因性Kras遺伝子座への組換えがKrasHDRテンプレート内に操作されたAvrII及びBsiWI部位の外側で生じると最初に予測した(図31C)。しかしながら、エクソン2の97塩基対上流の2塩基対を改変することにより操作されたAvrII部位は、KrasHDR対立遺伝子のこの領域を直接分析した25個の腫瘍のうち5つで不在であった。エクソン2の20塩基対下流の1塩基対を改変することにより操作されたBsiWI部位は、58個の腫瘍のうち11個で不在であった。これらの知見は、KrasHDRテンプレートの組換えがより大きくより距離がある相同アーム内で生じることが最も多いが、5’及び3’ミスマッチ(PAM*変異、Krasコドン12または13変異、及びバーコード内の8つの潜在的なミスマッチを含む)の脇側に位置する非常に短い相同領域内でも検出可能な頻度で生じることを示した。

いくつかの腫瘍内のKrasHDR対立遺伝子において重複の存在を最初に同定した後、HDR組み込みKras遺伝子座のいずれかの側で生じたKrasエクソン2の重複を特異的に増幅するためにPCRプライマーを設計した(右側の重複−フォワードプライマー:TGACCCTACGATAGAGGTAACG、リバースプライマー:CTCATCCACAAAGTGATTCTGA、シーケンシングプライマー:TGACCCTACGATAGAGGTAACG;左側の重複−フォワードプライマー:TGAGTGTTAAAATATTGATAAAGTTTTTG、リバースプライマー:TCCGAATTCAGTGACTACAGATG、シーケンシングプライマー:TGAGTGTTAAAATATTGATAAAGTTTTTG)。これらの重複特異的PCRプロトコルの各々は逆の配向で隣接のプライマー対を使用し、増幅の重複が存在した場合にのみ生じることを確実にした。野生型エクソン2の後半またはエクソン2全体(しかし、スプライスアクセプターの重要な領域を欠く)の重複を含む、様々な長さの重複が同定された(図31D)。イントロン2の領域の欠失及び重複も観察された。さらに、U6プロモータ及びウイルスITRを含むAAVベクターの部分のイントロン2への組み込みが観察された。これらの改変の大きさ及び位置を考慮すると、腫瘍形成を駆動するための発がん性Krasの要件と一致し、誰もKras変異エクソン2のエクソン3へのスプライシングを変更するとは予想しない。

既知のKrasHDR対立遺伝子及びバーコードを有する細胞株からのハイスループットシーケンシングのための正規化対照の生成 シーケンシング正規化対照として使用するための細胞株を確立するために、PT;H1 1LSL−Cas9マウスから単一の大きい腫瘍を解剖し、単一細胞懸濁液中に消化し、平板培養して細胞株を生成した。これらの細胞を拡張し、次いで、DNAを抽出した後、Krasエクソン2をPCR増幅した(フォワードプライマー:TCCCCTCTTGGTGCCTGTGTG、リバースプライマー:GGCTGGCTGCCGTCCTTTAC)。PCR産物をシーケンシングして(上述の特異的及び一般的なシーケンシングプライマーを使用する)、KrasHDR対立遺伝子及びバーコードの存在を確認した。固有のバーコード(下記(iv)の組成)を有する単一KrasG12V対立遺伝子を同定した。この細胞株からのゲノムDNAを、全てのバルク肺試料のハイスループットシーケンシングの正規化対照として使用した(図34)。

バルク組織処理及びDNA抽出 バルク肺組織処理及びDNA抽出 バルク肺試料を感染させた(形質導入した)マウスから切断し、処理前に−80℃で保管した。シーケンシングのためのDNAを抽出するために、試料を解凍し、50mLの円錐管に移した。20mLの溶解緩衝液(H2O中、100mM NaCl、20mM Tris pH7.6、10mM EDTA pH8.0、0.5%SDS)及び200μLのプロテイナーゼK(20mg/mL)を各試料に添加した。次に、正規化対照DNAの3μg(約5×105ゲノム)を各試料に添加した(図25A及び図35B)。次いで、組織ブレンダーを使用して、試料を慎重に均質化し、組織ブレンダーはきれいな10%漂白剤、70%エタノール、及び1XPBSを通過させることにより各試料の間に洗浄された。均質化した試料を55℃で一晩溶解した。フェノール/クロロホルム抽出、続いてエタノール沈殿により、DNAを組織ライセートから単離した(図37A、B)。

バルク膵組織処理及びDNA抽出 膵腫瘍塊を解剖し、消化し、生存(DAPI陰性)、系統(CD45、CD31、Ter119、F4/80)陰性、Tomato陽性細胞をFACSにより単離した。正規化対照は膵癌試料には添加されなかった。DNeasy Blood and Tissue Extractionキット(Qiagen)を使用して、DNAをFACS単離した新生細胞から単離し、次いで、エタノール沈殿によりさらに精製した。

llumina(登録商標)ライブラリ調製及びバルク組織からのI腫瘍バーコードのシーケンシング 大規模に並行かつ定量的様式で各Kras変異型を保有する腫瘍の数及び大きさを明らかにするために、バーコード化されたKrasHDR対立遺伝子の多重Illumina(登録商標)シーケンシングを可能にした2回PCR戦略を開発した(図27f)。1回目のPCRに関して、3つのPAM及びsgRNA標的部位変異(PAM*;1回目のフォワードプライマー配列は太字である)を含有するKrasHDR配列に相補的なフォワードプライマー(1回目のフォワードプライマー:下記(v)の組成(配列番号2)、ならびにAAV−KrasHDR/sgKras/CreベクターのHDRテンプレートに存在しない内因性Kras遺伝子座の下流領域に相補的なリバースプライマー(1回目のリバースプライマー:TTAGCAGTTGGCCTTTAATTGG)(配列番号3)が使用された。このプライマー対は、バルク腫瘍保持組織から精製されたDNAに存在する豊富な野生型Kras対立遺伝子または潜在的なエピソームAAV−KrasHDR/sgKras/Creベクターを増幅することなく、ゲノムKrasHDR対立遺伝子を特異的に増幅するように選択された。加えて、多重Illumina(登録商標)シーケンシングを可能にするために、P5アダプター(イタリック体)、8−bpカスタムi5インデックス(N’s)、及びIllumina(登録商標)シーケンシングプライマー配列(リード1)(下線付き)が、1回目のフォワードプライマーの5’端に含まれた( Illuminaシーケンシング用の1回目のフォワードプライマー:下記(vi)の組成(配列番号4)。

重要なことには、個々の腫瘍内のKrasHDR対立遺伝子の特徴付けは、Krasイントロン2において多様なインデルをもたらすHDRにおいてあるばらつきを明らかにしたため(図32D)、4(肺試料)または6(膵臓試料)サイクルのみを1回目のPCRにおいて行って、可変長の産物の増幅中の偏りの可能性を最小にした。さらに、高効率ポリメラーゼ(Q5(登録商標)Hot Start High−Fidelityポリメラーゼ、NEB;64℃のアニーリング温度)及び長い伸張時間(3:00分間)を使用して、全てのKrasHDR対立遺伝子の頑強な増幅を確実にした。ゲノム肺DNAにおけるKrasHDR対立遺伝子は、4〜40個の別個の100μLのPCR反応物を使用して増幅され、次いで、増幅後にプールして、PCRジャックポットの作用を低減した(図34a)。これらの100μLのPCR反応物の各々は、大きい初期のKrasHDR対立遺伝子のプールから増幅するために、4μgのDNAテンプレートを含有した。1回目の増幅後、全ての反復PCR反応物をプールし、QIAquick PCR Purification Kit(Qiagen)を使用して、100μLの各試料を洗浄した。

100μLの2回目のIllumina(登録商標)ライブラリPCRのために、精製した1回目のPCRアンプリコンをテンプレートDNAとして使用した(Q5(登録商標)Hot Start High−Fidelityポリメラーゼ、NEB;72℃のアニーリング温度;肺試料に関しては35サイクル、膵臓試料に関しては40サイクル)。2回目のPCRは、1回目のPCRアンプリコンに存在したKrasエクソン2配列内の112−bp領域を全体的に増幅した。2回目のリバースプライマーは、Illuminaライブラリの二重インデックスされたペアエンドシーケンシングを可能にするために、5’端にP7アダプター(イタリック体)、逆相補8−bpカスタムi7インデックス(「Ns」)、及び逆相補Illuminaシーケンシングプライマー配列(リード2)(下線付き)を含有した(2回目のリバースプライマー#1:下記(vii)の組成(配列番号5)。2回目のPCRフォワードプライマーは、1回目のPCR中に、フォワードプライマーにより増幅したKrasHDR対立遺伝子に付加されたP5 Illuminaアダプターに相補的であった(2回目のフォワードプライマー:AATGATACGGCGACCACCGAGATCTACAC)(配列番号6)。このプライマーを使用して、1回目のPCR反応から持ち越された可能性がある任意の汚染ゲノムDNAを増幅することなく、1回目のPCRアンプリコンを増幅した。さらに、P7アダプター配列をコードする2回目のリバースプライマーは、他の2つのプライマーと同じ濃度で、2回目のPCR反応物に添加された(2回目のリバースプライマー#2:CAAGCAGAAGACGGCATACGAGAT)(配列番号7)。このプライマーは、2回目のリバースプライマー#1により、KrasHDRアンプリコンに付加された逆相補P7アダプター配列に結合する。2回目のPCRは35〜40サイクルにわたって行われたため、P7アダプター(2回目のリバースプライマー#2)は、長い2回目のリバースプライマー#1により産生された非特異的増幅の量を制限するために付加された。

2回目の増幅後、100−μLのPCR反応物は2.5%アガロースゲルで実行され、予想された大きさのバンドは切除された。QIAquick Gel Extraction Kit(Qiagen)を使用して、DNAをゲル断片から抽出した。精製したIllumina(登録商標)ライブラリの質及び濃度は、Bioanalyzer(Ag ilent)を使用して決定された。次いで、固有の二重インデックスを有する個々のIllumina(登録商標)ライブラリは、より大きい腫瘍負荷を有するマウスに本来由来するライブラリがより低い腫瘍負荷を有するマウスからのものよりも最終プールにおいて高い比率で表示されるように、一緒にプールされた(図34A)。合計35個の個々の試料が2つのIllumina(登録商標)ライブラリプールに組み合わされた。各プールの質及び濃度はBioanalyzer(Agilent)で確認された。次いで、各最終Illumina(登録商標)ライブラリプールは、多重150bpペアエンドRapid Runシーケンシングプログラム(Elim Biopharmaceuticals)を使用して、Illumina(登録商標)HiSeqレーンでディープシーケンシングされた。

バーコード化された腫瘍の大きさ及び数を推定するためのIlluminaシーケンシングデータの分析 発明者らの逆多重Illumina(登録商標)シーケンシングデータから腫瘍を呼び出すためのパイプラインを開発した。パイプラインは、固有のバーコード配列を集計し、アンプリコンのディープシーケンシングデータ(DADA2)のノイズ除去をするように設計されたアルゴリズムを使用して、繰り返し起こるシーケンシングエラーを排除する。このアルゴリズムを、偽腫瘍呼び出しの発生を最小にし、技術的偏り(リード深度における変動、Illumina(登録商標)シーケンシング装置エラー率における変動、及びバーコード多様性における変動を含む)を最小にするように調整した。AAV/Cas9媒介体細胞HDR駆動腫瘍形成後の腫瘍遺伝子型及びバーコードの分析に対する修正を含むこのパイプラインを以下に説明する。

ペアエンドリードの統合、フィルタ処理、及びトリミング 発明者らのIllumina(登録商標)シーケンシングライブラリは、KrasHDR対立遺伝子の小さい112−bp断片を含有したが、これらの断片の150bpペアエンドシーケンシングを行い、重複するフォワード及びリバースリードを統合して、KrasHDR対立遺伝子のKrasコドン12及び13ならびにバーコード領域におけるIllumina(登録商標)シーケンシングエラーの可能性を低減した。重複するペアエンドリードを統合し、品質フィルタ処理し、PANDAseqを使用してトリミングした(断片長:60bp、フォワードトリミングプライマー:ATGACTGAGTATAAACT;リバーストリミングプライマー:CTCATCCACAAAGTGA)。

固有の腫瘍の呼び出し フォワード及びリバースリードを統合して、シーケンシングエラーを低減した後でも、おそらく繰り返し起こるllumina(登録商標)シーケンシングエラー(または可能性は少ないが繰り返し起こるPCRエラー)からの10,000塩基当たり平均約1つのエラーが検出された。このエラー率を考慮すると、単一ヌクレオチドミスマッチを含有する大きい固有にバーコード化された腫瘍からのリードは、大きい実際の腫瘍の大きさの約1/10,000の小さい偽腫瘍として呼び出されることが予想された。特定のマウスにおいて、最も大きい腫瘍に対して約3〜4桁小さく、1ヌクレオチド偏位を含有した偽「腫瘍」の小さいクラスターが観察されたため、この現象は眼で確認できた。加えて、各KrasHDR変異型−バーコード対も発がん性コドン12または13の変異塩基において繰り返し起こるシーケンシングエラーを生成した。

腫瘍を正確に呼び出すために、以下のステップを用いて、腫瘍バーコードシーケンシングデータを分析するための計算及び統計パイプラインを開発した。 DADA2を使用して、リードの非バーコード領域からのエラーモデルを訓練し、固有のリードパイルアップを腫瘍にクラスター化する。 KRASコドン12の上流の7つのヌクレオチド及び最終バーコード塩基の下流の7つ のヌクレオチドからのシーケンシング/PCRエラーの残存率を推定した。次いで、DADA2を介して、発明者らのシーケンシングエラーのモデルを使用して、固有のリードパイルアップ(バーコード化された塩基の7つのヌクレオチド以内に切り詰められた)を固有の腫瘍にクラスター化した。固有のクラスター起源の最小信頼度0.01(すなわち、オメガ_a=0.01)を使用した。閾値がより大きいと、マウス試料において呼び出された固有の腫瘍の数が増加した。ペアエンドシーケンシングが、固有のパイルアップが本当に異なる腫瘍であったという大きい信頼度をもたらすように思えたため、このより大きい値を選択した。例えば、この閾値が全ての意図されないリード配列(例えば、バーコードの外側の不適切なヌクレオチドを有するリード)を排除し、この閾値が生物学的反復間でより一貫した各マウス内の病変の総数を呼び出したことを見出した。これらは、リードエラーを適切に取り扱うことなく、呼び出された腫瘍の数がシーケンシングリード深度と正に相関し得るため、考慮すべき重要なことであった。最後に、10,000倍大きかった病変から1ヌクレオチドだけ偏位したDNA配列を有するあらゆる腫瘍を排除した。これは腫瘍呼び出しの1.56%のみに影響を及ぼした。

リードパイルアップを正規化対照に対して正規化しておよその腫瘍の大きさを得る。 リードパイルアップを生成し、上述の補正を行った後、各呼び出した腫瘍からのリード数を、バルク腫瘍保有組織ライセートからDNAを抽出する前に各試料にスパイクされた正規化対照からのリード数に対して正規化した。これは、各腫瘍の呼び出し数の妥当な推定を得ることを可能にし、同じ遺伝子型及び処置のマウスからのデータを統合することを可能にした。しかしながら、各腫瘍内の細胞の絶対数を正確に定量化する発明者らの能力に影響を与えるいくつかの要因が存在する。

最初に考慮するべきことは、個々の腫瘍内のKrasHDR対立遺伝子の一部がIllumina(登録商標)シーケンシングのためのPCRプライマー内のKrasイントロン2に挿入または欠失を保有したということである。異なる大きさのアンプリコンの存在がPCRの偏りを生成した可能性があるが、長い伸張時間(約3分間)を使用し、また高速(20〜30秒/kb)、高忠実度ポリメラーゼ(Q5(登録商標);NEB)を使用して、1回目のIlluminaライブラリPCRにおいて4〜6サイクルのみを行うことにより、これを低減する試みを行った。2回目の増幅における最終Illumina(登録商標)ライブラリPCR産物は、全ての使用にわたって短くかつ均一であったため、PCR増幅はこのステップにおいて偏っていないはずである。

さらに、Kras変異型及びバーコードが内因性Kras遺伝子座にノックインされることを考慮すると、いくつかの腫瘍において、この領域はゲノム的に増幅されることが可能である(これは、肺癌のマウスモデルにおいて発生させたKrasG12D駆動肺腫瘍において記述されている)。Kras増幅は典型的には、非常に高いKrasコピー数をもたらすが、発明者らのリード計数から細胞数への変換は、各細胞がバーコード化されたKrasHDR対立遺伝子の単一コピーを含有すると仮定されるため、あらゆる増幅は、増幅したKrasHDR対立遺伝子を有する腫瘍内の細胞数についてわずかな過大評価をもたらす。

最後に、正規化対照自体は、Krasイントロン2に既知の重複を有する腫瘍からの細胞から生成され、これは、重複を有しない腫瘍よりも1回目のIlluminaライブラリ調製物において、より大きいPCR産物をもたらす。したがって、正規化対照のKras対立遺伝子から離れるあらゆるPCRの偏りは、重複を有しない腫瘍の大きさの系統的な過少評価をもたらす。

バーコード重複率の推定及び腫瘍の大きさの分布の補正 発明者らのパイプラインと組み合わせたIllumina(登録商標)Hi−Seq Rapid Runの2レーン上の35個の試料からの腫瘍バーコードのシーケンシングは、5桁超を網羅するリード計数で固有のバーコードの検出を可能にする。したがって、このアプローチの前例がない分解能は、大きい病変ならびにバルク組織内の小さい過形成の検出を可能にする。しかしながら、バルク組織内の多数の病変を検出する能力は、バーコード衝突、つまり、同じマウスにおいて同じDNAバーコードを有する2つ以上の病変の発生の確率を増加させる。バーコード衝突は、2つの小さい「衝突」腫瘍が単一のより大きい腫瘍として同定されるため、観察された腫瘍の大きさを誇張し得る。したがって、発明者らは、この問題が中程度であり、呼び出された腫瘍の推定された大きさを明白に偏らせないことを確実にするために、バーコード衝突の統計モデルを開発した。

発明者らのバーコード衝突モデルは、発明者らの研究の各Kras変異型の24,576個の可能なバーコードiの各々を観察するという尤度piを説明する。発明者らのプールにおけるバーコード頻度間の再現性がある変動の大部分は、各ゆらぎ塩基でのヌクレオチド頻度における統計的に独立した変動に由来する(すなわち、各バーコードは、バーコード断片の合成中のヌクレオチド濃度にわずかな変動があるため、等しくプールに存在しない可能性がある)(図23G)。したがって、バーコード内の各塩基bでの各ヌクレオチドnの独立した頻度fb,nを推定し、この表を使用して、以下のように、各バーコードの配列Bi,b,nに基づいたバーコード尤度を予測する(ここで、バーコードiが位置bでヌクレオチドnを有する場合、Bは1であり、そうでなければ0である)。

ここで、マトリックス表記を使用して、点乗積を示す。このモデルは、21個の自由パラメータのみを用いて全てのバーコードの頻度を予測する。バーコードのある残存過剰表示が肺試料に存続したため、ヌクレオチド頻度について補正した後、全ての肺分析から最も頻繁に観察されたバーコード10%を単純に廃棄した。これらの最も頻繁に観察されたバーコードは、ウイルス産生の前に、発明者らのAAV−KrasHDR/sgKras/CreプラスミドプールのIllumina(登録商標)シーケンシング(MiSeq)によって、発明者らのマウス実験とは関係なく同定された。この処理後、次いで、Σi piを1に再正規化した。

次いで、各マウス内の各バーコードの発生が多項サンプリングプロセスであると仮定した。そうすると、各マウス内の各観察されたバーコードの衝突Ciの平均数は以下である。

ここで、μiは各マウス内のバーコードの平均数を示し、一方、Nは腫瘍の総数を示す(両方とも不明である)。Nは、下記の方程式及びBrent法を使用して、各マウスの観察された腫瘍数N(obs)から決定された。

このモデルは、バーコード衝突が発明者らのマウス試料において一般的に稀であった(平均4.04%)ことを見出した。しかしながら、衝突の尤度はマウス及びKras変異型により変動し得る。例えば、WT KrasHDR対立遺伝子の衝突の平均予測数は5.8%であり、1匹のマウスでは12%に達する。WT Krasベクターは、初期のAAV−KrasHDR/sgKras/Creプラスミドプール)において各変異Krasベクターよりも意図的に約4倍多く表示されるため、WT KrasHDR対立遺伝子は、最高数の衝突となると予想された(図23F)。したがって、発明者らは、各病変の 大きさを1+Ciで分割して、バーコード衝突が腫瘍の大きさの分布に影響を及ぼす偏りを最小にした。衝突は稀な事象であるため、特定のマウス内の特定の衝突数は、実質的にCiとは異なり得る。この制限のため、この補正はバーコード衝突に起因する腫瘍の大きさの分布における系統的な偏りを最小にすると考えるが、生じた特定の衝突を効率的に同定することができない。

Illumina(登録商標)シーケンシングの質及び再現性の決定 Kras変異型が腫瘍形成を駆動する定量的に異なる能力を有するかを決定するために、100,000個を超える細胞を含有することが推定される腫瘍(すなわち、約5×105個の細胞に由来した各試料に添加された正規化対照DNAの「大きさ」の1/5)に重点を置くことを選択した。反復試料(独立した試料調製、シーケンシング、及び処理)からこの細胞数カットオフを上回る腫瘍の回帰分析は、高い相関を示した(全てのR2値は0.99を上回った。図36を参照されたい)。さらに、このカットオフを下回る腫瘍内の細胞の推定数は、バーコード衝突、ならびにPCR増幅及びシーケンシングにおけるばらつきにより偏る可能性が高く、それらの全てが各Kras変異型を保有する腫瘍の大きさ及び数を正確に呼び出す発明者らの能力を減少させる。

バルク腫瘍保有肺からのシーケンシングデータの分析 H11LSL−Cas9対立遺伝子(PT;H11LSL−Cas9、LT;H11LSL−Cas9、及びT;H11LSL−Cas9)を有する全てのマウス遺伝子型において100,00個の細胞を超える腫瘍を計数し、各変異型を、AAV−KrasHDR/sgKras/Creプラスミドプールにおけるその初期の表示で分けることにより、各KrasG変異型を保有する腫瘍の相対数を定量化した(この分析に関して、プラスミドプールにおける各変異型の初期表示は、バーコード存在量の98パーセンタイルを上回るバーコードを除去した後、各Kras変異型と関連するリードの総数から計算された。この制限は、はっきりとは結果を改変せず、非常に豊富な変異型−バーコード対が特定の変異型の全体的な表示に明白に影響を及ぼさなかったことを確実にするために単に適用された)。

次いで、WT Kras変異型が1の表示を有するように相対腫瘍数を調整した。100,000個の細胞を超える腫瘍から生じるように見えた比較的少数のWT KrasHDR対立遺伝子が存在した。これらは、HDR事象が非発がん性Kras WT遺伝子型を創出したが、それにもかかわらず、他の理由で腫瘍に進化したか、またはWT Kras変異型が同じ肺細胞において同時HDRにより発がん性Kras変異型と「ヒッチハイク」し、続いて、拡大駆動だが、発がん性変異型となった腫瘍を表し得る。

バルク組織から解剖した(及び上述したように分析された)個々の腫瘍からの少数の残存細胞は、通常、発明者らのバルク腫瘍シーケンシングデータにおいて検出可能であった。腫瘍の大きさの全ての分析において、これらの解剖された腫瘍は、それらの真の大きさを推測することができなかったため、除外された。しかしながら、各処置されたマウスの遺伝子型において100,000個を超える細胞の腫瘍数を分析したとき、解剖可能な腫瘍が常に任意のマウス内で観察された最大のものの中にあり、したがって、100,000個の細胞閾値を確実に超えるため、個々に解剖された腫瘍からのデータを含めた。

腫瘍数において統計的に有意な相違は、フィッシャーの正確検定を使用して決定された。各変異型に関して、2つの試験を行い、G12DまたはWT KrasHDR対立遺伝子の頻度のいずれかと比較した。全てのp値は、調査された変異型の数についてボンフェローニ補正され、両側であった。両側「多数細胞」ピアソンカイ二乗検定を使用して、T;H11LSL−Cas9マウスに対するPT;H11LSL−Cas9及びLT;H11LSL−Cas9マウスの全てのKras変異型にわたって腫瘍数の分布を比較した。

実施例3.インビボでの肺腺癌における腫瘍抑制の適応度ランドスケープ 単独でまたは組み合わせでがんにおいて見出される大半のゲノム改変の機能的な影響はほとんど不明のままである。本明細書に記載の実験とともに、腫瘍バーコード化の組み込み、CRISPR/Cas9媒介ゲノム編集、及びウルトラディープバーコードシーケンシングが、ヒト肺腺癌の自発性マウスモデルにおいて腫瘍抑制因子改変の対の組み合わせを調べるために示される。31個の一般的な肺腺癌遺伝子型の腫瘍抑制作用がマッピングされ、状況依存及び差次的作用強度の凸凹のランドスケープを明らかにした。

結果 がん成長は、主に、複数の協同性ゲノム改変の結果である。がんゲノムシーケンシングは、ヒトがん内の多数の改変をカタログ化してきたが、腫瘍成長に対するこれらの改変の組み合わせ作用はほとんど不明である。大半の推定上の駆動物質は10パーセント未満の腫瘍において改変され、これらの改変が、不活性である、弱く有益である、またはある特定のゲノム状況においてのみ有益である可能性があることを示唆する。可能な組み合わせの数が候補遺伝子数と要因的に対応するため、同時発生率単独により遺伝子相互作用を調べることは実際には不可能である。遺伝子操作されたマウスモデルは、自発性環境内の腫瘍成長における遺伝子機能の見識を提供することができるが、実際的な考慮は、組み合わせ腫瘍抑制遺伝子不活性化の広範な研究を妨げてきた(図41)。したがって、インビボでの腫瘍成長を駆動する遺伝子相互作用の発明者らの理解は限られたままである。

これらの実際的な問題に対処するために、ディープシーケンシングと組み合わせた腫瘍バーコード化(Tuba−seq)を使用して、並行して多くの異なる腫瘍抑制遺伝子改変の作用を定量的に測定するための方法が開発された(本明細書に記載される)。Tuba−seqは、肺腺癌の遺伝子操作されたマウスモデルを、腫瘍抑制因子不活性化(例えば、CRISPR/Cas9媒介)、腫瘍バーコード化、及びディープシーケンシングと組み合わせる。Tuba−seqは全ての腫瘍の大きさを測定し、個々のマウスの多重腫瘍遺伝子型に適合するため、前例がない精度、感度、及びスループットで成長作用を測定することができる。ここで、このアプローチは用いた。31個の一般的な腫瘍抑制遺伝子型を有する発がん性KrasG12D駆動肺腫瘍の成長を定量化する(図39)。予想外の遺伝子相互作用が同定され、大半の腫瘍抑制因子の作用は状況依存であることが見出され、ヒト肺腺癌における遺伝子改変のいくつかのパターンが説明された。

腫瘍抑制因子TP53は、ヒト肺腺癌の半分以上において不活性化される。他の10個の推定上の腫瘍抑制因子の成長抑制作用に対するp53欠失の作用を決定するために、多くの一般的な腫瘍抑制遺伝子を標的とするバーコード化されたLenti−sgRNA/Creベクターのプール、及び4つのバーコード化されたLenti−sgInert/Creベクター(Lenti−sgTS−Pool/Cre;図39、41、及び42)を使用して、KrasLSL−G12D;Rosa26LSL−tdTomato;H11LSL−Cas9(KT;Cas9)及びKT;p53flox/flox;Cas9(KPT;Cas9)マウスにおいて腫瘍を発生させた。バーコードは、各腫瘍及びそのsgRNAを固有に同定する2つの構成要素を含有した(sgID−BC;図42)。各遺伝子型の各腫瘍における新生細胞の数は、肺が広範な過形成、腺腫、及びある程度の初期の腺癌を含有した腫瘍発生の15週間後に決定した。sgID−BC領域をバルク腫瘍保有肺ゲノムDNAから増幅し、産物をディープシーケンシングし、Tuba−seq分析パイプライン(本明細書に記載される)を適用した。

KT;Cas9及びKPT;Cas9マウスのTuba−seq分析は、発明者らの調査の遺伝子の多くについての腫瘍抑制作用の改変されたスペクトルを明らかにした(図39及び43)。腫瘍の大きさは、前に入念に調べた2つの測定:対数正規(LN)平均及 び95パーセンタイル腫瘍の大きさにより要約された(図39)。p53欠損腫瘍において、Rb1、Setd2、Lkb1/Stk11、Cdkn2a、またはApc stillの不活性化は、尚も成長利点を提供し、一方、Smad4、Arid1a、及びAtmは、p53の不在下でのみ腫瘍抑制因子として現れた(図39及び43)。この背景でのさらなる腫瘍抑制因子の出現は、p53欠損が後の腫瘍進化を促進することを示唆する。より多くの変異を適応性にさせることにより、p53の喪失は、腫瘍進化の予測可能性を減少させ、治療抵抗性及び転移疾患の出現を含むさらなる腫瘍進化を容易にする可能性がある。

p53の同時欠失は、より多くの改変を適応性にさせるだけでなく、腫瘍抑制因子喪失の作用規模も大幅に変更した。KT;Cas9マウスにおいて、Rb1欠損は、Lkb1−またはSetd2欠損よりも腫瘍の大きさを増加させなかった(図39及び図44a;別途指定されない限り、P<0.0001ブートストラップ試験)。対照的に、p53欠損背景において、Rb1欠損は、Lkb1−またはSetd2欠損と比較可能な成長利点を付与し(P>0.05)、p53とRb1腫瘍抑制因子経路との間の強い互助作用と一致した(図39)。バルクKPT;Cas9肺DNAにおける各標的遺伝子座のCas9生成インデルの定量化は、比較可能な高いパーセンテージのインデルを有するLkb1、Setd2、及びRb1対立遺伝子を確認した(図39及び45)。最後に、肺がん成長に対するp53及びRb1の同時不活性化の作用は、従来のCre/LoxPに基づくマウスモデルを使用して確認された(図44)。

p53能力対p53欠損腫瘍におけるRb1不活性化の定量的に異なる成長利益は、駆動物質の適応度強度における変化がヒト肺腺癌においてその改変の頻度を改変するかを調査する機会を提示した。実際、RB1改変(SNV及びCNV)及びTP53改変の同時発生はヒト肺腺癌において富化された(P=0.03;Fig.図39及び図44)。とりわけ、これら2つの改変の同時発生において約5倍富化したにもかかわらず、この相互作用は、複数の仮説試験に関して補正された後の全ての可能な対の駆動物質相互作用の未処理調査において統計的に有意ではなく、したがって、同時発生パターンを超えた遺伝子相互作用を機能的に研究する必要性を図示する(10個の対の相互作用のボンフェローニ補正後、P=0.32)。

次に、KT;Lkb1flox/flox;Cas9(KLT;Cas9)マウスにおいて腫瘍をLenti−sgTS−Pool/Creで発生させることにより、Lkb1及び他の推定上の腫瘍抑制因子の組み合わせ喪失の作用が調査された(図40及び43)。Lkb1は、自発性モデルにおいて肺腫瘍成長を劇的に増加させ、ヒト肺腺癌において頻繁に不活性化されるため、調査された(図41)。興味深いことに、適応性腫瘍抑制因子喪失の数及び中央成長利益の両方が既に急速に成長するLkb1欠損腫瘍において減衰した(マウス背景間の統計力の変化に関係なく、P<0.05、方法)。再度、これは単一の改変が腫瘍の適応度ランドスケープ全体を変更することができることを示す。収穫逓減エピスタシスと称される適応度利益の全般的な減衰は、進化において一般的であり、腫瘍が最終的には適応度プラトーに達し得ることを示唆する。

Apc及びRb1の不活性化は、Lkb1欠損腫瘍に対して顕著な成長利点を提供する唯一の改変であった(図40)。Rb1欠損が腫瘍の大きさを増加させる能力は、同時Lkb1欠損を伴っても、細胞周期調節におけるRb1の完全な役割及び基本的に異なるLkb1喪失からの作用機序を強調する。Apc喪失も肺癌成長の主要な駆動物質であり、Apcは研究した3つ全ての背景において腫瘍抑制性であった。

驚くべきことに、Lkb1欠損腫瘍の成長に対するSetd2欠損の作用は、中程度であり、統計的に有意ではなかった(図40)。この重複は、Lkb1及びSetd2両方 の不活性化がKT;Cas9及びKPT;Cas9マウスにおいて成長を強く促進したため、そしてこれらの遺伝子が同じ経路で機能するというエビデンスがないため、際立った。したがって、Setd2不活性化の状況依存を試験し、KPT,KPT;Cas9、及びKLT;Cas9マウスにおいて腫瘍をLenti−sgNeo2/Cre及びLenti−sgSetd2/Creを用いて発生させることにより確認した。Setd2不活性化は、もしあれば、Lkb1欠損腫瘍に成長利点をほとんど付与することなく、Lkb1能力肺腫瘍成長を増強した(組織学的分析に関しては(KPT;Cas9/KLT;Cas9のsgSetd2)/(KPT;Cas9/KLT;Cas9のsgNeo2)のP<0.05、Tuba−seq分析に関してはP<0.0001、図40及び46)。この所見も、ヒト肺腺癌におけるLKB1/STK11及びSETD2の改変の相互排他性により十分に支持される(P<0.001、図40及び46)。

これらの研究の大半の遺伝子は、p53またはLkb1の存在下または不在下でのみ腫瘍成長を駆動する状況依存成長作用を示した(図40)。3つ全ての状況において利点を付与した腫瘍抑制因子改変(Rb1及びApc)でさえ、腫瘍抑制の状況依存規模を尚も示した。そのような広範の状況依存は、駆動物質相互作用が無視されるか、または限られた相関のみを考慮することを正当化するためには十分に稀であり、及び/もしくは弱いと推定されるかのいずれかである、駆動物質の包括的な調査により見逃される。それにもかかわらず、発明者らの適応度測定は、これらのデータの限られた統計的分解能にもかかわらず、ヒト肺癌において変異同時発生パターンと全体的に一致する(ピアスマンのR=0.50、P<0.05、図47)。さらに、肺癌は、それらの状況依存の程度において固有であるようには見えないが(図47)、ここでの知見は、他のがんの種類における状況依存の直接的な測定が保証されることを示唆する。

腫瘍進化のこの凹凸のランドスケープは、いくつかの意味合いがある。第1に、遺伝子機能を理解するために、調査の大半の遺伝子(11個中8個)は一部の状況においてのみ適応性であったため、複数の遺伝学的状況において推定上の駆動物質を調査することが重要であり得る(図40)。第2に、広い適応度プロファイリングが望ましい。ここでの検出力分析は、約500種の中強度相互作用がTuba−seqを使用して100匹のマウスコホートで調査することができたことを示唆する(図48)。より大きいゲノムスクリーニングは、より多くの推定上の駆動物質、他の発がん性事象との相互作用、同じ遺伝子を標的とする複数のsgRNA、または腫瘍抑制因子改変の3つ組を調査することができた。最後に、駆動物質改変は特定の遺伝学的状況にのみ有益であるため、この広範な状況依存は、大半の駆動物質改変が固定される頻度は低いことを示唆する。

本明細書に記載されるインビボでの組み合わせ腫瘍抑制因子喪失の適応度作用の研究は、従来の方法論ならびにヒト肺腺癌ゲノムデータにより検証された予想外の遺伝子相互作用を同定した。本明細書に記載されるバーコード化された、多重のゲノム編集アプローチは、これらの遺伝子相互作用の機能的結果(治療応答に対するそれらの影響、細胞シグナル伝達、及び/または転移進行を含む)を調べるために容易に利用することができた。

相互参照 本出願は、2017年4月3日出願の米国仮特許出願第62/481,067号の利益を主張するものであり、この出願は、参照によりその全体が本明細書に組み込まれる。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈