Spatial encoding biological assays

申请号 JP2013503861 申请日 2011-04-05 公开(公告)号 JP2013523151A 公开(公告)日 2013-06-17
申请人 プログノシス バイオサイエンシズ インコーポレイテッドPrognosys Biosciences,Inc.; 发明人 エス. チー、マーク;
摘要 本発明は、空間コード化 生物 学的アッセイで使用するためのアッセイおよびアッセイ系を提供する。 本発明は、試薬が規定の空間パターンで生物学的サンプルに提供される高レベルの多重化が可能なアッセイと、空間パターンに従って試薬の制御送達が可能な機器と、本質的にデジタル読取情報を提供するデコード化スキームとを含むアッセイ系を提供する。
权利要求
  • サンプル中の複数の部位において、複数の生物学的標的の存在量もしくは活性またはその両方の空間パターンを決定するアッセイ系であって、以下の工程、すなわち、
    担体に固定されたサンプルを提供する工程と、
    前記複数の生物学的標的に対するコード化プローブを既知の空間パターンで前記サンプル中の前記複数の部位に送達する工程であって、各コード化プローブは、前記生物学的標的と相互作用しうるプローブ領域と、前記コード化プローブが送達された部位の位置を特定するコードタグとを含む送達工程と、
    前記コード化プローブを前記生物学的標的と相互作用させる工程と、
    前記生物学的標的と相互作用するコード化プローブを前記生物学的標的と相互作用しないコード化プローブから分離する分離工程と、
    前記コード化プローブの配列の全部または一部を決定する決定工程と、
    前記複数の生物学的標的の存在量もしくは活性またはその両方をサンプル中の部位の位置に関連付ける関連付け工程と、
    を行う、アッセイ系。
  • 前記生物学的標的が核酸であり、かつ前記コード化プローブがオリゴヌクレオチドである、
    請求項1に記載のアッセイ系。
  • 前記複数の核酸の標的のそれぞれに対して2つのコード化プローブが存在する、
    請求項2に記載のアッセイ系。
  • 前記複数の生物学的標的がタンパク質であり、前記コード化プローブの前記プローブ領域がタンパク質であり、かつ前記コードタグがオリゴヌクレオチドを含む、
    請求項1に記載のアッセイ系。
  • 前記複数の生物学的標的が酵素を含む、
    請求項4に記載のアッセイ系。
  • 前記コード化プローブの前記プローブ領域が抗体を含む、
    請求項1に記載のアッセイ系。
  • 前記コード化プローブのプローブ領域がアプタマーである、
    請求項1に記載のアッセイ系。
  • 前記コード化プローブのプローブ領域が小分子である、
    請求項1に記載のアッセイ系。
  • 前記分離工程と前記決定工程との間に増幅を行う工程をさらに含む、
    請求項1に記載のアッセイ系。
  • 前記決定工程が核酸シークエンシングにより行われる、
    請求項1に記載のアッセイ系。
  • 前記シークエンシングがハイスループットデジタル核酸シークエンシングである、
    請求項10に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記多数の部位の数との積が20超である、
    請求項1に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が50超である、
    請求項12に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が75超である、
    請求項13に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が100超である、
    請求項14に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が1,000超である、
    請求項15に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が10,000超である、
    請求項16に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が100,000超である、
    請求項17に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が1,000,000超である、
    請求項18に記載のアッセイ系。
  • 少なくとも10万個のコード化プローブの配列が並列方式で決定される、
    請求項11に記載のアッセイ系。
  • 少なくとも50万個のコード化プローブの配列が並列方式で決定される、
    請求項20に記載のアッセイ系。
  • 少なくとも100万個のコード化プローブの配列が並列方式で決定される、
    請求項21に記載のアッセイ系。
  • 前記既知の空間パターンが前記サンプルの組織学的特徴により決定される、
    請求項1に記載のアッセイ系。
  • ソフトウェアのプログラムされたハードウェアが、前記送達工程、前記分離工程、前記決定工程、および前記関連付け工程のうちの少なくとも2つの工程を行う、
    請求項1に記載のアッセイ系。
  • 前記コード化プローブのプローブ領域がタンパク質であり、かつ前記分離工程が、前記生物学的標的と相互作用するコード化プローブを親和性捕獲剤により捕獲することにより達成される、
    請求項1に記載のアッセイ系。
  • 前記コード化プローブの前記プローブ領域が核酸であり、かつ前記分離工程が前記サンプルの洗浄により達成される、
    請求項1に記載のアッセイ系。
  • サンプル中の複数の部位において、複数の核酸標的の存在量もしくは活性またはその両方の空間パターンを決定するアッセイ系であって、以下の工程、すなわち、
    担体に固定されたサンプルを提供する工程と、
    前記複数の核酸標的に対するオリゴヌクレオチドプローブを既知の空間パターンで前記サンプル中の前記複数の部位に送達する工程と、
    前記オリゴヌクレオチドプローブを前記核酸標的にハイブリダイズさせる工程と、
    ハイブリダイズされていないコード化オリゴヌクレオチドプローブを前記サンプルから洗浄除去する工程と、
    1つ以上のコード化剤を既知の空間パターンに従って前記サンプル中の前記複数の部位の位置に送達する工程であって、各部位に送達されるコード化剤の組合せが異なる工程と、
    前記コード化剤と前記オリゴヌクレオチドプローブとを結合させてコード化プローブを形成する結合工程と、
    前記コード化プローブの配列の全部または一部をハイスループットシークエンシングにより決定する決定工程と、
    前記複数の生物学的標的の存在量もしくは活性またはその両方を前記サンプル中の複数の部位の位置に関連付ける関連付け工程と、
    を行う、アッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が20超である、
    請求項27に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が50超である、
    請求項28に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が75超である、
    請求項29に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が10,000超である、
    請求項30に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が100,000超である、
    請求項31に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が1,000,000超である、
    請求項32に記載のアッセイ系。
  • 少なくとも10万個のコード化プローブの配列が並列方式で決定される、
    請求項33に記載のアッセイ系。
  • 少なくとも100万個のコード化プローブの配列が並列方式で決定される、
    請求項34に記載のアッセイ系。
  • 前記複数の核酸標的のそれぞれに対して2つのオリゴヌクレオチドプローブが送達される、
    請求項27に記載のアッセイ系。
  • 前記結合工程がライゲーションにより行われる、
    請求項27に記載のアッセイ系。
  • 前記結合工程が伸長およびそれに続くライゲーションにより行われる、
    請求項27に記載のアッセイ系。
  • 前記結合工程と前記決定工程との間に増幅を行う工程をさらに含む、
    請求項27に記載のアッセイ系。
  • サンプル中の複数の部位において、複数のタンパク質標的の存在量もしくは活性またはその両方の空間パターンを決定するアッセイ系であって、以下の工程、すなわち、
    担体に固定されたサンプルを提供する工程と、
    前記複数のタンパク質標的に対するコード化プローブを既知の空間パターンで前記サンプル中の前記複数の部位に送達する工程であって、各コード化プローブは、タンパク質プローブ領域とコードタグとを含み、前記タンパク質領域は前記タンパク質標的と相互作用しうるものであり、前記コードタグは、前記コード化プローブが送達された部位の位置を特定するとともに、該コードタグがその一部をなす前記コード化プローブの前記タンパク質プローブ領域を特定するものである工程と、
    前記コード化プローブを前記タンパク質標的と相互作用させる工程と、
    前記タンパク質標的と相互作用するコード化プローブを前記タンパク質標的と相互作用しないコード化プローブから分離する分離工程と、
    前記コード化プローブの配列の全部または一部をハイスループットシークエンシングにより決定する決定工程と、
    前記複数のタンパク質標的の存在量もしくは活性またはその両方を前記サンプル中の前記複数の部位の位置に関連付ける関連付け工程と、
    を行う、アッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が20超である、
    請求項40に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が50超である、
    請求項41に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が75超である、
    請求項42に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が100超である、
    請求項43に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が500超である、
    請求項44に記載のアッセイ系。
  • アッセイされる前記複数の生物学的標的の数と前記サンプル中の前記複数の部位の数との積が1000超である、
    請求項45に記載のアッセイ系。
  • 少なくとも1万個のコード化プローブの配列が並列方式で決定される、
    請求項46に記載のアッセイ系。
  • 少なくとも10万個のコード化プローブの配列が並列方式で決定される、
    請求項40に記載のアッセイ系。
  • 少なくとも100万個のコード化プローブの配列が並列方式で決定される、
    請求項48に記載のアッセイ系。
  • 前記結合工程と前記決定工程との間に増幅を行う工程をさらに含む、
    請求項40に記載のアッセイ系。
  • 前記タンパク質標的が酵素であり、かつ前記コード化プローブのプローブ領域が、前記酵素に対する基質、推定基質、またはその両方である、
    請求項40に記載のアッセイ系。
  • 前記コード化プローブのプローブ領域が親和性捕獲剤である、
    請求項40に記載のアッセイ系。
  • 前記コード化プローブのプローブ領域が抗体である、
    請求項52に記載のアッセイ系。
  • 前記コード化プローブのプローブ領域がアプタマーである、
    請求項52に記載のアッセイ系。
  • 前記タンパク質標的と相互作用するコード化プローブを前記タンパク質標的と相互作用しないコード化プローブから分離することは、前記タンパク質標的と相互作用するコード化プローブと、前記タンパク質標的と相互作用しないコード化プローブとを識別する親和性捕獲剤により達成される、
    請求項40に記載のアッセイ系。
  • 前記コードタグがオリゴヌクレオチドである、
    請求項36に記載のアッセイ系。
  • サンプル中の複数の部位において、複数の生物学的標的の存在量もしくは活性またはその両方の空間パターンを決定するアッセイ系であって、以下の工程、すなわち、
    担体に固定されたサンプルを提供する工程と、
    前記複数の生物学的標的に対するコード化プローブを既知の空間パターンで前記サンプル中の前記複数の部位に送達する工程であって、各コード化プローブは、前記生物学的標的と相互作用しうるプローブ領域と、前記コード化プローブが送達された部位の位置の特定および前記生物学的標的の特定を行うコードタグとを含む工程と、
    コード化プローブを生物学的標的と相互作用させる工程と、
    コード化プローブの配列の全部または一部を決定する工程と、
    複数の生物学的標的の存在量もしくは活性またはその両方をサンプル中の部位の位置に関連付ける工程と、
    を行う、アッセイ系。
  • 说明书全文

    本発明は、生物学的分子のアッセイ、より特定的には、固体サンプル中の多数の生物学的分子の空間分布を同時に決定するためのアッセイに関する。

    以下の解説では、背景および緒言として論文および方法について記述する。 ここに含まれるものは、なんら先行技術を「容認」するものとみなされるものではない。 しかるべき場合には、出願人は、ここで参照される論文および方法が適用可能な法的規定のもとで先行技術を構成しないものであることを実証する権利を明示的に留保する。

    網羅的な遺伝子発現解析およびタンパク質解析は、生物学の機序を理解するうえで有用なツールになってきた。 これらのツールの使用により、発生や、癌および自己免疫疾患などの種々の疾患に関与する遺伝子およびタンパク質の同定が可能になってきた。 さまざまな転写物についてのインサイチュ(in situ)ハイブリダイゼーションや他の多重検出などの従来の方法は、遺伝子発現の空間パターンを明らかにし、発生および疾患の分子基盤の解明に役立ってきた。 1サンプルあたりのRNA配列が多い場合の定量分析を可能にしてきた他の技術としては、マイクロアレイ(非特許文献1および非特許文献2参照)、SAGE(serial analysis of gene expression)(非特許文献3参照)、qPCRのハイスループット実行(非特許文献4参照)、およびin situ PCR(非特許文献5参照)が挙げられる。 これらの方法は有用であるが、サンプル中の多くの空間位置で多くの遺伝子の発現、または多様なタンパク質の存在および/もしくは活性の同時測定を行えるようにするうえではそれほど有用でない。 レーザーキャプチャーマイクロダイセクションでは、少数の位置で多くの遺伝子の解析を行うことが可能であるが、それは、非常に高価であり、労がかかり、しかも倍率調整が十分ではない。 2D方式のある種のPCRアッセイは、空間情報を保持するが(非特許文献6参照)、これらの方法は、ウェル中への組織の物理的移動に基づくので空間分解能が低く、また、このため、組織サンプルへのランダムアクセスおよび高レベルの多重化が妨害される。

    シー(Shi)ら,Nature Biotechnology,24(9):1151−61(2006) スローニム(Slonim)およびヤナイ(Yanai),Plos Computational Biology,5(10):e1000543(2009) ヴェルクレスク(Velculescu)ら,Science,270(5235):484−87(1995) スパージオン(Spurgeon)ら,Plos ONE,3(2):e1662(2008) ヌオーヴォ(Nuovo),Genome Res. ,4:151−67(1995) アルマーニ(Armani)ら,Lab on a Chip,9(24):3526−34(2009)

    現時点では、多数の遺伝子、タンパク質、または他の生物学的活性分子の空間的発現パターンを高分解能で同時に解析する実用的方法は存在しない。 したがって、組織内の生物学的分子の再現性のある高分解能空間マップの必要性が存在する。 本発明は、この必要性に対処する。

    ここでは、以下の詳細な説明でさらに説明される概念の一部を単純化した形で紹介する。 これは、クレームされた要旨の主要なまたは本質的な特徴を明記することを意図したものではなく、クレームされた要旨の範囲を限定すべく使用することを意図したものでもない。 クレームされた要旨の他の特徴、詳細、有用性、および利点は、添付の図面に例示されたおよび添付の特許請求の範囲に規定された態様を含む以下に記載の詳細な説明から明らかになる。

    本発明は、組織内の生物学的活性の高分解能空間マップを提供するアッセイ系を包含する。 アッセイ系は、コード化プローブが規定の空間パターンで生物学的サンプルに提供される高レベルの多重化が可能なアッセイと、空間パターンに従って試薬の制御送達が可能な機器と、本質的にデジタル読取情報を提供するデコード化(解読)スキームとを含む。 要するに、本発明は、シークエンシングの高度並列データ解析によりin situハイブリダイゼーションの分解能を提供し、多くの位置で多くの生物学的標的を調べる能力を提供する。

    したがって、いくつかの実施形態では、本発明は、サンプル中の複数の部位において、複数の生物学的標的の存在量もしくは活性またはその両方の空間パターンを決定するアッセイ系を提供する。 このアッセイ系は、以下の工程、すなわち、担体に固定されたサンプルを提供する工程と、複数の生物学的標的に対するコード化プローブを既知の空間パターンでサンプル中の複数の部位に送達する工程であって、各コード化プローブは、生物学的標的と相互作用しうるプローブ領域と、コード化プローブが送達された部位の位置を特定するコードタグとを含む送達工程と、コード化プローブを生物学的標的と相互作用させる工程と、生物学的標的と相互作用するコード化プローブを生物学的標的と相互作用しないコード化プローブから分離する分離工程と、コード化プローブの配列の全部または一部を決定する決定工程と、複数の生物学的標的の存在量もしくは活性またはその両方をサンプル中の部位の位置に関連付ける関連付け工程とを行う。

    本発明に係る特定の態様では、生物学的標的は核酸を含み、かつコード化プローブはオリゴヌクレオチドであり、いくつかの態様では、複数の核酸標的のそれぞれに対して2つのコード化プローブが存在する。 いくつかの態様では、複数の生物学的標的はタンパク質を含み、コード化プローブのプローブ領域はタンパク質であり、かつコードタグはオリゴヌクレオチドを含む。 いくつかの態様では、複数の生物学的標的は酵素を含む。 いくつかの態様では、コード化プローブのプローブ領域は、抗体、アプタマー、または小分子を含む。

    アッセイ系のいくつかの態様は、分離工程と決定工程との間に増幅を行う工程をさらに含む。 いくつかの態様では、決定工程は、核酸シークエンシングにより行われ、好ましい態様において、シークエンシングは、ハイスループットデジタル核酸シークエンシングである。

    本発明のいくつかの態様では、アッセイされる複数の生物学的標的数とサンプル中の複数の部位数との積は20超であり、いくつかの態様では、アッセイされる複数の生物学的標的数とサンプル中の複数の部位数との積は50超であり、いくつかの態様では、アッセイされる複数の生物学的標的数とサンプル中の複数の部位数との積は、75超、100超、150超、500超、750超、1,000超、5,000超、10,000超、25,000超、50,000超、100,000超、500,000超、もしくは1,000,000超、またはそれ以上である。 他の態様では、少なくとも5万個のコード化プローブの配列が並列方式で決定され、他の態様では、少なくとも10万個のコード化プローブ配列が並列方式で決定され、いくつかの態様では、少なくとも50万個のコード化プローブの配列が並列方式で決定され、いくつかの態様では、少なくとも100万個、1000万個、1億個、10億個、100億個、1000億個、またはそれ以上のコード化プローブの配列が並列方式で決定される。

    いくつかの態様では、既知の空間パターンは、サンプルの組織学的特徴により決定される。 また、いくつかの態様では、送達工程、分離工程、決定工程、および関連付け工程の少なくとも2つの工程は、ソフトウェアでプログラムされたハードウェアにより行われる。

    いくつかの態様では、コード化プローブのプローブ領域はタンパク質であり、かつ分離工程は、生物学的標的と相互作用するコード化プローブを親和性捕獲剤により捕獲することにより達成される。 いくつかの態様では、コード化プローブのプローブ領域は核酸であり、かつ分離工程は、サンプルの洗浄により達成される。

    他の実施形態では、サンプル中の複数の部位において、複数の核酸標的の存在量もしくは活性またはその両方の空間パターンを決定するアッセイ系を提供する。 このアッセイ系は、以下の工程、すなわち、担体に固定されたサンプルを提供する工程と、複数の核酸標的に対するオリゴヌクレオチドプローブを既知の空間パターンでサンプル中の複数の部位に送達する工程と、オリゴヌクレオチドプローブを核酸標的にハイブリダイズさせる工程と、ハイブリダイズされていないコード化オリゴヌクレオチドプローブをサンプルから洗浄除去する工程と、1つ以上のコード化剤を既知の空間パターンに従ってサンプル中の複数の部位の位置に送達する工程であって、各部位に送達されるコード化剤の組合せが異なる工程と、コード化剤とオリゴヌクレオチドプローブとを結合させてコード化プローブを形成する結合工程と、コード化プローブの配列の全部または一部をハイスループットシークエンシングにより決定する決定工程と、複数の生物学的標的の存在量もしくは活性またはその両方をサンプル中の複数の部位の位置に関連付ける関連付け工程とを行う。

    本発明の他の実施形態は、サンプル中の複数の部位において、複数のタンパク質標的の存在量もしくは活性またはその両方の空間パターンを決定するアッセイ系を提供する。 このアッセイ系は、以下の工程、すなわち、担体に固定されたサンプルを提供する工程と、複数のタンパク質標的に対するコード化プローブを既知の空間パターンでサンプル中の複数の部位に送達する工程であって、各コード化プローブは、タンパク質プローブ領域とコードタグとを含み、前記タンパク質領域は前記タンパク質標的と相互作用しうるものであり、コードタグは、コード化プローブが送達された部位の位置を特定するとともに、該コードタグがその一部をなすコード化プローブのタンパク質プローブ領域を特定するものである工程と、コード化プローブをタンパク質標的と相互作用させる工程と、タンパク質標的と相互作用するコード化プローブをタンパク質標的と相互作用しないコード化プローブから分離する工程と、コード化プローブの配列の全部または一部をハイスループットシークエンシングにより決定する工程と、複数のタンパク質標的の存在量もしくは活性またはその両方をサンプル中の複数の部位の位置に関連付ける工程とを行う。

    他の実施形態は、サンプル中の複数の部位において、複数の生物学的標的の存在量もしくは活性またはその両方の空間パターンを決定するアッセイ系を提供する。 このアッセイ系は、以下の工程、すなわち、担体に固定されたサンプルを提供する工程と、複数の生物学的標的に対するコード化プローブを既知の空間パターンでサンプル中の複数の部位に送達する工程であって、各コード化プローブは、生物学的標的と相互作用しうるプローブ領域と、コード化プローブが送達された部位の位置の特定および生物学的標的の特定を行うコードタグとを含む工程と、コード化プローブを生物学的標的と相互作用させる工程と、コード化プローブの配列の全部または一部を決定する工程と、複数の生物学的標的の存在量もしくは活性またはその両方をサンプル中の部位の位置に関連付ける工程とを行う。

    本発明に係るアッセイ系は、検出対象の分子とそのような検出系に必要とされる試薬とに基づいて、種々の検出機構を利用可能である。 本発明に係るアッセイ系で使用可能な例示的な方法は、以下でより詳細に説明される。

    本発明に係るアッセイ系の概略図。

    核酸を検出するための本発明に係るアッセイ系の一実施形態の概略図。

    図2で概観されるアッセイの一実施形態を示す図。

    本発明に係るアッセイ系のコンビナトリアルコード化スキームの一実施形態に対する一般的機構を例示する図。

    図4に示されるコンビナトリアルコード化スキームの実施形態の簡略具体例を示す図。

    定義 本明細書で用いられる用語は、当業者により理解される明白な通常の意味を有するものとする。 以下の定義は、読者が本発明を理解するのに役立てることを意図したものであり、とくに指定がないかぎり、そのような用語の意味を変更したり、さもなければ限定したりすることを意図したものではない。

    本明細書で用いられる「抗体」という用語は、抗原への特異的結合が可能な全体の免疫グロブリンもしくは抗体、または免疫グロブリン分子の任意の機能性フラグメントを意味するものである(抗体および抗原は、本明細書に定義される「結合パートナー」である)。 本明細書で用いられる「抗体」は、全体の抗体はもとより、対象の抗原または抗原フラグメントに結合可能な任意の抗体フラグメントを含むものとする。 そのようなペプチドの例としては、完全抗体分子や、抗体フラグメント、たとえば、Fab、F(ab')2、CDRS、VL、VH、および抗原に特異的に結合可能な抗体の任意の他の部分などが挙げられる。 本発明に係るアッセイ用の抗体は、検出されるタンパク質(すなわち、生物学的標的)または本発明に係るアッセイで検出に使用されるタンパク質(すなわち、プローブ)に対して免疫反応性または免疫特異性があり、したがって、それらに特異的かつ選択的に結合する。

    本明細書で用いられる「結合剤」という用語は、対象の生物学的分子に特異的に結合する任意の作用剤を意味する。
    「相補的」または「実質的に相補的」とは、ヌクレオチド間または核酸間におけるハイブリダイゼーション、塩基対形成、または二重鎖形成を意味する。 ヌクレオチド間または核酸間としては、たとえば、二本鎖DNA分子の2つの鎖間、またはオリゴヌクレオチドプライマーと一本鎖核酸上のプライマー結合部位との間などがある。 相補的ヌクレオチドは、一般的には、AとT(もしくはAとU)、またはCとGである。 2つの一本鎖のRNA分子またはDNA分子は、一方の鎖のヌクレオチドが、最適なアライメントおよび比較ならびに適切なヌクレオチド挿入または欠失を行って、他方の鎖の少なくとも約80%、通常は少なくとも約90%〜約95%、さらには約98%〜約100%と対合する場合、実質的に相補的であると言われる。

    「ハイブリダイゼーション」とは、2つの一本鎖ポリヌクレオチドが非共有結合で安定な二本鎖ポリヌクレオチドを形成する過程を意味する。 得られる(通常は)二本鎖のポリヌクレオチドは、「ハイブリッド」または「二重鎖」である。 「ハイブリダイゼーション条件」は、典型的には約1M未満、多くの場合約500mM未満の塩濃度を含み、約200mM未満のこともある。 「ハイブリダイゼーション緩衝液」は、5%SSPEなどの緩衝化塩溶液または当技術分野で公知の他のそのような緩衝液である。 ハイブリダイゼーション温度は、5℃程度に低くすることが可能であるが、典型的には22℃超、より典型的には約30℃超であり、典型的には37℃を超える。 ハイブリダイゼーションは、多くの場合、ストリンジェント条件下で、すなわち、プライマーがその標的部分配列にはハイブリダイズするが他の非相補的配列にはハイブリダイズしない条件下で、行われる。 ストリンジェント条件は、配列依存性であり、異なる環境では異なる。 たとえば、より長いフラグメントは、特異的ハイブリダイゼーションを行うには短いフラグメントよりも高いハイブリダイゼーション温度を必要としうる。 相補鎖の塩基組成および長さ、有機溶媒の存在、ならびに塩基ミスマッチの程度をはじめとする他の因子がハイブリダイゼーションのストリンジェンシーに影響する可能性があるので、パラメーターの組合せは、いずれか1つのパラメーターのみの絶対的測定よりも重要である。 一般的には、ストリンジェント条件は、規定のイオン強度およびpHで特定の配列のT よりも約5℃低くなるように選択される。 例示的なストリンジェント条件は、約7.0〜約8.3のpHおよび少なくとも25℃の温度で少なくとも0.01Mから多くとも1Mを超えないナトリウムイオン濃度の塩濃度(または他の塩)を含む。 たとえば、5xSSPE(750mM NaCl、50mMリン酸ナトリウム、5mM EDTA、pH7.4)および約30℃の温度の条件は、対立遺伝子特異的ハイブリダイゼーションに好適であるが、好適な温度は、ハイブリダイズされる領域の長さおよび/またはGC含有率に依存する。

    「ライゲーション」とは、2つ以上の核酸(たとえば、オリゴヌクレオチドおよび/またはポリヌクレオチド)の末端間の共有結合または共有連結を鋳型駆動反応で形成することを意味する。 結合または連結の性質は、さまざまでありうる。 また、ライゲーションは、酵素的または化学的に行いうる。 本明細書で用いられる場合、ライゲーションは、通常、一方のオリゴヌクレオチドの5'炭素末端ヌクレオチドと他方のヌクレオチドの3'炭素との間にホスホジエステル連結を形成するように酵素的に行われる。

    本明細書で用いられる「核酸」、「オリゴヌクレオチド」、「オリゴ」、または文法的等価表現は、一般的には、共有連結で一体化された少なくとも2つのヌクレオチドを意味する。 核酸は、一般的には、ホスホジエステル結合を含有するが、いくつかの場合には、ホスホルアミダイト連結、ホスホロジチオエート連結、もしくはメチルホホロアミダイト(methylphophoroamidite)連結、またはペプチド核酸主鎖および連結などの他の選択肢の主鎖を有する核酸類似体が含まれていてもよい。 他の類似体核酸としては、ロックド核酸、陽性主鎖、非イオン性主鎖、および非リボース主鎖を含む二環式構造を有するものが挙げられる。 分子の安定性を増大させるためにリボースリン酸主鎖の修飾を行ってもよく、たとえば、PNA:DNAハイブリッドは、いくつかの環境でより高い安定性を呈しうる。

    「プライマー」とは、ポリヌクレオチド鋳型との二重鎖の形成時、核酸合成の開始点として作用し、伸長二重鎖が形成されるように鋳型に沿ってその3'末端から伸長されうる天然または合成のオリゴヌクレオチドを意味する。 伸長過程時に追加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列により決定される。 プライマーは、通常、DNAポリメラーゼにより伸長される。

    「SNP」または「単一ヌクレオチド多型」という用語は、個体間の遺伝的変異を意味し、たとえば、生物のDNA中の単一の窒素塩基位置が変異しうるものであり、SNPは、ゲノム全体にわたり見いだされ、個体間の遺伝的変異の多くは、SNP遺伝子座での変異に起因し、多くの場合、この遺伝的変異は、個体間の表現型変異をもたらす。 本発明で使用するためのSNPおよびそのそれぞれの対立遺伝子は、公共のデータベース(U.C.サンタクルーズ・ヒトゲノム・ブラウザ・ゲートウェイ(U.C.Santa Cruz Human Genome Browser Gateway)(http://genome.ucsc.edu/cgi−bin/hgGateway)またはNCBI
    dbSNPウェブサイト(http://www.ncbi.nlm.nih.gov/SNP/)などの多くの情報源に由来しうるか、または米国特許第6,969,589号明細書および「ヒトゲノム多型」という名称の米国特許出願公開第2006/0188875号明細書に記載されるように実験的に決定しうる。 SNPの使用は、本明細書に提示された実施形態のいくつかで説明されているが、他の両対立遺伝子マーカーまたは複対立遺伝子マーカーも使用しうることは理解されよう。 両対立遺伝子マーカーは、2つの多型体または対立遺伝子を有するマーカーである。 上述したように、形質に関連する両対立遺伝子マーカーでは、対照群と比較して症例群の遺伝的組成物中に豊富に存在する対立遺伝子は、「関連対立遺伝子」と称され、他の対立遺伝子は「非関連対立遺伝子」と呼ばれうる。 したがって、所与の形質(たとえば、疾患または薬剤応答)に関連する両対立遺伝子多型では、対応する関連対立遺伝子が存在する。 本明細書に提示された方法で使用しうる他の両対立遺伝子多型としては、多重ヌクレオチド変化、挿入、欠失、および転座が挙げられるが、これらに限定されるものではない。 さらに、本明細書でのDNAへの言及は、ゲノムDNA、ミトコンドリアDNA、エピソームDNA、および/またはDNAの誘導体、たとえば、アンプリコン、RNA転写物、cDNA、DNA類似体などを包含しうることも理解される。 関連解析(association study)でスクリーニングされる多型遺伝子座は、二倍体または一倍体の状態で存在可能であり、理論上、ゲノム全体にわたる部位に由来する。

    本明細書で用いられる「選択的に結合する」、「選択的結合」などという用語は、結合パートナー(たとえば、タンパク質、核酸、抗体、または他の親和性捕獲剤など)を指す場合、指定のアッセイ条件下で選択的ハイブリダイゼーションを保証する高い親和性および/または相補性を有する2つ以上の結合パートナーの結合反応を意味する。 典型的には、特異的結合は、バックグラウンドシグナルの標準偏差の少なくとも3倍である。 したがって、指定の条件下で、結合パートナーは、その特定の「標的」分子には結合し、サンプル中に存在する他の分子には有意量で結合しない。

    「シークエンシング」、「配列決定」などは、核酸のヌクレオチド塩基配列に関する情報を決定することを意味する。 そのような情報は、核酸の部分配列情報さらには全配列情報の同定または決定を含みうる。 配列情報は、さまざまな程度の統計的な信頼性または信頼度を用いて決定されうる。 一態様では、この用語は、核酸中の複数のコンティグ(contiguous)ヌクレオチドの同一性および順序の決定を含む。 「ハイスループットデジタルシークエンシング」または「次世代シークエンシング」とは、本質的に並列方式で核酸配列の多く(典型的には、数千〜数十億)を決定する方法を用いた配列決定を意味し、この場合、1度に1つではなくバルクプロセスで配列決定すべくDNA鋳型を作製し、好ましくは並列方式で、または他の選択肢としてそれ自体並列方式化しうるウルトラハイスループット連続プロセスを用いて、多くの配列を読み取る。 そのような方法としては、パイロシークエンシング(たとえば、454ライフサイエンス社(Life Sciences,Inc.),ブランフォード,コネチカット州(Branford,CT)により製品化されているもの)、ライゲーションによるシークエンシング(たとえば、SOLiD(商標)技術であって、ライフテクノロジー社(Life Technology,Inc.),カールスバッド,カリフォルニア州(Carlsbad,CA)により製品化されているもの)、修飾ヌクレオチドを用いた合成によるシークエンシング(たとえば、TruSeq(商標)およびHiSeq(商標)技術であって、イルミナ社(Ill
    umina,Inc. ),サンディエゴ,カリフォルニア州(San Diego,CA)により製品化されているもの、HeliScope(商標)であって、ヘリコスバイオサイエンス社(Helicos Biosciences Corporation),ケンブリッジ,マサチューセッツ州(Cambridge,MA)により製品化されているもの、およびPacBio RSであって、パシフィックバイオサイエンス・カリフォルニア社(Pacific Biosciences of California,Inc.),メンロパーク,カリフォルニア州(Menlo Park,CA)により製品化されているもの)、イオン検出技術によるシークエンシング(イオントレント社(Ion Torrent,Inc.),サウスサンフランシスコ,カリフォルニア州(South San Francisco,CA))、DNAナノボールのシークエンシング(コンプリートゲノミクス社(Complete Genomics,Inc.),マウンテンビュー,カリフォルニア州(Mountain View,CA))、ナノ細孔に基づくシークエンシング技術(たとえば、オックスフォードナノポアテクノロジーズ社(Oxford Nanopore Technologies,LTD),オックスフォード,英国(Oxford,UK))により開発されたもの)、および高度並列シークエンシング法などが挙げられるが、これらに限定されるものではない。

    「T 」という用語は、「融解温度」を参照する際に用いられる。 融解温度とは、二本鎖核酸分子の集団が半分に解離されて一本鎖になる温度のことである。 核酸のT を計算するためのいくつかの式は、当技術分野で周知である。 標準的参考文献により示されるように、T 値の単純な推定値は、核酸が1M NaClの性溶液中に存在する場合、式T =81.5+0.41(% G+C)により計算可能である(たとえば、アンダーソン(Anderson)およびヤング(Young),量的フィルターハイブリダイゼーション(Quantitative Filter Hybridization),核酸ハイブリダイゼーション(Nucleic Acid Hybridization)(1985)参照)。 他の参考文献(たとえば、アラウィ(Allawi)およびサンタルシア・ジュニア(SantaLucia,Jr.),バイオケミストリー(Biochemistry),36:10581−94(1997))は、構造、環境、さらには配列の特性をT の計算で考慮した代替計算法を含む。

    本明細書に記載の技術の実施では、とくに指定がないかぎり、有機化学、高分子技術、分子生物学(組換え技術を含む)、細胞生物学、生化学、およびシークエンシング技術の従来技術および説明を利用可能であり、これらは、当業者の技能の範囲内である。 そのような従来技術としては、ポリマーアレイ合成、ポリヌクレオチドのハイブリダイゼーションおよびライゲーション、ならびに標識を用いたハイブリダイゼーションの検出が挙げられる。 本明細書の実施例を参照することにより、好適な技術の具体例を得ることが可能である。 しかしながら、もちろん、他の等価な従来手順を使用することも可能である。 そのような従来技術および説明は、グリーン(Green)ら編,ゲノム解析(Genome
    Analysis):実験マニュアルシリーズ(Vol.I−IV)(1999);ワイナー(Weiner),ガブリエル(Gabriel),ステフェンス(Stephens)編,遺伝的変異(Genetic Variation):実験マニュアル(2007);ディーフェンバハ(Dieffenbach),ドベクスラー(Dveksler)編,PCRプライマー(PCR Primer):実験マニュアル(2003);ボウテル(Bowtell)およびサムブルック(Sambrook),DNAマイクロアレイ(DNA Microarrays):モレキュラークローニングマニュアル(2003);マウント(Mount),バイオインフォマティクス(Bioinformatics):シークエンスおよびゲノム解析(2004);サムブルック(Sambrook)およびラッセル(Russell),モレキュラー・クローニング プロトコル要約集(Condensed Protocols from Molecular Cloning):実験マニュアル(2006);サムブルック(Sambrook)およびラッセル(Russell),モレキュラー・クローニング:実験マニュアル(2002)(すべて、コールド・スプリング・ハーバー・ラボラトリー出版社(Cold Spring Harbor Laboratory Press)刊);ストライヤー(Stryer),生化学(Biochemistry)第4版(1995);W. H. フリーマン(W.H.Freeman),ニューヨーク,ニューヨーク州;ゲイト(Gait),「オリゴヌクレオチド合成(Oligonucleotide Synthesis)」:実用手法(2002),IFLプレス(IRL Press),ロンドン、ネルソン(Nelson);コックス(Cox),レーニンジャーの新生化学(2000)第3版,W. H. フリーマン出版社,ニューヨーク,ニューヨーク州;ならびにバーグ(Berg)ら,生化学(2002)第5版,W. H. フリーマン出版社,ニューヨーク,ニューヨーク州(それらはすべて、それらの全体があらゆる目的で参照により本明細書に組み入れられるものとする)などの標準的実験マニュアルに見いだしうる。

    本明細書および添付の特許請求の範囲で用いられる場合、単数表現の「1つの(a)」、「1つの(an)」、および「それの(the)」は、文脈上明らかに異なる場合を除いて、複数表現の参照語を包含することに留意されたい。 したがって、たとえば、「核酸(a nucleic acid)」への参照は、1つ以上の核酸を意味し、「アッセイ(the assay)」への参照は、当業者に公知の等価な工程および方法への参照を包含し、他も同様である。

    とくに定義されていないかぎり、本明細書で用いられる科学技術用語はすべて、本発明が属する技術分野の当業者により一般に理解されているものと同一の意味を有する。 本明細書に挙げられた出版物はすべて、本明細書に記載の本発明と組み合わせて使用可能な装置、製剤、および方法を説明および開示することを目的として、引用により組み入れられるものとする。

    値の範囲が提供される場合、その範囲の上限値および下限値の間の各介在値ならびにその指定範囲内の任意の他の指定値または介在値は、本発明の範囲内に包含されるものとみなされる。 これらのより小さい範囲の上限値および下限値は、独立して、そのより小さい範囲内に含まれうるものであり、また、指定範囲内の任意の特定的に除外された限界値の制約を受けて、本発明の範囲内に包含される。 指定範囲が限界値の一方または両方を含む場合、それらの含まれる両限界値のいずれか一方を除外した範囲もまた、本発明の範囲内に包含される。

    以下の説明では、本発明のより十分な理解を提供すべく、多数の詳細な具体的内容が示される。 しかしながら、これらの詳細な具体的内容の1つ以上を用いることなく本発明を実施しうることは、当業者には明らかである。 他の例では、本発明が曖昧にならないように、当業者に周知の特徴および周知の手順は、説明されていない。

    本発明の一般的事項 本発明に係るアッセイ系は、1)効率的な空間コード化スキームを用いて高レベルの多重化が可能なアッセイと、2)空間パターンに従って試薬を送達しうる機器と、3)本質的にデジタル読取情報により決定されるデコード化とを含む、空間コード化多重化アッセイを提供する。 本発明に係るアッセイ系では、生物学的標的の存在もしくは不在および相対量または生物学的標的の指標となる生物学的活性、さらには生物学的サンプル(たとえば、顕微鏡用スライドや培養ディッシュなどの担体上に配置された組織切片または他の生物学的構造物)中の生物学的標的の位置または活性を検出する。

    アッセイ系はさらに、空間規定パターンで試薬を送達する能力を備えた機器を提供する。 この機器は、ソフトウェア、試薬、およびプロトコルと一緒になって、本発明に係るきわめて革新的なアッセイ系の主要要素を提供し、遺伝子発現およびペプチド局在化を含めて、意味のある空間環境中の多数の生物学的標的または活性の測定を可能する。 このアッセイ系で使用されるコード化スキームでは、多重化アッセイの生成物を生物学的サンプルから取り出して分析に供すべくプールした後、生物学的サンプル中の生物学的標的または活性(またはその欠如)の位置を決定することが可能である。 コード化スキームのデコード化は、たとえば、低コストで数百万〜数兆のデータ点を容易に提供する次世代シークエンシングにより、実施可能である。 次いで、生物学的標的の量または活性などのアッセイ結果を生物学的サンプル中の特定の位置に対しマッピングすることが可能である。 アッセイ系は、生物学的サンプル中の細胞機能および調節の複雑な空間パターンを知る新しい解析の機会を与える。

    本発明に係るアッセイ系100の概略図は、図1で提供される。 工程110では、担体に固定された生物学的サンプルが提供される。 生物学的サンプルは、対象の生物学的標的を含有する。 生物学的標的は、核酸(たとえば、RNA転写物、ゲノムDNA配列、cDNA、アンプリコン、または他の核酸配列を含む)およびタンパク質、酵素などの任意の対象分子を含みうる。 工程120では、コード化プローブは、既知の空間パターンに従って生物学的サンプルに送達される。 コード化プローブは、対象の生物学的標的と相互作用可能なプローブと、アッセイされる生物学的標的のサンプル中の位置を特定することにより、アッセイ結果をサンプル中の位置に関連付けるために使用可能なコードタグとを含む。 ほとんどの実施形態では、コードタグはオリゴヌクレオチドである。 しかしながら、コードタグはまた、質量タグ、蛍光標識、または他の部分を含みうる。

    いくつかの実施形態では、コード化プローブのプローブおよびコードタグの部分は、生物学的サンプルに送達される前にあらかじめ結合される。 たとえば、コード化プローブがオリゴヌクレオチドである場合、プローブおよびコードタグ配列の両方を単一のオリゴヌクレオチドとして合成することが可能である。 他の選択肢として、コード化プローブのプローブおよびコードタグの部分を、独立して、合成または取得し、生物学的サンプルへの送達前に組み合わせることが可能である(たとえば、2つの個別のオリゴヌクレオチドを合成し、たとえば、ライゲーションにより結合させることが可能であり、または抗体およびオリゴヌクレオチドを独立して調製し、生物学的サンプルへの送達前にコンジュゲートすることが可能である)。 また、図2〜5に記載されているように、プローブおよびコードタグ(コード化オリゴヌクレオチド中)を独立して合成し、アッセイにおいて異なる工程で生物学的サンプルに送達する(たとえば、最初にプローブ、その後コードタグ、またはその逆)。

    工程130では、コード化プローブを生物学的標的と反応または相互作用させる。 すなわち、たとえば、オリゴヌクレオチドを核酸標的にハイブリダイズさせたり、酵素にタンパク質標的との反応を触媒させたり、抗体をエピトープに結合させたりするなどする条件を提供する。 生物学的標的が核酸である場合、コード化プローブは、典型的には、オリゴヌクレオチドであり、標的核酸にハイブリダイズする。 生物学的標的がタンパク質である場合、コード化プローブは、典型的には、標的タンパク質に結合することによりまたはそれと反応することにより(すなわち、タンパク質の一方は、他方の基質である)標的タンパク質と相互作用するアプタマー、小分子、またはオリゴヌクレオチドコンジュゲートタンパク質である。 コード化オリゴヌクレオチドは、コンジュゲーション、好適な基を介する化学架橋または光架橋などによりプローブ(タンパク質)に結合しうる。

    コード化プローブが生物学的標的と相互作用した後、工程140では、生物学的標的と相互作用したコード化プローブを、生物学的標的と相互作用しなかったコード化プローブから分離しなければならない。 生物学的標的が核酸でありかつコード化プローブがオリゴヌクレオチドである場合、分離は、たとえば、ハイブリダイズされていないコード化プローブをサンプルから洗浄除去することにより、達成可能である。 同様に、アプタマー、小分子、およびタンパク質のプローブを使用するアッセイを含めて、アフィニティー結合に基づく他のアッセイでは、親和性の低い結合剤を、洗浄工程を用いて除去することが可能である。 プローブが標的との相互作用を介して変換される場合(たとえば、ペプチドの場合、たとえば、プロテアーゼによる切断またはキナーゼによるリン酸化を介して)、すべてのコード化プローブ、すなわち、生物学的標的と相互作用して変換されたコード化プローブおよび変換されなかったコード化プローブの両方を捕集することが便利である。 捕集後またはプール後、抗体または他の親和性捕獲剤を用いて、一部分(たとえば、リン酸基)の付加により変換されたプローブを捕獲することが可能である。 プローブが切断を介して変換された場合、たとえば、変換(たとえば、切断による)時に変換されたプローブから除去されるタグを介して変換されなかったプローブを捕獲することにより、または切断の部位に新しいタグを付加することにより、変換されたプローブを分離することが可能である。

    反応(変換)または相互作用したコード化プローブを、反応または相互作用しなかったコード化プローブから分離した後、反応および/または相互作用したコード化プローブの配列は、好ましくはシークエンシングにより、決定される。 コード化プローブの配列は、アッセイ結果を生物学的サンプル中の元の位置に対しマッピングすることを可能にする。

    図2は、空間情報のコード化のためのコンビナトリアルコード化スキームの効率的な実行を具現化する本発明に係るアッセイ系の概略図を提供する。 この概観の目的では、プローブはオリゴヌクレオチドであるが、他の箇所で説明されるように、他のタイプのプローブを使用することも可能である。 工程210では、担体に固定された生物学的サンプル、たとえば、組織サンプルまたは他の生物学的構造が提供される。 工程220では、1種以上のオリゴヌクレオチドプローブが生物学的サンプルに送達され、そこで、オリゴヌクレオチドプローブは、生物学的サンプル中の生物学的標的にハイブリダイズ可能である。 工程230では、オリゴヌクレオチドプローブを核酸標的と相互作用させる(ハイブリダイズさせる)。 すなわち、オリゴヌクレオチドプローブが標的核酸にハイブリダイズすることが可能である適切な条件が提供される。

    工程240では、標的核酸にハイブリダイズしなかったオリゴヌクレオチドプローブは、除去され、それにより、標的核酸にハイブリダイズしたオリゴヌクレオチドプローブから分離される。 この実施形態では、分離は、たとえば、サンプルを洗浄してハイブリダイズされなかったオリゴヌクレオチドプローブを除去することにより、達成可能である。 次いで、工程250では、コード化オリゴヌクレオチド(コード化剤)は、選択された空間パターンに従って生物学的サンプルに送達される。 この場合、コード化オリゴヌクレオチドは、生物学的サンプル中の生物学的標的の位置をコード化するために使用されるコードタグを含む。 図1に示されるアッセイ系とは対照的に、ここでは、プローブおよびコード化剤(コード化オリゴヌクレオチド)は、別々の工程で送達されることに留意されたい。 工程260では、コード化オリゴヌクレオチドをオリゴヌクレオチドプローブに結合させてコード化プローブを形成する。 プローブがオリゴヌクレオチドであるこの場合、コード化オリゴヌクレオチドは、たとえばライゲーションにより、オリゴヌクレオチドプローブに結合させることが可能である。 他の選択肢として、プライマーとして作用するプローブオリゴヌクレオチドを伸長させるDNAポリメラーゼを用いることによりコード化オリゴヌクレオチド中の情報が転写され、これにより、プローブオリゴヌクレオチドはコード化オリゴヌクレオチドの配列をコピーして組み込むことが可能である。

    工程270では、コード化プローブ中のコードタグの配列さらにはプローブ自体の配列または配列の一部分を決定し、工程280では、標的核酸を生物学的サンプルにマッピングする。 いくつかの実施形態では、配列の存在量は、その位置での生物学的標的の相対量を明らかにする。 本発明をよりよく説明するために、この実施形態は特定の順序での個々の工程を示しているが、工程の厳密な順序は変更することが可能である。 たとえば、工程220と250とを組み合わせることが可能であって、プローブとコード化オリゴヌクレオチドとの混合物を、選択された空間パターンに従って送達するようにすることができる。 次いで、組み合わされた工程220および250の直後にまたはそれらと同時に、結合工程260を行うことが可能である。 次いで、この場合、工程260の後、工程240が行われる。 したがって、この一連の工程の2つの主要な結果(すなわち、プローブ分子の位置特異的コード化、および対応する標的分子と相互作用するその能力に基づくプローブ分子の分離)は、特定の工程の実行時、いくらかの柔軟性をもたせて達成可能であることを認識しうる。 同様に、コード化スキームのデザインにもかなりの柔軟性が存在する。 以下で述べるように、本発明に係るアッセイは、コンビナトリアル法にとくに適合する。

    したがって、本発明は、シークエンシングの高度並列データ解析によりin situハイブリダイゼーションの分解能を提供し、多くの位置で多種多様な生物学的標的を調べる能力を提供する。 いくつかの実施形態では、アッセイされる複数の生物学的標的数と生物学的サンプル中の部位数との和は20超であり、他の実施形態では、アッセイされる複数の生物学的標的数と生物学的サンプル中の部位数との和は50超であり、他の実施形態では、アッセイされる複数の生物学的標的数と生物学的サンプル中の部位数との和は、100超、500超、1,000超、10,000超、25,000超、100,000超、500,000超、1,000,000超である。 本発明に係る空間コード化範囲に基づき、さらに多数が意図されうることが理解される。 たとえば、各位置につき10,000個の標的×10,000個の位置のアッセイは、10 個の異なるアッセイを生じさせる。 また、とくに、単一細胞程度の分解能を有する空間位置が利用される場合、これらよりも多数でさえも利用されることが容易に意図されうる。 さらに、ハイスループットデジタルシークエンシングが利用される実施形態では、典型的には、少なくとも1,000個のコード化プローブの配列が並列方式で決定される。 より典型的には、デジタル読取情報を用いて、各アッセイに対して複数の配列読み値(プローブおよび空間位置コードにより規定される)を取得することが望ましい。 実験のデザインおよびアッセイの要件にもよるが、1個のアッセイあたり平均で少なくとも3個のコピー、より典型的には1個のアッセイあたり少なくとも10個または少なくとも30個のコピーを得ることが望ましい。 好適なダイナミックレンジを有する定量的読取情報では、1個のアッセイあたり1,000個の読み値を取得することが望ましいこともある。 したがって、1,000,000個のアッセイが行われる場合、配列読み値の数は10億以上になる可能性がある。 ハイスループットデジタルシークエンシングを使用しかつ重複(redundnacy)を許した場合、少なくとも10,000個のコード化プローブの配列が並列方式で決定されるか、または少なくとも100,000個、500,000個、1,000,000個、10,000,000個、100,000,000個、1,000,000,000個、またはそれ以上のコード化プローブの配列が並列方式で決定される。

    アッセイ 本発明に係るアッセイ系のアッセイ部分は、次の一般的工程、すなわち、コード化剤(いくつかの実施形態では、プローブにあらかじめ結合されている)が既知の空間パターンに従ってサンプルに送達されるようにプローブおよびコード化剤を送達する工程と、プローブをサンプル中の生物学的標的と相互作用または反応させる工程と、プローブおよびコード化剤があらかじめ結合されていない場合、コード化剤をプローブに結合させる工程とを含む。

    本発明に係るサンプルは、担体に固定可能であるかまたは本質的に二次元で提供可能である実質上任意の1種または複数種の生物学的サンプルを含む。 この場合、アッセイされる生物学的標的に結合する能力または生物学的サンプル内の元の位置を知る機能は重要である。 例示的な生物学的サンプルは、組織切片(たとえば、全動物切除切片および組織生検試料を含む)、スライド上または培養ディッシュ上の細胞集団などを含む。 本発明に係るアッセイ系は、新しいサンプル(一次組織切片など)および保存したサンプル(限定されるものではないが、凍結サンプル、パラホルマリン固定サンプル、パラフィン包埋(FFPE)サンプル)を含めて、多数の生物学的サンプルタイプに適合可能であるという点でとくに有利である。 本発明に係るアッセイ系の重要な態様は、生物学的サンプルが個別の独立して測定可能な領域を有する基材表面上に固定されることである。

    検出対象の生物学的標的は、タンパク質、核酸、脂質、炭水化物類、イオン、または以上のいずれかを含有する多成分複合体(ただし、これらに限定されるものではない)をはじめとする任意の生物学的分子でありうる。 細胞レベル下の標的の例としては、オルガネラ、たとえば、ミトコンドリア、ゴルジ体、小胞体、葉緑体、エンドサイト小胞、エキソサイト小胞、空胞、リソソームなどが挙げられる。

    いくつかの特定の実施形態では、アッセイ系は、核酸解析(たとえば、遺伝子型解析により)、DNAコピー数またはRNA転写物の定量分析、サンプル内の特定の転写物の局在化解析などに使用される。 図3は、たとえば、本発明に係るアッセイ系で使用可能な単一ヌクレオチド多型(SNP)を検出するための、例示的なアッセイの全体的スキームを例示する。 図3では、2つのオリゴヌクレオチドプローブが提供される。 各オリゴヌクレオチドプローブは、305および307に見られる標的特異的領域(分析対象のSNPのいずれかの側に位置する)と301および303に見られるライゲーション領域とを含む。 オリゴヌクレオチドプローブは、生物学的サンプル中の標的核酸(図示せず)にハイブリダイズされる。 工程302では、一方のオリゴヌクレオチドプローブを伸長させてSNP配列を組み込み、かつ他方のプローブにライゲートして、標的核酸領域309とライゲーション領域301および303とを含む伸長されたプローブを形成する。

    2つのコード化剤(両方とも、コードタグ(315および317で示される)とライゲーション領域(311および313で示される)とプライマー領域(319および321で示される)とを含む)を組み合わせ、伸長されたプローブにライゲートし、コード化標的特異的オリゴヌクレオチドを形成する。 この場合も、図1とは対照的に、プローブおよびコード化剤は、別々の工程で送達される。 そうすることにより、以下に記載のコンビナトリアル実施形態の使用が可能になる。 好ましい実施形態では、1対のコード化オリゴヌクレオチド内のコード化オリゴヌクレオチドは、標的配列の一方の側または他方の側(すなわち、標的配列の5'側または3'側)に特異的にライゲートする。 また、典型的には、コード化オリゴヌクレオチドおよびプローブのライゲーション領域およびプライマー領域は、共通(universal)である。 すなわち、プローブおよびコード化オリゴヌクレオチドの構築に使用される1組のライゲーション領域およびプライマー領域は、一定であり、プローブの標的特異的領域およびコード化オリゴヌクレオチドのコードタグのみが異なる。 しかしながら、この場合も、他の選択肢の実施形態では、ライゲーション領域およびプライマー領域は、共通でなく、プローブおよびコード化剤ごとに異なる。

    ライゲーションに続いて、コード化プローブを溶出させ、プールし、場合により、PCRを介してシークエンシングアダプターをコード化プローブに付加する。 他の選択肢の実施形態では、シークエンシングプライマーをコード化オリゴヌクレオチドにライゲートしうるか、またはシークエンシングプライマー配列をコード化オリゴヌクレオチドの一部として付加しうる。 図3に見られるように、各シークエンシングアダプターは、コード化プローブ上のプライマー領域319および321に適合可能なプライマー領域319または321を含む。 第1のアダプター327、第1のプライマー領域319、第1のコードタグ315、ライゲーション領域311および301、標的領域309、ライゲーション領域313および303、第2のコードタグ317、第2のプライマー領域、325および第2のアダプター329を含む最終構築物は、この時点で、デジタルハイスループットシークエンシングプロセスに投入可能な状態にある。

    伸長反応およびライゲーション反応の組合せが図3に例示されているが、ライゲーションのみ(たとえば、標的核酸配列の連続部分にハイブリダイズするオリゴヌクレオチドに対して)を含めて、コード化オリゴヌクレオチドを標的特異的オリゴヌクレオチドに連結するために様々な反応が用いられうることを認識すべきである。 他の選択肢として、GOLDENGATE(登録商標)アッセイ(ファン(Fan)ら,Cold Spring
    Symp. Quant. Biol. ,68:69−78(2003);(イルミナ社(Illumina,Inc.),サンディエゴ,カリフォルニア州(San Diego,CA)参照)などの場合、追加のオリゴヌクレオチドを利用するアッセイを利用しうる。

    他の実施形態では、本発明に係るアッセイ系はまた、ペプチドまたはタンパク質、抗体の存在、酵素および他のタンパク質の活性、翻訳後修飾、ペプチドの活性型および非活性型、さらには生物学的サンプル中のペプチドアイソフォームを分析するために使用可能である。 したがって、プローブは、酵素の活性領域、免疫グロブリンの結合ドメイン、タンパク質の規定ドメイン、全タンパク質、合成ペプチド、導入された突然変異を有するペプチド、アプタマーなどを含みうる。

    特定の態様では、プローブは、酵素またはプロ酵素(たとえば、キナーゼ、ホスファターゼ、チモーゲン、プロテアーゼ、またはそれらの断片)に対する基質である。 特定の態様では、プローブは、1つ以上のシグナル伝達経路に関与するタンパク質(たとえば、キナーゼまたはホスファターゼ)を検出するために使用されるリン酸化基質である。 本発明に係る他の特定の態様では、プローブは、特定のプロテアーゼまたはプロテアーゼのクラスにのみ会合する特定のプロテアーゼ基質である。 他の態様では、プローブは、酵素のさまざまなプロセス体、アイソフォーム、および/またはドメインである。 タンパク質系プローブは、典型的には、オリゴヌクレオチドコード化剤にコンジュゲートされるかまたは他の形で連結される。 この場合、オリゴヌクレオチドコード化剤はまた、タンパク質プローブの同定を可能にするヌクレオチド配列成分を含むであろう。

    特定の態様では、本発明は、サンプル中の異なる位置間および/またはサンプル間の生物学的標的の量および/または活性の差を評価するためのアッセイを提供する。 この方法は、生物学的サンプルから複数のコード化結果を決定することと、生物学的サンプル中の各位置の生物学的標的の量の差を評価することとを含む。

    コンビナトリアル実施形態 コード化の効率を最大化するために、コード化オリゴヌクレオチドでコードタグ対を使用するコンビナトリアル手法を使用することが可能である。 標的特異的情報とコードタグとを切り離すことにより、所要のオリゴヌクレオチドの数は、劇的に低減され、それに付随してコストが削減される。

    図4は、本発明に係るアッセイ系のコンビナトリアルコード化スキームの一実施形態に対する一般的機構を例示する。 ここでは、代表的組織切片(416で示される)中の核酸がアッセイされる。 図4のAでは、対象の標的核酸402に特異的に結合される2つの標的特異的/コード化オリゴヌクレオチド構築物420および422が示される(たとえば、図3の工程302および304間で形成される)。 第1のコード化プローブ420は、たとえば、アッセイ生成物の増幅用の共通プライミング部位に会合するコードタグ408、またはシークエンシング技術を用いてコード識別子の同定を可能にするアダプター404を含む。 第2のコード化プローブ422は、たとえば、アッセイ生成物の増幅用の共通プライミング部位に会合するコードタグ406、またはシークエンシング技術を用いてコード識別子の同定を可能にするアダプター410を含む。

    図4のBでは、20個の異なるコードタグ、すなわち、a1〜a10(コードタグ406、コード化プローブ420上)およびb1〜b10(コードタグ408、コード化プローブ422)に使用可能な空間パターンが示される。 たとえば、コードタグa1は、10個の離散した領域またはスポット(412では第1の水平線(行)のスポットとして示される)として生物学的サンプル上に堆積される。 コードタグa2は、412では第2の行上の10個のスポットとして生物学的サンプルに堆積される。 コードタグa3は、412では第3の行上の10個のスポットとして生物学的サンプル上に堆積され、以下も同様である。 「a」タグは10個の横の行で堆積されるが、「b」タグは414に示されるように10個の縦の列で堆積される。 たとえば、コードタグb1は、414の第1の列の10個の離散したスポットとして生物学的サンプル上に堆積され、コードタグb2は、414の第2の列の10個の離散したスポットとして生物学的サンプル上に堆積される。 そのような構成を用いることにより、20個のコードタグで生物学的サンプル上の100個の異なる位置を一意的に規定することが可能である。

    図4のCでは、コードタググリッド418に合致する代表的組織切片416が示される。 矢印は、組織切片416に合致するグリッド418上に「a」コードタグおよび「b」コードタグがどのように堆積されるかを示す。 順序付け後、たとえば、コードタグa1およびb4が標的核酸配列に会合した場合、標的核酸配列(すなわち、生物学的標的)は、組織切片の位置a1、b4に存在したことになる。

    図5は、本発明に係るアッセイ系のコード化スキームの簡略具体例を提供する。 図5は、a1、a2、a3、a4、およびb1、b3、b3およびb4を含む、コード化オリゴヌクレオチド510を示す。 標的特異的オリゴヌクレオチド(TSO)(プローブ)1および2は、520に示される。 堆積または分配のスキームは、530に示される。 図4では例示されたグリッドと同様に、コード化オリゴヌクレオチドa1〜a4は、パターン状(ここでは縦パターン状)に堆積され、コード化オリゴヌクレオチドb1〜b4には、パターン状(ここでは横パターン状)に堆積される。 しかしながら、スポットを有する正方形として示されるグリッドは、実際には図4に示される組織切片416などの生物学的サンプル(図示せず)上の堆積パターンである。

    標的特異的オリゴヌクレオチドは、生物学的サンプルに送達され、標的核酸が存在する場合、標的特異的オリゴヌクレオチドは、生物学的サンプル中の標的核酸にハイブリダイズする。 次いで、ハイブリダイズされなかった標的特異的オリゴヌクレオチドは、たとえば洗浄により、除去される。 次いで、コード化オリゴヌクレオチドは、530に示された空間パターンに従って生物学的サンプルに送達される。 コード化オリゴヌクレオチドは、生物学的サンプル中の標的核酸にハイブリダイズした任意の標的特異的オリゴヌクレオチドにライゲートされ(またはたとえば、伸長およびライゲートされ)、次いで、ライゲートされた構築物は、生物学的サンプルから溶出され、プールされる。 そしてシークエンシングアダプターが、この配列がコード化オリゴヌクレオチド中にあらかじめ含まれていない場合に付加される。 ライゲートされた構築物は、たとえば、ハイスループットシークエンシングまたは「次世代」シークエンシングにより、配列決定される。

    得られる配列のプールは、540に示される。 a4b1、a4b2、a1b3、a2b3、a3b3、a4b3、およびa4b4(横線で示された位置)では標的特異的オリゴヌクレオチド1のみで配列読取情報が得られた。 a1b1(縦線で示された位置)では標的特異的オリゴヌクレオチド2のみで配列読取情報が得られた。 位置a2b1、a3b1、a1b2、a2b2、およびa3b2(クロスハッチで示された位置)では両方の標的特異的オリゴヌクレオチド1および2で配列読取情報が得られた。 a1b4、a2b4、またはa3b4(陰影無しで示された位置)ではいずれの標的特異的オリゴヌクレオチドでも配列読取情報が得られなかった。 したがって、アッセイが行われた生物学的サンプルにおいて、第1の標的核酸は、生物学的サンプルの左側の大部分および下側で検出され、第2の標的核酸は、生物学的サンプルの左上部分でのみ検出され、いずれの標的核酸も、生物学的サンプルの右上部分では検出されなかった。 この時点で、2つの標的核酸の示差発現を生物学的サンプルに戻して生物学的サンプル中のこれらの位置の生物学的構造または細胞型に対しマッピングすることが可能である。

    位置情報に加えて、コードタグの相対存在量に関する情報を得ることが可能である。 たとえば、a4T1b2配列と比較してデータセット中にa4T1b1配列が10倍存在することが判明した場合、これは、標的核酸配列1がa4T1b1位置にa4T1b2位置の10倍存在することを示唆する。

    図3に示されるヌクレオチド解析の場合、コードタグを標的特異的オリゴヌクレオチドに直接ライゲートすることにより、n個の標的に対して2n個の標的特異的オリゴヌクレオチドが必要とされるにすぎない。 たとえば、図2で概説されたコンビナトリアル手法を用いて、10,000個の空間位置で100個の異なる標的をアッセイするには、2×100個の標的特異的オリゴヌクレオチドおよび2×100個のコード化オリゴヌクレオチドが必要である。 アッセイオリゴヌクレオチドの合計カウント数は、共通プライマーをカウントしないで、わずか400個(標的特異的なもの200個およびコード化されたもの200個)である。 これとは対照的に、コード化オリゴヌクレオチドを標的特異的オリゴヌクレオチドから切り離さなかった場合、(n×X位置コード)+(n×Y位置コード)が必要となり、上記の例では、共通プライマー配列をカウントしないで20,000個のオリゴヌクレオチドが必要になる。 さらに、図2〜5に示される実施形態は、2つのコード化剤(コードタグ)を用いたコンビナトリアルスキームを示しているが、3つ、4つ、またはそれ以上のコード化剤およびコードタグを使用して、さまざまな手段によりおよび工程のさまざまな組合せで、プローブにまたは互いに結合させることが可能である。

    本発明に係るアッセイ系の空間コード化態様に基づいて、それほど多くないアッセイ数であっても、多量の情報を発生させることが可能である。 たとえば、5個以上の生物学的標的をサンプル中の5個以上の位置でアッセイすると、25個以上の組合せが発生する。 読取にデジタルシークエンシングを用いた場合、1つの組合せあたりの配列読み値の最適数は、必要とされた感度およびダイナミックレンジに依存し、調整可能である。 たとえば、各組合せに対して平均で100個の読み値をサンプリングする場合、25個の組合せに対する全数は、25,000個の読み値である。 平均サンプリング深さを1,000として1,000個の標的を1,000個の位置でアッセイする場合、10 個の読み値が必要とされる。 これらの数は大きいが並列デジタルシークエンシング法の本来の能力の範囲内にあり、この方法では、適度の時間でかつ1個の読み値あたり非常に低コストで数十億個さらには数兆個の読み値のデータ集合を発生することが可能である。 したがって、識別される位置数もしくはアッセイされる生物学的標的数またはその両方を変化させることにより、かつデジタルシークエンシングを用いることにより、多量の情報を得ることが可能である。 特定の態様では、2つ以上の生物学的分子に対して複数の位置を識別することが可能である。

    試薬送達系 本発明に係る試薬送達系は、生物学的サンプルの離散部分への試薬の送達およびコード化スキームの空間パターンの整合性の維持を可能にする機器を含む。 本発明に係るアッセイ系の試薬送達系は、任意選択のイメージング手段と試薬送達ハードウェアと制御ソフトウェアとを含む。 試薬送達は、いくつかの異なる方法で達成可能である。 試薬送達は、一度に多くの異なる生物学的サンプルに対して行われることに留意されたい。 単一の組織切片を本明細書に例示してきたが、複数の生物学的サンプルを固定して同時に分析することが可能である。 たとえば、組織サンプルの連続切片を並列方式で解析し、データを合わせて3Dマップを構築することが可能である。

    本発明に係るアッセイ系に不可欠なのは、生物学的サンプル上への試薬の空間パターン化を可能にする機器である。 生物学的分子(たとえば、オリゴヌクレオチドまたは抗体)および化学試薬(たとえば、小分子またはdNTP)の両方の調製および送達の技術は、当技術分野で公知であり、かつこれらの機器系の使用は、当業者に公知であり、本発明に係るアッセイ系に容易に適合可能である。 好適な試薬送達系の一例は、生物学的分子を含有するナノリットルスケールの小滴を高精度かつ高再現性で送達すべく使用可能なLabcyte(商標)エコー音響液体ハンドラーである。 当業者であれば、試薬が送達されるべき位置を特定するソフトウェアを用いて、この試薬送達装置を全系内に組み込むことが可能であった。

    生物学的サンプル上への作用剤および/またはコード識別子の堆積に使用可能な他の機器には、インクジェットスポッティング、ピン、ペン、またはキャピラリーを利用した機械的スポッティング、マイクロコンタクトプリンティング、光化学法、またはフォトリソグラフィー法などが含まれるが、これらに限定されるものではない。 いくつかの適用では、異なる試薬分布および/または生物学的標的定量に対して生物学的サンプルの特定の領域を1つ以上のアッセイ領域に分割または分離することが好ましいこともある。 アッセイ領域は、バリヤーまたはチャネルを用いて物理的に分離可能である。

    一例示的態様では、試薬送達系は流動系でありうる。 本発明に係る試薬送達用流動系は、1つ以上のポンプ、バルブ、流体貯蔵器、チャネル、および/または試薬貯蔵器などの機器を含みうる。 試薬送達系は、流体を移動させて生物学的サンプルの離散した部分と接触するように構成される。 試薬の移動は、流体試薬の下流などに配置されたポンプにより駆動可能である。 ポンプは、各流体試薬を反応室まで(およびそれを通り抜けるように)駆動可能である。 他の選択肢として、流体を貫通するように重力により試薬を駆動してもよい。 米国特許出願公開第20070166725号明細書および同第20050239192号明細書には、本発明に係るアッセイ系で使用可能な汎用流体ツールが開示されている。 このツールは、比較的単純なハードウェアを用いて非常に複雑な分析操作を達成すべくガス、液体、および固体の精密操作が可能である。

    より具体的な例では、基材に固定された生物学的サンプルに1つ以上のフローセルを上から装着することが可能である。 フローセルは、それに接続された入口チューブおよび出口チューブを含みうる。 また、場合により、試薬をフローセルにおよび生物学的サンプル全体にわたり送達するために、外部ポンプが使用される。 フローセルは、生物学的サンプルの特定部分にのみ試薬を送達し、生物学的サンプルの任意の特定部分に送達される試薬の量およびタイプを制限するように構成される。

    他の態様では、マイクロ流体系を生物学的サンプルが配置される基材に一体化させたり、または基材の上に外側から装着したりすることが可能である。 基材に当接した流体層により、平面状基材上および/またはその上方に、流体を保持および移送するためのマイクロ流体流路を形成してもよい。 試薬貯蔵器間に配置されたバルブの選択的開閉により、流体試薬を選択および送達することが可能である。

    ポンプは、一般的には、流体および/または流体中に配置された試薬を移動させるためのなんらかの機構を含む。 いくつかの例では、ポンプは、小容積の流路(すなわち、マイクロ流体構造)を介して流体および/または試薬を移動させるように構成可能である。 ポンプは、いくつかある手段の中でとくに、流体および/もしくは流体移送構造体に正圧または負圧を機械的に加えることにより、電気的に電界の適切な印加を行うことにより、またはその両方により、駆動することが可能である。 例示的な機械式ポンプは、シリンジポンプ、蠕動ポンプ、ロータリーポンプ、加圧ガス、ピペッターなどを含みうる。 機械式ポンプは、微細加工されたり、成型されたりすることが可能である。 例示的な電気式ポンプは、電極を含みうる。 また、電気泳動、電気浸透、電気毛管現象、誘電泳動(進行波形態を含む)などにより駆動しうる。

    バルブは、一般的には、チャネルを介して流体の流路の制御するためのなんらかの機構を含む。 バルブは、たとえば、チャネルを部分的にまたは完全に閉鎖するように選択的に変形可能な可変形部材、チャネルを部分的にまたは完全に閉塞するようにチャネル内に選択的に伸長可能な可動突起、電気毛管構造体などを含みうる。

    開口ガスケットを生物学的サンプルの上に装着することが可能であり、そしてサンプルおよび試薬をガスケット中に注入することが可能である。 好適なガスケット材料としては、ネオプレン、ニトリル、およびシリコーンゴムが挙げられるが、これらに限定されるものではない。 他の選択肢として、基材上の生物学的サンプルと化学的不活性耐水性材料との間に挟設されたガスケットにより、水密反応室を形成することが可能である。 化学的不活性耐水性材料としては、たとえば、黒色陽極酸化アルミニウム、熱可塑性物質(たとえば、ポリスチレン、ポリカーボネートなど)、ガラスなどが挙げられるが、これらに限定されるものではない。

    任意選択の実施形態では、アッセイ系は、関心のある生物学的サンプルの特徴および組織を決定するためのイメージング手段を含む。 得られる画像は、たとえば、試薬の堆積パターンをデザインするために使用しうる。 各人は、その代わりに、たとえば、顕微鏡を用いて、生物学的サンプルを観察したり、生物学的サンプルの組織を解析したり、送達アッセイ試薬に対する空間パターンを特定したりすることが可能であるので、イメージング手段は、任意選択である。 含めるのであれば、送達系は、CCD型またはIGFET型(たとえば、CMOS型)撮像装置などの撮像装置や、米国特許出願公開第20090197326号明細書(引用により本明細書に組み入れられるものとする)に記載されるような試薬送達用の超音波スプレー装置を含むマイクロ回路構成を備えることができる。 また、図4および5は、x,yグリッド構成を用いて例示しているが、たとえば、組織サンプルのトポロジーを追跡したり、組織中の特定のグループの細胞、細胞層、および/または細胞型にターゲティングしたりするなど、他の構成を使用することが可能であることに留意されたい。

    さらに他の選択肢では、試薬送達系は、マスク処理やスプレー処理などの半導体技術を用いて、生物学的サンプル表面上の特定のパターンに合わせた試薬の送達を制御する。 特定の領域を曝露から保護するマスクを用いることにより、生物学的サンプルの特定の領域を試薬への曝露から保護することが可能である。 スプレー処理や流体流動などの従来技術を用いて、試薬を生物学的サンプルに導入してもよい。 マスク化送達を用いることにより、基材表面上へのパターン化された送達スキームが得られる。

    本発明の好ましい態様では、試薬送達機器は、インクジェットプリント技術に基づく。 多種多様なインクジェット機構(たとえば、熱方式、圧電方式)が存在し、適合性は、水性および有機性のインク配合物を用いて示されてきた。 独立作動ノズルセットを用いて複数の試薬を同時に送達することが可能であり、非常に高い分解能が得られる。

    関心のある特定部位にターゲティングするため、試薬送達方法および関連するコード化スキームを支援すべく、アッセイされる生物学的サンプルの情報画像を用いてもよい。 アッセイ系の他の特徴と統合された画像処理(たとえば、免疫組織化学または他の染色化学により識別された細胞型の画像)を用いて、生物学的サンプルのサンプル領域を特定することが可能である。 いくつかの態様では、ソフトウェアを用いて、画像情報を試薬送達パターンに自動変換する。 したがって、試薬送達のために生物学的サンプルを非常に正確に位置合せし整合させる機構は、本発明に係るアッセイ系の重要な要素である。 スライド上での基準マーカーの使用および/または他の非常に正確な物理的位置決めシステムなどの機構は、この目的に適合しうる。

    本発明は、好ましくは、アッセイ系に合わせて作製された完全なソフトウェア一式を含む。 場合により、実施される特定のアッセイに合ったコード化ヌクレオチド(核酸がアッセイされるいくつかの実施形態では、標的特異的オリゴヌクレオチド)をデザインするためにオリゴヌクレオチドデザインソフトウェアを使用し、系の一部として組み込んでもよい。 また、場合により、アッセイ結果を決定するために、試薬送達およびデータ解析(すなわち、配列解析)のためのアルゴリズムおよびソフトウェアを組み込んでもよい。 生成されるデータセットのタイプが測定尺度の結果として大規模なものになる可能性があるので、統合データ解析はとくに有用である。 アッセイ系により生成される空間関連データの解析のためにとくにデザインされたアルゴリズムおよびソフトウェアツールは、パターン解析ソフトウェアおよび可視化ツールを含めて、アッセイ系により生成されるデータの価値を高める。

    ある態様では、アッセイ系は、試薬の調製および試薬の品質管理(たとえば、オリゴヌクレオチドプールの完全性および配列忠実性)を行うプロセスを含む。 特に、揮発性、主要温度での安定性、および試薬送達機器に適合させるための化学的適合性などの因子に従って試薬を配合し、アッセイ系内に組み込まれた機器により分析してもよい。

    シークエンシング 本発明に係るアッセイ系のコード化プローブ中のコードタグおよびプローブ配列を同定するために、多くの方法を使用することが可能である。 質量分析(たとえば、Maldi−Tof,LC−MS/MS)、核磁気共鳴イメージング、または好ましくは核酸シークエンシングなどの技術を用いてコードタグを検出することが可能である。 本発明に係るコードタグをデコード化するための技術の例は、たとえば、米国特許出願公開第20080220434号明細書(引用により本明細書に組み入れられるものとする)に見いだしうる。 たとえば、コードタグは、オリゴヌクレオチド質量タグ(OMTまたはmassTag)でありうる。 そのようなタグは、たとえば、米国特許出願公開第20090305237号明細書(その全体が引用により組み入れられるものとする)に記載されている。 さらに他の選択肢では、コード化プローブを増幅してマイクロアレイにハイブリダイズさせることが可能である。 このためには、コード特異的プライマーの使用により達成される個別の増幅反応を行う必要がある。 この場合、各増幅は、特定の空間コードまたはコードのサブセットに特有なものである。 各増幅はまた、異なる解像可能標識(たとえば、発蛍光団)を含む。 ハイブリダイゼーションに続いて、サンプル中の異なる空間位置にマッピングされた特定の標的の相対量を、解像可能標識の相対存在量により決定することが可能である。

    とくに好ましい一態様では、アッセイ系により得られるコードタグは、ハイスループットシークエンシング法、次世代シークエンシング法、および高度並列次世代シークエンシング法に供される基質であり、たとえば、SOLiD(商標)技術(ライフテクノロジーズ社)またはゲノム・アナライザー(Genome Ananlyzer)(イルミナ社)を用いてコードタグの配列を確認するために使用される。 そのような次世代シークエンシング法は、たとえば、ワンパスのシークエンシング法を用いて、または両末端シークエンシングを用いて、実施可能である。 次世代シークエンシング法としては、ハイブリダイゼーションに基づく方法、たとえば、ドルマナック(Drmanac)の米国特許第6,864,052号明細書、同第6,309,824号明細書、および同第6,401,267号明細書、ならびにドルマナック(Drmanac)らの米国特許出願公開第2005/0191656号明細書に開示されるもの、シークエンシング・バイ・シンセシス方法、たとえば、米国特許第6,210,891号明細書、同第6,828,100号明細書、同第6,969,488号明細書、同第6,897,023号明細書、同第6,833,246号明細書、同第6,911,345号明細書、同第6,787,308号明細書、同第7,297,518号明細書、同第7,462,449号明細書、および同第7,501,245号明細書、米国特許出願公開第20110059436号明細書、同第20040106110号明細書、同第20030064398号明細書、および同第20030022207号明細書、ロナギ(Ronaghi)ら,Science,281:363−365(1998)、およびリー(Li)ら,Proc. Natl. Acad. Sci. ,100:414−419(2003)、ライゲーションに基づく方法、たとえば、米国特許第5,912,148号明細書および同第6,130,073号明細書、および米国特許出願第20100105052号明細書、同第20070207482号明細書、および同第20090018024号明細書、ナノ細孔シークエンシング、たとえば、米国特許出願第20070036511号明細書、同第20080032301号明細書、同第20080128627号明細書、同第20090082212号明細書、およびソニ(Soni)およびメラー(Meller),Clin Chem 53:1996−2001(2007)、さらには他の方法、たとえば、米国特許出願第20110033854号明細書、同第20090264299号明細書、同第20090155781号明細書、および同第20090005252号明細書が挙げられるが、これらに限定されるものではない。 また、マッカーナン(McKernan)ら,Genome Res. ,19:1527−41(2009)、およびベントレー(Bentley)ら,Nature 456:53−59(2008)をも参照されたい。 それらはすべて、それらの全体があらゆる目的で本明細書に組み入れられるものとする。

    アッセイ系の適用 生物学的サンプル中の生物学的標的の量および空間位置を同時に測定可能なハイスループット多重化アッセイ系が有益と思われる生物学的研究、診断法、および薬剤開発の重要な領域が多数存在することは、本開示を読めば当業者には明らかである。 たとえば、さまざまなRNA転写物(trancripts)の相対存在量を推定する能力と、組織中の多くの位置(個別細胞程度の大きさであってもよいし、さらにはそれよりも小さくてもよい)にわたり存在量の空間パターンの画像を再構築する能力とを組み合わせることにより、多種多様な領域の基礎研究が可能になる。 以下のものは、例示的な使用であり、なんら範囲を限定するものでないない。

    一例では、CT走査での画像再構成と類似した方法で一連の組織切片を解析することにより、遺伝子発現の三次元パターンが決定される。 そのような方法は、疾患病理において遺伝子発現の変化の測定に使用されうる。 疾患病理としては、たとえば、癌組織および/または傷害、炎症、もしくは感染を受けた組織などがある。 本発明に係るアッセイ系を用いれば、複合組織中の遺伝子発現およびタンパク質局在化に関するより詳細な情報が得られ、正常状態および疾患状態の両方で機能および調節に関する新しい知見がもたらされ、試験しうる新しい仮説が提供される。 たとえば、本発明に係るアッセイ系を用いれば、多くの個体研究およびENCODE(バーニー(Birney)ら,Nature,447:799−816(2007))やmodENCODEのような、より大きいプログラムから得られる知見のいくつかを組織レベルで統合しうる。 アッセイ系はまた、システム生物学の分野で遺伝子発現の相互作用ネットワークをモデリングするコンピューター的取組みを支援する。

    アッセイ系はまた、体細胞変異(たとえば、癌における体細胞突然変異)または感染性生物に対する応答変動を解析する新規な手法を提供する。 たとえば、腫瘍は、典型的には、きわめて不均一であり、異常局所環境において遺伝的正常細胞とともに癌細胞を含有する。 癌細胞は、突然変異および選択を受け、この過程において局所クローンが発生することは、珍しくない。 腫瘍との関連で比較的稀な体細胞突然変異を同定することにより、クローン変異体の選択における主要突然変異の役割に関する研究が可能になる。 癌細胞および遺伝的正常細胞の両方における血管新生、炎症、または他の癌関連過程に関連する転写パターンは、癌生物学に関する知見を得るべく解析可能であり、癌を治療するための新しい療法剤の開発を支援可能である。 他の例では、各人は、感染性生物に対するさまざまな感受性を有しており、本発明に係るアッセイ系は、微生物と組織との相互作用または微生物と組織内の種々の細胞型との相互作用を研究すべく使用可能である。

    重要なこととして、空間関連情報の提供に加えて、本発明では、稀な突然変異の検出感度が増大される。 これは、どの所与の反応においても小さな位置のみがアッセイされるので、SN比(信号対雑音比)を劇的に増大させることが可能であるからである。 混合サンプル中の稀な突然変異の典型的なアッセイでは、サンプルは、バルクで処理される。 すなわち、核酸は、多くのセルから抽出されて単一のプールにされる。 したがって、突然変異が10,000個の細胞のうち1個に存在する場合、約10,000個までの細胞に由来する正常DNAのバックグラウンドに対して検出しなければならない。 これとは対照的に、本発明に係るアッセイ系では、多くの細胞が解析されるものの、空間コード化システムにより個々の細胞または小さな細胞群が同定される。 したがって、本発明に係るアッセイ系では、バックグラウンドは何桁も低減され、感度は大幅に増大される。 さらに、突然変異細胞の空間組織を観測することが可能であり、これは、癌の組織切片中の主要突然変異の検出にとくに重要なものとなりうる。 すでに、分子組織学的分析は、癌生物学に関する知見をもたらしており、診断法での使用可能性を有しうる。 本発明に係る技術は、そのような方法の能力を大幅に増大させることを約束する。

    以下の実施例は、本発明をいかに実施および使用するかについての完全な開示および説明を当業者に提供すべく提示されたものであり、本発明者が自身の発明に対して意図した範囲を限定しようとするものでもなければ、以下の実験が実施される実験のすべてであることまたはそれだけに限られることを表現または暗示しようとするものでもない。 当業者であればわかるであろうが、広義に記述された本発明の精神または範囲から逸脱することなく、特定の実施形態に示された本発明に、多数の変更および/または修正を加えることが可能である。 したがって、本発明の実施形態は、いかなる点においても、例示的なものであって限定的なものではないとみなされる。

    使用される数に関して正確を期すべく努力してきたが(たとえば、量、温度など)、いくらかの実験誤差および偏差を考慮しなければならない。 とくに指定がないかぎり、部は重量部であり、分子量は重量平均分子量であり、温度は摂氏度単位であり、圧力は大気またはその近傍である。

    実施例1:コード化スキームの初期概念実証 初期概念実証として、実用的単一アッセイを実証すべくマイクロアレイを用いてモデル系を開発する。 より複雑な生物学的サンプルの解析に関する問題に対処する前に、基本デザインによりアッセイの概念を検証し、実用的アッセイを確立する。 この概念実証のための読取として従来のシークエンシングを使用する。

    組織切片の代用物してマイクロアレイを使用する。 標的の組成が既知でありかつ系統的に変化させることができるように、マイクロアレイの標的配列は完全に特定される。 5'アミノ修飾を介して合成オリゴヌクレオチド鋳型をガラススライドに結合させる。 各スライドは、単一のオリゴヌクレオチド鋳型配列を有し、行われるアッセイは、ライゲーション、または伸長およびそれに続くライゲーション(これは特定の多型の決定に有用でありうるため)のいずれかを利用しうる。

    アッセイのin situ部分が終了した後、反応生成物は溶出され、生成物の存在または不在を決定し収量を推定するためにqPCRにより解析されるとともに、そのアッセイ生成物の構造を決定するために従来のシークエンシングにより解析される。 試験される単一のアッセイは、適切なポジティブコントロールならびにネガティブコントロール、および単一塩基変異体を識別する能力をチェックするための一つのヌクレオチド変異体(SNV)を含む。

    実施例2:拡張性(Scalability)
    ハイスループット試験で使用するためのアッセイの拡張性を確証するために、アッセイ系の複雑度を増大させる。 マイクロアレイモデル系を用いて24プレックス(plex)×24部位アッセイを行うことにより、空間コード化およびアッセイ系の両方の拡張性を実証する。

    各アッセイ位置の生物学的標的(ここではDNA標的配列の量)をマイクロアレイ基材上で系統的に変化させる。 たとえば、スポットサイズが50μm(ミクロン)(中心間)であるマイクロアレイでは、1mm の領域は400個以下のスポットを含有する。 標的配列の個々の解像を可能にするために、任意で、各部位の周りの領域は、これらのスポットを有しない領域により占められる。 あるいは、2以上の直接隣接するスポットは、標的配列を有しない領域に取り囲まれて、またはその領域に隣接してクラスター化されてもよい。

    空間コード化が正確であることを実証するために、部位は、アッセイ読取情報が各部位の予想組成物と一致することを示すさまざまな標的組成物を含む。 24個の標的配列を用いて、存在する12個の標的と不在の12個の標的とのさまざまな組合せを持つ各部位で、単純デジタルパターンが作製される。 すなわち二進コード(0=不在、1=存在)が作製される。 次いで、アッセイ読取情報を決定し、検出された領域が空間デコード化後の予想シグナルと一致することを示す。 この特定例では、コード空間は、多少の誤りがあっても異なるコードの混合を生じない程度に十分大きい(2 24 )。 さらに、このデザインでは、誤りの同定が可能であり、空間コード化の正確度の推定だけでなく、標的配列の存在または不在を判定する正確度の推定もまた可能である。

    定量差の検出能力は、24部位アッセイの各部位で行われる24個のアッセイのそれぞれについて用量−応答曲線を作成することにより評価される。 これにより、検出限界、ダイナミックレンジ、およびそのレンジにわたり所与の倍率変化を検出する能力の評価が可能になる。

    一態様では、各標的に対して特徴数を変化させることにより異なる比で個別の標的を表すべく、ラテン方格法が使用される。 言い換えれば、一部位で複数のスポットを用いて、24個の標的配列のそれぞれに割り付けられたスポットの数を変化させることが可能であり、24部位のそれぞれは、異なる組成物を有しうる。 1×3インチのマイクロアレイは、多重反復試験を可能にするのに十分な程度に大きい。 こうした24配列のより大きいセットは、デコンボルーションを必要とする。 また、これは、次世代シークエンシング技術(たとえば、SOLiD(商標)技術(ライフテクノロジーズ社,カールスバッド,カリフォルニア州)またはゲノム・アナライザー(イルミナ社,サンディエゴ,カリフォルニア州))などのハイスループット技術を用いて達成される。 24プレックスアッセイの使用は、空間コード化およびデコード化の正確度とアッセイ系の定量的応答との両方を実証する。

    実施例3:保存サンプルへのアッセイの適合化 ゲノムDNAがRNAアッセイの概念実証としてアッセイされる。 これは、単一コピーの参照シグナルを確証する方法を提供するためである。 FFPEサンプル用に実用的アッセイを開発した後、それをRNAアッセイに適合化する。 この目的のために、高多重化で適合性を確保すべくアッセイオリゴヌクレオチド濃度をアッセイする。 細胞直径が10ミクロンの細胞直径であって、各細胞に対して直径10ミクロンの試薬小滴を送達すると仮定すると、小滴の容積は、500μl以下であり、1μΜの濃度で3×10 11個以下の分子を含有しうる。 10,000個の細胞で1,000個の標的配列をアッセイするためには、一小滴中に2,000個以下のターゲティングオリゴヌクレオチドが必要とされる。 したがって、各小滴は、各アッセイオリゴの1.6億以下のコピー数(細胞内の数千個の標的配列よりもはるかに過剰)を含有しうる。

    低回収効率の問題に対処するために、非常に小数のまたは損なわれたサンプルから得られる絶対数の少ない生成物分子の取扱いが強化される。 すなわち、溶出が効率的で、表面への分子の吸着から生じる減少が防止される。 後者の問題に対処する方法は、グリコーゲンや担体核酸などの担体材料を組み込むことである。

    実施例4:生物学的サンプルへのアッセイの適合化 人為的系を形成するために対照RNA鋳型を固体担体に固定する。 DNA/RNAハイブリッド中のニックを修復可能なT4 DNAリガーゼを用いてアッセイを行う。 対応付けられたスライド上または同一のスライドの異なる部分上でアッセイを行い、一方ではgDNAをアッセイし、他方ではRNAをアッセイする。 gDNAをアッセイする場合、スライドをRNアーゼで前処理することが可能であり、RNAをアッセイする場合、スライドをDNアーゼで前処理する。 gDNAまたはRNAを抽出してそれぞれqPCRまたはRT−qPCRで相対量を定量することにより、アッセイの結果を確認する。

    組織切片RNAアッセイを可能なかぎり情報量の多いものとするため、存在量の範囲にわたり転写物を標的とする特定の組織での発現レベルに関する既存の情報がアッセイデザインで使用される。 アッセイの定量性能特性の初期評価を可能にするために、高存在量の転写物といくつかの中〜低存在量の転写物の両方が標的とされる。

    以上では、本発明の原理を単に例示しているにすぎない。 本明細書に明示的に説明も提示もされていないが、本発明の原理を具現化し、その趣旨および範囲に包含される種々の構成を、当業者であれば、考案できるであろうことはわかるであろう。 さらに、本明細書に挙げられた実施例および条件表現はすべて、本発明の原理およびその技術の促進に本発明者らが寄与する概念を読者が理解するのに役立つように主に意図されたものであり、そのような特定的に挙げられた実施例および条件に限定されないとみなされるものとする。 さらに、本発明の原理、態様、および実施形態、さらにはその特定の実施例を述べた本明細書の記載はすべて、それらの構造的および機能的な等価物の両方を包含するものとする。 そのほかに、そのような等価物は、現在知られている等価物および今後開発される等価物(すなわち、構造にかかわらず同一の機能を発揮する任意の開発される要素)の両方を包含するものとする。 したがって、本発明の範囲は、本明細書に提示および説明された例示的実施形態に制限されるものではない。 もっと正確に言えば、本発明の範囲および趣旨は、添付の特許請求の範囲により具現化される。 以下の特許請求の範囲では、「手段」という用語が用いられていないかぎり、そこに挙げられた特徴または要素はいずれも、米国特許法第条112第6項に準ずる手段+機能の制限を受けるとみなされるべきものではない。

    QQ群二维码
    意见反馈