Design and construction of diverse synthetic peptide and polypeptide libraries |
|||||||
申请号 | JP2013151434 | 申请日 | 2013-07-22 | 公开(公告)号 | JP2013235610A | 公开(公告)日 | 2013-11-21 |
申请人 | Sea Lane Biotechnologies Llc; シー レーン バイオテクノロジーズ, エルエルシー; | 发明人 | LAWRENCE HOROWITZ; RAMESH R BHATT; AARON L KURTZMAN; | ||||
摘要 | PROBLEM TO BE SOLVED: To provide design and construction of diverse synthetic peptide and polypeptide libraries.SOLUTION: The present invention concerns design and construction of diverse peptide and polypeptide libraries. Specifically, the invention concerns methods of analytical database design for creating datasets using multiple relevant parameters as filters, and methods for generating sequence diversity by directed multisyntheses oligonucleotide synthesis. The present methods enable reduction of large complex annotated databases to simpler datasets of related sequences, on the basis of relevant single or multiple key parameters that can be individually directly defined. The methods further enable creation of diverse libraries on the basis of this approach, using multisynthetic collections of discrete and degenerate oligonucleotides to capture the diverse collection of sequences, or portions thereof. | ||||||
权利要求 | 本願明細書に記載された発明。 |
||||||
说明书全文 | 本発明は、多様なペプチドおよびポリペプチドライブラリーの設計および構築に関する。 具体的には、本発明は、複数の関連パラメータをフィルタとして用いてデータセットを作成するための解析データベースを設計する方法と、定方向マルチ合成体オリゴヌクレオチド合成によって配列多様性を生成する方法とに関する。 本方法は、大きく複雑な注釈付きのデータベースを、個別に直接定義することができる関連性のある単一または複数のキーパラメータに基づいて、より単純な関連する配列のデータセットに縮小することを可能にする。 本方法は、多様な配列の集合またはその部分を獲得するための別個および縮重オリゴヌクレオチドのマルチ合成集合を用いて、この手法に基づいて多様なライブラリーを作成することをさらに可能にする。 ペプチドまたはポリペプチドベースの薬剤候補の開発は、しばしば関連するペプチドまたはポリペプチド配列のライブラリーのスクリーニングから始まる。 したがって、治療用抗体候補選択の第1手順は、通常は、高度に多様な抗体配列のライブラリーの作成である。 多様な抗体ライブラリーの設計および構築のためのいくつかの方法は、当該技術分野で既知である。 繊維状ファージベースのコンビナトリアル抗体ライブラリーの多様性は、重鎖および軽鎖遺伝子をシャッフルすることによって(非特許文献1)、あるいは誤りがちのポリメラーゼ連鎖反応(PCR)によってライブラリーにランダム変異を導入することによって(非特許文献2)、増加させることができるということが記載されている。 抗体ライブラリーを生成するための基礎として定義されたフレームワークを使用することは、非特許文献3;非特許文献4;および非特許文献5によって記載されている。 そのほかに、CDR−H3ライブラリーの単一V L遺伝子との組み合わせ(非特許文献6)、V L遺伝子の限られた組との組み合わせ(非特許文献7)、またはV L遺伝子のランダム化されたレパートリーとの組み合わせ(非特許文献8)も報告されている。 また、普遍的またはランダム化免疫グロブリン軽鎖を用いて抗体ライブラリーを作成する方法を記載している特許文献1;特許文献2;特許文献3も参照。 非特許文献9は、HuCAL( Hu man C ombinatorial A ntibody L ibraries(ヒトコンビナトリアル抗体ライブラリー))と称されるヒト抗体ライブラリーの設計および構築への異なる概念を記載している。 この手法は、免疫応答時に頻繁に使用されるヒトV HおよびV Lサブファミリーのそれぞれは、1つのコンセンサスフレームワークによって表され、これは7つの重鎖のHuCALコンセンサス遺伝子と7つの軽鎖のHuCALコンセンサス遺伝子とをもたらし、49の可能な組み合わせを生じるという発見に基づく。 全ての遺伝子は、コドン使用、タンパク質凝集を推進する好ましくない残基、ならびに全てのCDRに隣接する固有および一般的な制限部位を考慮して、全合成によって作製される。 この手法は、必要に応じて異なる抗体フォーマットに変換することができるCDRを含有する、モジュラー抗体遺伝子の生成をもたらす。 HuCAL抗体ライブラリーの設計および合成は、特許文献4;特許文献5;特許文献6;および特許文献7に記載されている。 Kang et al. , Proc. Natl. Acad. Sci. USA, 88:11120−11123, (1991) Gram et al. , Proc. Natl. Acad. Sci. USA, 89:3576−3580, (1992) Barbas et al. , Proc. Natl. Acad. Sci. USA 89:4457−4461 (1992)(randomizing CD3−H3) Barbas et al. , Gene 137:57−62 (2003) (extending randomization to Vκ CDR3) Hayanashi et al. , Biotechniques 17:310 (1994)(simultaneous mutagenesis of antibody CDR regions by overlap extension and PCR) Nissim et al. , EMBO J. 13:692−698 (1994) De Kruif et al. , J. Mol. Biol. 248:97−105 (1995) Griffiths et al. , EMBO J. 13:3245−3260 (1994) Knappik et al. , J. Mol. Biol. 296:57−86 (2000) これらおよびその他の前進にもかかわらず、高度に多様な(ポリ)ペプチド(例えば、抗体)ライブラリーの設計および構築のための新しい効率的な方法への必要性は大きい。 本発明は、多様なペプチドおよびポリペプチドライブラリーの設計および構築に関する 一態様において、本発明は、少なくとも1つの共通配列モチーフを特徴とする関連するアミノ酸配列を含むデータベースの多様性解析の方法であって、 手順(d)において、最小閾値アミノ酸使用頻度は、共通配列モチーフ内のあらゆるアミノ酸位置に対して指定することができる。 特定の一実施形態では、共通配列モチーフ内の大部分のアミノ酸位置に対して、最小閾値アミノ酸使用頻度を指定する。 別の特定の実施形態では、共通配列モチーフ内の全アミノ酸位置に対して、最小閾値アミノ酸使用頻度を指定する。 種々の実施形態において、共通配列モチーフ内の特定のアミノ酸位置に対して指定された最小閾値アミノ酸使用頻度は、同一であっても、あるいは異なってもよい。 さらなる実施形態では、共通配列モチーフ内の大部分のアミノ酸位置に最小合計アミノ酸使用を提供するように、最小閾値アミノ酸使用頻度を設定する。 またさらなる実施形態では、該共通配列モチーフ内の全アミノ酸位置に最小合計アミノ酸使用を提供するように、最小閾値アミノ酸使用頻度を設定する。 最小合計アミノ酸使用は、任意の所望のレベルに設定してもよく、特定の実施形態では、これは少なくとも約40%、または少なくとも約45%、または少なくとも約50%、または少なくとも約55%、または少なくとも約60%、または少なくとも約65%、または少なくとも約70%、または少なくとも約75%、または少なくとも約80%、または少なくとも約85%、または少なくとも約90%である。 別の実施形態では、関連するアミノ酸配列は抗体配列である。 さらに別の実施形態では、関連するアミノ酸配列は、抗体重鎖配列を含む。 さらなる実施形態では、関連するアミノ酸配列は、抗体軽鎖配列を含む。 関連するアミノ酸配列が抗体配列である場合、共通配列モチーフは、例えば、CDR1、CDR2、またはCDR3配列などのCDR配列でよい。 本発明の方法の手順(b)において使用できるフィルタの性質または数には制限はない。 特定の実施形態において、抗体配列の場合、フィルタの既定の組み合わせは、(1)抗体重鎖または軽鎖のアイソタイプ、(2)CDR1、CDR2、およびCDR3配列のうち1つ以上の長さ、(3)1つ以上のCDR1、CDR2、およびCDR3配列内の1つ以上の既定の位置における、1つ以上の既定のアミノ酸残基の存在、(4)フレームワークのタイプ、(5)抗体が結合する抗原、(6)抗体の親和性、および(7)CDR配列外の位置によるアミノ酸残基、からなる群から選択できる。 さらなる実施形態では、抗体重鎖および/または軽鎖のCDR1、CDR2、およびCDR3配列のうちの少なくとも1つは、サイズが適合する。 このパラメータは、例えば、追加フィルタとして、抗体重鎖および/または軽鎖配列のアイソタイプと組み合わせることができる。 種々の実施形態において、位置によるアミノ酸使用頻度は、少なくとも約3%、または少なくとも約5%、または少なくとも約10%、または少なくとも約15%であるか、あるいは約3%〜約15%、または約5%〜約10%に設定する。 本発明の方法の別の実施形態では、同じ位置によるアミノ酸使用頻度が、該CDR配列内の各アミノ酸を特徴付ける。 代替実施形態では、位置によるアミノ酸使用頻度は、該CDR配列内の少なくとも2つのアミノ酸残基において異なる。 別の実施形態では、フィルタの既定の組み合わせは、フレームワークのタイプを含む。 さらに別の実施形態では、抗体重鎖および軽鎖配列の双方が解析される。 場合により、抗体重鎖配列は、既定の抗体軽鎖の特徴と対にされる、あるいは抗体軽鎖配列は、既定の抗体重鎖の特徴と対にされる。 さらなる実施形態では、関連する抗体配列は、少なくとも1つの機能性抗体に由来する。 またさらなる実施形態では、本発明の方法の手順(b)で適用されるフィルタのうちの少なくとも1つは、機能性抗体の重鎖および/または軽鎖のフレームワーク配列に最も類似する生殖系列配列である。 限定はされないが、機能性抗体は、例えば、細胞表面および可溶性受容体、サイトカイン、成長因子、酵素、プロテアーゼ、およびホルモンからなる群から選択されるポリペプチドに結合する。 したがって、抗体は、サイトカイン、例えばIL−1、IL−2、IL−3、IL−4、IL−5、IL−6、IL−10、IL−11、IL−12、IL−15、IL−17、IL−18、IL−23、およびそれらのそれぞれのファミリーメンバーなどのインターロイキンに結合してもよい。 あるいは、サイトカインは、例えば、インターフェロン−α、−β、および−γ(IFN−α、−β、および−γ)、腫瘍壊死因子−αおよび−β(TNF−αおよび−β)、TWEAK、RANKL、BLys、RANTES、MCP−1、MIP−1α、MIP−1β、SDF−1、コロニー刺激因子(CSF)、顆粒球コロニー刺激因子(G−CSF)、および顆粒球マクロファージコロニー刺激因子(GMCSF)からなる群から選択されてもよい。 抗体が結合するポリペプチドは、成長因子であってもよく、これには神経成長因子(NGF)、インスリン様成長因子1(IGF−1)、上皮成長因子(EGF)、血小板由来成長因子(PDGF)、血管内皮成長因子(VEGF)、胎盤成長因子(PLGF)、組織成長因子−α(TGF−α)、および組織成長因子−β(TGF−β)が含まれるが、これらに限定されない。 別の実施形態では、機能性抗体は、例えばDig、Bio、DNP、またはFITCなどのハプテンに結合する。 本明細書における方法のさらに別の実施形態では、関連するアミノ酸配列は、分泌タンパク質または細胞外タンパク質のファミリーメンバーに由来するが、これは例えばサイトカインでよい。 具体的な実施形態では、サイトカインはインターフェロン−αであり、関連するアミノ酸配列は、IFN−αサブタイプの配列である。 特定の実施形態において、本発明は、同定されたデータセットを活用して設計された関連するアミノ酸配列の物理的ライブラリーを合成する手順をさらに含む。 本方法のある実施形態では、ライブラリーは、定義されたアミノ酸のみが生成されるように、別個のいくつかの定義されたオリゴヌクレオチドまたは縮重オリゴヌクレオチドを生成することによって合成される。 さらなる実施形態では、産生された物理的ライブラリーの多様性は、同定されたデータセットの物理的表現であるライブラリーの多様性を上回る。 これは、例えば、最小閾値アミノ酸使用頻度を満たさない少なくとも1つのアミノ酸も該多様性を提供するために合成されることに起因しうる。 またさらなる実施形態では、作成された物理的ライブラリーの多様性は、同定されたデータセットの物理的表現であるライブラリーの多様性を下回る。 これは、例えば、最小閾値アミノ酸使用頻度を満たす全アミノ酸が合成されるとは限らないことに起因しうる。 別の実施形態では、データセットは、抗体重鎖および/または軽鎖配列を含むが、これには1つ以上のCDRを含んでよい。 さらに別の実施形態では、CDRは、フレームワーク配列の骨格中にクローニングされるが、これは場合により、該CDRを含むデータベース内で最も頻繁に使用されるフレームワーク配列であってもよい。 物理的ライブラリーは、全ての原核および真核発現系含む、任意の発現系を用いて発現することができる。 具体的な実施形態では、物理的ライブラリーは、ファージミドディスプレイ、mRNAディスプレイ、微生物細胞ディスプレイ、哺乳動物細胞ディスプレイ、マイクロビーズディスプレイ技法、抗体アレイ、またはタンパク質−DNA結合に基づくディスプレイを用いて発現およびディスプレイされる。 本発明の別の実施形態では、ライブラリーは、そのメンバーの1つ以上の化学的および/または生物学的特性をスクリーニングされる。 かかる特性には、半減期、効力、有効性、結合親和性、および免疫原性が含まれるが、これらに限定されない。 さらに別の実施形態では、アミノ酸側鎖の多様性は、1つ以上のアミノ酸位置においてライブラリーのメンバーに導入される。 特定の実施形態では、アミノ酸側鎖の多様性は、1つ以上の該アミノ酸位置において、アミノ酸残基に少なくとも2つの異なる側鎖化学官能基を提供することによって導入される。 別の実施形態では、全アミノ酸の化学的性質の少なくとも30%、または少なくとも50%、または少なくとも55%、または少なくとも60%が、各アミノ酸位置において表わされる。 好ましくは、アミノ酸の該側鎖多様性は、コンビナトリアル縮重オリゴヌクレオチド合成を用いて導入される。 別の態様では、本発明は、ペプチドまたはポリペプチド配列のコンビナトリアルライブラリーを産生する方法であって、コンビナトリアルオリゴヌクレオチド合成を用いて、ペプチドまたはポリペプチド配列の2つ以上のアミノ酸位置に、アミノ酸側鎖の化学的多様性を導入する手順を含む方法に関する。 一実施形態において、アミノ酸側鎖の化学的多様性は、該ペプチドまたはポリペプチド配列の天然の多様性を模倣するように設計される。 ライブラリーは、抗体ライブラリーを含むがこれに限定されない、任意のタイプのライブラリーであってもよい。 具体的な実施形態では、抗体ライブラリーは、抗体の重鎖可変ドメイン配列を含む。 別の実施形態では、ライブラリーは、抗体の軽鎖可変ドメイン配列を含む。 さらに別の実施形態では、ライブラリーは、コンビナトリアル一本鎖可変フラグメント(scFv)ライブラリーである。 さらなる実施形態では、抗体ライブラリーは、Fab、Fab'、またはF(ab') 2フラグメントのライブラリーである。 κのCDR1、2、および3の頻度解析;位置による絶対使用の決定を示す。 κのCDR1、2、および3の頻度解析;位置による絶対使用の決定を示す。 κ 1軽鎖の閾値解析である。 使用10%を下回る個々のアミノ酸は報告されない。 κ 1軽鎖の閾値解析である。 使用10%を下回る個々のアミノ酸は報告されない。 κ 1軽鎖の閾値解析である。 使用5%を下回る個々のアミノ酸は報告されない。 κ 1軽鎖の閾値解析である。 使用5%を下回る個々のアミノ酸は報告されない。 H 3重鎖合成ライブラリーの閾値解析(長さ10残基)である。 閾値使用率は、各アミノ酸位置に対して個別に設定されており、これは3%〜10%である。 κ 1軽鎖合成ライブラリーの多様性を示す。 κ 1軽鎖合成ライブラリーの多様性を示す。 H 3のCDR1およびCDR2の頻度解析を示す。 H 3のCDR1およびCDR2の頻度解析を示す。 H 3重鎖合成ライブラリーの多様性を示す。 H 3重鎖合成ライブラリーの多様性を示す。 H 3重鎖合成ライブラリー多様性の設計を示す。 H 3重鎖合成ライブラリー多様性の設計を示す。 L 1フレームワークのハプテン解析を示す。 A. 定義 特に定めのない限り、本明細書において使用される技術用語および科学用語は、本発明が属する技術分野における通常の知識を有する者が通常理解するのと同じ意味を有する。 Singleton et al. , Dictionary of Microbiology and Molecular Biology 2nd ed. , J. Wiley & Sons (New York, N.Y. 1994)は、当業者に、本出願において使用される用語の多くの概括的指針を与える。 当業者は、本発明を実施する際に使用しうる、本明細書において記載されるものと同様または同等の多くの方法および材料に気付くであろう。 実際に、本発明は、記載される方法および材料に決して限定されない。 本発明の目的上、以下の用語を下記に定義する。 「共通配列モチーフ」という表現は、本明細書において最も広い意味で用いられ、2つ以上のペプチドまたはポリペプチド配列の間で共通するアミノ酸残基のパターンを指して用いられる。 配列モチーフは、本発明の詳細な説明に記載されるものなどの様々なパターン発見アルゴリズムによって、容易に同定することができる。 本発明の文脈において、「抗体」(Ab)という用語は、最も広い意味で用いられ、特定の抗原に対して結合特異性を示す免疫グロブリン、ならびに抗原特異性を欠く免疫グロブリンおよびその他の抗体様分子を含む。 後者の種類のポリペプチドは、例えば、リンパ系により低レベルで生成され、骨髄腫により増加したレベルで生成される。 本出願において、「抗体」という用語は、モノクローナル抗体、ポリクローナル抗体、および抗体フラグメントを具体的に対象とするが、これらに限定されない。 「天然抗体」は、通常は、2つの同一の軽(L)鎖と2つの同一の重(H)鎖とから構成される、約150,000ダルトンのヘテロ四量体糖タンパク質である。 各軽鎖は、共有ジスルフィド結合によって重鎖に連結されるが、ジスルフィド連鎖の数は、異なる免疫グロブリンアイソタイプの重鎖間で異なる。 また、各重鎖および軽鎖は、規則的な間隔の鎖内ジスルフィド架橋を有する。 各重鎖は、一端に可変ドメイン(V H )を有し、それにいくつかの定常ドメインが続く。 各軽鎖は、一端に可変ドメイン(V L )を、その他端に定常ドメインを有し、軽鎖の定常ドメインは重鎖の第1定常ドメインと並び、軽鎖の可変ドメインは重鎖の可変ドメインと並んでいる。 特定のアミノ酸残基は、軽鎖および重鎖の可変ドメイン間の界面を形成すると考えられている(Chothia et al., J. Mol. Biol. 186:651 (1985);Novotny and 抗体鎖に関する「可変」という用語は、抗体間で配列が大きく異なり、各特定の抗体のその特定の抗原への結合および特異性に関与する、抗体鎖の部分を指して用いられる。 かかる可変性は、軽鎖および重鎖の可変ドメインの双方における超可変領域と呼ばれる3つのセグメントに集中している。 可変ドメインのより高度に保存される部分は、フレームワーク(FR)と呼ばれる。 天然の重鎖および軽鎖の可変ドメインは、それぞれ4つのFR(それぞれFR1、FR2、FR3、およびFR4)を含み、主としてβ−シート配置をとり、β−シート構造を接続するかあるいは場合によりその一部を構成するループを形成する3つの超可変領域によって接続される。 各鎖における超可変領域は、FRによって近接して一緒に保持され、他方の鎖の超可変領域とともに、抗体の抗原結合部位の形成に貢献する(Kabat et al., Sequences of Proteins of Immunological Interest, 5th Ed. Public Health Service, National Institutes of 「超可変領域」という用語は、本明細書において用いられる場合、抗原結合に関与する抗体のアミノ酸残基を指す。 超可変領域は、「相補性決定領域」または「CDR」からのアミノ酸残基を含む(すなわち、軽鎖可変ドメイン中の残基30〜36(L1)、46〜55(L2)、および86〜96(L3)、ならびに重鎖可変ドメイン中の30〜35(H1)、47〜58(H2)、および93〜101(H3);MacCallum et 「フレームワーク領域」という用語は、より相違するCDR領域の間に存在する、当該技術分野で認められる抗体可変領域の部分を指す。 かかるフレームワーク領域は、典型的には、フレームワーク1〜4(FR1、FR2、FR3、およびFR4)と称され、三次元空間において、重鎖または軽鎖抗体可変領域に見られる3つのCDRを保持するための骨格を提供し、それによってCDRは抗原結合表面を形成することができる。 抗体は、その重鎖の定常ドメインのアミノ酸配列に応じて、異なるクラスに指定することができる。 抗体には、IgA、IgD、IgE、IgG、およびIgMの5つの主要なクラスがあり、それらのうちのいくつかは、例えばIgG1、IgG2、IgG3、IgG4、IgA、およびIgA2などのサブクラス(アイソタイプ)にさらに分類できる。 免疫グロブリンのこれらの異なるクラスに相当する重鎖定常ドメインは、それぞれα、δ、ε、γ、およびμと呼ばれる。 任意の脊椎動物種からの抗体の「軽鎖」は、それらの定常ドメインのアミノ酸配列に基づいて、カッパ(κ)およびラムダ(λ)と呼ばれる明確に区別できる2つの型のうちの1つに指定することができる。 「抗体フラグメント」は、全長抗体の一部、一般的にはその抗原結合または可変ドメインを含む。 抗体フラグメントの例には、Fab、Fab'、F(ab') 2 、およびFvフラグメント、線状抗体、一本鎖抗体分子、二重特異性抗体、および抗体フラグメントから形成された多特異性抗体が含まれるが、これらに限定されない。 「モノクローナル抗体」という用語は、B細胞の単一クローンによって合成された抗体分子を指して用いられる。 「モノクローナル」という修飾語は、実質的に均質な抗体の集団から得られた抗体の特徴を示し、特定の方法による抗体の生成を必要とすると解釈されるものではない。 したがって、モノクローナル抗体は、Kohler and Milsteinによって最初に記載されたハイブリドーマ法(Nature 256:495 (1975);Eur. J. Immunol. 6:511 (1976))により、組換えDNA技法によって作製することができ、あるいはファージ抗体ライブラリーから単離することもできる。 「ポリクローナル抗体」という用語は、B細胞の集団によって合成された抗体分子の集団を指して用いられる。 「一本鎖Fv」または「sFv」抗体フラグメントは、抗体のV HおよびV Lドメインを含み、これらのドメインは、単一のポリペプチド鎖中に存在する。 一般的に、Fvポリペプチドは、V HとV Lドメインとの間にポリペプチドリンカーをさらに含み、それによりsFvは、抗原結合に望ましい構造を形成することができる。 sFvの概説については、The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds. Springer−Verlag, New York, (1994)の269〜315ページ、Pluckthunを参照。 一本鎖抗体は、例えば、WO 88/06630号およびWO 92/01047号に開示されている。 本明細書において用いられる「抗体結合領域」という用語は、1つ以上の抗原を結合することができる、免疫グロブリンまたは抗体可変領域の1つ以上の部分を指す。 典型的には、抗体結合領域は、例えば、抗体軽鎖(VL)(またはその可変領域)、抗体重鎖(VH)(またはその可変領域)、重鎖Fd領域、組み合わされた抗体軽鎖および重鎖(またはその可変領域)であるFab、F(ab') 2 、単一ドメイン、または一本鎖抗体(scFv)など、あるいは全長抗体、例えばIgG(例えば、IgG1、IgG2、IgG3、またはIgG4サブタイプ)、IgA1、IgA2、IgD、IgE、またはIgM抗体などである。 「閾値出現頻度」という用語は、本明細書におけるライブラリーで用いるために選択される配列が、発現に有利な配列であると決定された配列に由来することを要求する、本発明の基準を指す。 要求される多様性の程度、ライブラリーの所望のサイズなどの最終的な目標に応じて、「閾値出現頻度」を異なるレベルに設定することができる。 「アミノ酸」または「アミノ酸残基」という用語は、典型的には、当該技術分野で認められる定義を有するアミノ酸を指し、例えば、アラニン(Ala)、アルギニン(Arg)、アスパラギン(Asn)、アスパラギン酸(Asp)、システイン(Cys)、グルタミン(Gln)、グルタミン酸(Glu)、グリシン(Gly)、ヒスチジン(His)、イソロイシン(Ile)、ロイシン(Leu)、リジン(Lys)、メチオニン(Met)、フェニルアラニン(Phe)、プロリン(Pro)、セリン(Ser)、トレオニン(Thr)、トリプトファン(Trp)、チロシン(Tyr)、およびバリン(Val)からなる群から選択されるアミノ酸などであるが、所望の場合、修飾、合成、または希少アミノ酸も使用してよい。 したがって、37 CFR 1.822(b)(4)に記載される修飾および異常アミノ酸は、具体的に本定義に含まれ、参考として本明細書で特に援用される。 アミノ酸は、種々のサブグループにさらに分類することができる。 したがって、アミノ酸は、非極性側鎖(例えば、Ala、Cys、Ile、Leu、Met、Phe、Pro、Val);負荷電側鎖(例えば、Asp、Glu);正荷電側鎖(例えば、Arg、His、Lys);または非荷電極性側鎖(例えば、Asn、Cys、Gln、Gly、His、Met、Phe、Ser、Thr、Trp、およびTyr)を有するとしてグループ化することができる。 アミノ酸は、小型のアミノ酸(Gly、Ala)、求核性アミノ酸(Ser、His、Thr、Cys)、疎水性アミノ酸(Val、Leu、Ile、Met、Pro)、芳香族アミノ酸(Phe、Tyr、Trp、Asp、Glu)、アミド(Asp、Glu)、および塩基性アミノ酸(Lys、Arg)としてもグループ化することができる(図25を参照)。 「保存アミノ酸残基」という用語は、比較される2つ以上のアミノ酸配列における所定の残基位置に対して、典型的には少なくとも50%以上(例えば、約60%、70%、80%、90%、95%、またはそれ以上)の高い頻度で出現することが決定されたアミノ酸残基を指す。 「半保存アミノ酸残基」という用語は、所定の残基位置が比較される2つ以上のアミノ酸配列の間で、高い頻度で出現すると決定されたアミノ酸残基(複数)を指す。 2〜3個の残基、好ましくは2個の残基が合わせて約40%以上(例えば、50%、60%、70%、80%、90%、またはそれ以上)の頻度で示される場合、それらの残基は、半保存であると決定される。 「可変アミノ酸残基」という用語は、所定の残基位置が比較される2つ以上の配列の間で、可変頻度で生じると決定されたアミノ酸残基を指す。 多数の残基が所定の位置に現すれる場合、その残基位置は、可変であると決定される。 「可変性プロファイル」という用語は、抗体のCDR内など、ポリペプチド配列内の特定のアミノ酸位置に存在する、アミノ酸およびその個別の出現頻度の列挙を指す。 「ポリヌクレオチド」という用語は、DNA分子およびRNA分子などの核酸、ならびにそれらの類似体(例えば、ヌクレオチド類似体を用いて、あるいは核酸化学を用いて生成したDNAまたはRNA)を指す。 必要に応じて、ポリヌクレオチドは、例えば、当該技術分野において認められる核酸化学を用いて合成的に作製しても、あるいは例えばポリメラーゼを用いて酵素的に作製してもよく、また所望であれば修飾してもよい。 典型的な修飾には、メチル化、ビオチン化、および当該技術分野において既知のその他の修飾が含まれる。 さらに、核酸分子は、一本鎖または二本鎖でよく、所望の場合は、検出可能部分に連結していてもよい。 「突然変異誘発」という用語は、特別の定めのない限り、ポリヌクレオチドまたはポリペプチド配列を変更するための当該技術分野において認められる任意の技法を指す。 好ましい種類の突然変異誘発には、誤りがちなPCR突然変異誘発、飽和突然変異誘発、またはその他の部位特異的突然変異誘発が含まれる。 「ベクター」という用語は、細胞内で自己複製ができ、また例えば遺伝子またはポリヌクレオチドなどのDNAセグメントを効果的に連結させて、付着したセグメントの複製をもたらすことができるrDNA分子を指して用いられる。 1つ以上のポリペプチドをコードする遺伝子の発現を指示することができるベクターは、本明細書において、「発現ベクター」と称する。 本明細書において用いられる「プライマー」という用語は、核酸の制限消化反応物から精製されたものか、あるいは合成的に産生されたものかに関わらず、核酸鎖に相補的なプライマー伸長産物の合成が誘導される条件下に置かれたとき、核酸合成の開始点としての機能を果たすことができるポリヌクレオチドを指す。 かかる条件には、好適な温度およびpHでの、ヌクレオチドおよびDNAポリメラーゼ、逆転写酵素などの存在を含んでもよい。 プライマーは、好ましくは一本鎖であるが、二本鎖型であってもよい。 プライマーは、重合剤の存在下で伸長産物の合成を刺激するために十分長くなくてはならない。 プライマーの正確な長さは、標的配列の複雑さ、温度、およびプライマー源を含む多くの要因に依存するであろう。 プライマーは、典型的には、約15〜約25ヌクレオチドを含有するが、より短いプライマーおよびより長いプライマーも使用できる。 短いプライマーは、一般に、テンプレートと安定複合体を形成するのにより低い温度を必要とする。 「ファージディスプレイライブラリー」は、ファージコートタンパク質との融合体としてクローン化タンパク質配列の集合を発現するタンパク質発現ライブラリーである。 したがって、「ファージディスプレイライブラリー」という表現は、本明細書において、ファージが外部(典型的には異種)タンパク質を発現する、ファージ(例えば、繊維状ファージ)の集合を指す。 外部タンパク質は、ファージが接触する他の部分と自由に相互作用(結合)することができる。 外部タンパク質をディスプレイする各ファージは、ファージディスプレイライブラリーの「メンバー」である。 「抗体ファージディスプレイライブラリー」は、抗体または抗体フラグメントをディスプレイするファージディスプレイライブラリーを指す。 抗体ライブラリーには、ファージの集団、またはかかるファージの集団をコードするベクターの集合、あるいはかかるファージもしくはベクターの集合を有する1つ以上の細胞が含まれる。 このライブラリーは、ファージ粒子1個当たり平均1つの一本鎖抗体または抗体フラグメントをディスプレイする一価であっても、あるいはウイルス粒子1個当たり平均2つ以上の抗体または抗体フラグメントをディスプレイする多価であってもよい。 「抗体フラグメント」という用語は、一本鎖Fv(scfv)フラグメントおよびFabフラグメントを含むが、これらに限定されない。 好ましい抗体ライブラリーは、平均10 6を超える、または10 7を超える、または10 8を超える、または10 9を超える異なるメンバーを含む。 「繊維状ファージ」という用語は、その表面に異種ポリペプチドをディスプレイできるウイルス粒子を指し、これにはf1、fd、Pf1、およびM13が含まれるが、これらに限定されない。 繊維状ファージは、テトラサイクリン(例えば、「fd−tet」)などの選択可能なマーカーを含んでもよい。 種々の繊維状ファージディスプレイ系が当業者に周知である(例えば、Zacher et al. Gene 9: 127−140 「パニング」という用語は、標的への高い親和性および特異性を有する抗体などの化合物を担持するファージの同定および単離の際の、複数ラウンドのスクリーニングプロセスを指して用いられる。 KabatデータベースおよびKabatの慣例を用いた抗体配列解析に関する情報は、例えば、Johnson et al. , The Kabat database and a bioinformatics example, Methods Mol. Biol. 2004; 248: 11−25;およびJohnson et al. , Preferred CDRH3 lengths for antibodies with defined specificities, Int Immunol. 1998, Dec; 10(12):1801−5などで見出されるであろう。 Chothiaの慣例を用いた抗体配列解析に関する情報は、例えば、Chothia
次の手順では、同定された1つ以上の配列モチーフを互いにアラインメントし、各データセットがアラインメントされた配列モチーフのうちの1つ以上に特有の既定のパラメータの組み合わせを共有することを特徴とする、別々のデータセットにさらに分割する。 かかるパラメータは、例えば、長さ、特定の配列モチーフが属するサブファミリー、配列が由来する種、生物学的機能などである。 次に、2つ以上のパラメータの所定の組み合わせを特徴とするデータセットをアミノ酸使用頻度について位置によって解析して、データセット内の個々の一続きのアミノ酸における主要なアミノ酸使用を同定する。 配列モチーフのアラインメントは、当該技術分野内にある種々の方法で達成できるが、これには例えば、公的に入手可能なコンピュータソフトウェアである、BLAST、BLAST−2、ALIGN、またはMegalign(DNASTAR)ソフトウェアなどの使用が挙げられる。 当業者は、比較される配列の全長にわたって最大アラインメントを達成するために必要とされる任意のアルゴリズムを含み、アラインメントを測定するための適当なパラメータを決定することができる。 アミノ酸使用頻度の決定は、高度(典型的には少なくとも50%)の出現、および好ましくは完全な、所定の位置(保存アミノ酸残基)のデータセットの全メンバーにおける同一性、または所定の残基位置へのデータセットの2つ以上のメンバー(好ましくは大部分)におけるアミノ酸残基の出現に基づいてよい。 次に、1つ以上の追加パラメータを特徴とする追加データセットを作成することができるが、これらは必ずしも配列が関連していなくてもよい。 例えば、目標が多様な抗体ライブラリーの設計である場合、非冗長再構成抗体配列を含有する電子データベースであるKabatデータベースに存在する抗体重鎖および軽鎖のCDR配列は、既定のパラメータの固有の組み合わせ(フィルタ)を用いて、位置による頻度について解析することができる。 Kabatデータベースは、抗体タンパク質配列を含有し、これらは提出時に注釈が付けられる。 Kabatデータベースからの情報は、他の環境、例えばMicrosoft Accessデータベースなどにインポートすることができるが、それによりフィルタを簡便に適用することができ、また、結果を例えばExcelを含む別の任意のソフトウェアを用いて表にし、さらに解析することができる。 本発明の手法は、多様なパラメータ(フィルタ)およびパラメータ(フィルタ)の組み合わせを用いて、抗体重鎖および軽鎖配列の双方を同時にフィルタ処理することを可能にする。 したがって、個々の重鎖についての多様性データセットの生成を軽鎖の選定制限に関連付けることができる。 例えば、抗体の重鎖CDR配列を解析するためのフィルタは、(1)ある軽鎖タイプ(例えばカッパ(κ)またはラムダ(λ))との対合;(2)CDRサイズ(例えば、CDR1=6残基;CDR2=13残基);および(3)CDR3サブファミリー(例えば、V H 1対V H 3)のうちの1つ以上を含んでもよい。 軽鎖では、全てのCDRはサイズが適合してもよい。 例えば、CDR1=7、CDR2=10、およびCDR3=8アミノ酸残基であることを既定することができる。 追加として、あるいは代替として、軽鎖は、軽鎖サブファミリーのタイプ(例えば、κ1またはκ3サブファミリー)に基づいてフィルタ処理(さらに分割)してもよい。 したがって、例えば、重鎖の多様性解析はκ軽鎖との対合に基づいて実施できるが、解析は、V κ 3サブファミリーの軽鎖と対合する重鎖配列に、または8アミノ酸の長さを含有するCDR3を有するκ軽鎖に、あるいは両者の組み合わせにさらに制限することもできる。 抗体重鎖および/または軽鎖の共変解析のための追加フィルタには、アイソタイプ、抗原タイプ、親和性、および/またはCDRと関連のない位置による残基、あるいは抗体鎖のタイプもしくはサブタイプを含んでよいが、これらに限定されない。 さらに、本発明は、「生産的」な重鎖および軽鎖の対合に基づいた、テーマに沿ったライブラリーの設計を可能にする。 したがって、市販の抗体を含む、同じ抗原への種々の抗体に多様性解析を行なって、ヒトの治療において成功する可能性が最も高い抗体を同定することができる。 目標が、生産的な重鎖および軽鎖の対合に基づく、テーマに沿った抗体ライブラリーの設計である場合、選択された抗原に対して、1つ以上の生産的な(例えば、市販の)抗体を選択する。 次に、重鎖および軽鎖の生殖系列の起源を決定し、同じタイプの重鎖および軽鎖のCDR配列(例えば、V H 3、V κ 1)に上述のタイプの多変量解析を行なって、多様性データセットを作成する。 好ましくは、解析は、サイズが適合するCDRのみに基づくべきである。 本発明の方法では、アラインメントおよびフィルタの適用後、位置による解析を行なって、前もって作成されたデータセット内の個々のアミノ酸またはアミノ酸のグループの位置による頻度を決定し、CDR多様性データセットなどの多様性データセットを生成する。 対象とされる各アミノ酸位置への絶対的な位置によるアミノ酸使用を決定したあと、アミノ酸の使用率および合計使用への閾値を下げて、より広い適用範囲の多様性に対応することができる。 したがって、例えば、必要な総適用範囲は80%を超え、個々のアミノ酸が10%未満とならないように設定することができる。 in silicoモデリングは、関連性のある任意の情報源、例えば、遺伝子およびタンパク質配列、および三次元データベース、および/または抗体など、以前に試験したポリペプチドからの結果などの追加モデリング情報を用いて、継続的に更新することができ、それによりin silicoデータベースは、その予測能力がより正確になる。 さらに、in silicoサブセットは、結合親和性/結合活性の結果などの生物検定の結果、以前に試験した抗体の生物活性で補完することができる。 このようにして、構造的特色を、目的の用途に期待される能力とより密接に相関させることが可能である。 CDR多様性データセットの設計に続き、要求される多様性を提供するコンビナトリアル(縮重)オリゴヌクレオチド配列の集合を合成し、好適なテンプレートを背景に、その集合をクローニングする。
本明細書においてペプチドまたはポリペプチドライブラリーを作成する際の第1手順は、位置による集合全体を含有するように多重合成するためのアミノ酸の集合の逆翻訳である。 逆翻訳ツールは、当該技術分野で周知であり、市販されている。 例えば、Entelechon(ドイツ)のJava(登録商標)ベースの逆翻訳ツールは、タンパク質を適合されたコドン使用を有するヌクレオチド配列に翻訳し、特定の生物における発現に配列を最適化させる。 好ましい実施形態では、本発明の方法は、別個および縮重オリゴヌクレオチドの組を合成できる自動逆翻訳アルゴリズムを使用して、in silico解析によって作成された多様性表を表現する。 このアルゴリズムは、特定のコドンを含んでも、あるいは含まなくてもよく、また非等モルの縮重を組み込んで、データセットの多様性だけでなく、相対分布もより正確に実現することができる。 必要とされるオリゴヌクレオチドの数は、縮重塩基を選択して、頻繁に使用されるアミノ酸のうちの1つを超えるものを一度で同時にコードすることによって制限することができる。 さらに、かかる縮重塩基を制限して、対象とされる種の希少コドンを避けることができる。 例えば、集合を大腸菌の中で合成する場合、希少アルギニンコドン使用を大腸菌に用いることは、逆翻訳において制限される。 さらに、全アミノ酸が同じ頻度で使用されるとは限らないことは知られている。 したがって、非等モルの混合物を使用して、仮想(in silico)多様性表のプロファイルをより正確に反映することができる。 位置による多様性が所望するよりも多くのオリゴヌクレオチドの合成を要求する場合、多様性を化学プローブ集合を用いて任意に定義することができる。 したがって、アミノ酸側鎖の化学的性質をアミノ酸のサブセット内で獲得してもよく、小型、疎水性、芳香族、塩基性、酸性、アミド、求核性などのアミノ酸が、かかるサブセットを構成できる。 実施例が説明するように、かかる化学的に探索された多様性の位置は、別の状況では要求されるよりもはるかに少ない数のオリゴヌクレオチドを用いて合成することができる。 化学的に探索された多様性は、天然の多様性の大半を包含し、広範な相互作用的な化学的性質を提供する。 本発明の多様な抗体ライブラリーを構築するとき、修飾アミノ酸残基、例えば、ほとんどのポリペプチドに用いられる従来の20種のアミノ酸以外の残基で、例えばホモシステインなどを、所望であれば、CDRなどの抗体配列に組み込むことができる。 これは当該技術分野において認められる技法を用いて実行できるが、典型的には、修飾アミノ酸残基が望まれるポリヌクレオチドに終止コドンを導入する。 この技法は、次に、ポリペプチドに組み込まれる修飾アミノ酸に連結された修飾tRNA(例えばアンバー、オパール、またはオーカー終止コドンのいわゆるサプレッサーtRNA)を提供する(例えば、Kohrer et al., PNAS, 98, 14310−14315 (2001)を参照)。 好ましい実施形態では、上記の手順のうちの1つ以上は、コンピュータを利用する。 特定の実施形態では、コンピュータを利用した手順は、例えば、Kabatデータベースのマイニング、および場合により、Vbase配列ディレクトリの結果(Tomlinson, I M. et al., .VBASE Sequence Directory. Cambridge, U.K.: MRC Centre for Protein Engineering; 1995)との相互参照を含む。 本発明の方法は、様々な手順を実行するためのソフトウェア(例えば、コンピュータ可読命令)およびハードウェア(例えば、コンピュータ、ロボット、およびチップ)を含むハイスループット手法に修正可能である。 本明細書においてライブラリーを生成するためのオリゴヌクレオチドは、DNA合成の既知の方法によって合成できる。 既知の合成方法には、ホスホラミダイト化学(Beaucage and Caruthers, Tetrahedron Letts., 22(20):1859 1862 (1981))が含まれるが、これは、例えばNeedham−VanDevanter et al. (Nucleic Acids Res., 12:6159 6168 (1984))に記載されるように、自動合成機を用いて、特に最も一般的な40〜80bpのサイズ範囲で、効果的なオリゴ調製を可能にする。 さらに、オリゴヌクレオチドは、トリエステル法、ホスファイト法、およびH−ホスホネート法などによって合成できるが、これらは全て当該技術分野で周知である。 オリゴヌクレオチド合成方法の概説は、例えば、「Oligonucleotide Synthesis: A Practical Approach」, ed. M. J. Gait, JRL Press, New York, N. Y. (1990)を参照されたい。 オリゴヌクレオチドは、様々な市販用供給元に特注もできるが、これには例えば、The Midland Certified Reagent Company(米国テキサス州ミッドランド)、The Great American Gene Company(米国ユタ州ソルトレイクシティ)、ExpressGen Inc. (米国イリノイ州シカゴ)、Operon Technologies Inc. (米国カリフォルニア州アラメダ)などがある。 ライブラリーが抗体ライブラリーである場合、次の手順において、多様性をフレームワーク中にクローニングして、多様な抗体ライブラリーを作成する。 フレームワーク骨格は、当該技術分野で周知の方法によって選択することができる。 したがって、データベース内で最も頻繁に使用されるフレームワークを骨格として使用するために選定し、多様性を生殖系列フレームワーク中にクローニングする。 フレームワーク配列を選択するために、特定の抗原に反応して発現されたことを決定された全ての使用可能なフレームワーク骨格のサブセットを配列する。 所定の抗原クラスに反応して本来最も頻繁に発現されるフレームワークを決定することによって、適当なフレームワークアクセプターを選択する。 例えば、タンパク質ベースの抗原に反応して発現される好ましいアクセプターフレームワークを決定するために、Kabatデータベースで「タンパク質を標的とする」フレームワーク検索する。 異なる抗原クラスに対するCDRを提示するために好ましいアクセプター配列が必要な場合、および/または、特定の種のアクセプター配列が必要な場合、それに応じてKabatタンパク質配列フィルタを設定する。 したがって、タンパク質ベースの標的に対するヒト治療法として使用する配列を決定するために、タンパク質/ペプチド抗原を認識するヒト抗体配列のみに焦点を合わせるようにフィルタを設定する。 これは、結果を偏らせるデータセットおよび配列情報の冗長性を大きく減少させる。 かかる解析は、V H 、V κ 、および/またはV λ遺伝子にも同様に実施できる。 多様な集合を標的特異的アクセプター上に組み込んで、抗体エンジニアリングのための変異体集合を生成することができる。 生成されたCDRの多様性は、ポリメラーゼ連鎖反応(PCR)などの当該技術分野で既知の方法によって、フレームワーク領域に組み込むことができる。 例えば、オリゴヌクレオチドは、伸長用プライマーとして使用できる。 この手法では、CDRなどの定義された領域(またはその部分)に対応する突然変異誘発性カセットをコードするオリゴヌクレオチドは、少なくとも部分的に互いに相補的であり、例えばTaqポリメラーゼなどのポリメラーゼを用いて、伸長させて大きい遺伝子カセット(例えば、scFv)を形成することができる。 別の手法では、部分的に重複するオリゴヌクレオチドを設計する。 内部オリゴヌクレオチドをそれらの相補鎖にアニーリングして、さらなるアニーリングに有用な一本鎖伸長部を有する二本鎖DNA分子を生じる。 次に、PCRを用いて、アニーリングされた対を混合し、伸長させて、ライゲートし、全長二本鎖分子を形成することができる。 好適なベクター中にクローニングするために、合成遺伝子の端部付近に便利な制限部位を設計してもよい。 この手法では、縮重ヌクレオチドをオリゴヌクレオチドのうちの1つの代わりに直接組み込むこともできる。 相補鎖は、プライマー伸長反応において、ポリメラーゼを活用した酵素伸長によって、他方の鎖の部分的に相補的なオリゴヌクレオチドから合成される。 合成段階での縮重ポリヌクレオチドの取り込みは、例えば、遺伝子の1つを超えるドメインまたは定義された領域に突然変異を起こさせて、あるいはそれを改変して多様性を持たせる場合に、クローニングを簡単にする。 用いる方法に関わらず、二本鎖形態に変換したあと、標準的技法によって、オリゴヌクレオチドを好適な発現ベクター中にライゲートすることができる。 好適なプラスミドなどの適当なベクターを用いて、遺伝子を無細胞抽出液、あるいは抗体の発現に適した原核細胞もしくは真核細胞に導入することができる。 異なる手法では、ファージベクター、またはヘルパーファージを用いて、一本鎖分子の増殖を可能にする繊維状ファージの複製起点を有するベクター中に、所望のコード配列をクローニングすることができる。 一本鎖テンプレートを、所望の突然変異を示す1組の縮重オリゴヌクレオチドを用いてアニーリングし、伸長およびライゲートして、それによって各類似体鎖を適当な宿主に導入できる分子の集団に組み込む(例えば、Sayers, 本明細書において、合成ヒト抗体ライブラリーなどのライブラリーを作成するのに適した様々なファージミドクローニングシステムは、当該技術分野で既知であり、例えば、Kang et al. , Proc. Natl. Acad. Sci. , USA, ライブラリーのサイズは、CDRの長さ、および表示が必要なCDR多様性の量によって異なるであろう。 好ましくは、ライブラリは、10 15 、10 14 、10 13 、10 12 、10 11 、10 10 、10 9 、10 8または10 7未満、またより好ましくは10 6以下の抗体または抗体フラグメントを含有するように設計されるであろう。 本発明に従って構築されたライブラリーは、当該技術分野において認められる技法を用いて、好ましくは配列された、マイクロチップなどの固体支持体に付着してもよい。 本発明に従って構築されたライブラリーは、当該技術分野で既知の任意の方法を用いて発現させることができ、これには細菌発現系、哺乳動物発現系、およびin vitroリボソームディスプレイ系が含まれるが、これらに限定されない。 好ましい実施形態では、本発明は、本明細書における多様なライブラリーを発現させるためのファージベクターの使用を包含する。 この方法は、一般的に、クローニングおよび発現のための繊維状ファージ(ファージミド)表面発現ベクター系の使用を伴う。 例えば、Kang et al. , Proc. Natl. Acad. Sci. , USA, 88:4363−4366 (1991);Barbas et al. , Proc. Natl. Acad. Sci. , USA, 88:7978−7982 (1991);Zebedee et al. , Proc. Natl. Acad. ベクターは、導入されたファージ遺伝子とディスプレイタンパク質遺伝子を発現させるために培養される組換え宿主細胞を形質転換し、またファージ粒子を集めて宿主細胞から脱落させるために使用される。 次に、脱落したファージ粒子を宿主細胞培養培地から回収(収集)し、所望の抗体結合特性についてスクリーニングする。 典型的には、回収した粒子をあらかじめ選択した抗原と結合させるために「パニング」する。 強く結合している粒子を収集し、粒子の個々の種をクローニングによって単離して、抗原への結合についてさらにスクリーニングする。 所望の抗原結合特異性を有する結合部位を産生するファージを選択する。 本発明の方法は、抗体ライブラリーの発現およびディスプレイに用いられる任意の特定の技術にも制限されないことは重要である。 また、他のディスプレイ技法、例えば、リボソームまたはmRNAディスプレイ(Mattheakis et al., Proc. Natl. Acad. Sci. USA 91:9022−9026 (1994);Hanes and Pluckthun, Proc. Natl. Acad. Sci. USA 94:4937−4942 (1997))、細菌ディスプレイ(Georgiou et al., Nature Biotech. 15:29−34 (1997))または酵母細胞ディスプレイ(Kieke et al., Protein Eng. 10:1303−1310 (1997))などの微生物細胞ディスプレイ、哺乳動物細胞ディスプレイ、胞子ディスプレイ、レトロウイルスディスプレイ(Urban et al., Nucleic Acids Res. 33:e35 (2005))などのウイルスディスプレイ、タンパク質−DNA結合に基づくディスプレイ(Odegrip et al., Proc. Acad. Natl. Sci. USA 101:2806−2810 (2004);Reiersen et リボソームディスプレイでは、抗体およびコードするmRNAはリボソームによって連結されるが、これはmRNAの翻訳終結時に、ポリペプチドを解放せずに停止させられる。 選択は、全体としての三元複合体に基づく。 mRNAディスプレイライブラリーにおいて、抗体とコードするmRNAとの共有結合は、アダプター分子として用いられるピューロマイシンを介して確立される(Wilson et al., Proc. Natl. Acad. Sci. USA 98:3750−3755 (2001))。 抗体をディスプレイするためのこの技法の使用については、例えば、LipovsekおよびPluckthun, J. Immunol. Methods. 290:51−67 (2004)を参照されたい。 微生物細胞ディスプレイ法には、サッカロマイセス・セレヴィシエ(Saccharomyces cerevisiae)などの酵母表面ディスプレイが含まれる(BoderおよびWittrup, Nat. Biotechnol. 15:553−557 以下の非限定的実施例によって、本発明を説明する。 本発明の方法を実施するための技法は、当該技術分野において周知であり、標準的な実験用教本に記載されている。 これには、例えば、Ausubel et al. , Current Protocols of Molecular Biology, John Wiley and Sons (1997);Molecular Cloning: A Laboratory Manual, Third Edition, J. Sambrook and D. W. Russell, eds. , Cold Spring Harbor, New. York. , USA, Cold Spring Harbor Laboratory Press, 2001;O'Brian et al. , Antibody Phage Display, Methods and Protocols, Humana Press, 2001; Phage Display: A Laboratory Manual, C. F. Barbas III et al. eds. , Cold Spring Harbor, New. York. , USA, Cold Spring Harbor Laboratory Press, 2001;およびAntibodies, G. Subramanian, ed. , Kluwer Academic, 2004などがある。 突然変異誘発は、例えば、部位特異的突然変異誘発(Kunkel et al., Proc. Natl. Acad. Sci. USA 82:488−492 (1985));DNA Cloning,1巻および2巻(D. N. Glover, Ed. 1985);Oligonucleotide Synthesis(M. J. Gait, Ed. 1984);PCR Handbook Current Protocols in Nucleic Acid Chemistry, Beaucage, Ed. John Wiley & Sons (1999)(編者);Oxford Handbook of Nucleic Acid Structure, Neidle, Ed. , Oxford Univ Press (1999);PCR Protocols: A Guide to Methods and Applications, Innis et al. , Academic Press (1990);PCR Essential Techniques: Essential Techniques, Burke, Ed. , John Wiley & Son Ltd (1996);The PCR Technique: RT−PCR, Siebert, Ed. , Eaton Pub. Co. (1998);Antibody Engineering Protocols (Methods in Molecular Biology), 510, Paul, S. , Kabatの慣例を用いた抗体配列解析に関するさらなる詳細は、例えば、Johnson et al. , The Kabat database and a bioinformatics example, Methods Mol. Biol. 2004; 248: 11−25;Johnson et al. , Preferred CDRH3 lengths for antibodies with defined specificities, Int Immunol. 1998, Dec; 10(12):1801−5;Johnson et al. , SEQHUNT. A program to screen aligned nucleotide Chothiaの慣例を用いた抗体配列解析に関するさらなる詳細は、例えば、Chothia et al. , Structural determinants in the sequences of immunoglobulin variable Chothia解析に関するさらなる詳細は、例えば、Morea V, Tramontano A, Rustici M, Chothia C, Lesk A M. CDR接触考察に関するさらなる詳細は、例えば、MacCallum RM, Martin AC, Thornton JM. Antibody−antigen interactions: contact analysis and binding site Topography. J Mol Biol. 1996 Oct 11; 262(5):732−45に記載されている。 本明細書において参照される抗体配列およびデータベースに関するさらなる詳細は、例えば、Tomlinson IM, Walter G, Marks JD, Llewelyn MB, Winter G. The repertoire of human germline VH sequences reveals about fifty groups of VH segments with different hypervariable loops. J Mol Biol. 1992
次に、得られたV κ 1軽鎖配列の集合は、位置18〜19にアミノ酸「RV」を有する配列を選択し、また以下の長さ制限を適用することによってフィルタ処理した:CDR1=7アミノ酸、CDR2=10アミノ酸、およびCDR3=8アミノ酸。 これらのフィルタを適用することによって、本来2374メンバーであった集合は、771メンバーに減少した。 CDR1に先行する「RV」モチーフから完全なCDR3配列までの完全な明確な配列を含有する登録のみを使用することによって、V κ 1軽鎖可変ドメイン配列の数をさらに383にまで減少させた。 続いて、配列をアラインメントし、各位置の出現アミノ酸を表にし、各位置の20種の天然アミノ酸の分布を計算して、位置によるアミノ酸の絶対使用に基づき、位置による頻度に基づくCDRドメイン多様性のデータベースを生成した。 この作表の結果は、図2に示す。 図2に記載するデータセットは、任意の所定の位置について10%を上回ったアミノ酸使用のみを報告することよって、さらにフィルタ処理した。 結果は図3に記載する。 多様性への指定される使用率の影響を評価するために、5%を上回ったアミノ酸使用のみを含めて、別のデータセットを作成した。 結果は図4に示す。 図3と図4のデータセットとの比較から、より低いアミノ酸使用率を要求することによって、より広い適用範囲の多様性を実現できることが明らかである。 図5に示すように、図4に記載される軽鎖CDR1の多様性をコードするためには、コンビナトリアルオリゴヌクレオチド128個または縮重コンビナトリアルオリゴヌクレオチド16個を合成する必要がある。 塩基は、等モルである必要はなく、アミノ酸使用を偏らせるように調節して、本解析で認められた頻度を反映させることができ、さらに頻度表に含まれない残基を含んでもよい。 代替的にまたは追加的に、頻度表に含まれる残基を省いて、例えば、合成に必要なオリゴヌクレオチドの数をさらに減らしてもよい。
この「多様性再取り込みスキーム」は、既存の合成抗体のクローンから、再多様化された抗体の組を改変する際にも有用である。 本発明に従って作成した合成ライブラリーの潜在的多様性は、全てのメンバーをディスプレイおよび選択するために現在利用できる技法の限界を上回るため、発見された標的特異的クローンが、典型的にスクリーニングされたライブラリーの任意のDNAレベルに存在し、アクセスできる、可能性のある解決策のうちのごく一部のみを示す可能性が非常に高い。 したがって、本発明のライブラリーにおいて、4ラウンドのパニング後に、抗EGF抗体を同定したあと、本来設計された多様性をクローンにコンビナトリアル的に再導入して、新しい変異体の組を作成した。 次に、これらの新しい変異体の組をEGFへのパニングによって再びスクリーニングし、連続する各ラウンドにおいて、結合および洗浄のストリンジェンシーを高めた。 最終結果は、最初のパニングで見られたよりも高い、バックグラウンドを上回るレベルに濃縮されたEGF結合ファージのプールを作成した。
親抗体D2E7の重鎖の生殖系列起源を決定するために、フレームワーク領域を解析した。 これは、D2E7とヒト生殖系列VH遺伝子とのCDRをマスキングして達成した。 次に、BLASTアルゴリズムによって、D2E7のFR1とFR3との間の残りの配列を全てのヒト生殖系列VH遺伝子に対してアラインメントした。 図8に示すように、D2H7のV H領域は、V H 3_3−09と最大の類似性を示した。 図9に示すデンドログラムアラインメントは、同様の結果を示した。 同様に、親抗体D2E7の軽鎖は、V κ 1 A20と最も類似していることがわかった(図10および11)。 実施例1に記載される抗体軽鎖V κ 1のCDR1、CDR2、およびCDR3配列の頻度解析は、閾値使用パーセントのフィルタを6%に設定することによって修正した。 図12に示すように、このフィルタでは、位置91を除く全アミノ酸位置についての合計使用は80%を上回り、これはライブラリー多様性9×10 6に対応し、この多様性は、30個の縮重オリゴヌクレオチドで生成できる。 次に、KabatデータベースのSequences of Proteins of 次に、重鎖可変ドメイン集合を以下のフィルタで処理した: 続いて、配列をアラインメントし、各位置の出現アミノ酸を表にし、各位置の20種の天然アミノ酸の分布を計算して、位置によるアミノ酸の絶対使用に基づき、位置による頻度に基づくCDRドメイン多様性のデータベースを生成した。 この作表の結果は、図13に示す。 図13に記載するデータセットは、任意の所定の位置について少なくとも10%であったアミノ酸使用のみを報告することよって、さらにフィルタ処理した。 図14に示すように、このフィルタを用いると、CDR2では、位置52、52A、55、および58における合計アミノ酸適用範囲が75%を下回る。 より広い適用範囲に対応するために、要求される使用パーセントを10%から5%に下げた。 図15に示すように、この変更によって、全ての位置の合計アミノ酸使用が75%を上回るまで増加した。 CDR1およびCDR2の双方に5%使用フィルタを適用すると、CDR1領域の合成に4個の縮重オリゴヌクレオチドが必要となり、CDR2の多様性は、28個の縮重オリゴヌクレオチドでコードできる(図16参照)。 したがって、合計28個の縮重オリゴヌクレオチドを使用して、総多様性1.5×10 8を実現することができ、80%を上回る位置による適用範囲を提供する。 次の手順では、上述のヒト抗体の重鎖可変ドメイン配列5971個から、アイソタイプであるかに関わらず、長さ13アミノ酸のV H 3配列を集めた。 要求される各位置のアミノ酸使用パーセントを、閾値を4%使用に設定したアミノ酸位置93、94、および101を除いて、4%に設定した。 結果は図17に示す。 これらの閾値を設定することにより、総多様性7.5×10 9を有する合成V H 3重鎖の合成ライブラリーを、384個の縮重オリゴヌクレオチドを用いて調製することができる。 示されるように、CDR3領域の残基は、親抗体D2E7の対応する残基と良好な一致を示す。
設計は、抗ジゴキシゲニン(抗DIG)抗体から始めた(Dorsam, H. et この重鎖および軽鎖の生殖系列起源を決定するために、親抗体を解析した。 図19に示すように、V L −Igは軽鎖に最も類似し、V H 3−23は重鎖に最も類似しているため、CDRをこの環境に置いて、抗ハプテン抗体の同定のための生産的ライブラリーを作成した。 次に、λの長さが適合するV Lフレームワーク残基について、軽鎖CDR1およびCDR2配列を上記の実施例に記載されるように解析した。 各位置について要求されるアミノ酸使用パーセントを6%に設定することによって、6%を下回る個々の配列が報告されないようにした。 図20に示すように、このフィルタは、各アミノ酸位置について優れた適用範囲を提供する。 H3の長さが適合する(8アミノ酸)重鎖について類似の解析を行なうが、6.25%のフィルタを適用し、全ての位置を含む合計アミノ酸適用範囲は75%であった(図21)。
多様なIFN−αライブラリーを作成するための第1手順として、11個の189アミノ酸長の遺伝子産物を同定した。 図22に示すように、これらのIFN−αポリペプチドのアミノ酸残基32〜38を互いにアラインメントして、残基使用頻度を決定した。 閾値アミノ酸使用パーセントを9%に設定した場合、2個の縮重オリゴヌクレオチドを用いて、100%の適用範囲を達成することができる(図22および23参照)。 図23に示すように、非縮重設計を用いると、要求される適用範囲を提供するために、40個のオリゴヌクレオチドが必要である。 ライブラリーを調製したあと、当該技術分野で既知の方法によって、所望の新規の特性についてのスクリーニングを実施することができる。 したがって、効力の向上は、ファージディスプレイIFN−αライブラリーのバイオパニングによってなど、標準的な生物検定で試験することができる。 半減期が増加したメンバーは、例えば、IFN−α受容体に対してファージディスプレイライブラリーをバイオパニングすることによって、あるいはライブラリーのメンバーを1つ以上の血清プロテアーゼに曝露させることによって同定することができる。 免疫原性の低下は、例えば、最も低いMHC分子との結合性を示す、ライブラリー中に存在するペプチドまたはポリペプチドを同定することによって、あるいは直接全タンパク質のT細胞エピトープ提示を試験することによって、試験することができる。 これらおよび多数のさらなる試験は当業者に周知である。
アミノ酸は、それぞれ小型、求核性、疎水性、芳香族、酸性、アミド、および塩基性の側鎖化学官能基を特徴とする7つのグループに分けることができる(図24)。 図25の左上の図は、7つのグループのそれぞれに属するアミノ酸の1文字記号を示している。 異なる側鎖の化学的性質を代表する9種のアミノ酸(A、S、H、L、P、Y、D、Q、R)を選択した。 図25の他の部分に示すように、9個のコドンまたは2個の縮重コドンによって、ハイライトした9種のアミノをコードすることができ、またそれにより側鎖の化学的性質の多様性を獲得することができる。 (B=C、G、またはT;M=AまたはC;Y=CまたはT;D=A、G、またはT) この化学的に探索された多様性の手法は、単独で、あるいは本発明のその他の任意の方法との組み合わせで用いて、所望の特性を備えるコンビナトリアルライブラリーを作成することができる。 本明細書を通して引用される全ての参考文献は、参考として本明細書で明示的に援用される。 κのCDR1、2、および3の頻度解析;位置による絶対使用の決定を示す。 κのCDR1、2、および3の頻度解析;位置による絶対使用の決定を示す。 κ 1軽鎖の閾値解析である。 使用10%を下回る個々のアミノ酸は報告されない。 κ 1軽鎖の閾値解析である。 使用10%を下回る個々のアミノ酸は報告されない。 κ 1軽鎖の閾値解析である。 使用5%を下回る個々のアミノ酸は報告されない。 κ 1軽鎖の閾値解析である。 使用5%を下回る個々のアミノ酸は報告されない。 図5は、それぞれ、出現する順番で、 配列番号4および5〜20を開示する。 H 3重鎖合成ライブラリーの閾値解析(長さ10残基)である。 閾値使用率は、各アミノ酸位置に対して個別に設定されており、これは3%〜10%である。 (それぞれ、出現する順番で、配列番号21〜48)を示す。 (それぞれ、出現する順番で、配列番号49〜78)を示す。 (それぞれ、出現する順番で、配列番号79〜108)を示す。 (それぞれ、出現する順番で、配列番号109〜116)を示す。 (それぞれ、出現する順番で、配列番号1 17〜139)の生殖系列起源の決定を示す。 (それぞれ、出現する順番で、配列番号1 17〜139)の生殖系列起源の決定を示す。 (それぞれ、出現する順番で、配列番号 140〜159)の生殖系列起源の決定を示す。 (それぞれ、出現する順番で、配列番号 140〜159)の生殖系列起源の決定を示す。 κ 1軽鎖合成ライブラリーの多様性を示す。 図12は、配列番号1 60を開示する。 κ 1軽鎖合成ライブラリーの多様性を示す。 H 3のCDR1およびCDR2の頻度解析を示す。 H 3のCDR1およびCDR2の頻度解析を示す。 H 3重鎖合成ライブラリーの多様性を示す。 図16は、配列番号1 61を開示する。 H 3重鎖合成ライブラリーの多様性を示す。 図16は、配列番号1 61を開示する。 H 3重鎖合成ライブラリー多様性の設計を示す。 図17−1は、配列番号162を開示する。 H 3重鎖合成ライブラリー多様性の設計を示す。 (配列番号1)および重鎖可変領域 (配列番号2)の配列を示す。 (それぞれ、出現する順番で、配列 番号2、125、1および163)の生殖系列起源の決定を示す。 L 1フレームワークのハプテン解析を示す。 (それ ぞれ、出現する順番で、配列番号164〜168、167、167、169、167、170、167および171)を示す。 (そ れぞれ、出現する順番で、配列番号172、172および173〜174)を示す。 (それぞれ 、出現する順番で、配列番号175および176)を示す。 次に、重鎖可変ドメイン集合を以下のフィルタで処理した: |