Small proteins

申请号 JP50755892 申请日 1992-02-27 公开(公告)号 JP4146512B2 公开(公告)日 2008-09-10
申请人 ダイアックス コープ.Dyax Corp.; 发明人 ケント、レイチェル、バリボールト; ラドナー、ロバート、チャールズ; レイ、アーサー、チャールズ; ロバーツ、ブルース、リンゼイ;
摘要
权利要求
  • キメラタンパク質のライブラリーであって、各キメラタンパク質はア)6アミノ酸より大きく40アミノ酸より少ないアミノ酸からなり、一対のシステインの間に形成された単一のジスルフィド結合を有し、そのジスルフィド結合のスパンは4アミノ酸残基以上9アミノ酸残基以下であるミクロタンパク質、およびイ)遺伝子パッケージの外表面タンパク質の少なくとも一部、
    を含んでなり、前記キメラタンパク質が前記遺伝子パッケージの外表面上に提示されていることを特徴とする、キメラタンパク質のライブラリー。
  • ジスルフィド結合のスパンが4アミノ酸であることを特徴とする、請求項1記載のライブラリー。
  • ジスルフィド結合のスパンが5アミノ酸であることを特徴とする、請求項1記載のライブラリー。
  • ジスルフィド結合のスパンが6アミノ酸であることを特徴とする、請求項1記載のライブラリー。
  • ジスルフィド結合のスパンが7−9アミノ酸であることを特徴とする、請求項1記載のライブラリー。
  • ライブラリーのいくつかのミクロタンパク質において、ジスルフィド結合のスパン内に、プロリン、バリン、イソロイシンから選択されるアミノ酸が少なくとも1つ含まれることを特徴とする、請求項4または5に記載のライブラリー。
  • ライブラリーのミクロタンパク質すべてにおいて、ジスルフィド結合のスパン内に、プロリン、バリン、イソロイシンから選択されるアミノ酸が少なくとも1つ含まれることを特徴とする、請求項4または5に記載のライブラリー。
  • アミノ酸がプロリンであることを特徴とする、請求項6に記載のライブラリー。
  • 前記ミクロタンパク質が20以下のアミノ酸からなるアミノ酸配列を含んでなることを特徴とする、請求項1−8のいずれかに記載のライブラリー。
  • 前記ミクロタンパク質が配列X 1 −C−X 2 −X 3 −X 4 −X 5 −C−X 6
    を含んでなり、ここでシステイン(C)がジスルフィド結合を形成し、X 1 −X 6は互いに独立に変化するアミノ酸であることを特徴とする、請求項2のいずれかに記載のライブラリー。
  • 前記ミクロタンパク質中で、そのジスフィルド結合のスパンのアミノ酸の少なくとも1つはNNT,NNG,RNG,VNT,RRS,SNTから選択される多様化コードの1つによってコードされることを特徴とする、請求項1−10のいずれかに記載のライブラリー。
  • 前記ミクロタンパク質中で、そのジスフィルド結合のスパンのアミノ酸のいずれもNNN,NNK,NNSのいずれかでコードされるものではないことを特徴とする請求項1−11のいずれかに記載のライブラリー。
  • ミクロタンパク質が前記外表面タンパク質の少なくとも1部に直接結合していることを特徴とする、請求項1−12のいずれかに記載のライブラリー。
  • 遺伝子パッケージが繊維状ファージであることを特徴とする、請求項1−13のいずれかに記載のライブラリー。
  • 外表面タンパク質が繊維状ファージの主要コートタンパク質であることを特徴とする、請求項1−14のいずれかに記載のライブラリー。
  • 外表面タンパク質が繊維状ファージの遺伝子IIIタンパク質であることを特徴とする、請求項1−15のいずれかに記載のライブラリー。
  • ターゲットに対して望ましい結合活性を有するタンパク質を同定する方法であって、
    ア)請求項1−16のいずれかに記載のキメラタンパク質のライブラリーをスクリーニングし、
    イ)キメラタンパク質を同定する、
    ことを含んでなる、方法。
  • 請求項1−16のいずれかに記載のライブラリーをコードする、核酸の混合物。
  • 各核酸が発現ベクター中にクローン化されていることを特徴とする、請求項18に記載の核酸の混合物。
  • 说明书全文

    発明の背景[発明の分野]
    この発明は新規な小型結合タンパク質の開発に関するものであり、特にマイクロタンパク質の突然変異誘発、発現、親和性の選択、そして増幅といった工程をくり返すことによっる新規な結合タンパク質の開発に関するものである。 この工程に於て、小型タンパク質の結合領域をコードしている遺伝子、予め定められた限定数コードンの偶然の突然変異誘発により得られた該遺伝子は、遺伝子要素と溶融している。 その遺伝子要素は、ウイルス(特に線状ファージ)あるいは細胞の外表面に表示されている細胞群発現の結果としての混合物を生成する。 親和性の選択は、ウイルスあるいは細胞が溶融細胞を含んでいるゲノムを識別するために利用されている。 溶融細胞はクロマトグラフィー的な目標と結合するタンパク質に符号を付つける。
    [関連技術の記載]
    タンパク質のアミノ酸配列はその三次元(3D)構造を決定する。 このことはまたタンパク質の機能を決定する。 ポリペプチド鎖の幾らかの残留物(残基、以下同じ)はタンパク質の三次元構造の決定上他に比して重要な役割を演じる。 従ってその結合能は、共有結合ではなく密着した結合でありかつ特異性であり、目標とする分子の特質との結合する。 「タンパク質工学」はタンパク質配列の順序を操作する技術である。 即ち、その結合の特性を変えることである。 タンパク質結合に影響を及ぼしている因子は知られているが、新規の表面デザインは困難であることが分かっている。 Quiochoその他(QUI087)は次のように示唆している。 即ち、現在のタンパク質工学の方法では、自然に発生するタンパク質が持っている優れた結合特性を持ったタンパク質を作り出すことは困難であろう。
    しかしながら いくつかの孤立した成功の実績はある。 例えば、Wilkinsonら(WILK84)は、突然変異THr 51 −−Proを持ったBacillus ste-arothermophilusチロシントランスファーRNAシンセターゼの突然変異体は、ATPに対する親和性が100倍増加したことが示されていると報告している。
    組換型DNA技術の発達に伴い、天然タンパク質に遺伝子の符号を付して突然変異させ、突然変異した遺伝子を発現することによりタンパク質の突然変異体を作ることができるようになった。 いくつかの突然変異誘発の方法が知られている。 一つは「タンパク質手術」(DILL87)であり、選出された遺伝子内に一個もしくはそれ以上の数の予め定められた突然変異を導入することである。 完全に予定された配列の唯一のポリペプチドは発現され、その結合特性は評価されている。
    他の極端な方法は、放射線や種々の科学物質のような比較的不特定の突然変異誘発剤を利用するランダムに突然変異体を生成するものである。 Hoその他(HOCJ85ならびにLehtovaars、EP Appln.285、123を参照のこと。
    核酸合成手段の適切なサイクルで各種基の混合物を利用して予め定められたヌクレオチドをランダムに変えることができる。 (OLIP86とOLP87)。 混合物中の基の配合割合は、各コードンの位置に従ってその頻度が決められる。 その頻度で各アミノ酸は、退化DNA固体群から発現されたポリペプチド中に発生する。 (REUD88a、VERS86a、VERS86b)。 DNAをコードする異なったアミノ酸の存在率が異なる点については言及していない。
    Ferenciとその共同研究者は、E.Coliのマルトース運搬タンパク質LamBのクロマトグラフィ単離に関し一連の論文を発表している。 (FERE82a、FERE82b、FERE83、FERE84、CLUN84、HEIN87、及び上記の論文)突然変異体は不特定の化学的突然変異誘発物質で自発的にまたは誘発的に生成された。 突然変異誘発のレベルが選ばれ、単一点突然変異または二種残留物の単一挿入を規定する。 多種突然変異は探索されないし発見されることもなかった。
    従来のLamB基質マルトースと澱粉に対する親和性の度合いに変動が見られる一方、天然のLamBによって結合されないターゲットとしての分子に対する親和性の選択はなかった、また多種突然変異は探索されないし発見されることもなかった。 文献FERE84は、親和性のクロマトグラフィ的な選択技術が他の「表面に存在している重要なバクテリア酵素」と同様な突然変異体の発生に応用できる、また細胞内のバクテリアタンパク質を細胞表面に配置転換する突然変異を選択することができると考えている。 しかしながら、Ferenciのいう突然変異体表面のタンパク質は、バクテリアの表面タンパク質と外生または非相同一の結合領域のキメラであった。
    Ferenciはまた、構造遺伝子をクローンしたり、タンパク質構造、活性部位もしくは配列を知る必要はないと論じている。 しかしながら、この発明による方法は、クローンされた構造遺伝子を特に利用することにある。 キメラの外面上で既定されたポテンシャル結合タンパク質に符号を付している遺伝子をクローンすることなしに構造し発現することはできない。
    Ferenciは突然変異を特殊な座に限ることはしなかった。 置換は特殊の部位に特殊のアミノ酸型が望ましいということで制限されず、むしろ突然変異誘発物質の性質によって制限されている。 この発明においては、タンパク質の構造、活性部位や配列の知識が適切な予測に利用される。 その知識は、どの残留物がタンパク質を不当に不安定することなく結合活動に最も大きく影響するかの予測の補佐をし、また突然変異誘発はこれらの部位に集中される。 Ferenciは、表面残留物が好ましく変えられるべきだとは示唆していない。 従って、Ferenciの選択機構はここに公開された方法に比して有効性を欠くものである。
    複数の研究員達は突然変異を起こしていない異種の抗原のエピトープをバクテリアまたはファージの表面に位置付けし、天然のバクテリアもしくはファージの表面タンパク質に溶融させ、エピトープが抗体に認められたことを実証した。 このように、Charbitら(CHAR86a、b)は、ポリオウイルスのVP1をコートしたタンパク質のC3エピトープをE.ColiのLamB外被膜タンパク質に遺伝的に挿入し、C3エピトープがバクテリアの細胞表面に晒されたことを免疫学の観点から断定した。 Charbitら(CHAR87)は同様に、LamBのキメラと肝炎BウイルスのpreS2領域のA(もしくはB)エピトープを生成した。
    キメラのLacZ/OmpBタンパク質は、E.Coliに発現されており、融解に依存して、外被膜もしくはペリプラズムに位置付けられている(SJLH77)。 キメラのLacZ/OmpA表面タンパク質もまたE.Coli細胞の表面に発現され表示されている(WEIN83)。 その他は、E.coli型1線毛(HEDE89)やバクテロイド結節型1線毛(JENN89)のような他のバクテリア表面タンパク質の細胞キメラの表面に発現され表示されている。 上記の例では、突然変異が誘発された遺伝形質は挿入されていない。
    DulbeccoDULB86)は異種坑原エピトープをウイルス表面タンパク質に組み込む処理方法を示唆している。 それによって発現されたキメラタンパク質は、異ったエピトープが抗体に近付き得るような方法でウイルスの表面に表示される。 1985年に、Smith(SMIT85)はEcoRIエンドヌクリアーゼ遺伝子の非機能セグメントをバクテリオファージF1の遺伝子IIIに「位相で」挿入したと報告している。 遺伝子IIIタンパク質は感染に必要なマイナーコートのタンパク質である。 Smithは組換型ファージがEcoRIエンドヌクレアーゼに反して産出された不動の抗体によって吸着され、また酸で抽出し得ることを論証している。 De la Cruzら(DELA88)は、Plasmodium Falciparumからのcircumpsporozo-iteタンパク質の繰り返し領域のフラグメントが、遺伝子IIタンパク質への挿入物としてM13の表面に発現していると述べている。 彼等は組換え型ファージがウサギにおいて抗原でもあり免疫原でもあり、このような組換え型ファージはBエピトープ遺伝地図作製に利用し得ることを明らかにした。 研究者達は、同様な組み換え型ファージがTエピトープ遺伝地図作製やワクチン開発に利用し得ることを示唆している。
    これらの研究者達は挿入された物質の突然変異誘発を示唆していないし、また挿入された物質が抗体の坑原結合サイト以外の受容体に特別に結合する能力をキメラタンパク質に授与している完璧な結合ドメインでもない。
    McCaffertyら(MCCA90)は、抗体のFvフラグメントがpIIIタンパク質のN末端への溶融を発現している。 Fvフラグメントは突然変異されていない。
    ParmleyとSmith(PARMS88)は、エピトープライブラリーが展示し得る全てのヘキサペプチドを築き得るし、抗体と結合するエピトープを分離したとを示唆している。 エピトープライブラリーの論議において、著者達は異種アミノ酸の代表のバランスをとることが望ましいとは示唆していない。 彼等はまた挿入が外生タンパク質の完全なドメインをコードすべきであるとは。 論議していない。 エピトープは構造化タンパク質に対する非構造化ペプチドであると考えられている。
    ScottとSmith(SCOT90)並びにCwirlaら(CWIR90)は、エピトープライブラリーを作製した。 その中で、ターゲット抗体のためのポテンシャルヘキサペプチドエピトープは、エピトープをコードして、fdファージの遺伝子IIIと共に、ファージに汚染された細胞に溶融された遺伝子を発現し、退化オレゴヌクレオチドの溶融によってランダムに突然変異するとしている。 これらの細胞は表面にエピトープを表示した溶融ファージを作り出した。 固定された抗体に結合されたファージは酸とともに溶出された。 これら二つの研究において、溶融された遺伝子は野生型pIII配列から可変領域を区別するためのスペーサー領域をコードしているセグメントを形作っていた。 それによって変かえられたアミノ酸は近隣在のpIII配列に拘束されない。 Devlinら(DEVL90)は、同様に、M13ファージを使って、ストレプトアビジンに認知されたランダム15の残基エピトープを選別した。 ここでもスペーサーが、キメラファージタンパク質の残余からランダムペプチドを除去するために利用された。 したがって、これらの文献は、突然変異を起こした残溜基(残基、以下同じ)の配座レパトリーを拘束しているとは論議していない。
    ScottとSmith、Cwirlaら、並びにDelinらの持つもう一つの問題は、各位置におけるアミノ酸の資料採取が非常に片寄っているライブラリーを製作したことである。 可変領域をコードしている退化オリゴヌクレオチドのデザインにおける彼等の最大の関心は全20のアミノ酸が各位置にコードされ得ることを確実にすることだった。 彼等の第二の関心は停止信号が起きる回数を最小限にすることだった。 従って、ScottとSmith並びにCwirlaらは、NNK(N=G,A,T,Cの同等の配合、K=CとGの同等の配合)を用い、Devlinらは、NNS(S=GとCの同等の配合)を使った。 最も優待されたアミノ酸と最も優待されないアミノ酸の回数比を減少しようとはしなかったし、酸性アミノ酸と基性アミノ酸の発生率を同等のものとしようとはしなかった。
    Devlinらは、いくつかの親和性の選択をしたストレプトアビジン結合ペプチドを特性ずけたが、これらペプチドの親和性係数を計測しなかった。 Cwirlaらは、ペプチドの親和性係数を決定したが、最高のヘキサペプチドが親和性(350-300nM)であったということを発見して失望させられた。 その親和性、即ちその「概略値」は、ターゲット抗体により認知された天然のメットーエンケファリンエピトープ(7nM)のそれよりも弱いものだった。 Cwirlaらは、高い親和性を持ったファージ支承ペプチドが酸溶出の折りも結合したままで存在していると推測している。 その理由は、ファージ(pIIIの約4コピーを運搬している)と二価のターゲットIgG問の複数価の相互作用よるものであるかも知れない。 ScottとSmithは、ターゲット抗体にたいする親和性(A2)が基準ミオヘムエリトリンエピトープ(50nM)のそれと同等であるペプチドを発見し得た。 しかしながら、ScottとSmithは、多分、溶融ファージのターゲットに対する不可逆転結合によって、いくつかの親和性の高いペプチドが失われてしまったことに関して懸念を示している。
    Lamら(LAM91)は、確固とした支えの上に非生物学的合成によるペンタペプチドライブラリーを作り上げた。 彼等は、およそ等モルの割合のランドムペンタペプチドの世界を入手しようと教えるかたわら、ジスルフィドの架橋形成を消滅するために故意にシステインを除外した。
    Ladner,GlickそしてBirdは、WO88/0633(公告1988年9月7日、さらにUS特許出願07/021,046優先権を持ってGenex Corpに委託した)(LGB)で、一本鎖抗体の結合領域をコードするDNAを換え、SCAD/gpVキメラがファージの外面に顕示されるようにSCAD遺伝子をラムダファージのgpV遺伝子にサブクローン化し、そして親和性クロマトグラフィーで抗原に結合するファージを選択することにより、種々の一本鎖抗体ドメイン(SCAD)を特定の抗原に結合させるためスクリーンしてもよいと述べている。 そこで述べられている唯一の抗原はウシの成長ホルモンである。 他の結合性物質、ターゲット、担体有機物、その他の外面タンパク質については議論していない。 また突然変異の程度や方法についても何の言及もしていない。 さらに、溶融の正確な構造についても論議しておらず、好結果をもたらす溶融を見極める方法、またSCADか顕示されない場合にとるべき方法についても言及していない。
    LadnerとBirdはWO88/0661(公告1988年9月7日)で、一本鎖の「擬二量化」リプレッサー(DNA結合タンパク質)が、推定上のリンカーペプチドを突然変異させ、ひき続いて不斎性リプレッサーのデザイン用の認識要素辞書を作成するのに突然変異と選択を使うことができるかも知れないという、生体内選択により生成できるかも知れないと示唆している。 レプレッサーは有機体の外面に顕示されない。
    タンパク質を安定化するジスルフィド結合の構成を促すためのシステインに換え得るタンパク質中の残留基を見極める方法は、PantolianoとLadnerのUS特許番号4、903、773号(PANT90)、PantolianoとLadner(PANT87)、PaboとSuchenek(PABO86)、MAT89、並びにSAUE86に示されている。
    Ladnerら、WO90/02809は、バクテリア、ファージ、または胞子のセミ人造外面タンパク質の領域として顕示されている既知のタンパク質のセミランダム突然変異誘発(「変化」)、さらに理想の結合特性を持った突然変異体の親和性選択について記述している。 特に極小のタンパク質でWO90/02809に言及されているものは、クラムビン(3:40、4:32、16:26ジスルフィド;46AAs)オボムコイドの第三領域(8:38、16:35と24:56ジスルフィド;56AAs)さらにBPTI(5:55、14:38、30:51ジスルフィド;58AAs)である。 WO90/02809もまた、およそ同等の割合でその位置にある20の全アミノ酸の混合を入手できる「変化」コードンに関する方法を記述している。
    Bassら(BASS90)は、ヒト成長ホルモンをM13ファージの遺伝子IIIタンパク質に溶融した。 彼は、hGHとその他の「大型タンパク質」が突然変異し「結合選択」が利用できるかも知れないと示唆している。
    [発明の要約]
    ポリペプチドはペプチド結合によって結合された同種または異種のアミノ酸の一本鎖からなる重合体である。 線形ペプチドは、各アルファカーボンの主要な一本鎖結合のまわりの内部回転をとうして大多数の異なった配座を取り上げることができる。 これらの回転は最小限に干渉するグリシンと最大限に干渉するバリン、イソロイシン、特にプロリンを持った側グループによって異なった程度で妨げられる。 20の残留基を持つポリペプチドは種々の内部回転によって決められた10 20異種配座を持つこともある。
    タンパク質はポリペプチドであり、鎖に隣接した位置にかならずしも存在しないアミノ酸の問の安定性相互作用の結果として、明確な配座に折り畳まれている。 この褶曲構造は普通その生物学的活動にとって本質的なものである。
    40から60の残留基、もしくはそれ以上に長いポリペプチドにとって、素結合、塩橋、また疎水性の相互作用のような非共有的勢力は特種褶曲または配座を安定化するために十分である。 ポリペプチドの構成要素は高温、もしくは低いか高いpHのような変性剤によって乱されないかぎり、少なくともその配座に保持されている。 そこでポリペプチドは褶曲を解消し、また[溶融する」。 ペプチドが小型であればあるほど、その配座は環境によって決められる可能性が大きくなる。 小型な制約をあまり受けないペプチドが生物学的活動を持つとしたら、ペプチド配位子は、その受容体に近接するまで、その本質において、ランダムコイルに存在する。 受容体は、非好意的代替配座がvan der Waa-lsや他の非共有的相互作用によって疎外されるので一個もしくは数個の配座にのみペプチドを受け入れる。
    小型ポリペプチドは、大型ペプチドに比して、治療剤または診断剤として利用される場合、下記を含み(しかも下記に限られることなく)ポテンシャルに有利である。 すなわちa)組織への浸透が良いb)循環系よりの消去が速い(造影剤にとっては重要である)
    c)抗体原性が低い、そしてd)多数の活動が高いさらに、ポリペプチド、特に40より少数の残留基を持っているポリペプチドは化学的合成をとうして入手できる有利性がある。 30以下のポリペプチドは特に優先される。 このようにして、好みのターゲットを結合する小型ポリペプチドを識別するために突然変異と親和性選択の組み合わせを利用し得ることは好ましいことである。
    しかしながら、このサイズのポリペプチドの大多数は結合分子としての優位性を持っていない。 Oliveraら(OLIV90a)によると、「このサイズのペプチドは普通多数の配座の中で均衡に分類されている(固定した配座をもつためには、タンパク質は普通もっと大型でなければならない)。」ターゲット分子とのペプチドの特殊な結合は、結合位置を補足する配座を取り上げるペプチドを必要とする。 一つの残留基に三つの等エネルギーの配座(即ち、ベータストランド、アルファヘリックス、そしてイソメルマン反転)を持ったデカペプチドのために、およそ6・10 4の総合的に可能な配座がある。 これらの配座が、拘束を受けていないデカペプチドのために同等の確率性があると仮定して、たった一つの可能性を持った配座が結合位置に結合されたならば、ターゲットに対するペプチドの親和性は、もしそれが単一の効果的な配座に拘束される場合、およそ6・10 4高くなると期待できる。 このようにして、正確な配座に拘束されているデカペプチドに対して、拘束をうけていないデカペプチドは低い親和性を顕示することが期待される。 拘束を受けていないデカペプチドの他の配座の一つが意図されたターゲット以外の物質と堅く結合した中の一つであるかも知れないので、それは低い特殊性を顕示する可能性がある。 それはプロテアーゼのために結合部位を提供する可能性があるので、コロラリー系をとうして、それはプロテアーゼによって退化に対する抵抗が減少されるかも知れない。
    この発明は上記の種々の問題を克服し、望ましい結合の特性を持った新規なミニタンパク質を識別することによって、小型ポリペプチドの持つ優位性を保持している。 ミニタンパク質は小型ポリペプチドであり、非共有的勢力のみの結果として安定した配座を持つためには小型すぎるが、安定した配座に共有的に架橋を形成して(即ち、ジスルフィド結合によって)、それによって、拘束を受けていない同等サイズのポリペプチドよりも大きいタンパク質分子のより典型的な生物学的活動を持つことになる。 この発明が特に懸念しているミニタンパク質は、二つの種類に別けられる。 即ち、a)アミノ酸40以下のジスルフィド結合ミクロタンパク質、とb)アミノ酸60以下の金属イオン配置されたミニタンパク質である。
    この発明は、所望の結合特性を持った新規なタンパク質を特定する突然変異遺伝子の構造、発現、そして選択、ならびにそれらミニタンパク質自体に関するものであり、またポテンシャルな「ターゲット」物質に対するミニタンパク質を顕示するために利用される突然変異体「遺伝子パッケージ」の「ライブラリー」に関するものである。 「ターゲット」はタンパク質であることが多いが、タンパク質である必要はない。 ターゲットは有機物質や無機物質は勿論、他の生物学的あるいは合成的高分子でもよい。
    既述の特許出願、WO90/02809は、安定したタンパク質が好ましい結合特性を持った新規なタンパク質を識別するために突然変異された可能性があると一般的にのべている。 この目的のために有用であると特殊に識別されている適切な「親」タンパク質には三つのタンパク質が含まれて入る。 即ち、BPTI(58残留基)(残基、以下同じ)、オボムコイドの第三ドメイン(56残留基)、そしてクラムビン(46残留基)である。 これらのタンパク質は、非近隣在アミノ酸間の非共有的相互作用が意義を持つようになる、40から60の残留基を持っている。 これら三つのタンパク質はまた分子の安定性を高める働きをする三つのジスルフィド結合を持っている。
    特許出願、WO90/02809のどこにも、40以下の残留基を持ったポリペプチドに関して、また特に一個もしくは二個のジスルフィド結合を持ったポリペプチドが、突然変異の変動のための「足場」として働き十分に安定性と持たせることについての特別な承認は見いだされない。 これらの「ミニタンパク質」は、すくなくとも、以前にも指摘したように、利用価値は大である。
    特許出願、WO90/02809はまた、異なった架橋形成(Cu:CYS、HIS、HIS、MET)を持ったタンパク質、アズリンの利用を示唆している。 しかしながら、アズリンは128のアミノ酸を持っているので、ミニタンパク質とは考えられない。 この発明は、金属イオンが調整している架橋形成と特徴としているアミノ酸数60以下のミニタンパク質の利用に関するものである。
    この発明によって、抗体の抗原結合サイト以外のターゲットに特別に結合し得るタンパク質が提供された。 タンパク質は、抗体によって結合され得るので、単なる「結合タンパク質」とは考えられない。 (後述の「結合タンパク質」の定義を参照してください)。 アミノ酸数が6から8より多いアミノ酸配列が大多数であるが、一つの免疫原担体と結合する場合、免疫反応を引き出し、いかなるランダムポリペプチドも、その基質に対して最小限の親和性と特殊性に関する「結合タンパク質」の厳格な定義を満足させ得る。 それは、多数のランダムポリペプチドを次々にテストすることによってのみ、(そして、通常の場合には、配列変動の程度と性質をコントロールして、すなわち、安定した構造を持つドメインとのポテンシャルな結合のための残留基にそれを制限し、選択された残留基が、安定性よりむしろ結合に影響を及ぼすようにすることによってのみ)この問題は解決される。 上記事項に続く「請求の範囲」記載の事項は、この明細書中に組み込んで望ましい実施例とする。
    【図面の簡単な説明】
    図1はサソリ毒性(Brookhavenタンパク質データ銀行登録ISN3)残留基20から42までの主鎖を示す図である。 CYS 25とCYS 41はジスルフィド形成を示している。 天然タンパク質においては、これらのグループは他のシステインにジスルフィドを形成するが、主鎖モーションはガンマ硫黄を受け入れられる幾何学にもたらすよう義務ずけられている。 GLY以外の残留基は一字コードでベータカーボンに標識されている。
    [好ましい実施例の詳細な説明]
    1. 序文この発明の基本原理は強制される進化の一つである。 自然界において、進化は、遺伝子的変動、有益な形質、それに選出された個々の生殖の組み合わせの結果として起こるものであり、その形質のために集団は豊かになるのである。 この発明は、ミクロタンパク質の突然変異体である異種ではあるが関連性のあるポテンシャルな結合ドメインをコードするDNA分子の一つの混合を作り出しているコントロールされたDNAのランダム突然変異誘発(「変化」)(Variegation)をとうして遺伝子的変動を成し遂げられている。 この発明は望ましい結合特質を持つ新規なタンパク質を明白にする突然変異した遺伝子を分離するものであり、次の方法をとる。 すなわち、1)突然変異した遺伝子各々の生成物が、遺伝子を含む複製遺伝子パッケージ(GP)(細胞、胞子、またはウイルス)の外面に顕示されるように、そうさを行い、2)親和性選択を利用して、すなわち、ターゲット物質に結合させるための選択を利用して、そのターゲット物質に改善された結合性を持ったタンパク質を特定化する遺伝子を含むパッケージに対して、パッケージの集団を増大させるのである。 最後に、増大は、顕示されたタンパク質によって、生殖の目的でターゲットと結合した遺伝子を含むパッケージのみを許容することにより成し遂げられる。 進化は、選択がターゲット物質のために提供されているということで「強制」であり、またその特種コードンが自然に起きる回数よりも高い回数で突然変異するということで「強制」である。
    顕示戦略は、第一に、親和性分子(抗体であるかも知れない)が入手可能である。 安定した、構成を持ったドメイン(「初期ポテンシャル結合ドメイン」、IPBD)を顕示するための遺伝子パッケージを変えることにより完成される。 変更が成功するか否かは、変えられた遺伝子パッケージが親和性分子と結合するか否かを決定することによって簡単に計測される。
    IPBDは、広範な突然変異誘発を許容するということで選ばれた。 IPBDはパッケージの表面に顕示され、親和性選択に従属され、遺伝子をコードしているIPBDは多数の突然変異誘発の特殊なパターンに従属されていることが知られている。 ここで使われている「変化」(variegation)は、各々の単一のポテンシャルな結合ドメイン(IPBDの突然変異体)を顕示する遺伝子パッケージの集団の生産に通じる。 しかしながら、その「変化」は異種ではあるが、構造的に関連を持つポテンシャルな結合ドメイン(PBD S )の一群を全体的に顕示する。 各遺伝子パッケージは、その特殊なパッケージの表面に顕示されたPBDをコードするpbd遺伝子のバージョンを運んでいる。 親和性の選択は、所望の結合特性を持ったPBDsを保持している遺伝子パッケージを識別するために利用され、またこれらの遺伝子パッケージは増幅され得る。 親和性選択と増幅による一度もしくは数度の同位体濃縮のサイクルの後、成功結合ドメイン(SBD s )をコードしているDNAは選択されたパッケージから回収される。
    必要に応じて、SBD支持パッケージからのDNAは、「親のポテンシャル結合ドメイン」(PPBD)としての変化の最終ラウンドのSBDを利用して、PBD sの次の世代へと「変化」していく。 そして満足な結果が得られるまでその操作は続けられる。 IPBDとPBD sの第一世代間の構造的ならびに進化的関係の故に、IPBDもまた「親のポテンシャル結合ドメイン」(PPBD)と考えられている。
    ミクロタンパク質が変化される場合、親の分子に共有的に架橋している残留基は変化されず、それによって配座を安定化する。 たとえば、ミクロタンパク質と結合したジスルフィドの変化の形において、ある種のシステインは不変であるので、発現そして顕示の状況の下では、共有架橋形式(即ち、システインの一つもしくは数個のペアーの間にジスルフィド結合)を作り、そして過敏に変動する線型中間アミノ酸によって取り入れられる配座を十分に拘束している。 言い換えるならば、拘束された足場は、広範にランダム化されたポリペプチドに組み込まれる。
    所望結合特性を持ったミクロタンパク質が一旦特性ずけられると、それは組換型DNA技術によるのみでなく、非生物学的合成の方法でも再生し得る。
    上記請求範囲のとして記載の目的のために、タンパク質Pは、「結合タンパク質」であり、抗体の変動するドメイン以外の、少なくとも一つの分子とイオンあるいは原子種Aにつき、解離定数K D (P,A)<10 -6 moles/liter(望ましくは、<10 -7 moles/liter)。
    上記(1)の「抗体の変動するドメイン」は、明確にするために意図されており、一つのタンパク質は、それは抗原であるということのみで、「結合タンパク質」とは考えられない。
    最大型のタンパク質は、ドメイン(ROSS81)と呼ばれる識別し得る胞子の中に組み込まれている。 タンパク質ドメインは、種々の方法で定義されている。 安定性に重要性を置いている「ドメイン」の定義は、一一高温もしくはカオトロピック(chaotropic)エージェントのような乱し勢力の表に全体の構造を保持している一一好意的であるが、原子コーデイネートとタンパク質配列の同相は完全に無視されない。
    タンパク質のドメインが、選ばれたターゲットと特殊に結合するためのタンパク質の能力に対して第一に責任をとる場合、それは、ここでは、「結合ドメイン」(BD)と呼ぶこととする。
    「換えられたDNA」(variegated DNA)(vgDNA)とは、同等もしくは類似した長さのDNA分子の混合のことであり、アラインメントが行われた場合には、異なった複数のアミノ酸を各コードンにコードする数個のコードンで様々であるが、それは他のコードンの位置に単一のアミノ酸のみをコードする。 換えられたDNAにおいては、コードンは可変であり、与えられた可変のコードンがコードする異なったアミノ酸発生の領域と頻度が、DNAのシンセサイザによって前もって決定されているということが知られている。 たとえ、その混合の中にある個々のDNA分子配列、一つのプリオリ(priori)を知るために、その合成方法を他が知ることを許容しなくてもである。 換えられたDNAの指定された可変のコードンの数は、望ましくは20以下であり、最も望ましい数は5から10である。 各可変のコードンにコードされたアミノ酸の混合はコードンによって異なる。
    換えられたDNAが導入された遺伝子パッケージの集団は「換えられた」と言える。
    この発明の目的として、「ポテンシャル結合タンパク質」(PBP)とは、換えられたDNAの集団にあるDNA分子の一つの種によって コードされたタンパク質を指している。 その中にある変動の領域は、ターゲット物質のための結合ドメインとして働く可能性を持ったポリペプチドの一個もしくはそれ以上のセグメントを一つもしくはそれ以上後続してコードする場合に現れる。
    「キメラタンパク質」(chimeric protein)とは、第一のアミノ酸配列が、第一のタンパク質のドメインとは異なったドメインを持ち、第一のタンパク質とは十分に同族体ではないドメインを定義している 第二のアミノ酸配列と熔融することである。 キメラタンパク質は、第一タンパク質を顕示している一つの有機体の中に見いだされる(異種のタンパク質にも見いだされるが)異種のドメインを現しているのかも知れない。 もしくはそれは異種の有機物によって顕示されたタンパク質構造の「種間」(in-terspecies)、「属間」(intergeneric)その他の融解であるかも知れない。
    この発明に関わるキメラタンパク質の一つのアミノ酸配列は、ここに定義される「遺伝子パッケージ」(GP)の外面タンパク質から典型的に誘導される。 その表面にPBDを顕示している一つはGP(PBD)である。 単一で顕示された場合、第二のアミノ酸配列はタンパク質(もしくはドメイン)の特徴を持っているが、識別し得るドメインとしてキメラタンパク質に組み込まれているものの一つである。 それは、第一のアミノ酸配列(介入しているスペーサーを持った、もしくは持たないで)のアミノもしくはカルボキシーターミナルに出現するか、もしくは第一のアミノ酸配列を中断する。 第一のアミノ酸配列は遺伝子パッケージの表面タンパク質に確実に相当するか、もしくは調節される。 すなわち結合ドメインの顕示を容易にするためである。
    II. ミクロその他のミニタンパク質この発明においては、ジスルフィド結合ミクロタンパク質と金属含有ミニタンパク質は顕示戦術を検証する初期ポテンシャル結合ドメイン(IPBD S )として、また所望のターゲット結合特徴を持ったBDを入手しようと実際に望んでいるPPBD Sとして利用される。 特別に明示されない限り、もしくは文脈によって必要とされない限り、IPBD Sに対する引用はmutatis mutandisに適用されるものであり、PPBD Sも同様である。
    上記事項に続く「請求の範囲」の目的のために、ミクロタンパク質は、およそ6基から40基の残留基を持っている。 ミクロタンパク質はミニタンパク質のサブセットであり、それらは、およそ60基以下の残留基を持っている。 ミクロタンパク質はミニタンパク質のサブセットを構成するので、便宜上ミニタンパク質という語彙がジスルフィド結合ミクロタンパク質ならびに金属調整ミニタンパク質の両方に対し、必要に応じて引用される。 IPBDは既知の結合活動を持ったミニタンパク質であり、もしくは既知の結合活動を持ってはいないが、結合活動(裂けめ、溝、その他)に寄与する第二位もしくはそれより高い構成を持っているものの一つである。 IPBDが既知の結合活動を持っている場合には、ターゲット物質に対する特殊の親和性を持つ必要はない。 IPBDは、天然に発生するミニタンパク質とその配列が同一のものである必要はない。 それは、既知のミニタンパク質の配列と「十分に相当する」アミノ酸配列と「同族体」であるかも知れないし、もしくはそれは完全に人工的なものかも知れない。
    配列が「十分に相当する」していると考えられるか否かを決定するためには、次の事項を考える必要がある。 すなわち、配列が、基準演算規則に従って最善にフィットするよう調節されている場合の配列の類似程度、架橋(すなわち、ジスルフィド結合)の連結性パターンにおける類似点、X線回折分析もしくはNMRによって表示される場合、類似の三次元構成を持っているタンパク質の度合い、そして配列されているタンパク質が類似の生物学的活動を持っていることに対する度合い。 この文脈の関連で、セリンプロテアーゼ阻害剤の中で、配列の30パーセントが相同である一組のメンバーがあり同族体であると認証されているタンパク質のグループがある。
    IPBDの候補は次の基準を満足させる必要がある。 すなわち、
    1)ドメインは、意図された使用の状態下で安定に保たれて存在する(ドメインは、挿入されるタンパク質の全部を包含する。すなわち、アルファコノトクシンGI(OLIV90a)、もしくはCMTI−III(MCWH89)、
    2)アミノ酸配列の知識は手に入れることができる、そして3)IPBDに対する特殊なそして高い親和性を持っている分子は手に入れることができる。 これは、AfM(IPBD)と省略される。
    IPBD(AfM(IPBD))に対する親和性を持っている分子の単一の種属が手に入るとしたら、それは下記の事項に利用されるだろう。 すなわち、a)GP表面のIPBDの検出、b)マトリックス上の親和性分子の顕示レベルと密度の最適化、そして、c)親和性分離操作の効率と敏感性の決定。 AfM(IPBD)の二つの種族が手に入るとするならば、一つは高いそしてもう一つは中間のIPBDに対する親和性を選ぶのである。 高い親和性を持った種属は初期検出と、効率と敏感性を決定するために 利用されるだろう。 そして中間の親和性を持った種属は最適化を知るために利用されるだろう。
    IPBDそれ自体が既知の結合タンパク質ではない場合には、もしくは、その天然のターゲットが浄化されない場合には、IPBDに対して作られた抗体が親和性分子として利用されるかも知れない。 この目的のための抗体の利用は、抗体が最後のターゲットであると考えるべきではない。
    数多くのIPBD候補があるが、その候補のために上記の情報が全部入手できるし、入手するのは適当に実際的である。 たとえば、CMTI−III(29残留基)(CMTI−タイプの阻害剤は、OTLE87、FAVE89、WIEC85、WIEC85、MCWH89、BODE89、HOLA89aとbに述べられている)、熱に対して安定しているエンテロトキシン(E.coliのST−la)(18残留基)(GUAR89、BHAT86、SEKI85、SHIM87、TAKA85、TAKE90、THOM85aとb、YOSH85、DALL90、DWAR89、GARI87、GUZM89、GUZM90、HOUG84、KUBO89、KUPE90、OKAM87、OKAM88、そしてOKAM90)、アルファコノトキシンGI(13残留基)(HASH85、ALMQ89)、ミューコノトキシンGIII(22残留基)(HIDO90)、そして、コナスキングコングミクロタンパク質(27残留基)(WOOD90)を含んでいる。 構成に関する情報はX線もしくはニュートロン回折研究、NMR、科学薬剤架橋もしくはラベル、関連を持ったタンパク質の既知の構造からのモデル、もしくは論理的計算である。 3D構成情報はX線回折、ニュートロン回折もしくはNMRが推薦できる。 その理由はこれらの方法は既定された限界内に原子の殆ど全部を位置ずけることができる。 第50表が所望される幾つかのIPBD Sを挙げている。
    突然変異はPBDの安性を減少するかも知れない。 したがって、選ばれたIPBDはできるならば、高い溶解温度、すなわち少なくとも摂氏50度であることが望ましい、そして広いpH領域で安定していることが望ましい。 すなわち8.0から3.0の間が望ましく、11.0から2.0の間が最も望ましい。 それによってSBDsが突然変異により選ばれたIPBDから引き出され、結合をとうしての選択が十分な安定性を保持する。 望ましくは、種々のPBD Sを作り出しているIPBDの代替物が、ドメインの融点を摂氏でほぼ40度以下に下げないことである。 ミニタンパク質は、一つもしくはそれ以上のジスルフィドのような共有的な架橋を持っていることが役に立つことであり、それらが十分に安定性を確保するだろう。
    試験管内で、ジスルフィドの橋は空気の酸化の結果としてポリペプチド中に自然に形成され得る。 生体内でのことは勿論それ以上に複雑である。 ごく少数の細胞内のタンパク質はジスルフィドの橋を持っているが、多分それは強い還元の環境がグルタチオンシステムによって保持されているためであろう。 ジスリィドの橋は、動きまわるタンパク質に普通存在しているし、もしくはヘビの毒素やその他の毒素(たとえば、コノトキシン、カリブドトキシン(charybdotoxin)バクテリア性エンテロトキシン)、ペプチドホルモン、消化酵素、補足タンパク質、免疫グロブリン、リゾチーム、プロテアーゼ阻害剤(BPTIとそのホモローダ、CMTI−III(とうなす[ククールブタマクシマ−−cucrbita maxima]トリプシン阻害剤III)そしてそのホモローグ、ヒルジン、その他)そしてミルクのタンパク質のような細胞内の場で動いているタンパク質に存在している。
    強硬な細胞内鎖のループを閉ざすジスルフィド結合は、ペプシン、チオレドキシン、インシュリンA鎖、絹のフィブロイン、そしてリポアミドデヒドロゲナーゼの中で発見されている。 橋架けをしているシステイン残留基は、ポリペプチド鎖にそった一つから四つの残留基によって隔離されている。 モデルビルデイング、X線回折分析、そしてNMR研究は、そのようなループのアルファカーボンパスは、通常平らであり頑強であることを示している。
    免疫グロブリンの中に2種類のジスルィドの橋がある。 一つは保存された細胞内橋で、アミノ酸残留基を60から70持っており、殆どすべての免疫グロブリンのドメインに繰り返して発見される。 互いに競いあっているベータシート間に深く埋められているこれらの橋は、溶剤から守られており、そして変性剤の存在下でのみ普通還元され得る。 その他のジスルフィドの橋は主に細胞内の結合であり、分子の表面に存在している。 これらの橋は溶剤に接近可能であり、また比較的簡単に還元される。 (STEI85)。 この発明によるミクロタンパク質のジスルフィドの橋は、より小型の鎖間隔を持っているシステイン間の内鎖のつながりである。
    ミクロタンパク質が複数のジスルフィド結合を持っている場合には、少なくとも二つのシステインの群れであることが望ましい。 すなわち、それらは鎖に直接隣接しているか、もしくは単一のアミノ酸(−C−X−C−)で隔離されていることが望ましい。 いずれの場合でも、二つのシステインの群れは、立体障害という理由のために相互に一対となることは不可能である。 そしていくつかの実現可能な位相は還元される。
    16の残留期を持つポリペプチドの3個から8個のアミノ酸を連結している一つの内鎖ジスルフィド橋は、4のスパンを持っていると言えよう。 4から12のアミノ酸がジスルフィド結合している場合には、それらは7の第二のスパンを形成する。 両方で、四つのシステインがポリペプチドを四つのシステイン内セグメント(1−2、5−7、9−11、そして13−16)に分割する。 (Cys3とCys4間にはセグメントが存在しないと言うことを観察してください。)クロスリンクしたミクロタンパク質の連結のパターンはクロスリンクの終端の相対的位置の単純なものである。 たとえば、二つのジスルフィド結合を持ったミクロタンパク質にとって、連結のパターン「1−3、2−4」は次のことを意味している。 すなわち、第一のクロスリンクのシステインは第三のクロスリンクのシステイン(最初の配列における)と結合したジスルフィドであり、第二のクロスリンクのシステインは第四のそれと結合している。
    クロスリンクがミニタンパク質の配座の自由を拘束する度合、そしてそれがミニタンパク質を安定化する度合は、種々の方法で概算することができるであろう。 それらは下記の方法を含んでいる。 すなわち、吸収分光学(アミノ酸が埋められているか晒されているかを検出する)、円形二色性学(タンパク質のらせん含有の一般図を提供する)、核磁気共鳴映像(特殊な化学的環境における数個の核を示す、それと同時に核の移動性を示す)、タンパク質結晶のX線もしくはニュートロン回折分析等である。 ミニタンパク質の安定性は、温度、pH、その他の機能として種々の波長で吸収の変化をモニターすることによって確実なものとすることができるであろう。 埋められた残留基はタンパク質が組み込みから解放される時に晒されることになる。 同様に、変性状態の結果としてのミニタンパク質の解除は、NMRライン位置と幅に変化をもたらす。 円形二色性(CD)スペクトルは配座に対して極度に敏感である。
    この発明による換えられたジスルフィド結合のミクロタンパク質は、いくつかのクラスに分けられる。 すなわち、
    クラスIミリロタンパク質は、ジスルフィド結合を形成するために相互作用し得る一組のシステインを特徴としているものであり、その結合はおよそ9以下の残留基のスパンを持っている。 このジスルフィドの橋は、望ましくは、少なくとも二つの残留基のスパンを持っていることであり、これはジスルフィドの幾何学的機能である。 間隔が二つもしくは三つの残留基である場合には、一つの残留基は、望ましくは、橋を架けている残留基の緊張を少なくするためにグリシンが適当である。 間隔の上限はそれほど精密でなくともよいが、通常、間隔が大きければ大きいほど、ジスルフィド結合によって線状の中間アミノ酸残留基に課せられる配座の拘束物が少なくなる。
    このようなペプチドの主な鎖が許される自由は極端に少ないが、緊張はない。 ジスルフィドが形成される時に放出されるフリーエネルギーは、システインをともにもたらす配座に閉じ込められた時、主な鎖によって失われたフリーエネルギーを越えるものである。 ジスルフィド生成時のフリーエネルギーの喪失によって、サイドグループの近位末端は相互に固定された関係を保持している。 ターゲットに結合された場合には、ドメインは、正しい配座に入るためにフリーエネルギーを消費する必要はない。 ドメインは、他の配座にジャンプして、ターゲットではないものと結合することはできない。
    4から5のスパンを持ったジスルフィド橋が特に望ましい。 スパンが6になると拘束の影響が減少する。 この場合、少なくとも封鎖された残留基の一つが主鎖の幾何学的形状に制限を課すアミノ酸であることが望ましい。 プロリンは最大の制限を課し得る。 バリンとイソロイシンは主鎖により少ない制限を課し得る。 この拘束を課している非システイン残留基の好ましい位置は不変システインの一つに隣接することである。 しかしながら、それはたの橋を架けている残留基の一つであるかも知れない。 スパンが7の場合には、主鎖配座を制限している二つのアミノ酸を加えることが望ましい。 これらのアミノ酸は7つの位置のどれでも良い。 しかし望ましくは、システインに直接隣接している二つの橋を架けている残留基である。 スパンが8もしくは9の場合には、拘束しているアミノ酸の数を増しても良い。
    クラスIミクロタンパクが40までのアミノ酸を保持し得るとしも、アミノ酸の数は20以下の方が望ましい。
    ジスルフィド結合のクラスIミクロタンパク質は溶剤に晒される。 そのために、GPsの換えられた集団を晒すことを避けなければならない。 そのGPsの換えられた集団は、ジスルフィドを破壊する試薬液にクラスIミクロタンパク質を顕示する。
    クラスIIミクロタンパク質は、9以上のアミノ酸のスパンを持った単一のジスルフィド結合を特徴としているものである。 橋を架けているアミノ酸は、配座を安定化するために役立つ二次的構造を形成する。 望ましくは、これらの中間アミノ酸が、下記に示された概要のようなヘヤピン超二次的構造を形成することである。

    既知のタンパク質に関する研究をもとに、アルファヘリックス、ベータストランド、


    もしくはインメルマン反応に見いだされる特殊残留基、もしくは特殊ジプペチドまたはトリペプチドの性向を計算することができる。 これらの二次的構造の中のアミノ酸残留基の通常の発生回数がCREI84の表6−4に記載されている。 アミノ酸配列からの二次的構造の予想についての詳細な取扱に関しては、SCHU79の第6章を参照のこと。


    適切なヘヤピン構造をデザインするためには、三次元配座が知られているタンパク質から実際の構造をコピーすることができるし、発生回数データを利用してデザインすることもできるし、上記二つの方法を統合してデザインすることもできる。 望ましくは、一つもしくはそれ以上の実際の構造をモデルとして用い、そして発生回数データはその構造の邪魔をすることなく製造できる構造を決定するのに使うのである。


    望ましくは、3つ以下のアミノ酸がシステインとアルファヘリックスもしくはベータストランドの始めもしくは終わりの間に介在かることである。


    もっと複雑な構造(ダブルヘヤピンのようなもの)も可能である。


    クラスIIIaミクロタンパク質は、二つのジスルフィドの結合を特徴としている。 これらもまた、選択的に、上記クラスIIミクロタンパク質に関連して記述した二次的構造を特徴としている。 二つのジスルフィド結合では三つの位相が可能である。 お望みならば複数のジスルフィド結合可能の位相が、熱に対して安定性を示すエンテロトキシンST−IAに存在する一群のシステインによって還元されるかも知れない。


    クラスIIIbミクロタンパク質は、三つもしくはそれ以上のジスルフィド結合を特徴としている。 そして望ましくは、前述したように、少なくともいつ群のシステインを持つことである。


    金属フィンガーミニタンパク質。 この発明はまた、ジスルフィド結合によるクロスリンク以外のミニタンパク質に関わるものである。 すなわち、フィンガータンパク質のアナローダである。 フィンガータンパク質は、フィンガー構造によって特徴ずけられている。 その構造のに中で、金属イオンが四面体設置を形成している二つのCysと二つのHis残留基によって調整されている。 金属イオンは、亜鉛(II)であることが主であるが、時として、鉄、銅、コバルト、その他であることもある。 「フィンガー」は、多数の配列(PheもしくはTyr)−(1 AA)−Cys−(2−4 AAs)−Cys−(3AAs)−Phe−(5 AAs)−Leu−(2 AAS)−His(3 AAS)−His−(5 AAS)である。 (BERG88,GIBS88)。 フィンガータンパク質は、典型的にフィンガーモチーフの多数の繰り返しを持っており、一つのフィンガーは亜鉛イオンの存在中に織り込まれていることが知られている。 (FRAN87,PARR88)。 二つのフィンガーがDNA結合に必要か否かはまだ議論の余地がある。 この発明は、一つもしくは二つのフィンガーを持ったミニタンパク質に関わるものである。 サイドグループの他の組み合わせは多価金属イオンに関連を持つクロスリンクの形成に導くものである。 たとえば、Summers(SUMM91)は、一つの18−アミノ酸ミニタンパク質がHIV−1−F1のカプシド(capsid)タンパク質で発見されたと報告している。 それは亜鉛原子と結合している三つのシステインと一つのヒスチジンを持っていた。 ターゲットは必ずしも核酸でなければならないことはないと言うことを理解すべきである。


    G. 調整されたPBSs


    下記のタンパク質のあ種のサイドグループを選択的に調整し得るいくつかの酵素と化学的試薬液がある。 それらは、a)タンパク質−チロジンキナーゼ、EIImans試液、メチルトランスフェラーゼ(メチラートGLUのサイドグループ)、セリンキナーゼ、プロリンヒドロキシアーゼ、GLUをGLAに変換するビタミンK依存酵素、無水マレイン酸、そしてアルキル化剤を含んでいる。 これらの酵素もしくは試薬液の一つをもったGPs(PBD)の換えられた集団の取扱は、選ばれた酵素もしくは試薬液によって影響されたサイドグループを調整する。 GPを破壊しない酵素もしくは試薬液は、非常に望ましいものである。 サイドグループのそのような調整は顕示されたPBDsの結合特性に直接影響を及ぼす。 親和性分離の方法を利用して、予め定められたターゲットと結合する調整されたGPsを我々は強化しようとしている。 活性結合ドメインは、全部遺伝的に規定されているのではないから、各強化の場で形態発生後の調整を繰り返す必要がある。 この方法は、これらのSBDsの化学的合成を心に描いているので、ミニタンパク質IPBDsにとっては特に適切である。


    III. 変化戦術−−望ましい多様性を持ったポテンシャル結合ドメインを入手するための突然変異誘発III. A. 一般的事項数個のドメインの突然変異によって入手し得る異なったアミノ酸配列が大きく、発見し得る量で顕示し得るいくつかの異なったドメインと比較された時、強制的進化の有効性は残留基が多様性を持つように注意深く選択することによっておおきく高められる。 先ず、


    結合活動(すなわち、表面にある残留基)に影響を及ぼす可能性のある既知のタンパク質の残留基そしてその安定性を不必要に低下させない既知のタンパク質の残留基は識別された。 これらの残留基をコードしているコードンの全部もしくは一部は、


    DNAの換えられた集団を作り出すために次々に換えられていく。 次々に一つのターゲット分子に触れる表面に十分に近く存在する残留基のグループは、同時変化のために、用意されたセットである。 DNAの換えられた集団は種々なポテンシャル結合ドメインを顕示するために利用される。 そして興味のあるターゲットとの結合をなしとげる能力が評価される。


    この発明による方法は、上記のようにして、さらに、生産され高度に換えられた集団の性格において、そして新規の結合タンパク質が択ばれると言うことからも、他の方法に比して傑出している。 我々は、顕示されたポテンシャル結合ドメインが、効果的で組織だてられた方法で関連性を持った隣接しているアミノ酸配列の「配列スペース」を抜き取るよう強制する。 四つのゴールが、ここで利用される様々な変化を導く。 望ましくは、1)大多数(すなわち、10

    7 )の変形が利用可能となる、2)高い歩合の可能性変化が検出し得る量で現れる、3)望ましい変化の現れの頻度が相対的に一定している、そして4)変動が限られた数のアミノ酸残留基にのみ発生する。 最も望ましくは、変動がポテンシャル結合ドメインの表面の共通領域方向に導かれたサイドグループを持つ残留基に発生することである。


    この方法は、遺伝子を調整する放射線とヒドロキシルアミンのような無差別的突然変異誘発剤の単純な使用とは区別されるべきである。 無差別突然変化誘発剤の使用では、突然変異の部位はコントロールされることもなく、非常に片寄っている。 多くの突然変異は、結合ドメインの部分ではない残留基に影響を及ぼしている。 化学的突然変異誘発物質がゲノム全体に導かれた場合ほとんどの突然変異は、ポテンシャル結合ドメインをコードしているそのものより他の遺伝子に発生する。 さらに、合理的レベルの突然変異誘発においては、調整されたコードンが単一ベース変化によって特徴ずけられる可能性があるので、限られたそして片寄った可能性の領域のみが探求される。 同様に、遠隔(remote)はランダムされない配列の突然変異誘発物質であるオリゴヌクレオチドを利用する特殊部位突然変異誘発技術の利用である。 これらの専門技術は、多数の変形の生産と検査に関わってはいない。 注意を集めているランダム突然変異誘発の専門技術は知られているが、変動分布をコントロールすることの重要性は見逃されている。


    ポテンシャル結合ドメインは最初アミノ酸レベルでデザインされる。 一度、どの残留基が突然変異誘発されるかを識別すれば、そしてどの突然変異がその部位で行われるかを識別すれば、種々のPBD

    Sをコードしている換えられたDNAをデザインすることができる。 コードされたPBD

    Sによって、PBDがターゲットに対する親和性を持っていればそれは検出されるという合理的な確率を保証する。 勿論、数多くの入手した独立した形質転換物そして親和性分離専門技術は、変化の単一ラウンド内で可能な変化の度合いに制限を課すだろう。


    タンパク質中に多様性を作り出すために様々な方法がある。 (RICH86、CARU85、そしてOLIP86参照のこと。)一つの極端は、出来るかぎり多数のタンパク質の中のほんの少数の残留基を換えているとである。 (なかんずく、CARU85、CARU87、RICH86、そしてWHAR86参照のこと。)この方法を「集束突然変異誘発」(Focused Mutagenesis)と呼ぶことにする。 典型的な「集束突然変異誘発」戦略は、一セット5から7までの残留基を取り出し、13から20までの可能性で各々を変える。 突然変異誘発の他のプラン(「拡散突然変異誘発」)は、より制限された選択のセットをとうしてより多数の残留基を替えることである。 (VERS86aとPAKU86を参照のこと。)採用した変化(variegation)のパターンはこれらの極端な例の中間に存在する。 すなわち、20のアミノ酸をとうして二つの残留基が替えられ、たった二つの可能性をとうしてあと二つが替えられ、そして5番目は20のアミノ酸の10が換えられた。


    同時に換えられるコードンの数は制限されない。 しかしながら、可能なPBD配列が、すくなくとも一つの遺伝子パッケージによって真実に顕示されると言う合理的な確立を生み出す突然変異誘発戦略を採用することが望ましい。 のぞましくは、vgDNAによってコードされたミューテイン(mutein)そして各替えられた部位における最も好まれないアミノ酸から成っているミューテインがライブラリー中で少なくとも独立した形質変換物によって顕示される確率は、少なくとも0.50であり、望ましくは0.90である。 (より好まれているアミノ酸から成るミューテインは、勿論、その同じライブラリー中に発生する可能性がある。)


    望ましくは、変化は、10褶曲以下の異なったDNA配列(さらに望ましくは、3褶曲以下の)による異なった10

    6 −10

    7のアミノ酸配列を顕示する典型的な形質転換物集団をもたらすことである。


    アルファヘリス(helices)とベータストランド(strands)を持っていないクラスIミクロタンパク質に関しては、いかなる突然変異の場においても、望ましくは、各々が4から8の非システインコードンを替え、それによって、それらの各々がポシブルな20のアモノ酸の中少なくとも8をコードすることである。 各コードンの変化はその部位に特別に替えられ得る。 望ましくは、システインがポテンシャル代替物の一つではない、たとえシステインがその中に含まれていたとしても。


    ミニタンパク質が金属フィンガータンパク質である場合には、典型的な変化戦術においては、二つのCysと二つのHis残留基、そしてオプションとしての前述のPhe/Tyr、PheとLeu残留基は不変であり、そして複数(普通5から10)の他の残留基は換えられる。


    ミクロタンパク質が、一つもしくはそれ以上のアルファヘリスとベータストランドを特徴としているタイプである場合には、いかなる与えられた部位においてもポテンシャルなアミノ酸調整のセットは、その部位における第二次的構造を破壊しないものを取り入れることが望ましい。 各可変のアミノ酸における可能性の数は限られているので、可変アミノ酸の全数は選択過程における抜粋有効性を替えることなく大きくなるであろう。


    クラスIIIミクロタンパク質にとって、のぞましくは、20以下、さらに望ましくは5から10のコードンが変化することである。 しかしながら、拡散誘発物質が利用される場合には、変化させられたコードンの数は多くなり得る。


    変化が通常指定された可変コードンにおいて一つのアミノ酸が他との代替に関係するような場合には、アミノ酸の挿入もしくは消滅に関連する可能性もある。


    III. B. 換えられる残留基の識別さて、換えられるIPBDの残留基の選択を助ける原理について考えよう。 礎になる理論は、構成されたタンパク質のみが特殊結合を顕示すると言うことである。 すなわち、上記のタンパク質が、他の大多数を除外して特殊な化学的物質と結合することができる。 このようにして、換えられる残留基は、基礎的なIPBD構造の保存と言う目的をもって選択される。 褶曲構造からPBDをしめだす代替物質は、GPsが無差別に結合する遺伝子を担動する原因となるので、それらは簡単に集団から取り去ることができる。 溶液に晒されたアミノ酸代替物質は、内部座にある代替物質である三次元構造に影響を及ぼすことはあまりない。 (PAKU86、REID88a、EISE85、SCHU79、169-171ページ、そしてCREJ84、239-245、314-315ページを参照のこと)。 内部残留基は往々にして保存され、そしてアミノ酸タイプは、タンパク質構造が破壊されるかも知れないリスクなしに意義ある異なったタイプに換えることは不可能である。 しかしながら、IからLにもしくはFからYへのような内的残留基の保守的変化は見逃される。 そのような保守的変化は、隣接タンパク質残留基の配置ならびに原動力に微妙に影響し、そしてそのような「繊細な調節」はSBDが一度見いだされると有用となる。 挿入および削除はどこよりもループ内でより容易に許容される。 (THOR88)。


    IPBDに関するデータならびに変化サイクルにおいて変化する残留基を決定するのに役に立つターゲットに関するデータは次を含む。 すなわち、1)構造、もしくは少なくともIPBD表面にある残留基のリスト、2)IPBDにホモローグの配列のリスト、そして3)ターゲット分子のモデルもしくはターゲットのスタンドイン、である。


    III. C. 各親残留基のための代替物セットの決定換えるための残留基を選択してから、各可変残留基に許容するアミノ酸の領域が決定される。 全レベルの変化は、各変化した残留基における変形体の数である。 各変形した残留基は、2から20の異なった可能性物質を産出し、変化の異なったスキームを持っている。 特定の変化されたコードンによってポテンシャルにコードされたアミノ酸セットは、「代替セット」と呼ばれる。


    Milligen7500のようなDNA合成剤をコントロールしているコンピュータは、いくらかのnt基剤(すなわち、ntホスホラミジット−−phorphoram-idites)を利用して、二つもしくはそれ以上のリザーバ(reservoir)からnts配分の役割を持ったオリゴntのベースを合成することができる。 あるいは、nt基剤は他の比率で混合され、「汚れたビン」と呼ばれる合成のためのリザーバの一つに入れられる。 コードンの各ヌクレオチド部位にある基剤の「混合物」は、そのコードンによってコードされた異なったアミノ酸の相対的発生頻度を決定する。


    簡単に変化されたコードンは、ヌクレオチド部位が退化でありものであり、等モル比で混合された二つもしくはそれ以上の基の混合から入手されるものである。 これらの混合は基準化された「あいまいなヌクレオチド」コードによってこの明細書に記述されている。 このコードの中に、たとえば、退化コードン「SNT」の中の、「S」はGとB基の等モルの混合物であり、「N」は全四基の等モルの混合物であり、「T」は単一の不変基チミジンである。


    複雑に変化させられたコードンは、二つもしくはそれ以上の基剤の等モルの混合ではない一つの基剤によって、少なくとも、三つの部位の中の一つが充たされたものである。


    簡単に変化されたコードンでも複雑に変化されたものでも、望ましい代替セットを作ることができる。 特殊アミノ酸もしくはアミノ酸のクラスが適切であることを表示している情報がない場合には、発見し得るレベル以上のミニタンパク質の表示は不経済なので、同等の確率をもった全アミノ酸を代替するよう努力している。 一つのコードン(NNN)の各部位にある四つのntsの同等量は、各アミノ酸がコードしているコードンの数に比例して存在するアミノ酸分布を産出する。 この分布は、一つの酸の残留基に対して二つの基本的残留基を与えると言う不利な点を持っている。 さらに、WもしくはMの6倍ものR、S、そしてLが発生する。 五つのコードンがこの分布で合成されたら、L、R、そしてSのいくつかの組み合わせをコードしている243配列の各々は、WとMのいくつかの組み合わせをコードしている32配列の各々より7776倍豊富である。 発見し得るレベルで五つのWsプレゼントを持つためには、7776以上の折りたたみで、各(L、R、S)配列プレゼントを持たなければならない。


    特殊なアミノ酸残留基は、いくつかの方法で定義されたポリペプチドの三次元構造に影響を及ぼすことができる。 すなわち、


    a)ポリペプチドの主鎖の柔軟性に影響を及ぼす、


    b)疎水性グループを加える、


    c)電荷グループを加える、


    d)原子結合を許す、


    e)ジスルフィド、金属イオンとのキレーション、もしくは生体代行機器グループとの結合などのクロスリンクを形成する。


    Lundeen(LUND86)は、三次元構造として知られているタンパク質に存在するヘリス、ベータストランド、ターン、そしてコイルのアミノ酸の頻度の表を作成し、遊離チオールグループを持っているCYSsと半シスチンを区別した。 遊離CYSはヘリックスに最も数多く発見され、半シスチンはベータシートに最も数多く発見されたと報告している。 しかしながら、半シスチンはヘリスに定期的に発見されている。 Peaseら(PEAS90)は、二つのシスチンを持つペプチドを構造した。 各々の一つの端は真実に安定したアルファヘリックスにある。 アパアミンは同様な構造を持っている。 (WEMM83,PEAS88)。


    柔軟性:


    GLYは二つの水素がC

    アルファに付着した最も小さいアミノ酸である。 GLYはC

    ベータを持っていないので、GLYは主鎖に最大柔軟性を委ねる。 このようにして、GLYはインメルマン反転に頻繁に発生する。 PRO、ASP、SER、そしてTHRに特に頻繁に発生する。


    ALA、SER、CYS、ASP、ASN、LEU、MET、PHE、TYR、TRP、ARG、HIS、GLU、GLNそしてLYS等のアミノ酸は、枝なしベータを持っている。 勿論、サイドグループであるSER、ASPそしてASNは、主鎖と水素結合を頻繁に行い、それによって、勢力的に他に望ましくない配座を主鎖に付けることができる。 VAL、ILEそしてTHRは、延長された主鎖配座をより望ましいものとしている枝分かれベータカーボンを持っている。 このようにして、VALとILEはベータシートの中に最も頻繁に見られる。 THRのサイドグループが容易に主鎖と水素結合を形成することができるので、ベータシートに存在する傾向は少ない。


    プロリン主鎖は巡回サイドグループによって特に制約される。 ファイ度は、常に60度に近い。 大多数のプロリンはタンパク質の表面で発見される。


    電荷:


    LYSとARGは、各々10.4もしくは12.0以下のpHにおいて単一正電荷を保持する。 いかなる場合でも、各々4と5のアミノ酸を持ったメチレングループは、疎水性相互作用が可能である。 ARGのグアニジニュームグループは、LYSのアミノ酸グループがたった三つの水素を同時に寄与できないのに、五つの水素を同時に寄与することができる。 さらにまた、これらのグループの幾何学は異なっているので、これらのグループは時として交換され得ない。


    ASPとGLUは、各々−4.5と4.6以上のpHにおいて単一負電荷を保持する。 ASPが一つのメチレングループしか持っていないので、いくつかの疎水相互作用が可能である。 ASPの幾何学は主鎖窒素と水素結合を形成する役を演ずる。 その窒素はインメルマン反転の中に頻繁に発見されるASPと一貫しており、ヘリスの初頭にある。 GLUは、アルファヘリスの中に頻繁に発見され、特にこれらヘリスのアミノ酸末端位置に発見される。 その理由は、サイドグループの負電荷がヘリックス双極子と安定化のための相互作用を持つためである。 (NICH88、SALI88)。


    HISは、生理学的領域、viz. 6.2におけるイオン化パッケージを持っている。 このパッケージは、電荷されたグループの近接位置で、もしくは水素授与者もしくは受納者の近接位置で換えられる得る。 HISは亜鉛、銅、そして鉄のような金属イオンと結合することができる。


    水素結合:


    電荷されたアミノ酸の他に、SER、THR、ASN、GLN、TYRそしてTRPは水素結合に参与することができる。


    クロスリンク:


    最も重要なクロスリンク形式は、チオールのCYS残留基間で形式されたジスルフィド結合である。 適切な酸化環境の中で、これらの結合は自然に形式される。 これらの結合はタンパク質もしくはミニタンパク質の特殊な配座を非常に安定したものとすることができる。 酸化されたチオール試薬液と還元されたチオール試薬液の混合液が存在する場合、最も安定した配座の支配を許容する変換作用が行われる。 タンパク質とペプチドの中のジスルフィドに関しては、KATZ90、MATS89、PERR84、PERR86、SAUE86、WELL86、JANA89、HORV89、KISH85、そしてSCHN86を参照すること。


    特殊な酵素を必要としないで形成される他のクロスリンクは下記のとうりである。 すなわち、


    1)(CYS)

    4 :Fe ルブレドキシン(CREI84、376ページ)


    2)(CYS)

    4 :Zn アスパルテート トランスカルバミラーゼ(CREI84、376ページ)とZn−フィンガー(HARD90)


    3)(HIS)

    2 (MET)(CYS):Cu アズリン(CREI84、376ページと基本「ブルー」Cuキューカンバータンパク質(GUSS88)


    4)(HIS)

    4 :Cu CuZn過酸化ジスムターゼ5)(CYS)

    4 :(Fe

    4

    4 ) フェレドキシン(CREI84、376ページ)


    6)(CYS)

    2 (HIS)

    2 :Zn アエンーフィンガー(GIBS88、SUMM91)


    7)(CYS)

    3 (HIS):Zn アエンーフィンガー(GAUS87、GIBS88)


    (HIS)

    2 (MET)(CYS):Cuを持っているクロスリンクは、HISとMETがCuなしにクロスリンクを形成できないと言うポテンシャルな優位性を持っている。


    簡単に換えられたコードン次の簡単に換えられたコードンは、それらがアミノ酸の相対的にバランスのとれたセットをコードするので有用である。 すなわち、


    1)SNTは次のセット(L、P、H、R、V、A、D、G)をコードする、すなわちa)一つの酸性物質(D)と一つのベース(R)


    b)脂肪族(L、V)と芳香疎水族(H)の両方c)大型(L、R、H)と小型(G、A)サイドグループd)堅固(P)と柔軟(G)アミノ酸e)一度コードされたアミノ酸2)RNGは次のセット(M、T、K、R、V、A、E、G)をコードする、すなわちa)一つの酸性物質と二つのベース(最適のものではなく許容されるもの)


    b)親水性物と疎水性物c)一度コードされたアミノ酸3)RMGは次のセット(T、K、A、E)をコードする、すなわちa)一つの酸性、一つのベース、一つの中性の親水性物b)三つの希望されたアルファヘリスc)一度コードされたアミノ酸4)VNTは次のセット(L、P、H、R、I、T、N、S、V、A、D、G)をコードする、すなわち、


    a)一つの酸性物質と一つのベースb)全クラス:電荷物、中性親水性物、疎水性物、堅固物と柔軟物、その他c)一度コードされたアミノ酸5)RRSは次のセット(N、S、K、R、D、E、G

    2 )をコードする、すなわちa)二つの酸性物質と二つのベースb)二つの中性親水性物質c)二度コードされた単一グリシン6)NNTは次のセット(F、S、Y、C、L、P、H、R、I、T、N、V、A、D、G)をコードする、すなわちa)15の異なったアミノ酸を提供する16のDNA配列。 セリーンのみが繰り返され、他は同じ量で存在する。 (これはライブラリーの極度に有効な抜き取りを許容する。)


    b)これらは同数の酸とベースのアミノ酸である(DとR一つ宛)


    c)アミノ酸の全主要クラスが存在する。 すなわち、酸性、ベース、脂肪性疎水性物質、芳香疎水性物質、そして中性疎水性物質7)NNGは次のセット(L

    2 、R

    2 、S、W、P、Q、M、T、K、V、A、E、G、ストップ)をコードする、すなわちa)アルファヘリス(L、M、A、Q、K、E、そして、S、R、Tに対してより少ない程度で)の配座を好む残留基の公正で優位なものb)13の異なったアミノ酸をコードする。 (VHGは、NNGによってコードされたセットのサブセットをコードする。それは、同等の酸とベースを持った、9つの中で5つがアルファヘリックスを好む、9つの異なったDNAの中にある9つのあみノ酸をコードする。)


    初期変化のために、NNTが、大多数の場合、好まれる。 しかしながら、アミノ酸がアルファヘリックスに組み込まれるのをコードンがコードする場合には、NNGがNNTより好まれる。


    下記に、効率に関して数個の簡単な変化を分析する。 それによって、ライブラリーは抜き取りを行うことができる。


    (NNK)

    6によってコードされたランダムヘキサペプチドのライブラリーが報告されている。 (SCOT90、CWIR90)。 表130は、そのようなライブラリーの期待された行為を示している。 NNKは、PHE、TYR、CYS、TRP、HIS、GLN、ILE、MET、ASN、LYS、ASP、そしてGLU(アールファセット)のために単一コードンを作成し、VAL、ALA、PRO、THR、そしてGLY(ファイセット)の各々のために二つのコードンを作成し、LEU、ARG、とSER(オメガセット)の各々のために三つのコードンを作成する。 表130Aに示されているように、これらのセット各々からのアミノ酸の数に従って、64、000、000の可能配列を28のクラスに分割した。 最大クラスは、14.6パーセントにほぼ等しい可能配列を持ったファイオメガ四つのアルファである。 選択は別として、一クラスの全配列は、生産される同一の可能性を持っている。 表130Bは、(NNK)

    6ライブラリーから取られた任意DNA配列が、定義されたクラスの一つに属しているヘキサペプチドをコードする確率を示している。 たったの6.3パーセントにほぼ等しいDNA配列がこのファイオメガ四つのアルファクラスに属していることに注意して下さい。


    表130C、は数個の独立した配座(すなわち、10

    6 、3・10

    6 、10

    7 、3・10

    7 、10

    8 、3・10

    8 、10

    9 、3・10

    9 )を持っているライブラリーのために各クラスにある期待された数の配列を示している。 10

    6独立した配座(ITs)では6つのオメガクラスの56パーセントを見ることを期待しているが、6つのアルファクラスのたったの0.1パーセントにすぎない。 見られた大多数の配列は、10パーセント以下がサンプルされたクラスから来ている。 たとえば、二つのファイ二つのオメガ二つのアルファのクラスからのペプチドが、ターゲットと結合するためにライブラリーを分割することによって単離されることを考えてください。 単離配列に関連ずけられているペプチドに関してどの位の知識を持っているか考えてください。 たった4パーセントの二つのファイ二つのオメガ二つのアルファのクラスがサンプルされただけなので、オメガセットからのアミノ酸が事実オメガセットからの中で最上だと結論を下すことはできない。 ポジション2にLEUがあるかも知れないが、ARGもしくはSERのほうがいいのかも知れない。 オメガ6つのクラスのペプチドを単離したとしても、より良いクラスのメンバーがライブラリーにはなかったと言う注意をひくチャンスがある。


    10

    7 ITsのライブラリーで、数クラス完全にサンプルされたのを見たことがある。 しかし、アルファ6つのクラスは、たったの1.1パーセントしかサンプルされていない。 7.6・10

    7 ITsで,全アミノ酸配列の50パーセントの顕示を期待している。 しかし、三つもしくはそれ以上のアミノ酸のアルファセットを持っているクラスは、あまり沢山サンプルされていない。 (NNK)

    6ライブラリーのサンプリングを完成するためには、およそ3.10

    9 ITs、今までに報告されている最大の(NNK)

    6ライブラリーの10倍のものが必要とされる。


    表131は、(NNT)

    4 (NNG)

    2によってコードされたライブラリーの期待値を示している。 存在度の期待値は、コードンの順とは関係なく、もしくは不変化コードンをグループ別集団にすることにも関係がない。 ライブラリーは、0.133倍のアミノ酸配列をコードしているが、そこにはたった0.0165倍のDNA配列しかない。 このようにして、5.0・10

    7 ITs(すなわち、(NNK)

    6のために必要とされるものより60倍も少ない)はライブラリーのほとんど完全に近いサンプリングをしている。 その結果は(NNT)

    6のものは幾分か良いものであり、そして(NNG)

    6のものは、幾分かではあるが、それ程悪いものでもない。 制御因子は、アミノ酸配列に対するDNA配列の比率である。


    表132は、コードンNNK、NNT、そしてNNGのための#DNA配列/#AA配列の比率を示している。 NNKとNNGのためには、Pfファージの中の遺伝子IIIが「ストップ減失と推測される」と言う語句によって示されているように、PBDが重要な遺伝子の部分として顕示されていると推測している。 そのように重要な遺伝子が利用されることはいかなる場合においても必要とはされていない。 重要でない遺伝子が利用される場合には、分析方法は少し換えられるだろう。 NNTとNNGをサンプルすることは幾分か効果的ではなくなるであろう。 (NNT)

    6が(NNK)

    5より3.6倍多数のアミノ酸配列を提供し、1.7倍少ないDNA配列を必要としていることを見て下さい。 (NNT)

    7が(NNK)

    6の二倍ものアミノ酸配列を提供しているが、DNA配列は3.3倍少ないものとなっていることを見て下さい。


    このようにして、特別な部位で、全20のアミノ酸を入手するために簡単な混合を利用することは可能であるが、これらの簡単な混合はコードされたアミノ酸のセットが非常に歪められたものとなる。 この問題は複雑に変化されたコードンを利用して解決することができる。


    複雑に変化されたコードン全20のアミノ酸を許容し、最も好まれているアミノ酸(mfaa)の存在度の比率に対する最小限に好まれているアミノ酸(lfaa)の存在度の最大比率を産出しているコードン内のnt分布(「fxs」)は、酸性そしてベースのアミノ酸の同等に存在する拘束があるとしても、できるだけ少数のストップコードン、そして、便宜上、第三のベースがTもしくはGであり、表10Aに示されておるように、そして存在度が示されているアミノ酸の各タイプをコードしているDNA分子を産出する。 他の複雑な変化されたコードンは一つもしくはそれ以上の配座を緩和することによって入手し得る。


    この化学作用は、等概然的である酸性とベースのアミノ酸を持った全20のアミノ酸をコードし、最も好まれたアミノ酸(セリン)は、最小限に好まれるアミノ酸(トリプトファン)と同じ頻度で、たったの2.454回コードされている。 「fxs」vgコードンは、NNKもしくはNNSがたった一つのコードンを提供しているアミノ酸[F、Y、C、W、H、Q、I、M、N、K、D、E]の中のいくつかを持っているペプチドに対してサンプリングを最大に改善する。 そのサンプリングの利点は、ライブラリーが相対的に小さい場合に最大に顕著なものとなる。 酸性とベースの同等性の条件を見逃し、ストップコードンを過小評価する結果は表10Bに示されている。


    NNTコードンの利点は、この特許登録のどこでても論議されている。 最適化されないNNTはたった16のDNA配列によってコードされた15のアミノ酸を提供している。 表10Cに示されている分布をもってNNTを改善することができる。 それはほとんど同等量で5つのアミノ酸(SER、LEU、HIS、VAL、ASP)を提供する。 さらに8つのアミノ酸(PHE、TYR、ILE、ASN、PRO、ALA、ARG、GLY)は、SERの存在度78パーセントで存在している。 THRとCYSはSERの存在度の半分に存続している。 ジスルフィド結合ミクロタンパク質のためのDNAを変化させる場合、CYSの普及度を減少することが望ましい。 この分布は高いレベルで見られる13のアミノ酸を許容し、ストップを付与しない。 最適化されたfxs分布は高い普及度でたった11のアミノ酸を許容する。


    NNGコードンもまた最適化され得る。 表10Dはほぼ最適化された(「ALA」は[ARG]とほぼ等しい)NNGコードンを示している。 この変化の下に、四つの同等に最も好まれているアミノ酸:LEU、ARG、ALA、とGLUがある。 このセットの中には一つの酸性と一つのベースがあることに注意して下さい。 二つの同等に最も好まれていないアミノ酸:TRPとMETがある。 ifaaとmfaaの比率は0.5258である。 このコードンが6回繰り返された場合、TRPとMETで全体を作られたペプチドは最も好まれたアミノ酸で全体を作られたペプチドと2パーセントの共通性を持っている。 これを「最適化されたNNG vgDNAにおける(TRP/MET)

    6の普及度」と呼ぶことにしている。


    「汚れたビン」方法でvgDNAを合成する場合には、限られた数の混合のみを利用するのが時として望ましい。 一つの非常に有益な混合物は「最適化されたNNS混合」と呼ばれている。 その中で、fxs混合の最初の二つのポジション:T

    1 =0.24、C

    1 =0.17、A

    1 =0.33、G

    1 =0.26を平均し、第二ポジションは第1ポジションと同一で、C

    3 =G

    3 =0.5である。 この分布は、5パーセント以上のアミノ酸 ARG、SER、LEU、GLY、VAL、THR、ASN、とLYSを提供し、さらに4パーセント以上のアミノ酸 ALA、ASP、GLU、ILE、METとTYRを提供している。


    さらに複雑さを増して換えられたコードンは、興味あるものである。 このコードンは、最初の二つのポジションの最適化されたNNTコードンと同一であり、第三ポジションではT:G::90:10を持っている。 このコードンは5.5パーセント以上のアミノ酸(ALA、ILE、ARG、SER、ASP、LEU、VAL、PHE、ASN、GLY、PRO、TYR、とHIS)を提供する。 4.3パーセントのTHRと3.9パーセントのCYSは、NNK(3.125パーセント)のLFAAsよりさらに一般的である。 残り5つのアミノ酸は、1パーセント以下で存在している。 このコードンは、全アミノ酸が存在していると言う特徴を持っていて、二つ以上の低存在度のアミノ酸を持っている配列は希少である。 このコードンを利用してSBDを単離する場合には、最初の13のアミノ酸が各ポジションでテストされることは理論的に確かである。 最適化されたNNGを基とした、同様なコードンが利用され得る。


    表10Eは、最適化されたNNS(もしくはNNK)コードンのいくつかの特性を示している。 三つの同等に最も好まれているアミノ酸:AERG、LEU、とSERがあることに注意して下さい。 12の同等に最も好まれていないアミノ酸:PHE、ILE、MET、TYR、HIS、GLN、ASN、LYS、ASP、GLU、CYSとTRPも存在する。 五つのアミノ酸(PRO、THR、ALS、VAL、GLY)がその間にある。 NNSの6回の繰り返しは、[ARG、LEU、とSER]からなる配列とたったの0.1パーセント前後同相のアミノ酸[PHE、ILE、MET、TYR、HIS、GLN、ASN、LYS、ASP、GLU、CYS、ソシテTRP]からなる配列を提供する。 これは、最適化されたNNG

    6 vgDNAにおける(TRP/MET)

    6の普遍度よりほぼ20倍低いのみならず、この低普遍度は12のアミノ酸に適用する。


    拡散誘発拡散誘発は、タンパク質のいかなる部位にも、またいかなる場合にも利用し得るが、ターゲットに結合しようとする物質が設定された場合が最も適切である。 拡散誘発は、少量の一つもしくはそれ以上の他の活性化されたntsを持ったDNA合成(すなわち、ntホスホラミジット−−nt−phosphoramidites)のために活性化された各々の純粋なntsをスパイクする(無効にする)ことによって遂行され得る。 望ましくは、スパイクのレベルは、最終製品のほんの少量の部分が(たとえば、0.0001パーセントの1パーセント)最初のDNA配列を含むくらいの量にする。 これは、単一の、ダブルの、三重の、そしてそれ以上の誘発の発生を確かなものとするが、根本となる配列の回収は可能性のある成果である。


    III. D. 重要なシステインを持ったミクロタンパク質の変化に関連している特殊考察いくつかの望ましい簡単なもしくは複雑な変化されたコードンが、システインを含むアミノ酸セットをコードする。 これは、数個のコードされた結合ドメインが、不変のジスルフィド結合システイン以外に、一つもしくはそれ以上のシステインを特徴とすることを意味している。 例えば、各NNTコードされたポジションには、16チャンスの内一回、システインを入手できる可能性がある。 六つのコードンが換えられる場合には、付加システインを含むドメインの分数値は0.33である。 奇数のシステインが複雑化された状態を引き起こす。 PerryとWetzel(PERR84)を参照のこと。 一方、多数のジスルフィドを含んでいるタンパク質は、ジスルフィド、すなわち、トリプシンを形成しないシステインを含んでいる。 一対になっていないシステインの可能性は、いくつかの方法で取り扱かうことができる。 すなわち、


    第一に、変化させられたファージ集団は、スルホリンク(SulfoLink)(Pierce Chemical Company,Rockford,Illinois,61105からのカタログ番号は44895 H)のような遊離したチオールを強固に結合している不動試液を無視される可能性がある。 Pierceからのもう一つの製品は、TNB-Thiol Agarose(カタログ番号は20409 H)。 BioRadはこの目的のためにAffi-Gel 401(カタログ番号153-4599)を販売している。


    第二に、下記のようなシステインを除外している変化を利用することができる。 すなわち、


    NHT−−[F、S、Y、L、P、H、I、T、N、V、A、D]を提供するVNS−−[L

    2 、P

    2 、H、Q、R

    3 、I、M、T

    2 、N、K、S、V

    2 、A

    2 、E、D、G

    2 ]を提供するNNG−−[L

    2 、S、W、P、W、R

    2 、M、T、K、R、V、A、F、G、ストップ]を提供するSNT−−[L,P,H,R,V,A,D,G]を提供するRNG−−[M、T、K、R、V、A、E、G]を提供するRMG−−[T、K、A、E]を提供するVNT−−[L、P、H、R、I、T、N、S、V、A、D、G]を提供する、


    もしくはRRS−−[N、S、K、R、D、E、G

    2 ]を提供する。 しかしながら、これらのスキームの各々は、NNTと比較して、一つもしくはそれ以上の不利なものを持っている。 すなわち、a)より少数のアミノ酸が許容される、b)アミノ酸は平均して提供されていない、c)酸性とベースのアミノ酸は恐らく同等ではあり得ない、もしくは、d)ストップコードンが発生する。 しかしながら、NNG、NHT、そしてVNTはNNTと同様有用である。 NNGは13の異なったアミノ酸と一つのストップシグナルをコードする。 たった二つのアミノ酸が16回の混合の中に二度現れる。


    第三に、予め定められたターゲットに結合する集団を豊かにすることができ、そして余分のシステインのために、選択された配列(のpost hoc−−前後即因果関係)を評価できる。 配座を拘束するために提供されているシステインよ多数のシステインを含んでいるものは、完全に有用である。 デザインされた以外のジスルフィドのつながりが発生する可能性がある。 単離されたDNA配列によって定義された結合ドメインは、いずれにせよ適切ではないと言うのではない。 単離されたドメインの適切性は化学的に合成されたペプチドの化学的そして生物化学的な評価によって最善に決定される。


    最後に、Ellmanの試液、ヨードアセテート、もしくはヨウ化メチルのような試液で遊離チオールをブロックすることができる。 その試液は特に遊離チオールと結合し、そしてジスルフィドとは作用しない、そして集団中の調整されたファージをそのままにしておく。 ブロックするための薬剤はミクロタンパク質の結合特質を換えてしまう可能性があることを知るべきである。 このようにして、異なった結合ドメインが発見されるかも知れないと言う期待を持ってブロックするための種々の薬剤を利用しても良い。 チオールをブロックされた遺伝子パッケージの換えられた集団は結合のためには画分される。 単離された結合ミクロタンパク質のDNA配列が奇数のシステインを含んでいる場合、合成手段は奇数のチオールが適切にブロックされている、各ポシブルなつながりを持っているミクロタンパク質を提供するために利用されている。 ニシウチ(NISH82、NISH86、そしてここに引用されている論文)は、各チオールが異なった型のブロックしているグループで保護されている、複数のシステインを含んでいるペプチド合成の方法を開示している。 これらのグループは、選択的に除去することができるので、ジスルフィドの対合が統御され得る。 一つのチオールがブロックされたままで残るか、もしくはブロックから解かれて異なった試液と再びブロックされるという改変したスキームの利用を考えている。


    III. E. 第二番目そして後続の変化のラウンドの計画この発明による方法は、予め定められたターゲットに対する高い親和性を持っている結合ドメインのアミノ酸配列に関する情報の効果的収集を許容する。 単一ラウンドの変化や親和性濃縮化から非常に有用な結合ドメインが入手できたとしても、最高で可能な親和性と特殊性を勝ち取るためには、多数のラウンドが必要であると考えている。


    初めての変化のラウンドでターゲットとのなんらかの結合をしたとしても、ターゲットに対する親和性はまだ低すぎ、SBDsの変化によってさらに改善が成されるだろう。 望ましくは、工程は進歩的であることである。 すなわち、各変化のサイクルは、前のサイクルが生産したものより、次の変化サイクルのためにより良い出発点を作り出す。 変化のレベルをそうなるようにセットして、ppbdそしてppbd配列に関連した多数の配列が検出可能な量で存在していて、進歩的な工程を確かなものとしている。


    変化のレベルがそのように高く、ppbd配列がそのように低いレベルで存在しているので、PPBDを顕示する変換体がないと言うような識別可能な機会がある、また次のラウンドの最高SBDはPPBDより悪いものが出てくる可能性もある。 必要以上に高い変化レベルでは、各誘発のラウンドは前のラウンドから独立していて、進歩の保証はない。 この方法は、価値ある結合タンパク質まで導いてくれる可能性がある。 しかしこのレベルの変化での実験の繰り返しは進歩的な結果をもたらさない。 過多の変動は望ましいものではない。


    進歩性は全部もしくは無と言う性質のものではない。 前の変化サイクルから得たデータのほとんどが保持され、PPBD表面に関連した多数の異なった表面が生産される時、その工程が進歩的なのである。


    先の変化サイクルにおける変化のレベルが正しく選ばれれば、正しく換えられた残留基に存在するために選択されたアミノ酸が、最善に決定されるものである。 他の残留基に環境は変わるので、それらを再び変えることは適切である。 同時に変えられるものよりもっと多くの興味ある残留基があるので、今だかつて変えられたことのないもの(優位性が最も高い)、もしくは、一つまたはそれ以上のサイクルのために変えられなかったもののいずれかの残留基の選出を続けていくかも知れない。


    NNTもしくはNNGの換えられたコードンの利用は、換えられたライブラリーのきわめて有効なサンプリングにつうじている。 その理由は、(異なったアミノ酸配列)と(異なったDNA配列)比率が、NNKに対するそれよりも、もしくは最適化されたvgコードン(fxs)に対するそれよりも、ずっとユニティに近いものであるから。 いずれにせよ数個のアミノ酸は各ケースで省略される。 NNTそしてNNG両方ともアミノ酸の重要なクラス(疎水性、親水性、酸性、ベース、中性の疎水性、小型、大型)のメンバーを許容する。 結合ドメインを選択した後、後続の変化そして選択は高度の親和性もしくは特殊性を達成することが望ましいことであろう。 この第二の変化の間、先の変化によって見逃されたアミノ酸の可能性が検討されるであろう。


    いくつかの例が役に立つことと思う。 NNTを利用して、PROを入手したと仮定しよう。 このアミノ酸は、NNTでもNNGでも使用可能である。 PROはセット[PRO、LEU、VAL、THR、ALA、ARG、GLY、PHE、TYR、CYS、HIS、ILE、ASN、ASP、SER]からの最高のアミノ酸であると言うことは理論的に確かである。 [PRO、TRP、GLN、MET、LYS、GLU]を含んだセットを次に試してみよう。 NNGによって許容されたこのセットは望ましいセットである。


    目的物質の代わりにHISを入手したとしたらどう言うことになるのだろう。 ヒスチジンは芳香族であり、かなり疎水性であり、そとてイミダゾールリングと結合し、またイミダゾールリングから水素結合を形成することができる。 トリプトファンは疎水性であり、そして芳香族であり、そして適当なアクセプタに水素を授与することができ、またNNTコードンによって除外される。 メチオニンもまた除外され、そして疎水性である。 このようにして、一つの望ましいコースは、[HIS、GLN、ASN、LYS、TYR、CYS、TRP、ARG、SER、GLY、<ストップ>]を許容する変化されたコードンHDSを利用することである。


    変化の第一ラウンドが完全に不成功に終わる場合には、異なったパターンの変化が利用されるべきである。 たとえば、一つ以上の相互作用がドメイン内で定義され得る場合には変化の次のラウンドにある換えられた残留基が、最初の変化内で確定されたセット以外のセットからでなければならない。 故障が繰り返されるような場合には、異なったIPBDに変えることもできる。


    IV. 顕示戦略:「遺伝子パッケージ」の表面に異種結合ドメインを顕示するIV. A. 遺伝子パッケージに対する一般必要条件多数の異なってはいるが関連を持ったポテンシャル結合ドメインの顕示を手に入れるためには、複製し得る遺伝子パッケージの不均一パッケージを生成することである。 この遺伝子パッケージの各々は、興味あるターゲットのためにポテンシャルな結合ドメインをコードしている第一DNA配列と顕示方法をコードしている第二DNA配列を含んでいるハイブリッド遺伝子から成っている。 このようにして、外表面のタンパク質は、遺伝子パッケージにとって天然のものではあるが、ポテンシャル結合ドメイン(もしくは、それが関連している親結合ドメイン)とは自然に関連を持たない。 そのポテンシャル結合ドメインは、キメラタンパク質相当物質(もしくは、その処理された形)をその外表面に顕示する遺伝子パッケージの基である。


    望ましい結合特性を具現している集団の構成要素は非常に小型なもの、たとえば10

    6より小さいものであるかも知れない。 この集団の構成要素が一度、非結合構成要素から切り離されると、それは増幅されることが可能でなければならない。 可変の細胞を培養することは、遺伝子物質の最も勢力的に増幅されたもの、そして望ましいものである。 遺伝子メッセージは試験管内、すなわち、PCRによって増幅される。 しかしながら、これは最も望ましい方法ではない。


    望ましくは、GPが下記のものであることである。 すなわち、1)ポテンシャル結合ドメインをコードしている理論的機構で遺伝子的に変えられたもの、2)培養で保持され増幅されたもの、3)親和性分離中、ターゲット物質と相互作用を行うことの出来るポテンシャルな結合タンパク質ドメインを顕示するよう操作されたもの、そして4)親和性は分離されているが、回収し得る形で顕示された結合ドメインをコードしている遺伝子情報を持っているもの。 望ましくは、GPが親和性分離の後も可変性を持っていることである。 望ましいGPsは栄養バクテリア細胞、バクテリア胞子、そして特にバクテリアDNAウイルスである。 真核生物(eukaryote)のウイルスは遺伝子パッケージとして利用され得るだろう。 しかしそれらは望ましいものではない。 遺伝子パッケージがバクテリア細胞である場合、もしくはペリプラズム的に組み立てられたファージである場合、顕示の手段は二つの要素を持っている。 第一要素は、最初の発現物質を細胞(パッケジがファージの場合には宿主細胞)の内被膜に導く分泌シグナルである。 この分泌シグナルは、処理された、成熟した、ポテンシャルな結合タンパク質を作り出すためにシグナル ペプチドによって分割される。 第二要素は、パッケージがその外表面に処理されたタンパク質を収集するよう導いている外表面運搬シグナルである。 望ましくは、この外表面運搬シグナルが遺伝子パッケージに天然にある表面タンパク質から誘導されることである。


    たとえば、望ましい実験例において、ハイブリッド遺伝子は、一つのシグナル配列(すなわち、バクテリアphoAもしくはbla遺伝子のシグナル配列、もしくはM13ファージ遺伝子IIIのシグナル配列)に操作可能につながっているか、また、繊状ファージ(すなわち、M13)のコートタンパク質(すなわち、M13遺伝子IIIもしくは遺伝子VIIIタンパク質)をコードしているDNAに操作可能につながっているポテンシャルな結合ドメインをコードしているDNAから成っている。 発現物質は、宿主細胞の内皮膜(リピッド二重膜)まで運搬される。 そこでシグナル ペプチドは処理されたハイブリッドタンパク質を去るよう分割される。 このハイブリッドタンパク質のコートタンパク質のような要素のC−終端は、リピッド二重膜に捕らえられてしまう。 それ故ハイブリッドタンパク質はペリプラズムの部分から逃れない。 (これは、野生タイプコートタンパク質の典型的なものである。)未完成ファージ粒子の単一ストランドDNAは、ペリプラズムの部分に入っていき、それは、野生タイプのコートタンパク質とハイブリッドタンパク質をリピド二重膜から収集する。 ハイブリッドタンパク質は、このようにして、その外表面に晒されたポテンシャルな結合ドメインを去り、繊状ファージの表面被覆に組み込まれる。 (このようにして、宿主バクテリア細胞ではなく、繊状ファージが、この実験例で「複製可能な遺伝子パッケジ」である。)


    分泌シグナルがポテンシャル結合ドメインの顕示のために必要である場合には、特別に望ましい実験例においては、ハイブリッド遺伝子が発現されたバクテリア細胞は「分泌許容」系統の細胞である。


    遺伝子パッケージがバクテリア胞子、もしくはコートが細胞内で組み立てられたファージ(ファイX174もしくはラムダのような)である場合には、宿主バクテリア細胞の内皮膜に発現物質を導いている分泌シグナルは必要ではない。 この場合には、発現手段は、単なる外表面運搬シグナルであり、典型的には胞子もしくはファージコートタンパク質の誘導物である。


    数個のGPsのための望ましいOSPsは、表2に示されている。 このセクションのosp−ipbdの溶融に関しては、必要な変更を加えて、osp−pbdとosp−sbd溶融ににも適用されるべきである。


    IV. B. GPsとしてのファージの利用:


    IPBDがジスルフィド結合ミクロタンパク質である場合には、IPBDsは細胞内に折りたたまれないので(これらのタンパク質は、ファージが細胞から解放された後これらのタンパク質は細胞内に折りたたまれる可能性がある)、ペリプラズム的に組み立てられたファージが望ましいものとされている。 IPBDが大型もしくは溶解し得ない配合団(Fe

    4

    4群のような)を必要とする場合には、細胞内で組み立てられたファージが望ましいものとされている。 その理由は、配合団はペリプラズムに欠けているので、分泌されるとIPBDが折りたたまれないかも知れないから。 変化が導入される場合には、多数の汚染が、それらの表面に異なったPBDの少なくとも数個のコピーを持っている一つのPBDのための遺伝子を担っているハイブリッドGPsを生成することができる。 それは、低い多数の汚染(MOI)をもたらした状態下でファージを持った汚染細胞によってこの可能性を最小限度に食い止めることが望ましい。


    損なわれない成熟したファージとの関連を持つ酵素活動がほとんどないので、そして代謝的に不活性な成熟したファージ粒子を示している、遺伝子はバクテリア宿主外では不活性なので、バクテリオファージは優れた候補である。


    与えられたバクテリオファージのために、望ましいOSPは、普通、大多数のコピーのファージ表面に存在している一つである。 それにも関わらず、M13 gIIIタンパク質(一つのファージに対して5のコピー)のようなOSPは、PBDの顕示の原因となるOSPとして優れた選択であるかも知れない。


    野生タイプのosp遺伝子が保存されることは望ましいことである。 ipbd遺伝子断片は、第二コピーの受容体osp遺伝子に挿入されるか、もしくは新規に操作されたosp遺伝子に挿入され可能性がある。 osp−ipbd遺伝子は調整されたプロモータの統御の下に置かれることが望ましい。


    ipbd遺伝子の断片を挿入するために、ユーザーは候補OSP遺伝子の中にサイトを選択しなければならない。 大多数のバクテリオファージのコートは、高度に規制されている。 このようなバクテリオファージにおいては、ウイルス粒子(virion)の中の他のタンパク質と相互作用をする親OSPの残留基を、操作されたOSP−IPBD溶融の中に保持することは重要なことである。 M13 gIIIのために、最後の100の残留基(BASS90)(もしくは、たとえそれより少ない数としても)を保持すれば十分であるかも知れないが、M13 gVIIIのために、全部の成熟したタンパク質を保持することは望ましい。 そのような打ち切られたgIIIタンパク質は、gIIIタンパク質がファージ汚染性に対して必要とされるように、完全なgIIIタンパク質と並んで発現されるであろう。


    M13、f1、fd、If1、Ike、Xf、Pf1、そしてPf3を含んでいる繊状ファージは、特別に興味をひくものである。 主要なコートタンパク質は、遺伝子IIIによってコードされている。 50アミノ酸成熟遺伝子VIIIコートタンパク質は、73アミノ酸プリコート(ITOK79)として合成されている。 第一23アミノ酸は、未完成ポリペプチドが細胞内皮膜に挿入される原因となっている典型的な単一配列を構成している。


    一つのE.Coliシグナルペプチド(SP−I)は、アミノ酸18、21、そして23を承認し、幾分か少ない程度ではあるが、残留基22、そしてプリコート(KUHN85a、KUHN85b、OLIV87)の残留基23と24との間のカットを承認している。 シグナル配列を取り除いた後で、成熟したコートのアミノ終端は、内皮膜のペリプラスム側に位置させられる。 カルボキシ終端は細胞質側に存在する。 成熟した50アミノ酸コートタンパク質のおよそ3000コピーが内皮膜に並行して参加している。


    遺伝子VIIIの配列は知られており、アミノ酸の配列は,lacUV5プロモータを利用して、そしてLacI

    q抑制体とともに利用されて、合成遺伝子にコードされ得る。 lacUV5プロモータはIPTGに誘発される。 成熟した遺伝子IIIタンパク質は、円形ssDNAの周囲の被覆を形成する。 三次元構造のf1ウイルス粒子は、中程度の解像度で知られている。 遺伝子VIIIタンパク質のアミノ終端はウイルス粒子の表面にあり、そしてそのために、ポテンシャル結合ドメインの望ましい接続サイトである。 遺伝子VIIIのいくつかの調整が行われた、そしてそれらは下記に記載されている。 M13コートの二次元構造は、三次元構造に含蓄的である。 成熟したM13遺伝子VIIIタンパク質はたった一つのドメインを持っている。


    下記から成る三点遺伝子を構造した。 すなわち、


    1)内皮膜をとうして分泌の部分(2)と(3)を導いているシグナル配列をコードしているDNA、


    2)成熟したBPTI配列をコードしているDNA、そして3)成熟したM13 gVIIIをコードしているDNA。


    この遺伝子はM13ファージの表面に活力ある形でBPTIが現れる原因となる。


    M13プリコート(SCHA78)のアミノ酸配列はAA_seq1と呼ばれ、下記のとうりである。 すなわち、


    M13CPに新規のタンパク質ドメインを挿入する最善のサイトは、矢印で示してあるように、A23の後である。 その理由は、SP−IがA23の後プリコートされたタンパク質を裂開するからである。 分泌され得るタンパク質は、そのアミノ終端で成熟したM13CPと連結されて出現する。 成熟したM13CPのアミノ終端はウイルス粒子の外表面に位置されているから、導入されたドメインは、ウイルス粒子の外側に顕示されるであろう。 M13CPが資質2重膜に出現する機構が今だ解明されていないと言うことは、bptiの直接遺伝子VIIIへの挿入が機能的溶融タンパク質を生成しないのかも知れないと言う可能性を提起する。 溶融のシグナル配列を他に、たとえば、phoA配列(MKQSTIALALLPLLFTPVTKA........)(MARK91)に変えることが必要なのかも知れない。 Marksら(MARK86)は、phoAシグナル ペプチドが成熟したBPTIをE.coliペリプラズムに導くことができることを示した。


    IPBDを顕示するもう一つの方法は、一部もしくは全部の遺伝子IIIを含んでいるキメラ遺伝子のドメインとしてそれを顕示することである。 この遺伝子はM13のマイナーコートタンパク質の一つをコードする。 遺伝子VI、VII、とIXもまたマイナーコートタンパク質をコードする。 これらのマイナータンパク質の各々は、一つの完全な成熟ウイルス粒子につきおよそ五つのコピーの中に存在する。 そしてそれらは形態発生もしくは汚染に関係している。 これにひき比べてメージャーコートタンパク質は、一つに完全な成熟したウイルス粒子につき2500以上のコピーの中に存在する。 遺伝子VI、VII、とIXタンパク質は、完熟したウイルス粒子の末端に存在する。 これら三つのタンパク質は、後転移的に操作されない。 (RASC86)。


    単一ストランドの円形ファージDNAは、遺伝子IIタンパク質のおよそ五つのコピーと関連を持ち、DNAがらせん形被覆のタンパク質の中に閉じ込められうような方法で皮膜と関連を持ったコートタンパク質のパッチを通って押し出される。 (WEBS78)。 DNAは一対を基礎にはしていない(それはウイルスゲノムに厳めしい厳格は制限を課すことになる)。 むしろベースは配列から独立して互いに挿入する。


    Smith(SMIT85)とdelaCruzら(DELA88)は、遺伝子IIIへの挿入は新規なタンパク質ドメインが完全に成熟したウイルス粒子の外表面に発現する原因となることを示している。 ミニタンパク質の遺伝子は、SmithとdelaCruzらによって利用されたサイトの遺伝子III、他のドメインの境界線に対応している、もしくはタンパク質の表面ループに対応している一つのコードンにある遺伝子III、もしくは成熟したタンパク質のアミノ終端にある遺伝子IIIに溶融されるかも知れない。


    全参考文献に記載されている実験では、単一の調整された遺伝子IIIのfdを含んでいるベクトルが利用されている。 このようにして、gIIIの全五つのコピーは同一の方法で調整される。 遺伝子IIIは、かなり大型(1272b.p.もしくはファージゲノムの約20パーセント)であり、そして遺伝子全体の複製はファージへ安定的に挿入されるかどうかは確かではない。 さらに、gIIIのタンパク質の全五つのコピーは完全に成熟したウイルス粒子の一つの端に存在している。 二価のターゲット分子(抗体のような)が五価のファージと結合する場合には、結果としてもたらされた複雑性は逆に戻すことは不可能であろう。 ターゲットに結合されたGPの逆戻りのできない場合は、ターゲットに対して最大の親和性を持っている新規なポリペプチドをコードしている遺伝子配列を担っているGPsの親和性同位体濃縮に大幅に干渉する。


    逆戻りのできない複雑性の発生の可能性を減少するために、IIIのカルボキシ末端部分をコードする第二の合成遺伝子を利用することができるかも知れない。 遺伝子IIIタンパク質のカルボキシ末端部分は、ファージの中にそれを組み入れる原因となる。 たとえば、(コードン398によって特定されたアルギニンからはじめて)最後の29残留基はファージへ溶融タンパク質が組み込まれる原因となるに十分であるかも知れない。 代替的に、成熟したgIIIタンパク質、すなわち、遺伝子IIIの最後の150から160までのアミノ酸の最後の胞子ドメインを含むかも知れない。 たとえば、下記からなる(5フィートから3フィートまで)一つの遺伝子を操作できるかも知れない。 すなわち、


    1)プロモータ(望ましくは制御されたもの)、


    2)リボゾーム結合のサイト、


    3)イニシエーション コードン、


    4)分泌の(5)と(6)の部分を内皮膜をとうして導いている機能的シグナル ペプチド、


    5)IPBDをコードしているDNA、


    6)M13タンパク質の残留基275から424までをコードしているDNA、


    7)変換ストップコードン、そして、


    8)(任意に)転写ストップシグナル。


    野生タイプの遺伝子IIIを残しておくので、いくつかの変換されない遺伝子IIIが存在するであろう。 代替的に、OSPとして遺伝子VIIIタンパク質を利用するかも知れない、そしてosp:ipbd溶融を制御するかも知れないので、溶融タンパク質の一つもしくは数個のコピーがファージの上に発現する。


    M13遺伝子VI、VII、とIXタンパク質は、変換後は操作されない。 これらのタンパク質がファージの中に組み込まれるルートは、今だ報告されていない。 これらのタンパク質は普通の形態生成そしてファージの感染性のために必要である。 これらの分子(遺伝子VIタンパク質、遺伝子VIIタンパク質、そして遺伝子IXタンパク質)が:a)細胞質から、b)ペリプラズムから、もしくはc)脂質二重膜の内部から、ファージに接続しているかどうかは、知られていない。 下記の一つを利用してファージ表面にIPBDを導入するためにこれらのタンパク質の一つを利用し得る。 すなわち、


    1)ipbd::pmcp、


    2)pmcp::ipbd、


    3)シグナル::ipbd::pmcp、そして4)シグナル::pmcp::ipbd。


    そこでipbdは、最初のポテンシャル結合ドメインのための発現にコードしているDNAを表示しており、pmcpは、ファージマイナーコートタンパク質VI、VIIそしてIXの一つのためにコードしているDNAを表示しており、シグナルは、phoAシグナル(MKQSTIALALLPLLFTPVTKA)のような機能的分泌シグナルペプチドを表示しており、そして「::」は、枠内遺伝子溶融を表示している。 表示された溶融は、知られたプロモータ、望ましくは、lacUV5、tac、もしくはtrpのような規制されたプロモータの下流に置かれる。 溶融(1)と(2)は、マイナーコートタンパク質が細胞質からファージに接続される場合、もしくは脂質二重膜への自律的挿入によって接続される場合が適切である。 溶融(1)は、マイナーコートタンパク質のアミノ終端が遊離している場合に適切であり、溶融(2)は、カルボキシ終端が遊離している場合に適切である。 溶融(3)と(4)は、マイナーコートタンパク質がペリプラズムからファージに接続する場合、もしくは脂質二重膜の内部からファージに接続する場合に適切である。 溶融(3)は、マイナーコートタンパク質が遊離している場合に適切であり、溶融(4)は、カルボキシ端末が遊離している場合に適切である。


    同様な構造が他の線状ファージと建造可能である。 Pf3は、IncP−1プラスミドをかくまっているシュードモナス アエルゲノサ(Pseudomonas aerugenosa)細胞を感染する良く知られた線状ファージである。 PF3のメージャーコートタンパク質は、その分泌を導くシグナルペプチドを持たないのが通常である。 その配列は残留基ASP

    7 、ARG

    37 、LYS

    40 、そしてPHE

    44 −COOを電荷する。 その配列は晒されているアミノ終端と一貫している。 このようにして、Pf3の表面にIPBDTの発現をもたらすために、下記よりなる三点遺伝子を構成した。 すなわち、


    1)枠内で(3)に溶融しているシュードモナス アエルゲノサ(IPBDの分泌をもたらすととして望ましく知られている)における分泌をもたらすものとして知られているシグナル配列、


    2)枠内で(3)に溶融している、IPBDをコードしている一つの遺伝子断片、


    3)成熟したPf3コートタンパク質をコードしているDNA。


    任意的に、1から10までのアミノ酸のフレキシブルなつながりをコードしているDNAもしくは一つの特殊なプロテアーゼ(すなわち、因子Xa)のために承認サイトを形成しているアミノ酸は、ipbd遺伝子断片とPf3コートタンパク質遺伝子の間に導入される。 この三点遺伝子は、Pf3に導入されるために、他のPf3遺伝子の発現を干渉しない。 遺伝子組み換えの可能性を削減するために、第(3)部分は野生タイプの遺伝子に相対的な多数の沈黙の突然変異を持つようデザインされている。 シグナル配列が分裂されるとしても、IPBDはペリプラズムの中にあり、そして成熟したコートタンパク質はアンカーとしてまたファージ組立てシグナルとして作用する。 この溶融タンパク質が、野生タイプのコートタンパク質によって許容されたルートとは別のルートによって脂質二重膜の中で休息をとることは問題ではない。


    WO90/02809に記載されているように、バクテリオファージファイ X174のようなファージ、ラムダもしくはT4のような大型DNAファージ、そしてRNAファージでさえ、適切な適応と調整をもってGPsとして利用されるかも知れない。


    IV. C. 遺伝子パッケージとしてのバクテリア細胞下記の良く特徴ずけられたバクテリア系統の一つを選択しても良い。 すなわち、1)培養で育てられたもの、2)その表面にPBDsを顕示するために操作されたもの、そして3)親和性選択と相容性であるもの。


    バクテリア細胞の内での望ましい遺伝子パッケージは、Salmonella typhimurium、Bacillus subtilis、Pseudomonas aeruginosa、Vibrio choleae、Klebsiella pneumonia、Neisseria gonorrhoese、Neisseria meningitidis、Bacteroides nodosus、Moraxella bovisそして特にEscyerichia coliである。 ポテンシャル結合ミニタンパク質はキメラバクテリアの外表面タンパク質(OSP)への挿入物として発現されるかも知れない。 全バクテリアはそれらの外表面にタンパク質を展示する。 E.coliは、望ましいバクテリアGPであり、そしてそのためにf、LamBが望ましいOSPである。


    大多数のバクテリアタンパク質は、細胞質の中に存在するが、他は、ペリプラズムの場(プラズマ皮膜とグラムーマイナスバクテリアの細胞壁間に存在する)に運搬される、もしくは、細胞の外表面に送られるかそこに固定される。 さらにその他のバクテリアタンパク質は細胞を取り巻いている媒体の中に出される(分泌される)。 細胞によって認識されるタンパク質、そしてそれが細胞質の外に搬出される原因となり、細胞表面に顕現される原因となるタンパク質の特質は、「外表面運搬シグナル」と呼ぶこととする。 グラムーマイナスのバクテリアはOSPsのサブセットを形成する外皮膜タンパク質(OMP)を持っている。 多数のOMPsには皮膜の一倍もしくはそれ以上のスパンがある。 OMPsを外皮膜に局在させるシグナルは、成熟したタンパク質のアミノ酸配列の中にコードされる。 バクテリアの外皮膜タンパク質は、シグナル ペプチドと呼ばれているものを含んだ前駆物質形態で最初発現される。 前駆物質タンパク質は内皮膜に運搬され、そしてシグナル ペプチド部分(moiety)はペリプラズムの場の中に押出される。 そこで、それは「シグナル ペプチダーゼ」によって裂開され、そして残余の「成熟」したタンパク質はペリプラズムに入ることができる。 そこで一度、他の細胞内機構が成熟したタンパク質の中の構造を認識し、その適切な部位は外皮膜にあると言うことを表示し、そしてそれをその部位に運搬する。


    リーダーもしくは一つのタンパク質からのシグナル ペプチドのためにコードするDNAは、キメラ遺伝子を形成するために、他のタンパク質、タンパク質XのためにコードしているDNA配列に接続され、そのキメラ遺伝子の顕示は、タンパク質Xがペリプラズムにおいて遊離して発現する原因となっていることは良く知られている。 バクテリア系統(LISS85、STAD89)輸出許容の利用は、シグナル配列溶融が望ましいタンパク質を細胞表面に導く確率性を増大する。


    OSP−IPBD溶融タンパク質は、外皮膜の部分が高度に規制されていないので、グラムーマイナーのバクテリアの外皮膜の中で構造化の役割をする必要はない。 大型OSPsのために一つもしくはそれ以上のサイトが存在するだろう。 そしてそのサイトでospが打ち切られ、そしてipbdに溶融されるので、溶融を発現している細胞は細胞表面のIPBDsを顕示するだろう。 omp遺伝子の断片と一つのx遺伝子の断片との溶融は、外皮膜に発現しているXまで導いて行く。 (CHAR88bとc、BENS84、CLEM81)。 そのような溶融が形成される場合には、DNA配列の中のxのためにipbdを代替することによって一つのosp−ipbdをデザインすることができる。 さもなければ、成功したOMP−IPBD溶融が、溶融した遺伝子を発現しながら、そしてIPBD顕示の表現型のための終結体GPsをテストしながら、最高のompの断片を一つのipbdに溶融することによって、望ましくさがしもとめられる。 IPBDが顕示される可能性を最大限にするために、ompとipbd間の溶融のポイントもしくは二つ以上のポイントを取るために、OMPに関する使用可能データを利用する。 (可橈性のあるリンカーをコードしているスペサーDNAは、(リンカーは、GLY、SER、とASNからなる)顕示を容易ならしめるためにospとipbdから誘導された断片間に設置されることができる。代替的に、数ケ所のサイトでospを打ちきり、もしくは可変の長さのosp断片を生産する方法で、そしてosp断片をipbdに溶融し、溶融を発現している細胞はふるい分けられもしくは選択されて、細胞の表面にはIPBDsが顕示する。Freudlら(FREU89)は、あるサイズ以上のOSPs(OmpAのような)の断片が外皮膜に組み込まれていることを示した。もう一つの代替方法は、omp断片とipbdの溶融におけるランダムDNAの短いセグメントを含むことである、そしてIPBD顕示の表現型を表示しているメンバーのために結果としてもたらされた変化された集団を篩い分けるか、選択する。


    E.coliにおいては、LamBタンパク質は良く理解されたOSPであり、利用され得る。 E.coli LamBタンパク質は、S.typhimurium、V.cholerae、とK.pneumoniaに機能的な形で発現されているので、E.coli LamBへの一つの溶融としてこれらの種属のいずれにもPBDsの集団を顕示することができる。 K.pneumoniaは、LamBと同様なマルトポリン(maltoporin)を発現する(WEHM89)、そしてこれもまた利用し得る。 P.aeruginosaでは、D1タンパク質(LamBの一つの同族体)が利用し得る。 (TRIA88)。


    LamBは、機能的なN−ターミナル配列が存在している場合には、外皮膜まで運搬される。 さらに、成熟した配列の最初の49アミノ酸が成功をもたらす運搬のために必要とされる。 (BENS84)。 他のOSPsに関しては、E.coliのLamBは、後に除外される典型的なシグナル配列で合成される。 LamBタンパク質と他の外皮膜タンパク質OmpC、OmpFそしてPhoEの部分間の同相は、LamBアミノ酸(39から49まで)と他のタンパク質の配列間の同相を含めて、検出されている。 (NIKA84)。 これらのサブ配列は外皮膜に運搬されるタンパク質と名ずけられるかもしれない。


    LamBのアミノ酸配列は知られている。 (CLEM81)。 そして一つのモデルは、それがどのような方法で他の皮膜にそれ自体を固定するかを開発したものである。 (他も含めて、BENZ88bによって調査された。)モルトース(麦芽糖)とファージ結合ドメインの部位もまた知られている。 (HEIN88)。 この情報を利用して、バクテリアの外皮膜に顕示するキメラのOSPを提供してLamBに組み込まれるかも知れないPBD挿入によっていくつかの戦略が識別されるかも知れない。


    PBDsがLamBのようなキメラのトランス皮膜タンパク質によって顕示されなければならない場合、PBDは細胞の表面に通常発見されるループに挿入され得る。 (BECK83、MANO86比較のこと)。 代替的に、一つの5フィートセグメントのosp遺伝子をipbd遺伝子断片に溶融するかも知れない。 溶融部位はOSPの表面に晒されたループに相当する場所を選択し、そしてOSPのカルボキシ終端のタンパク質は除外される。 LamBにおいては、60までのアミノ酸が結果としての異形のエピトープ(epitope)の顕示を持って挿入されているのかも知れない。 (CHAR88bとc)。 OmpC、OmpA、OmpE、とPhoEの構造特徴が非常に似ているので、これらのタンパク質から同様な働きを期待する。


    LamBは、結合タンパク質として特徴ずけられるかも知れないが、この発明の中では一つのOSTSを提供するために利用されると言うことに注意してください。 その結合ドメインは変化されていない。


    OmpA、OmpC、OmpF、PhoEとピリンのような他のバクテリアの外表面タンパク質は、LamBとその同族体の場合に利用されるかも知れない。 OmpAは、それが非常に豊富に存在しているので、そしてその同族体が広範なグラム−マイナス バクテリア種属の中で知られているので、特別に興味のあるものである。 Bakerら(BAKE87)は、E.coliの外皮膜の中のタンパク質組み込みを調査し、そして残留基19−32、62−73、105−118、と147−158が細胞表面に晒されていることを予告しているOmpA位相的モデルを引用している。 (VOGE86)。 およそコードン111で、もしくはおよそコードン152で断片をコードしている一つのipbdの挿入は、細胞表面にIPBDが顕示される原因となっているようだ。 OmpAに関しては、MACI88とMANO88も参照のこと。 シュードモナス アエルゲノサのポリンタンパク質Fは、クローンされ、E.coliのOmpAに配列ホモロジイを持っている。 (DUCH88)。 このホモロジイはプロリンタンパク質Fに表面を晒した。 残留基の予測を許容するには十分ではないけれど、OmpAの位相モデルを決定するために利用された方法がポリンタンパク質Fにも利用されるかも知れない。 一つのOSPのようにOmpAを利用することに関連した研究はBECK80とMACI88に含まれている。


    MisraとBenson(MISR88a、MISR88b)は、残留基GLY

    164とLEU

    250は細胞表面に晒されている、またその他も含めて、と言うことを予告しているE.coli OmpCの位相モデルを開示している。 このようにして、E.coli ompC細胞のおよそコードン164での、もしくはおよそコードンの250での、もしくはS.thyphimurium ompC遺伝子の同位のコードンでの、一つのipbd遺伝子断片の挿入は、IPBDが細胞表面に発現する原因となるかも知れない。 他のバクテリア種属のompC遺伝子が利用されるかも知れない。 OmpCに関連した研究はCATR87とCLIC88を含まれている。


    E.coliのOmpFは、一つの極めて豊富なOSP、10

    4コピーに等しいかまたは大きい細胞である。 Pagesら(PAGE90)は、七つの表面を晒したセグメントを表示しているOmpFのモデルを発表している。 一つのipbd遺伝子断片の溶融は、一つの挿入として、もしくはompFの3フィート部分を代替するものとしても、表示された領域の一つには機能的なompF:ipbd遺伝子を生成する可能性がある。 そしてその発現は細胞の表面にIPBDを顕示するように導いている。 特に、約コードン111、177、217、もしくは245での溶融は機能的なompF::ipbd遺伝子を導くに違いない。 OmpFに関しては、REID88b、PAGE88、BENS88、TOMM82、とSODE85を合わせて参照のこと。


    ピリ繊毛タンパク質は、ピリエートされた(piliated)細胞はこれらのタンパク質の多数のコピーを発現するので、またいくつかの他種(N.gonorrhoeae、P.aeruginosa、Moraxella bovis、Bacteroides、nodosus、とE.coli)は関連したピリンを発現するので特に興味深いものである。 Getzoffとその協力者たち(GETZ88、PAGE87、SOME85)は、淋菌性ピリ繊毛のモデルを構造し、そしてその淋菌性ピリ繊毛のタンパク質は、タバコ モザイクウイルス タンパク質とミオヘムエリトリンに機構が似ている四つのらせん束を形成すると予告している。 このモデルでは、アミノ終端とカルボキシ終端との両方が晒されている。 アミノ終端はメチル化されている。 Elleman(ELLE88)は、Bacteroides nodosusと他の種のピリンを調査し、抗原型の差異はピリンタンパク質の差異関係があるのかも知れない、そして最大変動はC終端領域に発生していると述べている。 ピリンタンパク質のアミノ終端部分は高度に保存されている。 Jenningsら(JENN89)は、口病(アフトーザ)(残留基144−159)のウイルスの断片を、淋菌性ピリンと高度に同相のB.nodosus型4線毛タンパク質に接種した。 P.aerubinosaの中の3フィート終端溶融の発現が、生物菌種の中に導かれ、溶融タンパク質の検出可能な量を生成していると言うことを彼等は発見した。 Jenningsらは、異種エピトープを変化させなかった。 また彼等はいかなる変動も示唆していない、彼等は、最後のピリン残留基と「柔軟性のあるリンカー」を提供している異種エピトープの最初の残留基との間に一つのGLY−GLYリンカーを挿入した。 このようにして、IPBDを接着するのぞましい部位は、カルボキシ終端であることが分かった。 Jenningsらによってテストされた特殊な内部溶融(JENN89)は、P.aeruginosaに致死的であるように見えたけれども、その束の晒されたループもまた利用され得るだろう。 ピリンに関しては、MCKE85とORND85も参照すること。


    Judd(JUDD86、JUDD85)は、N.gonorrhoeaeのタンパク質IAを研究し、そしてアミノ終端が晒されていることを発見した。 このようにして、N.gonorrhoeae表面にIPBDを顕示する手段として成熟したP. IAのアミノ終端にもしくは近隣にIPBDを接着することができる。


    E.coliのPhoE位相の一つのモデルは、van del Leyら(VAND86)によって開示されている。 このモデルは、八つのループが晒されていることを予告している。 これらループの1つへのIPBDの挿入は、細胞表面にIPBDが顕示される結果を導くらしい。 残留基158、201、238、そして275は、IPBDの挿入のための望ましい部位である。


    他の利用し得るOSPsは、通常少量で発見される栄養素の受容物質であるE.coli BtuB、FepA、FHuA、IutA、FecAそしてFhuE(GUDM89)を含んでいる。 これら全タンパク質の遺伝子は、配列されているが、位相モデルはまだ利用可能ではない。 Gudmunsdottirら(GUDM89)は、BtuB面のある種の残留基、ペリプラズムを開示することにより、そしてウイルスBtub::FepA溶融の機能性を決定することによってBtuBとFepAのためのそのようなモデルの構造をはじめた。 Carmelら(CARM90)は、FhuAに対する同様な性質の研究を報告している。 全ナイセリア属は、すでに識別されている。 そして多数の場合にはクローンされている鉄分運搬のための外表面タンパク質を発現している。 MORS87とMORS88も参照のこと。


    多数のグラムーマイナスバクテリアは、一つもしくはそれ以上の燐酸リパーゼ(ph-ospholipase)を発現している。 E.coli燐酸リパーゼA、pldA遺伝子の産物は、de Geusら(DEGE84)によってクローンされ配列された。 彼等はタンパク質が後移転的処理なしに細胞表面に発現していることを発見した。 一つのipbd遺伝子断片は、終端に接続することもできるし、タンパク質の中でループをコードしていると思われている部位で挿入され得る。 その燐酸リパーゼAは、シグナル配列を除去することなく外表面に到着し、そのシグナル配列は、このルートを許容するPldA::IPBD溶融タンパク質を承認しない。 このようにして、一つのPldA::IPBDもしくはIPBD::PldA溶融が適切なシグナル配列を付加することによってペリプラズムの中に分泌される原因となるかも知れない。 このようにして、一つのiPbd断片が一つのPldAの終端に単純な二元溶融をしたことに加えて、下記の構造はテストされるべきである。 すなわち、


    1)ss::ipbd::pldA


    2)ss::pldA::ipbd


    PldA::iPBDタンパク質が一度ペリプラズムの中で遊離すると、それがどのようにしてそこに行ったか覚えていないし、そしてそれが他の表面に位置される結果となったPldAの構造特徴は同じ目的部位への溶融を導くであろう。


    IV. D. 遺伝子パッケージとしてのバクテリア胞子:


    バクテリア胞子はGP候補として望ましい特徴を持っている。 胞子は、化学的そして物理的エージェントに対して、栄養バクテリア細胞もしくはファージより以上に抵抗力がある。 そしてそのために多種の親和性選択状態の利用を許容する。 また、バチルス(桿状菌Bacillus)胞子は活性的に代謝しないし、その表面のタンパク質を換えることもない。 バチルス胞子、そしてさらに特殊に、B.subtilis胞子は、それ故に、望ましいスポロイダル(sporoidal)GPsである。 WO90/02809に詳細にわたって説明してあるように、異種の結合ドメインは、B.subtilis cotCもしくはcotD遺伝子によってコードされているような外表面タンパク質に導入されるかも知れない。


    通常、遺伝子パッケージとして細胞、胞子、もしくはウイルスを利用することが望ましいこととされている、そのために外表面タンパク質は、すでに識別されたIPBDを顕示するよう操作され得る。 しかしながら、WO90/02809に説明したように、この発明はそのような遺伝子パッケージに限られることなく、外表面運搬シグナルとして、変化と選択技術によって生成されるかも知れない。


    V. E 遺伝子構造と発現の考察(i)pbd−osp遺伝子は下記のものであろう。 すなわち、a)完全に合成されたもの、b)天然と合成DNAの複合、もしくはc)天然DNA断片の複合。 重要な点は、pbdセグメントが、前述のように、多数のそして多様なPBDs家族をコードするために容易に変化されたと言うことである。 合成されたipbdセグメントは、それが制限サイトの設置に関して最大のコントロールを許容されているので望ましいものである。 その3フィートの側面にあるosp−ipbd遺伝子に隣接している領域に補足として存在する核分子、そして換えられないosp−ipbdの部分に補足として存在する核分子は、配列作りのために必要とされる。


    遺伝子の規制を行う部分の配列は天然の規制要素の配列から取られている。 すなわち、a)プロモーター、b)Shine-Dalgarno配列、そしてc)転写のターミネーター。 規制要素は天然の規制領域の交感配列の知識からもデザインされ得る。 これらの規制要素の配列はコードを行う領域に接続されている。 規制部位はまた都合の良い調整を許容する規制領域に挿入されているか、もしくは隣接して存在する。


    親和性分離の重要な機能は、ターゲットのために高度の親和性を持っているPBDs(IPBDから誘導された)を支えているGPsを、ターゲットのために低い親和性を持っているPBDsを支えているGPsから分離することである。 GPの溶出量がGP表面のPBDsの数に依存している場合には、低い親和性、GP(PBD

    W )を持った多数のPBDsを支えている一つのGPは、高度の親和性、PBDs(PBD

    Z )を持った少数のPBDsを支えている一つのGPとともに溶出するかも知れない。 osp−pbd遺伝子の規制は、望ましくは、大多数のパッケージが親和性に従って良い分離に影響を及ぼすために十分なPBDを顕示すようにすることである。 osp−pbdの発現のレベルをコントロールする規制し得るプロモーターの利用は、変化された集団の特徴的な働きを細心に調整することを許容する。


    栄養バクテリア細胞における操作された遺伝子合成誘発は、lacUV5、trpP、もしくはtac(MANI82)のような規制されたプロモーターの利用をとうして行われてきた。 合成されたタンパク質の量を規制する要素は、十分に良く理解されているので、広範な種類の不均一なタンパク質がE.coli、B.subtilisそして他の宿主細胞の中に、すくなくとも適度の量で、生成され得る。 (BETT88)。 望ましくは、osp−ipbd遺伝子のためのプロモーターは、一つの小さい化学的誘発物による規制に従うことである。 たとえば、lacプロモーター、そしてハイブリッド trp−lac(tac)プロモーターはイソプロピルチオガラクトシド(isopropylthiogalactoside(IPTG)で規制し得る。構成された遺伝子のためのプロモーターは、天然osp遺伝子からはくる必要はない。いかなる規制し得るバクテリアのプロモーターでも利用できる。非漏洩性のプロモーターが望ましい。


    この発明は、遺伝子デザインの単一の方法に限られたものではない。 osp−ipbd遺伝子は全体(in toto)を合成する必要はない。 遺伝子の部分は天然のものから入手できるかも知れない。 突然変化をpbd DNA配列の特定なサイトに容易にそして正確に導いて行くかぎり、正確な遺伝子溶融を生成するためにいかなる操作方法を利用してもかまわない。


    合成される遺伝子のコードしてある部分は、タンパク質のレベルでデザインされ、それからDNAでコードされる。 遺伝子コードの暖昧な表現は、変化されたコードンにおけるアミノ酸の様々な分布を生成するために、組み替えの可能性を最小限にするために、そして宿主細胞においてのコードンの利用が下手に変換されるのを減少するために、限定されたサイトの最適な配置を許容するように操作される。


    V. F 構造の考察ipbd−osp遺伝子をコードするたるのアミノ酸配列のデザインは、いくつかの構造の考察と関係している。 デザインは各型のGPによって幾分か変換する。 バクテリアにおいては、OSPsは重要な要素ではなく、従って、OSPドメインの溶融は、その親としての機能のいずれをも、外皮膜に宿らせること以外は要求事項は何もない。


    OSPがPBDドメインのオリエンテーションを規制しないことが望ましい。 これはPBD内に規制がないと言うことと間違えて考えてはいけない。 Cwirlaら(CWIR90)、ScottとSmith(SCOT90)、そしてDevlinら(DEVL90)は、ファージが顕示されているランダムペプチドの中の可変残留基はファージOSPからの影響を受けてはいけないと説いている。 中程度から高度の配座制限を持っている結合ドメインは、高度の特殊性を開示するだろう、そして高度の親和性もまた可能であると説いている。 このようにして、良く定義された枠内に発現するアミノ酸を特定する変化のためのコードンの選択は規制されている。 サイドグループの性質は、数多いアミノ酸の組み合わせの置替によって極度に広範な領域をとうして換えられる。 与えられたクラスの大多数のPBDsの主鎖配座は、極めて似たものである。 しかしながら、OSPに関連したPBDの動きは規制されてはいけない。 このようにして、PBDとOSPの間に柔軟性のあるリンカーを入れることは往々にして適切である。 このような柔軟性のあるリンカーは、柔軟性のある領域を持っていることが知られているし、天然に存在しているタンパク質から取ることができる。 たとえば、M13のgIIIタンパク質は、アミノ終端ドメインに高度の自由を許容すると考えられているし、グリシンを豊かに含んでいる領域を持っている。 そのような柔軟性のあるリンカーもまたデザインし得るかも知れない。 アミノ酸GLY、ANA、SERとASPが豊かに含まれているポリペプチドのセグメントは柔軟性が増大するようにできるかも知れない。 多数のグリシンは特に望ましい。


    LamB、OmpA、もしくはM13 gIIIタンパク質のようなOSPの表面ループにPBDを挿入することを選択した場合には、PBDがOSPの終端に接続される時には発生しないいくつかの考察をする。 このようなケースにおいては、OSPはPBDにいくつかの制限的影響を及ぼしている。 PBDの終端はある程度固定された位置に置かれている。 高度に変化されたDNA配列を、表面を晒されたループをコードしているコードンに、そして特殊結合表現型を持っている細胞のために選択されたコードンにosp遺伝子に挿入し得る。 識別されたアミノ酸配列が(いかなる方法によってでも)合成される場合には、OSPの拘束は失われ、そしてペプチドは、ターゲットに対してより低い親和性を持ち、そしてより低い特殊性を持つようになる。 TanとKaiser(TANN77)は、BPTIの全アミノ酸を含んでいるBPTIの合成モデルを発見した、そしてそのモデルは、BPTIよりほぼ10

    7くらい高いトリプシンのための一つのK

    dを持っているトリプシンと接触している。 このようにして、変化されたアミノ酸は、構造的制約がPBDによって提供されている一つのPBDの部分であることが最も望ましい。


    LamBに挿入された異物エピトープに隣接しているアミノ酸はこれらのエピトープの免疫特質に影響を及ぼすことが知られている。 (VAND90)。 LamB、OmpA、もしくは同様なOSPsのループに挿入されているPBDsがループのアミノ酸によって、また一般的にOSPによって影響されるだろうということを期待している。 PBDの適切な顕示を入手するためには、OSPとPBDの間に一つもしくはそれ以上のリンカーアミノ酸を加える必要があるかも知れない。 そのようなリンカーは、天然タンパク質から獲得しえるし、もしくはアミノ酸の構成行動の知識を基にしてデザインし得るかも知れない。 GLY、SER、ASN、ASP、ARG、そしてTHRを豊かに持った配列が適切である。 いずれの接合部位にもある一つから五つのアミノ酸は、OSPとPBD間の望ましい柔軟性を分与するだろう。


    ipbd遺伝子のファージosp遺伝子への挿入の望ましいサイトは、下記の中の一つである。 すなわち、a)IPBDが元の形に折り畳まれるところ、b)OSPドメインがその元の形に折り畳まれるところ、そしてc)二つのドメイン間に干渉がないところ。


    一つのOSPのアミノもしくはカルボキシ終端を表示しているファージのモデルが溶液に晒されているような場合には、成熟したOSPの晒された終端は、ipbd遺伝子の挿入のための良い候補となる。 低い解像度の三次元モデルで十分である。


    三次元モデルがない場合には、成熟したOSPのアミノとカルボキシ終端がipbd遺伝子の挿入のための最善の候補である。 構造的溶融は、ドメイン間の望ましくない相互作用を回避するために、IPBDそしてOSPドメイン間の付加的残留基を必要とするかも知れない。 IPBDもしくはOSPに対するタンパク質同族体の特殊配列をコードしているランダムDNAもしくはDNAは、もし必要ならば、osp断片とipbd断片間に挿入され得る。


    OSP内のドメイン境界にある溶融は、機能的な溶融を入手するための良い方法でもある。 Smithは、不均質DNAをf1の遺伝子IIIにサブークローンしている時、そのような境界を研究した。 (SMIT85)。


    IPBDの顕示を促すために適当なOSPドメインを識別する基準は、IPBDを識別するために利用されたものとは幾分か異なっている。 一つのOSPを識別する場合、最小限のサイズはそれほど重要ではない。 なぜならば、OSPドメインは最後の結合分子の中には出現しないし、各変化ラウンドに繰り返して遺伝子を合成することは必要ではないから。 主なデザインに関する懸念は下記のものを含んでいる。 すなわち、a)OSP::IPBD溶融はIPBDの顕示を促す、b)最初の遺伝子の構造は合理的に便宜であること、そして、c)osp::ipbd遺伝子は遺伝的に安定しており、そして安易に操作できること。 ドメインを識別するためにいくつかの方法がある。 原子を利用した調整に依存する方法は、JaninとChothia(JANI85)によって研究された。 これらの方法は、アルファとカーボン(C

    a )間の距離、平面の分割(ROSE85と比較のこと)、もしくは埋められた表面(RASH84)のマトリックスを利用する。 Cho-thiaとその協力者達は、ドメイン構造(彼等の定義に従った)を持った多数の天然タンパク質の働きの相関関係を研究した。 Rashinは、テルモリシン(thermo-lysin)の残留基206から316までからなるドメインの安定性を正しく予告した(VITA84、RASH84)。


    多数の研究者は、安定したドメインを隔離し、そして確認するために部分的なタンパク質分解とタンパク質配列の分析を利用した。 (たとえば、VITA84、POTE83、SCOT87a、とPABO79を参照のこと)。 Paboらは、コリファージ ラムダからのcI抑制体が二つのドメインを含んでいる一つの表示として熱量測定を利用した。 彼等は、ドメイン境界の場所を決定するのに部分的タンパク質分解を利用した。


    たった一つの利用し得る構造に関するデータが候補OSPのアミノ酸配列である場合には、ターンとループを予測する配列を利用することができる。 いくつかのループとターンが正しく予告される高度の確率性がある。 (ChouとFasman、(CHOU74)と比較のこと)。 これらの部位はまたipbd遺伝子断片の挿入のための候補でもある。


    バクテリアOSPsにおける、主要な考察は下記を含む。 すなわち、PBDが顕示されること、そしてb)キメラのタンパク質に毒性がないこと。


    OSPsの位相的モデルから、OSPのアミノもしくはカルボキシ終端が晒されているかどうかを決定することができる。 その場合には、これらはosp断片のipbd断片への溶融のための優れた選択である。


    lamB遺伝子は配列され、そして様々なプラスミドに利用し得る。 (CLEM81、CHAR88aとb)。 lamB断片と他の多数の遺伝子との多数の溶融は、E.coliのタンパク質の輸出の研究に利用されている。 様々な研究から、Charbitら(CHAR88aとb)は、lamBの残留基が下記であることを特定する一つのモデルを提案している。 すなわち、a)皮膜に着床されている、b)ペリプラズムと直面している、そしてc)細胞表面と直面している。 成熟したタンパク質のアミノ酸のためのモデルの番号付けを我々は取り入れている。 このモデルによると、外表面のループのいくつかが定義されている。 それらは下記のとうりである。 すなわち、1)88から111までの残留基、2)145から165までの残留基、そして3)236から251までの残留基。


    LamBに着床されたミニタンパク質について考えてください。 たとえば、G

    1 NXCX

    5 XXXCX

    10 SG

    12をコードしているDNAをlamBのコードン153と154間に挿入することは、E. coli細胞の表面に発現されている様々なlamBに導くであろう。 G

    1 、N

    2 、S

    11そしてG

    12は、ミニタンパク質に十分なオリエンテーションの自由を許容するよう供給される、そしてそれはターゲットと最大限に相互作用がし得る。 親和性の同位体濃縮を利用して(たとえば、蛍光的にラベルを貼られたターゲット経由でFACSと関係して、多分数ラウンドの濃縮化をとうして)、予め定められたターゲットに対する高度の親和性を示している一つの特殊なLamB誘導物を発現している一つのストランド(たとえば、BESTと名ずけられた)を入手できるかも知れない。 BESTからの3から10までの挿入された残留基の配列を持っている一つのオクタペプチドは、BESTで見られたものと似ている親和性を特殊性を持っているに違いない。 その理由は、オクタペプチドは、LamB誘導物と分離されたミニタンパク質に非常に似ている配座の中にアミノ酸を保持している内部構造を持っているから。


    一つもしくはそれ以上の新らしいドメインをタンパク質に溶融することは、親タンパク質の能力と異なった細胞から輸出される新らしいタンパク質の能力を生成するかも知れない。 野生タイプコートタンパク質のシグナルペプチドは、真正のペプチドのために機能するかも知れないが、溶融を直接輸出することは不可能である。 Sec依存のパスウエイを利用するためには、異なったシグナルペプチドが必要かも知れない。 このようにしてキメラのBPTI/M13遺伝子VIIIタンパク質を発現し、そして顕示すするためには、異種構造のシグナルペプチド(phoAのそれ)を利用する必要があることを発見した。


    ターゲットに対する高度の親和性を持っているペプチドを顕々示するGPsは、ターゲットから、特に多原子価のターゲットから溶出することは非常に困難なことであるかも知れない。 (堅固に結合されたバクテリアは現場で容易に増殖することができる。)ファージに関しては、特殊なプロテアーゼのための裂開のサイト(血液凝固要素Xaのような)を溶融OSPタンパク質の中に導入することができるので、結合ドメインは遺伝子パッケージから裂開されることができる。 そのような裂開は、全てのそれに起因しているファージが同一のOSPsを持ち、それによって同様に汚染的であり、ポリペプチド顕示ファージさえも、裂開なしに親和性マトリックスから溶出され得るという利点を持っている。 この段階は、そうしない限り失われてしまったかも知れない価値ある遺伝子の回収を許容している。 知っている限りにおいて、情報を持っている遺伝子パッケージを回収する手段として、特殊なプロテアーゼを利用すること、もしくは汚染度合いの異なったファージの集団を同一の汚染度を持ったファージの中に変換することについて開示したものはいないし、示唆した人もいない。


    IV. G. 遺伝子挿入の合成この発明は、特殊なDNA合成もしくは構成の方法もしくは戦略に限られたものではない。 従来のDNA合成は、変化されたDNA(混成プローブの生産のために現在利用されているものと似ている)の生成のための適切な試液調整で利用されるかも知れない。


    osp−pbd遺伝子は、適当に変換したGPによって顕示され得るように示されているosp−ipbdのようなvgDNAが存在している親遺伝子の中に挿入することによって創造されるかもしれない。 この発明は、特殊なvgDNA導入方法、たとえば、カセット誘発もしくは単一ストランドのオリゴヌクレオチドで導かれた誘発、に限られたものではない。


    IV. H. 操作できるクローニング ベクトル操作できるクローニングベクトル(OCV)は、キレラのipbd−ospもしくはipbd−osp遺伝子を遺伝子パッケージの中に導入するために利用される複製核酸である。 遺伝子パッケージがウイルスである場合には、それはそれ自体OCVとして働くかも知れない。 細胞や胞子のためには、OCVはプラスミド、ウイルス、ファージミド、もしくは染色体であるかも知れない。


    IV. I. 細胞の変換:


    GPが細胞の場合には、GPsの集団は適当なOCVsで細胞を変換することによって生成される。 GPがファージの場合には、ファージは遺伝子的に操作され、そして増幅のために適当な宿主細胞に感染(tramsfect)する。 GPが胞子の場合には、胞子形成可能な細胞が通常の代謝の状態でOCVと変形される、そして胞子形成が誘発され、それによってOSP−PBDsが顕示されるようになる。 この発明はDNAとともに細胞変換をする1つの方法に限られてはいない。


    変形された細胞は、最初、プラスミド遺伝子の発現を許容している非選択的状態の下で成長する。 それから変形しなかった細胞を殺すために選択される。 変形した細胞は、誘発の適切なレベルでosp−pbd遺伝子を発現するよう誘発される。 IPBDもしくはPBDs担っているGPsは、手近のGPに適当な方法で収穫される、一般的には、GPsを造粒する遠心分離の方法と、不妊の媒体(細胞)もしくは緩衝剤(胞子もしくはファージ)の中での再懸濁の方法である。 顕示戦略が成功したか否か(GPs全体が「テスト」IPBDをそこに顕示する)、もしくは親和性選択が成功したか否か(GPs様々な異なったPBDsをそこに顕示する)の確認のために、それらの準備は整った。


    IV. J. 顕示戦略の確認:


    収穫されたパッケージは、IPBDが表面に存在するか否かを決定するためにテストされる。 GP表面にあるIPBDの存在を調べるいかなるGPsテストにおいても、イオンもしくはIPBDの安定性のために重要であると知られている補足因子もしくはAfM(IPBD)が適当なレベルで含まれているかを調べる。 テストは、下記によって行われる。 すなわち、a)親和性のラベルを付すことによって、b)酵素応用で、c)分光光度的に、d)親和性分離で、もしくはe)親和性沈降反応によって行われる。 この段階でのAfM(IPBD)は、IPBD分子に対する強度の親和性(望ましくはK

    d <10

    -11 M)そしてwtGPに対する少量の親和性もしくは無親和性を持っているものを取り上げる。


    V. ーゲット結合突然変異体の親和性選択V. A. 一般的な親和性分離技術親和性分離は、顕示機構が働いているか否かを確認するために初めてこの発明で利用された。 すなわち、キメラの外表面タンパク質が発現されて、そして遺伝子パッケージの表面に運搬されたか否かを調べるもので、挿入された結合ドメインがターゲット物質に受容され得るように方向ずけられている。 この目的のために利用された場合には、結合ドメインは特別なターゲットのための既知の結合ドメインであり、そのターゲットは親和性分離工程において利用される親和性分子である。 たとえば、一つの顕示機構は、挿入される遺伝子パッケージの外表面タンパク質をコードしている遺伝子の中にBPTIをコードするDNAを挿入することにより確認し得るかも知れないし、通常BPTIによって結合されている無水トリプシンとの結合をテストすることによって確認され得るかも知れない。


    遺伝子パッケージがターゲットと結合している場合には、対応結合ドメインが遺伝子パッケージによってたしかに顕示されているという確認を持つことができる。 結合ドメインを顕示しているパッケージ(そしてそこでターゲットと結合している)は、結合していないものから分離される。


    一度、顕示機構が確認されると、様々な異なったポテンシャル結合ドメインを顕示している遺伝子パッケージの変化された集団を利用することが可能となり、そして一つもしくはそれ以上のターゲットとの結合がうまく行われているか否かを決定するための親和性分離技術を利用することが可能となる。 このターゲットは、顕示された結合ドメイン、すなわち、一つの新しいターゲットとの結合のために選ばれ得るもの、に対して親である既知の結合ドメインによって結合されたものである必要はない。


    「親和性分離手段」という言葉は、下記に限られることなく、下記を含むものである。 すなわち、a)親和性コラムクロマトグラフィ、b)親和性マトリックス物質からの一括溶出、c)一つのプレートに接着された親和性物質からの一括溶出、d)細胞選別を活性化した螢光、そしてe)ターゲット物質の存在下における電気泳動、を含む。 「親和性物質」とは、浄化されるべき物質、「検体」(analyte)と呼ばれる物質に対する親和性を持った物質を意味することに使われた。 大多数の場合には、親和性物質を検体との関係は逆に戻すことができるので、検体は一度不純物が洗い去られると親和性物質から遊離され得るものである。


    V. B. 一般親和性クロマトグラフィ親和性コラム クロマトグラフィ、なにかの容器に保管された親和性マトリックス物質からの一括溶出、そしてプレートからの一括溶出は、非常に類似しているので、これらは今後、「親和性クロマトグラフィ」として取り扱うこととする。


    親和性クロマトグラフィが利用されると、


    1)ターゲット物質の分子は、適当に大きいサイズでなければならない、そして親和性分離のために適当な堅固な支持に対して利用される化学的反応性がなければならない、


    2)マトリックスへのアップリケーションの後、ターゲット物質は水と反応しないことがのぞましい、


    3)マトリックスへのアップリケーションの後、ターゲット物質は特殊ではない方法でタンパク質と結合したり劣化したりしてはいけない、そして4)ターゲット物質の分子は、ターゲット結合のための十分な、変化されない表面(リンカーに接続されている原子を除いて、普通、少なくとも500Å

    2の)を許容する一つのマトリックスに対する物質を接続するために十分に大きくなければならない。


    親和性クロマトグラフィは、望ましい分離手段ではあるが、FACS、電気泳動法、もしくはその他の方法も利用され得る。


    この発明は、望ましい結合特質を持ったタンパク質をコードする細胞もしくはウイルスを担っている遺伝子のために集団を濃縮するバクテリア参媒、もしくはバクテリア ウイルス(もしくは他の遺伝子パッケージ)の親和性分離に利用するためのものである。


    V. C. ターゲット物質この発明は、一つもしくはそれ以上のターゲット物質と結合する結合ドメイン、または一つもしくはそれ以上のターゲット物質との結合に失敗する結合ドメインのための選択に利用され得る。 もちろん、特殊性は、結合分子がターゲット物質の限られたセットに強固に結合するための能力であるが、識別されなければならない最初のセットからターゲット物質の他のセットにより微弱に結合したり、全然結合しない場合もある。


    ターゲット物質は、ポリペプチド、脂肪質、ポリヌクレア酸、そして多糖類のような有機高分子であるが、それらに限られることはない。 しかしながら、この発明は上述の識別されたターゲット物質のいずれにも限られてはいない。 ただ一つの限定は、ターゲット物質が親和性分離に適当であるということである。 このようにして、水溶液の中で安定しているほとんど全ての分子はターゲットとして利用し得る。


    ヒト好中球(neutrophil)エラスターゼ(HNE)のようなセリンプロテアーゼは、ポテンシャルターゲット物質でも特に興味をひくクラスである。 セリンプロテアーゼは生きている有機物の中で[ウビキトース](ubiquitous)であり、消化、血液凝固、フィブリノリシス(fibrinolysis)、免疫反応、生殖、そしてペプチド ホルモンの後移行操作のような工程で重要な役割を演じるものである。 これらの酵素が演じる役割は重要であるが、制御されない、もしくは適当でないタンパク質分解活動は時として非常な破壊力を持つものである。


    V. D. 固定化もしくはターゲット物質へのラベル付けクロマトグラフィ、FACS,もしくは電気泳動に関しては、ターゲット物質を第二の化学構成要素に共有的に結合させる必要があるかも知れない。 クロマトグラフィにとっては、第二の構成要素はヒトのマトリックスであり、FACSにとって第二の構成要素は螢光色素であり、そして電気泳動にとっては、第二の構成要素は強力に電荷された分子である。 多くの場合には、ターゲット物質はすでに下記の望ましい性質を持っているのでカップリングは必要ではない。 すなわち、a)固定化、b)螢光、もしくはc)電荷。 その他の場合には、化学的もしくは物理的カップリングが必要である。


    親和性分離において利用される固定されたもしくはラベルを貼られた類似体を準備するために利用される実際上のターゲット物質は必要ではない。 むしろ、ターゲット物質の中の適当に反応する類似体がより以上に便利かも知れない。 反応する機能的グループを持っていないところのターゲット物質は、ハロゲンのような強力な試薬液の利用をとうして一つの反応する機能グループをまず生成することによって固定化することができるかも知れない。 ある場合には、事実上のターゲット物質の反応的グループが、乱されることなく存在させられたターゲット分子の一部を占領しているかも知れない。 その場合には、付加の機能的なグループが合成化学によって導入されるかも知れない。


    固定化の一般的な方法として、二つの方法が広範に利用されている。 第一の方法は、興味ある化合物をバイオティニレート(biotinylate)することである。 それからバイオティニレートされた誘導物を固定化されたアビディンに結合する。 第二の方法は、ターゲット物質に抗体を生成し、様々な方法で抗体を固定化し、それからターゲット物質を固定化された抗体に結合することである。 抗体の利用はより大型のターゲット物質のために適当である。 小型ターゲット(たとえば、10もしくはそれ以下の非水素原子からなるもの)は、抗体によって完全に覆没されてしまうので、ほんの少量のターゲットがターゲット抗体合成物に晒される。


    抗体に依存しない疎水性分子の非共有固定化もまた利用され得かも知れない。 2、3、3−トリメチールデカンのような化合物は、アルギン酸ナトリウムのようなマトリックス前駆物質と混合され、そしてその混合物は硬化用の溶液まで押し出される。 その結果として生成されたビーズは、2、3、3-トリメチールデカンを全体に散布され、そして表面に晒されている。


    他の固定化の方法は、特殊化学的機能性の存在に依存している。 一つのポリペプチドは−NH

    2 N-terminal;Lysines)、−COOH C-terminal; Aspartic Acids; Glutamic Acids、−OH(Serines;Threonines;Tyrosines)、そして−SH(Cysteines)を表示する。 アミノ酸のサイド鎖の反応性に関しては、CREI84参照のこと。 1つの多糖類は、糖のバックボーンを持っているDNAがそうであるように、遊離した−OHグループを持っている。


    支持物質として利用される適当なマトリックスには、ポリスチレン、ガラス、アガローズ、そしてその他のクロマトグラフィの支持物が含まれ、そしてそれらはビーズ、シート、コラム,ウエル、そしてその他の望ましい形態に生成される。


    選択工程の初期の段階で、ターゲット物質の比較的高度の集中が結合を容易にするためにマトリックスに利用され、ターゲット集中は、後に削減されて、より高度の親和性SBDsが選ばれる。


    V. E. より低い親和性のPBDを支えている遺伝子パッケージの溶出GPs集団は、タンパク質結合のために利用される予定だったものと互換され得る状態の下で親和性マトリックスに適用される、そしてその集団は、カラム上いくらかの溶質のグラジエントの推移によって画分される。 ターゲットに対する親和性を持っているPBDsのためにプロセスは濃縮され、そしてそのために、ターゲットに対する親和性が、利用された溶質によってより少なく影響される。 濃縮された画分は、溶出物がより大きく集中されてカラムから溶出する可変のGPsを含んでいるものである。


    溶出物は、顕示されたPBDsと固定化されたターゲット物質間の非共有相互作用を弱めることができる。 のぞましくは、溶出物が遺伝子パッケージを破壊しないこと、そして成功裡のミニタンパク質を対応している遺伝子メッセージが、PCRのような試験管内の方法によるよりもむしろ遺伝子パッケージを再生産することによって最も都合よく増幅されることである。 ポテンシャルな溶出物のリストには、塩(Na+、NH

    4 +、Rb+、SO

    4 −−、H

    2 PO

    4 −、クエン酸塩、K+、Li+、Cs+、HSO

    4 −、CO

    3 −−、Ca++、Sr++、C1−、PO

    4 −−−、HCO

    3 −、Mg++、Ba++、Br−、HPO

    4 −−そして酢酸塩)、酸、熱、ターゲットと結合すると知られている化合物、そして水溶性ターゲット物質(もしくはその類似物質)が含まれている。 非溶出の遺伝子パッケージは、溶出状態に抵抗するターゲット物質のために十分に高い親和性を持っている結合ドメインをコードしているDNAを含んでいる。 そのような成功裡の結合ドメインをコードしているDNAは、様々な方法で回収し得る。 望ましくは、結合遺伝子パッケージは、溶出状態の変化によって容易に溶出される。 代替的に、現場で遺伝子パッケージを培養することができるかも知れない。 もしくはフェノール(もしくは他の適当な溶剤)を持ったマトリックスでターゲットに含まれているものを抽出し、そしてPCRによるDNAもしくは組み替え型DNA技術によるDNAを増幅することができるかも知れない。 さらに、特定のプロテアーゼのためのサイトが顕示ベクトルの中に操作されている場合には、特定のプロテアーゼはGPからの結合ドメインを裂開するために利用される。


    マトリックスその他に対する非特定の結合は、親和性分離技術の中でよく知られている技術によって識別され、もしくは還元されるかも知れない。


    V. F. パッケージの回収親和性カラムへの結合を顕示しているパッケージの回収は、いくつかの方法で成し遂げることができるだろう。 すなわち、


    1)上記のようにグラジエントでカラムから溶出した画分を集めること。 カラムに対する高度の親和性を持ったPBDsをコードしている遺伝子のためにより濃縮されたGPsを含んでいるグラジエントの中に後で溶出している画分を集めること。


    2)水溶液の形でターゲット物質をカラムを溶出する。


    3)栄養媒体を持ったマトリックスを水に浸し、そして現場で望ましいパッケージを育てる。


    4)マトリックスの部分を削除し、そして成長媒体を接種するためにそれらを利用する。 5)ターゲットをマトリックスに接着しているつながりを化学的もしくは酵素的に劣化するので、ターゲットに結合しているGPsはさらに溶出する、もしくは6)パッケージを劣化し、そしてフェノールもしくは他の適当な溶剤でDNAを回収する。 回収されたDNAはGPsを再生する細胞を変換するために利用される。


    上述の方法を組み合わせて利用することができる。 親和性マトリックスから回収したいものは、GPsそのものではなく、その中にある情報である。 生存能力を持ったGPsの回収が強く望まれるが、遺伝子物質の回収が重要なのである。 細胞、胞子、もしくはビリオンが逆戻り出来ないようにマトリックスと結合しているが、破壊されていない場合には現場の細胞分割、萌芽、もしくは感染をとうして情報を回収することができる。 パッケージのタンパク質分解退化とDNA回収はのぞましくない。


    V. G. 濃縮されたパッケージの増幅選択された結合形質を持った生命力のあるGPsは、適当な媒体での培養によって増幅される、もしくは、ファージの場合には、そのように培養された宿主に感染する。 GPsがクロマトグラフィによって不活性化された場合には、osp−pbd遺伝子を担っているOCVは、GPから回収され、そして新しい、生命力を持った宿主に導入される。


    V. H. 推定SBDsの特徴:


    一つのもしくはそれ以上のクローンの分離されたもののために、osp断片なしに、各々のSBDが一つの遊離したタンパク質として生産され得るような発現ベクトルの中にsbd遺伝子断片をサブクローンするかも知れない。 結合の強さの物理的測定は、適当な方法によって各々遊離したSBDタンパク質のためにできるかも知れない。


    結合がまだ十分ではないと分かった場合には、次を変換するSBD(新しいPPBD)の残留基を決定する。 結合が十分である場合には、新規の望ましい結合タンパク質をコードしている遺伝子を支えている発現ベクトルをもとことになる。


    V. I. 合同選択:


    物質Aと結合するが物質Bとは結合しない分子、もしくは物質AとB両方に結合する分子、どちらでも代替的にもしくは同時に結合する分子の選択に関して記述した方法の親和性分離を調整しても良い。


    V. J. 敵対するものの操作一つの酵素もしくは受容者に対する敵対者を用意することはのぞましいことだろう。 天然の基剤もしくは作用物質か、活性サイトに達することを妨げている分子を生成することによって成し遂げられる。 活性サイトに直接結合する分子は、作用物質か敵対物質であるだろう。 このようにして、下記の戦略を採用した。 酵素と受容者を指定物質TER(ターゲット酵素もしくは受容者)の下であると考えている。


    大多数のTERsのために活性サイトを封鎖する科学的インヒビターが存在する。 通常これらの化学薬剤は、高度な毒性のために研究の道具としてのみ有用である。 二つの親和性マトリックスを用意した。 すなわち、一つは活性TERを、他の一つは封鎖されたTERを利用した。 変化されたGP(PBD)sの集団をつくり、酵素の両方の型に結合するSBPsを選択し、それによって、活性サイトと結合しないSDPsを入手した。 SBDsは酵素表面の異なった部位との結合を発見するだろうと期待している。 一対のsbd遺伝子は一つの介入しているペプチド セグメントと溶融している。 たとえば、SBD−1とSBD−2はターゲット酵素に対して高度の親和性を示している結合ドメインであり、そしてそのために結合は競争的ではなく、その遺伝子 sbd−1::linker::sbd−2は、ターゲットに対して高度の親和制示すだろう一つの2−ドメインをコードしている。 様々なSBDsと様々なリンカーを持っているいくつかの溶融を生成する。 そのような化合物は、ターゲット酵素に対して一つの敵対物質であるという理論的な確率性を持っている。


    VI. 成功する結合ドメイン対応DNAの開発SBDは組替型DNA技術で生成し得るが、一つのIPBDとしてミニ タンパク質利用から本来付与されている利点は、誘導されたSBDがまたミニ タンパク質のように行動するだろう、そして科学的合成に手段で入手し得だろうということである。 (「化学的合成」という言葉は、ここで使われているように、細胞なしの環境での酵素剤の使用も含まれている。)


    この発明の方法を利用することによって得られるミニ タンパク質は、天然には発生していないアミノ酸そしてアミノ酸以外のグループを含んでいる一連の同族体のための先導化合物として考えられることを理解しなければならない。 たとえば、一連のメンバーの各々は、そのD鏡像異性体によって置換された一つのアミノ酸を持っている一連の同族体を合成することができる。 また、ベータ アラニン、アミノ酪酸、3−ヒドロキシプロリン、2−アミノアジピン酸、N−エチルアスーラジン、ノルバリン、その他のような構成要素を含んでいる同族体を生成することができる、そしてそれらは、安定性や毒性などのような興味ある結合そして他の特質のためにテストされ得るだろう。


    ペプチドは、溶液もしくは支持物質の中で化学的に合成されるかも知れない。 段階的な合成を断片縮合の様々な組み合わせが利用され得るだろう。


    合成作用中は、アミノ酸サイド鎖は分枝を回避するよう保護することが望ましい。 いくつかの異なった保護グループが、システインのチオールグループの保護のために有用である。 それらは下記を含む。 すなわち、


    1)4−メトキシベンジル(MB

    z 1;Mob)(NISH82;ZAFA88)、HFで除去し得る。


    2)アセタミドメチル(Acm)(NISH82;NISH86;BECK89c)、ヨードで除去し得る。 水銀イオン(すなわち、水銀アセテート)。 硝酸銀。 そして3)S−para−メトキシベンジル(HOUG84)。


    他のチオール保護グループは、Greeneの「有機合成における保護グループ」(1981)のような標準の文献著作の中で見つけられる。


    ポリペプチド鎖が一度合成されると、ジスルフィド結合も形成されなければならない。 可能な酸性可剤は、空気(HOUGH84;NISH86)、フェリシアン化合物(NISH82;HOUG84)、ヨード(NISH82)、そして過ギ酸(HOUG84)である。 温度、pH、溶液、そしてカオトロピーの化学物質は、酸化工程に影響を及ぼすかも知れない。


    複数のジスルフィド結合を持った大多数のミクロタンパク質は、生物学的に活性のある形で化学的に合成されている。 それらは下記を含む。 すなわち、コノトキシンG1(13AA、4−Cys)(NISH82)、熱安定エンテロトマシンST(18AA、6 Cys)(HOUG84)、STの類似体(BHAT86)、オメガーコノトキシンGVIA(27AA、6Cys)(NISH86;RIVI87b)、オメガーコノトキシンMVIIA(27AA、6Cys)(OLIV87b)、アルファーコノトキシンSI(13AA、4CyS)(ZAFA88)、ミュー コノトキシン IIIa(22AA、6Cys)(BECK89c、CRUZ89、HATA90)を含む。 時として、ポリペプチドは自然に折り畳まれているので、正しいジスルフィド結合を形成する。 他の時には、各一対のシステインのために、異なった除去可能な保護グループの利用によって助力しなければならない。


    この発明による成功裡の結合のドメインは、大型タンパク質を単独でもしくは部分として、ターゲット物質の単離もしくは検出を含んだ目的、結合タンパク質が適当であることを確かめるための目的のために利用される。 この目的をさらに助長するためには、新規な結合タンパク質が直接的にもしくは間接的に共有的に、もしくは非共有的に、ラベルに、担体に、もしくは支持体に結合され得るかも知れない。


    薬剤として利用される場合には、新規な結合タンパク質は、適当な担体、もしくは補助剤と混合されても良い。


    例 1


    Aクラスミクロタンパク質のデザインおよび突然変異誘発物質単一のジスルフィドによって配座が拘束された結合ドメインのライブラリーを入手するためには、下記のミクロタンパク質属ヲコードしているDNAを適当なOSPをコードしている遺伝子に挿入する。 すなわち、


    部分がジスルフィド結合を表示している。 ジスルフィドは通常ポリペプチド鎖に連続しているシステイン間には形成されない。 上記にX

    nで表示された残留基の一つもしくはそれ以上は新規な結合を手に入れるために大きく換えられている。 X

    1を前置する、もしくはX

    6に従う一つもしくはそれ以上のアミノ酸がある、しかしながら、X

    1の前もしくはX

    6の後の残留基は、図表に表されたジスルフィド橋によって意義深くは拘束されない、そしてこれらの遠隔の橋のない残留基を換えることは有利ではない。 最後のX残留基は、遺伝子パッケージのOSPと連結されている。


    1 、X

    2 、X

    3 、X

    4 、X

    5 、そしてX

    6は独立して変換され得る、すなわち、変化の一つの異なったスキームが各部位で利用されることができる。 X

    1そしてX

    6は最小限に拘束された残留基であり、他の部位より変化が少ない。


    1とX

    6は、たとえば、アミノ酸(E、K、T、そしてA)の一つになることができ、このセットのアミノ酸は下記の理由のために望ましいものである。 すなわち、


    a)正電荷の、負電荷の、そして中性のアミノ酸の可能性が供給されている、


    b)これらのアミノ酸は、コードンRMG(R=等モルのAとG、M=等モルのAとC)


    そしてc)これらのアミノ酸はシグナル ペプチダーゼによって適切な工程が許容される。


    一つの望ましい実験例では、X

    2 、X

    3 、X

    4そしてX

    5は、代替セット(F、S、Y、C、L、P、H、R、I、T、N、V、A、D、そしてG)をコードしているコードンNNTによって各々コードされることにより初めて変化される。


    NNKコードンよりNNTコードンのほうが有利であることは、換えられたコードンの数が増加するに従って徐々にはっきりしてくるからである。 五つのコードンがNNTコードンかNNKコードンかのいずれかによって換えられたライブラリーを表10と表130で比較してある。 NNTは15の異なったアミノ酸をコードし、たった16のDNA配列をコードしている。 このようにして、1.139・10

    7のアミノ酸配列、ストップなし、そしてたった1.678・10

    7のDNA配列がある。 10

    8の独立した変換体のライブラリーは、全可能性配列の99パーセントを含んでいる。 NNKライブラリーは、6.4・10

    7配列を含んでいるが、完全なサンプリングはもっと多数の独立した変換体を必要とする。


    この配列は、天然のM13遺伝子IIIプロモーターとシグナル配刺を利用してM13の遺伝子IIIタンパク質との溶融として顕示される。 残留基16から23までのM13遺伝子IIIタンパク質の配列は、S

    16 HSAETVE

    23であり、シグナル ペプチダーゼーIがS

    16の後を裂開する。 このセグメントは下記と置換される。 すなわち、


    16 GA

    18 AEGX

    1 CX

    2

    3

    4

    5 CX

    6 SYIEGRVIETVE。


    17

    18がGAと換えられていることは感染のためのファージを拘束していないということに注意してください。 PBDと成熟したIIIタンパク質間に一つのボビンF. Xa認識/裂開サイト(YIEGR/VI)を挿入することは有用である。 これはPBDに対する位置決めの自由を許容するのみならず、GPからのPBDの裂開をも許容する。


    1 、X

    2 、X

    5 、そしてX

    6が、NNT(F、S、Y、C、L、P、H、R、V、T、N、V、A、D、そしてGを許容している)によってコードされている一つのファージ ライブラリー、そしてX

    3とX

    4が、NNG(L、S、W、P、Q、R、M、T、K、V、A、E、そしてGを許容している)によってコードされている一つのファージ ライブラリーは、TN2と名付けられている。 このライブラリーは、およそ1.5x10

    7 DNA配列によってコードされている およそ8.55×10

    6ミクロタンパク質を顕示する。 NNGは、これらの第三と第四の部位で少なくとも部分的にシステイン可能性を排除するために、第三と第四の可変部位(ジスルフィドが閉じ込められたループの中央部位)で利用される。


    Devlinらは10

    7変換体を篩い分けた。 その各々は、ストレプトアビジンを持った親和性のための10

    12ランダムペンタデカペプチドを顕示すし得る。 そして彼等は、八つのユニークな配列(「A」−「I」)を持った20のストレプトアビジン結合ファージ単離物質を発見した。 全単離物質はHP;15/20、HPQ;そして6/20、HPQFを含んでいたが、それらはペンタデカペプチド内の異なった部位にあった。 最も頻繁に出合った単離物質は、システインが完全に欠けているD(5)、I(4)、そしてA(3)であった。 しかしながら、二つのプラスの単離物質、「E」(1)と「F」(2)は、一対の配置されたシステインが含まれていたので、ジスルフィド結合の形成が可能であった。 これらの単離物質の配列は、表820に示されている。


    TN2ライブラリーは、ストレプト アビジン結合活動発現の可能性を持っているために、Devlinの「E」そして「F」に極めて類似している一つの推定のミクロタンパク質、HPQを入れるべきだったことを認識している。 HPQは、TN2ライブラリーの全メンバーに共通のAEGアミノ酸終端配列から成っており、四つのスパンでジスルフィド橋を形成し得る可能性を持っている配列PCHPQFCQによって随従され、一つのセリン(S)と一つのボビン因子Xa認識サイトによって随従される。 (YIEGR/IV)(表820参照のこと)。 パイロット実験は、ストレプトアビジンとHPQを担っているファージとの結合がDevilinの「F」単離物質のそれと比べ得るものであり、両方ともそのマージンはバックグラウンド(1.7×)の上にあった。 したがって、固定されたストレプトアビジンに対するTN2のライブラリーを篩にかけた。


    ストレプトアビジンは、1mgにつき、特殊な活動14.6ユニット(1ユニットは、1ミューgのバイオチンを結合する)を持った遊離タンパク質(Pierce)として利用し得る。 0.01パーセントのアジ化物を含んでいるPBSにおいて1ミリリットルに付き1mgのストック溶液が作られる。 StrAvストックの100ミューLが、1m-mulon(#4)プレートの250ミューL容積のウエルに付加され、摂氏4度で一晩培養される。 ストックは除去され、そして1mg/mLの濃度でBSAを含んでいるPBSの250ミューLと置換され、そしてさらに1時間摂氏4度で保たれる。 ファージ結合アッセイの中で利用する前に、ウエルは、0.1パーセントのツイーン(tween)を含んででいるPBSの250ミューLで5回手早く洗浄する。


    各StrAvが塗布されたウエルに、一つの知られた量(Tn2ライブラリーの10

    11 pfu's)のファージを含んだ100ミューLの結合緩衝液を加える。 室温で1時間培養を続け、その後、非結合ファージを除去し、PBS 0.1パーセントのツイーンで手早く10回洗浄する。 それからさらに、pHが7、6、と5のシトラートで洗浄して、非特殊な結合を除去する。 結合ファージは、mL BSAに付き1mgと1MトリスpH8の60ミューLを持った中和剤とを含んでいる250ミューLのpH2シトラート緩衝液で溶出させる。 溶出物は、結合、洗浄、そして溶出のその後のラウンドに利用される新規のファージストックを生成するバクテリア細胞に感染させるために利用された。 能力強化サイクルは、さらに二度繰り返され(全部で三度)、その後多数の個々のファージはクローンの単離物として配列に加えられ、またテストされた。 各ステップに存在するファージの数は、適当に希釈され、E.coliを含んでいるF'のローンにプレートされて、プラック形成ユニット(pfu's)として決定される。


    表838は、StrAvに結合するために発見されたペプチベド配列と最後の(ラウンド3)ファージ プールから取られたランダムピックの頻繁度を示している。


    検査された全推定ミクロタンパク質のインターシステインセグメントは、HPQモチーフを含んでいた。 最初のシステイン前の可変残留基は、{F、S、Y、C、L、P、H、R、I、T、N、V、A、D、G}のいずれかを含むことができた。 選択された残留基は{Y、H、K、D、N}であった、そしてファージHPQはPを持っている。 第二システイン後の可変残留基もまた{F、S、Y、C、L、P、H、R、I、T、N、V、A、D、G}を持つことができた。 選択された残留基は{P、S、G、R、V}であった、そしてファージHPQはQを持っている。 比較的よくない結合ファージHPQは多分P

    4もしくはQ

    13もしくはその両方のためかも知れない。


    対照実験にあいて、TN2ライブラリーは、上記に示された同一の方法でスクリーンされた、そしてそれは、封鎖エージェントBSAであるターゲットタンパク質を持っている。 結合、溶融、そして増幅の三つのラウンドの後、16のランダムファージプラックが選取され、配列された。 半数のクローンには挿入(8/16)が見られなかった。 そして残余のものには、表839に示されている配列があった。 このコレクションにはなんのコンセンサスもない。


    ファージに関連性を持ったミクロ タンパク質、HPQ6を顕示した。 CHPQFCのCHPQFPRCとの交替を除いては、それはHPQと同一である。 (表820を参照のこと)。 顕示された場合、HPQ6は、HPQもしくはDevlinの「F」単離体のいずれよりもストレプトアビジンに対するより実質的に強力な親和性を持っていた。 (Devilinの「E」単離体は研究されなかった。)ジチオスレイトル(dithio-threitol)(DTT)での操作は、ストレプトアビジンとのHPQ6ファージ結合(しかしファージをコントロールしていない)を著しく減少した、そしてそれは顕示されたペプチドの中に存在する一つのジスルフィド橋は、良い結合に必要であるということを示唆している。 TN2ライブラリーのスクリーニングの結果を検討して、ファージHPQ6の結合は、P

    4を{Y、H、L、D、N}の一つと代替することによって、もしくはQ

    13を{P、S、G、R、V}の一つと代替することによってさらに改善され得るだろう。


    例 II


    A CHS::HELIX::TURN::STRAND::CYS UNIT


    親クラス2ミクロタンパク質は、多分天然に発生しているクラス2ミクロタンパク質である。 それはまた、クラス2のミクロ タンパク質の基準を満足させるために、その構造が満足し、もしくは一部変更されるかも知れない一つの大型タンパク質のドメインであるかもしれない。 一部変更は、一つのシステイン(もしくは一対のシステインを)ヘアピン構造のベースに導入するような簡単なものかも知れない、そしてそうすることによって、ヘアピンはジスルフィド結合で閉鎖されるであろう。 もしくは、ヘアピン構造を達成するために、中間残留基の一部変更に関して、もっと手の込んだ方法で閉鎖されるであろう。 その親クラス2のミクタンパク質もまた二つもしくはそれ以上の天然に発生しているタンパク質、すなわち、一つのタンパク質のアルファヘリックスと第二のタンパク質のベータストランドからの構造の混成となるであろう。


    一つのポテンシャルな利用法のミクロタンパク質モチーフは、各一つのヘリックス、ターン、リターンのストランドを取り囲んでいるジスルフィドのループ構成することである。 そのような構造はデザインされ得るし、もしくは既知の三次元構造のタンパク質から入手することができるだろう。 サソリの神経毒素、変形物質3、(ALMA83a、ALMA83b)(以後ScorpTxと称する)は、図1に示されている構造を含んでいる、そしてそれは一つのヘリックス(残留基N22からN33まで)、一つのターン(残留基33から35まで)、そして一つのリターン(残留基36から41まで)から成っている。 ScorpTxは、残留基12−65、16−41、25−46、そして29−48を接続するジスルフィドを含んでいる。 CYS

    25そしてCYS

    41は、非常に近く、主鎖を乱すことなくジスルフィドによって結合され得る。 図1はCYS

    25とCYS

    41との結合を示している。 さらに、CYS

    29は、GLNに換えられている。 一つのジスルフィドは、25から41までの間を形成し、そして示されているヘリックスは形成すると期待している。 示されているアミノ酸配列は、この構造と高度な適合性を持っている。 GLY

    35 、GLY

    36 、そしてGLY

    39の存在は、ジスルフィド形成のためにCYS

    41の周りで必要である変化の便宜を図るために、ターンそして引き伸ばされたストランドに十分な可橈性を与えている。


    この構造の検査から(Brookhaven Protein Data Bankの1SN3に見いだされるように)、下記の残留基のセットは変化のために望ましいものであろうと考える。 即ち、


    ポジション27、28、31、32、24、そして23は,ヘリックスの一面を構成している。 これらの各々の部位において、下記の変化しているコードンを拾いあげた。 すなわち、a)親のアミノ酸を含んでいるもの、b)ヘリックスが望ましくしている残留基の優位性を持っている残留基のセットを含んでいるもの、c)広範な種類のアミノ酸を提供しているもの、そしてd)できるだけ平均した分布に導くもの。 ポジション34は、ターンの部分である。 残留基34のサイドグループは、残留基27、28、31、32、24そして23のサイドグループと接触する分子と相互作用し得る. このようにして、ここに変化を許容し、そしてターンと適合性のあるアミノ酸を提供する。 示された変化は、8.85・10

    6 DNA配列によってコードされた6.65・10

    6 3アミノ酸配列に導く。


    ポジション26、27、30、31、そして32は、集団の中のヘリックス好意的アミノ酸の能力強化を図るために換えられる。 残留基37と38は、リターン ストランドの中にあるので、他の変化コードンを採用する。 この変化は4.43・10

    6 3アミノ酸配列と7.08・10

    6 DNA配列を許容するこのようにして、このスキームを具体化する一つのライブラリーは、すこぶる効果的にサンプルを取ることができる。


    例 III


    クラス3ミクロタンパク質のデザインと突然変異誘発物質二つのジスルフィド結合を持った親ミクロタンパク質二つのジスルフィド結合を持ったミクロ タンパク質は、アルファコノトキシン、すなわち、GI、GIA、GII、MI、そしてSIをモデルとすることができるかも知れない。 これらは、下記の保存された構造を持っている。 すなわち、


    橋本ら(HASH85)は、アルファコノトキシンGI、GII、そしてMIの24の類似体の合成について報告している。 GI(ポジション2、3、7、そして13にあるCYS)のための番号付けのスキームを利用して、橋本らは、タンパク質が毒性になることを許容する4、8、10、そして12での改変を報告している。 Almquistら(ALMQ89)は、(des−GLU

    1 )アルファコノトキシンGIと20の類似体を合成した。 彼等は、PRO

    5の代わりにGLYを代替して、二つの異性体、多分異なったジスルフィド結合に関連しているもの、を立ち上がらせたと報告した。 彼等は、タンパク質が毒性であることを許容したいくつかの代替物質を残留基8から11までの間で発見した。 Zafarallaら8ZAFA88)は、ポジション9におけるPRO代替は活性タンパク質を提供するということを発見した。 引用された各々のグループは化学反応のためにアッセイとして生体内毒性飲みを利用した。 そのような研究から、活性タンパク質は親の三次元構造を持っているということは推論できるが、不活性のタンパク質親の三次元構造に欠けているということは推論できない。


    Pardiら(PARD89)は、アルファ コノトキシンGIはNMRによってベノム(venom)から入手てせきると断定した。 小林ら(KOBA89)は,MMRからの合成アルファコノトキシンGI三次元構造を報告した、このデータはPARD89のデータを合致している。 Pardiらの図5を引用している。


    残留基GLU

    1は、既知の類似体もしくは同族体のGLU、ARG、そしてILEの便宜を図ることで知られている。 望ましい変化コードンは、アミノ酸セット(L

    2

    2 MVSPTAQKEWG<ストップ>)を許容するNNGである。 Pardiらの図5から、GLU

    1のサイドグループは、残留基9から12までから成るストランドとして同一の領域に投影するということが分かる。 残留基2と3はシステインであり、変化されることはない。 残留基4のサイドグループは、残留基9から12までから(point away)(注意をそらせる)する。 このようにして、後続のラウンドまでこの残留基変換を据え置く。 PRO

    5は、適切なジスルフィドが形成されるための原因になる必要があるかも知れない。 GLYが代替された場合には、ペプチドはここで二つの形態に織り込まれるが、いずれにも毒性はない。 PRO

    5が変換することを許容されるが、第一ラウンドではのぞましく考えられない。


    ALA

    6における代替物質は報告されていない。 一つの望ましいコードンはALA、THR、LYS、そしてGLU(小型疎水性物質、小型親水性物質、プラス、そしてマイナス)を生じるRMGである。 CYS

    7は変換しない。 ALA

    8を持っている同族体タンパク質には毒性があるが、GLY

    8はそのまま残しておくことを望む。 ポジション9の種々アミノ酸を持っている同族体タンパク質には毒性がある。 このようにして、FS

    2 YCLPHRITNVZDGを許容する一つのNNT変化コードンを利用する。 第四CYSの後ポジション14で、ALA、THR、LYS、もしくはGLU(RMGコードン経由で)を許容する。 この変化は、1.68・10

    7 DNA配列によってコードされた1.053・10

    7アミノ酸配列を許容する。 2.0・10

    7 、3.0・10

    7 、そして5.0・10

    7の独立した変換体を持っているライブラリーは、各々許容された配列のほぼ70パーセント、ほぼ83パーセント、そしてほぼ95パーセントを顕示するだろう。 他の変化もまた適当である。 アルファコノトキシンに関しては、特にALMQ89、CRUZ85、GRAY83、GRAY84、そしてPARD89を参照のこと。


    親のミクロ タンパク質は、Peaseら(PEAS90)によって指定された「ハイブリッドI」そして「ハイブリッドII」のタンパク質の一つを代替し得るかも知れない。 PEAS90の図4と比較すること。 いずれのタンパク質のためにも変わる残留基の望ましいセットの一つは、下記から成るものである。 すなわち、


    これは、1.26・10

    7 DNA配列によってコードされた9.55・10

    6アミノ酸配列を提供する。 5.0・10

    7変換体から成っている一つのライブラリーは、全可能配列の98.2パーセントの発現を許容する。 各々の部位において、親アミノ酸は許容される。


    ポジション5で、一つのターンと互換性を持つアミノ酸を提供する。 ポジション6で、ILEとVALは枝分かれしたベータ炭素を持て、そして鎖をうねにしている理由から、ILEとVALを許容する。 ポジション7で、ヘリックスのアミノ酸終端でしばしば発現するASP、ASN。 そしてSERを許容する。 ポジション8と9で、ヘリックス固有のの部分であるという理由で、異なっている電荷と疎水生物(hydrophobicities)を持っているいくつかのヘリックス友好アミノ酸(ALA、LEU、MET、GLN、GLU、そしてLYS)を許容する。 ポジション10はヘリックスのずっと離れた端にあるので、小型セット(ALA、THR、LYS、そしてGLU)を許容する。 このセットは、三つのヘリックス友好アミノ酸、並びに、きわめてよく許容されているが、プラス、マイナス、中性の親和性を許容するTHRを含んでいる。 12と16のサイドグループは、既に記述された残留基として同一の領域の中に投射する。 これらの部位において、ヘリックスに友好的なアミノ酸に対してゆがみを持っている多種多様なアミノ酸を許容する。


    親のミクロ タンパク質は、残留基9−24そして31−40のアプロチニン(aprotinin)から成り、そして二つのジスルフィド(Cys9−Cys22そしてCys14−Cys38)を持っている一つのポリペプチドと代替されても良いだろう。 そのようなポリペプチドは、アルファ コノトキシンのような同じジスルフィド結合位相を持っており、そしてその二つの橋は各々12と17のスパンを持っているものである。


    残留基23、24、そして31は、アミノ酸残留基セット(G、S、R、D、N、H、R、T、A)をコードするために変化されるので、必要な幾何学のターンをこのむ一つの配列が発見される。 P1領域におけるBPTIに類似した安定した構造の中に折り畳まれているミクロタンパク質を顕示しているGPsを豊かにする親和性分子をしてトリプシンもしくは無水性トリプシンを利用する。


    三つのジスルフィド結合親ミクロタンパク質コーンかたつむり(Conus)は、長さが10−30アミノ酸で、そしてジスルフィド結合が特に豊かである毒性コノトキシン(Conotoxins)を生成する、それらは、従って、原形のミクロ タンパク質である。 三つのジスルフィド結合を持った新規なミクロ タンパク質は、ミュー(GIIIA、GIIIB、GIIIC)もしくはオメガー(GVIA、GVIB、GVIC、GVIIA、GVIIB、MVIIA、MVIIGその他)コノトキシンをモデルにすることができるだろう。 ミューコノトキシンは下記の保存された構造を持っている、すなわち、


    ミューコノトキシンの非三次元構造はすでに開示されている。 日高ら(HIDA90)は、ジスルフィドの関連性を樹立した。 下記のダイアグラムは、ジオグラフトキシンI(geograph-toxin I)(ミューコノトキシンGIIIAとしても知られている)を描いている。


    R19からC20までの接続はQ14からC15までのストランドにいくことができる。 一つの望ましい変化の形態は一つのループの残留基を換えることである。 最も長いループが五つのアミノ酸のみを含んでいるので、ループを形成しているシステインと接続している残留基を換えることも適切である。 たとえば、残留基5から9、それに2、11、19、そして22を加えて換えることができるかも知れない。 もう一つの有用な変化は、残留基11−14そして16−19を、8つのアミノ酸をとうして、換えることであろう。 ミューコノトキシンに関しては、BECK89b、BECK89c、CRUZ89、そしてHIDA90を参照のこと。


    オメガコノトキシンは下記のように表示されるであろう。 すなわち、


    キングコング ペプチドは、オメガコノトキシンと同じジスルフィドの取り合わせを持っているが異なった生物学的活動を持っている。 Woodwardら(WOOD90)は、C.textileから三つの同族体タンパク質の配列を報告している。 成熟した毒素ドメイン内でシステインのみが保存されている。 システインの面間隔は完全に保存されているが、他のポジションは三つの全配列の同一のアミノ酸を持っていない、そしてほんの少数のポジションが一対のようなものを示している。 このようにして、全ポジションは(システインを除いて)一つの安定したジスルフィド構造を形成するだろうところの高い可能性を持って自由に代替されるだろうと結論している。 オメガコノトキシンに関しては、HILL89とSUNX87を参照のこと。


    親の結合ドメインとして利用し得るかも知れない他のミクロ タンパク質は、とうなすマキシマ(Cucurbit maxima)トリプシン阻害物質I(CMTI−I)である。 CMTI−IIIもまた適当である。 これらは夏南瓜、ズキーニ、そしてキュウリからの阻害物質を含んでいるカボチャ属のセリン プロテアーゼ阻害物質のメンバーである。 (WIEC85)。 McWherterら(MCWG89)は、ヒトロイコサイト(leukocyte)エラスターゼとカテプシンG. に対する親和性を持っているカボチャ種属プロテアーゼ阻害物質の合成配列された変形物質について記述している。 勿論、この属のいかなるメンバーも利用され得るだろう。


    CMTI−Iは、三つのジスルフィド結合によって固定された配座の中に保持されている、たった29のアミノ酸から成っていることが知られている最小タンパク質の一つである。 その構造は、X線回折(BODE89)とNMR(HOLA89aとb)の両方を利用して、Bodeとその協力者達によって研究されている。 CMTI−Iは俵状をしており、それはヘリックスもしくはベータシートを持っていない、しかしそれはターンから成り、そして短いポリペプチドの延長で接続している。 ジスルフィドのペアリングは、Cys3−Cys20、Cys10−Cys22、そしてCys16−Cys28である。 Bodeらによって研究されたCMTI−I:trypsin合成物の中で、29の阻害物質残留基のうち13は、トリプシンと直接的な関連を持っている。 それらの大多数は、化学反応サイト結合Arg5(P1−)IIe6を含んでいる重要な結合セグメントVal2(P4)−Glu9(P4')の中に存在している、そして他のスリン プロテイナーゼ阻害物質にも見られた一つの配座一座の中に存在している。


    CMTI−Iは、ほぼ1.5・10

    -12 Mのトリプシンのための一つのK

    1を持っている。 McWherterらは、HLE特殊性を授与するためにP1における「中程度に量の多い疎水性グループ」の代替物質を示唆した。 彼等は、HLEに対する検出可能な結合を与える残留基(HAL、ILE、LEU、ALA、PHE、MET、そしてGLY)の広範なセットを発見した。 カテプシンGに関しては、彼等は、真に望ましい量の多い(特に芳香属K)サイドグループを予期していた。 彼等は、PHE、LEU、MET、そしてALAがそれらの基準に従って機能的であることを発見した。 彼等は、TRP、TLR、もしくはHISをテストしていない。 (ALAは第二に小さい利用可能なサイドグループを持っているということに注意してください。)


    最初の望ましい変化戦略は、残留基ARG

    1 、VAL

    2 、PRO

    4 、ARG

    5 、ILE、LEU

    7 、MET

    8 、GLU

    9 、LYS

    11 、HIS

    25 、GLY

    26 、TLY

    27 、そしてGLY

    29の一部もしくは全部を換えることである。 たとえば、ターゲットがHNEである場合には、下記の可能性を持っているDNAを合成することができる。 すなわち、


    これは、およそ1.03・10

    7 DNA配列によってコードされたほぼ5.81・10

    6アミノ酸を許容する。 5.0・10

    7の独立した変換体から成る一つのライブラリーは、可能性のある配列のほぼ99パーセントを提供する。 他の変化スキームもまた利用され得る。


    これに属する他の阻害物質は下記を含んでいる。 すなわち、


    Citrullus vulgarisからのトリプシン阻害物質I(OTLE87)、


    Bryonia dioicaからのトリプシン阻害物質II(OTLE87)、


    Cucurbita maximaからのトリプシン阻害物質I(OTLE87の)、


    Cucurbita maximaからのトリプシン阻害物質III(OTLE87の)、


    Cucurbita maximaからのトリプシン阻害物質IV(OTLE87)、


    Cucurbita pepoからのトリプシン阻害物質II(OTLE87の)、


    Cucurbita pepoからのトリプシン阻害物質III(OTLE87の)、


    Cucumis sativusからのトリプシン阻害物質IIb(OTLE87の)、


    Cucumis sativusからのトリプシン阻害物質IV(OTLE87の)、


    Ecballiumelaterriumからのトリプシン阻害物質II(FAVE89)そして


    Momordica repensからの阻害物質CM-1(OTLE87の)


    初期ポテンシャル結合ドメインとして利用され得る他のミクロ タンパク質は、いくらかの腸内毒素誘発物質のE.coli、Citrobacter freundii、そしてその他のバクテリアから誘発された熱安定性をもった腸内毒素である。 これらのミクロ タンパク質は、E.coliから分泌されることが知られており、十分な安定性を持っている。 これらのタンパク質の合成、クローニング、発現、そして特質に関しては、下記を参照すること。 すなわち、BHAT86、SEKI85、SHIM87、TAKA85、THOM85aとb、YOSH85、DALL90、DWAR89、GARI87、GUZM89、GUZM90、HOUG84、KUBO89、KUPE90、緒か87、OKAM88、そしてOKAM90。


    例 IV


    CU(II)、一つのシステイン、二つのヒスチジン、そして一つのメチオニンから成る一つのクロスリンクを持っているミニタンパク質下記のような配列は、すなわち、HIS−ASN−GLY−MET−Xaa−Xaa−Xaa−Xaa−Xaa−Xaa−HIS−ASN−GLY−CYSそしてCYS−ASN−GLY−MET−Xaa−Xaa−Xaa−Xaa−Xaa−Xaa−HIS−ASN−GLY−HISは、ダイアグラムに示してあるような構造を形成するためにCu(II)との結合を容易にする。


    鎖に沿ってHIS、MET、HIS、そしてCYSの他の取り合わせもまた同様な構造を形成するようである。 ポジション2と3そしてポジション12と13にあるアミノ酸ASN−GLYは、それらが一緒になり、そして金属と結合するために十分な柔軟性を持った金属結合配位子を担っているアミノ酸を授与する。 他の接続配列も利用し得るかも知れない、すなわち、GLY−ASN、SER−GLY、GLY−PRO、GLY−PRO−GLY、もしくはPRO−GLY−ASN利用し得るかもしれない。 また、第一と第二もしくは第三と第四の金属結合残留期を結ぶループの中に一つもしくはそれ以上の残留基を換えることも可能である。 例えば、


    Xaa4で種々アミノ酸のためにダイアグラムされた構造を形成するに違いない。 それはサイドグループのXaa4とXaa6が一緒に近在し、ミニ タンパク質の表面に存在していることが期待できる。


    変化したアミノ酸は、保持されているので、それらの柔軟性は限られている。 このクロスリンクは、ジスルフィドリンケージからは幾分か異なっている。 Cアルファ

    4とCアルファ

    11間の分離は、一つのシステインのCアルファsの分離より大きいものである。 さらに、金属イオンを持った残留基1から4そして11から14までの相互作用は、残留基4から11までのジスルフィドより、残留基5から10までの動きをより以上に規制することが期待されている。 単一のジスルフィド結合は、結合した残留基のアルファ炭素に強力な遠隔拘束を働かすが、たとえば、主鎖のおけるNからCまでのベクトルにはきわめて少量の方向的拘束しか働かせない。


    望ましい配列にとって、残留基5から10までのサイドグループは、ターゲットと特殊な相互作用を形成する。 他の可変アミノ酸、たとえば、4、5、7、もしくは3などは適当である。 大きなスパンは、次の場合に利用され得るかも知れない。 すなわち、包括された配列が、ポリペプチド主鎖の配座の自由を規制しているアルファ ヘリックスもしくは他の第二義的は構造を形成するための高度のポテンシャルを持っているセグメントを含んでいる場合である。 四つのCYSsを持っているミニ タンパク質は三つの特殊なベアリングを形成することができるが、二つのHISs、一つのMET、そして一つのCYSを持っているミニ タンパク質は、Cuとたった二つの特殊な合成物しか形成できない。 これら二つの構造は、Cuをとうしての鏡面対称によって関係ずけられている。 二つのHISsは識別可能であるので、構造は異なっている。


    そのような金属含有のミニ タンパク質が線状ファージに顕示される場合には、ファージを生成している細胞は適切な金属イオンの存在する中で成長し得る、もしくはファージは、それらが細胞から分離された後にのみ金属に晒され得る。


    ZN(II)と四つのシステインから成る一つのクロスリンクを持っているミニタンパク質例 V


    例XVに示されているものに類似したクロスリンクは、亜鉛フィンガー タンパク質(GIBS88、GAUS87、PARR88、FRAN87、CHOW87、そしてHARD90)によって例示されている。 亜鉛フィンガーの一属は、Zn

    ++ (PARR88、FRAN87、CHOW87、EVAN88、BERG88、CHAV88)を結合する保持されたポジションの中に二つのCYSと二つのHIS残留基を持っている。 Gibsonら(GIBS88)は、亜鉛フィンガーを形成すると考えられているいくつかの配列を研究し、これらの化合物のための三次元モデルを提案している。 これらの配列の大部分は保持されたポジションに二つのCYSと二つのHIS残留基をもっているが、あるものは三つのCYSと一つのHIS残留基をもっている。 Gaussら(GAUS87)もまた亜鉛を結合している三つのCYSと一つのHIS残留基を持っている亜鉛フィンガータンパク質を報告している。 Hardら(HARD90)は、各々が四つのCYS残留基を持っている二つの亜鉛フィンガーから成る一つのタンパク質の三次元構造を報告している。 これらの亜鉛結合タンパク質の全ては、還元細胞内環境の中で安定している。 一つのCYS::亜鉛クロスリンク ミニタンパク質の一つの望ましい例は、HARD90の図1に示されている配列の残留基440から461で成っている。 残留基444から456は変化され得るかも知れない。 そのような一つの変化は下記のとうりである。


    これは、同数のアミノ酸配列をコードしている3.77・10

    7 DNA配列に導く。 1.0・10

    8独立変換体を持っている一つのライブラリーは許容された配列の93パーセントを顕示するだろう。 2.0・10

    8独立変換体は、許容された配列の99.5パーセントを顕示するだろう。


    文献


    QQ群二维码
    意见反馈