Computer-based method for identifying a peptide motif of conserved invariant

申请号 JP2001571896 申请日 2000-08-31 公开(公告)号 JP2003528639A 公开(公告)日 2003-09-30
申请人 カウンシル・オブ・サイエンティフィック・アンド・インダストリアル・リサーチ; 发明人 デバシス ダッシュ,; クマー, サミア ブラマチャリ,;
摘要 (57)【要約】 本発明はいくつかの 生物 体のゲノム様式の比較を行うための新規なコンピューターベースの方法に関し、当該コンピューター法は、いくつかの生物体のタンパク質配列からのペプチドライブラリーの作製、および続いて保存された不変のペプチドモチーフの同定を導く比較を包含し、ならびにこの目的のために、いくつかの不変のペプチドモチーフは、任意の事前の推定を伴わずに種々の細菌生物体と宿主ゲノムとの間の直接的な配列比較によって同定され、ならびに本発明の方法は、潜在的な薬剤標的の同定のために有用であり、そして広範囲の抗細菌剤についての薬剤ふるいとして、および感染の特定の診断のために、ならびにさらに、このような不変のペプチドモチーフサインの補助を伴って未だ未知の機能のタンパク質への機能の割り当てのために作用し得る。
权利要求
  • 【特許請求の範囲】 【請求項1】 薬剤標的として有用な不変のペプチドモチーフを同定するためのコンピューターベースの方法であって、以下の工程i)http://www.ncbi.nlm.nih.govにて入手可能な選択された生物体の全てのタンパク質配列から重複するペプチドライブラリーをコンピューター処理的に作製する工程、 ii)上述のようにして得られた長さ「N」のペプチドを、単一文字のアミノ酸コードに従って、アルファベット順にコンピューター処理的に選別する工程、 iii)選択された細菌の共通のペプチド配列をコンピューター処理的にマッチングする工程、 iv)元来のタンパク質におけるこれらの共通のペプチドを、コンピューター処理的に配置し、そして続いてそれらの起源および位置でそれらを標識する工程、
    v)重複する共通のペプチドをコンピューター処理的に合わせて、不変のペプチド配列の長い鎖を得る工程、 vi)結晶構造データベースからこれらの保存されたペプチドの二次構造を注釈付けする工程、 vii)非病原性系統のゲノムに対して病原性系統のゲノムを比較し、そしてこれらの2つの群において共通に保存されない配列を選択する工程、ならびにviii)宿主ゲノムにおいて所与の保存された配列についてサーチし、そして宿主ゲノムに存在する配列を却下することによって、潜在的な薬剤標的配列として不変の配列モチーフを、コンピューター処理的に検証する工程、を包含する、
    方法。 【請求項2】 請求項1に記載の方法であって、ここで長さ「N」のスライディングウィンドウの長さが、アミノ酸残基の4〜任意の長さの範囲であり得る、方法。 【請求項3】 請求項1に記載の方法であって、ここでタンパク質配列データが、任意の生物体から採用され得るが、Mycoplasma pneumo
    niae、Helicobacter pylori、Hemophillus
    influenzae、Mycobacterium tuberculos
    is、Mycoplasma genitalium、Bacillus su
    btillis、Escherichia coliのような微生物に具体的に制限されない、方法。 【請求項4】 請求項1に記載の方法であって、ここで保存されたペプチドモチーフが、以下: 1. AAQSIGEPGTQLT 35. KMSKSKGN 2. AGDGTTTAT 36. KMSKSLGN 3. AGRHGNKG 37. KNMITGAAQMDGAILVV 4. AHIDAGKTTT 38. KPNSALRK 5. CPIETPEG 39. LFGGAGVGKTV 6. DEPSIGLH 40. LGPSGCGK 7. DEPTSALD 41. LHAGGKFD 8. DEPTTALDVT 42. LIDEARTPLIISG 9. DHAGIATQ 43. LLNRAPTLH 10. DHPHGGGEG 44. LPDKAIDLIDE 11. DLGGGTFD 45. LPGKLADC 12. DVLDTWFSS 46. LSGGQQQR 13. ERERGITI 47. MGHVDHGKT 14. ERGITITSAAT 48. NADFDGDQMAVH 15. ESRRIDNQLRGR 49. NGAGKSTL 16. FSGGQRQR 50. NLLGKRVD 17. GEPGVGKTA 51. NTDAEGRL 18. GFDYLRDN 52. PSAVGYQPTLA 19. GHNLQEHS 53. QRVAIARA 20. GIDLGTTNS 54. QRYKGLGEM 21. GINLLREGLD 55. RDGLKPVHRR 22. GIVGLPNVGKS 56. SALDVSIQA 23. GKSSLLNA 57. SGGLHGVG 24. GLTGRKIIVDTYG58. SGSGKSSL 25. GPPGTGKTLLA 59. SGSGKSTL 26. GPPGVGKT 60. SVFAGVGERTREGND 27. GSGKTTLL 61. TGRTHQIRVH 28. GTRIFGPV 62. TGVSGSGKS 29. IDTPGHVDFT 63. TLSGGEAQRI 30. IIAHIDHGKSTL 64. TNKYAEGYP 31. INGFGRIGR 65. TPRSNPATY 32. IREGGRTVG 66. VEGDSAGG 33. IVGESGSGKS 67. VRKRPGMYIG 34. KFSTYATWWI を含むとして同定される、方法。 【請求項5】 請求項1に記載の方法であって、ここで不変のペプチドの数が、生物間の関連性および比較される生物の数に従って変化する、方法。 【請求項6】 請求項1〜4に記載の方法であって、ここで不変の配列が、
    データベース http://www.ncbi.nlm.nih.govにおいて入手可能なような以下のタンパク質に属し得、ここで該タンパク質の列挙が、以下: DNA指向性RNAポリメラーゼベータ鎖エキシヌクレアーゼABCサブユニットA III エキシヌクレアーゼABCサブユニットB IV DNAジャイレースサブユニットB V ATPシンターゼベータ鎖VI S-アデノシルメチオニンシンセターゼVII グリセルアルデヒド 3-リン酸デヒドロゲナーゼVIII 伸長因子G(EF-G) IX 伸長因子TU(EF-TU) X 30S リボソームタンパク質 S12 XI 50S リボソームタンパク質 L12 XII 50S リボソームタンパク質 L14 XIII バリルtRNAシンセターゼ(VALRS) XIV 細胞分裂タンパク質FtSH ホモログXV DnaKタンパク質(HSP70) XVI GTP結合タンパク質 LepA XVII 輸送体XVIII オリゴペプチド輸送ATP結合タンパク質OPPF を含む、方法。 【請求項7】 請求項1に記載の方法であって、ここで請求項1の工程(i
    ii)において与えられるようなペプチドライブラリーを比較する該方法が、図1において与えられる工程を従うことによって行われる、方法。 【請求項8】 請求項1に記載の方法であって、ここで請求項1の工程(i
    v)において与えられるような元来のタンパク質配列において共通のペプチドを配置する該方法が、図2において与えられる工程を従うことによって行われる、
    方法。 【請求項9】 請求項1に記載の方法であって、ここで請求項1の工程(v
    )において与えられるような重複を取り出した後に種々の長さの共通のペプチドを作製する該方法が、図3において与えられる工程を従うことによって行われる、方法。 【請求項10】 本発明の方法を行うためのマイクロプロセッサーベースの系であって、以下i)ペプチドライブラリーの作製のためのアミノ酸配列ウインドウを決定する、
    および続いて起源をタギングする手段、 ii)ペプチドライブラリーを比較する手段、 iii)元来のタンパク質においてこれらの共通のペプチドをコンピューター処理的に配置することならびに続いてそれらの起源および位置でそれらを標識すること、 iv)重複する共通のペプチドをコンピューター処理的に合わせて、不変のペプチド配列の長い鎖を得ること、 を備える、マイクロプロセッサーベースの系。 【請求項11】 本発明の方法を行うためのコンピューターベースの系であって、中央処理装置をさらに備え、ペプチドライブラリー作製プログラム(PE
    PLIB)、ペプチドライブラリーマッチングプログラム(PEPLIMP)、
    ペプチドステッチングプログラム(PEPSTITCH)、ペプチド抽出プログラム(PEPXTRACT)を行い、ここで該プログラムは全て、中央処理装置が使用者インターフェース装置での使用者の入力に応答して上記のプログラムのスクリーンを示すディスプレイに接続される中央処理装置によってアクセスされる記憶装置において保存される、コンピューターベースの系。 【請求項12】 公的に利用可能なデータベース(SWISSPROT)における他のタンパク質配列に対して相同性なし/または弱い相同性を示す未知の機能のタンパク質に機能を割り当てるための方法であって、以下の工程: I. 未知の機能のタンパク質配列からの重複するペプチドライブラリーをコンピューター処理的に作製する工程、 II. 上述のように得られた長さ「N」(Nはアミノ酸のスライディングウインドウの長さである)のペプチドを、単一文字アミノ酸コードに従って、アルファベット順にコンピューター処理的に選別する工程、 III. 全ての機能的に公知のタンパク質のペプチドライブラリーと、現在のライブラリーとをコンピューター処理的にマッチングして共通のペプチドを得る工程、 IV. 元来のタンパク質においてこれらの共通のペプチドをコンピューター処理的に配置し、そして続いてそれらの起源および位置でそれらを標識する、工程、
    V. 重複する共通のペプチドをコンピューター処理的に合わせて、不変のペプチド配列の長い鎖を得る、工程、 VI. ペプチド配列同一性の最大の長さが見出されるタンパク質の機能に基づいて未知のタンパク質に機能を割り当てる工程、を用いることにより、類似の機能のタンパク質との適合の数が多いほど、機能的な割り当ての尤度が高くなる、方法。
  • 说明书全文

    【発明の詳細な説明】 【0001】 発明の分野: 本発明は、薬剤標的として有用なペプチドを同定するためのコンピューターベースの方法に関する。 より詳細には、本発明は、潜在的な薬剤標的として有用な種々の生物体のタンパク質配列データにおける不変のペプチドモチーフの同定のための方法に関する。 本発明はさらに、正確なアミノ酸配列同一性サインを介した、未知の機能の仮説的なオープンリーディングフレーム(タンパク質)への機能の割り当てのための方法を提供する。 【0002】 本発明は、薬剤標的のための潜在的な候補として作用し得るタンパク質の保存された不変のアミノ酸配列の構造的および機能的なサインを同定するための新規なアプローチを提供する。 薬剤耐性系統の出現は、新規な薬剤および薬剤標的の同定を必要としてきた。 病原体のタンパク質に存在するが宿主のタンパク質に不在の独特の不変のペプチドモチーフは、潜在的な薬剤標的を示す。 本発明はまた、同時の多数のタンパク質配列のゲノム様式の比較のための方法を提供する。 なお別の利用性は、感染の特定の診断のために有用なペプチド配列を同定するためである。 【0003】 発明の背景: 感染を治癒するために今日利用可能であるほとんどの薬剤が、原因となる生物体の細胞中の特定のタンパク質標的分子に結合することが知られ、例えば、いくつかの抗生物質は、タンパク質翻訳が影響されるようにリボソームの機能を破壊することが知られる。 これらの場合において、薬剤は、リボソームRNAに直接的に結合するか、またはRNAタンパク質複合体に結合するかのいずれかであることが見出されている(Wimberlyら、1999)。 化学的プローブ化実験は、薬剤が、異なる生物体中の構造的に類似な領域において「不変」であるリボソームRNAのあるヌクレオチド配列に結合することを示した(PorseおよびGarrett、1999)。 他のクラスの薬剤は、転写のような他の機能(Cutlerら、1999)、または細菌細胞における脂肪酸生合成(McC
    affertyら、1999)をブロックするように作用する。 【0004】 近年、病原体細菌のいくつかの薬剤耐性系統(GhannoumおよびRic
    e、1999)が出現し、これは細菌の病原に起因して、感染を治癒するにおいて従来の処置手順を無効にする。 これは、新規な薬剤標的および対応する薬剤の同定を必要とする。 この目的のために、種々の微生物からの完全なゲノム配列の利用可能性が、所与のゲノムにおいてコードされる全てのタンパク質を分析する機会を私達に提供する。 今日公知のほとんどの薬剤がタンパク質を標的するので、所与の細菌において全てのタンパク質を分析することは、新規に有効な薬剤標的を提供し得るようである。 【0005】 タンパク質における保存された不変の配列の知見は、セグメントの包埋された位置対曝露された位置、または特異的な二次構造エレメントの存在のような、タンパク質の構築のある特徴を理解するにおいて有用であり得る(RoomanおよびWodak、1988、Presnellら、1992)。 タンパク質の機能的な役割は、保存された不変の配列の最も重要な局面である、通常の配列解析の方法としては、BLAST(Altschulら、1990)およびFAST
    A(WilburおよびLipman、1983)が挙げられる。 これらの方法は、アミノ酸配列置換マトリクスを使用してその質が評価される配列アラインメントを行う。 統計学的な算定が行われ、そして結果が格付けされた様式において出され、最も類似な配列が第1に格付けされる。 しかし、これらの方法は、この研究において特に重要である不変の配列モチーフを同定するために、同時にゲノム様式の比較を行うように設計されていない。 【0006】 ある生物体の各タンパク質と、いくつかの他の生物体の全ての別のタンパク質とを比較するためには、BLASTを1つ1つ使用しなければいけないか、またはバッチBLASTが使用されなくてはいけないかのいずれかであり、これは非常に時間がかかりすぎおよびそれゆえ実施可能ではない。 仮にこれが行われたとしても、実行の終わりに、相同なタンパク質およびアラインメントのセットの総括的な類似性が得られることであろう。 【0007】 複数の配列アラインメントを用いる問題は、これがタンパク質の選択に偏ることである。 機能的に関連されるタンパク質のみが、選択されたタンパク質間で任意の関係の明らかな像を与える。 このような手順は、労働集中的であり、および時間がかかりすぎ、そしてさらなるプロセシングおよびフィルタリングを必要とする結果を導く。 しかし、これらの方法によって、いくつかの生物体の全てのタンパク質を比較し、そして保存された不変のペプチドを検索することは不可能である。 【0008】 本発明は、上記のような多様な使用を導く、および上述に列挙される欠点を取り除く、不変の配列モチーフを探索するための新規なコンピューターベースの方法を提供する。 【0009】 出願人のアプローチは、異なる細菌タンパク質間の不変の配列モチーフが、タンパク質の構造および機能についての重要な役割を担わなくてはならないという範例に基づく。 薬剤標的が同定され得る多数の方法のうち、本発明者らは比較的なおよび構造的なゲノミクスに基づくアプローチを採用した。 この場合において、不変の配列モチーフは、直接的または間接的のいずれかで問題のタンパク質分子の機能に関与され得る。 このアプローチは、離れてまたは密接してのいずれかで関連される、細菌にわたって変化されずに残存している不変の配列モチーフが、損なわれ得ない独特の構造的特徴を発展したという概念に由来する。 実際、いわゆる保存的な置換はまた、これらの不変の配列モチーフにおいて寛容されないことがさらに起こり得る。 この目的のために、本発明者らは、任意の事前の推定を伴わずに、種々の細菌ゲノム間の直接的な配列比較によっていくつかの不変のペプチドモチーフを同定した。 配列を研究するこの公平なおよび未推定の方法は、種々のゲノムにおいて未同定の配列特性を解明する利点を有する。 【0010】 不変の配列モチーフは問題のタンパク質分子の機能に重要であり得るので、本発明者らの目的は、潜在的な広範囲の抗細菌性の薬剤標的としてこれらのペプチドモチーフを発展させることである。 これらの不変の配列に特異的に結合し得る小分子は、問題のタンパク質分子の機能の破壊を引き起こし得ることが考えられ得る。 このコンピューター内のアプローチが利用可能なデータベースに存在するタンパク質配列から機能を引き出すための実験的な検証のための新規な手本を提供することが予期される。 【0011】 発明の目的: 本発明の主な目的は、いくつかの生物体のゲノム様式のタンパク質配列の比較、および不変の保存されたペプチドの同定のための方法を提供することである。 【0012】 本発明の別の目的は、いくつかの生物体のゲノム様式の比較を行うための新規なコンピューターベースの方法に関し、ここで当該コンピューター法は、いくつかの生物体のタンパク質配列からのペプチドライブラリーの作製、そして続いて保存された不変のペプチドモチーフの同定を導く比較を包含する。 【0013】 本発明のなお別の目的は、潜在的な薬剤標的の同定のために有用な、および広範囲の抗細菌剤についての薬剤スクリーニングとして作用し得る、ならびに感染の特異的な診断のために有用な方法を提供することに関する。 【0014】 本発明のなお別の目的は、未だ未知の機能のタンパク質に、適切な機能を割り当てることである。 【0015】 なお別の目的は、潜在的な薬剤標的を同定するために不変のペプチドまたはそれらのアナログを組み込むコンピューター法を提供することである。 【0016】 発明の要旨 出願人は、自然淘汰に耐えた多くの生物体のタンパク質配列に存在する数百万個のペプチドから得られる、不変のペプチドモチーフを同定するための方法を発明した。 従って、これらの配列は、タンパク質の構造決定因子であり、これは標的され得るか、または薬剤発見のための標的としてふるいとして使用され得る。
    これらの特別の不変のペプチドサインはまた、特別に機能的なクラスのタンパク質に関連されることが見出される。 【0017】 本発明の方法はまた、毒性、病原性生物体の特異的なペプチドモチーフに対して標的される薬物についての宿主細胞における代替の標的、または疾患プロセスを担う任意の宿主タンパク質標的を予測することを可能にする。 方法は、より多くのタンパク質に対してより低いストリンジェンシーを用いて、およびまた、真核生物および多細胞生物体について拡張され得る。 【0018】 本発明の他のおよびさらなる局面、特徴、および利点は、開示の目的のために与えられる本発明の現在好ましい実施態様の以下の記載から明白である。 【0019】 コンピュータープログラムの簡単な説明 1. PEPLIB 目的:生物体のペプチドライブラリーをそれらのFASTA形式タンパク質ファイルから作製するためのもの。 従って、使用者に規定される長さの重複するペプチドが作製され、次いで非重複性のペプチドのみが出力ファイルにおいてアルファベット順に配置される。 プログラミング言語:IRIXプラットフォームにおけるPERL。 2. PEPLIMP 目的:このプログラムは、使用者によって選択される生物体のペプチドライブラリーを比較し、そしてゲノムにわたって共通であるペプチド配列を報告する。 プログラミング言語:IRIXプラットフォームにおけるPERL。 3. PEPXTRACT 目的:このプログラムは、入力としてペプチドファイルを用い、FASTA形式タンパク質ファイル(pepファイル)においてサーチし、そしてペプチドについての詳細を報告する。 詳細はPID、タンパク質におけるペプチドの位置、
    生物体名などを含む。 プログラミング言語:IRIXプラットフォームにおけるPERL 4. PEPSTITCH 目的:このプログラムは、ある固定された規準(2つのペプチドは同じPID
    を有するべきであり、およびそれらの位置は近接するべきである)に依存してペプチドをつなぎ、そして重複を取り出し、そして全ての保存された不変のペプチドを報告する。 プログラミング言語:IRIXプラットフォームにおけるPERL 【0020】 発明の詳細: 理論的にいうと、莫大な数の組み合わせが、所与の長さのペプチドを形成するためにアミノ酸レベルで可能であるが、制限された画分のみが生物学的系において観察されている。 この制限された画分以外に、数個のペプチドのみが、異なる生物体のゲノムにわたって不変なままである。 本研究において、本発明者らは、
    全ての病原性および非病原性細菌ゲノムにわたって不変であるペプチドの性質に相応する質問を解答することを追求した。 【0021】 本発明において、種々の生物体のタンパク質におけるアミノ酸保存のストレッチが異なるクラスのタンパク質間の正確な区別を提供し得ることが示された。 一般的に、これらのタンパク質は、生物体の生存において非常に基本的な機能を有するタンパク質として同定される。 【0022】 いくつかの生物体のタンパク質配列は、既存のデータベース(NCBI、ge
    nbank/genomes/bacteria)からコンピューター処理的に得られた。 次いで、これらは特別に開発されたコンピュータープログラムPEP
    LIBによって「N」アミノ酸残基のペプチドフラグメントにコンピューター処理的に切断された。 長さ「N」のペプチドのライブラリーは、同時に1残基により配列に沿って長さ「N」のウィンドウをスライディングすることによって、各生物体の全てのタンパク質について作製された。 このように得られたペプチドは、単一文字アミノ酸コードに従ってアルファベット順にコンピューター処理的に選別され、そして重複性が、重複されたペプチドを削除することによって取り出された。 次いで、種々の生物体のペプチドは、共通のペプチドを見出すためにコンピューター処理的に比較された。 比較は、特別に開発された、PEPLIMP
    と標識されたコンピュータープログラムを使用して行われた。 共通のペプチドは、PEPXTRACTプログラムを使用して元来のタンパク質においてコンピューター処理的に配置され、そして続いてそれらのタンパク質の起源および位置で標識された。 これらの共通のペプチドは、共通のペプチドの長い鎖を形成するためにコンピューター処理的にバックステッチされた。 これは、PEPSTICH
    プログラムを使用して行われた。 【0023】 このようにして得られた共通のペプチドのこれらのフラグメントは、それらが機能的に保存されたタンパク質に由来するので、不変のペプチドとして命名された。 次いで、同じタンパク質から得られた全ての保存された不変のペプチドを1
    つの群に集団化した。 これらのペプチドの二次構造は、タンパク質結晶構造データ−ベース、従って、Protein Data Bank(PDB)から検証された。 【0024】 従って、本発明は、薬剤標的として有用な不変のペプチドモチーフを同定するためのコンピューターベースの方法を提供し、以下の工程i)http://www.ncbi.nlm.nih.govにて入手可能な選択された生物体の全てのタンパク質配列から重複するペプチドライブラリーをコンピューター処理的に作製する工程、 ii)上述のようにして得られた長さ「N」のペプチドを、単一文字のアミノ酸コードに従って、アルファベット順にコンピューター処理的に選別する工程、 iii)選択された細菌の共通のペプチド配列をコンピューター処理的にマッチングする工程、 iv)元来のタンパク質においてこれらの共通のペプチドを、コンピューター処理的に配置し、そして続いてそれらの起源および位置でそれらを標識する工程、
    v)重複する共通のペプチドをコンピューター処理的に合わせて、不変のペプチド配列の長い鎖を得る工程、 vi)結晶構造データベースからこれらの保存されたペプチドの二次構造を注釈付けする工程、 vii)非病原性系統のゲノムに対して病原性系統のゲノムを比較し、そしてこれらの2つの群において共通に保存されない配列を選択する工程、ならびにviii)宿主ゲノムにおいて所与の保存された配列についてサーチし、そして宿主ゲノムに存在する配列を却下することによって、潜在的な薬剤標的配列として不変の配列モチーフを、コンピューター処理的に検証する工程、を包含する。 【0025】 本発明の実施態様において、長さ「N」のスライディングウィンドウの長さは、アミノ酸残基の4〜任意の長さの範囲であり得る。 【0026】 本発明の実施態様において、タンパク質配列データは、任意の生物体から採用され得るが、Mycoplasma pneumoniae、Helicoba
    cter pylori、Hemophillus influenzae、M
    ycobacterium tuberculosis、Mycoplasma
    genitalium、Bacillus subtillis、Esche
    richia coliのような微生物に具体的に制限されない。 【0027】 さらなる実施態様において、同定されるような保存されたペプチドモチーフは、以下を含む: 1. AAQSIGEPGTQLT 51. NTDAEGRL 2. AGDGTTTAT 52. PSAVGYQPTLA 3. AGRHGNKG 53. QRVAIARA 4. AHIDAGKTTT 54. QRYKGLGEM 5. CPIETPEG 55. RDGLKPVHRR 6. DEPSIGLH 56. SALDVSIQA 7. DEPTSALD 57. SGGLHGVG 8. DEPTTALDVT 58. SGSGKSSL 9. DHAGIATQ 59. SGSGKSTL 10. DHPHGGGEG 60. SVFAGVGERTREGND 11. DLGGGTFD 61. TGRTHQIRVH 12. DVLDTWFSS 62. TGVSGSGKS 13. ERERGITI 63. TLSGGEAQRI 14. ERGITITSAAT 64. TNKYAEGYP 15. ESRRIDNQLRGR 65. TPRSNPATY 16. FSGGQRQR 66. VEGDSAGG 17. GEPGVGKTA 67. VRKRPGMYIG 18. GFDYLRDN 19. GHNLQEHS 20. GIDLGTTNS 21. GINLLREGLD 22. GIVGLPNVGKS 23. GKSSLLNA 24. GLTGRKIIVDTYG 25. GPPGTGKTLLA 26. GPPGVGKT 27. GSGKTTLL 28. GTRIFGPV 29. IDTPGHVDFT 30. IIAHIDHGKSTL 31. INGFGRIGR 32. IREGGRTVG 33. IVGESGSGKS 34. KFSTYATWWI 35. KMSKSKGN 36. KMSKSLGN 37. KNMITGAAQMDGAILVV 38. KPNSALRK 39. LFGGAGVGKTV 40. LGPSGCGK 41. LHAGGKFD 42. LIDEARTPLIISG 43. LLNRAPTLH 44. LPDKAIDLIDE 45. LPGKLADC 46. LSGGQQQR 47. MGHVDHGKT 48. NADFDGDQMAVH 49. NGAGKSTL 50. NLLGKRVD 【0028】 本発明に対するなお別の実施態様において、不変のペプチドの数は、生物間の関連性および比較される生物の数に従って変化し得る。 【0029】 なお別の実施態様において、不変の配列は、データベースhttp://www.ncbi.nl m.nih.govにおいて入手可能なような以下のタンパク質に属し得、ここでタンパク質の列挙は、以下を含む: I DNA指向性RNAポリメラーゼベータ鎖II エキシヌクレアーゼABCサブユニットA III エキシヌクレアーゼABCサブユニットB IV DNAジャイレースサブユニットB V ATPシンターゼベータ鎖VI S-アデノシルメチオニンシンセターゼVII グリセルアルデヒド 3-リン酸デヒドロゲナーゼVIII 伸長因子G(EF-G) IX 伸長因子TU(EF-TU) X 30S リボソームタンパク質 S12 XI 50S リボソームタンパク質 L12 XII 50S リボソームタンパク質 L14 XIII バリルtRNAシンセターゼ(VALRS) XIV 細胞分裂タンパク質FtSH ホモログXV DnaKタンパク質(HSP70) XVI GTP結合タンパク質 LepA XVII 輸送体XVIII オリゴペプチド輸送ATP結合タンパク質OPPF 【0030】 本発明に対するなお別の実施態様において、上述で説明される方法の工程(i
    ii)において与えられるようなペプチドライブラリーを比較する当該方法は、
    図1において与えられる工程を従うことによって行われる。 【0031】 本発明に対するなお別の実施態様において、上述で説明される方法の工程(i
    v)において与えられるような元来のタンパク質配列において共通のペプチドを配置する当該方法は、図2において与えられる工程を従うことによって行われる。 【0032】 別の実施態様において、上述で説明される方法の工程(v)において与えられるような重複を取り出した後に種々の長さの共通のペプチドを作製する当該方法は、図3において与えられる工程を従うことによって行われる。 【0033】 本発明に対する別の実施態様において、本発明の方法を行うためのマイクロプロセッサーベースの系は、以下i)ペプチドライブラリーの作製のためのアミノ酸配列ウインドウを決定する、
    および続いて選別する手段、 ii)ペプチドライブラリーを比較する手段、 iii)元来のタンパク質においてこれらの共通のペプチドをコンピューター処理的に配置すること、ならびに続いてそれらの起源および位置でそれらを標識すること、そしてiv)重複する共通のペプチドをコンピューター処理的に合わせて、不変のペプチド配列の長い鎖を得ること、を備える。 【0034】 本発明の別の実施態様において、本発明の方法を行うためのコンピューター系は、中央処理装置を備え、ペプチドライブラリー作製プログラム(PEPLIB
    )、ペプチドライブラリーマッチングプログラム(PEPLIMP)、ペプチドステッチングプログラム(PEPSTITCH)、ペプチド抽出プログラム(P
    EPXTRACT)を行い、ここで当該プログラムは全て、中央処理装置が使用者インターフェース装置での使用者の入力に応答して上記のプログラムのスクリーンを示すディスプレイに接続される中央処理装置によってアクセスされる記憶装置において保存される。 【0035】 本発明のなお別の実施態様において、公的に利用可能なデータベース(SWI
    SSPROT)における他のタンパク質配列に対して相同性なし/または弱い相同性を示す未知の機能のタンパク質に機能を割り当てるための方法は、以下の工程: I. 未知の機能のタンパク質配列からの重複するペプチドライブラリーをコンピューター処理的に作製する工程、 II. 上述のように得られた長さ「N」(Nはアミノ酸のスライディングウインドウの長さである)のペプチドを、単一文字アミノ酸コードに従って、アルファベット順にコンピューター処理的に選別する工程、 III. 全ての機能的に公知のタンパク質のペプチドライブラリーと、現在のライブラリーとをコンピューター処理的にマッチングして共通のペプチドを得る工程、 IV. 元来のタンパク質においてこれらの共通のペプチドをコンピューター処理的に配置し、そして続いてそれらの起源および位置でそれらを標識する、工程、
    V. 重複する共通のペプチドをコンピューター処理的に合わせて、不変のペプチド配列の長い鎖を得る、工程、 VI. ペプチド配列同一性の最大の長さが見出されるタンパク質の機能に基づいて未知のタンパク質に機能を割り当てる工程、を用いることにより行われ得る。 類似の機能のタンパク質との適合の数が多いほど、機能的な割り当ての尤度が高くなる。 【0036】 生物体の、それらの名称、系統、アクセス番号、および他の詳細のような項目は、以下に与えられる。 【0037】 ゲノム 系統 アクセス番号 全塩基配列 完成の日付Mycobacterium tuberculosis H37Rv AL123456 4411529bp 1998年6月11日Cole,STら、Nature 393(6685)、537-544(1998) Bacillus subtilis DY AL009126 4214814bp 1997年11月20日Kunst,F.ら、Nature 390(6657)、249-256(1997) Mycoplasma genitalium G37 L43967 580074bp 1995年10月30日Fraser,CMら、Science 270(5235)、397-403(1995) Mycoplasma pneumonia M129 U00089 816394bp 1996年11月15日Himmelreich,Rら、Nucleic Acids Res. 24(22)、4420-4449(1996) Escherichia coli K-12 U00096 4639221bp 1998年10月13日Blattner、FRら、Science 277(5331)、1453-1474(1997) Helicobacter pylori 26695 AE000511 1667867bp 1997年8月6日Tomb,J.-F.ら、Nature 388(6642)、539-547(1997) Haemophilus influenzae Rd L42023 1830138bp 1995年7月25日Fleischmann,RDら、Science 269(5223)、496-512(1995) 【0038】 ゲノム タンパク質 8マーのペプチドの数 共通のペプチドが見出されるタンパク質の番号Bacillus subtilis 4100 1174826 69 Escherichia coli 4289 1302149 81 Haemophilus influenzae 1709 504044 56 Helicobacter pylori 1566 474087 51 Mycoplasma genitalium 467 165523 30 Mycoplasma pneumonia 677 221216 43 Mycobacterium tuberculosis 3918 1252582 58 【0039】 本発明は以下の実施例の補助を伴って説明されるが、本発明の範囲を制限するものと解釈されるべきではない。 【0040】 実施例実施例1 1. ペプチドライブラリー作製プログラム(PEPLIB) プログラムの目的は、同時に1アミノ酸残基によりウィンドウをスライディングすることによって所与のゲノムの使用者に特定されるウィンドウ長さ「N」の非重複性のペプチドライブラリーを作製することである。 プログラムは以下のように作用する: http://www.ncbi.nlm.nih.govから得られるインターネットでダウンロードされたFASTA形式ファイルは、名称<organism#name>.pepによって保存され、実行時に特定されるような長さの独特のペプチドを作製するPERLプログラムへの入力として適用される。 入力/出力ファイル形式:ダウンロードされたファイルおよびそれらの形式: <organism#name>.pep:注釈およびタンパク質配列を保存するファイル。 <organism#name>は、Tb(Mycobacterium tuberculosis)、Bs(Bacillus
    subtilis)、Mg(Mycoplasma genitalium)、Mp(Mycoplasma pneumonia)
    、Ec(Escherichia coli)、Hp(Helicobacter pylori)、Hi(Haemophil
    us influenzae)をいう。 形式:FASTA “>gi|”<注釈> <<完全長タンパク配列… … … … …. 例えば、 >gi|2808711|emb|CAA16238.1|dnaA MTDDPGSGFTTVWNAVVSELNGDPKVDDGPSSDANLSAPLTPQQRAWLNLVQPL TIVEGFALLSVPSSFVQNEIERHLRAPITDALSRRLGHQIQLGVRIAPPATDEADDTT VPPSENPATTSPDTTTDNDEIDDSAAARGDNQHSWP....... >gi|3261513|emb|CAA16239.1|dnaN MDAATTRVGLTDLTFRLLRESFADAVSWVAKNLPARPAVPVLSGVLLTGSDNGL TISGFDYEVSAEAQVGAEIVSPGSVLVSGRLLSDITRALPNKPVDVHVEGNRVALT CGNARFSLPTMPVEDYPTLPTLPEETGLLPAE.......... 出力ファイル:<organism#name><peptide#length>.txt 形式: <実行時に特定される長さの全ての独特なペプチド> 例えば、Tb8.txtの形式: AAAAAAAA AAAAAAAG AAAAAAAQ AAAAAAAS AAAAAAAT ................. 【0041】 実施例2ペプチドライブラリーマッチングプログラム(PEPLIMP) プログラムの目的は、使用者に規定されるペプチドライブラリーを互いに比較し、そして共通の/独特なペプチドを報告することである。 プログラムPEPL
    IBの出力ファイルは、PEPLIMPプログラムについての入力として使用される。 プログラムが実行される場合、使用者は比較されるライブラリーを選択することを促される。 選択されるライブラリーに依存して、共通のペプチドを有する出力ファイルが作成される(図1)。 上記の7つの生物体の8マーペプチドライブラリーの比較は、164個の8マーペプチドを生じた。 Mycobacterium tuberculosis、Helicobacter pylori、Mycoplasma pneumonia
    、およびHaemophilus influenzaeのような4つの病原性生物体の比較は、206
    個の不変のペプチドを生じ、ならびにBacillus subtilis、Mycoplasma genitali
    um、およびEscherichia coliのような3つの非病原性生物体の比較は、601個の不変のペプチドを生じた。 比較樹形図は以下のようである: 【0042】 【表1】

    【0043】

    実施例3ペプチド抽出プログラム(PEPXTRACT) 本プログラムは、PEPLIMPプログラムの出力、すなわち、全ての不変のペプチドを入力として採用し、そして元来のデータベースからのタンパク質配列においてこれらのペプチドを配置し、そしてさらなる解析のためにタンパク質同定番号(PID)、位置、および生物体名でそれらを標識する。 このプログラムの論理回路は、図2において示されるフローチャートにおいて説明される。 【0044】

    実施例4ペプチドステッチングプログラム(PEPSTITCH) 本プログラムは、重複する不変のペプチドを知的に取り出し、そして考慮下のタンパク質に存在する不変のペプチドの全ての連続的なストレッチを報告する。


    これは、先ず生物体の同じタンパク質からの「N」マーペプチドをグループ分けし、そして次いでそれらの位置上に形跡を維持して、それらが長い単一のペプチドに合わされることによってなされる。 このプログラムの論理回路は図3において示される。 【0045】

    実施例5仮説的なタンパク質の機能の予測 配列FSGGQRQRを有する不変のペプチドが、7つの試験されたうちの6


    つの生物体(M.tuberculosisを除く)のoppF/dppFタンパク質に存在することが見出された。 このタンパク質はATP結合タンパク質として機能する。 この不変のペプチドはまた、M. tuberculosisにおけるRv1273c遺伝子によってコードされる仮説的なタンパク質上に位置されることが見出されたので、Rv1273c遺伝子によってコードされるこのタンパク質は、ATP結合タンパク質として機能しなければならないことが、これがこのクラスのタンパク質のサインを保持するので、示唆される。 【0046】

    実施例6仮説的なタンパク質の機能の予測 配列GIVGLPNVGKSを有する別の不変のペプチドが、7つの試験されたうちの6つの細菌(M.tuberculosisを除く)においてGTP結合機能を有するタンパク質において見出され、ここでは同じ不変の配列がM. tuberculosisにおけるRv1112遺伝子によってコードされる仮説的なタンパク質に存在する。 この仮説的なタンパク質は、GTP結合特性を有し得ることが、これがこのクラスのタンパク質のサインを保持するので、強く示唆される。 【0047】

    実施例7不変のペプチドモチーフに基づく薬剤標的の同定 酵素DNAジャイレースは、DNAの高次コイルを減少することが知られる。


    このタンパク質はヒトに不在であり、過去数年間標的として考慮されてきた。 しかし、薬剤分子が標的化されるべき正確な配列は未だ明らかでない。 多くの病原性および非病原性細菌のDNAジャイレースベータサブユニットにわたって不変であるが、宿主において不在であるVRKRPGMYIG、LHAGGKFD、


    SGGLHGVG、LPGKLADC、VEGDSAGG、およびQRYKGL


    GEMのような不変のペプチドは、細菌感染に対する潜在的な薬剤標的として使用され得る構造的決定因子である。 これらのペプチドのうちの3つの結晶構造が図4において示される。 【0048】

    実施例8未知の機能のタンパク質への機能の割り当て 本発明の方法の補助を伴って、以下の工程を用いることによって、公的に利用可能なデータベース(SWISSPROT)において他のタンパク質配列に対し相同性なし/弱い相同性を示す未知の機能のタンパク質に機能を割り当て得る:


    I. 未知の機能のタンパク質配列からの重複するペプチドライブラリーをコンピューター処理的に作製する工程、 II. 上述のように得られた長さ「N」(Nはアミノ酸のスライディングウインドウの長さである)のペプチドを、単一文字アミノ酸コードに従って、アルファベット順にコンピューター処理的に選別する工程、 III. 全ての機能的に公知のタンパク質のペプチドライブラリーと、現在のライブラリーとをコンピューター処理的にマッチングして共通のペプチドを得る工程、 IV. 元来のタンパク質においてこれらの共通のペプチドをコンピューター処理的に配置し、そして続いてそれらの起源および位置でそれらを標識する、工程、


    V. 重複する共通のペプチドをコンピューター処理的に合わせて、不変のペプチド配列の長い鎖を得る、工程、 VI. ペプチド配列同一性の最大の長さが見出されるタンパク質の機能に基づいて未知のタンパク質に機能を割り当てる工程。 【0049】 類似の機能のタンパク質との適合の数が多いほど、機能的な割り当ての尤度が高くなる。 【0050】 利点: 1. 本発明の主要な利点は、不変のペプチド配列モチーフサインを達するために、ある生物体の多数(数千個)のタンパク質と、他の生物体のタンパク質とのゲノム様式の同時比較の新規な方法を提供することである。 2. これは、不変のペプチドモチーフの同定の迅速な方法を提供する。 3. これは、複雑な数学的算定を全く含まないので、不変のペプチドモチーフを決定する簡便なおよび非常に正確な方法を提供する。 4. これは、広範囲の抗細菌化合物についてのスクリーニングアッセイについての基礎を提供する。 【0051】 参考文献: Altschul、S. F. 、Carol,R. J. 、&Lipman、D. J


    . (1990)。 基本的な局所的アラインメントサーチ道具。 J. Mol. Bi


    ol. 215、403-410。 Cutler N. S. 、Heitman J. 、Cardenas M. E.


    、(1999)。 酵母から哺乳動物まで保存されるシグナル伝達経路におけるT


    ORキナーゼホモログ機能。 Mol Cell Endocrinol 155


    (1-2)、135-142。 Ghannoum、M. A. およびRice、L. B. (1999)。 抗真菌剤:作用の態様、耐性の機構、および細菌耐性とこれらの機構との相関。 Clin


    Microbiol Rev 12(4)、501-517。 McCafferty D. G. 、Cudic、P. 、Yu、M. K. 、Beh


    enna、D. C. 、Kruger、R.、(1999)。 ペプチド抗生物質機構における相乗作用および二様性。 Curr Opin Chem Biol


    3(6)、672-680。 Porse、B. T. 、&Garrette、R. A. (1999)。 リボソーム機構、抗生物質、およびGTP加分解。 Cell 97、423-426。 Presenell、S. R. 、Cohen、B. I. 、& Cohen、F.


    E. 、(1992)。 タンパク質二次構造予測に対するセグメントベースのアプローチ。 Biochemistry 31、983-993。 Rooman、M. J. 、& Wodak、S. J. (1988)。 タンパク質構造データベースサイズによって制限される予測的な配列モチーフの同定。 Na


    ture 335、45-49。 Wilbur、W. J. 、&Lipman、D. J. (1983)。 核酸およびタンパク質データバンクの迅速な類似性サーチ。 Proc Natl Acad Sci USA 80、726-730。 Wimberly、B. T. 、Guymon、R. 、McCutcheon、W


    hite、S. W. 、& Ramakrishnan、V. 、(1999)。 リボソーム活性部位の詳細な見解:L11-RNA複合体の構造。 Cell 97


    、491-502。 【図面の簡単な説明】 【図1】 図1は、ペプチドライブラリーマッチングプログラムの論理回路を示す。 【図2】 図2は、ペプチド抽出プログラムの論理回路を示す。 【図3】 図3は、ペプチドステッチングプログラムの論理回路を示す。 【図4】 図4は、DNAジャイレースBタンパク質からの3つの不変のペプチド(VR


    KRPGMYIG、LHAGGKFD、およびSGGLHGVG)の結晶構造を示す。

    ───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,DM,EE,ES,FI ,GB,GD,GE,GH,GM,HR,HU,ID, IL,IN,IS,JP,KE,KG,KP,KR,K Z,LC,LK,LR,LS,LT,LU,LV,MA ,MD,MG,MK,MN,MW,MX,NO,NZ, PL,PT,RO,RU,SD,SE,SG,SI,S K,SL,TJ,TM,TR,TT,TZ,UA,UG ,US,UZ,VN,YU,ZA,ZW Fターム(参考) 2G045 CB21 DA36 JA01 4B024 AA11 AA20 CA01 HA11 4B063 QA13 QA18 QQ06 QQ42 QX04

    QQ群二维码
    意见反馈