And use thereof for producing a peptide library专利检索- .化合物库的虚拟或数学概念专利检索查询-专利查询网

And use thereof for producing a peptide library
申请号	JP2009553040	申请日	2008-03-04	公开(公告)号	JP5371786B2	公开(公告)日	2013-12-18
申请人	サノフイ;			发明人	エーファ・ユンク; マンフレート・ヘントリッヒ;
摘要	Screening libraries of peptides in different assays offers an opportunity to simultaneously interrogate intracellular signaling pathways, create reagents to further the understanding of the pathway, and to create novel forms of therapies. Many, if not all, biologically active peptides (e.g. peptide hormones) have profound effects both in health and disease, either by growth stimulating roles, growth inhibitory roles, or the regulation of critical metabolic pathways. The present invention is directed to novel bioactive peptides, an in silico method to identify these peptides and a peptide library containing these peptides.
权利要求	コンピュータベースのシステムにおいて、バイナリサポートベクターマシン（ＳＶＭ）ベースのアルゴリズムを使用して生物活性ペプチドを同定するための方法であり、該方法は以下の工程：ａ）生物活性ペプチドと非生物活性ペプチドを識別することを学習するためにＳＶＭアルゴリズムをトレーニングすること、該トレーニングは、以下の工程を包含する：ａ ₁ ）標識された既知の生物活性ペプチドおよび標識された既知の非生物活性ペプチドのセットについて、４９の次元でベクターを生成すること、各次元は、分子ディスクリプタ値の計算によりもたらされ、該標識によりペプチドがそれぞれ生物活性または非生物活性のいずれであるのかが示される；ａ ₂ ）工程ａ ₁ ）で生成されたベクターのデータをＳＶＭベースのアルゴリズムに転換すること、該アルゴリズムは、生物活性ペプチドおよび非生物活性ペプチドのそれぞれに対応するベクターを分離する最適な超平面を計算する；ｂ）公表されているヒトタンパク質データベースからタンパク質配列を提供すること；ｃ）計算法を使用して、工程ｂ）で提供されたタンパク質配列内の二次構造および切断部位を予測すること；７つの分子ディスクリプタのセットをペプチドフラグメントの生成をもたらす該予測工程に基づいて計算する；ｄ）工程ｃ）で生成されたペプチドフラグメントの物理化学的特性に対応する４２の分子ディスクリプタのセットを計算すること；ｅ）工程ｃ）からの計算値を０〜１のスケール値に変換し、各ペプチドフラグメントの４９−次元−ベクターの次元１〜７を生成し、そして工程ｄ）からの計算値を０〜１のスケール値に変換し、各ペプチドフラグメントの該ベクターの次元８〜４９を生成すること；ｆ）工程ｅ）で生成されたベクターを工程ａ）からのトレーニングされたＳＶＭアルゴリズムに提示し、工程ａ ₂ ）で計算された超平面から各ベクターへの距離を測定すること；およびｇ）工程ｆ）で測定された距離に従って、生物活性ペプチドまたは非生物活性ペプチドに各ペプチドフラグメントを分類することを包含する、方法。工程ｅ）で生成された次元１〜７が以下：次元１：Ｎ末端ＰｒｏＰスコア；次元２：Ｎ末端Ｈｍｃｕｔスコア；次元３：Ｎ末端フラグメント；次元４：Ｃ末端ＰｒｏＰスコア；次元５：Ｃ末端Ｈｍｃｕｔスコア；次元６：Ｃ末端Ｈａｍｉｄスコア；次元７：Ｃ末端フラグメントであり；そして工程ｅ）で生成された次元８〜４９が以下：次元８：１ポリペプチドあたりの酸性アミノ酸（Ｅ、Ｎ、Ｑ）の割合；次元９：１ポリペプチドあたりの正電荷のアミノ酸（Ｒ、Ｈ）の割合；次元１０：１ポリペプチドあたりの芳香族アミノ酸（Ｆ、Ｙ、Ｗ）の割合；次元１１：１ポリペプチドあたりの脂肪族アミノ酸（Ｇ、Ｖ、Ａ、Ｉ）の割合；次元１２：１ポリペプチドあたりのプロリンの割合；次元１３：１ポリペプチドあたりの反応性アミノ酸（Ｓ、Ｔ）の割合；次元１４：１ポリペプチドあたりのアラニンの割合；次元１５：１ポリペプチドあたりのシステインの割合；次元１６：１ポリペプチドあたりのグルタミン酸の割合；次元１７：１ポリペプチドあたりのフェニルアラニンの割合；次元１８：１ポリペプチドあたりのグリシンの割合；次元１９：１ポリペプチドあたりのヒスチジンの割合；次元２０：１ポリペプチドあたりのイソロイシンの割合；次元２１：１ポリペプチドあたりのアスパラギンの割合；次元２２：１ポリペプチドあたりのグルタミンの割合；次元２３：１ポリペプチドあたりのアルギニンの割合；次元２４：１ポリペプチドあたりのセリンの割合；次元２５：１ポリペプチドあたりのトレオニンの割合；次元２６：１ポリペプチドあたりの非標準アミノ酸の割合；次元２７：１ポリペプチドあたりのバリンの割合；次元２８：１ポリペプチドあたりのトリプトファンの割合；次元２９：１ポリペプチドあたりのチロシンの割合；次元３０：システイン含有量；次元３１：１ポリペプチドあたりのコイル状の二次構造の割合；次元３２：１ポリペプチドあたりのらせん状の二次構造の割合；次元３３：１ポリペプチドあたりのランダム二次構造の割合；次元３４：Ｎ末端切断部位周囲の構造についてのスコア；次元３５：Ｃ末端切断部位周囲の構造についてのスコア；次元３６：１ポリペプチドあたりのらせん状ブロックの数；次元３７：ポリペプチドの等電点；次元３８：ポリペプチドの平均分子量；次元３９：ポリペプチド内の各アミノ酸のファンデルワールス力の合計；次元４０：ポリペプチド内の各アミノ酸の疎水性値の合計；次元４１〜４８：１ポリペプチドあたりの疎水性、立体的特性、および電子物性の主成分スコアベクターに基づいて計算された平均値；次元４９：ポリペプチドの長さである、請求項１に記載の方法。前記工程ｂ）からのタンパク質配列が、ヒトセクレトームにおいて見出される天然のタンパク質配列のみである、請求項１または２に記載の方法。前記生物活性ペプチドが、前駆体ホルモンから誘導される生物活性ペプチドホルモンである、請求項１〜３のいずれか１項に記載の方法。ポリペプチド製剤、薬物療法のための標的、関連標的を見出すためのリガンドまたは疾患を経過観察するための生体指標を同定するための、請求項１〜４のいずれか１項に記載の方法。バイナリサポートベクターマシン（ＳＶＭ）ベースの方法を使用して生物活性ペプチドを同定するように設定された計算デバイスであり、該計算デバイスは前記バイナリサポートベクターマシン（ＳＶＭ）ベースの方法を実行し、該方法は以下の工程：ａ）生物活性ペプチドと非生物活性ペプチドを識別することを学習するためにＳＶＭアルゴリズムをトレーニングすること、該トレーニングは、以下の工程を包含する：ａ ₁ ）標識された既知の生物活性ペプチドおよび標識された既知の非生物活性ペプチドのセットについて、４９の次元でベクターを生成すること、各次元は、分子ディスクリプタ値の計算によりもたらされ、該標識によりペプチドがそれぞれ生物活性または非生物活性のどちらかであることが示される；ａ ₂ ）工程ａ ₁ ）で生成されたベクターのデータをＳＶＭベースのアルゴリズムに転換すること、該アルゴリズムは、生物活性ペプチドおよび非生物活性ペプチドのそれぞれに対応するベクターを分離する最適な超平面を計算する；ｂ）公表されているヒトタンパク質データベースからタンパク質配列を提供すること；ｃ）計算法を使用して、工程ｂ）で提供されたタンパク質配列内の二次構造および切断部位を予測すること；７つの分子ディスクリプタのセットをペプチドフラグメントの生成をもたらす該予測工程に基づいて計算する；ｄ）工程ｃ）で生成されたペプチドフラグメントの物理化学的特性に対応する４２の分子ディスクリプタのセットを計算すること；ｅ）工程ｃ）からの計算値を０〜１のスケール値に変換し、各ペプチドフラグメントの４９−次元−ベクターの次元１〜７を生成し、そして工程ｄ）からの計算値を０〜１のスケール値に変換し、各ペプチドフラグメントの該ベクターの次元８〜４９を生成すること；ｆ）工程ｅ）で生成されたベクターを工程ａ）からのトレーニングされたＳＶＭアルゴリズムに提示し、工程ａ ₂ ）で計算された超平面から各ベクターへの距離を測定すること；およびｇ）工程ｆ）で測定された距離に従って、生物活性ペプチドまたは非生物活性ペプチドに各ペプチドフラグメントを分類することを包含する、上記計算デバイス。
说明书全文	本発明は、計算生化学分野およびコンピュータにより補助される生物活性ペプチドの設計に関する。本発明は、生物学的配列分析、バイオインフォマティクスデータマイニング、情報表現および管理学習を使用する分類アルゴリズムに使用される方法を組み合わせる。さらに、ペプチドライブラリの設計および生物医学研究のための生物活性ペプチドの使用に関する。今日の創薬の主要目的は、臨床での実用的である生物活性分子を同定することである。全部ではないが多くの生物活性ペプチド（例えば、ペプチドホルモン）は、増殖刺激的役割、増殖抑制的役割、または非常に重要な代謝経路の制御のいずれかにより、健康および疾患の両方に大きな影響を与える。ペプチドホルモンは、異なる細胞型および腺、ニューロン、腸、脳などのような器官中で前駆体として製造される。ペプチドホルモンは、始めに大きな前駆体、すなわちプロホルモンとして合成され、そしてＥＲおよびゴルジ層板を介する輸送の間に、多くの翻訳後修飾を受け得る。これらは処理され、そして活性成分（一次メッセンジャー）として作用するようにそれらの終点に輸送され、細胞表面の受容体に結合することにより、細胞応答を誘発する。ペプチドホルモンは、生産の調節；成長；水および塩代謝；温度調節；心臓血管、胃腸、および呼吸調節；挙動；記憶；および感情状態を含む多くの生理的過程におけるキーメッセンジャーである。ペプチドホルモンは、糖尿病（インスリン）、血圧調節（アンギオテンシン）、貧血症（エリスロポエチン−α）、多発性硬化症（インターフェロン−β）、肥満（レプチン）などのような生物医学研究の様々な部分に関連する生理的過程において重要な役割を果たす。従って、新規な生物活性ペプチドは、ポリペプチド製剤、薬物療法のための標的、関連標的を見出すためのリガンド（例えば、ＧＰＣＲ脱オーファン化）または疾患を経過観察するための生体指標として使用される可能性を有する。ペプチドライブラリは、生物活性ペプチド（抗菌ペプチド、受容体アゴニストおよびアンタゴニスト、細胞表面受容体のリガンド、タンパク質キナーゼ阻害剤および基質、Ｔ細胞エピトープ、ＭＨＣ分子に結合するペプチドならびに受容体結合部位のペプチドミモトープを含む）を同定するのに首尾よく使用されている。ペプチドライブラリは、遺伝子および合成ベースのライブラリ中のそれらの起点に従って分類され得る（非特許文献１）。遺伝子ベースのライブラリにおいて、ポリペプチド内の組み合わせ位置は、標的ポリペプチドの配列をエンコードするＤＮＡレベルで導入され、多様化される。遺伝子ベースのライブラリと対照的に、合成ライブラリは、化学合成のレベルでそれらの多様化を達成する。多くのペプチドライブラリは、１骨格に基づくか、または異なるポリペプチドの一次構造を生成するためにランダム組み合わせ方法を使用する。両方の方法の不利点は、２０の天然のアミノ酸の組み合わせが、最も変化しやすく、そして非常に多数の異なる構造からなるポリペプチドの構成を可能にすることである。どのくらいの数の異なる構造が得られ得るか一例を挙げると、４つのアミノ酸のみを含むペプチドについて１６０.０００の異なる一次構造の可能性が考えられる。ペプチドライブラリ中の可能性ある構造の数を著しく減少させ、大量のデータの処理を可能にし、そしてインビボで活性を有するペプチドとインビボで活性を有さないペプチドを区別する正確で、かつハイスループットな方法が提供される必要がある。 C. Falciani, L. Lozzi, A. Pini, L. Bracci;" Bioactive Peptides from Libraries ";Chemistry & Biology,Volume 12,Issue 4, Pages 417-426, 2005 本発明の目的は、先行技術の問題を解決することである。本発明は、生物情報ストラテジーを使用する新規な生物活性ペプチドホルモンライブラリを構築するための方法に関する。サポートベクターマシン（ＳＶＭ）アルゴリズムを使用して、生物活性ペプチドを同定する。この方法は、保存タンパク質特性およびペプチドホルモン前駆体中に存在する短いモチーフを利用することにより、ヒトプロテオームをコンピュータ内で検索して、可能性ある生物活性ペプチドホルモンを見出すことを可能にする。それらの特徴はペプチドホルモンに共通しており、そしてそれらの成熟に関与する一方で、意外にも、タンパク質配列レベル単独に対するデータベース検索（例えば、ＢＬＡＳＴ、ＦＡＳＴＡ）が可能となるペプチドホルモン前駆体間の配列類似性は極わずかしかない。しかし、共起タンパク質特性およびペプチドホルモン前駆体における翻訳後修飾のためのモチーフの組み合わせ（例えば、前駆体の短いタンパク質配列の長さ、シグナルペプチド、ジスルフィド結合、アミド化部位、硫酸化部位、グリコシル化部位など）を使用して、高特異性を有する新規なペプチドホルモンを見出すことができる。発明の要旨本発明の１つの要旨は、コンピュータベースのシステムにおいて、バイナリーサポートベクターマシン（ＳＶＭ）ベースのアルゴリズムを使用して、生物活性ペプチドを同定するための方法に関し、ここで：ａ）生物活性ペプチドと非生物活性ペプチドを識別することを学習するためにＳＶＭアルゴリズムをトレーニングし、該トレーニングは、以下の工程を包含する：ａ ₁ ）標識された既知の生物活性ペプチドおよび標識された既知の非生物活性ペプチドのセットについて４９の次元（ｄｉｍｅｎｓｉｏｎ）でベクターを生成すること、各次元は、分子ディスクリプタ値の計算によりもたらされ、該標識によりペプチドがそれぞれ生物活性または非生物活性のどちらかであることが示される；ａ ₂ ）工程ａ ₁ ）で生成されたベクターのデータをＳＶＭベースのアルゴリズムに転換すること、該アルゴリズムは、生物活性ペプチドおよび非生物活性ペプチドのそれぞれに対応するベクターを分離する最適な超平面を計算する；ｂ）公表されているヒトタンパク質データベースからタンパク質配列を提供する；ｃ）計算法を使用して、工程ｂ）で提供されたタンパク質配列内の二次構造および切断部位を予測する；７つの分子ディスクリプタのセットをペプチドフラグメントの生成をもたらす該予測工程に基づいて計算する；ｄ）工程ｃ）で生成されたペプチドフラグメントの物理化学的特性に対応する４２の分子ディスクリプタのセットを計算する；ｅ）工程ｃ）からの計算値を０〜１のスケール値（ｓｃａｌｅｄｖａｌｕｅ）に変換し、各ペプチドフラグメントの４９−次元−ベクターの次元１〜７を生成し、そして工程ｄ）からの計算値を０〜１のスケール値に変換し、各ペプチドフラグメントの該ベクターの次元８〜４９を生成する；ｆ）工程ｅ）で生成されたベクターを工程ａ）からのトレーニングされたＳＶＭアルゴリズムに提示し、工程ａ ₂ ）で計算された超平面から各ベクターへの距離を測定する；そしてｇ）工程ｆ）で測定された距離に従って、生物活性ペプチドまたは非生物活性ペプチドに各ペプチドフラグメントを分類する。一般に、工程ｅ）で生成された次元１〜７が以下：次元１：Ｎ末端ＰｒｏＰスコア；次元２：Ｎ末端Ｈｍｃｕｔスコア；次元３：Ｎ末端フラグメント；次元４：Ｃ末端ＰｒｏＰスコア；次元５：Ｃ末端Ｈｍｃｕｔスコア；次元６：Ｃ末端Ｈａｍｉｄスコア；次元７：Ｃ末端フラグメントであり；そして工程ｅ）で生成された次元８〜４９が以下：次元８：１ポリペプチドあたりの酸性アミノ酸（Ｅ、Ｎ、Ｑ）の割合；次元９：１ポリペプチドあたりの正電荷のアミノ酸（Ｒ、Ｈ）の割合；次元１０：１ポリペプチドあたりの芳香族アミノ酸（Ｆ、Ｙ、Ｗ）の割合；次元１１：１ポリペプチドあたりの脂肪族アミノ酸（Ｇ、Ｖ、Ａ、Ｉ）の割合；次元１２：１ポリペプチドあたりのプロリンの割合；次元１３：１ポリペプチドあたりの反応性アミノ酸（Ｓ、Ｔ）の割合；次元１４：１ポリペプチドあたりのアラニンの割合；次元１５：１ポリペプチドあたりのシステインの割合；次元１６：１ポリペプチドあたりのグルタミン酸の割合；次元１７：１ポリペプチドあたりのフェニルアラニンの割合；次元１８：１ポリペプチドあたりのグリシンの割合；次元１９：１ポリペプチドあたりのヒスチジンの割合；次元２０：１ポリペプチドあたりのイソロイシンの割合；次元２１：１ポリペプチドあたりのアスパラギンの割合；次元２２：１ポリペプチドあたりのグルタミンの割合；次元２３：１ポリペプチドあたりのアルギニンの割合；次元２４：１ポリペプチドあたりのセリンの割合；次元２５：１ポリペプチドあたりのトレオニンの割合；次元２６：１ポリペプチドあたりの非標準アミノ酸の割合；次元２７：１ポリペプチドあたりのバリンの割合；次元２８：１ポリペプチドあたりのトリプトファンの割合；次元２９：１ポリペプチドあたりのチロシンの割合；次元３０：システイン含有量；次元３１：１ポリペプチドあたりのコイル状の二次構造の割合；次元３２：１ポリペプチドあたりのらせん状の二次構造の割合；次元３３：１ポリペプチドあたりのランダム二次構造の割合；次元３４：Ｎ末端切断部位周囲の構造についてのスコア；次元３５：Ｃ末端切断部位周囲の構造についてのスコア；次元３６：１ポリペプチドあたりのらせん状ブロックの数；次元３７：ポリペプチドの等電点；次元３８：ポリペプチドの平均分子量；次元３９：ポリペプチド内の各アミノ酸のファンデルワールス力の合計；次元４０：ポリペプチド内の各アミノ酸の疎水性値の合計；次元４１〜４８：１ポリペプチドあたりの疎水性、立体的特性、および電子物性の主成分スコアベクターに基づいて計算された平均値；次元４９：ポリペプチドの長さである。本発明の方法の好ましい実施形態において、工程ｂ）からのタンパク質配列は、ヒトセクレトーム（ｓｅｃｒｅｔｏｍｅ）において見出される天然のタンパク質配列のみである。別の好ましい実施形態において、生物活性ペプチドは、前駆体ホルモンから誘導される生物活性ペプチドホルモンである。本発明の別の要旨は、本発明の方法を使用して、ヒトセクレトームから選択される生物活性ペプチドに関する。好ましい実施形態において、生物活性ペプチドは生物活性ペプチドホルモンである。より好ましい実施形態において、生物活性ペプチドホルモンは前駆体タンパク質から誘導される。別の好ましい実施形態において、生物活性ペプチドは、以下の配列番号：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１０１、１０２、１０３、１０４、１０５、１０６、１０７、１０８、１０９、１１０、１１１、１１２、１１３、１１４、１１５、１１６、１１７、１１８、１１９、１２０、１２１、１２２、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８．１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１５３、１５４、１５５、１５６、１５７、１５８、１５９、１６０、１６１、１６２、１６３、１６４、１６５、１６６、１６７、１６８、１６９、１７０、１７１、１７２、１７３、１７４、１７５、１７６、１７７、１７８、１７９、１８０、１８１、１８２、１８３、１８４、１８５のアミノ酸配列からなる群から選択される配列を有する。本発明は、さらに本発明の方法により同定される生物活性ペプチドを含むペプチドライブラリに関する。好ましい実施形態において、ペプチドライブラリは、上記の配列番号１〜１８５のアミノ酸配列からなる群から選択される配列を有する生物活性ペプチドを含む。より好ましい実施形態において、ペプチドライブラリは、生物活性ペプチドホルモンを含む。別のより好ましい実施形態において、ペプチドライブラリは、前駆体タンパク質から誘導される生物活性ペプチドホルモンを含む。本発明の別の要旨は、バイナリーサポートベクターマシン（ＳＶＭ）ベースの方法を使用して、生物活性ペプチドを同定するように設定された計算デバイスに関し、ここで：ａ）生物活性ペプチドと非生物活性ペプチドを識別することを学習するためにＳＶＭアルゴリズムをトレーニングし、該トレーニングは、以下の工程を包含する：ａ ₁ ）標識された既知の生物活性ペプチドおよび標識された既知の非生物活性ペプチドのセットについて４９の次元でベクターを生成すること、各次元は、分子ディスクリプタ値の計算によりもたらされ、該標識によりペプチドがそれぞれ生物活性または非生物活性のどちらかであることが示される；ａ ₂ ）工程ａ ₁ ）で生成されたベクターのデータをＳＶＭベースのアルゴリズムに転換すること、該アルゴリズムは、生物活性ペプチドおよび非生物活性ペプチドのそれぞれに対応するベクターを分離する最適な超平面を計算する；ｂ）公表されているヒトタンパク質データベースからタンパク質配列を提供する；ｃ）計算法を使用して、工程ｂ）で提供されたタンパク質配列内の二次構造および切断部位を予測する；７つの分子ディスクリプタのセットをペプチドフラグメントの生成をもたらす該予測工程に基づいて計算する；ｄ）工程ｃ）で生成されたペプチドフラグメントの物理化学的特性に対応する４２の分子ディスクリプタのセットを計算する；ｅ）工程ｃ）からの計算値を０〜１のスケール値に変換し、各ペプチドフラグメントの４９−次元−ベクターの次元１〜７を生成し、そして工程ｄ）からの計算値を０〜１のスケール値に変換し、各ペプチドフラグメントの該ベクターの次元８〜４９を生成する；ｆ）工程ｅ）で生成されたベクターを工程ａ）からのトレーニングされたＳＶＭアルゴリズムに提示し、工程ａ ₂ ）で計算された超平面から各ベクターへの距離を測定する；そしてｇ）工程ｆ）で測定された距離に従って、生物活性ペプチドまたは非生物活性ペプチドに各ペプチドフラグメントを分類する。本発明は、さらにポリペプチド製剤、薬物療法のための標的、関連標的を見出すためのリガンドまたは疾患を経過観察するための生体指標を同定するための本発明の方法の使用に関する。本発明は、さらに細胞内シグナル伝達経路を問い合わせるため、経路の理解を進める試薬を製造するため、治療の新規な形態を作り上げるため、そして医薬活性化合物、薬物療法のための標的、関連標的を見出すためのリガンドまたは疾患を経過観察するための生体指標を同定するためのスクリーニング法における本発明のペプチドライブラリの使用に関する。本発明はまた、生物活性剤としての配列番号１〜１８５のアミノ酸配列からなる群から選択される配列を有する生物活性ペプチドを含む医薬組成物に関する。発明の詳細な説明本発明は、新規な生物活性ポリペプチドおよびこのような生物活性ポリペプチドを同定するためのコンピュータ内の方法に関する。本発明において、ヒト体内における任意の細胞組織と相互作用するか、または影響を与える場合、ポリペプチドは生物活性と考えられる。生物活性ペプチドは、ポリペプチド製剤、薬物療法のための標的、関連標的を見出すためのリガンド（例えば、ＧＰＣＲ脱オーファン化）または疾患を経過観察するための生体指標として使用される可能性がある。生物活性ペプチドとしては、とりわけ、生物活性ペプチドホルモンが挙げられる。ペプチドホルモンは、それらの高特異性、さらにそれらの極めて低濃度での有効性により特徴づけられる。ペプチドホルモンは、より大きな前駆体、すなわちプロホルモンとして始めに合成される。前駆体は、通常、より活性のある、または成熟した別の物質を形成する物質である。タンパク質前駆体は、翻訳後修飾により活性形態に変換され得る不活性タンパク質（またはペプチド）である。いくつかの切断部位が前駆体の修飾に関与し、成熟タンパク質を生成する：シグナル配列切断部位、プロテアーゼ切断部位、アミド化部位など。タンパク質の前駆体の名前には、しばしば、プロまたはプレが接頭辞として付けられる。後に生じるタンパク質が潜在的に有害であるが、早急におよび／または大量に利用可能となる必要がある場合、前駆体がしばしば有機体に使用されることが多い。用語「ポリペプチド」、「ペプチド」および「タンパク質」は本明細書中で相互に用いられ、共有結合により連結したアミノ酸残基からなるポリマーをいう。これらの用語は、完全長タンパク質の一部またはフラグメント、例えば、ペプチド、オリゴペプチドおよび少なくとも２つのアミノ酸からなるより短いペプチド配列、より特に、４〜４５のアミノ酸からなるペプチド配列を含む。さらに、これらの用語は、修飾アミノ酸のポリマーを含み、この修飾アミノ酸は、例えば、塩基性ペプチド骨格を有効に改変する化学修飾（アミド化、グリコシル化、リン酸化反応、アセチル化および／または硫酸化反応が挙げられるが、これらに限定されない）による翻訳後修飾されているアミノ酸を含む。従って、ポリペプチドは、天然のタンパク質から誘導され得、そして特に、ＣＮＢｒのような試薬、またはトリプシンもしくはキモトリプシンなどのようなプロテアーゼを使用して、化学的または酵素的切断により完全長タンパク質から誘導され得る。あるいは、このようなポリペプチドは、周知のペプチド合成法を使用して化学合成により誘導され得る。アミノ酸は、アミンおよびカルボン酸官能基の両方を含む任意の分子である。アミノ酸残基は、ペプチド結合（タンパク質鎖中のアミノ酸モノマーを結合している化学結合）の形成において、一個の水分子を失った（窒素側からＨ＋およびカルボン酸側からＯＨ−）時点のアミノ酸の残りである。各タンパク質は、その一次構造として公知であるその固有のアミノ酸配列を有する。一次構造は非常に単純であり、そしてタンパク質またはポリペプチド鎖中のアミノ酸の数および配列に関連する。共有ペプチド結合は、タンパク質構造のこのレベルに関与する唯一の種類の結合である。タンパク質中のアミノ酸配列は、ＤＮＡ中の遺伝情報により決定され、ＲＮＡに転写され、次いでタンパク質に翻訳される。従って、タンパク質構造は遺伝的に決定される。タンパク質構造の次のレベルは、一般に、構造規則性の量またはポリペプチド鎖がとる形状を参照する。天然のポリペプチド鎖は、規則正しく、かつ規定の形状に自然に折り畳まれる。二次構造の主な２つの種類、すなわちα−ヘリックス、およびβ−プリーツシートは、タンパク質中で見出される。ポリペプチド鎖の三次構造は、鎖のα−ヘリックスまたはβ−プリーツシートによってとられる立体配座または形状の次のレベルである。多くのタンパク質は、配置が大まかに球形に分類される形状に折り畳まれる傾向にあり、さらにいくつかの特に構造的なタンパク質は長繊維を形成する。これらは三次構造全体の主要な形態である。ドメインはしばしば使用される用語であり、これはポリペプチド鎖における球形構造の小型ユニットをいう。各タンパク質の固有の形状が、体内におけるその機能を決定する。アミノ酸配列変異体もまた「ポリペプチド」の定義の範囲内に含まれる。これらは、前記ポリペプチドの少なくとも１つの本質的な特性、例えばその生物活性が変更されていない天然のアミノ酸配列において、１つまたはそれ以上の好ましい保存、アミノ酸置換、欠失、または挿入を含み得る。このようなポリペプチドは、化学ポリペプチド合成によって合成され得る。保存的アミノ酸置換は、当該分野で周知である。例えば、野生型のタンパク質の１つまたはそれ以上のアミノ酸残基が、同様の電荷、大きさまたは極性のアミノ酸残基で保存的に置換され得、得られたポリペプチドは本明細書中に記載されるような機能的能力を保持している。このような置換基を作製するための規定は周知である。さらに具体的には、保存的アミノ酸置換は、一般に、それらの側鎖に関連するアミノ酸のファミリー内で行われるものである。遺伝的にエンコードされたアミノ酸は、一般に４つの群に分類される：（１）酸性＝アスパラギン酸塩、グルタミン酸塩；（２）塩基性＝リシン、アルギニン、およびヒスチジン；（３）非極性＝アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、およびトリプトファン；および（４）非荷電極性＝グリシン、アスパラギン、グルタミン、システイン、セリン、トレオニン、およびチロシン。フェニルアラニン、チロシンおよびトリプトファンはまた、芳香族アミノ酸に一緒に分類される。任意の特定の基内での１つまたはそれ以上の交換、例えば、イソロイシンまたはバリンについてロイシンの置換は代替的であり、グルタミン酸塩についてアスパラギン酸塩もしくはセリンについてトレオニンの置換、または構造的に関連するアミノ酸残基での任意の他のアミノ酸残基の置換は、一般に、得られたポリペプチドの機能にあまり影響しない。生物活性が機能ドメインに対応するそのアミノ酸配列の結果として予測可能であるペプチドは、用語「ポリペプチド」の定義の範囲内に含まれる。生物活性がそのアミノ酸配列の分析により予測され得ないペプチドもまた、用語「ポリペプチド」に含まれる。本発明において、サポートベクターマシンアルゴリズム（ＳＶＭ）を使用して、インビボで活性を有するポリペプチドとインビボで活性を有さないポリペプチドを区別する。サポートベクターマシン（ＳＶＭ）：サポートベクターマシン（ＳＶＭ）は、トレーニング段階の間、決定面または「超平面」を決定する万能な学習マシンである。ベクターのトレーニング集団から選択されるサポートベクターのセットにより、および対応する乗数のセットにより決定超平面を決定する。決定超平面はまた、核関数により特徴づけられる。ＳＶＭの数学的基礎は、ＪｏｈｎＳｈａｗｅＴａｙｌｏｒ＆ＮｅｌｌｏＣｒｉｓｔｉａｎｉｎｉによる書籍−ＣａｍｂｒｉｄｇｅＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，２０００，表題「ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅｓａｎｄｏｔｈｅｒｋｅｒｎｅｌ−ｂａｓｅｄｌｅａｒｎｉｎｇｍｅｔｈｏｄｓ」およびＣｈｉｈ−ＣｈｕｎｇＣｈａｎｇａｎｄＣｈｉｈ−ＪｅｎＬｉｎによる論文、表題「ＬＩＢＳＶＭ−ＡＬｉｂｒａｒｙｆｏｒＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅｓ」，２００１に説明されている。トレーニング段階の後、トレーニグ段階の間に予め決定された決定超平面に基づき、試験ベクターを分類するために使用される試験段階において、ＳＶＭを作動する（Ｎｏｂｌｅ，２００６）。サポートベクターマシンは、多くのかつ多様な分野に応用される。例えば、Ｈ．ＫｉｍａｎｄＨ．Ｐａｒｋによる論文、表題「Ｐｒｅｄｉｃｔｉｏｎｏｆｐｒｏｔｅｉｎｒｅｌａｔｉｖｅｓｏｌｖｅｎｔａｃｃｅｓｓｉｂｉｌｉｔｙｗｉｔｈｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｓａｎｄｌｏｎｇ−ｒａｎｇｅｉｎｔｅｒａｃｔｉｏｎ３ｄｌｏｃａｌｄｅｓｃｒｉｐｔｏｒ」において、ＳＶＭは、高分子のドッキングを研究するために、高分解能３Ｄ構造を予測する問題に適用されている。本発明において、サポートベクターマシンアルゴリズム（ＳＶＭ）を使用して、インビボで活性を有するポリペプチドとインビボで活性を有さないポリペプチドを区別する。実際的な面から、本発明において、パーソナルコンピュータのような計算デバイスにより、ＳＶＭを実行する。計算デバイスは、本発明に従う方法を実行するための取扱説明書を備える、実施例の節（１.１.）に記載されるような一連の異なるソフトウェアを実行する１つまたはそれ以上のプロセッサを含む。ＳＶＭおよびモデル生成のトレーニング：ＳＶＭモデルをトレーニングするために、実施例の節（１.１.）に記載され、そして図１に図式的に示されるプログラムルーチンを使用して、４９の次元でベクターを生成した。ＳＶＭトレーニングセットについて、既知の生物活性ペプチドの情報を、Ｓｗｉｓｓｐｒｏｔのような任意の公表されているヒトタンパク質データベースから抽出し得る。４〜５５のアミノ酸の長さを有する好ましい生物活性ペプチドを、Ｓｗｉｓｓｐｒｏｔの注釈に従ってそれらの前駆体から抽出し、そしてＳＶＭアルゴリズムのトレーニングに使用した正の例として標識した。割り当てられた機能を有さない同様に既知のペプチドホルモン前駆体から４〜５５のアミノ酸の長さで生成された全ての他のフラグメントを、ＳＶＭトレーニングについての負のトレーニングセットとして使用した。ＳＶＭはバイナリーシステムであるので、生物活性ペプチドを＋１として標識し、そして非生物活性ペプチドを−１として標識した。同様に、５６〜３００のアミノ酸の長さを有する生物活性ペプチドおよび非生物活性ペプチドを使用して、より長いポリペプチドを予測するための二次モデルをトレーニングした。負の例を過剰提示（ｏｖｅｒ−ｒｅｐｒｅｓｅｎｔ）させないために、それぞれ短い（４〜５５アミノ酸）および長い（５６〜３００アミノ酸）についての最終的なＳＶＭトレーニングセットを、全ての負のペプチドから同数の負をランダムに選択することにより、正および負のトレーニングデータを同じくらいの数に調節した。生物活性ペプチドおよび非生物活性ペプチドに隠されている情報を変換するために、４９のディスクリプタのセットを定義し、そしてＳＶＭのトレーニングに使用した。ＳＶＭモデルの性能は、ペプチドを表現するために使用される選ばれたディスクリプタの性質に強く依存する。本発明において、初めの７つのディスクリプタは、人体によって生成されるポリペプチドの尤度を示す。ペプチドホルモン前駆体配列に対するプロテアーゼ予測部位ツールのセットを利用することにより、これらの７つの次元を計算した（図１）。各プログラム出力の得られたスコアをディスクリプタとして直接使用した。残りの４２の次元は、各々生成されたフラグメントの重要な物理化学特性を示す（すなわち、生物活性ペプチドまたは非生物活性ペプチド）。本発明に使用される４９のディスクリプタを、実施例の節の項目３に記載する。４９のディスクリプタの固有の組み合わせが、各ペプチドに対応する。異なるペプチドは、各次元が１つのディスクリプタに対応する場合、多次元空間中の点として表わされ得る。ＳＶＭは、生物活性ペプチドおよび非生物活性ペプチドに対応する点の２つのセットを最適に分離する境界を見出そうとする。この境界は、ｎ次元空間中の２つの種類の対象、すなわち、それぞれ生物活性ペプチドおよび非生物活性ペプチドに対応するベクターを最適に分類する最適超平面と呼ばれる。得られたＳＶＭモデルは、生物活性ペプチドと非生物活性ペプチドを区別することを学習する。生物活性ペプチドおよび非生物活性ペプチドの独立試験セットの順位に基づいて、最高の性能を有する最良のモデルを選択する。モデルを試験するために、生成されたモデル全ての性能を試験し、そして短いペプチド（４〜５５アミノ酸）および長いポリペプチド（５６〜３００アミノ酸）についての２つの最良のモデルをそれぞれ選択する。生物活性ペプチドの同定：トレーニング後、得られたトレーニングＳＶＭモデルは、生物活性が特徴づけられていない生物活性ペプチドを同定し得る。ペプチドライブラリ生成に関連する工程を説明するために、本発明に開示される方法の図式的概観を図１に示す。入力値として、Ｓｗｉｓｓｐｒｏｔのような公表されているヒトタンパク質データベースから提供されるタンパク質配列を使用する。工程１において、全ての可能なプロテアーゼ切断部位を、それらの事象を予測するツールのセットを使用して予測する。それぞれの切断部位の位置を、各前駆体の配列について保存する。さらに、全体のタンパク質前駆体配列について二次構造を推定する。前駆体配列内の予測切断部位に基づいて、全ての可能なフラグメントを生成し（工程２）、そして工程３の入力として使用する。工程３は、各ペプチドフラグメントの物理化学特性の計算を含む（実施例の節の項目３に説明する）。一般に、各フラグメント内のアミノ酸頻度、各フラグメントの二次構造、各フラグメントの等電点、各フラグメントの平均分子量、各フラグメントの疎水性、フラグメント内の各アミノ酸についての全てのファンデルワールス力の合計、フラグメント内の各アミノ酸についての一般的に使用されている全てのアミノ酸ディスクリプタの合計（すなわち、Ｍｅｉｅｔａｌ.，２００５に基づく各アミノ酸についてのＶＨＳＥ値）およびフラグメント長の情報を、生物情報を数値に変換するために考慮する。工程１および３からの計算値を工程４ａおよび４ｂで変換し、それぞれ１〜０のスケール値を得、各フラグメントについての４９の次元ベクターを生成する。工程５において、ベクターをトレーニングＳＶＭモデルに提示し、超平面から各ベクターへの距離を測定する。次いで、ＳＶＭ出力を工程６に使用し、ペプチドが生物活性であり得るか、またはそうでないかを決定する。本発明の方法により同定される生物活性ペプチドに対応する４９の次元ベクターを図３に記載する。ペプチドライブラリ中の可能性ある構造の数を有意に減少させるために、本発明において、ヒトセクレトームにおいて見出される天然のタンパク質配列のみを、ペプチドライブラリを生成するための一次構造として使用した。ヒトセクレトームは、細胞により分泌される全てのヒトタンパク質に対応するＤＮＡ中にエンコードされる全情報である。新規な生物活性ペプチドを見出すための前駆体配列として使用された可能性のある分泌ヒトタンパク質を、実施例の節の項目１.１.に記載される公表されている配列データベースから抽出した。分泌タンパク質（すなわち、タンパク質前駆体）の一次構造の異なる部分を、新規な生物活性ペプチドを推定するための鋳型として使用した。化学合成に適しているペプチドを提供するために、ペプチドの長さは４〜４５アミノ酸に制限した。本発明の方法による新規な生物活性ペプチドの同定後、抗菌アッセイを行い、後者のペプチドの生物活性を試験した。これらのアッセイを、実施例の節の項目６に詳述する。本発明は、さらに上記のＳＶＭモデル法により同定される生物活性ペプチドを含むペプチドライブラリに関する。本発明の方法により同定され、そして本発明のペプチドライブラリを含む１８５の生物活性ペプチドのアミノ酸配列を図２に記載する。ペプチドライブラリは、タンパク質関連研究のために新規に開発された技術である。ペプチドライブラリは、アミノ酸の系統的組み合わせ（ｓｙｓｔｅｍａｔｉｃｃｏｍｂｉｎａｔｉｏｎ）を有する多数のペプチドを含む。通常、ペプチドライブラリは固相、主に樹脂上で合成され、この固相は平面またはビーズとして作製され得る。ペプチドライブラリは、薬物設計、タンパク質−タンパク質相互作用、および他の生物化学的応用さらに薬物応用のための強力なツールを提供する。本発明のペプチドライブラリを、細胞内シグナル伝達経路を問い合わせるため、経路の理解を進める試薬を製造するため、治療の新規な形態を作り上げるため、そして医薬活性化合物、薬物療法のための標的、関連標的を見出すためのリガンドまたは疾患を経過観察するための生体指標を同定するためのスクリーニング法に使用し得る。本発明のポリペプチドは、ホルモン活性を有する。従って、本発明のポリペプチドは、薬物、例えばポリペプチド製剤、関連標的を見出すためのリガンド（例えば、ＧＰＣＲ）、薬物療法のための標的（例えば、モノクローナル抗体の標的、受容体フラグメント）、疾患を経過観察するための生体指標（体液中のペプチドフラグメントを検出するためのツール抗体との組み合わせ）、タンパク質キナーゼ阻害剤および基質、Ｔ細胞エピトープ、受容体結合部位のペプチドミモトープなどとして有用である。本発明のペプチドまたは前駆体をコードするＤＮＡは、例えば、心疾患、ホルモン産生腫瘍、糖尿病、胃潰瘍などの遺伝子治療、治療または予防のための試薬、ホルモン分泌阻害剤、腫瘍増殖阻害剤、神経作用などとして有用である。さらに、本発明のＤＮＡは、心疾患、ホルモン産生腫瘍、糖尿病、胃潰瘍などのような疾患の遺伝子診断のための試薬として有用である。図１は、本発明に開示される方法の図式的概観を示し、ペプチドライブラリ生成に関連する工程を説明する。図２は、共通の物理化学特性に基づいて選択された１８５の生物活性ペプチドのアミノ酸配列を示す。続きである。続きである。続きである。図３ａは、トレーニングＳＶＭアルゴリズムにより生物活性として同定された１８５のペプチドの入力ベクターを示す。続きである。続きである。続きである。図３ｂは、トレーニングＳＶＭアルゴリズムにより生物活性として同定された１８５のペプチドの入力ベクターを示す。続きである。続きである。続きである。図３ｃは、トレーニングＳＶＭアルゴリズムにより生物活性として同定された１８５のペプチドの入力ベクターを示す。続きである。続きである。続きである。図３ｄは、トレーニングＳＶＭアルゴリズムにより生物活性として同定された１８５のペプチドの入力ベクターを示す。続きである。続きである。続きである。図３ｅは、トレーニングＳＶＭアルゴリズムにより生物活性として同定された１８５のペプチドの入力ベクターを示す。続きである。続きである。続きである。図３ｆは、トレーニングＳＶＭアルゴリズムにより生物活性として同定された１８５のペプチドの入力ベクターを示す。続きである。続きである。続きである。図３ｇは、トレーニングＳＶＭアルゴリズムにより生物活性として同定された１８５のペプチドの入力ベクターを示す。続きである。続きである。続きである。図４は、μｇ／ｍｌでの抗生物質の計算されたＩＣ５０値を示す。一般に現在記載される本発明は、以下の実施例を参照してより容易に理解され、実施例は本発明の特定の局面および実施形態の説明の目的で単に含まれ、そして本発明を限定するとは意図されない。１．データベースおよびコンピュータプログラム１．１．データベース以下の公表されている配列データベースを使用して、可能性ある分泌ヒトタンパク質を抽出し、これを前駆体配列として使用して、新規な生物活性ペプチドを見出した：ヒトゲノム（ＮＣＢＩ３３アセンブリ、２００３年７月１日）をタンパク質に翻訳した、サブセット；ＩｎｔｅｒｎａｔｉｏｎａｌＰｒｏｔｅｉｎＩｎｄｅｘ，Ｓｗｉｓｓｐｒｏｔ（２００６年７月１１日にリリース５０．３）およびＴｒＥＭＢＬ（リリース：２００３年８月〜２００６年３月）；ＳＶＭベースのアルゴリズムのトレーニングについて、既知の生物活性ペプチドの情報をＳｗｉｓｓｐｒｏｔから抽出した。１．２．コンピュータプログラム１．１シグナルＰバージョン２．０（Ｎｉｅｌｓｅｎｅｔａｌ．，１９９７）目的：このプログラムを使用して、タンパク質シグナル配列を検出し、そして可能性あるヒトセクレトームを決定した。０．９８のカットオフスコアで使用した。シグナルＰバージョン２．０は、異なる有機体からアミノ酸配列中のシグナルペプチド切断部位の存在および局在化を予測する：この方法は、いくつかの人工の神経ネットワークおよび隠れマルコフモデルの組み合わせに基づいて、切断部位の予測およびシグナルペプチド／非シグナルペプチドの予測を組み込む。１．２ＰｒｏＰバージョン１．０（Ｄｕｃｋｅｒｔｅｔａｌ．，２００４）目的：このプログラムを使用して、タンパク質配列中の可能性ある切断部位を検出する。使用したカットオフスコアは、０．１１に設定した。このプログラムは、ニューラルネットワークの全体を使用して、真核生物のタンパク質配列中のアルギニンおよびリジンプロペプチド切断部位を予測する。フリン特異的予測（Ｆｕｒｉｎ−ｓｐｅｃｉｆｉｃｐｒｅｄｉｃｔｉｏｎ）はデフォルトである。一般的な前駆タンパク質転換酵素（ＰＣ）予測を行うこともまた可能である。１．３．アミド化部位予測およびプロテアーゼ切断部位予測（Ｒｏｈｒｅｒ，２００４）目的：プログラムＨａｍｉｄは、タンパク質配列中のアミド化部位を予測する。プログラムＨｍｃｕｔは、塩基性アミノ酸残基（Ｌｙｓ、Ａｒｇ）の前で起こるタンパク質配列中のプロテアーゼ切断部位を予測する。両方のプログラムはＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌｓに基づき、そしてソフトウェアバージョンＨｍｍｅｒ２．３．２（Ｄｕｒｂｉｎｅｔａｌ．１９９８）を利用する。１．４サポートベクターマシン（ＣｈａｎｇａｎｄＬｉｎ，２００１）ＬＩＢＳＶＭは、サポートベクターの分類（Ｃ−ＳＶＣ、ｎｕ−ＳＶＣ）、回帰（イプシロン−ＳＶＲ、ｎｕ−ＳＶＲ）および分配評価（１クラスＳＶＭ）の統合ソフトウェアである。以下のＳＶＭ規格を使用した：ＳＶＭ＿ｔｙｐｅ：ｎｕ−ＳＶＣ；Ｋｅｒｎｅｌ＿ｔｙｐｅ：放射基底関数。１．５．ＰｓｉＰｒｅｄバージョン２．４５（Ｊｏｎｅｓ，１９９９）タンパク質二次構造予測のための方法。この方法をＪｏｎｅｓ，１９９９に記載されるように使用した。１．６．等電点の計算目的：ポリペプチドの等電点の計算。これをＧａｓｔｅｉｇｅｒｅｔａｌ．２００５に従って行った。１．７．Ｐｅｒｌ−抽出および出力を行う言語（Ｐｒａｃｔｉｃａｌｅｘｔｒａｃｔｉｏｎａｎｄｒｅｐｏｒｔｌａｎｇｕａｇｅ）目的：Ｐｅｒｌは、ＬａｒｒｙＷａｌｌにより作成され、そして１９８７年に初めて公表されたダイナミックプログラミング言語である。２．ＳＶＭのトレーニング管理された学習プロセスのために、既知の生物活性ポリペプチド前駆体を、以下のＳＲＳ（ｗｗｗ．ｅｘｐａｓｙ．ｏｒｇのＳｅｑｕｅｎｃｅＲｅｔｒｉｅｖａｌＳｙｓｔｅｍ）クエリ命令文（ｑｕｅｒｙｓｔａｔｅｍｅｎｔ）を使用してＳｗｉｓｓｐｒｏｔのような一般によく利用される公表されているデータベースから抽出した：有機体（Ｏｒｇａｎｉｓｍ）＝脊椎動物亜門；配列の長さ（Ｓｅｑｕｅｎｃｅ＿ｌｅｎｇｔｈ）＝３０：３００；重要な特性（Ｆｅａｔｕｒｅ＿ｋｅｙ）＝シグナル；キーワード（Ｋｅｙｗｏｒｄｓ）＝サイトカインまたはホルモンまたはボンベシンまたはブラジキニンまたはグルカゴンまたは成長因子またはインスリンまたは神経ペプチドまたはオピオイドペプチドまたはタキキニンまたは甲状腺ホルモンまたは血管収縮剤または血管拡張剤。このクエリは、Ｓｗｉｓｓｐｏｒｔデータベースの注釈より生物活性ペプチドが容易に利用可能である既知のペプチドホルモン前駆体のセットをもたらす。従って、これらの配列を使用して、ＳＶＭベースのモデルのトレーニングのための生物活性ペプチドおよび非生物活性ペプチドのセットを推測する。３．ベクターを構築するために使用した分子ディスクリプタＳＶＭモデルの性能は、ペプチドを説明にするために使用される選択されたディスクリプタの質に強く依存する。本発明において、以下のディスクリプタが選択された：次元１〜７は、ヒト体内で生成されるポリペプチドの尤度を示し、そして異なるプロテアーゼ切断部位予測ツールの組み合わせにより計算された。これらのツールの結果は、ベクターの始めの７つの次元に示される。次元１：Ｎ末端ＰｒｏＰスコア；次元２：Ｎ末端Ｈｍｃｕｔスコア；次元３：Ｎ末端フラグメント（０．２の固定値）次元４：Ｃ末端ＰｒｏＰスコア；次元５：Ｃ末端Ｈｍｃｕｔスコア；次元６：Ｃ末端Ｈａｍｉｄスコア；次元７：Ｃ末端フラグメント（０．２の固定値）ポリペプチドの物理化学特性を計算し、そして以下のベクターの４２の次元を示す。次元８：１ポリペプチドあたりの酸性アミノ酸（Ｅ、Ｎ、Ｑ）の割合次元９：１ポリペプチドあたりの正電荷のアミノ酸（Ｒ、Ｈ）の割合次元１０：１ポリペプチドあたりの芳香族アミノ酸（Ｆ、Ｙ、Ｗ）の割合次元１１：１ポリペプチドあたりの脂肪族アミノ酸（Ｇ、Ｖ、Ａ、Ｉ）の割合次元１２：１ポリペプチドあたりのプロリンの割合次元１３：１ポリペプチドあたりの反応性アミノ酸（Ｓ、Ｔ）の割合次元１４：１ポリペプチドあたりのアラニンの割合次元１５：１ポリペプチドあたりのシステインの割合次元１６：１ポリペプチドあたりのグルタミン酸の割合次元１７：１ポリペプチドあたりのフェニルアラニンの割合次元１８：１ポリペプチドあたりのグリシンの割合次元１９：１ポリペプチドあたりのヒスチジンの割合次元２０：１ポリペプチドあたりのイソロイシンの割合次元２１：１ポリペプチドあたりのアスパラギンの割合次元２２：１ポリペプチドあたりのグルタミンの割合次元２３：１ポリペプチドあたりのアルギニンの割合次元２４：１ポリペプチドあたりのセリンの割合次元２５：１ポリペプチドあたりのトレオニンの割合次元２６：１ポリペプチドあたりの非標準（不確定）アミノ酸の割合（この次元は入力として０以外のあらゆる値を含まないというわけではない）次元２７：１ポリペプチドあたりのバリンの割合次元２８：１ポリペプチドあたりのトリプトファンの割合次元２９：１ポリペプチドあたりのチロシンの割合次元３０：システイン含有量（０、偶数または奇数はそれぞれ、０．５、１または０に設定される）次元３１：１ポリペプチドあたりのコイル状の二次構造の割合次元３２：１ポリペプチドあたりのらせん状の二次構造の割合次元３３：１ポリペプチドあたりのランダム二次構造の割合次元３４：Ｎ末端切断部位周囲の構造についてのスコア次元３５：Ｃ末端切断部位周囲の構造についてのスコア次元３６：１ポリペプチドあたりのらせん状ブロックの数次元３７：ポリペプチドの等電点次元３８：ポリペプチドの平均分子量次元３９：ポリペプチド内の各アミノ酸のファンデルワールス力の合計次元４０：ポリペプチド内の各アミノ酸の疎水性値の合計次元４１〜４８：１ポリペプチドあたりの疎水性、立体的特性、および電子物性の主成分スコアベクターに基づいて計算された平均値（Ｍｅｉｅｔａｌ．２００５）次元４９：ポリペプチドの長さ。適用可能である場合、次元１〜４９の値は、０〜１の範囲内に基準化される（ｓｃａｌｅ）。トレーニングおよび予測のための入力ベクターは４９の次元を含むが、現在のフォーマットにおいて、次元２６（１フラグメントあたりの非標準アミノ酸の割合）は全てのフラグメントについて０に設定されるので、４８のみが利用される。これは、非標準アミノ酸を含む適切なトレーニングデータがないためであるが、将来モデル（ｆｕｔｕｒｅｍｏｄｅｌ）に含まれ得る。４．モデルの試験生物活性ペプチドおよび非生物活性ペプチドの独立試験セットの順位に基づいて、最高の性能を有する最良のモデルを選択する。モデルを試験するために、生成されたモデル全ての性能を試験し、そして短いペプチド（４〜５５アミノ酸）および長いポリペプチド（５６〜３００アミノ酸）についての２つの最良のモデルをそれぞれ選択した。結果として、短いペプチドについて９０．７％および長いペプチドについて９４％の全体の予測精度が達成された。独立試験セットを使用して、開示される方法は、約９３％の生物活性ペプチドおよび約９１％の非生物活性ペプチドを正確に同定する。５．生物活性ペプチドの同定順位工程の間（工程６、図１）、４６アミノ酸よりも短い、１前駆体あたりの最もスコアの高いペプチドを選択する。この順位プロセスにおいて、たとえ、タンパク質前駆体あたりの最もスコアの高いペプチドが示されても、ＳＶＭ分類後に、｜０，６５｜を超える距離を有し、そして負のトレーニングデータセット内（すなわち、−０，６５またはより低いスコア）に特定される全てのフラグメントをすぐに破棄する。６．本発明の方法により同定されたペプチドの生物活性を試験するための抗菌アッセイ６．１．アッセイ技術微量希釈試験は、培養物中の生菌または酵母細胞の数を測定するためのホモジニアス法を表す。これは、生存する細菌または酵母が培養物中で不透明であるという事実に依存する。濁度は光度計を用いて光吸収として測定され得、そしてサンプル中の細胞の数と関連している。６．２．材料および方法細菌および酵母株実験の課程において使用した株は、Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ（Ｅ．ｃｏｌｉＡＴＣＣ２５９２２）、Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ（Ｓ．ａｕｒｅｕｓＡＴＣＣ２９２１３）およびＣａｎｄｉｄａａｌｂｉｃａｎｓ（Ｃ．ａｌｂｉｃａｎｓＦＨ２１７３）である。全ての試験株の前培養前培養の多数の植菌に使用し得る冷凍保存ストック（ｃｒｙｏｓｔｏｃｋ）を構築して、株の培養を開始する。１．植菌ループを使用して、ＭｕｅｌｌｅｒＨｉｌｔｏｎ（ＭＨ）寒天プレートの表面上に細菌をストリークし、そして寒天プレートを３７℃で３日間インキュベートする。酵母について、Ｓａｂｏｕｒａｕｄｄｅｘｔｒｏｓｅ（ＳＤ）寒天を用いるが、同じ手順を使用する。２．ＭＨ培養液（３０ｍｌ）を含む１００ｍｌ振とうフラスコに細菌１ループを植菌し、そしてフラスコを３７℃および１８０ｒｐｍで１日間インキュベートする。酵母について、ＳＤ培養液中で同じ条件を適用する。３．滅菌ピペットを使用して、各々２５のグリーングラスビーズを含むＣｒｙｏｂａｎｋ（ＣＲＹＯ／Ｇ）プラスチックバイアルから高張クリオ保存液（ｃｒｙｏ−ｐｒｅｓｅｒｖａｔｉｖｅｓｏｌｕｔｉｏｎ）を取り出す。４．細菌／酵母懸濁液（２ｍｌ）で各バイアルを満たし、バイアルを密閉し、そして慎重に混合する。５．バイアルから細菌／酵母培養液の上清をできる限り除く。すぐにビーズの表面を細菌／酵母で覆う。バイアルに残っている液体の量は、ビーズの凝集を妨ぐために、できる限り少量にすべきである。１つの前培養の植菌に１つビーズを使用する（１００ｍｌ振とうフラスコ中にＭＨ／ＳＤ培養液（３０ｍｌ））。６． −８０℃で、Ｃｒｙｏｂａｎｋ（ＣＲＹＯ／Ｇ）バイアルを保存する。７．品質／滅菌チェック：冷凍庫からＣｒｙｏｂａｎｋ（ＣＲＹＯ／Ｇ）バイアルを取り出し、そしてＣｒｙｏｂｌｏｃｋ（ＣＲＹＯ／Ｚ）に配置する。バイアルを開け、ビーズ１つを取り出し、すぐにＭＨ／ＳＢＤ寒天プレートの表面にビーズをストリークする。３７℃で３日間プレートをインキュベートする。コロニー形態を検査することにより、試験株が成長していることだけを確認する。ＭＨ培養液を使用する試験培養物の調製試験株バイアルをＣｒｙｏｂａｎｋから取り出す。ビーズ１つを滅菌ピペットで取り出し、そして細菌および酵母についてそれぞれ、ＭＨおよびＳＤ培養液（３０ｍｌ）を含む１００ｍｌ三角フラスコに植菌する。３７℃および１８０ｒｐｍで１８時間培養する。全ての試験株について、光学密度を１０ ⁸細胞／ｍｌに対応する細胞密度にＭＨ培養液で調節する。アッセイのための標準植菌培養物を１：１００で１０ ⁶ ＣＦＵ／ｍｌ（コロニー形成単位／ｍｌ）の最終濃度まで希釈する。ペプチド希釈化合物を１２５μＭの標準初期濃度〜０，２４μＭの最終濃度まで連続希釈する（１０希釈段階）。ＤＭＳＯの初期濃度は、全てのサンプルおよび対照において、１，４％である。用量反応曲線についての抗生物質の標準希釈用量反応実験のために、ＭＨ培養液で化合物を連続希釈する（１６希釈段階）。化合物の最終濃度は６４μｇ／ｍｌ〜０.００２μｇ／ｍｌの範囲である。ＤＭＳＯの初期濃度は、全てのサンプルおよび対照において１，４％である。アッセイプロトコル ^* ＭＨ培養液（３０ｍｌ）中、３７℃で１８時間細菌を前培養する（１００ｍｌ三角フラスコ） ^* ＳＤ培養液（３０ｍｌ）中、３７℃で１８時間酵母を前培養する（１００ｍｌ三角フラスコ） ^* ＭＨ培養液で１０ ⁶ ＣＦＵ／ｍｌに細胞懸濁液を調節する（試験培養物）アッセイ ^第一のバイアルにＤＭＳＯ中の化合物（１０μｌ）およびＭＨ培養液（３０μｌ）を添加する ^ ＭＨ培養液（２０μｌ）を含む第二のバイアルに第一のバイアルから２０μｌを移す ^最後の工程を８回（ペプチド、１０希釈段階）または１４回（抗生物質、１６希釈段階）繰り替えす ^各バイアルに試験培養懸濁液（１０μｌ）を添加する（ペプチドについて１０バイアルおよび抗生物質について１６バイアル） ⇒細胞の初期植菌（ｓｔａｒｔｃｅｌｌｉｎｏｃｕｌｕｍ）：５×１０ ⁵ ＣＦＵ ⇒ＤＭＳＯの初期濃度：１２，５％ ⇒化合物の初期／最終濃度：１２５μＭ〜０，２４μＭ ⇒抗生物質の初期／最終濃度：６４μｇ／ｍｌ〜０，００２μｇ／ｍｌ ^* ５％相対湿度および５％ＣＯ ₂により３７℃で１８時間インキュベートする ^* ５フラッシュ（ｆｌａｓｈ）、５９０ｎｍで吸光度を読み取る対照 ^高対照：細菌を含むＭＨ培養液（生育調節、高シグナル） ^低対照：細菌を含まないＭＨ培養液（滅菌調節、低シグナル）６．３．抗生物質を用いる感度試験可能性のある薬物を同定するためのアッセイの適正を評価するために、「材料および方法」に記載される条件を使用して、多数の抗生物質の用量依存効果を試験した。シプロフロキサシン（ｃｙｐｒｏｆｌｏｘａｃｉｎ）はＥ．ｃｏｌｉおよびＳ．ａｕｒｅｕｓに対して、ナイスタチンはＣ．ａｌｂｉｃａｎｓに対して活性であることが予測された。これらの抗生物質の計算されたＩＣ５０値を、μｇ／ｍｌで図４に示す。６．４．アッセイ結果試験株Ｅ．ｃｏｌｉ（ＡＴＣＣ２５９２２）、Ｓ．ａｕｒｅｕｓ（ＡＴＣＣ２９２１３）およびＣ．ａｌｂｉｃａｎｓ（ＦＨ２１７３）に対してペプチドを試験した。ペプチドＡ００３５００５８９およびＡ００３５００５４８は、Ｅ．ｃｏｌｉに対してそれぞれ、７，２５μｇ／ｍｌおよび６，７９μｇ／ｍｌのＩＣ５０値を示した。Ｓ．ａｕｒｅｕｓおよびＣ．ａｌｂｉｃａｎｓに対する活性は見出せなかった。参考文献 Chih-Chung Chang and Chih-Jen Lin;“LIBSVM:a library for support vector machines”;2001 Peter Duckert, Soren Brunak and Nikolaj Blom;“Prediction of proprotein convertase cleavage sites”;Protein Engineering, Design and Selection, 17:107-112, 2004 Durbin R, Eddy S, Krogh A and Mitchison G;“The theory behind profile HMMs:Biological sequence analysis:probabilistic models of proteins and nucleic acids”;Cambridge University Press, 1998. C. Falciani, L. Lozzi, A. Pini, L. Bracci;“Bioactive Peptides from Libraries”;Chemistry & Biology,Volume 12,Issue 4, Pages 417-426, 2005 Gasteiger E., Hoogland C., Gattiker A., Duvaud S., Wilkins MR, Appel RD, Bairoch A.;“Protein Identification and Analysis Tools on the ExPASy Server”;(In) John M. Walker（ed):The Proteomics Protocols Handbook, Humana Press, 2005 Jones, DT;“Protein secondary structure prediction based on position-specific scoring matrices”;J. Mol. Biol. 292:195-202, 1999 H. Kim and H. Park;“Prediction of protein relative solvent accessibility with support vector machines and long-range interaction 3d local descriptor”;Proteins, 54(3):557-62, 2004 Mei, H., Liao, TH, Zhou, Y., and Li, SZ;“A new set of amino acid descriptors and its application in peptide QSARs”;Biopolymers Vol.80, 775-786, 2005 Henrik Nielsen, Jacob Engelbrecht, Soren Brunak and Gunnar von Heijne;“Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites”;Protein Engineering, 10:1-6, 1997 Noble WS.;“What is a support vector machine?”;Nat. Biotechnol. 24(12):1565-7, 2006 Rohrer, S.;“Prediction of post-translational processing sites in peptide hormone precursors”;Diplomarbeit, Universitat Wurzburg, 2004 John Shawe Taylor & Nello Cristianini;“Support Vector Machines and other kernel-based learning methods”;Cambridge University Press, 2000

And use thereof for producing a peptide library

该功能需要专业版企业版VIP权限，您可以：