Chemical resources database

申请号 JP2001573237 申请日 2001-04-03 公开(公告)号 JP2003529843A 公开(公告)日 2003-10-07
申请人 ライブラリア・インコーポレーテッド; 发明人 ブーニン・バリー・エー.;
摘要 Chemical software tools employ databases and associated systems that store, manipulate, and investigate chemical information that is organized by reaction chemistry. Specific procedures and methods are associated with specific reactions. Further, such tools may associate reliability ratings with individual reactions to identify robust reactions from among groups of related reactions. For example, a particular benzyl amine may be given a high reliability rating because it is superior to other aromatic primary amines in its ability to form amides (the reaction chemistry under consideration). Further, the software tools may automatically suggest/generate diverse libraries for particular precursors, classes of precursors, or reaction chemistries. This is accomplished by automatically generating a flexible group of reaction chemistries based on like procedures and methods for a particular precursor or class of precursors. Preferably, these software tools are designed to allow continuous improvement and refinement by feedback from humans and/or artificial intelligence systems.
权利要求
  • 【特許請求の範囲】 【請求項1】 化学合成情報を提供するためのエキスパート・システムの開発方法であって、 (a)化学合成法に従って系統的に分類された化学情報を蓄積したデータベースを提供するステップと、 (b)ユーザからの検索指示に応じて、前記データベースを用いて化学合成に関する情報を特定するステップと、 (c)前記エキスパート・システムが化学合成情報をより適切に提供可能なように修正された、該エキスパート・システム内の情報あるいはルールを、ユーザからの検索指示に対する回答に基づいて特定するステップと、 (d)前記ステップ(c)で特定された情報を用いて、前記エキスパート・システムを改良するステップと を備えるエキスパート・システムの開発方法。 【請求項2】 前記化学合成法に従って系統的に分類された化学情報が、反応条件ならびに出発物質を含んでいる請求項1記載の開発方法。 【請求項3】 人工知能を用いて前記化学合成情報にフィードバックを行うことによって、前記データベースの改良を行う請求項1記載の開発方法。 【請求項4】 前記化学合成法が、コンビナトリアル合成法を含んでいる請求項1記載の開発方法。 【請求項5】 請求項1記載の方法であって、さらに、 新しいコンビナトリアル合成法を前記データベースに追加するステップを備える開発方法。 【請求項6】 請求項1記載の方法であって、さらに、 化学文献に記載されている化学合成法を前記データベースに追加するステップを備える開発方法。 【請求項7】 前記化学文献が、ピア・レビューの対象となる文献である請求項6記載の開発方法。 【請求項8】 請求項6記載の方法であって、さらに、 新しい化学合成法を検証後、前記データベースに追加するステップを備える開発方法。 【請求項9】 請求項6記載の方法であって、さらに、 化学合成法を前記データベースに追加する前に、前記化学合成法の書式を整えるステップを備える開発方法。 【請求項10】 前記エキスパート・システムが、SARツールを含んでいる請求項1記載の開発方法。 【請求項11】 請求項10記載の方法であって、 前記SARツールは、前記エキスパート・システム内で特定され、且つ該エキスパート・システムがより適切な化学合成情報を提供するように修正可能な情報あるいはルールに基づいて、改良されるツールである開発方法。 【請求項12】 化学合成に関する情報を提供する化学情報システムであって、 化学合成法に従って系統的に分類された化学情報を蓄積したデータベースと、 ユーザからの検索指示に応じて、前記化学合成法に関する情報を返すとともに、所定の化合物に対して考えられる複数の反応化学を自動的に生成可能なロジックと を備える化学情報システム。 【請求項13】 前記データベースシステムが、化学情報を含む他のデータベースと相互に通信可能なデータベースシステムである請求項12記載の化学情報システム。 【請求項14】 請求項12記載の化学情報システムであって、さらに、 化学情報を含む一つあるいは複数の他の化学データベースへのリンクを備えている化学情報システム。 【請求項15】 前記化学合成法が、コンビナトリアル・ケミストリ法を含んでいる請求項12記載の化学情報システム。 【請求項16】 前記化学情報の少なくとも一部は、化学文献を出典とする情報である請求項12記載の化学情報システム。 【請求項17】 請求項16記載の方法であって、 前記化学文献がピア・レビューの対象となる文献である方法。 【請求項18】 前記データベースで用いられる前記化学合成法が、信頼性評価を含んでいる請求項12記載の化学情報システム。 【請求項19】 請求項12記載の化学情報システムであって、さらに、 前記データベースから、一つあるいは複数の化合物の活性を予測するSARツールを備える化学情報システム。 【請求項20】 前記化学合成法が、ポリマー合成法を含んでいる請求項1
    2記載の化学情報システム。 【請求項21】 前記化学合成法が、酵素調節法を含んでいる請求項12記載の化学情報システム。 【請求項22】 前記ロジックが、検索エンジンを含んでいる請求項12記載の化学情報システム。 【請求項23】 前記ロジックが、決定ルールを含んでいる請求項12記載の化学情報システム。 【請求項24】 前記ユーザからの検索指示が、一定の反応条件に制限されている請求項12記載の化学情報システム。 【請求項25】 ユーザに化学情勢情報を提供する化学情報システムの利用方法であって、 (a)化合物あるいは化学合成に関する検索指示を受け取るステップと、 (b)化学合成法に従って系統的に分類され、且つ、前記化学合成法に関する信頼性評価を含む化学情報を蓄積したデータベースを、前記検索指示に応じて検索するステップと、 (c)前記検索指示に応じて、化学合成に関する情報を返すステップと を備える利用方法。 【請求項26】 請求項25記載の方法であって、さらに、 化学合成に関する化合物ライブラリを特定するステップを備える利用方法。 【請求項27】 請求項26記載の方法であって、さらに、 前記化合物ライブラリを顧客に提供するステップを備える利用方法。 【請求項28】 請求項25記載の方法であって、さらに、 前記化学情報システムを用いて同定された個々の化合物を提供するステップを備える利用方法。 【請求項29】 請求項25記載の方法であって、さらに、 前記化学情報システムを用いて同定された化合物の前駆物質を特定するステップを備える利用方法。 【請求項30】 請求項25記載の方法であって、さらに、 構造活性相関ツリーを顧客に提供するステップを備える利用方法。 【請求項31】 前記化学合成法が、コンビナトリアル合成法を含んでいる請求項25記載の利用方法。 【請求項32】 請求項25記載の方法であって、さらに、 化学情報を蓄積した外部データベースを自動的にクロス・リファレンスするステップを備える利用方法。 【請求項33】 請求項32記載の方法であって、さらに、 前記外部データベースから反応パラメータを特定する文献引用を入手するステップを備える利用方法。 【請求項34】 請求項25記載の方法であって、さらに、 直感的なリンクに従って、自動的に前記データベースをクロス・リファレンスするステップを備える利用方法。 【請求項35】 請求項25記載の方法であって、さらに、 前記データベースを、反応パラメータに従って構成するステップを備える利用方法。 【請求項36】 前記化学合成法が、ポリマー合成法を含んでいる請求項2
    5記載の利用方法。 【請求項37】 前記化学合成法が、酵素調節法を含んでいる請求項25記載の利用方法。
  • 说明书全文

    【発明の詳細な説明】 【0001】 【従来の技術】 現代の有機化学者は、無数のソフトウェアツールを自在に使いこなしている。
    このソフトウェアツールには、化学構造から活性を予測するためのツール(「構造活性相関」ツールあるいはSARツールと称される)や、市販されている試薬を注文するためのツール、文献へのリンクを含む膨大な量の化学情報を蓄積したデータベースなどが含まれる。 これらのツールのうち大部分は、新しい電子インフラ設備や電子商取引を利用する目的で最近開発されたものである。 また、かつては解決困難だった問題を解決する(あるいは、解決に近づける)ためにコンピュータ能を利用する目的で開発されたものもある。 【0002】 もっとも普及しているオンラインデータベースのなかには、かつては図書館の棚のテキストを調査するツールであった索引データを電子化して提供しているものもある(例えば、ベイルステイン、ケミカル・アブストラクト等)。 このようなデータベースは、種々の近代的な電子特性が付与されてはいるものの、根本的には、伝統的手法で集められた化学情報を電子データベースとして再フォーマットしたものにすぎない。 これら既存のデータベースは、基本的に、ある文献を入手するべきかどうかを化学者が判断する助けとなる情報を備えた、文献の索引リストであって、現代の化学者の研究を容易にする目的で最適化されたものではない。 【0003】 既存の化学ソフトウェアを用いた場合の大きな問題は、反応条件の範囲が狭められてしまうことである。 また、データベースに含まれる、反応性や化学反応経路に関する詳細な情報へのアクセスにも問題がある。 これは、特に、ハイスループット化学で問題となる。 多くの場合、研究設備や化学測定機器の特有の性質によって、反応条件の範囲が狭められている。 例えば、コンビナトリアル・ケミストリの研究設備やパラレル合成の研究設備でこの問題が生じる。 通常、このような装置は、化学合成に関して広い範囲の反応条件を提供することはできなかった。 なぜなら、このような装置は、多くの化学合成を同時に、かつ、非常に小さな反応スケールで実行するように設計されているためである。 このため、装置が非常に複雑になっており、この複雑さ故に、加熱・冷却、不活性雰囲気、高反応性試薬供給等に関して、様々な条件に設定することが困難であった。 また、対象となる分子の中には、熱および/あるいは光に対して不安定なものも多い。 ソフトウェアツールを用いて、役立つ可能性のある活性を備える化合物を提示された場合、実現可能な合成条件下で、この化合物が安定であるか否か(さらには、実際に合成可能であるか否か)を知りたいという要望が出てくる。 しかしながら、従来のツールはこのような情報を提供するものではなかった。 さらに、既存のデータベースは、化学反応条件や反応化学に基づいて化学情報を効果的に系統分類したものでもなかった。 【0004】 また、化学者が、新しい分野の研究を始め、なじみのない合成化学を利用する必要性が生じた場合には、別の問題が生じる。 このような場合、比較的容易に合成できる化合物から始めるのが一般的である。 特定の反応の対象となる一連の前駆物質がある場合、そのうちのいくつかの前駆物質が関連する反応が、他のものに比べて信頼性(反応が起こり得る可能性)が高いということは、頻繁に起こりえる。 その分野に不慣れな化学者からは、どの前駆物質が最も信頼性が高いのかを知りたいという要望がある。 また、その分野に詳しい化学者でも、直観的には進むはずの化学反応が実際には進まないという事態に頻繁に遭遇する。 信頼性評価と結びついた反応化学は、合成化学者の強力なツールとなり、無駄な実験に費やされる時間やお金を節約することにつながる。 しかしながら、従来のソフトウェアツールは、信頼性に関するデータを簡便に与えるものではなかった。 【0005】 さらに、化学者が薬剤開発や他の製品開発研究のために、化合物の多様なライブラリを形成しようとする場合にも、問題に直面する。 文献やデータベースは、
    いずれも、限定されたものであり、開発のための可能な経路をすべて示すことはできなかった。 通常、化合物の部分(化合物フラグメント)が、所望の活性に少なくとも部分的に関係すると考えられる。 このような知見は、たとえば、ファーマコフォア研究から得られる。 開発工程においては、対象となる化合物フラグメント、あるいはその変異体を含む化合物ライブラリを作成することが必要となる。 この目的のために、コンビナトリアル・ケミストリを利用して、大きな化合物ライブラリが作成される。 コンビナトリアル・ケミストリでは、所望の化合物フラグメントを備える複数の前駆物質を、一つあるいは複数の合成経路で合成する。 結果として得られる化合物ライブラリは、多様ではあるものの、化学者に周知の反応化学、あるいは既存のデータベースを検索することで見い出すことの可能な反応化学の範囲に限定されてしまう。 文献に限定されることなく、反応化学に関して更なるバリエーションを提供できれば、多様性をもっと高めることが可能である。 【0006】 【発明が解決しようとする課題】 しかし、化学の研究がどんどん進んでいく状況のなかで、上述したソフトウェアの限界に関する問題は看過しえなくなってきている。 日々、新しい合成法が開発され、試験が繰り返されている。 有機化学、構造生物学、薬剤開発に関する新たな知見も次々と生まれている。 このような進歩と歩調をあわせて化学情報を電子的に蓄積するのは、非常に困難なこととなっている。 【0007】 そこで、化学研究が容易になるような化学研究者のためのソフトウェアツールが求められている。 【0008】 【課題を解決するための手段およびその作用・効果】 上記の目的を達成するために、本発明は、データベースと、データベースに基づいて、反応化学に従い系統的に分類された化学情報を蓄積・操作・調査するためのシステムと、を利用する改良ソフトウェアツールを提供する。 このようなツールにより、個々の反応に対する信頼性の評価を行い、考えられる様々な反応群の中から望ましい反応を特定することができる。 また、このようなツールを用いることにより、ユーザは、化学反応条件をフィルタとして用いた反応化学の検索や、出発物質をフィルタとして用いた構造の検索が可能になる。 簡単な例で言えば、所定のベンジルアミンは、アミド形成能力(対象となる反応化学)が他の芳香族第一級アミンよりも優れているため、高い信頼性評価を得る。 また、もっと複雑な例では、信頼性の評価により、所定の反応条件をフィルタとして用いて、
    信頼性を複数の範囲に分類することが可能である。 さらに、ソフトウェアツールを用いて、所定の前駆物質、所定の種類の前駆物質、あるいは様々な反応化学に関する多様なライブラリを自動的に提案・作成することも可能である。 所定の前駆物質あるいは所定の種類の前駆物質に関して、フレキシブルな一連の反応化学を自動的に作成することにより、このようなライブラリを形成することができる。 これらのソフトウェアツールは、人および/あるいは人工知能システムからのフィードバックにより、絶えず改良・改善可能なように設計されることが望ましい。 【0009】 本発明の一つの態様は、化学合成に関する情報を提供する化学情報システムに関する。 この化学情報システムは、(a)化学合成法によって系統的に分類された化学情報を蓄積したデータベースと、(b)ユーザからの検索指示に応じて、
    前記化学合成法に関する情報を返信するように構成されたロジックと、を備えることを特徴とする。 ここで、データベースには、種類ごとに分類された反応のみでなく、反応条件も含まれている。 本発明の態様において、ロジックは、所定の化合物に関して複数の反応化学を自動的に作成するものでもよい。 たとえば、ある種の前駆物質から25種類の異なった反応が導かれることが示される。 本発明のシステムは、周知の反応を利用して反応生成物(ライブラリ)を自動的に作成するものでもよい。 さらに、作成された複数の反応化学を、一定の反応条件で限定するようにしてもよい。 たとえば、一連の出発物質と一定の反応条件を検索条件として入力することもできる。 本発明のロジックは、出発物質から想定可能であり、かつ、一定の反応条件下で様々な異なった生成物を与えるような、すべての種類の反応を作成する。 一定の反応条件とは、たとえば、温度範囲が摂氏25
    度から40度といった条件である。 反応化学を作成するための検索条件の一部として、一定の反応条件を利用することができるので、反応条件をフィルタとして用いて出力をフィルタリングするために、貴重な演算時間が費やされることはない。 ただし、後述するように、反応条件をフィルタとして用いた出力のフィルタリング自体は、有効なツールである。 【0010】 上記のシステムに備えられるロジックは、様々な種類の装置でハードウェアおよび/あるいはソフトウェアとして実現可能である。 ロジックを検索エンジンや決定ルールとして機能させることもできる。 上記システムで用いられる化学情報は、実験および/あるいは化学文献、特に、ピア・レビュー(peer-review )の対象となる文献等の多様なソースから集められる。 日進月歩の反応化学の成果を充分に活用するために、上記システムが、一つあるいは複数の他の化学データベースに接続され、ここから情報を入手できるように構成されることが望ましい。 【0011】 化学情報システムが、さらに、データベースから一つあるいは複数の化合物の活性を予測するSARツールのような他のツールやフィルタを備えるようにしてもよい。 このようなツールを用いることにより、構造生物学や薬剤開発など、様々な分野でシステムが利用可能になる。 【0012】 データベースで用いられる化学合成法は、種々のソースから集められる。 たとえば、有機化学、コンビナトリアル・ケミストリ、ポリマー合成、酵素法などの合成法を含む。 データベースで用いられる化学合成法が、信頼性の評価を含むように構成することが望ましい。 【0013】 本発明の別の態様は、ユーザに化学合成情報を提供する化学情報システムの利用法に関する。 この方法は、通常、コンピュータ装置上で実現され、(a)化合物あるいは化学合成に関する検索指示を受信するステップと、(b)前記検索指示に応じて、化学合成法によって系統的に分類され、かつ、前記化学合成法に関する信頼性評価を含む化学情報を蓄積したデータベースを検索するステップと、
    (c)前記検索指示に対して、化学合成に関する情報を返信するステップと、を備えることを特徴とする。 信頼性評価は、たとえば、再現性、適切な処理条件の範囲、収率等の因子に基づいて、反応をランク分けする。 対象となる合成法は、
    コンビナトリアル・ケミストリ、ポリマー合成、酵素反応などに利用されるものである。 この方法は、特に、構造生物学や薬剤開発などの分野で有効である。 【0014】 一例として、ユーザからの検索指示に応じて、システムが、化学合成に関係する化合物のライブラリを特定するように構成することも可能である。 ここで特定されるライブラリは、実際に合成された特定のライブラリでも、各化合物すべてが独立した信頼性の高い経路で合成されたライブラリでも、あるいは、信頼性の置ける化学反応データに基づく仮想ライブラリでもよい。 また、化学情報システムを、販売事業の一部として構成することも可能である。 この場合、システムは、顧客に対して、個々の化合物、ライブラリ用の試薬セット、あるいは、化学情報システムを用いて特定される化合物のライブラリを実際に提供することができる。 【0015】 本発明の態様として、前記化学情報システムの利用法が、ユーザに追加の情報を提供するようにしてもよい。 たとえば、前記方法が、化学情報システムを用いて同定された化合物の前駆物質を特定するようにしてもよいし、あるいは、前記方法が、化合物に関係する構造活性相関ツリーを提供するようにしてもよい。 また、ユーザに提供される化学合成情報に関するフィルタとして、これらの特徴を利用することも可能である。 【0016】 前記化学情報システムの利用法が、直観的リンクによる内部データベースからの情報のみでなく、化学情報を備える外部データベースとも自動的にクロス・リファレンス可能な構成も好適である。 たとえば、対象となる分子を作成する正確な手順を、(類似性、基礎構造、出発物質対応表などの)構造特性あるいは存在論的に定義された化学を介してリンクさせる。 化学反応の特性をより明確に表現可能な、より直観的な方式や合成化学者の主観的思考や分類にそって、自動的に合成情報を系統分類するようにしてもよい。 このような例として、出発物質の種類による(例:第一級芳香族アミン化学反応)化学反応の系統的分類や、反応条件の種類による(例:室温、一晩放置)化学反応の系統的分類が挙げられるが、
    これらは、従来のデータベース検索方式と比較して、分子の特性を最適化する合成スキームの直観的な選択に、はるかに有効である。 このような構成の一部として、前記方法が、内部データベースの反応パラメータのみでなく、外部データベースの反応パラメータも特定する文献引用を返信するようにしてもよい。 【0017】 本発明のさらに別の態様は、化学合成情報を提供するエキスパート・システムの開発方法に関する。 この場合、エキスパート・システムが、単純に、データベースと、前記データベースを変更し、これを検索するための関連ロジックから構成されるものでもよい。 エキスパート・システムは、ひとつあるいは複数のソースからのフィードバックによって進化し、改良される。 この開発方法は、(a)
    化学合成法によって系統的に分類された化学情報を蓄積したデータベースを提供するステップと、(b)前記データベースを用いて、ユーザからの検索指示に対して、化学合成情報を特定するステップと、(c)ユーザからの検索指示に対する回答に基づき、化学合成情報を提供する前記エキスパート・システムの適合性を増大させるように修正された、前記エキスパート・システム内の情報あるいは法則を特定するステップと、(d)前記ステップ(c)で特定された情報を用いて、前記エキスパート・システムを改良するステップと、を備えることを特徴とする。 たとえば、エキスパート・システムが、化学合成およびSARツールを含み、これらを改良するようにしてもよい。 【0018】 また、化学合成情報に関するフィードバックを行う人工知能システムを利用して、改良することも可能である。 さらに、既にデータベースに存在する化学合成情報を改良するのみでなく、新たな化学合成情報をデータベースに追加するような構成も好適である。 たとえば、前記方法によって、新たなコンビナトリアル合成法をデータベースに追加するようにしてもよいし、あるいは、(望ましくは、
    ピア・レビューされた)化学文献に記載された化学合成法をデータベースに追加するようにしてもよい。 データベース(およびエキスパート・システム)の統合性を確保するために、新たな化学合成法を追加する前に、これらを検証および/
    あるいは書式設定するようにしなければならない。 【0019】 上述した方法の少なくとも一部を実現するためのプログラムを記憶したコンピュータ読み取り可能な媒体を含むコンピュータプログラム製品として、本発明を構成することも可能である。 本発明の方法のいずれも、その全部あるいは一部を、コンピュータ読み取り可能な媒体上で提供可能なプログラムとして構成することができる。 さらに、上述したように作成および/あるいは利用されるデータおよびデータ構造の種々の組み合わせとして本発明を構成することも可能である。 【0020】 【発明の実施の形態】 【0021】 上記したものを含め、本発明の特徴や利点を、図面を参照しながら、以下で、
    さらに詳細に説明する。 【0022】 緒言: 合成化学の分野は、一世紀以上にわたって、科学者たちが観測したり実験することによって発展してきた。 化学合成情報は、一次文献や数多くの参照テキストに記録されてきた。 近年、特に、ここ10年で、合成化学の一分野として、コンビナトリアル・ケミストリが急速に発展してきた。 コンビナトリアル・ケミストリは、ハイスループット合成(HTS)のための最も一般的で信頼性の高い方法であると考えられる。 この技術は、多くの場合、自動化されており、最終的に合成化学に適合する産業革命にもなぞらえられてきた。 この技術は、化学者が(高容量スクリーニングHCSと関連付けられている)構造活性相関を迅速に解明する助けとなるものであるが、多くの理由により、充分には活用されていない。 ライブラリ作成のために必要となる、信頼性の高い方法に関する充分な情報が欠如していること、また、高収率で所望の生成物が得られるように反応条件を最適化することが困難であること、などが、その主な理由である。 以下に詳述するように、本発明の化学情報データベースおよびソフトウェアは、望ましくは、実験データおよび/あるいは他の情報に基づいて信頼性評価を行った状態で、合成手順を備えている。 また、本発明により、コンビナトリアル・ケミストリに関連する合成情報のデータベースを作成し、構築し、検索し、進化させ、実際に利用することが可能となる。 コンビナトリアル・ケミストリの概要に関しては後述する。 【0023】 化学合成法によって系統的に分類されたデータベース: ユーザが反応化学および処理条件によって検索を行う場合の自由度を高くするため、本発明は、化学合成法によって系統的に分類された化学情報のデータベースを提供する。 一般的には、これは、反応の種類ごとに分類された情報を意味する。 また、なんら限定するものではないが、このデータベースが、関係データベースであることが望ましい。 本発明のデータベースにおいては、種類、反応情報、反応に利用される特定の手順や方法、生成物の収率、信頼性評価によって化学反応を分類し、官能基や利用可能な合成法によって化学試薬を分類する。 たとえば、関係データベースの表において、特定の化学反応/処理情報を一次キーあるいは外部キーとして用いる。 実際、反応の種類(たとえば、還元的アミノ化反応)と反応物質あるいは生成物の組み合わせを、データベースの表で一次キーとして用いることができる。 また、反応の種類と関連する所定の反応条件(たとえば、温度範囲、溶媒の種類、圧力範囲など)をデータベースのキーとして用いることもできる。 個々のデータベース記録の属性あるいは項目として、最低でも、反応の種類や反応条件が与えられる。 当業者には自明のことであるが、数多くのデータベース・スキーマを利用して、以下に説明する機能を実現することができる。 【0024】 従来の化学データベース検索エンジンは、ユーザからの検索指示に応じて、反応形式の例を提供するものであった。 たとえば、ユーザが一般的に(たとえば、
    構造あるいは基本構造によって)エステル化反応を検索する場合、従来のシステムは、特定の順序やランク付けをすることなく、文献に基づくエステル化反応のリストを提供する。 より限定した検索条件を入力することにより、より関係の深い例、そして、望ましくは、妥当な程度に短くなったリストが提供されることになる。 ただし、構造上の条件を厳しくして検索したとしても、最も有用な情報を得られるかどうかはわからなかった。 【0025】 一例として、ユーザが従来のデータベースに下記の化学式の検索を指示したと考えてみよう。 この検索では、基本構造を用いる。 基本構造とは、ユーザの検索対象となる主要構造モチーフを定義するフラグメントである。 【化1】

    この例でいえば、検索により、生成物を調製するためにアミンフラグメントに加えられるアルデヒドフラグメントが特定される。 この場合の化学反応は、還元的アミノ化反応である。 上述したように、従来のデータベースでは、この種の検索指示に対して、基本構造フラグメントに一致するデータベース中のすべての反応(場合によっては、数百以上にのぼる)が提示される。 もっと短いリストが欲しい場合には、ユーザは、構造をより詳細に定義して、制限した検索を行わなければならない。 ユーザは、構造条件を制限することによって、もっと処理しやすい反応リストを入手することができる。 ただし、このリストは、データベースにロードされた文献に記載された反応のリストにすぎず、したがって、潜在的に価値のある反応データを見逃してしまう可能性がある。 【0026】 種類ごとに分類された化学反応のデータベースや官能基および利用可能な合成法に従って分類された化学試薬のデータベースを利用することにより、本発明は、文献に記載されている反応例のリストを提供するのみでなく、先行文献に基づいて反応の例を作成することも可能である。 これは、ユーザに直観的でない情報を提供するものであり、たとえ、ユーザがその分野に経験のある化学者だったとしても考慮しなかったであろうバリエーション(多様性)の情報を提供するものである。 【0027】 多様性の最大化: 化学合成の自動化の急速な進歩は、製薬研究に大きな影響を与えている。 自動化を生体外での(in vitro)テストと組み合わせることによって高容量スクリーニングが可能になる。 これにより、もっと大規模な化学ライブラリをテストする必要が生じ、さらに、より化学的に多様性のあるライブラリの作成が必要となる。 化合物構造の多様性は、合成プロトコルを多様化することにより実現される。


    本発明は、多様な合成プロトコルの作成を容易にするものである。 【0028】 本発明のデータベースの設計においては、文献に記載されるような完全な合成経路(反応スキーマとも称される)は、経路を構成する個々の反応に分けられる。 個々の反応は、データベース中に別個に格納されるか、あるいは、データベース中で別個の指標をつけられる。 これに対して、従来の化学データベースには、


    文献に記載された完全な合成経路のみが含まれる。 本発明は、化学反応をもっと広範囲に提示するものであり、本発明のデータベースは、個々の化学反応ステップの混合と適合を容易にし、新たな合成経路の開発につなげるものである。 従って、本発明のロジックは、先行文献からの新規な合成スキームの作成を容易にするものである。 【0029】 図1Aのブロック図101は、本発明のロジックが、先行文献に基づいて、新規な反応シーケンスを作成する処理を示す。 反応シーケンス103および105


    は、文献に記載された合成手順の2つの例を示すものであり、本発明のデータベースでは、それぞれ、別個の反応ステップにより特徴づけられる。 各ステップでは、所定の条件が設定され、そのステップが実行される。 シーケンス103は、


    ステップ107ないし115から成り、生成物117が製造される。 同様に、シーケンス105は、ステップ119ないし129から成り、生成物131が製造される。 従来のデータベースを用いた場合、適切な検索指示がなされれば、反応シーケンス103および105の個々のステップ(反応)がユーザに提示される。 しかし、多くの場合、反応シーケンスの個々のステップが提示されるというよりは、反応物質、生成物、および、2以上のステップおよび関連する処理条件の説明が、矢印と共に示されるにすぎない。 一方、本発明のデータベースにおいては、シーケンスは個々のステップによって特徴づけられ、各ステップは、反応の種類によって分類されるため、本発明のロジックは、このステップを参照して、


    周知のシーケンスを外挿して、新規なシーケンスを作成することができる。 たとえば、点線の矢印で示すように、本発明のロジックにより、ステップ107,1


    23,112,127から成る新規なシーケンス133が作成される。 この新しいシーケンスは、「混合・適合」アルゴリズムにより作成され、新規生成物13


    5を製造する。 文献によって周知となっている何千という化学変化から、数多くの新規なシーケンスを作成することが可能である。 また、詳細に後述するように、所定の処理条件、信頼性の評価、薬物動態学的パラメータなどをフィルタとして用いることにより、化学情報の確度をあげることができる。 【0030】 本発明は、また、パラレル合成にも好適に用いられ、所定種類の試薬に関する検索指示に応じて、数多くの分岐合成プロトコルを特定することができる。 図1


    Bは、合成スキーム127のシステムを示す。 本発明のロジックにより、自動的に、種々の反応スキームがユーザに提示される。 すなわち、多様性を最大にするように、数多くの反応シーケンスが提示される。 たとえば、一般的なアルデヒド138を反応出発物として入力したとする。 本発明のロジックは、138が反応して生成物を与えるのに適した合成経路を作成する。 一例として、アルデヒド1


    38は、アミン139と反応して、イミン141を生成する。 これは、アルデヒド138からの反応経路の一例にすぎない。 アルデヒド138を出発物質として、いくつもの反応が進み、様々な生成物149が製造される。 これらの生成物(


    149および141)の各々は、アルデヒド138から一段階の反応で製造される。 これらの化合物をさらに反応させて、別の生成物を製造することも可能である。 たとえば、イミン生成物141を、イミンに適合した化学反応143の出発物質として用いることもできる。 さらに、イミン141を還元してアミン145


    を生成することも可能である。 アミン145は、アルデヒド138から二段階の反応を経て得られる生成物である。 さらに、アミン145を反応させて、アミンに適合した化学反応147を実施することもできる。 このように直線的および分岐して伸びる合成プロトコルによって、アルデヒド138に由来する、大きく多様な化合物プールが作成される。 また、アルデヒド138は、アルデヒド類を示すものであり、その類に含まれる各化合物が各反応経路に従って個別の生成物を製造するため、さらに多様性が増加する。 さらに、138から得られる生成物および138と反応する反応物質も、すべて、対応する化合物類を示すものである。 【0031】 図示されるように、いずれの種類の反応物質からも多くの分岐が可能である。


    また、特に示してはいないが、図示される反応から生成される、新規で化学的に多様な中間物質および生成物自体を、合成プロトコルにおいて、アルデヒド13


    8(および、適当な経路に沿った中間物質)との反応の出発物質として用いることにより、さらに多様性を増大させることが可能である。 たとえば、138から合成されるアミン145をアルデヒド138と反応させることができる。 これは、フィードバック多様性を与えるものである。 【0032】 さらに、上記の合成プロトコルに適した反応条件を変化させることにより、多様性を増大させることができる。 たとえば、ある反応では、反応時間や反応温度によって、異なった生成物が支配的となる。 したがって、上述したように個々のステップで反応を特徴づけることにより、本発明のロジックで、反応物、中間物質、および生成物を合成ステップならびに反応条件と混合・適合させる場合の多様性を最大にすることが可能となる。 また、信頼性の評価を行うことにより、本発明の方法に付加価値を与えることができ、ユーザは、所定のシーケンスが有効である可能性に関するデータを得られる。 【0033】 処理条件および活性フィルタ: 前述したように、既存の化学ソフトウェアを使って、反応(処理)条件の範囲を限定することは容易ではない。 合成装置の限界や合成で用いる試薬や生成物の不安定性に起因した理由で反応条件を限定しなければならない場合、本発明の処理条件フィルタは、ユーザ独自の処理制限条件に応じた化学情報を提供することが可能である。 これにより、不必要な方法を研究する手間を省くことができ、時間と貴重な資源が節約できる。 さらに、反応条件フィルタを反応の種類で分類された反応データと共に用いることによって、ユーザは、特にパラレル合成装置に対する制限に基づいた新しいライブラリを設計可能である。 たとえば、室温かつ不活性雰囲気の不在下で反応する装置がある場合、これらを反応制約条件として入力することができる。 さらに、反応物質や生成物に関する制約を入力することもできる。 たとえば、反応出発物質となる試薬は、第二級アミンとするなどである。 化学者(ユーザ)がこれらの制約条件を入力することにより、室温で、かつ、不活性雰囲気の不在下で進む第二級アミンの反応のリストが(文献に由来するもの、並びに、ロジックから作成されたものを含めて)提供される。 【0034】 また、反応をその種類ごとに分類することが可能なため、同じ種類の反応を見つけるために、ユーザが手作業でリストを厳密に調べる必要性はない。 すなわち、本発明で提供されるリストあるいはリストから選択されるサブセットに含まれる反応を用いて合成された化合物から成る化合物ライブラリが作成される。 また、データベースに含まれる反応は種類ごとに分類されているため、その反応を構成する反応物質や生成物も種類ごとにタグがつけられている。 これは、アルデヒド、ケトン、アミンなど、所定の種類に属する各試薬に、データベースで標識(


    タグ)がつけられていることを意味する。 ユーザは、反応リストに含まれる試薬タグを集めて、所定の種類の試薬を含むリストを作成することができる。 このように構成することにより、試薬を、ライブラリ合成でより簡便に利用し、種類ごとに保存することができる。 たとえば、酸塩化物には揮発性のものも多く、冷却保存や換気が必要となる。 また、もっと害の少ない試薬は、より緩和された保存プロトコルに従って、保存することができる。 【0035】 本発明のソフトウェアツールは、化合物が所定のレベルの活性を備えることをフィルタとして用いることもできる。 このようなツールの例として、ファーマコフォア解析およびSARツールが挙げられる。 これらのツールを用いることにより、たとえば、標的との結合に基づく効果を予測することが可能となる。 また、


    他のツールを用いて、ADMET(吸収、分配、代謝、排泄、毒性)特性を予測することもできる。 一つのソフトウェアツールで提示された化合物を、構造から活性を予測する一つあるいは複数のフィルタツールを用いて解析する。 提示された化合物の予想活性がフィルタで指定された活性閾値に合致しない場合には、この化合物を却下するようにしてもよいし、あるいは、システムによる優先順位を低くするようにしてもよい。 【0036】 ADMET関連フィルタでは、たとえば、標準的な経験則に応じて、可能性のある化合物を選択するようにしてもよい。 製薬会社は、通常、経口投与可能な薬剤を求めている。 これは、経口投与が一般に最も受け入れられやすい形態であり、経口投与可能な薬剤は、「錠剤」の形に製造し、投与することが可能だからである。 いずれの化合物も、経口投与可能な薬剤候補となりうるかどうかを考慮する前に、薬物動態学的特徴を測定する必要がある。 利用可能な薬理学的データから、構造パラメータの関数として化合物の生体利用効率を求める法則を公式化することができる。 この法則は、「リピンスキの5の法則」として知られており、


    内臓壁を通した化合物の体内への吸収を、化合物の分子量、ヘテロ原子の数、親油性等と一般に相関させるものである。 この法則およびその他の構造予測に関連する薬理学的傾向をユーザは追加フィルタとして利用可能であり、化合物あるいは化合物ライブラリの設計に別の価値を与えることができる。 この構成により、


    ユーザに信頼性データと関連づけた合成データを与えるのみでなく、信頼性の高い反応化学をフィルタとして、薬理学的に適切な化合物のみを作成させることができる。 これは、貴重な化学および薬理学的資源の節約につながる。 【0037】 信頼性評価: 本発明の一態様として、化学反応や反応物質の信頼性評価を行うことができる。 既知の信頼できる化学反応データ、ピア・レビューされた化学文献、進行中の信頼性試験に基づいて、化学反応および反応物質と、関連する信頼性データとの対応表を作成する。 これらのデータは、信頼性評価、すなわち、再現性、適切な処理条件の範囲、収率等に基づく反応のランク付けの基礎となる。 【0038】 前述したように、本発明は、先行文献に基づいて反応例を作成することができる。 このアルゴリズムに信頼性データを組み込むことにより、所定の反応化学が有効な信頼限界をユーザに提供することができる。 たとえば、許容可能な所望の信頼性レベルをフィルタとして入力するようにしてもよい。 この場合、出力されるリストに含まれる反応は、許容可能な信頼性評価を満たす反応のみになる。 すべての反応を、反応の種類のみでなく、ソースによっても、すなわち、文献に記載された反応例か本発明のロジックにより作成された反応であるかを、分類するようにしてもよい。 ロジックにより作成された反応データには、外挿されたエラー確率因子を考慮した信頼性評価が含まれている。 【0039】 信頼性評価は、ユーザにとって、化学反応全体を記述する指標として重要なだけでなく、所定の反応出発試薬を用いる場合にユーザが利用可能な反応の種類を特定する予測指標としても重要である。 たとえば、最初の検索指示に応じて、反応を実際に検索あるいは作成することなく、複数種類の反応を確実に行うことのできる所定の前駆物質あるいは所定種類の前駆物質を提示する。 ユーザは、予測情報を利用して、自分のライブラリ設計プランにより適切なもの、たとえば、その時点で入手可能だと考えられる試薬のみを提示するように、次の検索指示を調整する。 【0040】 化学データベースおよびエキスパート・システムを進化させるためのフィードバックシステム: 本発明の別の態様として、エキスパート・システムと人工知能を利用することができる。 人工知能のルーツは、コンピュータ・インテリジェンス用の有名なチューリング・テスト(Turingテスト)に遡ることができる。 基本的な必要条件は、コンピュータが思考できるかどうかを問うのではなく、一連の質問に対して、


    質問者がタイプで打った答えを作成したのが人間であるのかコンピュータであるのかを判定できるかどうかという、もっとテストしやすい問いである。 この分野における初期の研究の成果は、最初は1963年にマグローヒル出版社から出版された古典的な本「コンピュータと思考」("Computer and Thought" AAAI Pres


    s Edition, 1995, Menlo Park )に記載されている。 この引例全体を、本明細書中において、参照して、組み込む。 【0041】 皮肉なことに、AIを用いた最初の応用例(エキスパート・システム)の一つは、質量分析データに基づいて分子構造の同定を支援するデンドラル・プロジェクトであった。 デンドラル・プロジェクトでは、フェイゲンバウム、レーダーバーグ、ブキャナン、およびジェラッシの間で共同研究が始められ、化学構造の高準な解明が行われた。 分子式、分光学的データ、有機化学者のコード化された発見的知識を与えると、デンドラルの対話型プログラムが、正しい構造を検索する過程で、可能な分子の立体配置を調査する。 このプロジェクトは、仮説形成と評価の基本的なメカニズムの一部を解明する手助けとなった。 プロジェクトの結果、これらのシステムでは、知識が推論と同じくらい重要であることが示された。 いずれにしても、今日では、成功の度合いこそ様々であるが、人工知能を利用したエキスパート・システムの作成は頻繁に行われている。 【0042】 エキスパート・システムは、限られた分野で、人間の専門家(エキスパート)


    の意志決定過程を再現する試みである。 これは、知識ベース、決定ルール、推論機構という、3つの構成要素から成っている。 上述したデータベースおよび知識ベースは、本発明のエキスパート・システムで利用可能である。 開発途上の技術のいずれにも言えることであるが、適切な問題なくしては、その技術は学問的な試みにとどまる。 本当の有用性は、その技術(本発明では、人工知能とコンビナトリアル・ケミストリの発展型技術)が所定の問題に対してどう適用されるかで示される。 【0043】 本発明のデータベースに対するフィードバックを目的とした最適化に利用可能な先進技術の例として、ウェブ産業技術、マルチエージェント・チーム、ヒト/


    コンピュータ・インターフェース、およびフレキシブルな仮説空間における帰納的学習が挙げられる。 MITのCBCLおよびAI研究所が共同開催した「脳と機械セミナー2000年春」2月23日トム・ミッチェル「標識されていないデータからの監視学習」(Tom Mitchell "Supervised Learning from Unlabeled D


    ata")、Kaminka, GA, Tambe, MJ Artificial Intelligence 2000, 12, 1


    05-147、「情報システムにおけるヒューマン ・ファクタ:ある組織的展望」("


    Human Factors in Information Systems: An Organizational Perspective")J


    . M. カーリー編、ニュージャージー州ノーウッド、アブレックス出版社199


    1年、「帰納的バイアス学習のモデル」("A Model of Inductive Bias Learnin


    g")J. Artificial Intelligence 2000, 12, 149-198参照。化学データベースの推論機構にこのような先進技術を利用する場合、少なくとも最初のうちは、人による検査や調整を必要とする。これらの引例は、それぞれ、本明細書中において、参照し、組み込む。 【0044】 本発明のシステムのいくつかは、(最も一般的で信頼性の高い合成法である)


    コンビナトリアル・ケミストリから始められた、科学者チームと人工知能の能力とを用いて、情報データベースを成長させ、情報データベースを検索するものである。 これらのシステムは、両方のグループの学習を手助けするフィードバック・ループを採用している。 各ステップの関連度を維持するように、所定の仕事に対してどちらがより適しているかが明らかになるまで、人間とコンピュータプログラムとが情報の評価と補正を行う。 この場合、両方のチームは、情報を交換することにより、協力し合い、かつ、競争する。 各段階で、情報システムが実用的であれば実際の役に立つ(たとえば、ライブラリや個々の化合物の合成)。 【0045】 システムを拡張する鍵となるのは、システムをオープンにして外部のグループと相互利用可能にすることである。 データベースの開発、検索エンジンの開発、


    (AIおよび化学の両方に関する)基礎技術の開発、および、他のデータベースとの交流等に、このアプローチを利用することができる。 このアプローチの典型例がインターネットである。 こうすれば、内容、基礎研究、ソフトウェア・アーキテクチャに、第三者が寄与することができる。 ソフトウェア・アーキテクチャには、提案と付加的寄与のフィルタが含まれる。 【0046】 書物は、固定的なデータベースである。 書物には、情報が含まれているが、いったん印刷された後には、その内部構造を進化させることはできない。 中間的なレベルのものとしては、ソフトウェア・データベースが挙げられる。 ソフトウェア・データベースは、複数の選択可能な選択肢や質問に対する回答を提供する。


    本発明の、より先進的なエキスパート・システムは、フィードバック・ループにより継続的に進化を続ける。 たとえば、(以下に参照して組み込まれる)エレクトロニック・コンビナトリアル・インデックス由来の化学情報から元々構成されていたデータベースを進化させて、より大きなものにすることができる。 コンビナトリアル・ケミストリは、合成のサブセットであり、合成は、薬剤開発の一断面であり、薬剤開発は、化学および生物学の一断面である。 関係アーキテクチャは、多段階の手順・処理(情報)と出力(サービス)の両方を備えている。 胎児の脳が発達していくように、使えば使うほど、また、外部との接続が増えれば増えるほど、内部の接続が強固なものになっていく。 【0047】 進化の階層において、中心位置は、一連の信頼性の高いハイスループット・コンビナトリアル合成法で占められている。 これは、すべての合成法とコンビナトリアル合成との関係に類似している。 前述したように、コンビナトリアル合成は、広範囲の官能基に対して対応可能という特質を備えるため、最も一般的で、便利で、且つ好適な合成法である。 コンビナトリアル法に関する文献にあるように、中心位置は時間と共に成長していくが、化学合成の成熟した分野にも触を伸ばしていくことにより、データベースの真の成長が成し遂げられる。 【0048】 第二の位置は、最も広く用いられている化学文献の中から慎重に選択されたものが占めている。 主要文献に記載されている手順や処理が、もっと一般的なハイスループット合成法との関係とともに、第二位置に含まれている。 なんら限定するものではないが、以下に、第二サークルに適当な参照文献の例を挙げる。 「マーチの最新有機化学:反応、メカニズム、および構造」第五版("March's Advan


    ced Organic Chemistry: Reactions, Mechanisms, and Structure")Smith, MB


    ., March, J.、ジョン・ワイリー&サンズ社、ニューヨーク、2001年、「有機合成における保護基」("Protective Groups in Organic Synthesis")Wuts,


    PGM, Greene, TW、ジョン・ワイリー&サンズ社、ニューヨーク、1999


    年、「ペプチド合成法」("The Practice of Peptide Synthesis")Bodanszky,


    M., Bodanszky, A.、シュプリンガー出版、ハイデルベルグ、1984年、「有機合成試薬辞典」("Encyclopedia of Reagents for Organic Synthesis")L.


    A. パケット編、ジョン・ワイリー&サンズ社、英国チチェスター、1995年。 人間とコンピュータプログラムの両方が簡単にアクセス可能なように、また、


    著作権による規制を避けるためにも、文献に記載されている事実や情報は、すべて、共通の簡単な書式に再フォーマットされる。 なんら限定されるものではないが、以下の文献も第二サークルに含めてもよい。 「有機合成」("Organic Synth


    eses")J.P.フリーマン編、ジョン・ワイリー&サンズ社、「有機反応」("


    Organic Reactions")L.A.パケット編、ジョン・ワイリー&サンズ社、「複素環式化学概論」(Comprehensive Heterocyclic Chemistry")Katritzky, AR


    、ペルガモン出版。 本段落に記載した文献は、それぞれ、全体として、本明細書中に引用され、組み込まれる。 【0049】 第三サークルには、最初の二つのサークルに含まれていた主要参照文献を含むようにしてもよい。 これにより、場合によっては、文献の鎖が形成される。 また、第四サークルには、定期刊行物中の化学文献の一部あるいはすべてを系統的に再構成したものを含むようにしてもよい。 共通のフォーマットで情報を再構成すれば、エンドユーザにはとても便利である。 これは、一見すると、ケミカル・アブストラクトによるフォーマッティングに似ているようであるが、手順・処理に重点を置いている点、および/あるいは、手順・処理をサービスに関連づけている点、さらに、手順・処理を進化するデータベースの一部としている点で異なっている。 共通フォーマットで構造情報および反応情報を格納することにより、化学者もAIプログラムも、システムを改善して、関係を作り出す処理に慣れることができる。 人間の専門家が新しい関係を見つけるたびに、コンピュータプログラムにそれが通知され、また、逆の場合も同様の通知が行われる。 【0050】 内部サークルの情報量があるレベル以上に増えなくなった時点で、外部データベースを導入するようにしてもよい。 好適な検索エージェントをプロジェクトの初期段階で用いて、他のデータベースを検索するようにしてもよいし、その逆でもよい。 この場合、実用性の鍵となるのは、データベースの構成と検索エンジンの簡便さ(と非常に高い自由度)である。 さらに、システムが検索エージェントを備え、情報を検索するようにしてもよい。 化学データベースの掘り起こしに関しては、人工知能プログラムによる誘導と人間の専門家による誘導の両方が行われる。 【0051】 本明細書に記載したデータベースの構成、表示、および使用法は、関連する知識分野にも関連しない知識分野にも適用可能である。 【0052】 補助的特性: 信頼性評価と共に合成手順等の情報を提供する以外に、本発明の化学情報ツールは、様々なサービスを含めた種々の補助的特性も有している。 一回クリックするだけで、「リスクを分かち合う」可能性からも通関手続きからも開放され、すべての化学情報を見ることができる。 サービスとしては、なんら限定するものではないが、個々の化合物、小規模ライブラリ(10ないし100のブックエンド・ライブラリ)や大規模ライブラリ(1000ないし100,000)の提供が挙げられる。 【0053】 ツールの備える全般的多様性や標的ライブラリを用いて、実際のライブラリや仮想ライブラリの第一世代を提供することができる。 ライブラリには、後続ライブラリを記述するSARツリー用のソフトウェアを搭載するようにしてもよい。


    また、他のソフトウェアを用いて、既知構造の情報に基づいて後続ライブラリを記述するSARツリーにバイアスを掛けることも可能である。 また、同一の反応に関する後続ライブラリ(科学的にも物流的にもこれが最も簡単なアプローチではあるが)の代わりに、ソフトウェア・プログラムおよび/あるいは人間が、信頼性評価を行った広範囲な化学反応の中から、多様な、あるいは、標的となる、


    ライブラリとそのサービスのセットを選択するようにしてもよい。 【0054】 たとえば、平均して2000個の化合物(2Dライブラリ)および6000個の化合物(3Dライブラリ)から成る各セットに、SARに基づく第二世代ライブラリ用のオプション、あるいは、顧客がSARを隠すことを希望する場合には、(分割・混合フォーマット等を用いて)完全に断片化したライブラリを備えるようにしてもよい。 人間とAIチームは、協力し、かつ、競争しながら、反応条件最適化およびSAR最適化の問題を解決することができる。 【0055】 情報パッケージを、クロスリファレンス・ネットワークに接続して、合成に関係する化合物のセットを提示するようにしてもよい。 たとえば、マーチの有機化学の書物の一部から、所定の反応条件を提示する一連の文献を導き出すようにしてもよい。 コンピュータも人間も「主要文献」のパターンを見つけ出すことができる。 上述したように、このパターンが、信頼性の評価と関連するものでもよい。 出力されるデータは、望ましくは、ベイルステイン等、既存の化学データベースにより提供される文献、言葉、スキームを含む。 さらに、手順ならびに、(リスクを分かち合う可能性につながる)顧客向けに作成され配信された文献に、ある化合物が記載されている可能性等に関する追加データも出力可能である。 顧客は、情報のみの利用、合成サービスのみの利用、2つを組み合わせての利用を自由に選択できる。 【0056】 情報およびデータベースサービスを拡張して、分析データ(理論データおよび/あるいは実験データ)、分子に関する構造データ、もっと複雑な問題に関する生体構造データ、化学薬品発注情報、ウェブ提供情報などを含むようにしてもよい。 これらは、すべて、薬剤開発の関連分野である。 【0057】 外部データを活用するオープンなシステムを実用化した例も数多くある。 化学の分野では、最近の例として、(ノースカロライナ州リサーチトライアングルパークの)SciQuest、(カリフォルニア州サンディエゴの)ChemNavigator 、(マサチューセッツ州ケンブリッジの)Cambridge Softのウェブポータルが挙げられる。 歴史的には、アルドリッチ・ケミカル社のカタログがあり、これには、顧客にとってはどちらでも同じことであるが、他社から購入し瓶詰めしなおした化学薬品や自社で製造した化学薬品のリストが記載されている。 適度な範囲として、


    本発明が提供可能なサービスは、顧客の要求範囲を考慮して、適当な解決に向けて、合成情報の世界的データベースを検索するものである。 【0058】 情報をサービスと関連づける別の方法として、文献に記載されている構造基準に基づいて(C.LipinskiらおよびM.Murckoら参照)、自由度の高い前駆物質のセットを構成するようにしてもよい。 ライブラリ作成(上述したような個々のライブラリあるいはライブラリ群の両方)のために、一定の、かつ、比類なく高い自由度をあたえるように入力データ変数を配列することにより、このような構造基準を構成することが可能である。 たとえば、前駆物質を、業界標準である96穴マイクロタイタープレート等のグリッドの行と列に配列することも可能であるし、バーコード化することも可能である。 内部利用あるいは外部利用に先立ち、溶解度データ、信頼性評価(+/−あるいは1−10)、芳香族/脂肪族、多様/


    標的、疎水性/親水性、アルファ/ベータ置換、o−、m−、p−置換、環の大きさ、二環式/溶融等の補足情報を前駆物質のセットに追加するようにしてもよい。 顧客は、ソフトウェアツールを用いて選択を行うこともできるし、自前で選択をすることもできる。 前駆物質のサブセットを用いて自社の研究所(一つの場所)で反応化学をテストした後、適当な前駆物質の入力データを慎重に予備配列および予備選択することにより、サービス・プロバイダに全ライブラリ(第二の場所)を作成させることも可能である。 このような前駆物質セットの予備配列により、新しい反応化学に対する前駆物質の適合性に関して、「リスク分担の」可能性の調査を迅速かつ容易に実施することができる。 【0059】 合成情報と構造的に関係する前駆物質のセットとを予備的に分類することにより、さらに自由度の高い化学サービスを提供することが可能になる。 これには、


    個々の化合物の合成から、小規模なセット(ブックエンド)、大規模なセット(


    全ライブラリ)までが含まれる。 理にかなうように配列された自由度の高い化学情報を備える大規模なデータベースあるいはエキスパート・システムがあれば、


    非常に広範囲なサービスの提供が可能となる。 他の関連分野あるいは非関連分野に対しても、この指針は適用可能である。 【0060】 ソフトウェア/ハードウェア: 本発明の実施態様では、一つないし複数のコンピュータシステムに格納されるデータ、あるいは、コンピュータシステムを介して送信されるデータの様々な処理が行われる。 また、本発明の別の実施態様は、このような処理を実行する装置に関するものである。 この装置は、必要な目的のために特別に構成されるものでもよいし、あるいは、コンピュータに格納されたコンピュータプログラムおよび/あるいはデータ構造により選択的に駆動され、再構成される汎用コンピュータでもよい。 本発明の処理は、いかなる特定のコンピュータにも、あるいは、それ以外の装置にも特有のものではない。 本明細書の技術に従って書かれたプログラムと共に、種々の汎用装置を利用するようにしてもよいし、あるいは、所望の処理工程を実現するために専用装置を構築するようにすれば、さらに便利である。


    このような様々な装置の構造例に関しては、以下に詳述する。 【0061】 さらに、本発明の別の実施態様は、コンピュータに種々の処理を実現させるためのプログラム命令および/あるいは(データ構造を含む)データを備える、コンピュータ読み取り可能な媒体やコンピュータプログラム製品に関するものである。 なんら限定するものではないが、コンピュータ読み取り可能な媒体の例としては、ハードディスク、フレキシブルディスク、磁気テープ等の磁気媒体、CD


    −ROMディスク等の光学媒体、光磁気媒体、半導体記憶装置、リード・オンリー・メモリ(ROM)やランダム・アクセス・メモリ(RAM)等、プログラム命令を格納し、実行するように特別に構成されたハードウェア装置が挙げられる。 また、本発明のデータおよびプログラム命令を、搬送波や他の輸送媒体に具現化するものでもよい。 プログラム命令は、コンパイラによって作成されるようなマシンコードでもよいし、インタープリタを利用してコンピュータで実行可能な、高レベルのコードを含むファイルでもよい。 【0062】 図2に、適切に構成・設計された場合に、本発明の画像解析装置として働く典型的なコンピュータシステムの概略ブロック図を示す。 コンピュータシステム2


    00は、任意の数のプロセッサ202(中央処理装置、CPUとも称する)と、


    プロセッサに接続される、一次記憶装置206(典型的にはランダム・アクセス・メモリ、RAM)と一次記憶装置204(典型的にはリード・オンリー・メモリ、ROM)を含む記憶装置と、を備える。 CPU202は、マイクロコントローラでも、マイクロプロセッサでもよく、(CPLDやFPGAのような)プログラム可能な装置でも、ゲートアレイASICや汎用マイクロプロセッサのようなプログラム不能な装置でもよい。 当業者に周知のように、一次記憶装置204


    は、CPUにデータおよび命令を単方向に送信可能であり、一方、一次記憶装置206は、通常、データおよび命令を双方向に送信可能である。 これらの一次記憶装置が、上述したような、任意の適当なコンピュータ読み取り可能な媒体を備えるようにしてもよい。 大容量記憶装置208もCPU202に双方向に接続され、データ記憶容量を増大させ、また、上述したような、任意のコンピュータ読み取り可能な媒体を備えるようにしてもよい。 大容量記憶装置208には、プログラム、データ等が格納され、一般的には、ハードディスクをはじめとする二次記憶媒体に対応する。 必要に応じて、大容量記憶装置208内部に保持される情報を、仮想記憶として、一次記憶媒体206の一部として標準的な方法で組み込むことができる。 さらに、CD−ROM214のような特定の大容量記憶装置は、データをCPUに単方向に転送可能である。 【0063】 CPU202は、さらに、一つあるいは複数の入力/出力装置に接続されたインターフェース210に連結される。 入力/出力装置の例としては、ビデオモニタ、トラックボール、マウス、キーボード、マイクロフォン、タッチセンシティブ・ディスプレイ、トランスデューサ・カードリーダ、磁気あるいは紙テープリーダ、タブレット、スタイラス、音声あるいは手書き文字認識装置、他のコンピュータ等、その他周知の入力装置が挙げられる。 さらに、CPU202が、データベースやコンピュータ等の外部装置に接続されるようにしてもよいし、図に2


    12で示される外部接続を用いて、電気通信ネットワークに接続されるようにしてもよい。 このように接続することにより、CPUは、ネットワークから情報を入力することができ、さらに、本明細書に記載される処理ステップを実行する際には、ネットワークに情報を出力することも可能である。 【0064】 コンピュータシステム200を、本明細書に記載したように構成される化学情報用のデータベースならびにデータベース管理システムとして構築するようにしてもよい。 化学情報は、種々のソースから得られる。 リモート化学情報ソースからは、インターフェース212を介して、システム200に情報が提供される。 【0065】 装置200においては、一次記憶装置206あるいは大容量記憶装置208のような記憶装置に化学情報が格納される。 さらに、データを解析し、提示するための種々のルーチンおよび/あるいはプログラムを記憶装置が格納するようにしてもよい。 このようなプログラム/ルーチンには、データベース管理システムや、新しい化学情報をデータベースに追加するためのプログラムや、データベースの性能を改良するためのツール等が含まれる。 【0066】 コンビナトリアル・ケミストリの概要: 以下の説明は、一般に広く用いられている、コンビナトリアル・ケミストリに関するテキストである「コンビナトリアル・インデックス」("The Combinatori


    al Index")Bunin, BA、1998年、アカデミック出版の最初のほうの章の記載に基づくものである。このテキスト全体を、本明細書において引用し、組み込む。 【0067】 非生物学的オリゴマーおよび非重合体性有機化合物(「小分子」)のライブラリの合成およびスクリーニングは、集中的な研究の対象となっている。 現在、固相合成を利用して、多くのコンビナトリアル・ライブラリが構築されている。 担体上で進む反応の多くは、高収率であるが、コンビナトリアル・ライブラリの構築に利用するのに充分有効で一般的なものにするためには、多くの場合、大幅な最適化が必要となる。 置換、環化、濃縮、スズキ式カップリング等、信頼性の高い反応方法は、様々な状況で利用可能であるため、特に本発明に有用である。 【0068】 溶液中で利用可能な技術と比較すれば、固体上で利用可能な分析および精製技術は限られたものであるため、固体担体上で有機化学反応を行うのは、目隠しをして作業するようなものである。 これが、溶液中でのライブラリ構築が好まれる理由の一つである。 担体上で所定の反応条件を評価する最も直接的な方法は、担体上で原料を分解して、得られた生成物を厳密に特徴づける方法である。 しかし、残念ながら、中間物質が開裂条件に対して不安定な場合も多いので、この方法がいつも可能なわけではない。 さらに、特に多段階シーケンスでは、多くの場合、所定の反応が有効であったか否かを判定するのに、もっと速い方法が存在する(FMOC評価)。 【0069】 溶液ライブラリに関する報告は、増え続けている。 ライブラリが、担体上で作成されるか、溶液内で作成されるかは、多くの場合、生じた化学反応の種類により決定される(あるいは、逆に言えば、ライブラリが担体上で作成されるか、溶液内で作成されるかによって、生じる化学反応の種類が決定される)。 固相抽出や液相抽出のようなハイスループットな精製技術が、スクリーニングに有用な溶液ライブラリの作成に重要な役割を果たすことも多い。 溶液ライブラリを構築する場合の課題(たとえば、溶解度や精製度)は、固相でのコンビナトリアル合成に伴う課題(たとえば、反応の進行やスケールアップのモニタ)とは、まったく異なっている。 ライブラリ作成のための戦略は液相と固相で多くの相違があるが、いずれの場合にも、合成の際に問題と成るのは、一般的で、かつ、高い収率を得られる反応条件を見つけることである。 【0070】 コンビナトリアル合成の目立った特徴は、比較的少数のビルディング・ブロックから大きな多様性が生み出されることである。 3種類のビルディング・ブロックA、B、Cから、固体担体上で形成される簡単なコンビナトリアル・ライブラリを例としてみてみよう。 各ビルディング・ブロックがたった10個の誘導体しか持たない場合でも、1000個の三量体から成るライブラリが形成される。 各ビルディング・ブロックの誘導体の数が100個になれば、誘導される化合物の数は、1,000,000個になる。 このように膨大な数の化合物に短時間でアクセスできるようになると、次に、いずれの化合物を製造するのが最も有効か、


    そして、作成された膨大な情報のトラックをどのように維持するか、というような問題が生じる。 【0071】 現在、生体外(in vitro)でコンビナトリアル・ライブラリを作成するためのアプローチは数多く存在する。 化合物は、空間的に分離された形態で合成することもできるし、混合物のプールとして合成することもできる。 混合物プールの中から活性のある化合物を特定する方法も、数多く提案されている。 当然のことながら、化合物を空間的に分離した形態で合成した場合には、活性のある化合物を特定することは容易である。 【0072】 ライブラリ解析のための最も単純なアプローチは、異なった化合物(あるいは他の変数)をパラレルに配列させて、空間的に分離しておくことである。 化合物を空間的に分離しておく手法の主な利点は、化合物プールとして形成した場合に生じるあいまいさの何割かを除去できることである。 化合物が空間的に分離されている場合には、生物学的評価から直接的な構造活性相関が得られる。 また、化合物が空間的に分離されている場合には、化合物の化学的整合性の解析的評価も簡単になる。 空間的に分離したライブラリの主な欠点は、合成可能な化合物の数が限定されることである。 【0073】 最初のコンビナトリアル・ライブラリは、1984年、ガイゼンおよびその共同研究者によって、空間的に分離された形態で作成されたGeysen, HM, Meloen


    , RH, Barteling, SJ, Proc. Natl. Acad. Sci. USA. 1984, 81, 3998-4002


    。 彼らは、固相ペプチド合成およびエピトープ(抗原決定基)解析のための機能ピンを開発した。 ピンは、96穴マイクロタイタープレートに合致するように作られていた。 ピン法は、他の分野の化学にも適用可能なように、様々なポリマーを利用する、ローディング・レベルを上げる、機能リンカーを利用するなどの手法で、改良されてきた。 アフィマックスのフォーダーおよびその共同研究者は、


    シリコンウェハー上で大きなライブラリを構築するフォトリソグラフィ法を開発したFodor, SPA, Read, JL, Pirrung, MC, Stryer, L, Lu, AT, Solas


    , D., Science 19991, 251, 767-773 。 この方法で、空間的に分離された大規模なライブラリ(100,000個の化合物から成る)を形成することができる。


    ただし、この方法は、光変化しやすい保護基と担体に結合した状態でのバイオアッセイが必要となるため、現在では、主に、DNA診断テストに用いられている。 樹脂上で、また、溶液中で、空間的に分離されたライブラリを作成するための新しい技術も、数多く、開発されつつある。 【0074】 化合物プールを用いた場合の戦略も、種々提案されてきた。 この中で最も古いものは、フルカ、ラム、ホートンによって独立に開発された手法で、スプリット混合法を用いて、ペプチドの混合物プールを作成するものであった;Furka, A.,


    Sebestyen, F., Asgedom, M., Dibo, G., Int. J. Pept. Protein Res. 1991,


    37, 487-493:Lam, KS, Salmon, SE, Hersh, EM, Hruby, VJ, Kazmiers


    uki, WM, Knapp, RJ, Nature 1991, 351, 82-84:Houghten, RA, Pinilla


    , C., Blondelle, SE, Appel, 7,R., Dooley, CT, Cuervo, JH, Nature 1


    991, 354, 84-86 。 スプリット合成では、ある量の樹脂を同量ずつ分けて、別々の反応容器に入れて、それぞれ、別々のモノマーと反応させる。 反応が完了した後、樹脂を集めたプールを作り、完全に混合する。 次に、一つの反応容器内で、


    共通の保護基を外す、あるいは、共通の形質転換を行う。 第二のモノマーとカップリングさせるために、樹脂を再び分ける。 コンビナトリアル合成が終了するまで、この処理を繰り返す。 活性化アミノ酸など、種々のビルディング・ブロックとカップリングさせるためには、樹脂を別々の反応容器に分けて、異なった反応速度で反応を完了させる必要がある。 【0075】 スプリット合成によって作成されたライブラリから、生物学的に活性な化合物を特定するための手法も、種々提案されている。 反復合成や小さなプールの評価等を行うデコンヴォルーション法により、化合物プールの中から活性な化合物を単離することができる。 各ステップで樹脂の一部を取っておき、反復合成を容易にするようにしてもよい。 オルトゴナル・ライブラリ、ポジショナル・ライブラリ、インデックスド・ライブラリでは、必要なデコンヴォルーションの量が最小になるプール手法が用いられる。 【0076】 元々はペプチド合成のために開発されたコンビナトリアル法は、人工バイオポリマーや小さな分子のコンビナトリアル合成にも用いられてきた。 たとえば、多様なペプトイド・ライブラリのスプリット合成から、7−膜貫通−G−タンパク質結合レセプター(7TM/GPCR)が同定された。 【0077】 スプリット合成が完了した時点では、理論的には、個々のビーズが単一の生成物を含んでいるはずである。 これは、いずれのビーズでも、そのすべての部位において、同じ合成試薬によって処理されるためである。 時間をくう反復合成に頼ることなく、バイオアッセイで活性な化合物を同定するために、「ワンコンパウンド・ワンビーズ」手法が開発された。 担体に結合した化合物のアッセイでは、


    放射性同位体で標識されたレセプターあるいは蛍光物質で標識されたレセプターと結合させて、単一の樹脂ビーズから活性化合物を同定する。 担体上で活性化合物を検出・単離した後、担体結合ペプチドを同定するエドマン分解等の方法で、


    単離された活性化合物の化学構造を決定するようにしてもよい。 溶液中で生物学的評価を行うために、担体から化合物を部分的に解離させる方法も開発された。


    生物学的評価の後、樹脂ビーズ上に残った化合物を構造決定に用いることもできる。 【0078】 分子タグ法は、スプリット合成で作成されたライブラリから活性化合物をデコンヴォルーションするための別の手法である。 この手法では、反応シーケンスをエンコードする読み取り可能なタグを樹脂につける。 生体内で自然に行われていることからもわかるように、DNAは、明らかにエンコードの標的となる。 しかし、残念ながら、有機合成で通常用いられている反応条件の多くの下では、DN


    Aは、化学的に安定ではない。 この問題を避けるために、比較的不活性な側鎖、


    あるいは、通常用いられる反応条件の多くに対して不活性なGC−ECタグを有するアミノ酸から合成されるペプチドをエンコードに用いた。 スティルおよび共同研究者によって開発されたGC−ECタグの利点は、0.1pmol 未満の量で検出可能であり、カルベン反応により直接ポリスチレンにつけられることである;Oh


    lmeyer, MH, Swanson, RN, Dillard, LW, Reader, JC, Asouline, G.,


    Kobayashi, R., Wigler, M., Still, WC, Proc. Natl. Acad. Sci., USA. 199


    3, 90,10922-10926 。 すなわち、この方法は、オルトゴナルな保護処理を必要としない。 また、樹脂上でライブラリをエンコードするための別の方法として、ラジオ周波数タグ法も開発された。 遺伝的アルゴリズムをはじめとして、コンビナトリアル・ライブラリを作成し、生物学的活性を最適化するための種々の手法が、現在、研究されている。 【0079】 ライブラリが作成される形態と、少なくとも同程度に重要なのは、アクセス可能な化合物の種類である。 本発明は、その一つの態様として、「コンビナトリアル・インデックス」("The Combinatorial Index" )から得られた化学反応情報を、ソフトウェア製品やサービスに拡大するものである。 本発明は、また、あらゆる合成化学を組み入れるように、コンビナトリアル・ケミストリに関する初期のデータベースを拡張するものである。 さらに、ソフトウェア・パッケージの一部として、自由度の高いサービスを組み込んだことも、その大きな特徴である。


    また、データベースを進化させる手法も、その態様の一つである。 これは、人工知能の新しい分野とも密接に関連している。 【0080】 結語: 以上、本発明を所定の処理や装置に従って説明したが、本発明は、広範囲に適用可能である。 特に、本発明を、コンビナトリアル・ケミストリおよび化学合成経路の観点から説明したが、これは、なんら本発明をこれらの分野に限定するものではない。 本明細書に記載したデータベースやソフトウェアシステムは、薬剤開発や構造生物学の分野に広く適用可能であり、さらに、心理学、法律、エンジニアリング、建築、ジャーナリズム、経済、歴史、ビジネス、エレクトロニクス、インターネット等、他の分野にも適用可能である。 また、当業者には自明のことであるが、それ以外の変更、修正、変形も可能である。 【図面の簡単な説明】 【図1A】 本発明のロジックにより、新規の反応シーケンスを作成する過程を示すブロック図である。 【図1B】 本発明のロジックにより、多様性を最大にするための反応シーケンスをユーザに提供する過程を示す合成スキームである。 【図2】 本発明の種々の形態を実現するために利用可能なコンピュータシステムの概略を示すブロック図である。 【符号の説明】 103…シーケンス 105…シーケンス 117…生成物 127…合成スキーム 131…生成物 133…シーケンス 135…新規生成物 138…アルデヒド 139…アミン 141…イミン 143…化学反応 145…アミン 147…化学反応 149…生成物 200…コンピュータシステム 202…CPU 204…一次記憶装置 206…一次記憶装置 208…大容量記憶装置 210…インターフェース 212…インターフェース 214…ROM

    ───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CR,CU,CZ,DE,DK ,DM,DZ,EE,ES,FI,GB,GD,GE, GH,GM,HR,HU,ID,IL,IN,IS,J P,KE,KG,KP,KR,KZ,LC,LK,LR ,LS,LT,LU,LV,MA,MD,MG,MK, MN,MW,MX,MZ,NO,NZ,PL,PT,R O,RU,SD,SE,SG,SI,SK,SL,TJ ,TM,TR,TT,TZ,UA,UG,US,UZ, VN,YU,ZA,ZW Fターム(参考) 5B075 MM01 MM04 MM11 ND20 ND34 PP02 PP03 PP04 PP07 PQ02 QT06 UU18 UU40 【要約の続き】 あるいは人工知能システムからのフィードバックにより、絶えず改良・改善可能なように設計されることが望ましい。

    QQ群二维码
    意见反馈