首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 组合化学;化合物库,如化学库、虚拟库 / 库本身,如阵列、混合物 / System representing the proximity data in multi-dimensional space, the method, and computer program products

System representing the proximity data in multi-dimensional space, the method, and computer program products

申请号 JP2000547590 申请日 1999-05-07 公开(公告)号 JP2002513979A 公开(公告)日 2002-05-14
申请人 3−ディメンショナル ファーマシューティカルズ, インコーポレイテッド; 发明人 ディミトリス ケイ. アグラフィオティス,; フランシス アール. サレミ,; ビクター エス. ロバノフ,;
摘要 (57)【要約】 対象を表す多次元空間内の点間の距離として、対象間の類似性/非類似性(関係)の正確または不正確な測度結果を表すシステム、方法およびコンピュータプログラムプロダクト。 確率的関係/距離の誤差を用いて、点の初期(ランダムまたは部分的に順番の)配置を反復的に細分するために、自己編成原理が用いられる。 データは、完全であってもよいし、不完全であってもよいし(即ち、対象間の関係のいくつかは既知でなくてもよい)、的確であってもよいし、不的確であってもよいし(即ち、いくつかのまたは全ての関係が許容の範囲または極限によって与えられ得る)、対称であってもよいし、非対称であってもよいし(即ち、対象Aの対象Bとの関係は、対象Bの対象Aとの関係と同じでなくてもよい)、定誤差または確率的誤差を含んでいてもよい。 対象間の関係は、観測、測度、事前の知識、または直感から直接的に導かれ得るか、あるいは近接(関係)データを導く任意の適切な技術を用いて、間接的に判定され得る。 本発明は、対象を表す多次元空間において対象の部分集合を表すために、対象の部分集合を反復的に解析する。 例示的な実施形態において、本発明は、従来の多次元的尺度構成法または非線形写像アルゴリズムを用いて、対象の部分集合を反復的に解析する。 別の例示的な実施形態において、関係は、対象の対間の対の関係または対の類似性/非類似性として定義され、本発明は、同時に対象の対を反復的に解析する。 好適には、部分集合は、二重のネスティングループとして、対で評価される。
权利要求 【特許請求の範囲】
  • 【請求項1】 対象間の関係を表示写像上の互いの距離として表す方法であって、 (1)該対象を該表示写像に配置するステップと、 (2)該対象の部分集合を選択するステップであって、該選択された対象の部分集合が、該選択された部分集合内の対象間の同伴関係を有する、ステップと、 (3)該表示写像上の対象間の距離を、該対象間の関係および該距離に基づいて、修正するステップと、 (4)該対象の集合からのさらなる対象の部分集合について、該ステップ(2
    )および(3)を繰り返すステップと、 を包含する方法。
  • 【請求項2】 前記ステップ(2)が、 (a)同伴の対の関係を有する対象の対を選択するステップ、 を包含する、請求項1に記載の方法。
  • 【請求項3】 1つ以上の対象の対間の前記関係が未知であり、 (4)同伴関係が既知である対象の対についてのみ、前記ステップ(2)から(4)までを行うステップと、 (5)関係が既知でない前記表示写像上の対象間の距離が、該ステップ(2)
    から(4)までが行われる間に適合することを可能にするステップと、 をさらに包含する、請求項2に記載の方法。
  • 【請求項4】 1つ以上の対象の対が有界不確定性によって関連し、 (5)関係値の許容範囲の集合として、有界不確定性を有する関係によって関連する、対象の対間の前記表示写像上の前記距離を、該距離が規定範囲を越えた場合にのみ修正するステップ、 をさらに包含する、請求項2に記載の方法。
  • 【請求項5】 1つ以上の対象の対が有界不確定性によって関連し、 (5)許容できる関係値の上限として規定される、有界不確定性を有する関係によって関連する、対象の対間の表示写像上の前記距離を、該距離が規定された上限より高い場合にのみ修正するステップ、 をさらに包含する、請求項2に記載の方法。
  • 【請求項6】 1つ以上の対象の対が有界不確定性によって関連し、 (5)許容できる関係値の下限集合として規定される、有界不確定性を有する関係によって関連する、対象の対間の前記表示写像上の前記距離を、該距離が規定範囲を越えた場合にのみ修正するステップ、 をさらに包含する、請求項2に記載の方法。
  • 【請求項7】 1つ以上の対象の対が非有界不確定性によって関連し、 (5)前記対応する関係が非有界不確定性を含む、対象の対を識別するステップと、 (6)該非有界不確定性を含む関係を取り除くステップと、 (7)該対応する関係が取り除かれた対象間の距離が、前記ステップ(2)から(4)までが行われる間に適合することを可能にするステップと、 をさらに包含する、請求項2に記載の方法。
  • 【請求項8】 前記ステップ(3)が、 (a)学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  • 【請求項9】 前記ステップ(3)が、 (a)固定された学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  • 【請求項10】 前記ステップ(3)が、 (a)適応学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  • 【請求項11】 前記ステップ(3)が、 (a)動的学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  • 【請求項12】 前記ステップ(3)が、 (a)前記選択された対象の対間の関係の関数である、学習速度に基づいて、
    前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  • 【請求項13】 前記ステップ(3)が、 (a)1つ以上の前記選択された対象の関数である、学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  • 【請求項14】 前記ステップ(3)が、 (a)前記選択された対の関数である、学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  • 【請求項15】 前記ステップ(3)が、 (a)従来の多次元的尺度構成技術を用いて、前記距離を修正するステップ、 を包含する、請求項1に記載の方法。
  • 【請求項16】 前記ステップ(3)が、 (a)従来の非線形尺度構成技術を用いて、前記距離を修正するステップ、 を包含する、請求項1に記載の方法。
  • 【請求項17】 前記ステップ(3)が、 (a)従来技術を用いて、誤差関数を計算するステップと、 (b)勾配降手順を用いて、前記距離を修正するステップと、 を包含する、請求項1に記載の方法。
  • 【請求項18】 前記対象が、化学的対象でないことが提供される、請求項1に記載の方法。
  • 【請求項19】 対象間の関係を表示写像上の互いの距離として表す方法であって、 (1)該対象を該表示写像に配置するステップと、 (2)該対象の部分集合を選択するステップであって、該選択された対象の部分集合が、該選択された部分集合内の対象間の同伴関係を有する、ステップと、 (3)該選択された部分集合から対象の対、同伴対の関係を有する対象の対を選択するステップと、 (3)該表示写像上の対象の対間の距離を、該対象の対間の関係および該距離に基づいて、修正するステップと、 (4)該選択された対象の集合からのさらなる対象の部分集合について、該ステップ(3)および(4)を繰り返すステップと、 を包含する方法。
  • 【請求項20】 (5)第2の対象の部分集合を選択するステップと、 (6)該第2の選択された対象の部分集合における、対象の対について、前記ステップ(3)および(4)を反復的に繰返すステップと、 をさらに包含する、請求項19に記載の方法。
  • 【請求項21】 対象の集合における、対象間の関係を表示写像上に互いの距離として表すシステムであって、 該対象を表示写像に配置する座標モジュールと、 対象の部分集合を、対象間の該距離を修正するために選択する部分集合セレクタと、 該選択された部分集合における対象間の該距離を、該距離および対応する関係の差に基づいて、修正する座標修正モジュールと、 を備える、システム。
  • 【請求項22】 対象の対を、対象間の前記距離を修正するために選択する、部分集合セレクタ、 をさらに備える、請求項21に記載のシステム。
  • 【請求項23】 3つ以上の対象を、その間の距離を修正するために選択する、部分集合セレクタと、 従来の技術を用いて、選択された部分集合内の対象間の該距離を受け取る、座標修正モジュールと、 をさらに備える、請求項21に記載のシステム。
  • 【請求項24】 従来の技術を用いて誤差関数値を計算し、勾配降手順を用いて前記距離を修正する、座標修正モジュール、 をさらに備える、請求項23に記載のシステム。
  • 【請求項25】 従来の多次元的尺度構成技術を用いて誤差関数値を計算する、座標修正モジュール、 をさらに備える、請求項23に記載のシステム。
  • 【請求項26】 従来の非線形尺度構成技術を用いて誤差関数値を計算する、座標修正モジュール、 をさらに備える、請求項23に記載のシステム。
  • 说明书全文

    【発明の詳細な説明】

    【0001】 (発明の背景) (発明の分野) 本発明は、データ解析に関し、より具体的には多次元空間内の近接データの表現に関する。

    【0002】 (関連技術) 多次元的尺度構成法(MDS)および非線形写像(NLM)は、対象間の距離が対象間の関係を表す、対象の、非線形写像を含む、表示写像を生成する技術である。

    【0003】 MDSおよびNLMは、Torgerson、Phychometrika、
    17:401 (1952)、Kruskal、Psychometrika、
    29:115 (1964)、およびSammon、IEEE Trans.
    Comput. 、C−18:401(1969)によって、心理学的データの低次元表現を生成する手段として導入される。 多次元的尺度構成法および非線形写像は、Schiffman、ReynoldsおよびYoungの、Intro
    duction to Multidimensional Scaling、
    Academic Press、New York(1981)、YoungおよびHamerのMultidimensional Scaling: Hi
    story, Theory and Applications、Erlba
    um Associates, Inc. 、Hillsdale,NJ(198
    7)、ならびにCox and Coxの、Multidimensional
    Scaling、Monographs in Statistics an
    d Applied ProbabilityのNumber 59、Chap
    man−Hall(1994)において検討される。 これらの出版物の内容は、
    その全文を通じて本明細書中で参考として援用される。

    【0004】 MDSおよびNLM(これらは、概して同じであり、以下では、集合的にMD
    Sと呼ぶ)は、低次元ユークリッド空間における点の距離によって、対象の近接関係を視覚化する方法の集合を表す。 近接測度は、Hartigan、J. A
    m. Statist. Ass. 、62:1140(1967)において検討され、この文献は、その全文を通じて本明細書中で参考として援用される。

    【0005】 特に、ベクトルまたは他のサンプルの有限集合A={a i ,i=l,. . . ,
    k}、Aにおけるi番目とj番目との対象間の類似性または非類似性を測定する、a i ,a j ∈Aの関係関数r ij =r(a i ,a j )、ならびに、m次元表示平面上のAの像の集合

    【0006】

    【数1】

    (ただし、

    【0007】

    【数2】

    は実数のm次元ベクトルの空間である)とすると、目的は、それらのユークリッド距離d

    ij =‖x

    i −x

    j ‖が可能な限り対応値r

    ijに近くなるように、x

    iを表示平面上に位置付けることである。 多くの場合単に近くにされ得る、この射影は、オリジナルr

    ijと射影d

    ij (これらは、オリジナルと射影されたベクトル集合の距離行列である)との差を測定する誤差関数を最小化することによって、反復様式で実行される。

    【0008】 このような誤差関数がいくつか提案されてきたが、多くは最小二乗タイプであり、Kruskalの「応」:

    【0009】

    【数3】

    Sammonの誤差基準:

    【0010】

    【数4】

    およびLingoesの無相関度係数:

    【0011】

    【数5】

    が含まれる。 ただし、d

    ij =‖x

    i −x

    j ‖は、表示平面上の像x

    iとx

    jとのユークリッド距離である。

    【0012】 概して、解は、以下によって反復様式で求められる。

    【0013】 (1)関係r ijを計算またはデータベースから取り出すステップ (2)像x iを初期化するステップ (3)像d ijの距離および誤差関数の値を計算するステップ(例えば、上記のEQ.1〜3のS、E、またはK) (4)像x iの新たな配置を、Kruskalの線形回帰、またはGuttm
    anのランク像置換等の勾配降手順を用いて計算するステップ (5) 誤差が指定された許容範囲内に最小化されるまでステップ3および4
    を繰返すステップ 例えば、Sammonアルゴリズムは、EQ. 4を用いて座標x iを反復的に更新することによって、EQ. 2を最小化する。 x pq (m+1)=x pq (m)−λΔ pq (m) EQ. 4 ただし、mは反復数であり、x pqはp番目の像x pのq番目の座標であり、λは学習速度であり、

    【0014】

    【数6】

    である。 EQ. 5における偏導関数は、

    【0015】

    【数7】

    によって与えられる。

    【0016】 写像は、EQ. 2の繰返し値をによって得られ、その後、誤差が指定された許容範囲内になるまで、EQ. 4および5を用いて座標が修正される。

    【0017】 上記の一般的な細分パラダイムは、比較的小さいデータ集合に適するが、大きいデータ集合については非実用的にさせる重要な制限を1つ有する。 この制限は、勾配の計算に必要な計算の努力(即ち、上記のステップ(4))はデータ集合のサイズの二乗に尺度化するという事実から生じる。 比較的大きいデータ集合について、この二次時間計算量により、部分細分でさえも処理しにくいものになる。

    【0018】 必要なのは、複数の対象を好適に尺度化し、小さいデータ集合と大きいデータ集合との両方に適用され得る、近接データを多次元空間内に表すシステム、方法およびコンピュータプログラムプロダクトである。 さらに、必要なのは、欠けているデータおよび/または有界または非有界の不確定性、ノイズまたは誤差を含むデータに対して効率的であり得る、システム、方法およびコンピュータプログラムプロダクトである。

    【0019】 (発明の要旨) 本発明は、好適には、対象を表す多次元空間内の点間の距離として、対象間の類似性/非類似性(関係)の正確または不正確な測度結果を表すシステム、方法およびコンピュータプログラムプロダクトである。 アルゴリズムは、確率的関係/距離の誤差を用いて、点の初期(ランダムまたは部分的に順番に)配置を反復的に細分するために、自己編成原理を用いる。 データは、完全であってもよいし、不完全であってもよいし(即ち、対象間の関係のいくつかは既知でなくてもよい)、的確であってもよいし、不的確であってもよいし(即ち、いくつかのまたは全ての関係が許容の範囲または極限によって与えられ得る)、対称であってもよいし、非対称であってもよいし(即ち、対象Aの対象Bとの関係は、対象Bの対象Aとの関係と同じでなくてもよい)、定誤差または確率的誤差を含んでいてもよい。

    【0020】 対象間の関係は、観測、測度、事前の知識、または直感から直接的に導かれ得るか、あるいは近接(関係)データを導く任意の適切な技術を用いて、直接的もしくは間接的に決定され得る。

    【0021】 本発明は、対象間の関係を表す多次元空間において対象の部分集合を表すために、対象の部分集合を反復的に解析する。

    【0022】 例示的な実施形態において、本発明は、従来の多次元的尺度構成法または非線形写像アルゴリズムを用いて、対象の部分集合を反復的に解析する。

    【0023】 別の例示的な実施形態において、関係は、対象の対間の対の関係または対の類似性/非類似性として定義され、本発明は、同時に対象の対を反復的に解析する。 好適には、部分集合は、二重のネスティングループとして、対で評価される。

    【0024】 以下の説明において、用語「関係」、「類似性」または「非類似性」は、対象の対間の関係を示すために用いられる。 用語「表示写像」は、オリジナルの対象を表すn次元空間上の像の集合を示すために用いられる。 用語「距離」は、その対象に対応する表示写像上の像間の距離を示すように用いられる。

    【0025】 化合物データおよび関係と共に実現される本発明の実施例を含む、本発明の実施例が、本明細書中に提供されている。 しかし、本発明は本明細書中に記載の実施例に限定されないことが理解されるべきである。 本発明は、様々な適用例において実現され得る。

    【0026】 例えば、本明細書中に記載の特定の実施形態が、対象間の類似性/非類似性を表すために、点間の距離を利用するが、本発明は、対象間の類似性/非類似性を表すために、任意の表示属性を利用するように意図され、適合される。 任意の表示属性には、フォント、サイズ、色、グレースケール、斜体、下線、太字、アウトライン、ボーダー等が含まれるが、これらに限定はされない。 例えば、2つの対象間の類似性/非類似性は、対象を表す点の相対的なサイズによって表される。

    【0027】 本発明のさらなる特徴および利点は、本発明の様々な実施形態の構造および動作と共に、添付の図面を参照しながら以下でより詳細に記載される。

    【0028】 本特許のファイルは、少なくとも1つのカラーで描かれた図面を含む。 カラー図面を有する本特許の写しは、請求され、必要な手数料が支払らわれれば特許庁によって提供される。

    【0029】 本発明は、添付の図面を参照しながら説明される。

    【0030】 図面において、同一の参照番号は、同一のまたは機能的に同様の要素を示す。
    また、参照番号の左端の数字は、関連付けられた要素が最初に現れる図面を示す。

    【0031】 (好適な実施形態の詳細な説明) (目次) I. 本発明の概略. . . . . . . . . . . . . . . . . . . . . . . . . . 12 II. 部分集合選択. . . . . . . . . . . . . . . . . . . . . . . . . 14 III. 不確定性のない完全な対の関係行列. . . . . . . . . . . . . . 15 IV. 不確定性のない疎な対の関係行列. . . . . . . . . . . . . . . . 18 V. 有界不確定性を有する対の関係行列. . . . . . . . . . . . . . . . 18 VI. 非有界の不確定性を有する対の関係行列(不正データ). . . . . . 21 VII. 基本的なアルゴリズムの変形例. . . . . . . . . . . . . . . . 21 VIII. 評価特性(特徴)、関係および距離測度. . . . . . . . . . . 23 A. 連続または離散している実数値を有する評価特性. . . . . . . 23 1. 評価特性の値が連続または離散している実数の場合の関係また は距離測度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 B. バイナリ値を有する評価特性. . . . . . . . . . . . . . . . 25 1. 評価特性の値がバイナリである場合の距離測度. . . . . 26 C. 評価特性の尺度構成法. . . . . . . . . . . . . . . . . . . 28 IX. 本発明の実行. . . . . . . . . . . . . . . . . . . . . . . . . 30 A. 概略. . . . . . . . . . . . . . . . . . . . . . . . . . . 30 B. コンピュータプログラムプロダクトにおける本発明の実行. . . 32 C. 本発明の動作. . . . . . . . . . . . . . . . . . . . . . . 35 X. 本発明の実施例. . . . . . . . . . . . . . . . . . . . . . . . . 37 A. 例示的な実施形態の動作. . . . . . . . . . . . . . . . . . 39 XI. 結論. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 (I.本発明の概略) 本発明は、対象を表す多次元空間内の点間の距離として(あるいは他の表示属性または技術を用いて)、対象間の類似性/非類似性(関係)の正確または不正確な測度結果を表すシステム、方法およびコンピュータプログラムプロダクトである。 アルゴリズムは、確率的関係/距離誤差を用いて、点の初期(ランダムまたは部分的に順番の)配置を反復的に細分するために、自己編成原理を用いる。
    データは、完全であってもよいし、不完全であってもよいし(即ち、対象間の関係のいくつかは既知でなくてもよい)、的確であってもよいし、不的確であってもよいし(即ち、いくつかのまたは全ての関係が許容の範囲または極限について与えられ得る)、対称であってもよいし、非対称であってもよいし(即ち、対象Aの対象Bとの関係は、対象Bの対象Aとの関係と同じでなくてもよい)、定誤差または確率的誤差を含んでいてもよい。

    【0032】 対象間の関係は、観測、測度、事前の知識、または直感から直接的に導かれ得るか、あるいは近接(関係)データを導く任意の適切な技術を用いて、直接的もしくは間接的に決定され得る。

    【0033】 本発明は、対象を表す多次元空間において対象の部分集合を表すために、対象の部分集合を反復的に解析する。

    【0034】 例示的な実施形態において、本発明は、従来の多次元的尺度構成法または非線形写像アルゴリズムを用いて、対象の部分集合を反復的に解析する。

    【0035】 別の例示的な実施形態において、関係は、対象の対間の対の関係または対の類似性/非類似性として定義され、本発明は、同時に対象の対を反復的に解析する。 好適には、部分集合は、二重のネスティングループとして、対で評価される。

    【0036】 さらに別の実施形態において、関係は、複数の対象間のNの関係またはNの類似性/非類似性として定義され、本発明は、複数の対象を同時に反復的に解析する。 ただし、Nは、好適には、1より大きい。 この別の実施形態の実行は、関連技術の当業者にとっては明らかである。

    【0037】 用語「対象」は、任意のエンティティ、データ、プロパティ、属性、コンポーネント、要素、成分(ingredient)、項目等のことであり、これらは、任意のこのようなエンティティ、データ、プロパティ、属性、コンポーネント、要素、成分、項目等のインスタンスまたは異なるものの間の類似性/非類似性を表すために有用である。 限定するものではないが、例示として、対象は、例えば、化合物、プロセス、機械、合成物、製造品、電気的装置、機械的装置、金融データ、金融証書、金融傾向、金融関連形質および特徴、ソフトウェア製品、人間的形質および特徴、科学的特性、形質、および特徴等を含む。 1実施形態において、本発明は、化合物を除き、任意のエンティティ、データ、プロパティ、属性、コンポーネント、要素、成分、項目等で動作する。

    【0038】 (II.部分集合選択) 本発明は、対象間の関係を表す多次元空間において対象の部分集合を表すために、対象の部分集合を反復的に解析する。 例示的な実施形態において、本発明は、従来の多次元的尺度構成法または非線形写像アルゴリズムを用いて、対象の部分集合を反復的に解析する。 この実施形態において、選択された部分集合における対象は、例えば、上記のような、しかしそれらに限定されない、従来のアルゴリズムを用いて、群として解析される。 具体的には、その部分集合を包含する対象に対応する像の座標は、従来の多次元的尺度構成法、非線形写像、または任意の他の適切なアルゴリズム、あるいは以下で説明する対の細分アルゴリズムを用いて、細分される。

    【0039】 この実施形態において、対象の部分集合は、ランダムに、半ランダムに、系統的に、または部分的に系統的等に選択され得る。 対象の部分集合が解析され、これらの距離が修正され、対象の集合は、自己編成しやすくなる。 このようにして、大きなデータ集合が、従来の多次元的尺度構成法または非線形写像アルゴリズムに適合され得る。

    【0040】 別の例示的な実施形態において、関係は、対象の対間の対の関係または対の類似性/非類似性として定義され、本発明は、同時に対象の対を反復的に解析する。 対象の対は、ランダムに、半ランダムに、系統的に、または部分的に系統的等に選択され得る。 対の解析の新規なアルゴリズムおよび技術が、以下のセクションで提供される。 この実施形態は、本発明を例示する目的としてのみ説明され、
    限定はしない。

    【0041】 別の実施形態において、関係は、複数の対象間のNの関係またはNの類似性/
    非類似性として規定され、本発明は、複数の対象を同時に反復的に解析する。 ただし、Nは、好適には、1より大きい。 この別の実施形態の実行は、当業者にとっては明らかである。

    【0042】 (III.不確定性のない完全な対の関係行列) 本明細書中で採用される好適なアプローチは、確率的または瞬間誤差に基づいて、反復的な細分を用いることである。 このセクションの記載では、全ての対の関係が既知であり、全て正確であると仮定される。 従来のMDSと同様に、その方法は、ランダムに、または他の何らかの手順(以下を参照)によって生成される点の初期的な配置で開始する。 この初期的な配置は、その後、2点i、jをランダムに繰返し選択することによって、且つEQ. 8により、表示写像上のそれらの座標を修正することによって、連続的に細分される。 x i (t+1)=f(t,x i (t),x j (t),r ij ) EQ. 8 ただし、tは現在の反復、x i (t)およびx j (t)は、表示写像上のi番目およびj番目の点の現在の座標、x i (t+1)は、表示写像上のi番目の点の新たな座標、r ijは、表示写像上で近似しようとする(以上を参照)i番目およびj番目の対象間の対の関係である。

    【0043】 上記のEQ. 8におけるf(.)は、任意の関数形式を取り得る。 理想的には、この関数は、i番目およびj番目の点の間の、実際の距離と終点の距離との差を最小化するようにしなければならない。 例えば、f(.)は、EQ. 9によって与えられ得る。

    【0044】

    【数8】

    ただし、tは反復数、d

    ij =‖x

    i (t)−x

    j (t)‖であり、λ(t)は調節可能なパラメータであり、以下では、ニューラルネットワークの専門用語を借りて、「学習速度」と呼ばれる。 このプロセスは、固定された数の周期で繰返されるか、またはいくつかの大域的誤差基準が、指定された許容範囲内まで最小化されるまで繰返される。 多数の反復が、典型的には、統計的精度を得るために必要とされる。

    【0045】 上記の方法は、ニューラルネットワークのバックプロパゲーショントレーニング(Werbos、Beyond Regression: New Tool
    s for Prediction and Analysis in the
    Behavioral Sciences、PhD Thesis、Harv
    ard University、Cambridge、MA(1974)ならびにRumelhartおよびMcClelland編、Parallel Di
    stributed Processing: Explorations i
    n the Microstructure of Cognition. 、V
    ol. 1、MIT Press、Cambridge、MA(1986))およびKohonenの自己編成原理(Kohonen、Biological
    Cybernetics、43:59(1982))を思わせるものである。

    【0046】 EQ. 9における学習速度λ(t)は、収束を確実にする場合に重要な役割を果たす。 λが小さすぎる場合、座標更新は小さく、収束は遅い。 反対に、λが大きすぎる場合、学習の速度は加速され得るが、表示写像は、不安定(即ち、振動的)になり得る。 典型的に、λは間隔[0,1]内で固定され得るか、または、
    細分プロセスの間単調に減少し得る。 さらに、λは、また、i、j、および/またはr ijの関数であり得、異なる重みをある特定の対象および/または関係に適用するために用いられ得る。 例えば、λは、

    【0047】

    【数9】

    によって計算され得る。 ただし、λ

    maxおよびλ

    minは、λ

    max ,λ

    min ∈[0,1


    ]となるように(重み付けされていない)開始学習速度および終了学習速度であり、tは細分ステップ(反復)の総数であり、tは現在の反復数であり、αは一定の尺度構成因子である。 EQ. 10および11は、大きな分離での訂正を減少する効果を有し、従って、短距離相互作用を、長距離相互作用より、より忠実に保護する表示写像を作製する。 重み付けについては、以下でより詳細に記載する。

    【0048】 このアプローチの主たる利点の1つは、部分細分を可能にすることである。 対の関係が、データの一般的な構造およびトポロジーを明らかにする程度に近く表されれば、充分であることが多い。 従来のMDSとは異なり、このアプローチは、細分プロセスの非常に細かい制御を可能にする。 さらに、表示写像が自己編成するので、対の細分は、協同的となり、問題の二次的性質を部分的に軽減する。

    【0049】 上記の埋め込み手順は、大域最小値までの収束(即ち、最小二乗の意味で、最も忠実な埋め込み)を保証しない。 所望の場合、細分プロセスは、異なる開始配置および/または乱数種から、複数回繰返され得る。 概して、表示写像における絶対的な座標は、物理的な重要性を持たない。 重要なことは、点間の相対距離、
    およびデータの一般的な構造およびトポロジー(クラスタの存在、密度、および分離等)である。

    【0050】 上記の方法は、理想的には、メトリックおよびノンメトリック尺度構成法の両方に適する。 後者は、対の関係が距離公準に従わない場合、具体的には、三不等式の場合、特に有用である。 対の関係行列が正の定符号である場合にしか、「
    正確な」射影が可能でないにも関わらず、この基準を満たさない場合でさえ意義のある写像が得られ得る。 上記のように、射影の全体の質は、EQ. 1〜3に示したような、誤差関数二乗和によって決定される。

    【0051】 上記の一般的なアルゴリズムは、対の関係行列が不完全な場合、即ち、対の関係のいくつかが未知であるか、または対の関係のいくつかが不確定もしくは不正であるか、あるいは上記の両方が当てはまる場合にも適用され得る。 これらの場合について以下で別々に記載する。

    【0052】 (IV.不確定性のない疎な対の関係行列) 上記の一般的なアルゴリズムは、対の関係行列が不完全な場合、即ち、対の関係のいくつかが未知である場合にも適用され得る。 この場合、関係が既知である点の対に関してアルゴリズムが反復するということを除いて、上記のものと同様のアルゴリズムが用いられ得る。 この場合、アルゴリズムは、既知の対の関係を満たす空間における配置を識別し、未知の対の関係は、細分の間に適合し、結果的に既知の関係の満足な埋め込みに導く値をとる。

    【0053】 欠けているデータの数に依存して、オリジナルの関係行列の2つ以上の満足な埋め込み(写像)があってもよい。 この場合、異なる配置(写像)は、異なる開始配置または乱数種から得られ得る。 分子の立体配置空間の探索のようないくつかの適用例において、この特徴は、他のいくつかの技術に対して、有意な利点を提供する。 オリジナルのアルゴリズム(以下のセクションを参照)の全ての変形例は、このコンテキストにおいて、用いられ得る。

    【0054】 (V.有界不確定性を有する対の関係行列) 上記の一般的なアルゴリズムは、対の関係が有界不確定性を有する場合、即ち、対の関係のいくつかが、ある特定の固定された許容範囲内でのみ既知である(
    例えば、関係が、指定された上界および下界を有する範囲または範囲の集合内にあることが既知である)場合にも適用され得る。 この場合、表示写像上の距離が、対応する点が所定の境界の外にある場合にしか、訂正されないことを除いて、
    上記のものと同様のアルゴリズムが用いられ得る。 例えば、2つの対象、iとj
    との間の関係が、上界および下界、それぞれ、r maxおよびr minについて与えられると仮定する。 この対象の対は、細分の間に選択され、表示写像上の対応する像の距離が計算され、d ijとして示される。 d ijがr maxより大きい場合、像の座標は、r maxを終点距離として用いて更新される(EQ.12)。 x i (t+1)=f(t,x i (t),x j (t),r max ) EQ. 12 反対に、d ijがr minより小さい場合、像の座標は、r minを終点距離として用いて更新される(EQ.13)。 x i (t+1)=f(t,x i (t),x j (t),r min ) EQ. 13 d ijが上界と下界との間にある場合

    【0055】

    【数10】

    訂正は行われない。 即ち、アルゴリズムは、現在の像間の距離が上界より大きい場合には上界を、現在の像間の距離が下界より低い場合には下界を一致させるように試みる。 像間の距離が上界および下界の間にある場合、訂正は行われない。

    【0056】 このアルゴリズムは、対の関係のいくつかが許容離散値の有限集合によって、
    または値の範囲の集合か、あるいは、それらの組合せによって与えられる場合、
    拡大され得る。 以下の記載のために、ゼロ幅の範囲として離散値を考慮する(例えば、2の離散値は、範囲[2,2]として表され得る)。

    【0057】 1つの仮説的対の関係、および表示写像上の対応する像の現在の距離の様々な可能性を、図5に示す。 図5において、陰を付けた領域510、512、および514は、所与の対の関係について許容値域を示す。 距離d1〜d5は、表示写像上の対応する像間の現在の距離について、5つの異なる可能性を示す。 矢印5
    16、518、520、および522は、写像上の像に適用されなければならない訂正の方向を示す。 矢印518および522は、左を向いて、表示写像上の同伴像の座標が、像が互いに近くなるように更新されなければならないことを示す。 矢印516および520は、右を向いて、同伴像の座標が、像がより遠くなるように更新されなければならないことを示す。

    【0058】 1つの範囲の場合のように、表示写像上の選択された対の像の現在の距離が任意の指定された範囲内にある場合、座標は更新されない(即ち、図5のd1の場合)。 そうでない場合、最も近い範囲の境界を終点距離として用いて、訂正され得る(即ち、図5のd2〜d5の場合)。 例えば、所与の対象の対間の関係が範囲[1,2]、[3,5]、および[6,7]内にあり、それぞれの像の現在の距離が2.9である場合(図5のd5)、訂正は、3をEQ. 8の終点距離(r ij )として用いて行われる。 しかし、現在の距離が2.1である場合、座標は、
    2をEQ. 8の終点距離(r ij )として用いて更新される。

    【0059】 この決定的基準は、終点距離がランダムに、または現在の距離と2つの最も近い範囲境界との間の差に依存する確率で選択される、確率的または確率論的基準によって置き換えられ得る。 上記の例(図5のd5)において、終点距離のような2と3との間の確率論的選択が、例えば、それぞれ0.1および0.9の確率で(即ち、2は、確率0.1で、終点距離として選択され、3は、確率0.9で、選択され得る)、行われ得る。 このような確率を得るために任意の方法が用いられ得る。 あるいは、2または3のいずれも、ランダムに終点距離として、選択され得る。

    【0060】 例えば、対の関係における、有界不確定性は、確率的誤差または定誤差、あるいは物理測定結果と関連付けられたノイズを表し得、概して、対の関係ごとに異なり得る。 典型的な例として、多次元的な核磁気共鳴分光法における、核オーバーハウザー効果(NOE)がある。

    【0061】 不確定性を扱う別のアルゴリズムは、関係が不確定であると考えられる対象の対の訂正の大きさを減少する。 この理論体系において、訂正の大きさは、例えば、EQ. 9の学習速度によって決定されて、関係が不確定であると考えられる対の関係に対して減少される。 訂正の大きさは、対応する対の関係と関連付けられた不確定性の度合に依存し得る(例えば、訂正の大きさは、対応する対の関係と関連付けられた不確定性と反比例し得る)。 誤差の存在および/または大きさが未知である場合、誤差は、アルゴリズムによって自動的に決定され得る(以下のセクションVを参照)。

    【0062】 (VI.非有界の不確定性を有する対の関係行列(不正データ)) 前述のセクションにおいて説明される概念は、対の関係のいくつかが不正データを含むと考えられる場合、即ち、対の関係のいくつかが不正確で本質的に実測値への関係を有さない場合に、適用され得る。 この場合、アルゴリズムの間、「
    問題のある」関係が検出されて、続くプロセスから取り除かれ得る。 即ち、目的は不正エントリを識別し、関係行列からこれらを取り除くことである。 このプロセスによって、疎な関係行列が得られ、これは、上記のセクション1.2のアルゴリズムを用いて細分され得る。

    【0063】 (VII.基本的なアルゴリズムの変形例) 多くの場合において、上記のアルゴリズムは、適切な統計的方法を用いてデータを予め順番にすることによって、加速され得る。 例えば、近接度が、ベクトル形式またはバイナリ形式で利用可能なデータから得られる場合、表示写像上の点の初期配置は、主成分分析法を用いて計算され得る。 好適な実施形態において、
    初期配置は、特徴行列の最初の3つの主成分(即ち、データの多くの分散の原因である、3つの潜在的変数)から構成され得る。 実際には、この技術は、細分のスピードに対して重大な効果を有し得る。 実際、ランダムな初期配置が用いられる場合、トレーニング時間のかなりの部分が、典型的に大きな再構成によって特徴付けられる表示写像の一般的な構造およびトポロジーを確立するために費やされる。 反対に、入力配置が部分的に順番にされている場合、誤差基準は比較的速く許容レベルまで減少され得る。

    【0064】 データが非常にクラスタ化している場合、サンプリングプロセスによって、低密度領域が高密度領域より、非効率的に細分され得る。 例示的な実施形態において、この傾向は、低密度領域におけるサンプリング確率を増加させる、オリジナルのアルゴリズムに対する修正によって、部分的に補償され得る。 1つの実施形態において、表示写像の重心が識別され、その点を中心とする同心のシェルが構成される。 一連の規則的な細分反復が、その後、実行され、そのたびにこれらのシェルの中または間から点を選択する。 このプロセスは、指定された数の周期で繰返される。 この段階には、その後、大域サンプリングを用いる規則的な細分の段階が続き、プロセスが繰返される。

    【0065】 概して、基本的なアルゴリズムは、短距離型の距離を、長距離型の距離と区別しない。 EQ. 10および11は、重み付けを用いて、短距離型の距離が、長距離型の距離よりも、より忠実に保護されることを確実にする方法を説明する。

    【0066】 別の(補足的な)アプローチは、分離の近い点が、分離の長い点より、より広範囲に渡ってサンプリングされることを確実にすることである。 例えば、上記で説明したものと同様の、大域細分および局所細分の周期が交代するシーケンスが、採用され得る。 この実施形態において、大域細分の段階が初期的に実行され、
    その後、得られる表示写像が、規則的なグリッドに仕切られる。 グリッドの各セル内の点(対象)が、その後、局所細分の段階にかけられる(即ち、同じセル内の点のみが比較され、細分される)。 好適には、各セル内のサンプリングステップの数が、そのセル内に含まれる点の数に比例しなければならない。 このプロセスは、極めて平行可能である。 この局所細分段階には、その後、他の大域細分段階が続き、プロセスは指定された数の周期で繰返されるか、または指定された許容範囲内に埋め込み誤差が最小化されるまで、繰返される。 あるいは、グリッド方法は、例えば、k−dツリーのような、近接点を識別する他の適切な方法によって置き換えられ得る。

    【0067】 本明細書中に記載の方法は、増分細分に用いられる。 それは、点の集合の編成された表示写像から開始され、点の新たな集合は、オリジナルの写像を修正することなしに加えられ得る。 厳密に言えば、点の新たな集合がオリジナルの集合より大幅に小さい場合、これは統計的に許容できる。 例示的な実施形態において、
    点の新たな集合は、上記の基本的なアルゴリズムの修正を用いて、存在する写像に「拡散」され得る。 具体的には、EQ. 8および9は、入来する点のみを更新するために用いられ得る。 さらに、サンプリング手順は、選択された対が、入来する集合から少なくとも1つの点を含むことを確実にする。 即ち、これらの点のうちの少なくとも1つが入来する集合に属するように、2点がランダムに選択される。 あるいは、新たな点の各々が、上記のアプローチを用いて、独立的に拡散され得る。

    【0068】 (VIII.評価特性(特徴)、関係および距離測度) 例示的な実施形態において、対象間の関係は、表示写像上の対象間の類似性/
    非類似性として表され得、対象に関連付けられた特性または特徴から得られ得る。 任意の類似性測度が、表示写像を構成するために用いられ得る。 類似性または非類似性を評価するために用いられる特性または特徴を、本明細書中で集合的に「評価特性」と呼ぶこともある。

    【0069】 例えば、対象が化合物である場合、対象間の類似性は、構造的類似性、化学的類似性、物理的類似性、生物学的類似性、および/または化合物の構造または同一性から得られ得る、いくつかの他のタイプの類似性測度に基づき得る。

    【0070】 (A.連続または離散実数を有する評価特性) 類似性測度は、対象の集合と関連付けられる評価特性のリストから得られ得る。 例えば、対象が化合物である場合、評価特性は、化合物の集合と関連付けられる、物理的、化学的、および/または生物学的特性であり得る。 この形式主義の下では、対象はベクトルとして多変量特性空間において表され、それらの類似性はいくつかの幾何学的距離測度によって計算され得る。

    【0071】 例示的な実施形態において、特性空間は、1つ以上の特徴または記述子を用いて規定される。 化合物の例において、特性空間は、1つ以上の分子の特徴または記述子を用いて規定され得る。 このような分子の特徴には、トポロジーの指数、
    物理化学的特性、静電界パラメータ、体積および表面パラメータ等が含まれ得る。 これらの特徴は、分子の体積および表面積、双極モーメント、オクタノール−
    分配係数、モル屈折度、生成熱、全エネルギー、イオン化ポテンシャル、分子連結指数、2Dおよび3D自動相関ベクトル、3D構造および/またはファルマコフォリック(pharmacophoric)パラメータ、電場等を含み得るが、これらに限定されない。

    【0072】 しかし、本発明がこの実施形態に限定されないことが理解されるべきである。
    例えば、分子の特徴は、酵素または受容体のような生物学的標的の配列(親和性フィンガープリントとしても公知である)に対しての化合物の集合の観察された生物活動を含み得る。 実際に、化学データの任意のベクトルの表現が、本発明において用いられ得る。

    【0073】 本発明は、化合物対象との適用例に限定されないことも理解されるべきである。 代わりに、本発明は、連続または離散実数を有する、評価特性に関連付けられた対象を含む、任意のデータ集合または対象と共に実現され得る。

    【0074】 (1.評価特性の値が連続または離散実数の場合の関係または距離測度) 「距離測度」は、選択された評価特性に基づき、対象間の関係を決定するために用いられる、アルゴリズムまたは技術の一部である。 任意の所与の状況において用いられる特定の距離測度は、少なくとも部分的に、評価特性がとり得る値の集合に依存する。

    【0075】 例えば、評価特性が値として実数を取り得る場合、適切な距離測度は、EQ.
    14に示す、ミンコフスキー計量である。

    【0076】

    【数11】

    ただし、kは特性ベクトルの要素を示すために用いられ、r∈[1,∞]である。 r=1.0の場合、EQ. 14は、シティブロックまたはマンハッタン計量である。 r=2.0の場合、EQ. 14は、通常のユークリッド計量である。 r=


    ∞の場合、EQ. 14は、絶対座標距離の最大値であり、「優性」計量、「サップ(sup)」計量、または「超計量」距離とも呼ばれる。 r∈[1,∞]の任意の値の場合、ミンコフスキー計量が真の計量であること、即ち、ミンコフスキー計量は、距離公準、具体的には三角不等式に従うことが示され得る。

    【0077】 (B.バイナリ値を有する評価特性) あるいは、対象の評価特性は、ビットが、特徴または特質の存在または不在、
    あるいは潜在的な存在または不在を示すために用いられる、バイナリ形式で表され得る。

    【0078】 例えば、対象が化学化合物の場合、対象は、各ビットが、標的分子における特定の構造的特徴またはパターンの存在または不在を示す、下部構造のキーを用いて、符号化され得る。 このような特徴は、特定の要素の出現の存在、不在、または最小数(例えば、少なくとも1、2または3個の窒素原子の存在)、異常なまたは重要な電子配置および原子タイプ(例えば、二重結合した窒素または芳香炭素)、アルコール、アミン等の共通の官能基、ある特定の基本および複合リング、3次元空間における、特定の分離でのファルマコフォリック群の対または三つ組、および、個別のビットに値しない程まれであるが、起こる場合には極めて重要である、異常な特徴の「離接」を含み得るが、これらに限定されない。 典型的には、これらの異常な特徴は、パターンのいずれか1つが標的の分子内に存在する場合に設定される、共通のビットを割り当てられる。

    【0079】 あるいは、化合物の評価特性は、ビットの割り当てを行うための事前に定義された断片または特徴ディクショナリに依存しない、バイナリフィンガープリントの形式で符号化され得る。 代わりに、事前に定義された極限までの、分子内の全てのパターンが、系統的に列挙され、ビット写像内の疑似乱数位置で少数のビットをオンにする、ハッシングアルゴリズムに対する入力として機能を果たす。 2
    つの異なる分子が正確に同じフィンガープリントを有し得ることが考えられるが、このようなことが起こる可能性は、最も単純な場合にも関わらず、極度に低い。 経験は、これらのフィンガープリントが、意義のある類似性の比較を可能にするように、分子構造についての十分な情報を、含むことを示唆する。

    【0080】 (1.評価特性の値がバイナリである場合の距離測度) 複数の関係測度がバイナリ記述子と共に用いられ得る(ただし、評価特性はバイナリまたはバイナリフィンガープリントである)。 最も頻繁に用いられるものは、xとyとの間で異なるビット数を測定する、正規化されたハミング距離:

    【0081】

    【数12】

    2つの分子が共通に有し得る下部構造の数と比較して、2つの分子によって共有される下部構造の数の測度である、TanimotoまたはJaccard係数:

    【0082】

    【数13】

    およびDice係数:

    【0083】

    【数14】

    である。

    【0084】 上記の等式において、AND(x,y)は、バイナリ集合xおよびy(両方の集合において「オン」であるビット)の共通部分であり、IOR(x,y)は、
    xおよびyの和または「包含的or」(xまたはyのいずれかにおいて「オン」
    であるビット)であり、XORは、xおよびyの「排他的or」(xまたはyの両方ではなく、いずれかにおいて「オン」であるビット)であり、|x|は、x
    において「オン」であるビット数であり、Nは、ビットにおいて測定されるバイナリ集合の長さ(定数)である。

    【0085】 他の一般的な計量は、バイナリ集合の場合、以下の形式で計算し直される、ユークリッド計量である。

    【0086】

    【数15】

    ただし、NOT(y)は、yのバイナリ補数を示す。 式|XOR(x,NOT(


    y))|は、xおよびyにおいて同一であるビット数(1または0のいずれか)


    を表す。 ユークリッド距離は、バイナリ集合が比較的リッチ(rich)である場合、類似性の良好な測度であり、類似性が相対感度で測定される状況において、主に用いられる。

    【0087】 化合物の例において、対象間の距離は、バイナリまたは多変量の表現を用いて決定され得る。 しかし、本発明は、この実施形態に限定されない。

    【0088】 例えば、2つの化合物の間の類似性は、適切な3次元アラインメント法を用いて分子の形を比較することによって決定され得るか、または指定された手順により規定される類似性モデルによって推測され得る。 例えば、このような類似性モデルの1つが、適切に符号化された対の化合物を与えられて類似性係数を予測するようにトレーニングされたニューラルネットワークであり得る。 このようなニューラルネットワークは、例えばユーザ入力によって決定されるような、構造対のトレーニング集合およびこのような対の既知の類似性係数を用いて、トレーニングされ得る。

    【0089】 (C.評価特性の尺度構成法) 再びEQ. 14を参照すると、特徴(即ち、評価特性)は、化合物間の関係を評価するときに、それらの相対的貢献度を反映するように、異なって尺度構成される。 例えば、特性Aは、2の重みを割り当てられ得、特性Bは、10の重みを割り当てられ得る。 従って、特性Bは、特性Aの5倍の影響を関係計算に対し有する。

    【0090】 従って、EQ. 14は、EQ. 19によって置き換えられ得る。

    【0091】

    【数16】

    ただし、w

    kは、k番目の特性の重みである。 このような重み付け因子の一例は、正規化係数である。 しかし、他の重み付け方式を用いてもよい。

    【0092】 尺度構成(重み)は、写像全体を通じて均一である必要はない、即ち、得られる写像は同型である必要はない。 以下では、均一の重みから得られる写像は、大域的に重み付けされる(同型)と呼ばれ、不均一の重みから得られる写像は、局所的に重み付けされる(非同型)と呼ばれる。 局所的に重み付けされた写像上において、表示写像上の関係(または距離)は、類似性の局所測度を反映する。 即ち、表示写像の1つの領域において、類似性を決定するものが、表示写像の他の領域において、類似性を決定するものと同じである必要はない。

    【0093】 例えば、局所的に重み付けされた写像は、局所的に重み付けされた事例に基づく学習アルゴリズムから得られる類似性を反映するように用いられ得る。 局所的に重み付けされた学習は、トレーニングデータを平均化し、補間し、補外し、さもなければ結合するように、局所的に重み付けされたトレーニングを用いる。 ほとんどの学習方法(モデル化または予測法とも呼ばれる)は、全てのトレーニングデータに合うように、1つのモデルを構成する。 他方、局所モデルは、クエリの位置の周りの局所領域において、トレーニングデータを合わせるように試みる。 局所モデルの例には、最隣接、重み付けされた平均、および局所的に重み付けされた回帰が含まれる。 局所的に重み付けされた学習は、VapnikのAdv
    ances in Neural Information Processi
    ng Systems、4:831、Morgan−Kaufman、San
    Mateo,CA(1982)、BottouおよびVapnikのNeura
    l Computation 4(6):888(1992)、ならびにVap
    nikおよびBottouのNeural Computation 5(6)
    :893 (1993)において、検討される。 これらの文献全てが、その全文を通じて本明細書中で参考として援用される。

    【0094】 表示写像は、また、厳密に対称でない関係行列、即ち、r ij ≠r jiの関係行列から構成され得る。 このアプローチの潜在的な使用は、関係(即ち、関係関数)
    が、例えば、点に基づく局所距離関数を用いて局所的に重み付けされたモデルにおいて、局所的に規定される状況にある。 この実施形態において、トレーニングの各事例は、距離関数および対応するパラメータの値と関連付けられている。 好適には、これらの局所距離関係を反映する表示写像を構成するために、2点間の距離が、それぞれの点の局所距離関数を用いて2度評価される。 得られる距離は、平均化され、上記の表示写像アルゴリズムにおける入力として用いられる。 点に基づく局所距離関数が、特徴空間を通じて連続的または半連続的な様態で変動する場合、このアプローチは、潜在的に意義のある射影に導かれ得る。

    【0095】 (IX.本発明の実行) (A.概略) 本発明は、様々なアルゴリズムを用いて様々な方法で実現され得、ハードウェア、ソフトウェア、ファームウェア、およびそれらの任意の組合せを用いて実現され得る。 図6を参照すると、例示的なブロック図は、本発明を実現する、システム610に含まれ得るモジュールおよびデータフローを示す。 図6のブロック図は、本発明の理解を助けるように意図される。 本発明は、図6のブロック図に示す例示的な実施形態に限定されない。

    【0096】 システム610は、対象と関連付けられた関係データ630を格納する関係型データベース612を含む。 関係型データベース612によって収容され得る、
    データのタイプおよび同伴関係は、本発明が、関係が規定され得る任意のタイプのデータと共に実現され得るように、境界を有さない。

    【0097】 関係データ630は、1つ以上の様々なソースから提供され得る。 例えば、評価特性636に基づいて、関係630aは、外部ソース632から提供され得、
    関係630bは、他のソース640から提供され得、関係データ630nは、オプションの関係発生器モジュール634によって発生され得る。 オプションの関係発生器モジュール634は、例えば、1つ以上の等式14〜19のような1つ以上のアルゴリズムを実行する、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せを含み得る。

    【0098】 関係データ630は、座標モジュール616に提供される。 例示的な実施形態において、関係630は、座標モジュール616に、好適には、関係データベース612からの任意の量の関係データ630を格納する行列である、関係行列6
    14として提供される。

    【0099】 座標モジュール616は、初期座標を、関係データ630によって関連するデータ点または対象に割り当てる。 初期座標は、ランダムに、または任意の他の技術で割り当てられ得る。 例えば、データは、予め順番に、または部分的に順番にされ得る。 座標は、表示写像を包含する。 表示写像は、線形またはディスプレイの表示写像であり得る。 表示写像は、n次元の表示写像である。

    【0100】 関係/座標部分集合618および同伴関係620は、座標修正モジュール62
    2に提供される。 例示的な実施形態において、一度に1つの関係/座標部分集合618が、座標修正モジュール622に提供される。

    【0101】 部分集合セレクタモジュール638が設けられて、座標修正モジュール622
    に提供される関係/座標部分集合618を選択し得る。 部分集合セレクタモジュール638は、ランダムに、または、上記の方法のうち1つ以上を含む任意の他の適切な方法で、関係/座標部分集合618を選択し得る。

    【0102】 座標修正モジュール622は、類似性/非類似性(関係620)の正確または不正確な測度結果に基づいて、表示写像上の対象の位置を修正する(即ち、座標618を修正する)。 より詳細には、座標修正モジュール622は、表示写像上の対象間の距離を測定し、それらを同伴関係620と比較する。 座標修正モジュール622は、その後、この比較に基づいて、座標618を修正する。 このような距離は、直接的に、または他の表示属性を修正するように、用いられ得る。

    【0103】 座標修正モジュール622は、上記の、1つ以上の従来の多次元的尺度構成法または非線形写像アルゴリズムを実行する、ハードウェア、ソフトウェア、ファームウェア、またはこれらの任意の組合せを含み得る。 それに加えて、または、
    代わりに、座標修正モジュール622は、例えば、1つ以上の等式8〜13、またはそれらの変形のような、対の解析用の、1つ以上の新規なアルゴリズムを実行する、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せを含み得る。

    【0104】 座標修正モジュール622が、上述したように対の解析を行う場合、関係/座標部分集合618および同伴関係620における座標間の距離の収束を確実にするように、学習速度λを適用し得る。 座標修正モジュール622は、類似性/非類似性(関係620)の正確または不正確な測度結果を表すように設計され得る。 例えば、座標修正モジュール622は、不確定性のない完全な対の行列、不確定性のない疎な対の行列、有界不確定性を含む対の行列、非有界の不確定性を含む対の行列(即ち、不正データ)、またはそれらの任意の組合せを処理するようにプログラムされ得る。 座標修正モジュール622は、また、上述のように、さらなる対象またはデータ点を対象の集合に拡散するようにプログラムされ得る。

    【0105】 座標修正モジュール622は、座標モジュール616に戻され、修正された座標624を生成する。 このプロセスは、座標618のさらなる部分集合および同伴関係620ついて、繰返され、好適には、指定された許容範囲または何らかの他の基準が満たされるまで、同じ関係/座標部分集合618および同伴関係62
    0について繰返される。

    【0106】 例示的な実施形態において、対象間の関係の視覚化が所望される場合、座標6
    26は、ディスプレイ用のオプションの視覚化モジュール628に提供され得る。 本発明の反復プロセスが続く限り、修正された座標626は、オプションの視覚化モジュール628に提供される。

    【0107】 (B.コンピュータプログラムプロダクトにおける本発明の実行) 本発明は、1つ以上のコンピュータを用いて実現され得る。 図2を参照すると、例示的なコンピュータ202は、プロセッサ204のような、1つ以上のプロセッサを含む。 プロセッサ204は、通信バス206に接続されている。 様々なソフトウェア実施形態が、コンピュータシステムのこの例について説明されている。 この説明によって、他のコンピュータシステムおよび/またはコンピュータアーキテクチャを用いて本発明を実現する方法が、当業者にとって明らかになる。

    【0108】 コンピュータ202は、また、好適には、ランダムアクセスメモリ(RAM)
    である、メインメモリ208を含み、1つ以上の二次記憶装置210も含み得る。 二次記憶装置210は、例えば、ハードディスクドライブ212および/またはフロッピーディスクドライブ、磁気テープドライブ、光ディスクドライブ等を表す、リムーバブル記憶ドライブ214を含み得る。 リムーバブル記憶ドライブ214は、周知の様態でリムーバブル記憶装置216から読み出すか、リムーバブル記憶装置216に書き込む。 リムーバブル記憶装置216は、リムーバブル記憶ドライブ214によって読み出され、且つ書き込まれるフロッピーディスク、磁気テープ、光ディスク等を表す。 リムーバブル記憶装置216は、コンピュータソフトウェアおよび/またはデータを格納したコンピュータ使用可能記憶媒体を含む。

    【0109】 別の実施形態において、コンピュータ202は、コンピュータプログラムまたは他の命令がコンピュータ202にロードされることを可能にする、他の同様の手段を含み得る。 このような手段は、例えば、リムーバブル記憶装置220およびインターフェース218を含み得る。 このようなものの例には、プログラムカートリッジおよびカートリッジインターフェース(ビデオゲーム装置において見受けられるようなもの)、リムーバブルメモリチップ(EPROMまたはPRO
    M等)および関連付けられたソケット、ならびに、ソフトウェアおよびデータがリムーバブル記憶装置220からコンピュータ202に転送されることを可能にする他のリムーバブル記憶装置220およびインターフェース218が含まれ得る。

    【0110】 コンピュータ202は、また、通信インターフェース222を含み得る。 通信インターフェース222は、ソフトウェアおよびデータがコンピュータ202と外部装置との間で転送されることを可能にする。 通信インターフェース222の例には、モデム、ネットワークインターフェース(イーサネットカード等)、通信ポート、PCMCIAスロットおよびカード等が含まれるが、これらに限定されない。 通信インターフェース222を介して転送されるソフトウェアおよびデータは、信号の形式(典型的には、搬送波上のデータ)であるが、この信号の形式は、電子的、電磁気的、光学的、または通信インターフェース222によって受信され得る他の信号であり得る。

    【0111】 この文書において、用語「コンピュータプログラムプロダクト」は、概して、
    リムーバブル記憶装置216、220、コンピュータ202から取り除かれ得るハードドライブ212、ならびに通信インターフェース222が受信するソフトウェアを搬送する信号等の媒体のことである。 これらのコンピュータプログラムプロダクトは、コンピュータ202にソフトウェアを提供する手段である。

    【0112】 コンピュータプログラム(コンピュータ制御ロジックとも呼ばれる)は、メインメモリおよび/または二次記憶装置210に格納される。 コンピュータプログラムは、また、通信インターフェース222を介して受信され得る。 このようなコンピュータプログラムは、実行される場合、コンピュータ202が本明細書中に記載の本発明の特徴を行うことを可能にする。 具体的には、コンピュータプログラムは、実行される場合、プロセッサ204が本発明の特徴を行うことを可能にする。 従って、このようなコンピュータプログラムは、コンピュータ202のコントローラを表す。

    【0113】 本発明がソフトウェアを用いて実現される実施形態において、ソフトウェアは、リムーバブル記憶装置214、ハードドライブ212、および/または通信インターフェース222を用いて、コンピュータプログラムプロダクトに格納され、コンピュータ202にロードされ得る。 制御ロジック(ソフトウェア)は、プロセッサ204によって実行される場合、プロセッサ204が本明細書中に記載の機能を行うことを可能にする。

    【0114】 他の実施形態において、本発明の自動化された部分が、例えば、特定用途向け集積回路(ASIC)等のハードウェアコンポーネントを用いて、ハードウェアにおいて、主に、または全体的に実現される。 本明細書中に記載の機能を行うようなハードウェア状態マシンの実行は、当業者にとって明らかである。

    【0115】 さらに別の実施形態において、本発明は、ハードウェアおよびソフトウェアの両方の組合せを用いて実現され得る。

    【0116】 コンピュータ202は、グラフィカルユーザインターフェースおよびウィンドウ環境をサポートするオペレーティングシステムを実行する、コンピュータシステムのような任意の適切なコンピュータであり得る。 適切なコンピュータシステムは、Silicon Graphics, Inc. (SGI)のワークステーション/サーバ、Sunのワークステーション/サーバ、DECのワークステーション/サーバ、IBMのワークステーション/サーバ、IBMの互換性PC
    、AppleのMacintosh、あるいは、Pentium Pro、またはPentiumII等のIntelのPentium系の中から1つ以上のプロセッサを用いているもののような、任意の他の適切なコンピュータである。 適切なオペレーティングシステムには、IRIX、OS/Solaris、Dig
    ital Unix、AIX、Microsoft Windows95/NT
    、Apple Mac OS、または他のオペレーティングシステムが含まれるが、これらに限定されない。 例えば、例示的な実施形態において、プログラムは、IRIX6.4オペレーティングシステムを実行する、Silicon Gr
    aphicsのOctaneワークステーション上で、X Window Sy
    stemに基づくMotifグラフィカルユーザインターフェースを用いて、実現および実行され得る。

    【0117】 (C.本発明の動作) 図7を参照すると、本発明の動作がプロセスフローチャート700に示されている。 本発明の動作を、関係行列614が不確定性のない完全な対の関係行列である、一般的な場合について示す。 当業者であれば、上記の記載およびプロセスフローチャート700に基づいて、例えば、関係行列614が不確定性のない疎なnのまたは対の関係行列である場合、関係行列614が有界不確定性を有するnのまたは対の関係行列である場合、関係行列614が非有界不確定性を有する対の関係行列(即ち、不正データ)である場合等の他の状況に適応するように、
    プロセスフローチャート700を改変することが可能である。

    【0118】 関係行列614が不確定性のない完全な対の関係行列である、一般的な場合のプロセスは、座標モジュール616が関係行列614を関係データベース612
    から受信するステップ702から開始される。

    【0119】 ステップ704において、座標モジュール616は、初期座標を、関係行列6
    14内の関係と関連付けられた対象に割り当てる。 初期座標の割り当ては、ランダムに行われ得る。 あるいは、初期座標は、予め順番にされるか、部分的に予め順番にされ得る。

    【0120】 ステップ706において、関係/座標部分集合618は、関係行列614から修正のため選択され得る。 部分集合618は、部分集合セレクタ638によって、ランダムに、反ランダムに、系統的に、または部分的に系統的、等に選択され得る。

    【0121】 ステップ708において、選択された部分集合618および同伴関係620は、座標修正モジュール622に提供される。 座標修正モジュール622は、同伴関係620に基づいて、関係/座標部分集合618内の座標を修正する。

    【0122】 ステップ710において、座標修正をする他の部分集合を選択するかどうかの判定が行われる。 他の関係/座標部分集合618が修正される場合、プロセスはステップ706に戻って、他の関係/座標部分集合618が選択される。 さもなければ、プロセスはステップ712で停止する。

    【0123】 任意の例示的な実施形態において、ステップ714で座標626がディスプレイ用のオプションの視覚化モジュール628に提供される。 ステップ714は、
    ステップ706〜712のうちの1つ以上の間の任意の時間に行われ得る。

    【0124】 他の任意の例示的な実施形態において、関係データ630は、ステップ702
    の前に生成される。 このオプションの例示的な実施形態において、評価特性63
    6がステップ716で受信される。 ステップ718で、関係発生器634は、評価特性から関係データ630を生成する。 ステップ720で、関係データ630
    は、関係データベース612に提供される。

    【0125】 プロセスは、関係データ630が関係行列614の形式で座標モジュールに提供される、ステップ702に進む。

    【0126】 (X.本発明の実施例) 本発明は、様々な適用例において、様々なタイプのデータと共に実現され得る。 例示的な実施形態において、本発明は、多次元空間における対象間の距離が、
    何らかの指定された方法で計算された、対応する化合物の類似性および/または非類似性(化合物の選択された特性または特徴に関連する)を表す、化合物に関連するデータを視覚化およびインタラクティブに解析する、システム、方法、および/またはコンピュータプログラムプロダクトとして実現され得る。 得られる写像は、適切なグラフィックス装置(例えば、グラフィックス端末)上に表示され、データ間の関係を明らかにするように、およびこれらの化合物に関連するタスクのアレイを開始するように、インタラクティブに解析される。

    【0127】 ユーザは、写像する複数の化合物、および選択された化合物間の類似性/非類似性を評価する方法を選択し得る。 表示写像は、選択された化合物および選択された方法によって、生成され得る。 表示写像は、選択された化合物の各々について点を有し、任意の2点間の距離が対応する化合物間の類似性/非類似性を表す。 表示写像の一部分が、その後表示される。 ユーザが、表示写像上に表れた化合物をインタラクティブに解析することが可能になる。 あるいは、全ての点(po
    int)が、それぞれ複数の化合物または対象と対応し得る。

    【0128】 図1は、本発明の例示的な実施形態による、計算環境102のブロック図である。

    【0129】 化学データの視覚化およびインタラクティブ解析モジュール104は、写像発生モジュール106および1つ以上の補助ユーザインターフェースコンポーネント108を含む。 写像発生モジュール106は、化合物の1つ以上の選択された特性または特徴(本明細書中で評価特性または特徴と呼ばれることもある)と関連する化合物間の類似性を判定する。 写像発生モジュール106は、1つ以上のデータベース120から、化合物および試薬についてのデータを取り出し、解析することによって、この機能を果たす。

    【0130】 化学データの視覚化およびインタラクティブ解析モジュール104は、通信媒体118を介して1つ以上のデータベース120と通信する。 通信媒体118は、好適には、データバス、コンピュータネットワーク等のデータ通信手段の任意のタイプである。

    【0131】 ユーザインターフェースモジュール108は、好適には、2Dまたは3D表示写像を適切なグラフィックス装置上に表示する。 ユーザインターフェースモジュール108は、人間のオペレータが、データ間の関係を明らかにするように、および対応する化合物に関連するタスクのアレイを開始するように、表示写像内の情報をインタラクティブに解析し、処理することを可能にする。

    【0132】 ユーザインターフェースモジュール108は、ユーザが化合物を収集(例えば、組合せのライブラリを表す)として編成することを可能にする。 化合物収集に属する情報は、好適には、1つ以上のデータベース120に格納される。

    【0133】 入力装置114は、入力(データ、コマンド、クエリ等)を、人間のオペレータから受信し、このような入力を、例えば、化学データの視覚化およびインタラクティブ解析モジュール104に、通信媒体118を介して転送する。 キーボード、ポインティング装置(マウス、ローラーボール、トラックボール、ライトペン等)、タッチスクリーン、音声認識等の、任意の、周知で適切な入力装置が、
    本発明において用いられ得る。 ユーザ入力は、また、格納され、その後、データ/コマンドファイルから適切に取り出され得る。

    【0134】 出力装置116は、人間のオペレータに情報を出力する。 モニタ、プリンタ、
    フロッピーディスクドライブ、または他の記憶装置、テキスト音声合成器等の任意の、周知で適切な出力装置が、本発明において用いられ得る。

    【0135】 化合物データの視覚化およびインタラクティブ解析モジュール104は、通信媒体118を介して1つ以上の計算モジュール122とインタラクトし得る。

    【0136】 図1の計算環境102に示されるコンポーネント(化学データの視覚化およびインタラクティブ解析モジュール104等)は、図2に示す例示的なコンピュータ202のような、1つ以上のコンピュータを用いて実現され得る。

    【0137】 (A.例示的な実施形態の動作) 表示写像内の化合物を視覚化し、インタラクティブに処理するために実現される本発明の動作を、次に、図3に示すフローチャート302を参照しながら説明する。 特に記載されていない場合、以下に記載のユーザとのインタラクションは、ユーザインターフェースモジュール108(図1)の動作によって得られる。

    【0138】 ステップ304で、ユーザは、新たな表示写像に写像する1つ以上の化合物を選択する。 ユーザは、ファイルから化合物のリストを取り出すことによって、化合物のリストに手動でタイプすることによって、および/またはグラフィカルユーザインターフェース(GUI)を用いることによって、写像する化合物を選択し得る。 本発明は、ユーザが表示写像に表示する化合物を特定することを可能にする他の手段を構想に入れている。

    【0139】 ステップ306で、ユーザは、ステップ304で選択された化合物間の分子の類似性/非類似性を評価するために用いられる方法を選択する。 1つの実施形態において、ステップ304で選択された化合物間の類似性/非類似性は、指定された評価特性の集合に基づいて、決定される(ステップ308)。 上述したように、評価特性は、ステップ304で選択された化合物の構造、機能、アイデンティティに関連する任意の特性であり得る。 評価特性は、ステップ304で選択された化合物の構造上の性質、機能的性質、化学的性質、物理的性質、生物学的性質等を含むが、これらに限定されない。

    【0140】 本発明の1つの実施形態において、選択された評価特性は、2つの化合物間の近接度(即ち、類似性/非類似性)を評価するときに、それらの相対的重要性を反映するように、異なって尺度構成され得る。 従って、ステップ306では、また、ユーザは、選択された評価特性の各々について、尺度構成因子を選択する。
    このような尺度構成因子の選択は任意であることに留意すべきである。 ユーザは、選択された評価特性の各々について、尺度構成因子を選択する必要はない。 ユーザが、所与の評価特性について尺度構成因子を選択しない場合、その評価特性は、ユニティ(unity)のようなデフォルトの尺度構成因子を与えられる。

    【0141】 あるいは、ステップ306で、ユーザは、ステップ304で選択された化合物に属する類似性/非類似性の値を、データベース等のソースから取り出すことを選択し得る。 データベースにおけるこれらの類似性/非類似性の値は、予め生成される。 他の実施形態において、ユーザは、ステップ306で、類似性/非類似性の値を任意の周知の技術または手順を用いて判定することを選択し得る。

    【0142】 ステップ308で、写像発生モジュール106は、新たな表示写像を生成する。 この新たな表示写像は、ステップ304で選択された化合物の各々についての点を含む。 また、この新たな表示写像において、任意の2点間の距離は、対応する化合物の類似性/非類似性を表す。 写像発生モジュール106が新たな表示写像を生成する様態は、次に、図4のフローチャート402を参照しながら、さらに説明される。

    【0143】 ステップ404で、ステップ304で選択された化合物に対応する点の新たな表示写像上の座標が初期化される。

    【0144】 ステップ406で、ステップ304で選択された化合物i、jのうち2つが処理のために選択される。

    【0145】 ステップ408で、化合物i、j間の類似性/非類似性r ijが、ステップ30
    6でユーザが選択した方法に基づいて、判定される。

    【0146】 ステップ410で、ステップ408で判定された類似性/非類似性r ijに基づいて、表示写像上の化合物i、jに対応する点の座標が得られる。

    【0147】 ステップ412で、トレーニング/学習パラメータが更新される。

    【0148】 ステップ414で、終了するか否かの決定がされる。 この時点で終了しないという判定がされた場合、制御は、ステップ406に戻る。 さもなければ、ステップ416が行われる。

    【0149】 ステップ416で、表示写像が出力される(即ち、表示写像の生成が完了する)。

    【0150】 フローチャート402のステップについての詳細は、上記に記載した。

    【0151】 再度図3を参照すると、ステップ312で、写像ビューア112は、新たな表示写像を出力装置116(コンピュータグラフィックスモニタ等)上に表示する。

    【0152】 ステップ314で、ユーザインターフェースモジュール108は、オペレータが表示された表示写像に表される化合物をインタラクティブに解析し、処理することを可能にする。

    【0153】 本発明は、ユーザが、存在する化合物視覚化表示写像(用語「化合物視覚化表示写像」は、ここでは、表された表示写像を指す)を修正することを可能にする。 例えば、ユーザは、さらなる化合物を写像に加えたり、写像から化合物を取り除いたり、写像上の化合物を強調表示したり等し得る。 このような場合、フローチャート302の適切な機能的ステップが繰返される。 例えば、ステップ304
    (写像する化合物の選択)、ステップ310(表示写像の生成)、およびステップ312(写像の表示)は、ユーザが存在する写像に新たな化合物を加えることを選択する場合に繰返される。 しかし、本発明の1実施形態によると、写像は、
    存在する化合物視覚化表示写像に化合物を加える場合、ステップ310および3
    12で増分的に細分され、表示される(この増分的な細分は、上述した)。

    【0154】 上記の化合物の例は、任意の化学的エンティティを視覚化し、インタラクティブに処理する場合にも有用である。 このような化学的エンティティには、小さな分子、ポリマー、ペプチド、タンパク質等が含まれるが、これらに限定はされない(しかしこれらのために用いられ得る)。 上記の化合物の例は、また、これらの化合物間の異なる類似性関係を表示するためにも用いられ得る。

    【0155】 (XI.結論) 本発明は、特定の機能および関係の動作を示す機能的ビルディングブロック(
    building block)の助けと共に、説明されてきた。 これらの機能的ビルディングブロックの境界は、説明の簡便化のために本明細書中で任意に規定されてきた。 特定の機能および関係が適切に行われる限り、代替の境界が規定され得る。 任意のこのような代替の境界は、本発明の範囲および精神の範囲内であり、当業者にとって明らかである。

    【0156】 これらの機能的ビルディングブロックは、分離したコンポーネント、特定用途向け集積回路、適切なソフトウェアを実行するプロセッサ、ならびに同等のものまたはこれらの任意の組合せによって、実現され得る。 これらの機能的ビルディングブロックを実現する適切な回路部および/またはソフトウェアを発展させることは、充分に当業者の範囲内である。

    【0157】 上記の記載および実施例に基づいて、当業者であれば、本発明の範囲内にある、広範で多様な適用例で本発明を実現し得る。

    【0158】 本発明の様々な実施形態が上述されてきたが、例示する目的のみで提供され、
    本発明を限定しないことが理解されるべきである。 従って、本発明の広がりおよび範囲は、上記の例示的な実施形態のいずれによっても限定されるべきではなく、特許請求の範囲およびその均等物によってのみ規定されるべきである。

    【図面の簡単な説明】

    【図1】 図1は、本発明の実施形態による、計算環境のブロック図である。

    【図2】 図2は、本発明のコンポーネントを実現するために有用なコンピュータのブロック図である。

    【図3】 図3は、本発明の実施形態による、表示写像を視覚化およびインタラクティブに処理する際の本発明の動作を表すフローチャートである。

    【図4】 図4は、本発明の実施形態による、表示写像が生成される様態を表すフローチャートである。

    【図5】 図5は、関係がある特定の許容範囲内で既知である、対象間の関係を概念的に示す。

    【図6】 図6は、対象間の関係を表すシステムのブロック図である。

    【図7】 図7は、対象間の関係を表す方法を示すプロセスのフローチャートである。

    ───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,UG,ZW),E A(AM,AZ,BY,KG,KZ,MD,RU,TJ ,TM),AE,AL,AM,AT,AU,AZ,BA ,BB,BG,BR,BY,CA,CH,CN,CU, CZ,DE,DK,EE,ES,FI,GB,GD,G E,GH,GM,HR,HU,ID,IL,IN,IS ,JP,KE,KG,KP,KR,KZ,LC,LK, LR,LS,LT,LU,LV,MD,MG,MK,M N,MW,MX,NO,NZ,PL,PT,RO,RU ,SD,SE,SG,SI,SK,SL,TJ,TM, TR,TT,UA,UG,UZ,VN,YU,ZA,Z W (72)発明者 ロバノフ, ビクター エス. アメリカ合衆国 ペンシルベニア 19067, ヤードレー, コーナーストーン ドラ イブ 24305 (72)発明者 サレミ, フランシス アール. アメリカ合衆国 ペンシルベニア 19067, ヤードレー, ティンバー レイクス 1970 Fターム(参考) 4H006 AA02 AC90 5B046 AA00 HA09 5B080 DA06

    QQ群二维码
    意见反馈