首页 / 专利库 / 资料储存系统 / 挖矿 / 数据挖掘 / Data mining device

Data mining device

阅读:533发布:2023-05-12

专利汇可以提供Data mining device专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a data mining device for extracting a correlation rule relating to the change patterns of respective attributes in predetermined fixed time width from time sequential data.
SOLUTION: This data mining device is provided with a time sequential data base 401 for holding the values of measured attributes respectively as the time sequential data, a first category value conversion means 402 for outputting the correspondence of the range of attribute values to the respective attributes and a category value, a first numerical value/category value correspondence holding means 403, a category value sequence division means 404 for generating and outputting the sequence of a partial category value sequence which is a part of a category value sequence, a first itemizing means 406 for generating the set of items relating to the same time range and outputting it as an item record, a first item data base 407, a first correlation rule extraction means 408 for extracting and outputting the correlation rule between the item sets composed of one or plural items and a first correlation rule data base 410.
COPYRIGHT: (C)2000,JPO,下面是Data mining device专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 (a)測定された複数種類の属性の値をそれぞれ時系列データとして予め保持する時系列データベース; (b)前記時系列データベースの各属性毎の前記時系列データを入力し、前記時系列データを構成する属性値が取り得る範囲を複数のレベルに分割し、各測定時点における属性値を該レベルに対応するカテゴリ値に変換することによりカテゴリ値系列データを生成して出力すると共に、各属性に対する属性値の範囲とカテゴリ値との対応を数値・カテゴリ値対応情報として出力する第1のカテゴリ値変換を行う第1のカテゴリ値変換手段; (c)前記第1のカテゴリ値変換手段が出力する前記数値・カテゴリ値対応情報を入力し、これを保持して出力する第1の数値・カテゴリ値対応保持手段; (d)前記第1のカテゴリ値変換手段が出力する各属性毎の前記カテゴリ値系列データを入力し、前記カテゴリ値系列データを予め定められた時間を単位として分割することにより、カテゴリ値系列の一部である部分カテゴリ値系列の系列を生成して出力するカテゴリ値系列分割手段; (e)前記カテゴリ値系列分割手段が出力する前記部分カテゴリ値系列の系列を入力し、前記部分カテゴリ値系列の系列を構成する各部分カテゴリ値系列に対し、対応する属性の名前を付加することにより品目を生成し、さらに、同一時間範囲に関する前記品目の集合を生成して品目レコードとして出力する第1の品目化を行う第1の品目化手段; (f)前記第1の品目化手段が出力する複数の前記品目レコードを入力し、これを保持する第1の品目データベース; (g)前記第1の品目データベースの複数の前記品目レコードを入力し、複数の前記品目レコードより、1つまたは複数の品目からなる品目集合間の相関ルールを抽出して出力する第1の相関ルール抽出手段; (h)前記第1の相関ルール抽出手段が出力する前記相関ルールを入力し、これを保持する第1の相関ルールデータベース;を備えたことを特徴とするデータマイニング装置。
  • 【請求項2】 (i)前記第1のカテゴリ値変換手段が出力する前記カテゴリ値系列データを入力し、前記カテゴリ値系列データを構成するそれぞれのカテゴリ値に対して対応する属性の名前を付加して品目に変換すると共に、同一測定時点に関する前記品目の集合を生成して品目レコードとして出力する第2の品目化を行う第2の品目化手段; (j)前記第2の品目化手段が出力する複数の前記品目レコードを入力し、これを保持する第2の品目データベース; (k)前記第2の品目データベースの複数の前記品目レコードを入力し、複数の前記品目レコードより、1つまたは複数の品目からなる品目集合間の相関ルールを抽出して出力する第2の相関ルール抽出手段; (l)前記第2の相関ルール抽出手段が出力する前記相関ルールを入力し、これを保持する第2の相関ルールデータベース; (m)前記第1の相関ルールデータベースの前記相関ルールを入力し、前記相関ルールを各時点毎に分解して複数の相関ルール要素を生成し、分解前の相関ルールおよび分解後の複数の前記相関ルール要素を出力する相関ルール分解手段; (n)前記相関ルール分解手段が出力する分解前の前記相関ルールおよび分解後の複数の前記相関ルール要素と、前記第2の相関ルールデータベースの前記相関ルールとを入力し、それぞれの分解前の前記相関ルールに対し、分解後のそれぞれの前記相関ルール要素と同一の相関ルールが前記第2の相関ルールデータベースの前記相関ルールの中に存在するかどうかを判定し、前記相関ルール要素全てに対して同一の相関ルールが存在した場合は、分解前の前記相関ルールは出力せず、そうでない場合は、分解前の前記相関ルールを出力する相関ルール照合を行う相関ルール照合手段; (o)前記相関ルール照合手段が出力する分解前の前記相関ルールを入力し、これを保持する第3の相関ルールデータベース;をさらに備えたことを特徴とする請求項1記載のデータマイニング装置。
  • 【請求項3】 (p)前記時系列データベースの各属性毎の前記時系列データを入力し、前記時系列データを構成する属性値が取り得る範囲を複数のレベルに分割し、
    各測定時点における属性値を該レベルに対応するカテゴリ値に変換することによりカテゴリ値系列データを生成して出力し、さらに、各属性に対する属性値の範囲とカテゴリ値との対応を数値・カテゴリ値対応情報として出力する第2のカテゴリ値変換手段; (q)前記第2のカテゴリ値変換手段が出力する前記数値・カテゴリ値対応情報を入力し、これを保持して出力する第2の数値・カテゴリ値対応保持手段; (r)前記第1の数値・カテゴリ値対応保持手段が出力する前記数値・カテゴリ値対応情報および前記第2の数値・カテゴリ値対応保持手段が出力する前記数値・カテゴリ値対応情報を入力し、これら2つの数値・カテゴリ値対応情報において、各属性毎に、属性値の範囲が重なっているカテゴリ値の対を検出し、そのカテゴリ値の対応関係をカテゴリ値・カテゴリ値対応情報として出力するカテゴリ値・カテゴリ値対応導出手段; (s)前記カテゴリ値・カテゴリ値対応導出手段が出力する前記カテゴリ値・カテゴリ値対応情報を入力し、これを保持して出力するカテゴリ値・カテゴリ値対応保持手段; (t)前記相関ルール分解手段が出力する分解前の前記相関ルールおよび分解後の複数の前記相関ルール要素と、前記カテゴリ値・カテゴリ値対応保持手段が出力する前記カテゴリ値・カテゴリ値対応情報とを入力し、分解後の複数の前記相関ルール要素のそれぞれに対し、その相関ルール要素に含まれるカテゴリ値を、前記カテゴリ値・カテゴリ値対応情報に基づいて変換することによって派生相関ルール要素を生成し、分解前の前記相関ルールおよび前記派生相関ルール要素とを出力する相関ルール変換手段;をさらに備え、 前記第2の品目化手段は、前記第2のカテゴリ値変換手段が出力する前記カテゴリ値系列データを入力し、前記第2の品目化を行い前記相関ルール照合手段は、前記相関ルール変換手段が出力する分解前の前記相関ルールおよび前記派生相関ルール要素と、前記第2の相関ルールデータベースが出力する前記相関ルールとを入力し、前記相関ルール照合を行うことを特徴とする請求項2記載のデータマイニング装置。
  • 【請求項4】 前記時系列データベースの前記時系列データを入力し、前記時系列データにおいて隣り合う測定時点における属性値の変動を算出して時間順に並べることにより変動時系列データを生成して出力する変動算出手段をさらに備え、 前記第1のカテゴリ値変換手段は、前記変動算出手段が出力する前記変動時系列データを入力し、前記第1のカテゴリ値変換を行うことを特徴とする請求項1記載のデータマイニング装置。
  • 【請求項5】 前記時系列データベースは、前記時系列データの他に各属性に対してその属性値間の差が意味を持つか持たないかについて記述した属性情報を有し、 前記変動算出手段は、さらに (i)前記時系列データベースの前記時系列データおよび前記属性情報を入力し、前記属性情報において属性値間の差が意味を持つと記述されていた属性に対する時系列データを差算出対象時系列データとすると共に、また属性値間の差が意味を持たないと記述されていた属性に対する時系列データを変動時系列データとして出力する差算出対象属性判定手段; (j)前記差算出対象属性判定手段が出力する前記差算出対象時系列データを入力し、前記差算出対象時系列データにおいて測定時点が隣接している全ての属性値の対を抽出して複数の隣接属性値対として出力する隣接属性値対抽出手段; (k)前記隣接属性値対抽出手段が出力する複数の前記隣接属性値対を入力し、それぞれの前記隣接属性値対について、測定時点が進んでいる方の属性値から測定時点が遅れているほうの属性値を引くことによって属性値の差を算出し、属性値対差として出力する属性値対差算出手段; (l)前記属性値対差算出手段が出力する前記属性値対差を保持し、前記属性値対差を時間順に並べることによって前記変動時系列データを生成して出力する数値系列保持手段;を備え、 前記第1のカテゴリ値変換手段は、前記差算出対象属性判定手段が出力する前記変動時系列データおよび前記数値系列保持手段が出力する前記変動時系列データを入力し、前記第1のカテゴリ値変換を行うことを特徴とする請求項4記載のデータマイニング装置。
  • 【請求項6】 前記時系列データベースは前記時系列データの他に、各属性に対してその属性値間の比が意味を持つか持たないかについて記述した属性情報を有し、 前記変動算出手段は、さらに (i)前記時系列データベースの前記時系列データおよび前記属性情報を入力し、前記属性情報において属性値間の比が意味を持つと記述されていた属性に対する時系列データを比算出対象時系列データとすると共に、属性値間の比が意味を持たないと記述されていた属性に対する時系列データを変動時系列データとして出力する比算出対象属性判定手段; (j)前記比算出対象属性判定手段が出力する前記比算出対象時系列データを入力し、前記比算出対象時系列データにおいて測定時点が隣接している全ての属性値の対を抽出して複数の隣接属性値対として出力する隣接属性値対抽出手段; (k)前記隣接属性値対抽出手段が出力する複数の前記隣接属性値対を入力し、それぞれの前記隣接属性値対について、測定時点が進んでいる方の属性値を測定時点が遅れているほうの属性値で割ることによって属性値の比を算出し、属性値対比として出力する属性値対比算出手段; (l)前記属性値対比算出手段が出力する前記属性値対比を保持し、前記属性値対比を時間順に並べることによって前記変動時系列データを生成して出力する数値系列保持手段;を備え、 前記第1のカテゴリ値変換手段は、前記比算出対象属性判定手段が出力する前記変動時系列データおよび前記数値系列保持手段が出力する前記変動時系列データを入力し、前記第1のカテゴリ値変換を行うことを特徴とする請求項4記載のデータマイニング装置。
  • 【請求項7】 (i)前記カテゴリ値系列分割手段が出力する前記部分カテゴリ値系列の系列を入力し、各属性に対し、各種の部分カテゴリ値系列が生起する頻度をそれぞれ算出し、部分カテゴリ値系列頻度情報として出力する部分カテゴリ値系列頻度算出手段; (j)前記部分カテゴリ値系列頻度算出手段が出力する前記部分カテゴリ値系列頻度情報を入力し、これを保持して出力する部分カテゴリ値系列頻度保持手段; (k)前記部分カテゴリ値系列頻度保持手段が出力する前記部分カテゴリ値系列頻度情報より、生起する頻度が所定の下限値よりも少ない部分カテゴリ値系列を検出し、小頻度部分カテゴリ値系列として出力する小頻度部分カテゴリ値系列検出手段; (l)前記小頻度部分カテゴリ値系列検出手段が出力する小頻度部分カテゴリ値系列および前記部分カテゴリ値系列頻度保持手段が出力する前記部分カテゴリ値系列頻度情報を入力し、前記小頻度部分カテゴリ値系列および前記小頻度部分カテゴリ値系列と類似した1つまたは複数の部分カテゴリ値系列より構成される集合であり、前記集合に含まれる部分カテゴリ値系列が生起する頻度の和が前記所定の下限値以上となる集合を生成し、さらに前記集合に含まれる部分カテゴリ値系列に対して同一のグループ識別子を一律に割り当て、その対応関係を部分カテゴリ値系列・グループ対応情報として出力する類似部分カテゴリ値系列集合生成手段; (m)前記類似部分カテゴリ値系列集合生成手段が出力する前記部分カテゴリ値系列・グループ対応情報を入力し、これを保持して出力する部分カテゴリ値系列・グループ対応保持手段; (n)前記カテゴリ値系列分割手段が出力する前記部分カテゴリ値系列の系列および、前記部分カテゴリ値系列・グループ対応保持手段が出力する前記部分カテゴリ値系列・グループ対応情報を入力し、前記部分カテゴリ値系列の系列を構成する部分カテゴリ値系列を前記部分カテゴリ値系列・グループ対応表に基づいて変換し、派生部分カテゴリ値系列の系列として出力する類似部分カテゴリ値系列統合手段;をさらに備え、 前記第1の品目化手段は、前記類似部分カテゴリ値系列統合手段が出力する前記派生部分カテゴリ値系列の系列を入力し、前記第1の品目化を行うことを特徴とする請求項1または請求項4記載のデータマイニング装置。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【発明の属する技術分野】本発明は、データベースより相関ルールを抽出するデータマイニング装置に関し、特に、測定される複数種類の属性の値をそれぞれ時系列として記録した時系列データを含むデータベースに適したデータマイニング装置に関する。

    【0002】

    【従来の技術】大規模データベースから知識発見を行う技術であるデータマイニングの一方法として、相関ルールの抽出がある。 相関ルールは、各レコードが品目の集合で構成されるようなデータベースを対象として抽出される。 以下、各レコードが品目の集合で構成されるようなデータベースのことを「品目データベース」と呼ぶことにする。 相関ルールとは、品目データベースにおいて、同一レコード中に現れやすい品目の集合に関するルールのことである。

    【0003】品目データベースからの相関ルール抽出の方法としては、R.AgrawalらによるAprioriと呼ばれるものがあり、文献“Fast Algorithms for Mining Associa
    tionRules”(Proc. of the 20th Int'l Conference on
    Very Large Databases, 1994)、また特開平8-2871
    06号公報に詳述されている(以下、従来技術1と呼ぶ)。 これらの文献では、相関ルール抽出は「支持度」
    と「確信度」と呼ばれる2つの指標を基準としている。
    例えば、 A 1 ,A 2 ,...,A k →B という形式で表現される相関ルール、すなわち「品目の集合(以下、「品目集合」と呼ぶ)A 1 ,A 2 ,...,A kを含むレコードと、さらに品目Bも含むレコードとの間には相関がある」という相関ルールの場合、品目集合A 1 ,
    2 ,...,A k ,Bを含むレコード数の全レコード数に対する比率を相関ルールの支持度と呼び、品目集合A 1 ,
    2 ,...,A kを含むレコードの中で、さらに品目Bも含むレコードの割合を相関ルールの確信度と呼ぶ。 この手法では、これら二つの指標が、予め定められた各々の下限値(それぞれ「最小支持度」、「最小確信度」と呼ぶ)以上となるような相関ルールを高速に抽出することが可能である。

    【0004】一方、時系列データからif then形式のルールを出する方法としては、時系列データを記号化した後にルールを抽出する方式が、特開平9−34719
    に記述されている(以下、従来技術2と呼ぶ)。

    【0005】従来技術2では、時系列データと記号値との対応を格納した記号化用辞書を予め利用者が用意しておく。 そして、時系列データと記号化用辞書を照合することにより、時系列データを記号値に変換する。 その後、得られた記号値列よりif then形式のルールを抽出する。

    【0006】図19に記号化用辞書の例を示す。 フィールド101は記号化の対象となる時系列データの変化パターンであり、フィールド102がフィールド101の変化パターンに対応する記号値である。 図20に分析対象となる時系列の例を示す。 図20では、計測器に表示されている圧力/温度/流量に関するデータを10秒おきにサンプリングしている状態を表している。 図20の時系列データを図19に示す記号化用辞書と照合することにより、例えば図21(a)(b)(c)のように記号値の系列が得られる。 図21では、記号値とともに、その記号値に対応する時間帯が記録されている。 このように、連続値をとる時系列データを記号値の系列に変換することにより、if then形式のルールの抽出が可能になる。

    【0007】

    【発明が解決しようとする課題】従来技術1によれば、
    品目データベースより、多くのレコードに当てはまるような普遍的な相関ルールを抽出することが可能である。
    しかし、属性値の時間的変化を扱うことは考慮されていないため、従来技術1だけでは、時系列データより属性の変化のパターンに関する相関ルールを得ることはできない。

    【0008】一方、従来技術2によれば、測定される複数種類の属性の値をそれぞれ時系列として記録した時系列データよりif thenルールを抽出することが可能となる。 しかし、図21に示すように、時系列データを記号値の系列に変換した結果に関して、各記号値に対応する開始時間、終了時間はまちまちであり、また結果的に記号値に対応する時間幅もまちまちとなる。 従って、記号値の系列に対して従来技術1などを適用するにしても、
    予め定めた一定時間幅における、異なる属性の変化パターンに関する相関ルール、例えば「ある一定時間において、圧力の変化パターンがAである場合は、温度の変化パターンがBとなることが多い」という形の相関ルールを得ることは困難である。

    【0009】この発明は、上記のような課題を解決するためになされたもので、測定される複数種類の属性の値をそれぞれ時系列として記録した時系列データより、予め定めた一定時間幅における各属性の変化パターンに関する相関ルールを抽出するデータマイニング装置を提供することである。

    【0010】

    【課題を解決するための手段】この発明に係るデータマイニング装置は、 (a)測定された複数種類の属性の値をそれぞれ時系列データとして予め保持する時系列データベース; (b)時系列データベースの各属性毎の時系列データを入力し、時系列データを構成する属性値が取り得る範囲を複数のレベルに分割し、各測定時点における属性値をレベルに対応するカテゴリ値に変換することによりカテゴリ値系列データを生成して出力すると共に、各属性に対する属性値の範囲とカテゴリ値との対応を数値・カテゴリ値対応情報として出力する第1のカテゴリ値変換を行う第1のカテゴリ値変換手段; (c)第1のカテゴリ値変換手段が出力する数値・カテゴリ値対応情報を入力し、これを保持して出力する第1
    の数値・カテゴリ値対応保持手段; (d)第1のカテゴリ値変換手段が出力する各属性毎のカテゴリ値系列データを入力し、カテゴリ値系列データを予め定められた時間を単位として分割することにより、カテゴリ値系列の一部である部分カテゴリ値系列の系列を生成して出力するカテゴリ値系列分割手段; (e)カテゴリ値系列分割手段が出力する部分カテゴリ値系列の系列を入力し、部分カテゴリ値系列の系列を構成する各部分カテゴリ値系列に対し、対応する属性の名前を付加することにより品目を生成し、さらに、同一時間範囲に関する品目の集合を生成して品目レコードとして出力する第1の品目化を行う第1の品目化手段; (f)第1の品目化手段が出力する複数の品目レコードを入力し、これを保持する第1の品目データベース; (g)第1の品目データベースの複数の品目レコードを入力し、複数の品目レコードより、1つまたは複数の品目からなる品目集合間の相関ルールを抽出して出力する第1の相関ルール抽出手段; (h)第1の相関ルール抽出手段が出力する相関ルールを入力し、これを保持する第1の相関ルールデータベース;を備えている。

    【0011】また、 (i)第1のカテゴリ値変換手段が出力するカテゴリ値系列データを入力し、カテゴリ値系列データを構成するそれぞれのカテゴリ値に対して対応する属性の名前を付加して品目に変換すると共に、同一測定時点に関する品目の集合を生成して品目レコードとして出力する第2の品目化を行う第2の品目化手段; (j)第2の品目化手段が出力する複数の品目レコードを入力し、これを保持する第2の品目データベース; (k)第2の品目データベースの複数の品目レコードを入力し、複数の品目レコードより、1つまたは複数の品目からなる品目集合間の相関ルールを抽出して出力する第2の相関ルール抽出手段; (l)第2の相関ルール抽出手段が出力する相関ルールを入力し、これを保持する第2の相関ルールデータベース; (m)第1の相関ルールデータベースの相関ルールを入力し、相関ルールを各時点毎に分解して複数の相関ルール要素を生成し、分解前の相関ルールおよび分解後の複数の相関ルール要素を出力する相関ルール分解手段; (n)相関ルール分解手段が出力する分解前の相関ルールおよび分解後の複数の相関ルール要素と、第2の相関ルールデータベースの相関ルールとを入力し、それぞれの分解前の相関ルールに対し、分解後のそれぞれの相関ルール要素と同一の相関ルールが第2の相関ルールデータベースの相関ルールの中に存在するかどうかを判定し、相関ルール要素全てに対して同一の相関ルールが存在した場合は、分解前の相関ルールは出力せず、そうでない場合は、分解前の相関ルールを出力する相関ルール照合を行う相関ルール照合手段; (o)相関ルール照合手段が出力する分解前の相関ルールを入力し、これを保持する第3の相関ルールデータベース;をさらに備えている。

    【0012】また、 (p)時系列データベースの各属性毎の時系列データを入力し、時系列データを構成する属性値が取り得る範囲を複数のレベルに分割し、各測定時点における属性値をレベルに対応するカテゴリ値に変換することによりカテゴリ値系列データを生成して出力し、さらに、各属性に対する属性値の範囲とカテゴリ値との対応を数値・カテゴリ値対応情報として出力する第2のカテゴリ値変換手段; (q)第2のカテゴリ値変換手段が出力する数値・カテゴリ値対応情報を入力し、これを保持して出力する第2
    の数値・カテゴリ値対応保持手段; (r)第1の数値・カテゴリ値対応保持手段が出力する数値・カテゴリ値対応情報および第2の数値・カテゴリ値対応保持手段が出力する数値・カテゴリ値対応情報を入力し、これら2つの数値・カテゴリ値対応情報において、各属性毎に、属性値の範囲が重なっているカテゴリ値の対を検出し、そのカテゴリ値の対応関係をカテゴリ値・カテゴリ値対応情報として出力するカテゴリ値・カテゴリ値対応導出手段; (s)カテゴリ値・カテゴリ値対応導出手段が出力するカテゴリ値・カテゴリ値対応情報を入力し、これを保持して出力するカテゴリ値・カテゴリ値対応保持手段; (t)相関ルール分解手段が出力する分解前の相関ルールおよび分解後の複数の相関ルール要素と、カテゴリ値・カテゴリ値対応保持手段が出力するカテゴリ値・カテゴリ値対応情報とを入力し、分解後の複数の相関ルール要素のそれぞれに対し、その相関ルール要素に含まれるカテゴリ値を、カテゴリ値・カテゴリ値対応情報に基づいて変換することによって派生相関ルール要素を生成し、分解前の相関ルールおよび派生相関ルール要素とを出力する相関ルール変換手段;をさらに備え、第2の品目化手段は、第2のカテゴリ値変換手段が出力するカテゴリ値系列データを入力し、第2の品目化を行い相関ルール照合手段は、相関ルール変換手段が出力する分解前の相関ルールおよび派生相関ルール要素と、第2の相関ルールデータベースが出力する相関ルールとを入力し、
    相関ルール照合を行う。

    【0013】また、時系列データベースの時系列データを入力し、時系列データにおいて隣り合う測定時点における属性値の変動を算出して時間順に並べることにより変動時系列データを生成して出力する変動算出手段をさらに備え、第1のカテゴリ値変換手段は、変動算出手段が出力する変動時系列データを入力し、第1のカテゴリ値変換を行う。

    【0014】また、時系列データベースは、時系列データの他に各属性に対してその属性値間の差が意味を持つか持たないかについて記述した属性情報を有し、変動算出手段は、さらに (i)時系列データベースの時系列データおよび属性情報を入力し、属性情報において属性値間の差が意味を持つと記述されていた属性に対する時系列データを差算出対象時系列データとすると共に、また属性値間の差が意味を持たないと記述されていた属性に対する時系列データを変動時系列データとして出力する差算出対象属性判定手段; (j)差算出対象属性判定手段が出力する差算出対象時系列データを入力し、差算出対象時系列データにおいて測定時点が隣接している全ての属性値の対を抽出して複数の隣接属性値対として出力する隣接属性値対抽出手段; (k)隣接属性値対抽出手段が出力する複数の隣接属性値対を入力し、それぞれの隣接属性値対について、測定時点が進んでいる方の属性値から測定時点が遅れているほうの属性値を引くことによって属性値の差を算出し、
    属性値対差として出力する属性値対差算出手段; (l)属性値対差算出手段が出力する属性値対差を保持し、属性値対差を時間順に並べることによって変動時系列データを生成して出力する数値系列保持手段;を備え、第1のカテゴリ値変換手段は、差算出対象属性判定手段が出力する変動時系列データおよび数値系列保持手段が出力する変動時系列データを入力し、第1のカテゴリ値変換を行う。

    【0015】また、時系列データベースは時系列データの他に、各属性に対してその属性値間の比が意味を持つか持たないかについて記述した属性情報を有し、変動算出手段は、さらに (i)時系列データベースの時系列データおよび属性情報を入力し、属性情報において属性値間の比が意味を持つと記述されていた属性に対する時系列データを比算出対象時系列データとすると共に、属性値間の比が意味を持たないと記述されていた属性に対する時系列データを変動時系列データとして出力する比算出対象属性判定手段; (j)比算出対象属性判定手段が出力する比算出対象時系列データを入力し、比算出対象時系列データにおいて測定時点が隣接している全ての属性値の対を抽出して複数の隣接属性値対として出力する隣接属性値対抽出手段; (k)隣接属性値対抽出手段が出力する複数の隣接属性値対を入力し、それぞれの隣接属性値対について、測定時点が進んでいる方の属性値を測定時点が遅れているほうの属性値で割ることによって属性値の比を算出し、属性値対比として出力する属性値対比算出手段; (l)属性値対比算出手段が出力する属性値対比を保持し、属性値対比を時間順に並べることによって変動時系列データを生成して出力する数値系列保持手段;を備え、第1のカテゴリ値変換手段は、比算出対象属性判定手段が出力する変動時系列データおよび数値系列保持手段が出力する変動時系列データを入力し、第1のカテゴリ値変換を行う。

    【0016】また、(i)カテゴリ値系列分割手段が出力する部分カテゴリ値系列の系列を入力し、各属性に対し、各種の部分カテゴリ値系列が生起する頻度をそれぞれ算出し、部分カテゴリ値系列頻度情報として出力する部分カテゴリ値系列頻度算出手段; (j)部分カテゴリ値系列頻度算出手段が出力する部分カテゴリ値系列頻度情報を入力し、これを保持して出力する部分カテゴリ値系列頻度保持手段; (k)部分カテゴリ値系列頻度保持手段が出力する部分カテゴリ値系列頻度情報より、生起する頻度が所定の下限値よりも少ない部分カテゴリ値系列を検出し、小頻度部分カテゴリ値系列として出力する小頻度部分カテゴリ値系列検出手段; (l)小頻度部分カテゴリ値系列検出手段が出力する小頻度部分カテゴリ値系列および部分カテゴリ値系列頻度保持手段が出力する部分カテゴリ値系列頻度情報を入力し、小頻度部分カテゴリ値系列および小頻度部分カテゴリ値系列と類似した1つまたは複数の部分カテゴリ値系列より構成される集合であり、集合に含まれる部分カテゴリ値系列が生起する頻度の和が所定の下限値以上となる集合を生成し、さらに集合に含まれる部分カテゴリ値系列に対して同一のグループ識別子を一律に割り当て、
    その対応関係を部分カテゴリ値系列・グループ対応情報として出力する類似部分カテゴリ値系列集合生成手段; (m)類似部分カテゴリ値系列集合生成手段が出力する部分カテゴリ値系列・グループ対応情報を入力し、これを保持して出力する部分カテゴリ値系列・グループ対応保持手段; (n)カテゴリ値系列分割手段が出力する部分カテゴリ値系列の系列および、部分カテゴリ値系列・グループ対応保持手段が出力する部分カテゴリ値系列・グループ対応情報を入力し、部分カテゴリ値系列の系列を構成する部分カテゴリ値系列を部分カテゴリ値系列・グループ対応表に基づいて変換し、派生部分カテゴリ値系列の系列として出力する類似部分カテゴリ値系列統合手段;をさらに備え、第1の品目化手段は、類似部分カテゴリ値系列統合手段が出力する派生部分カテゴリ値系列の系列を入力し、第1の品目化を行う。

    【0017】

    【発明の実施の形態】実施の形態1. 図1に実施の形態1におけるデータマイニング装置のブロック図を示す。
    図1において、時系列データベース401は、測定される複数種類の属性の値をそれぞれ時系列データとして記録したデータベースである。

    【0018】図1の時系列データベース401の内容の例を図2に示す。 図2は、ある人間に関し、ある時点を起点として1ヶ月毎にデータを取った結果を示している。 例えば、最初の測定では握力が36[kg]で最高血圧が111[mmHg]、その一ヶ月後の測定では握力が39[k
    g]で最高血圧が108[mmHg]であったことを示している。 また、握力と最高血圧の他にも様々な属性に関するデータを取っていることを想定している。 本明細書記載の実施の形態では、これらの属性が全て数値属性である場合について述べる。

    【0019】図1において、カテゴリ値変換手段402
    では、各属性について、属性値の取り得る範囲を複数のレベルに分割し、各レベルに対してカテゴリ値を割り当てる。 そして属性値の範囲とカテゴリ値との対応を出力し、数値・カテゴリ値対応保持手段403に保存する。
    この、属性値の範囲とカテゴリ値との対応に関する情報のことを、「数値・カテゴリ値対応情報」と呼ぶ。 属性値の分割は、例えば属性値の最大値と最小値を時系列データベース401より算出し、予め定めたレベル数により、最小値から最大値までの範囲を等分割するなどの処理により、算出できる。 属性値の分割方法については、
    パターン生成条件設定手段405により、事前にユーザが設定しておく。

    【0020】握力と最高血圧に関する数値・カテゴリ値対応情報の例を図3に示す。 握力の場合、30以下がカテゴリ値1に、30から40までの範囲がカテゴリ値2
    に、40から50までの範囲がカテゴリ値3に、50以上がカテゴリ値4に、それぞれ対応していることを示す。 最高血圧についても同様である。

    【0021】またカテゴリ値変換手段402では、数値・カテゴリ値対応情報に基づいて、数値の系列として表されていた時系列データを、カテゴリ値の系列に変換する。 図2に示す時系列データを、図3に示す数値・カテゴリ値対応情報に基づいて変換した結果得られるカテゴリ値系列を図4に示す。 例えば、第1番目の月の握力は36で、図3によると握力は30から40までがカテゴリ値2に対応しているので、結局カテゴリ値2に変換されて出力される。 他の数値に関しても同様である。

    【0022】図1のカテゴリ値系列分割手段404では、カテゴリ値変換手段402が出力したカテゴリ値系列データを、予め定められた時間を単位として分割して出力する。 分割されたそれぞれのカテゴリ値系列のことを「部分カテゴリ値系列」と呼ぶ。 つまり、カテゴリ値系列分割手段404の出力は、部分カテゴリ値系列の系列である。 分割の時間単位については、パターン生成条件設定手段405により、事前にユーザが設定しておく。 また、分割に関しては重複を許す。 つまり、同一のカテゴリ値が複数の部分カテゴリ値系列に含まれていても良いものとする。

    【0023】図4のカテゴリ値系列データを分割の時間単位を3ヶ月また2ヶ月分の重複を許して分割することにより得られる部分カテゴリ値系列の系列を図5に示す。

    【0024】図1の品目化手段406では、まず、カテゴリ値系列分割手段404が出力する部分カテゴリ値系列の系列の要素である部分カテゴリ値系列に対して、対応する属性の名前を付加する。 これが品目であり、さらに、同一時間範囲に関する品目をまとめることによって、品目レコードを生成して出力する。 品目化手段40
    6が出力した品目レコードは、第1の品目データベースである品目データベース407に保存する。

    【0025】図5の部分カテゴリ値系列の系列を品目化して得られる品目データベースの内容の例を図6に示す。 図6では、各品目を記号「,」で区切って示している。 例えば、図5において第1番目から第3番目の月にかけての握力に関する部分カテゴリ値系列が2-2-3なので、これをまとめて「握力:2-2-3」という品目とする。 また、同じく第1番目から第3番目の月にかけての最高血圧に関する部分カテゴリ値系列は3-2-2なので、
    同様にして「最高血圧:3-2-2」という品目とする。 そして、第1番目から第3番目の月にかけての属性値の変化を表す品目「握力:2-2-3」「最高血圧:3-2-2」を集めることにより、図6の1行目の品目レコードとしている。 また図4の第2番目から第4番目の月にかけての変化を表す品目は図6の2行目の品目レコードとなり、以下同様にして品目レコードを作成し、品目データベース407に保存する。

    【0026】図1の相関ルール抽出手段408は、品目データベース407に保存されている複数の品目レコードを入力として、品目集合間の相関ルールを抽出して出力する。 出力した相関ルールは、相関ルールデータベース410に保存する。 相関ルール抽出手段408の動作については、従来技術1の文献を参照のこと。 また、相関ルール抽出の際の最小支持度や最小確信度等の条件は、相関ルール抽出条件設定手段409により、事前にユーザが設定しておく。

    【0027】図6に示す品目データベースの内容より、
    例えば「握力:3-3-2→最高血圧:2-1-2」なる相関ルールが抽出されることが期待される。 この相関ルールは部分カテゴリ値系列で表現されているが、これを図1の数値・カテゴリ値対応保持手段403に保存されている数値・カテゴリ値対応情報を参照して変換することにより、「握力:40-50,40-50,30-40→最高血圧:100-110,1
    00以下,100-110」となり、人間が見て理解できる形式の相関ルールになる。 これは、「3ヶ月にわたって、握力が40-50,40-50,30-40というパターンで変化する場合は、同時に最高血圧が100-110,100以下,100-110というパターンで変化していることが多い」ことを表す相関ルールである。

    【0028】このように、測定される複数種類の属性の値をそれぞれ時系列として記録した時系列データベースにおいて、まず各属性に関する数値系列をカテゴリ値の系列に変換した後、カテゴリ値系列を予め定めた一定時間幅で分割し、分割されたそれぞれのカテゴリ値系列をパターンと見なすことによって、予め定めた一定時間幅における、各属性の変化パターンに関する相関ルールの抽出が可能になるという効果がある。

    【0029】実施の形態2. 図7に実施の形態2におけるデータマイニング装置のブロック図を示す。 時系列データベース401、カテゴリ値変換手段402、数値・
    カテゴリ値対応保持手段403、カテゴリ値系列分割手段404、パターン生成条件設定手段405、第1の品目化手段406、品目データベース407、第1の相関ルール抽出手段408、相関ルール抽出条件設定手段4
    09、第1の相関ルールデータベース410の動作は実施の形態1で説明した内容と同一である。 実施の形態1
    で説明した構成により、第1の相関ルールデータベース410内に、各属性の時間的な変化パターンに関する相関ルールが格納される。

    【0030】一方、図7において、カテゴリ値変換手段402が出力したカテゴリ値系列データを、さらに第2
    の品目化手段1001で品目化することにより、複数の品目レコードを生成する。 品目化に際しては、まずカテゴリ値系列データを構成する各カテゴリ値に対して、対応する属性の名前を付加する。 これが品目であり、さらに同一測定時点に関する品目をまとめることによって、
    品目レコードを生成して出力する。 得られた複数の品目レコードは、第2の品目データベース1002に保存される。

    【0031】図4に示すカテゴリ値系列データを品目化して得られる第2の品目データベース1002の内容の例を図8に示す。 例えば、図4において第1番目の月の握力のカテゴリ値が2なので、これをまとめて「握力:
    2」という品目とし、同じく第1番目の月の最高血圧のカテゴリ値が3なので、これをまとめて「最高血圧:
    3」という品目とする。 そして、第1番目の月のカテゴリ値に関する品目「握力:2」「最高血圧:3」を集めることにより、図8の1行目の品目レコードとしている。

    【0032】図7の第2の相関ルール抽出手段1003
    は、第2の品目データベース1002に保存されている複数の品目レコードを入力として、品目集合間の相関ルールを抽出して出力する。 第2の相関ルール抽出手段1
    003の動作は、第1の相関ルール抽出手段408の動作と同一である。 また、相関ルール抽出の際の条件は、
    第2の相関ルール抽出条件設定手段1004によって、
    事前にユーザが設定しておく。 出力した相関ルールは、
    第2の相関ルールデータベース1005に保存する。 図8に示した品目データベースの内容からは、例えば「握力:3→最高血圧:2」のような相関ルールが抽出されることが期待される。

    【0033】一方、図7の相関ルール分解手段1006
    は、第1の相関ルールデータベース410に保存されている相関ルールを各時点毎に分解する。 分解により得られる各時点毎のそれぞれの相関ルールのことを「相関ルール要素」と呼ぶ。 相関ルール分解手段1006は、複数の相関ルール要素を、分解前の相関ルールとともに出力する。

    【0034】例えば、第1の相関ルールデータベース4
    10内に「握力:3-3-2→最高血圧:2-1-2」なる相関ルールが保存されているとする。 これは属性「握力」と属性「最高血圧」に関する時間的な変化パターンの関係を表す相関ルールであるが、これを各時点毎に分解することにより、「握力:3→最高血圧:2」「握力: 3→最高血圧: 1」「握力: 2→最高血圧: 2」なる3つの相関ルール要素が生成される。

    【0035】図7の相関ルール照合手段1007は、相関ルール分解手段1006が出力するそれぞれの相関ルールに対し、対応する複数の相関ルール要素と同一のものがそれぞれ第2の相関ルールデータベース1005内に存在するかどうかを判定する。 全ての相関ルール要素に対して、同一のものが第2の相関ルールデータベース内に存在した場合、対応する分解前の相関ルールは、時間の要素を含まない相関ルールより導出可能な自明な相関ルールであると判断し出力しない。 そうでない場合は、対応する分解前の相関ルールを出力する。 相関ルール照合手段1007が出力した相関ルールは、第3の相関ルールデータベース1008に保存する。

    【0036】例えば、図7の相関ルール分解手段100
    6が、分解前の相関ルール「握力:3-3-2→最高血圧:2
    -1-2」および、分解後の相関ルール要素「握力:3→最高血圧:2」「握力: 3→最高血圧: 1」「握力: 2→
    最高血圧: 2」を出力したとする。 この時、これら3つの相関ルール要素と同一のものが第2の相関ルールデータベース1005内に存在するかどうかを調査する。 第2の相関ルールデータベース1005内に、これら3つの相関ルール要素と同一のものがそれぞれ存在した場合、時間の要素を含む相関ルール「握力:3-3-2→最高血圧:2-1-2」は、第2の相関ルールデータベース10
    05に存在する時間の要素を含まない相関ルール「握力:3→最高血圧:2」「握力: 3→最高血圧: 1」「握力: 2→最高血圧: 2」より導出可能であると判断され、出力されない。 そうでない場合、時間の要素を含む相関ルール「握力:3-3-2→最高血圧:2-1-2」は、時間の要素を含まない相関ルールからは導出不可能であり、
    時間の要素を含む相関ルールとして特別な意味を持つ可能性があると判断し出力する。

    【0037】このように、各属性の時間的な変化パターンに関する相関ルールを各時点毎の相関ルール要素に分解し、それらが各属性に関する時間の要素を含まない相関ルールに含まれるかどうかを判定することによって、
    時間の要素を含む相関ルールとして特別な意味を持つ可能性があるものだけを出力するので、ユーザの解析作業が軽減されるという効果がある。

    【0038】実施の形態3. 図9に実施の形態3におけるデータマイニング装置のブロック図を示す。 時系列データベース401、第1のカテゴリ値変換手段402、
    数値・カテゴリ値対応保持手段403、カテゴリ値系列分割手段404、パターン生成条件設定手段405、第1の品目化手段406、品目データベース407、第1
    の相関ルール抽出手段408、相関ルール抽出条件設定手段409、第1の相関ルールデータベース410の動作は実施の形態1で説明した内容と同一である。 実施の形態1で説明した構成により、第1の相関ルールデータベース410内に、各属性の時間的な変化パターンに関する相関ルールが格納される。

    【0039】一方、図9の、第2のカテゴリ値変換手段1201は、時系列データベース401が出力した時系列データをカテゴリ値系列データに変換して出力する。
    また、変換の際に使用する数値・カテゴリ値対応情報は第2の数値・カテゴリ値対応保持手段1202に保存する。 第2のカテゴリ値変換手段1201の動作は、第1
    のカテゴリ値変換手段402と同一であるが、変換の仕方が異なる可能性がある。 その場合、第1の数値・カテゴリ値対応保持手段403の内容と、第2の数値・カテゴリ値対応保持手段1202の内容とは異なる。 なお、
    属性値の分割方法については、パターン生成条件設定手段1203により、事前にユーザが設定しておく。

    【0040】以下、第1の数値・カテゴリ値対応保持手段403に保持されている属性「握力」と属性「最高血圧」に関する数値・カテゴリ値対応情報が図3であり、
    第2の数値・カテゴリ値対応保持手段1202に保持されている属性「握力」と属性「最高血圧」に関する数値・カテゴリ値対応情報が図10であるような場合を例にとって考える。

    【0041】図9において、第2のカテゴリ値変換手段1201が出力するカテゴリ値系列データは、第2の品目化手段1001によって品目化され、複数の品目レコードが生成される。 複数の品目レコードは、第2の品目データベース1002に保存される。 第2の品目化手段1001の動作は、実施の形態2で説明した内容と同一である。

    【0042】第2の相関ルール抽出手段1003は、第2の品目データベース1002に保存されている複数の品目レコードを入力として、品目集合間の相関ルールを抽出して出力する。 第2の相関ルール抽出手段1003
    の動作は、第1の相関ルール抽出手段408の動作と同じである。 また、相関ルール抽出の際の条件は、第2の相関ルール抽出条件設定手段1004によって、事前にユーザが設定しておく。 出力した相関ルールは第2の相関ルールデータベース1005に保存する。 図10に示した数値・カテゴリ値対応情報に基づいて処理を行うことにより、例えば「握力:11→最高血圧:11」のような相関ルールが抽出されることが期待される。

    【0043】一方、図9において、カテゴリ値・カテゴリ値対応導出手段1204は、第1の数値・カテゴリ値対応保持手段403が出力する数値・カテゴリ値対応情報と、第2の数値・カテゴリ値対応保持手段1202が出力する数値・カテゴリ値対応情報とを入力として、これら2つの数値・カテゴリ値対応情報において、各属性毎に、属性値の範囲が重なっているようなカテゴリ値の対を検出する。 そして、検出されたカテゴリ値間の対応関係を出力する。 この、検出されたカテゴリ値間の対応関係に関する情報のことを、「カテゴリ値・カテゴリ値対応情報」と呼ぶ。 出力されたカテゴリ値・カテゴリ値対応情報は、カテゴリ値・カテゴリ値対応保持手段12
    05に保持する。

    【0044】図3と図10に示す数値・カテゴリ値対応情報から生成されるカテゴリ値・カテゴリ値対応情報を図11に示す。 属性「握力」について考えると、図3のカテゴリ値1(30以下の範囲の属性値に対応),2(30-
    40の範囲の属性値に対応),3(40-50の範囲の属性値に対応)は、それぞれ図10のカテゴリ値11(45以下の範囲の属性値に対応)と、属性値の範囲が重なっている。 従って、図3のカテゴリ値1,2,3と図10のカテゴリ値11とが対応することになり、これは図11の属性「握力」に関するカテゴリ値・カテゴリ値対応情報の第1番目の欄に記述されている。 以下、同様にして図11のカテゴリ値・カテゴリ値対応情報が得られる。

    【0045】また、図9の相関ルール分解手段1006
    は、第1の相関ルールデータベース410に保存されている相関ルールを各時点毎に分解して複数の相関ルール要素を生成して、分解前の相関ルールとともに出力する。 相関ルール分解手段1006の動作は、実施の形態2に記載されている内容と同一である。

    【0046】図9の相関ルール変換手段1206は、相関ルール分解手段1006が出力する相関ルール要素に含まれるカテゴリ値を、カテゴリ値・カテゴリ値対応保持手段1205に保持されているカテゴリ値・カテゴリ値対応情報に基づいて変換する。 変換により得られる相関ルール要素を「派生相関ルール要素」と呼ぶ。 相関ルール変換手段1206は、派生相関ルール要素を、分解前の相関ルールとともに出力する。

    【0047】例えば、図9の相関ルール分解手段100
    6が、分解前の相関ルール「握力:3-3-2→最高血圧:2
    -1-2」および、分解後の相関ルール要素「握力:3→最高血圧:2」「握力: 3→最高血圧: 1」「握力: 2→
    最高血圧: 2」を出力したとする。 相関ルール変換手段1206は、これらの相関ルール要素に含まれるカテゴリ値を図11のカテゴリ値・カテゴリ値対応情報に基づいて変換する。 相関ルール要素「握力:3→最高血圧:
    2」について考えると、「握力:3」は図11によると「握力:11」に対応し、「最高血圧:2」は「最高血圧:11」に対応するので、結局「握力:11→最高血圧:
    11」なる派生相関ルール要素が得られることになる。 また、他の相関ルール要素についても同様にして変換され、同一の派生相関ルール要素「握力:11→最高血圧:
    11」が得られる。 最終的に、相関ルール変換手段120
    6は、分解前の相関ルール「握力:3-3-2→最高血圧:2
    -1-2」および派生相関ルール要素「握力:11→最高血圧:11」を出力する。

    【0048】図9の相関ルール照合手段1007は、相関ルール変換手段1206が出力するそれぞれの相関ルールに対し、対応する派生相関ルール要素と同一のものが第2の相関ルールデータベース1005内に存在するかどうかを判定する。 全ての派生相関ルール要素に対して、同一のものが第2の相関ルールデータベース100
    5内に存在した場合、対応する分解前の相関ルールは、
    第2の相関ルールデータベース1005に含まれる、時間の要素を含まない相関ルールより導出可能な自明な相関ルールであると判断し出力しない。 そうでない場合は、対応する分解前の相関ルールを出力する。 出力した相関ルールは、第3の相関ルールデータベース1008
    に保存する。

    【0049】例えば、図9の相関ルール変換手段120
    6が、分解前の相関ルール「握力:3-3-2→最高血圧:2
    -1-2」および派生相関ルール要素「握力:11→最高血圧:11」を出力した場合、この派生相関ルール要素と同一のものが第2の相関ルールデータベース1005内に存在するかどうかを調査する。 第2の相関ルールデータベース1005内に、この派生相関ルール要素と同一のものが存在した場合、時間の要素を含む相関ルール「握力:3-3-2→最高血圧:2-1-2」は、第2の相関ルールデータベース1005に含まれる、時間の要素を含まない相関ルール「握力:11→最高血圧:11」より導出可能であると判断され、出力されない。 そうでない場合、時間の要素を含む相関ルール「握力:3-3-2→最高血圧:2-1
    -2」は、時間の要素を含まない相関ルールからは導出不可能であり、時間の要素を含む相関ルールとして特別な意味を持つ可能性があると判断し出力する。

    【0050】このように、各属性の時間的な変化パターンに関する相関ルールを各時点毎の相関ルール要素に分解し、それらが各属性に関する時間の要素を含まない相関ルールに含まれるかどうかを判定する際に、相関ルール抽出の際の、数値からカテゴリ値への変換の境界値が異なっていても良いので、何回も境界値を変えて時間的な変化パターンに関する相関ルールを得る場合でも、時間の要素を含まない相関ルールに関しては同じものを再使用することができるという効果がある。

    【0051】実施の形態4. 図12に実施の形態4におけるデータマイニング装置のブロック図を示す。 変動算出手段1501では、各属性の時系列データにおいて、
    隣り合う測定時点における属性値の変動を算出して時間順に並べることにより、変動の系列を出力する。 これを「変動時系列データ」と呼ぶ。 変動の算出方法としては、属性値間の差を算出する方法を用いる。

    【0052】時系列データベース401は時系列データの他に、各属性に対してその属性値間の差が意味を持つか持たないかについて記述した属性情報を含むものとする。 例えば、「体温」「握力」「最高血圧」などの属性は、属性値間の差が意味を持つので、予め時系列データベース401内の属性情報にはそのように記述しておく。 また、変動算出手段1501は、差算出対象属性判定手段1502、隣接属性値対抽出手段1503、属性値対差算出手段1504、数値系列保持手段1505より構成される。

    【0053】図12の差算出対象属性判定手段1502
    は、時系列データベース401内の属性情報において、
    属性値間の差が意味を持つと記述されていた属性に対する時系列データについては、差算出の対象と見なして出力する。 差算出の対象となる時系列データのことを、
    「差算出対象時系列データ」と呼ぶ。 また、属性値間の差が意味を持たないと記述されていた属性に対する時系列データに関しては、差算出の対象とはせず、仮に変動の算出は既に終わっているものと見なして、変動時系列データとして出力する。

    【0054】図12の隣接属性値対抽出手段1503
    は、差算出対象属性判定手段1502が出力する差算出対象時系列データにおいて、測定時点が隣接しているような全ての属性値の対を抽出する。 それぞれの対のことを「隣接属性値対」と呼ぶ。

    【0055】以下、図2に示す時系列データを例に取って説明する。 図2の握力の時系列データからは、時間的に隣接した属性値を順次取り出していくことにより、(3
    6,39),(39,42),(42,41),(41,39),(39,43),(43,45),・・
    ・なる隣接属性値対の系列が得られる。

    【0056】図12の属性値対差算出手段1504は、
    隣接属性値対抽出手段1503が出力する隣接属性値対のそれぞれについて、測定時点が進んでいる方の属性値から測定時点が遅れているほうの属性値を引くことによって属性値の差を算出する。 これを「属性値対差」と呼ぶ。

    【0057】例えば、隣接属性値対(36,39)を考えると、測定時点が進んでいる方の属性値39から測定時点が遅れているほうの属性値36を引くことにより、属性値対差+3が得られる。

    【0058】図12の数値系列保持手段1505は、属性値対差算出手段1504が出力する属性値対差を保持し、属性値対差を時間順に並べることによって変動時系列データを生成して出力する。 図2の時系列データより得られる変動時系列データの例を図13に示す。 例えば、属性「握力」の一番上の欄には、隣接属性値対(36,
    39)より得られる属性値対差+3が記述されている。

    【0059】図12のカテゴリ値変換手段402は、変動算出手段1501が出力する変動時系列データを入力として処理を行う。 つまり、差算出対象属性判定手段1
    502において、差算出の対象と見なされた時系列データに関しては数値系列保持手段1505の出力である変動時系列データが、また、差算出の対象とはされなかった時系列データに関しては、差算出対象判定手段150
    2の出力である変動時系列データが、カテゴリ値変換手段402の入力となる。 カテゴリ値変換手段402以下、数値・カテゴリ値対応保持手段403、カテゴリ値系列分割手段404、パターン生成条件設定手段40
    5、品目化手段406、品目データベース407、相関ルール抽出手段408、相関ルール抽出条件設定手段4
    09、相関ルールデータベース410の動作は、実施の形態1で説明した内容と同一である。

    【0060】結果的に相関ルール抽出手段408の出力として、例えば「3ヶ月にわたって、握力が1−3上昇,変化なし,1−3下降というパターンで変化する場合は、同時に最高血圧が5−15下降,変化なし,5−
    15上昇というパターンで変化していることが多い」のような内容の相関ルールが抽出されることが期待される。

    【0061】このように、測定される複数種類の属性の値をそれぞれ時系列として記録した時系列データを、各属性についてまず隣り合う時点における属性値の変動を算出して変動時系列データとして処理を行うことにより、各属性の各時点を基準とした相対的な変動のパターンに関する相関ルールの抽出が可能になるという効果がある。

    【0062】さらに、属性値の変動算出に際して属性値の差を算出することにより、属性値間の差が意味を持つような属性に対して、有効な相関ルールの抽出が可能になるという効果がある。

    【0063】実施の形態5. 図14に実施の形態5におけるデータマイニング装置のブロック図を示す。 変動算出手段1501では、各属性の時系列データにおいて、
    隣り合う測定時点における属性値の変動を算出して時間順に並べることにより、変動時系列データを出力する。
    変動の算出方法としては、属性値間の比を算出する方法を用いる。

    【0064】時系列データベース401は、時系列データの他に各属性に対してその属性値間の比が意味を持つか持たないかについて記述した属性情報を含むものとする。 例えば、「体重」「握力」「最高血圧」などの属性は、属性値間の比が意味を持つので、予め属性情報にはそのように記述しておく。 また、変動算出手段1501
    は、比算出対象属性判定手段1701、隣接属性値対抽出手段1702、属性値対比算出手段1703、数値系列保持手段1704より構成される。

    【0065】図14の比算出対象属性判定手段1701
    は、時系列データベース401内の属性情報において、
    属性値間の比が意味を持つと記述されていた属性に対する時系列データについては、比算出の対象と見なして出力する。 比算出の対象となる時系列データのことを、
    「比算出対象時系列データ」と呼ぶ。 また、属性値間の比が意味を持たないと記述されていた属性に対する時系列データに関しては、比算出の対象とはせず、仮に変動の算出は既に終わっているものと見なして、変動時系列データとして出力する。

    【0066】図14の隣接属性値対抽出手段1702
    は、比算出対象属性判定手段1701が出力する比算出対象時系列データにおいて、測定時点が隣接しているような属性値の対、つまり隣接属性値対を全て抽出する。

    【0067】以下、図2に示す時系列データを例に取って説明する。 図2の握力の時系列データからは、時間的に隣接した属性値を順次取り出していくことにより、(3
    6,39),(39,42),(42,41),(41,39),(39,43),(43,45),…なる隣接属性値対の系列が得られる。

    【0068】図14の属性値対比算出手段1703は、
    隣接属性値対抽出手段1702が出力する隣接属性値対のそれぞれについて、測定時点が進んでいる方の属性値を測定時点が遅れているほうの属性値で割ることによって属性値の比を算出する。 これを「属性値対比」と呼ぶ。

    【0069】例えば、隣接属性値対(36,39)を考えると、測定時点が進んでいる方の属性値39を測定時点が遅れているほうの属性値36で割ることにより、属性値対比1.083が得られる。

    【0070】図14の数値系列保持手段1704は、属性値対比算出手段1703が出力する属性値対比を保持し、属性値対比を時間順に並べることによって変動時系列データを生成して出力する。 図2の時系列データより得られる変動時系列データの例を図15に示す。 例えば、属性「握力」の一番上の欄には、隣接属性値対(36,
    39)より得られる属性値対比1.083が記述されている。

    【0071】図14のカテゴリ値変換手段402は、変動算出手段1501が出力する変動時系列データを入力として処理を行う。 つまり、比算出対象属性判定手段1
    701において、比算出の対象と見なされた時系列データに関しては数値系列保持手段1704の出力である変動時系列データが、また、比算出の対象とはされなかった時系列データに関しては、比算出対象判定手段170
    1の出力である変動時系列データが、カテゴリ値変換手段402の入力となる。 カテゴリ値変換手段402以下、数値・カテゴリ値対応保持手段403、カテゴリ値系列分割手段404、パターン生成条件設定手段40
    5、品目化手段406、品目データベース407、相関ルール抽出手段408、相関ルール抽出条件設定手段4
    09、相関ルールデータベース410の動作は、実施の形態1で説明した内容と同一である。

    【0072】結果的に相関ルール抽出手段408の出力として、例えば「3ヶ月にわたって、握力が1.05−
    1.10倍,1.05−1.10倍,0.95−1.0
    0倍というパターンで変化する場合は、同時に最高血圧が0.95−1.00倍,0.95−1.00倍,1.
    05−1.10倍というパターンで変化していることが多い」ような内容の相関ルールが抽出されることが期待される。

    【0073】このように、属性値の変動算出に際して属性値の比を算出することにより、属性値間の比が意味を持つような属性に対して、有効な相関ルールの抽出が可能になるという効果がある。

    【0074】実施の形態6. 図16に実施の形態6におけるデータマイニング装置のブロック図を示す。 時系列データベース401、カテゴリ値変換手段402、数値・カテゴリ値対応保持手段403、カテゴリ値系列分割手段404、パターン生成条件設定手段405の動作は実施の形態1で説明した内容と同一である。

    【0075】図16の部分カテゴリ値系列頻度算出手段1901は、カテゴリ値系列分割手段404が出力する部分カテゴリ値系列の系列を入力として、各属性に関して、各部分カテゴリ値系列が生起する頻度をそれぞれ算出して出力する。 出力される、部分カテゴリ値系列と頻度との対応情報のことを、「部分カテゴリ値系列頻度情報」と呼ぶ。 部分カテゴリ値系列頻度情報は、部分カテゴリ値系列頻度情報保持手段1902に保存する。

    【0076】部分カテゴリ値系列頻度保持手段1902
    に保存される部分カテゴリ値系列頻度情報の例を図17
    に示す。 図17には、例えば、部分カテゴリ値系列1−
    1−2−2の生起する頻度は0.01であることが記述されている。 部分カテゴリ値系列Aの頻度は、例えば「部分カテゴリ値系列Aが生起する回数を、その属性に対する部分カテゴリ値系列の総数で割ることにより得られる数」などとして算出される。

    【0077】図16の小頻度部分カテゴリ値系列検出手段1903は、部分カテゴリ値系列頻度情報保持手段1
    902に保存されている部分カテゴリ値系列頻度情報より、生起する頻度が所定の下限値よりも少ないような部分カテゴリ値系列を検出して出力する。 このような部分カテゴリ値系列のことを「小頻度部分カテゴリ値系列」
    と呼ぶ。

    【0078】例えば、所定の下限値を0.05とした場合は、生起する頻度が所定の下限値0.05より少ないような部分カテゴリ値系列が小頻度部分カテゴリ値系列として出力される。 図17の場合、部分カテゴリ値系列1−1−2−2、1−1−1−2、1−1−2−3はいずれも頻度が0.05より少ないので、小頻度部分カテゴリ値系列となる。 これに対して部分カテゴリ値系列2
    −2−2−3の頻度は0.05以上であるため、小頻度部分カテゴリ値系列とはならない。

    【0079】図16の類似部分カテゴリ値系列集合生成手段1904は、小頻度部分カテゴリ値系列と類似した部分カテゴリ値系列の集合を生成し、それらの部分カテゴリ値系列(もとの小頻度部分カテゴリ値系列を含む)
    が生起する頻度の和が所定の下限値以上となるようにする。 さらに、これらの部分カテゴリ値系列に対して同一の識別子(「グループ識別子」と呼ぶ)を一律に割り当てる。 以上の操作を、グループ識別子が割り当てられていないような小頻度部分カテゴリ値系列がなくなるまで続行する。

    【0080】部分カテゴリ値系列とグループ識別子との対応に関する情報を「部分カテゴリ値系列・グループ対応情報」と呼ぶ。 類似部分カテゴリ値系列集合生成手段1904は、最終的に部分カテゴリ値系列・グループ対応情報を出力する。 部分カテゴリ値系列・グループ対応情報は、部分カテゴリ値系列・グループ対応保持手段1
    905に保存される。

    【0081】図17において、まず所定の下限値0.0
    5より少ない頻度を持つ小頻度部分カテゴリ値系列として、類似部分カテゴリ値系列集合生成手段1904において、1−1−2−2を処理することになったものとする。 小頻度部分カテゴリ値系列1−1−2−2と類似した部分カテゴリ値系列の集合を生成し、それらの部分カテゴリ値系列が生起する頻度の和が所定の下限値0.0
    5以上となるようにするには、例えば以下のようにすれば良い。

    【0082】まず、部分カテゴリ値系列1−1−2−2
    との距離が1であるような部分カテゴリ値系列を算出する。 ここで部分カテゴリ値系列間の距離として、「対応する時点におけるカテゴリ値の差を、全ての時点にわたって足したもの」として定義したものを使用すると、例えば部分カテゴリ値系列1−1−1−2や部分カテゴリ値系列1−1−2−3が得られる。 これらの部分カテゴリ値系列が生起する頻度の和は、図17より0.01+
    0.03+0.02=0.06となり所定の下限値0.05
    以上となるので、これらの部分カテゴリ値系列で構成される集合は条件を満たす。 従って、これらの部分カテゴリ値系列に対して同一のグループ識別子を一律に割り当てる。 図18に部分カテゴリ値系列・グループ対応情報の例を示す。 図18では、3つの部分カテゴリ値系列1
    -1-2-2, 1-1-1-2, 1-1-2-3に対して同一のグループ識別子g5が割り当てられていることを示されている。

    【0083】上の例では、もとの小頻度部分カテゴリ値系列との距離が1であるような部分カテゴリ値系列を算出して、その頻度の和が所定の下限値以上となったが、
    頻度の和が所定の下限値より少なくなる場合は、さらにもとのカテゴリ値系列との距離が2であるような部分カテゴリ値系列、それでもだめならば距離が3であるような部分カテゴリ値系列と順に調べていけば良い。

    【0084】図16の類似部分カテゴリ値系列統合手段1906は、カテゴリ値系列分割手段404が出力する部分カテゴリ値系列の系列の要素である各部分カテゴリ値系列を、部分カテゴリ値系列・グループ対応保持手段1905に保存されている部分カテゴリ値系列・グループ対応情報に基づいて変換して、新たな部分カテゴリ値系列の系列として出力する。 この新たな部分カテゴリ値系列の系列のことを「派生部分カテゴリ値系列の系列」
    と呼ぶ。

    【0085】図16において、品目化手段406、品目データベース407、相関ルール抽出手段408、相関ルール抽出条件設定手段409、相関ルールデータベース410の動作は、実施の形態1で説明したものと同一である。

    【0086】従来技術1で説明したように、相関ルール抽出手段408は、最小支持度以上となるような相関ルールのみを抽出する。 つまり、生起する頻度が最小支持度よりも少ないような品目は相関ルールとして出力されない。 従って、生起する頻度が最小支持度よりも少ないような部分カテゴリ値系列に対する品目は、実施の形態1では相関ルールとしては出力されない。 それに対して本実施の形態では、頻度の少ない部分カテゴリ値系列を、類似した部分カテゴリ値系列とまとめてグループとして全体としての頻度を大きくするため、グループに対応する品目が相関ルールとして現れる可能性が出てくる。 具体的には、図16の小頻度部分カテゴリ値系列検出手段1903および類似カテゴリ値系列集合抽出手段1904で用いる最小の下限値を、相関ルール抽出手段409で設定する最小支持度と同じ値にするなどすれば良い。

    【0087】このように、生起する頻度が少ない部分カテゴリ値系列を、類似した部分カテゴリ値系列とともに一つのグループにまとめ、全体としての生起する頻度を大きくすることによって、生起する頻度が少ないような部分カテゴリ値系列に関する相関ルールが得られる可能性があるという効果がある。

    【0088】尚、図16において、実施の形態4や実施の形態5と同様に変動算出手段1501(図12参照)
    が存在するような場合でも、上記手法は同様に適用可能である。

    【0089】

    【発明の効果】この発明に係るデータマイニング装置は、 (a)測定された複数種類の属性の値をそれぞれ時系列データとして予め保持する時系列データベース; (b)時系列データベースの各属性毎の時系列データを入力し、時系列データを構成する属性値が取り得る範囲を複数のレベルに分割し、各測定時点における属性値をレベルに対応するカテゴリ値に変換することによりカテゴリ値系列データを生成して出力すると共に、各属性に対する属性値の範囲とカテゴリ値との対応を数値・カテゴリ値対応情報として出力する第1のカテゴリ値変換を行う第1のカテゴリ値変換手段; (c)第1のカテゴリ値変換手段が出力する数値・カテゴリ値対応情報を入力し、これを保持して出力する第1
    の数値・カテゴリ値対応保持手段; (d)第1のカテゴリ値変換手段が出力する各属性毎のカテゴリ値系列データを入力し、カテゴリ値系列データを予め定められた時間を単位として分割することにより、カテゴリ値系列の一部である部分カテゴリ値系列の系列を生成して出力するカテゴリ値系列分割手段; (e)カテゴリ値系列分割手段が出力する部分カテゴリ値系列の系列を入力し、部分カテゴリ値系列の系列を構成する各部分カテゴリ値系列に対し、対応する属性の名前を付加することにより品目を生成し、さらに、同一時間範囲に関する品目の集合を生成して品目レコードとして出力する第1の品目化を行う第1の品目化手段; (f)第1の品目化手段が出力する複数の品目レコードを入力し、これを保持する第1の品目データベース; (g)第1の品目データベースの複数の品目レコードを入力し、複数の品目レコードより、1つまたは複数の品目からなる品目集合間の相関ルールを抽出して出力する第1の相関ルール抽出手段; (h)第1の相関ルール抽出手段が出力する相関ルールを入力し、これを保持する第1の相関ルールデータベース;を備えている。 そして、測定される複数種類の属性の値をそれぞれ時系列として記録した時系列データベースにおいて、まず各属性に関する数値系列をカテゴリ値の系列に変換した後、カテゴリ値系列を予め定めた一定時間幅で分割し、分割されたそれぞれのカテゴリ値系列をパターンと見なすことによって、予め定めた一定時間幅における各属性の変化パターンに関する相関ルールの抽出が可能になる。

    【0090】また、 (i)第1のカテゴリ値変換手段が出力するカテゴリ値系列データを入力し、カテゴリ値系列データを構成するそれぞれのカテゴリ値に対して対応する属性の名前を付加して品目に変換すると共に、同一測定時点に関する品目の集合を生成して品目レコードとして出力する第2の品目化を行う第2の品目化手段; (j)第2の品目化手段が出力する複数の品目レコードを入力し、これを保持する第2の品目データベース; (k)第2の品目データベースの複数の品目レコードを入力し、複数の品目レコードより、1つまたは複数の品目からなる品目集合間の相関ルールを抽出して出力する第2の相関ルール抽出手段; (l)第2の相関ルール抽出手段が出力する相関ルールを入力し、これを保持する第2の相関ルールデータベース; (m)第1の相関ルールデータベースの相関ルールを入力し、相関ルールを各時点毎に分解して複数の相関ルール要素を生成し、分解前の相関ルールおよび分解後の複数の相関ルール要素を出力する相関ルール分解手段; (n)相関ルール分解手段が出力する分解前の相関ルールおよび分解後の複数の相関ルール要素と、第2の相関ルールデータベースの相関ルールとを入力し、それぞれの分解前の相関ルールに対し、分解後のそれぞれの相関ルール要素と同一の相関ルールが第2の相関ルールデータベースの相関ルールの中に存在するかどうかを判定し、相関ルール要素全てに対して同一の相関ルールが存在した場合は、分解前の相関ルールは出力せず、そうでない場合は、分解前の相関ルールを出力する相関ルール照合を行う相関ルール照合手段; (o)相関ルール照合手段が出力する分解前の相関ルールを入力し、これを保持する第3の相関ルールデータベース;をさらに備えている。 そして、各属性の時間的な変化パターンに関する相関ルールを各時点毎の相関ルール要素に分解し、それらが各属性に関する時間の要素を含まない相関ルールに含まれるかどうかを判定することによって、時間の要素を含む相関ルールとして特別な意味を持つ可能性があるものだけを出力するので、ユーザの解析作業が軽減される。

    【0091】また、 (p)時系列データベースの各属性毎の時系列データを入力し、時系列データを構成する属性値が取り得る範囲を複数のレベルに分割し、各測定時点における属性値をレベルに対応するカテゴリ値に変換することによりカテゴリ値系列データを生成して出力し、さらに、各属性に対する属性値の範囲とカテゴリ値との対応を数値・カテゴリ値対応情報として出力する第2のカテゴリ値変換手段; (q)第2のカテゴリ値変換手段が出力する数値・カテゴリ値対応情報を入力し、これを保持して出力する第2
    の数値・カテゴリ値対応保持手段; (r)第1の数値・カテゴリ値対応保持手段が出力する数値・カテゴリ値対応情報および第2の数値・カテゴリ値対応保持手段が出力する数値・カテゴリ値対応情報を入力し、これら2つの数値・カテゴリ値対応情報において、各属性毎に、属性値の範囲が重なっているカテゴリ値の対を検出し、そのカテゴリ値の対応関係をカテゴリ値・カテゴリ値対応情報として出力するカテゴリ値・カテゴリ値対応導出手段; (s)カテゴリ値・カテゴリ値対応導出手段が出力するカテゴリ値・カテゴリ値対応情報を入力し、これを保持して出力するカテゴリ値・カテゴリ値対応保持手段; (t)相関ルール分解手段が出力する分解前の相関ルールおよび分解後の複数の相関ルール要素と、カテゴリ値・カテゴリ値対応保持手段が出力するカテゴリ値・カテゴリ値対応情報とを入力し、分解後の複数の相関ルール要素のそれぞれに対し、その相関ルール要素に含まれるカテゴリ値を、カテゴリ値・カテゴリ値対応情報に基づいて変換することによって派生相関ルール要素を生成し、分解前の相関ルールおよび派生相関ルール要素とを出力する相関ルール変換手段;をさらに備え、第2の品目化手段は、第2のカテゴリ値変換手段が出力するカテゴリ値系列データを入力し、第2の品目化を行い相関ルール照合手段は、相関ルール変換手段が出力する分解前の相関ルールおよび派生相関ルール要素と、第2の相関ルールデータベースが出力する相関ルールとを入力し、
    相関ルール照合を行う。 そして、各属性の時間的な変化パターンに関する相関ルールを各時点毎の相関ルール要素に分解し、それらが各属性に関する時間の要素を含まない相関ルールに含まれるかどうかを判定する際に、相関ルール抽出の際の、数値からカテゴリ値への変換の境界値が異なっていても良いので、何回も境界値を変えて時間的な変化パターンに関する相関ルールを得る場合でも、時間の要素を含まない相関ルールに関しては同じものを再使用することができる。

    【0092】また、時系列データベースの時系列データを入力し、時系列データにおいて隣り合う測定時点における属性値の変動を算出して時間順に並べることにより変動時系列データを生成して出力する変動算出手段をさらに備え、第1のカテゴリ値変換手段は、変動算出手段が出力する変動時系列データを入力し、第1のカテゴリ値変換を行う。 そして、測定される複数種類の属性の値をそれぞれ時系列として記録した時系列データを、各属性についてまず隣り合う時点における属性値の変動を算出して変動時系列データとして処理を行うことにより、
    各属性の各時点を基準とした相対的な変動のパターンに関する相関ルールの抽出が可能になる。

    【0093】また、時系列データベースは、時系列データの他に各属性に対してその属性値間の差が意味を持つか持たないかについて記述した属性情報を有し、変動算出手段は、さらに (i)時系列データベースの時系列データおよび属性情報を入力し、属性情報において属性値間の差が意味を持つと記述されていた属性に対する時系列データを差算出対象時系列データとすると共に、また属性値間の差が意味を持たないと記述されていた属性に対する時系列データを変動時系列データとして出力する差算出対象属性判定手段; (j)差算出対象属性判定手段が出力する差算出対象時系列データを入力し、差算出対象時系列データにおいて測定時点が隣接している全ての属性値の対を抽出して複数の隣接属性値対として出力する隣接属性値対抽出手段; (k)隣接属性値対抽出手段が出力する複数の隣接属性値対を入力し、それぞれの隣接属性値対について、測定時点が進んでいる方の属性値から測定時点が遅れているほうの属性値を引くことによって属性値の差を算出し、
    属性値対差として出力する属性値対差算出手段; (l)属性値対差算出手段が出力する属性値対差を保持し、属性値対差を時間順に並べることによって変動時系列データを生成して出力する数値系列保持手段;を備え、第1のカテゴリ値変換手段は、差算出対象属性判定手段が出力する変動時系列データおよび数値系列保持手段が出力する変動時系列データを入力し、第1のカテゴリ値変換を行う。 そして、属性値の変動算出に際して属性値の差を算出することにより、属性値間の差が意味を持つような属性に対して、有効な相関ルールの抽出が可能になる。

    【0094】また、時系列データベースは時系列データの他に、各属性に対してその属性値間の比が意味を持つか持たないかについて記述した属性情報を有し、変動算出手段は、さらに (i)時系列データベースの時系列データおよび属性情報を入力し、属性情報において属性値間の比が意味を持つと記述されていた属性に対する時系列データを比算出対象時系列データとすると共に、属性値間の比が意味を持たないと記述されていた属性に対する時系列データを変動時系列データとして出力する比算出対象属性判定手段; (j)比算出対象属性判定手段が出力する比算出対象時系列データを入力し、比算出対象時系列データにおいて測定時点が隣接している全ての属性値の対を抽出して複数の隣接属性値対として出力する隣接属性値対抽出手段; (k)隣接属性値対抽出手段が出力する複数の隣接属性値対を入力し、それぞれの隣接属性値対について、測定時点が進んでいる方の属性値を測定時点が遅れているほうの属性値で割ることによって属性値の比を算出し、属性値対比として出力する属性値対比算出手段; (l)属性値対比算出手段が出力する属性値対比を保持し、属性値対比を時間順に並べることによって変動時系列データを生成して出力する数値系列保持手段;を備え、第1のカテゴリ値変換手段は、比算出対象属性判定手段が出力する変動時系列データおよび数値系列保持手段が出力する変動時系列データを入力し、第1のカテゴリ値変換を行う。 そして、属性値の変動算出に際して属性値の比を算出することにより、属性値間の比が意味を持つような属性に対して、有効な相関ルールの抽出が可能になる。

    【0095】また、(i)カテゴリ値系列分割手段が出力する部分カテゴリ値系列の系列を入力し、各属性に対し、各種の部分カテゴリ値系列が生起する頻度をそれぞれ算出し、部分カテゴリ値系列頻度情報として出力する部分カテゴリ値系列頻度算出手段; (j)部分カテゴリ値系列頻度算出手段が出力する部分カテゴリ値系列頻度情報を入力し、これを保持して出力する部分カテゴリ値系列頻度保持手段; (k)部分カテゴリ値系列頻度保持手段が出力する部分カテゴリ値系列頻度情報より、生起する頻度が所定の下限値よりも少ない部分カテゴリ値系列を検出し、小頻度部分カテゴリ値系列として出力する小頻度部分カテゴリ値系列検出手段; (l)小頻度部分カテゴリ値系列検出手段が出力する小頻度部分カテゴリ値系列および部分カテゴリ値系列頻度保持手段が出力する部分カテゴリ値系列頻度情報を入力し、小頻度部分カテゴリ値系列および小頻度部分カテゴリ値系列と類似した1つまたは複数の部分カテゴリ値系列より構成される集合であり、集合に含まれる部分カテゴリ値系列が生起する頻度の和が所定の下限値以上となる集合を生成し、さらに集合に含まれる部分カテゴリ値系列に対して同一のグループ識別子を一律に割り当て、
    その対応関係を部分カテゴリ値系列・グループ対応情報として出力する類似部分カテゴリ値系列集合生成手段; (m)類似部分カテゴリ値系列集合生成手段が出力する部分カテゴリ値系列・グループ対応情報を入力し、これを保持して出力する部分カテゴリ値系列・グループ対応保持手段; (n)カテゴリ値系列分割手段が出力する部分カテゴリ値系列の系列および、部分カテゴリ値系列・グループ対応保持手段が出力する部分カテゴリ値系列・グループ対応情報を入力し、部分カテゴリ値系列の系列を構成する部分カテゴリ値系列を部分カテゴリ値系列・グループ対応表に基づいて変換し、派生部分カテゴリ値系列の系列として出力する類似部分カテゴリ値系列統合手段;をさらに備え、第1の品目化手段は、類似部分カテゴリ値系列統合手段が出力する派生部分カテゴリ値系列の系列を入力し、第1の品目化を行う。 そして、生起する頻度が少ない部分カテゴリ値系列を、類似した部分カテゴリ値系列とともに一つのグループにまとめ、全体としての生起する頻度を大きくすることによって、生起する頻度が少ないような部分カテゴリ値系列に関する相関ルールが得られる可能性がある。

    【図面の簡単な説明】

    【図1】 実施の形態1におけるデータマイニング装置のブロック図である。

    【図2】 図1の時系列データベースの内容の例を示す図である。

    【図3】 握力と最高血圧に関する数値・カテゴリ値対応情報の例を示す図である。

    【図4】 図3に示す数値・カテゴリ値対応情報に基づいて変換した結果得られるカテゴリ値系列を示す図である。

    【図5】 図4のカテゴリ値系列データを分割の時間単位を3ヶ月また2ヶ月分の重複を許して分割することにより得られる部分カテゴリ値系列の系列を示す図である。

    【図6】 図5の部分カテゴリ値系列の系列を品目化して得られる品目データベースの内容の例を示す図である。

    【図7】 実施の形態2におけるデータマイニング装置のブロック図である。

    【図8】 図4に示すカテゴリ値系列データを品目化して得られる第2の品目データベースの内容の例を示す図である。

    【図9】 実施の形態3におけるデータマイニング装置のブロック図である。

    【図10】 第2の数値・カテゴリ値対応保持手段に保持されている属性「握力」と属性「最高血圧」に関する数値・カテゴリ値対応情報の例を示す図である。

    【図11】 図3と図10に示す数値・カテゴリ値対応情報から生成されるカテゴリ値・カテゴリ値対応情報を示す図である。

    【図12】 実施の形態4におけるデータマイニング装置のブロック図である。

    【図13】 図2の時系列データより得られる変動時系列データの例を示す図である。

    【図14】 実施の形態5におけるデータマイニング装置のブロック図である。

    【図15】 図2の時系列データより得られる変動時系列データの例を示す図である。

    【図16】 実施の形態6におけるデータマイニング装置のブロック図である。

    【図17】 部分カテゴリ値系列頻度保持手段に保存される部分カテゴリ値系列頻度情報の例を示す図である。

    【図18】 部分カテゴリ値系列・グループ対応情報の例を示す図である。

    【図19】 記号化用辞書の例を示す図である。

    【図20】 分析対象となる時系列の例を示す図である。

    【図21】 図20の時系列データを図19に示す記号化用辞書と照合することにより得られる記号値の系列の例を示す図である。

    【符号の説明】

    401 時系列データベース、402 第1のカテゴリ値変換手段、403第1の数値・カテゴリ値対応保持手段、404 カテゴリ値系列分割手段、406 第1の品目化手段、407 品目データベース(第1の品目データベース)、408 第1の相関ルール抽出手段、4
    10 第1の相関ルールデータベース、1001 第2
    の品目化手段、1002 第2の品目データベース、1
    003第2の相関ルール抽出手段、1005 第2の相関ルールデータベース、1006 相関ルール分解手段、1007 相関ルール照合手段、1008 第3の相関ルールデータベース、1202 第2の数値・カテゴリ値対応保持手段、1204 カテゴリ値・カテゴリ値対応導出手段、1205 カテゴリ値・カテゴリ値対応保持手段、1206 相関ルール変換手段、1501
    変動算出手段、1502 差算出対象属性判定手段、
    1503 隣接属性値対抽出手段、1504 属性値対差算出手段、1505 数値系列保持手段、1701
    比算出対象属性判定手段、1702 隣接属性値対抽出手段、1703 属性値対比算出手段、1704 数値系列保持手段、1901 部分カテゴリ値系列頻度算出手段、1902 部分カテゴリ値系列頻度保持手段、1
    903 小頻度部分カテゴリ値系列検出手段、1904
    類似部分カテゴリ値系列集合生成手段、1905部分カテゴリ値系列・グループ対応保持手段、1906 類似部分カテゴリ値系列統合手段。

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈