专利汇可以提供Device and method for supporting data mining engine for medical information专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To easily apply a data mining engine to data in a wider range by converting a table format where a spreadsheet format and a transaction format coexist into an item row format.
SOLUTION: This supporting device has table view generating parts 1a and 1b that decide which row of a table an ID row, an attribute row and a value row should be arranged to, attribute name deciding parts 2a and 2b which decide an attribute name from the kind of a table attribute row and the name of a value row and prepare an attribute name master table while referring to master data, information in each attribute examining parts 4a and 4b which decide the correspondence of a value and a diagnosis and treatment item and prepare a value item correspondence table, an information in each attribute value examining part 5 which prepares an item code correspondence table and a diagnosis and treatment item row preparing part 6 which prepares a diagnosis and treatment item row.
COPYRIGHT: (C)2000,JPO,下面是Device and method for supporting data mining engine for medical information专利的具体信息内容。
【0001】
【発明の属する技術分野】本発明は、診療に関するデータ解析を行う医療情報用データマイニングエンジンに診療データを適切に供給するために、データの前処理を行う医療情報用データマイニングエンジン補助装置および医療情報用データマイニングエンジン補助方法に関するものである。
【0002】
【従来の技術】データマイニングエンジンは、バイナリ形式もしくはアイテム列形式のデータを前提に設計されている。 図13はバイナリ形式、図14はアイテム列形式のそれぞれ例を表している。 バイナリ形式におけるデータ単位は行であり、列には2値をとる属性(アイテム)が並ぶ。 各行には2値のいずれかが並び、アイテムの存在と非存在とを表す。 図13のテーブルは、Item1
からItem7までのアイテムが、データ単位ID1からI
D4のそれぞれにおいて存在するかしないかを○×で表している。 アイテム列形式は、存在する特性のみを行で示した形式である。 アイテム列形式ではしばしば、図1
4の501のように、コードを使用して各行のアイテムの存在を記述し、図14の502のようなコードとアイテムの対応テーブルを別途持つことで全体の記録量の低減を図る。
【0003】データマイニングエンジンにはスプレッドシート形式やトランザクション形式を扱うための手段を持つものもある。 図15はスプレッドシート形式、図1
6はトランザクション形式のそれぞれ例を表している。
スプレッドシート形式におけるデータ単位もバイナリ形式と同じく行であるが、列には2値を取るとは限らない属性が並ぶ。 各行には文字列、数値、無値が並び、属性に対応する属性値を表す。 トランザクション形式では、
列はID列、属性列、値列の3種類からなる。 値列は1
列であり、データ単位は複数行にわたり、各行のID列の値がデータ単位への所属を表す。
【0004】図3は上から対象となる診療データのテーブル例、診療マスターデータの例、医療事務データのテーブル例、医療事務マスターデータの例を示している。
診療データ並びに医療事務データの特徴は、トランザクション形式で複数の値列を持ち、その値列の意味が属性列の値によって変化する点である。 図3の診療データの例801では、診療科と診察の2列が属性列であり、その値によって意味が変化する様子が診療マスターデータ802に示されている。 801の一行目を例にとると、
患者aの11/4の受診において診療科=内科、診察=
血圧計に関して、脈拍、最低(血圧)、最高(血圧)がそれぞれ80、120、170だったことを表している。 医療事務データの例803と医療事務マスターデータ804の関係も同様である。 さらに、診療データの特徴は、所見、主訴、申し送りといった自然言語による属性値が大きな比重を占める点にある。
【0005】図12は上記のような診療データベースから診療アイテム列形式への変換を行う際の、従来技術によるデータマイニングエンジン補助装置の適用例である。
【0006】データ変換部301aは診療データから、
属性情報について診療マスターデータを参照しながらスプレッドシート形式もしくはトランザクション形式への変換を行う。 データ変換部301bは医療事務データから、属性情報について医療事務マスターデータを参照しながら、同じくスプレッドシート形式もしくはトランザクション形式への変換を行う。
【0007】自然言語解析部302は、診療データのうち自然言語の文章で記述された値について、文章中のキーワードを所与の術語辞書を参照しながら抽出して、スプレッドシート形式もしくはトランザクション形式で提示する。
【0008】データ統合部303は、データ変換部30
1aおよび301b、自然言語解析部302から得られるスプレッドシート形式もしくはトランザクション形式のデータを、統合してひとつのテーブル(以下統合テーブルと称する)とする。
【0009】属性毎情報調査部304は、上記統合テーブルの属性毎に値の種類を調査し、値アイテム対応テーブルを作成する。 このときひとつの値についてひとつの診療アイテムを割り当てることを基本とするが、値の種類が多い場合、例えば連続値の場合、範囲を決めてカテゴリ化し、複数の値をひとつの診療アイテムに対応させる。 また例えば、適当に選んだ複数の値をひとつの診療アイテムに対応させることもある。 一方、適当に選んだ値を診療アイテムとしないこともある。
【0010】属性値毎情報調査部305は、属性毎情報調査部304の提供する上記値アイテム対応テーブルに基づき、上記統合テーブルにおいて、例えば診療アイテムの出現数を求めてその出現数順に、正の整数をアイテムコードとして付番し、アイテムコード対応テーブルを作成する。
【0011】診療アイテム列作成部306は、上記統合テーブルの各データ単位について、各属性値に対応する診療アイテムを上記値アイテム対応テーブルに基づいて決定し、その診療アイテムのコードを上記アイテムコード対応テーブルに基づいて決定し、アイテムコードの並んだアイテム列形式を作成する。
【0012】エンジンパラメータ決定部307は、データマイニングエンジンの稼動時のパラメータ、例えばアイテム出現頻度の上限および下限を設ける場合にその値を与える。
【0013】
【発明が解決しようとする課題】従来の技術は、ひとつのスプレッドシート形式もしくはトランザクション形式からアイテム列形式やバイナリ形式への変換を行うことができるが、スプレッドシート形式とトランザクション形式が混在したテーブル形式に対しては、事前にいずれかへのデータ変換が必要で、その都度設計製作が必要だった。 また、複数のテーブルにまたがってデータマイニングエンジンを適用しようとする場合、事前にひとつのテーブルに統合する必要があった。 また、自然言語の文章が値となっている場合、意味のあるアイテムを得るには、別途自然言語解析部を設けてそこで文章から重要術語を抽出してスプレッドシート形式もしくはトランザクション形式に表現し、ひとつのテーブルにまとめるようにする必要があった。
【0014】本発明は上記のような問題点を解決するためになされたもので、スプレッドシート形式とトランザクション形式が混在したテーブル形式からアイテム列形式への変換を行うことにより、より広い範囲のデータに対して容易にデータマイニングエンジンが適用できることを可能とする医療情報用データマイニングエンジン補助装置および医療情報用データマイニングエンジン補助方法を得ることを目的とする。
【0015】また、複数テーブルに関して、その統合をアイテム列形式の直前とすることにより、テーブル毎の解析を並行して行うことができ、また統合に用いる領域を小さくすることことを可能とする医療情報用データマイニングエンジン補助装置および医療情報用データマイニングエンジン補助方法を得ることを目的とする。
【0016】さらに、自然言語の文章による属性値の扱いについて、自然言語解析部を用いて術語を抽出し、その結果をスプレッドシート形式とトランザクション形式が混在したテーブル形式の一部として表現し、以後の作業を通常の属性値と共通化することにより、術語に関するカテゴリ化や削除を容易にすることを可能とする医療情報用データマイニングエンジン補助装置および医療情報用データマイニングエンジン補助方法を得ることを目的とする。
【0017】
【課題を解決するための手段】本発明の係る医療情報用データマイニングエンジン補助装置は、診療データおよび医療事務データについて、診療アイテムの相関関係を発見するデータマイニングエンジンを適用するために、
診療データおよび医療事務データを診療アイテム列に変換する医療情報用データマイニングエンジン補助装置であって、診療データおよび医療事務データのデータベースである診療データベースを構成する複数のテーブルについて、ID列、属性列、値列をそれぞれテーブルのどの列とするかを決定するテーブルビュー生成部と、テーブルの属性列の値の種類と値列の名称とから、属性名を決定し、診療データについては診療マスターデータ、医療事務データについては医療事務マスターデータを参照しながら属性名マスターテーブルを作成する属性名決定部と、 テーブルの各属性について値列に記述された値の種類を調査し、値と診療アイテムの対応を決定し値アイテム対応テーブルを作成する属性毎情報調査部と、診療データベースについて、各診療アイテムの出現データ単位数を調査し、アイテムコード対応テーブルを作成する属性値毎情報調査部と、値アイテム対応テーブル、アイテムコード対応テーブル、および診療データベースから、診療アイテム列を作成する診療アイテム列作成部とを有し、テーブルビュー生成部は、属性名決定部で決定される属性名によって得られる術語列とを参照しながら、テーブルに格納されたデータに関する質問に回答する。
【0018】また、テーブルの一データ単位の一属性の値として与えられた自然言語による文章に対して、出現した術語の集合を作成して術語列とすると共に、属性名マスターテーブル中の該当箇所を所与の属性名に修正する術語出現調査部を更に有し、テーブルビュー生成部は、属性名決定部で決定される属性名と、術語出現調査部によって得られる術語列とを参照しながら、テーブルに格納されたデータに関する質問に回答する。
【0019】また、データマイニングエンジンのパラメータを決定するエンジンパラメータ決定部を更に有する。
【0020】また、他の発明に係る医療情報用データマイニングエンジン補助装置は、診療によって生じる技術的データである診療データおよび診療により発生する事務データである医療事務データに対して、一回の診療もしくは一患者の一連の診療をデータ単位として、同一データ単位内での症状、行為、および事務的特徴である診療アイテムの同時発生に関する相関関係を発見するデータマイニングエンジンを適用するために、診療データおよび医療事務データをデータ単位毎の診療アイテムの並びである診療アイテム列に変換すると共に、データマイニングエンジンの稼動パラメータの指定を可能とする医療情報用データマイニングエンジン補助装置であって、
診療データおよび医療事務データのデータベースである診療データベースの各テーブルについて、データ単位の識別子を記述する単一もしくは複数の列であるID列、
属性を記述する単一もしくは複数の列である属性列、値を記述する単一もしくは複数の列である値列をそれぞれテーブルのどの列とするかを決定しテーブルビュー生成部と、テーブルの属性列の値の種類と値列の名称とから、属性およびその名称である属性名を決定し、診療データについては診療マスターデータ、医療事務データについては医療事務マスターデータを参照しながら、属性列の値および値列の名称と属性名の対応テーブルである属性名マスターテーブルを作成する属性名決定部と、テーブルの一データ単位の一属性の値として与えられた自然言語による文章に対して、文章に出現した術語の集合を作成し、さらに所与の術語辞書を参照して術語集合を絞り込み、その結果を術語列とし、データ単位のID、
属性、術語列を診療データのテーブルの一行として提示し、属性名マスターテーブル中の属性名を、術語列を表す所与の名称に変更する術語出現調査部と、テーブルの各属性について値列に記述された値の種類を調査し、カテゴリ化ならびに値削除を行い、診療アイテムを決定し、値と診療アイテムの対応を決定し値アイテム対応テーブルを作成する属性毎情報調査部と、診療データベースについて、各診療アイテムの出現データ単位数を調査し、各診療アイテムにアイテムコードをつけ、診療アイテム名とアイテムコードの対応テーブルであるアイテムコード対応テーブルを作成する属性値毎情報調査部と、
値アイテム対応テーブル、アイテムコード対応テーブル、および診療データベースから、診療アイテムのアイテムコードの並ぶものである診療アイテム列を作成する診療アイテム列作成部と、データマイニングエンジンのパラメータを決定するエンジンパラメータ決定部とを有し、テーブルビュー生成部は、属性名決定部で決定される属性名と、術語出現調査部によって得られる術語列とを参照しながら、テーブルに格納されたデータに関する質問に回答する。
【0021】また、他の発明に係る医療情報用データマイニングエンジン補助方法は、診療データおよび医療事務データについて、診療アイテムの相関関係を発見するデータマイニングエンジンを適用するために、診療データおよび医療事務データを診療アイテム列に変換する医療情報用データマイニングエンジン補助方法であって、 1. 診療データおよび医療事務データのデータベースである診療データベースを構成する複数のテーブルから、
テーブルを一つ選択するテーブル選択ステップと、 2. テーブルのID列、属性列、値列をそれぞれ選択するID列・属性列・値列選択ステップと、 3. ID列・属性列・値列選択ステップの選択結果に基づいて、医療事務マスターデータを参照して、属性名マスターテーブルを作成する属性名マスターテーブル作成ステップと、 4. テーブル中の自然言語で記述された値を術語列に変換すると共に、属性名マスターテーブル中の該当箇所を所与の属性名に修正する自然言語変換ステップと、 5. 属性名マスターテーブルを参照してテーブルビューを作成し、テーブルビューに基づいて、値アイテム対応テーブルを作成する値アイテム対応テーブル作成ステップと、 6. 値アイテム対応テーブルの各診療アイテムについて、診療データベースに属するテーブルビューすべてを参照して、診療アイテムの出現データ単位数を調査し、
出現データ単位数に基づいてアイテムコードを決定し、
アイテムコード対応テーブルを作成するアイテムコード対応テーブル作成ステップと、 7. 診療データベースに属するテーブルビューすべての各データ単位について、値アイテム対応テーブルおよびアイテムコード対応テーブルを用いてアイテムコードを得て、アイテムコードの並ぶ診療アイテム列を作成する診療アイテム列作成ステップとを有し、1〜5のステップ、すなわちテーブル選択ステップ、ID列・属性列・
値列選択ステップ、属性名マスターテーブル作成ステップ、自然言語変換ステップ、値アイテム対応テーブル作成ステップまでがテーブルの数だけ繰り返して実行され、アイテムコード対応テーブル作成ステップにおいて複数の各テーブルからの情報が合流され、その後、診療アイテム列作成ステップが実行される。
【0022】また、データマイニングエンジンのパラメータの指定をするエンジンパラメータ決定ステップを更に有し、エンジンパラメータ決定ステップは、アイテムコード対応テーブル作成ステップにおいて複数の各テーブルからの情報が合流された後、実行される。
【0023】
【発明の実施の形態】実施の形態1. 図1はこの実施の形態の医療情報用データマイニングエンジン補助装置の構成図である。 図2はこの実施の形態の医療情報用データマイニングエンジン補助装置の動作を表すフローチャートである。 図4は上からこの実施の形態における診療データに対するID列・属性列・値列指定例および医療事務データのテーブル例の図である。 テーブルビュー生成部1aは、図2のテーブル選択ステップS201において診療データテーブルをひとつ選択し、ID列・属性列・値列選択ステップS202において、図4の901
のような診療データに対し、ID列、属性列、値列の区別を902のように与える。 ID列については、902
のように指定して受診をデータ単位とすることも、また患者IDのみを指定して患者をデータ単位とすることもできる。
【0024】属性名決定部2aは、属性名マスターテーブル作成ステップS203において、診療マスターデータから図3の802のような属性名マスターテーブルを作成する。
【0025】術語出現調査部3は、自然言語変換ステップS204において、図3に示す診療データ中、主訴および所見の値に関して、単語を抽出し、単語の間の関係から図5の1001に示すような術語の列を作成する。
さらに属性名マスターテーブルの主訴および所見の属性名を修正し、図5の1002および1003のような術語列を表す属性名とする。 この修正された属性名マスターテーブルを用いて、テーブルビュー生成部1aは、図3のテーブル801と等しい情報を持つ図6のようなテーブルビューを生成し、このビューについての質問に回答できる。
【0026】属性毎情報調査部4aは、値アイテム対応テーブル作成ステップS205において、テーブルビュー生成部1aが提供する図6のテーブルビューの属性毎に値の種類を調査し、図7のような値アイテム対応テーブルを作成する。 図7は図3のような診療データに対する値アイテム対応テーブルのうち、内科の一部を取り出した例になっている。 ひとつの値についてひとつの診療アイテムを割り当てることを基本とするが、値の種類が多い場合、例えば図7の「脈拍」や「体温」のような連続値の場合、範囲を決めてカテゴリ化し、複数の値をひとつの診療アイテムに対応させる。 また例えば、「術語」の「悪寒」と「頻繁な悪寒」を「内科主訴:悪寒」
としているように、適当に選んだ複数の値をひとつの診療アイテムに対応させることもできる。 一方、適当に選んだ値を診療アイテムとしないこともできる。 図7では斜線で示した4か所で診療アイテムと対応させない値ができている。
【0027】テーブルビュー生成部1bは、図2のテーブル選択ステップS201において医療事務データテーブルをひとつ選択し、ID列・属性列・値列選択ステップS202において、図4の903のような医療事務データに対し、ID列、属性列、値列の区別を904のように与える。 ID列については、診療データと医療事務データにまたがる診療アイテムの相関が得られるように、診療データのデータ単位と同じになるように指定する。
【0028】属性名決定部2bは、属性名マスターテーブル作成ステップS203において、医療事務マスターデータから図3の804のような属性名マスターテーブルを作成する。 この属性名マスターテーブルを用いて、
テーブルビュー生成部1bは、図3のテーブル803と等しい情報を持つ図8のようなテーブルビューを生成し、このビューについての質問に回答できる。 自然言語の文章を値にとる属性がない場合は、自然言語変換ステップS204は省略される。
【0029】属性毎情報調査部4bは、値アイテム対応テーブル作成ステップS205において、テーブルビュー生成部1bが提供する図8のテーブルビューの属性毎に値の種類を調査し、図9のような値アイテム対応テーブルを作成する。 図9は図3のような医療事務データに対する値アイテム対応テーブルのうち、内科の一部を取り出した例になっている。 診療アイテムの割り当て方式については属性毎情報調査部4aと同じである。
【0030】属性値毎情報調査部5は、アイテムコード対応テーブル作成ステップS206において、属性毎情報調査部4aの提供する図7のような値アイテム対応テーブル、および属性毎情報調査部4bの提供する図9のような値アイテム対応テーブルに基づき、テーブルビュー生成部1aが提供する図6のようなテーブルビューならびにテーブルビュー生成部1bが提供する図8のようなテーブルビューにおいて、例えばアイテムの出現数を求めてその出現数順に、正の整数をアイテムコードとして付番し、図10のようなアイテムコード対応テーブルを作成する。
【0031】診療アイテム列作成部6は、図6および図8のテーブルの各IDについて、各属性値に対応する診療アイテムを図7および図9のような値アイテム対応テーブルに基づいて決定し、その診療アイテムのコードを図10のアイテムコード対応テーブルに基づいて決定し、図11のようなアイテムコードの並んだ診療アイテム列形式を作成する。
【0032】エンジンパラメータ決定部7は、データマイニングエンジンの稼動時のパラメータ、例えばアイテム出現頻度の上限および下限を設ける場合にその値を与える。
【0033】すなわち、本実施の形態の医療情報用データマイニングエンジン補助装置は、診療によって生じる技術的データすなわち診療データおよび診療により発生する事務データすなわち医療事務データについて、一回の診療もしくは一患者の一連の診療をデータ単位として、同一データ単位内での症状、行為、事務的特徴すなわち診療アイテムの同時発生に関する相関関係を発見する装置すなわちデータマイニングエンジンを適用するために、診療データおよび医療事務データをデータ単位毎の診療アイテムの並びに変換し、並びにデータマイニングエンジンの稼動パラメータの指定を支援することを目的としている。
【0034】そして、その構成は、診療データおよび医療事務データのデータベースすなわち診療データベースを構成する各テーブルについて、データ単位の識別子を記述する単一もしくは複数の列すなわちID列、属性を記述する単一もしくは複数の列すなわち属性列、値を記述する単一もしくは複数の列すなわち値列をそれぞれテーブルのどの列とするかを決定し、属性名決定部で決定される属性名と、出現術語調査部4a,4bによって得られる術語列とを参照しながら、テーブルに格納されたデータに関する質問に回答するテーブルビュー生成部1
a,1bと、
【0035】テーブルの属性列の値の種類と、値列の名称とから、属性およびその名称すなわち属性名を決定し、診療データについては診療マスターデータ、医療事務データについては医療事務マスターデータを参照しながら属性列の値、および値列の名称と属性名の対応テーブルすなわち属性名マスターテーブルを作成する属性名決定部2a、2bと、
【0036】一データ単位の一属性の値として与えられた自然言語による文章に対して、文章に出現した術語の集合を作成し、さらに所与の術語辞書を参照して術語集合を絞り込み、その結果を術語列とし、該データ単位のID、該属性、該術語列を診療データのテーブルの一行として提示し、属性名マスターテーブル中の属性名を、
術語列を表す所与の名称に変更する出現術語調査部4
a、4bと、
【0037】テーブルの各属性について値列に記述された値の種類を調査し、カテゴリ化ならびに値削除を行い、診療アイテムを決定し、値と診療アイテムの対応を決定し値アイテム対応テーブルを作成する属性毎情報調査部4a,4bと、
【0038】診療データベースについて、各診療アイテムの出現データ単位数を調査し、各診療アイテムにアイテムコードをつけ、診療アイテム名とアイテムコードの対応テーブルすなわちアイテムコード対応テーブルを作成する属性値毎情報調査部5と、
【0039】値アイテム対応テーブル、アイテムコード対応テーブル、および診療データベースから、診療アイテムのアイテムコードの並ぶものすなわち診療アイテム列を作成する診療アイテム列作成部6と、
【0040】データマイニングエンジンのパラメータを決定するエンジンパラメータ決定部7からなり、その動作は、 1. テーブルビュー生成部1a,1bにおいてテーブルを一つ選択するテーブル選択ステップS201と、 2. テーブルビュー生成部においてテーブルのID列、属性列、値列をそれぞれ選択するID列・属性列・値列選択ステップS202と、 3. 選択結果から属性名決定部においてマスターデータを参照して属性名マスターテーブルを作成する属性名マスターテーブル作成ステップS203と、 4. 指定された自然言語で記述された値を術語列に変換し、属性名マスターテーブルの該当箇所を所与の属性名に修正する自然言語変換ステップS206と、 5. 属性名マスターテーブルを参照してテーブルビュー生成部においてテーブルビューを作成し、該テーブルビューに基づいて、属性毎情報調査部において値アイテム対応テーブルを作成する値アイテム対応テーブル作成ステップS205と、 6. 値アイテム対応テーブルの各診療アイテムについて、診療データベースに属するテーブルビューすべてを参照して、属性値毎情報調査部において診療アイテムの出現データ単位数を調査し、出現データ単位数に基づいてアイテムコードを決定し、アイテムコード対応テーブルを作成するアイテムコード対応テーブル作成ステップS206と、 7. 診療データベースに属するテーブルビューすべての各データ単位について、値アイテム対応テーブルおよびアイテムコード対応テーブルを用いてアイテムコードを得て、診療アイテム列作成部においてアイテムコードの並ぶ診療アイテム列を作成する診療アイテム列作成ステップS207と、 8.データマイニングエンジンのパラメータの指定を受け付けるエンジンパラメータ決定ステップS208とからなり、
【0041】上記8つのステップのうち5つのステップ、すなわちテーブル選択ステップS201、ID列・
属性列・値列選択ステップS202、属性名マスターテーブル作成ステップS203、自然言語変換ステップS
204、値アイテム対応テーブル作成ステップS205
までをテーブルの数だけ繰り返して実行し、アイテムコード対応テーブル作成ステップS206において複数テーブルからの情報を合流させ、残る2つのステップ、すなわち診療アイテム列作成ステップS207およびエンジンパラメータ決定ステップS208はその後に実行する。
【0042】
【発明の効果】本発明の係る医療情報用データマイニングエンジン補助装置は、診療データおよび医療事務データについて、診療アイテムの相関関係を発見するデータマイニングエンジンを適用するために、診療データおよび医療事務データを診療アイテム列に変換する医療情報用データマイニングエンジン補助装置であって、診療データおよび医療事務データのデータベースである診療データベースを構成する複数のテーブルについて、ID
列、属性列、値列をそれぞれテーブルのどの列とするかを決定するテーブルビュー生成部と、テーブルの属性列の値の種類と値列の名称とから、属性名を決定し、診療データについては診療マスターデータ、医療事務データについては医療事務マスターデータを参照しながら属性名マスターテーブルを作成する属性名決定部と、 テーブルの各属性について値列に記述された値の種類を調査し、値と診療アイテムの対応を決定し値アイテム対応テーブルを作成する属性毎情報調査部と、診療データベースについて、各診療アイテムの出現データ単位数を調査し、アイテムコード対応テーブルを作成する属性値毎情報調査部と、値アイテム対応テーブル、アイテムコード対応テーブル、および診療データベースから、診療アイテム列を作成する診療アイテム列作成部とを有し、テーブルビュー生成部は、属性名決定部で決定される属性名によって得られる術語列とを参照しながら、テーブルに格納されたデータに関する質問に回答する。 そのため、
スプレッドシート形式とトランザクション形式が混在した、列の意味が行によって異なるようなテーブルを扱うことができる。 従来技術を用いた例として挙げたものに比べて、データ変換部およびデータ統合部を設計製作することなくデータマイニングエンジンを適用することができる。 また複数テーブルに関して、その統合をアイテム列形式の直前まで行わないことにより、テーブル毎の解析を並行して行うことができ、また統合に用いる記憶領域を小さくすることができる。
【0043】また、テーブルの一データ単位の一属性の値として与えられた自然言語による文章に対して、出現した術語の集合を作成して術語列とすると共に、属性名マスターテーブル中の該当箇所を所与の属性名に修正する術語出現調査部を更に有し、テーブルビュー生成部は、属性名決定部で決定される属性名と、術語出現調査部によって得られる術語列とを参照しながら、テーブルに格納されたデータに関する質問に回答する。 そのため、自然言語の文章による属性値の扱いについて、自然言語解析部を用いて術語を抽出し、その結果をスプレッドシート形式とトランザクション形式が混在したテーブル形式の一部として表現し、以後の作業を通常の属性値と共通化することにより、術語に関するカテゴリ化や削除を容易にできる。
【0044】また、データマイニングエンジンのパラメータを決定するエンジンパラメータ決定部を更に有する。 そのため、データマイニングエンジンの稼動パラメータの指定を支援することができる。
【0045】また、他の発明に係る医療情報用データマイニングエンジン補助装置は、診療によって生じる技術的データである診療データおよび診療により発生する事務データである医療事務データに対して、一回の診療もしくは一患者の一連の診療をデータ単位として、同一データ単位内での症状、行為、および事務的特徴である診療アイテムの同時発生に関する相関関係を発見するデータマイニングエンジンを適用するために、診療データおよび医療事務データをデータ単位毎の診療アイテムの並びである診療アイテム列に変換すると共に、データマイニングエンジンの稼動パラメータの指定を可能とする医療情報用データマイニングエンジン補助装置であって、
診療データおよび医療事務データのデータベースである診療データベースの各テーブルについて、データ単位の識別子を記述する単一もしくは複数の列であるID列、
属性を記述する単一もしくは複数の列である属性列、値を記述する単一もしくは複数の列である値列をそれぞれテーブルのどの列とするかを決定しテーブルビュー生成部と、テーブルの属性列の値の種類と値列の名称とから、属性およびその名称である属性名を決定し、診療データについては診療マスターデータ、医療事務データについては医療事務マスターデータを参照しながら、属性列の値および値列の名称と属性名の対応テーブルである属性名マスターテーブルを作成する属性名決定部と、テーブルの一データ単位の一属性の値として与えられた自然言語による文章に対して、文章に出現した術語の集合を作成し、さらに所与の術語辞書を参照して術語集合を絞り込み、その結果を術語列とし、データ単位のID、
属性、術語列を診療データのテーブルの一行として提示し、属性名マスターテーブル中の属性名を、術語列を表す所与の名称に変更する術語出現調査部と、テーブルの各属性について値列に記述された値の種類を調査し、カテゴリ化ならびに値削除を行い、診療アイテムを決定し、値と診療アイテムの対応を決定し値アイテム対応テーブルを作成する属性毎情報調査部と、診療データベースについて、各診療アイテムの出現データ単位数を調査し、各診療アイテムにアイテムコードをつけ、診療アイテム名とアイテムコードの対応テーブルであるアイテムコード対応テーブルを作成する属性値毎情報調査部と、
値アイテム対応テーブル、アイテムコード対応テーブル、および診療データベースから、診療アイテムのアイテムコードの並ぶものである診療アイテム列を作成する診療アイテム列作成部と、データマイニングエンジンのパラメータを決定するエンジンパラメータ決定部とを有し、テーブルビュー生成部は、属性名決定部で決定される属性名と、術語出現調査部によって得られる術語列とを参照しながら、テーブルに格納されたデータに関する質問に回答する。 そのため、スプレッドシート形式とトランザクション形式が混在した、列の意味が行によって異なるようなテーブルを扱うことができる。 従来技術を用いた例として挙げたものに比べて、データ変換部およびデータ統合部を設計製作することなくデータマイニングエンジンを適用することができる。 また複数テーブルに関して、その統合をアイテム列形式の直前まで行わないことにより、テーブル毎の解析を並行して行うことができ、また統合に用いる記憶領域を小さくすることができる。
【0046】また、他の発明に係る医療情報用データマイニングエンジン補助方法は、診療データおよび医療事務データについて、診療アイテムの相関関係を発見するデータマイニングエンジンを適用するために、診療データおよび医療事務データを診療アイテム列に変換する医療情報用データマイニングエンジン補助方法であって、 1. 診療データおよび医療事務データのデータベースである診療データベースを構成する複数のテーブルから、
テーブルを一つ選択するテーブル選択ステップと、 2. テーブルのID列、属性列、値列をそれぞれ選択するID列・属性列・値列選択ステップと、 3. ID列・属性列・値列選択ステップの選択結果に基づいて、医療事務マスターデータを参照して、属性名マスターテーブルを作成する属性名マスターテーブル作成ステップと、 4. テーブル中の自然言語で記述された値を術語列に変換すると共に、属性名マスターテーブル中の該当箇所を所与の属性名に修正する自然言語変換ステップと、 5. 属性名マスターテーブルを参照してテーブルビューを作成し、テーブルビューに基づいて、値アイテム対応テーブルを作成する値アイテム対応テーブル作成ステップと、 6. 値アイテム対応テーブルの各診療アイテムについて、診療データベースに属するテーブルビューすべてを参照して、診療アイテムの出現データ単位数を調査し、
出現データ単位数に基づいてアイテムコードを決定し、
アイテムコード対応テーブルを作成するアイテムコード対応テーブル作成ステップと、 7. 診療データベースに属するテーブルビューすべての各データ単位について、値アイテム対応テーブルおよびアイテムコード対応テーブルを用いてアイテムコードを得て、アイテムコードの並ぶ診療アイテム列を作成する診療アイテム列作成ステップとを有し、1〜5のステップ、すなわちテーブル選択ステップ、ID列・属性列・
値列選択ステップ、属性名マスターテーブル作成ステップ、自然言語変換ステップ、値アイテム対応テーブル作成ステップまでがテーブルの数だけ繰り返して実行され、アイテムコード対応テーブル作成ステップにおいて複数の各テーブルからの情報が合流され、その後、診療アイテム列作成ステップが実行される。 そのため、スプレッドシート形式とトランザクション形式が混在した、
列の意味が行によって異なるようなテーブルを扱うことができる。 従来技術を用いた例として挙げたものに比べて、データ変換部およびデータ統合部を設計製作することなくデータマイニングエンジンを適用することができる。 また複数テーブルに関して、その統合をアイテム列形式の直前まで行わないことにより、テーブル毎の解析を並行して行うことができ、また統合に用いる記憶領域を小さくすることができる。
【0047】また、データマイニングエンジンのパラメータの指定をするエンジンパラメータ決定ステップを更に有し、エンジンパラメータ決定ステップは、アイテムコード対応テーブル作成ステップにおいて複数の各テーブルからの情報が合流された後、実行される。 そのため、データマイニングエンジンの稼動パラメータの指定を支援することができる。
【図1】 この発明の医療情報用データマイニングエンジン補助装置の構成図である。
【図2】 この発明の医療情報用データマイニングエンジン補助装置の動作を表すフローチャートである。
【図3】 この発明の実施例における対象とするテーブル形式の図である。
【図4】 この発明の実施例における診療データに対するID列・属性列・値列指定例および医療事務データのテーブル例の図である。
【図5】 この発明の実施例における自然言語属性値からの術語抽出の図である。
【図6】 この発明の実施例における診療データのテーブルビューの図である。
【図7】この発明の実施例における診療データの値アイテム対応テーブルの図である。
【図8】この発明の実施例における医療事務データのテーブルビューの図である。
【図9】この発明の実施例における医療事務データの値アイテム対応テーブルの図である。
【図10】この発明の実施例におけるアイテムコード対応テーブルの図である。
【図11】この発明の実施例におけるアイテム列形式の図である。
【図12】 従来のデータマイニングエンジン補助装置の例を説明するための構成図である。
【図13】 従来技術を説明するためのバイナリ形式の例を示す図である。
【図14】 アイテム列形式とアイテム対応テーブルの図である。
【図15】 従来技術を説明するためのスプレッドシート形式の図である。
【図16】 従来技術を説明するためのトランザクション形式の図である。
1a,1b テーブルビュー生成部、2a,2b 属性名決定部、3 術語出現調査部、4a,4b 属性毎情報調査部、5 属性値毎情報調査部、6 診療アイテム列作成部、7 エンジンパラメータ決定部、S201
テーブル選択ステップ、S202 ID列・属性列・値列選択ステップ、S203 属性名マスターテーブル作成ステップ、S204 自然言語変換ステップ、S20
5 値アイテム対応テーブル作成ステップ、S206
アイテムコード対応テーブル作成ステップ、S207
診療アイテム列作成ステップ、S208 エンジンパラメータ決定ステップ。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl. 7識別記号 FI テーマコート゛(参考) G06F 15/401 340C (72)発明者 大坪 道夫 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 Fターム(参考) 5B049 BB42 CC02 CC22 EE01 EE05 5B075 ND03 ND20 ND23 NK46 NK54 NR02 NR12 NS01 PR06 QM08 QP10 QS06 QS20 UU27 UU28
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于房产信息数据的智能服务防护方法及其系统 | 2020-05-08 | 939 |
一种基于互联网平台的数据化人才管理分析系统 | 2020-05-08 | 244 |
一种大数据数据中心运行监测系统 | 2020-05-08 | 505 |
基于海量时空数据的频繁轨迹提取方法及其挖掘系统 | 2020-05-08 | 452 |
基于频谱地图的卫星通信系统用户链路干扰规避方法 | 2020-05-11 | 767 |
一种基于数据挖掘的农作物生长预警的方法及装置 | 2020-05-08 | 755 |
一种声音直播用户的年龄预测方法 | 2020-05-11 | 318 |
基于ZORRO系统的数据挖掘任务创建方法 | 2020-05-11 | 948 |
一种基于负荷-电压灵敏度的配电网低电压预警方法 | 2020-05-11 | 191 |
一种电力系统检测数据攻击的方法、计算机设备和存储介质 | 2020-05-11 | 61 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。