Auxiliary device for discovering knowledge from database专利检索-数据库知识发现人工智能专利检索查询-专利查询网

Auxiliary device for discovering knowledge from database

阅读：582发布：2020-12-26

专利汇可以提供Auxiliary device for discovering knowledge from database专利检索，专利查询，专利分析的服务。并且PROBLEM TO BE SOLVED: To automatically generate significant domain knowledge of high quality to be supplied to a knowledge discovering device by extracting an important column from a statistical result according to a previously set knowledge model and regarding it as domain knowledge. SOLUTION: There are three kinds of model AHRn, THRn, and GPn as knowledge models 121, and a numeral is put in the symbol at the end of each model. Then AHRn and THRn are models wherein columns having up to (n)th acquired scores are regarded as domain knowledge. Here, the difference between AHRn and THRn is that while AHRn does not discriminate tables, THRn gives order of acquired scores in table units. Further, GPn is a model wherein columns having larger than (n) acquired points are regarded as domain knowledge. Here, a knowledge module 120 generates domain knowledge 130 according to the knowledge model 121. Consequently, domain knowledge that a person who is well acquainted with the domain of an object database generated by hand can automatically generated, so the operation man-hour can greatly be reduced.，下面是Auxiliary device for discovering knowledge from database专利的具体信息内容。

权利要求

【特許請求の範囲】

【請求項１】対象となるデータベースへの問い合わせの履歴から順次問い合わせ文を取り出し、該問い合わせ文から列と該列の出現する位置（「節」という）を抽出し、前記節に対して予め設定された得点をつけて統計をとり、前記統計結果から予め設定された規範に基づいて重要な列を抽出し、前記抽出された列をドメイン知識とする、ことを特徴とする知識発見補助装置。

【請求項２】対象となるデータベースから、該データベースに含まれている列を予め全て取り出しておき、前記全ての列に関する統計を予めとり、ドメイン知識とする列の割合を予め指定しておくことによって、列の数を一定の率に制限する、ことを特徴とする請求項１記載の知識発見補助装置。

【請求項３】前記取り出した問い合わせ文中で列の現れた節の得点が得点表に設定されていない場合、利用者から点数を獲得し、該点数と節を前記得点表に加える、ことを特徴とする請求項１記載の知識発見補助装置。

【請求項４】知識発見装置が対象とするデータベースへの問い合わせの履歴を保持する問い合わせデータベースと、前記問い合わせ文の節の種類によって加える点数を設定する得点表と、列毎に点数を記録する統計表と、前記問い合わせデータベースから読み出された問い合わせ文中の列の出現頻度を、前記得点表を参照して前記統計表に加える解釈手段と、前記知識発見装置のドメイン知識に加える規範を記述した知識化規範と、前記統計表に含まれている列から前記知識化規範に従って知識を生成する知識化手段と、生成された知識を保持するドメイン知識記憶部と、を備えたことを特徴とする知識発見補助装置。

【請求項５】前記解釈手段が、前記対象となるデータベースに含まれる表のすべての列を予め獲得し、前記統計表に予め列を追加する処理を更に行う、ことを特徴とする請求項４記載の知識発見補助装置。

【請求項６】前記知識化規範が、ドメイン知識とする割合を一定の率に制御する規範を含むことを特徴とする請求項４又は５記載の知識発見補助装置。

【請求項７】節の種類による点数を利用者に質問する質問手段を更に備え、前記解釈手段が、読み出した問い合わせ文中の列の現れた節が前記得点表にない場合に、前記質問手段を通じて前記利用者から点数を獲得し、該点数と節を前記得点表に加える、ことを特徴とする請求項４記載の知識発見補助装置。

说明书全文

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データベースからの知識を発見する装置に関し、特に、データベースの利用者が行った問い合わせの履歴を用いて、参照するデータベースの表の列を制限する知識発見補助装置に関する。

【０００２】

【従来の技術】データベースからの知識発見技術（Ｋno
wledge Ｄiscovery in Ｄatabeses，通常「ＫＤＤ」
と略記される）は、蓄積されたデータの集合から、何らかの規則性や関係を知識として抽出する技術である。このＫＤＤについては、文献⁽¹⁾ （前田章、「データベースからの知識発見技術」、システム／制御／情報、Vol.
39、No.4、pp.185-190、1995）等の記載が参照される。

【０００３】すなわち、上記文献で説明されているように、データベースからの知識発見（ＫＤＤ）において、
発見するルール型の知識の条件になり得るテーブルの列は、ドメイン知識に規定される。ここで「ドメイン知識」とは、ユーザにとってより有用な知識を抽出するための、知識抽出モジュールへのバイアスを与えることを目的とし、事例の特定の部分集合に着目したり、知識要素抽出アルゴリズムのパラメータを調節し、知識探索戦略を制御したり、あるいは知識要素の評価尺度を決定したりするなどのために用いられる（上記文献⁽¹⁾参照）。

【０００４】例えば、ある保険会社の顧客情報のデータベースのテーブルに、「購入商品名」、「氏名」、「年齢」、「住所」、「預金残高」、「借入金残高」、「職業」などの列があるとする。「購入商品名」は、発見するルールの結論になる。その他の列はルールの条件になり得るが、実際には、「氏名」や「住所」などの列は、
条件として余り意味がない。

【０００５】すなわち、「ＩＦ（もし）〜ＴＨＥＮ（ならば）…」といったルールにおいて、例えば、「ＩＦ
氏名の姓が山田ＡＮＤ住所が大阪府ＴＨＥＮ商品Ａを購入」のようなルールは利用価値が少ない。

【０００６】逆に、「預金残高」や「職業」などの列は、条件として意味をなす場合がある。すなわち、例えば、「ＩＦ預金残高が１０００万円以上ＡＮＤ職業が公務員ＴＨＥＮ商品Ｂを購入」のようなルールの場合である。この場合、保険会社のセールスマンは、
課長級以上の公務員に対しては商品Ｂを薦めると良いことがわかり、営業がしやすくなる。

【０００７】このように、データベースのテーブルの列を規定し、有意なルールの導出効率を上げるための知識がドメイン知識である。

【０００８】そして、このドメイン知識は、データベースに依存するため、従来、人手作業にて作成していた。

【０００９】

【発明が解決しようとする課題】上記したように、従来、意味のある有効なルールを効率的に発見するために、ドメイン知識は、対象となるデータベースを専門家が調べて人手作業で作成していた。

【００１０】しかしながら、この方法だと、ドメイン知識の質が高く、有意なルールを効率的に導出することができるが、その反面、ドメイン知識作成作業には多大な労力及び工数が必要となる。

【００１１】データベースに依存せず、ある領域に依存したドメイン知識を利用する場合もあるが、この場合、
汎用すぎるため、無意味なルールが多数導出され、ルールの検証に多大な労力が必要となる。

【００１２】このため、対象となるデータベースに依存したドメイン知識を自動的に生成することができる知識発見補助装置の実現が望まれる。

【００１３】したがって、本発明は、上記事情に鑑みてなされたものであって、その目的は、知識発見装置に与える質が高く、有意なドメイン知識を自動的に作成する知識発見補助装置を提供することにある。

【００１４】

【課題を解決するための手段】前記目的を達成するため、本第１発明は、対象となるデータベースへの問い合わせの履歴から、順次問い合わせ文を取り出し、この問い合わせ文から列と該列が問い合わせ文中に出現する位置（「節」という）を抽出し、節に応じて、予め設定された得点をつけて統計をとり、予め設定された知識規範に基づいて、統計結果から重要な列を抽出し、これをドメイン知識とする機能手段を備えている。なお、問い合わせ文は、例えば「Ｓｅｌｅｃｔ」、「Ｗｈｅｒｅ」等の「節」と呼ばれる部分から構成されている。この列の出現する位置を「節」と呼ぶ。

【００１５】本第２発明は、第１発明に加えて、予め対象データベースからそこに含まれている列を全て取り出しておき、ドメイン知識とする列の割合を記述させることによって、列の数を一定の率で制限する機能を備えている。

【００１６】本第３発明は、上記第１発明に加えて、列の出現する節が得点を設定されていない場合、利用者に、当該節に含まれている列の得点を質問することによって、得点を設定する機能を備えている。

【００１７】上記本第１発明によれば、この機能によって対象となるデータベースのドメインに精通した専門家なしにドメイン知識を生成することができる。

【００１８】上記本第２発明によれば、例えば、知識発見装置が対象データベースの全列の半分のみを参照するようなドメイン知識を生成することができる。

【００１９】上記本第３発明によれば、この機能によって、あらかじめ全ての節の種類の得点を設定する必要がなくなり、利用者の負担が減る。

【００２０】本第１発明乃至第３発明は、従来対象となるデータベースのドメインに精通した専門家が専ら手作業で作成していたドメイン知識を、自動的もしくは半自動的に生成することができる。

【００２１】そして、本第１発明乃至第３発明によって生成されたドメイン知識を用いることによって、既存の知識発見装置（例えば、代表的ＫＤＤシステムである「ＩＤ３」（文献⁽²⁾ （JRQuinlan:Learning Efficie
nt Clasification Pricedures and Their Applica
tion to Chess End Games, Machine Learning,Ti
oga Publising Company, pp.463-482(1982)）等参照）や、「ＩＴＲＵＬＥ」（文献⁽³⁾ （P.Smyth and
RMGoodman:Rule Induction Using Information T
heory, Knowledge Discovery in Databases, AAAI
Press, pp.159-176(1991)）等参照））は、膨大な列をすべて探索することなく、ルールを発見することができる。

【００２２】また、本発明の知識発見補助装置は、意味のない列を、予め除去するため、知識発見装置が意味のないルールを発見することを抑制することができる。

【００２３】

【発明の実施の形態】本発明の実施の形態について図面を参照して以下に詳細に説明する。

【００２４】

【実施の形態１】図１は、本発明の第１の実施の形態の構成をブロック図にて示したものである。図１を参照すると、本発明の第１の実施の形態においては、知識発見装置が対象とするデータベースへの問い合わせの履歴を保持している問い合わせデータベース２１０と、問い合わせデータベース２１０を管理するデータベース管理システム２００と、問い合わせ文の節の種類によって加える点数を設定する得点表１０１と、列毎に点数を記録する統計表１１０と、データベース管理システム２００を通じて問い合わせデータベース２１０の問い合わせを順次読み出し、問い合わせ文中の列の出現頻度を得点表１
０１を参照して統計表１１０に追加する解釈モジュール１００と、知識発見装置のドメイン知識に加える規範を記述した知識化規範１２１と、生成される知識を保持するドメイン知識１３０と、統計表１１０に含まれている列から知識化規範１２１に従って知識を生成する知識化モジュール１２０と、を備えて構成される。

【００２５】図２は、本発明の第１の実施の形態における得点表１０１の具体的な内容の一例を示す図である。
得点表１０１は、問い合わせ文の節によって異なる点数を保持する表である。

【００２６】図２を参照すると、この得点表１０１の例では、「Ｓｅｌｅｃｔ」節中に現れる列には「４」点が、「Ｗｈｅｒｅ」節中に現れる列には「２」点が、
「Ｇｒｏｕｐｂｙ」節、「Ｈａｖｉｎｇ」節、「Ｏｒ
ｄｅｒｂｙ」節、「Ｃｏｍｐｕｔｅ」節中に現れる列には、それぞれ「１」点が与えられる。

【００２７】図３は、本発明の第１の実施の形態における解釈モジュールの処理フローを示す流れ図である。図３を参照すると、まず、データベース管理システム２０
０を通じて問い合わせデータベース２１０から、過去の問い合わせ文を１文ずつ取り出す（ステップ１００−
１）。

【００２８】問い合わせ文がない場合（ステップ１００
−２のｎｏ）は処理を終了し、問い合わせ文がある場合には（ステップ１００−２のｙｅｓ）、ステップ１００
−３に進み、解釈モジュールは問い合わせ文を前から調べ、文中に列があるか否かを判定し、出現しなくなったらステップ１００−１に戻る。

【００２９】そして列の問い合わせ文中での位置を調べる（ステップ１００−４）。例えば、データベースの問い合わせ文が、「Ｓｅｌｅｃｔ列１，列２Ｆｒｏｍ
表１ＷWｈｅｒｅ列３＞１００」であるものとする。

【００３０】この場合は、列１と列２は「Ｓｅｌｅｃ
ｔ」節に、列３は「Ｗｈｅｒｅ」節の位置にある。

【００３１】図３を参照して、列の出現位置がわかると、次に得点を、得点表１０１から調べる（ステップ１
００−５）。その際、得点表１０１の内容が図２に示したものであるとすると、列１と列２は「４」点、列３は「２」点となる。

【００３２】次に決定した得点を統計表１１０に加えるために、統計表１１０に列があるかどうかを調べる（ステップ１００−６）。

【００３３】統計表１１０に得点を加える列がない場合には列を新しく作る（ステップ１００−７）。

【００３４】図４は、本発明の第１の実施の形態における統計表１１０の具体的な内容の一例を示した図である。統計表１１０の「列名」の表記は、「表名．列名」
の形式である。図４を参照して、例えば「表１．列１」
は、表１の列１を意味する。

【００３５】図４に示す例の場合、列１と列２は統計表１１０に存在するが、列３は存在しないため、列３を統計表１１０に作る。

【００３６】再び図３を参照して、次に上記ステップ１
００−５で決定した得点（図２に示した例では、列１と列２は「４」点、列３は「２」点）を、統計表１１０の点数（得点）に加える。

【００３７】図４示した統計表１１０と図２に示した得点表１０１の例の場合、統計表１１０の値として、列１、列２はともに「４」点が加算され、それぞれ、１２
点、８点となり、列３は「２」点となり、列４と列５はそのままである。

【００３８】解釈モジュール１００は、問い合わせ文がなくなるまで（図３のステップ１００−２のｎｏ）この処理を繰り返す。

【００３９】解釈モジュール１００の処理が終わると次に知識化モジュール１２０が実行される。

【００４０】知識化モジュールは、知識化規範１２１にしたがってドメイン知識を生成する。知識化規範には次の３種類の規範がある。

【００４１】（１）ＡＨＲｎ（２）ＴＨＲｎ（３）ＧＰｎ

【００４２】各規範の最後の記号ｎは数値が入る。ＡＨ
Ｒ（All tables High Rank）ｎとＴＨＲ（Table High R
ank）ｎは、獲得点数が上位ｎ番目までの列をドメイン知識とする規範である。ここでＡＨＲｎとＴＨＲｎの違いは、ＡＨＲｎが表を区別しないのに対して、ＴＨＲｎ
が表単位で獲得点数の順位を付ける点にある。またＧＰ
（Get Point）ｎは、獲得点数がｎ点以上の列をドメイン知識とする規範である。

【００４３】図５に、本発明の第１の実施の形態における統計表１１０の内容の一例を示す。図５に示した統計表１１０を例に、それぞれの規範の相違点を説明する。

【００４４】例えば、「ＡＨＲ８」という規範の場合は、表の区別なしに、得点の上位８番目までの列をドメイン知識とするため、順に「表１．列３」、「表２．列５」、「表１．列４」、「表１．列７」、「表１．列１」、「表２．列３」、「表１．列２」、「表２．列４」の各列がドメイン知識となる。

【００４５】また「ＴＨＲ４」という規範の場合は、それぞれの表毎に得点の上位４番目までの列をドメイン知識とするため、表１では、「表１．列３」、「表１．列４」、「表１．列７」、「表１．列１」が、表２では、
「表２．列５」、「表２．列３」、「表２．列４」、
「表２．列１」、「表２．列２」の各列がドメイン知識となる。表２では、４番目が２列、すなわち「表２．列１」、「表２．列２」、が存在するため、５列がドメイン知識となる。

【００４６】「ＧＰ１５」という規範の場合は、１５点以上の列をドメイン知識とするため、「表１．列３」、
「表２．列５」、「表１．列４」、「表１．列７」の各列がドメイン知識となる。

【００４７】図５に示した統計表１１０の例では、「Ａ
ＨＲ８」と「ＧＰ１０」の規範は全く同じ結果を生じる。ＧＰｎという規範がある最も重要な理由は、「ＧＰ
１」という規範によって問い合わせ文に出現した列すべてをドメイン知識としたい場合に用いることができることである。

【００４８】

【実施の形態２】図６は、本発明の第２の実施の形態の構成をブロック図にて示したものである。図６を参照すると、本発明の第２の実施の形態においては、図１を参照して説明した前記第１の実施の形態に、知識発見装置が対象とするデータベースである対象データベース２２
０が追加された構成とされており、解釈モジュール１０
０は、この対象データベース２２０を管理するデータベース管理システム２００を通じて対象データベース２２
０の表のすべての列を獲得し、統計表１１０に予め列を追加する処理が追加されている。

【００４９】図７は、本発明の第２の実施の形態における解釈モジュール１００の処理フローを示す流れ図である。図７を参照すると、まず、対象データベースからすべての列を取り出す（ステップ１００−９）。取り出した列を統計表１１０に加える（ステップ１００−１
０）。

【００５０】統計表１１０にはステップ１００−１０によって、予めすべての列が作られているため、図３の流れ図におけるステップ１００−６とステップ１００−７
の処理、すなわち統計表に列があるか否かを調べ存在しない場合には列を加えるという処理、は不要とされる。
図７に示した流れ図において、ステップ１００−１〜１
００−５、及びステップ１００−８は、前記第１の実施の形態と同様の処理であるため、説明を省略する。

【００５１】知識化規範１２１には次の２種類の規範が加わる。

【００５２】（４）ＡＤＲｎ（５）ＴＤＲｎ

【００５３】各規範の最後の記号ｎは数値が入る。この２種類の規範は、獲得点数の上位からｎ％をドメイン知識とする規範である。ＡＤＲ（All tables Dividing Ra
nk）ｎとＴＤＲ（Table Dividing Rank）ｎの差はＡＤ
Ｒｎが表を区別しないのに対して、ＴＤＲｎが表単位で列を絞り込むことである。

【００５４】これらの規範の意味は、対象データベース２２０の表のすべての列のうち、ｎ％をドメイン知識にすることにある。列の多少に係わらず、知識発見装置が参照する列を一定の率で制限する。

【００５５】

【実施の形態３】図８は、本発明の第３の実施の形態の構成をブロック図にて示したものである。図８を参照すると、本発明の第３の実施の形態は、図１を参照して説明した前記第１の実施の形態に、更に、節の種類による点数を利用者に質問する質問モジュール１０２が追加したものであり、解釈モジュール１００には、読み出した問い合わせ文中の列の現れた節が得点表１０１にない場合に、質問モジュール１０２を通じて、点数を獲得し、
その点数と節を得点表１０１に加えるという処理が追加されている。

【００５６】図９は、本発明の第３の実施の形態における解釈モジュール１００の処理フローを示す流れ図である。図９において、ステップ１００−１〜１００−５までは図３の流れ図を参照して説明した前記第１の実施の形態と同じように処理される。

【００５７】図９を参照すると、列の得点を得点表１０
１で調べた結果（ステップ１００−１１）、列の現れた節が得点表１０１にあれば、ステップ１００−６に、なければステップ１００−１２進む。ステップ１００−１
２では、質問モジュール１０２を通じて得点表に現れなかった節の点数を獲得する。例えば、図２に示す得点表１０１に、「Ｈａｖｉｎｇ」節の点数が設定されていないものとする。

【００５８】この場合、質問モジュール１０２は、例えば図１０にその画面表示（質問ダイアログ）の一例を示すように、「“Ｈａｖｉｎｇ”節に現れる列につける点数を教えてください。」という質問を利用者に行い、利用者から該節の点数を獲得する。

【００５９】再び図９を参照して、獲得した点数は節とともに得点表１０１に追加する（ステップ１００−１
３）。

【００６０】図１０に示す質問画面において、利用者が「Ｈａｖｉｎｇ」節の点数を「１」点とした場合、図２
に示すよな得点表１０１の内容となる。

【００６１】図９に示す流れ図において、残りのステップ１００−６〜１００−８では、図３を参照して説明した前記第１の実施の形態と同様の処理が行われるため、
説明を省略する。

【００６２】

【発明の効果】以上説明したように、本発明によれば、
従来対象となるデータベースのドメインに精通した者が人手作業で作成していたドメイン知識を、自動的もしくは半自動的に作成することができるため、ドメイン知識作成のための作業工数を大幅に削減するという効果を奏する。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態の構成を示すブロック図である。

【図２】本発明の第１の実施の形態における得点表の内容の一例を示す図である。

【図３】本発明の第１の実施の形態における解釈モジュールの処理フローを説明するための流れ図である。

【図４】本発明の第１の実施の形態における統計表の内容の一例を示す図である。

【図５】本発明の第１の実施の形態における統計表の内容の一例を示す図である。

【図６】本発明の第２の実施の形態の構成を示すブロック図である。

【図７】本発明の第２の実施の形態における解釈モジュールの処理フローを説明するための流れ図である。

【図８】本発明の第３の実施の形態の構成を示すブロック図である。

【図９】本発明の第３の実施の形態における解釈モジュールの処理フローを説明するための流れ図である。

【図１０】本発明の第３の実施の形態における質問モジュールの質問ダイアログの一例を示す図である。

【符号の説明】

１００解釈モジュール１００−１問い合わせ文を取り出す処理１００−２問い合わせ文があるかを判断し分岐する処理１００−３列があるかを判断し分岐する処理１００−４列の出現位置を調べる処理１００−５得点を調べる処理１００−６統計表に列があるかを判断し分岐する処理１００−７列を加える処理１００−８得点を加える処理１００−９全ての列を取り出す処理１００−１０全ての列を統計表に加える処理１００−１１点数があるかを判断し分岐する処理１００−１２点数を獲得する処理１００−１３得点表に追加する処理１０１得点表１０２質問モジュール１１０統計表１２０知識化モジュール１２１知識化規範１３０ドメイン知識２００データベース管理システム２１０問い合わせデータベース２２０対象データベース

标题	发布/更新时间	阅读量
基于关联数据的自治数据湖构建系统及方法	2020-05-11	984
供应链金融的风险分析方法、装置、计算终端及存储介质	2020-05-14	947
基于ATT&CK的欺骗性防御系统、构建方法及全链路防御实现方法	2020-05-15	827
大数据风控管理系统	2020-05-08	562
一种基于知识图谱的漏洞知识库构建方法	2020-05-13	945
一种面向在线教育的实时反作弊检测和预警方法	2020-05-14	770
一种用于大型赛事赛时运行管理的系统及方法	2020-05-15	830
一种基于专家知识库的渗透测试风险评估方法以及模型	2020-05-08	277
一种基于知识图谱的医疗保障骗保行为发现方法	2020-05-12	166
一种油气田钻井现场智能安全管控系统	2020-05-14	855

Auxiliary device for discovering knowledge from database

【発明の詳細な説明】

该功能需要专业版企业版VIP权限，您可以：