首页 / 专利库 / 数学与统计 / 超平面 / Neural network learning device

Neural network learning device

阅读:327发布:2021-09-19

专利汇可以提供Neural network learning device专利检索,专利查询,专利分析的服务。并且PURPOSE:To provide a high-speed neural network learning device by detecting and deleting unnecessary cells in a neural network part after learning a neural network without restrictions. CONSTITUTION:A neural network part 11 consists of links and cells. An example storage part 12 holds examples. A detecting part 13 detects unnecessary cells in the neural network part 11. A learning control part 14 controls learning of the neural network part 11 and restricts erasing of cells.,下面是Neural network learning device专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 リンクとセルで構成されるニューラルネットワーク部と、例題を保持する例題記憶部と、前記ニューラルネットワーク部中の不必要なセルを検出する検出部と、前記ニューラルネットワーク部の学習時には、
    前記例題記憶部に保持された例題を前記ニューラルネットワーク部の入力とし学習の制御をし、前記ニューラルネットワーク部のセル消去時には、前記検出部で検出された前記ニューラルネットワーク部中のセルを消去する学習制御部とから構成されることを特徴とするニューラルネットワーク学習装置。
  • 【請求項2】 前記検出部が、セルへの入力の平均からセルへの重みベクトルと閾値で形成される超平面への距離が入力ベクトルの分散以上であればセルが常に活性または非活性の状態にあることより、そのセルを不用なセルと見なすことが出来ることを用いて、不用なセルを検出することを特徴とする請求項1記載のニューラルネットワーク学習装置。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【産業上の利用分野】本発明は、ニューラルネットワーク部中の不必要なセルを検出し、それらを削除することにより高速なニューラルネットワーク学習装置に関する。

    【0002】

    【従来の技術】従来、ニューラルネットワークに例題を提示することによって行なう学習には、バックワードプロパゲーション法などがあり、例えば「Paralle
    l Distributed Processin
    g」、Rumelhart D. E. et. al、MI
    T Press、(1986)(以下引用文献1と称す)に記載されている。

    【0003】ニューラルネットワークの不必要なセルの作成をしない方法として、例えば、「忘却をもちいたコネクショニストモデルの構造学習アルゴリズム」、石川真澄、人工知能学会誌、Vol. 5、No. 5、pp.
    595−603、(1990)(以下引用文献2と称す)に記載されているような技術が知られている。 この方法では、バックワードプロパゲーション法を用いる学習に従来から用いられている2乗誤差にニューラルネットワークの複雑度を付け加える。

    【0004】

    【発明が解決しようとする課題】上述した従来法では、
    例題の学習時にニューラルネットワークの複雑度を低減するような制約を付け加えるので、制約の強さを問題に応じて試行錯誤で適当に設定しなければならないという問題点がある。 これは、制約がきつすぎる場合には学習が進まないし、弱過ぎる場合には不必要なセルが残ってしまうからである。

    【0005】本発明の目的は、学習を下記の様な制約なしで行なった後にニューラルネットワーク部中の不必要なセルを検出し、それらを削除することにより高速なニューラルネットワーク学習装置を提供することにある。

    【0006】

    【課題を解決するための手段】本発明のニューラルネットワーク学習装置は、リンクとセルで構成されるニューラルネットワーク部と、例題を保持する例題記憶部と、
    前記ニューラルネットワーク部中の不必要なセルを検出する検出部と、前記ニューラルネットワーク部の学習時には、前記例題記憶部と保持された例題を前記ニューラルネットワーク部の入とし学習の制御をし、前記ニューラルネットワーク部のセル消去時には、前記検出部で検出された前記ニューラルネットワーク部中のセルを消去する学習制御部とから構成されることを特徴とする。

    【0007】また本発明によれば、前記検出部が、セルへの入力の平均からセルへの重みベクトルと閾値で形成される超平面への距離が入力ベクトルの分散以上であればセルが常に活性または非活性の状態にあることより、
    そのセルを不用なセルと見なすことが出来ることを用いて、不用なセルを検出することを特徴とする。

    【0008】

    【作用】本発明では、例題を保持する例題記憶部より例題を取り出して、リンクとセルで構成されるニューラルネットワーク部を学習させる。 この学習の方法は、例えば以下引用文献1に記載されているバックワードプロパゲーション法が使える。 また、例題記憶部の全ての例題について十分学習を行ない学習が完了したニューラルネットワーク部中の不必要なセルを検出部により検出する。

    【0009】これは、中間層のセルがすべての入力に対しても常に活性あるいは非活性になる可能性がある。 この場合、中間層のセルは出力が伝搬する方向の層のセルに対しては常に同じ出力を伝搬する。 従って、次の層のセルのバイアスを変更することによって、セルを消去可能である。 検出部では、この入力に対してもその出力が変化しないセルを検出する。

    【0010】学習制御部では、ニューラルネットワークの学習の制御と消去可能なセルを検出する検出部の制御と消去可能なセルを消去し、消去した影響が現われないように次の層のセルのバイアスの変更を行なう。

    【0011】

    【実施例】本願の発明の実施例について図面を参照して説明する。

    【0012】図1は発明のニューラルネットワーク学習装置の一実施例を示す構成図である。 このニューラルネットワーク学習装置は、リンクとセルで構成されるニューラルネットワーク部11と、例題を保持する例題記憶部12と、ニューラルネットワーク部中の不必要なセルを検出する検出部13と、ニューラルネットワーク部の学習を制御する制御部14を有している。

    【0013】ニューラルネットワーク部11は、例えば、階層型ニューラルネツトワークなどがあり、セルとセル間を接続するリンクで構成されている。

    【0014】例題を保持する例題記憶部12は、学習すべき例題を保持している。 各例題は、入力とそれに対応する出力より構成されている。

    【0015】検出部13は、学習修了後にニューラルネットワーク部中の不必要なセルを検出する。

    【0016】制御部14は、ニューラルネットワークの学習の制御と消去可能なセルを検出する検出部の制御と消去可能なセルを消去し、消去した影響が現われないように次の層のセルのバイアスの変更を行なう。

    【0017】次に、本願の発明の実施例の動作を説明する。 動作は、例題記憶部12の例題を用いてニューラルネットワーク部11の学習を行なう学習フェーズと、学習修了後にニューラルネットワーク部中の不必要なセルを検出し、消去可能なセルを消去する消去フェーズからなる。 これらのフェーズの切り替えも制御部14によって行われる。

    【0018】(1)発明の学習フェーズ 発明の学習フェーズについて、図1と、ニューラルネットワーク部11の内部を詳しく表した図2を用いて説明する。

    【0019】図2では構成例として、3層型のニューラルネットワークについて示している。 このニューラルネットワークは引用文献1で記載されている技術と同じである。

    【0020】学習制御部14は例題記憶部12より例題を選択し、ニューラルネットワークの入力とする。 入力層のセル24の出力関数は線形で、入力の値をそのままそのセルの出力値とする。 これらの値は、中間層のセル25へのリンクを通して中間層へ重み付きで伝搬する。
    中間層のセル25の出力は、伝搬してきた値にそのセルの敷居値θを足し合わせた値にシグモイド関数を用いて計算する。

    【0021】同様にして出力層のセル26についてもその出力を計算する。 この様にして得られた値と、例題により示されている正解を比較してニューラルネットワークのリンクの重みの更新を行なう。 このアルゴリズムについては引用文献1に詳細に解説されているバックワード・プロパゲーションを用いて実行することができる。

    【0022】これによって、ニューラルネットワークの学習は修了する。 学習が修了したニューラルネットワーク部は、例題の入力に対して正しい答を出すことが出来る。

    【0023】(2)消去フェーズ 消去フェーズについて、図3を用いて説明する。

    【0024】消去フェーズでは、学習が完了したニューラルネットワーク部中の不必要なセルを検出部13により検出する。 すべての入力に対して、常に活性あるいは非活性になる中間のセルを見つける。

    【0025】簡単の為に、中間層のセル25について説明する。 また、入力層21が2つのセルにより構成されている場合について説明する。 ここで、2つのセルに対する入力をx 1とx 2とする。 この場合、入力ベクトルxはx 12平面上の点として表現される。

    【0026】ここで、例題記憶部12の各例題の入力を調査することにより、x 1とx 2の取り得る範囲を算出する。 簡単のために、この範囲が[0,1]であったとして説明する。 この場合、入力ベクトルxの取り得る範囲は図3中で斜線で囲まれた部分に相当する。

    【0027】学習が修了すると、中間層のセル25に対する重みベクトルwと敷居値θが決定する。 中間層のセル25の入力netは、

    【0028】

    【数1】

    【0029】で決まる。 この時、入力netが常に0の集合は、重みベクトルwと敷居値θで決められる直線となる。

    【0030】ここで、仮に直線が31であったとする。
    この場合、直線31が図3中で斜線で囲まれた部分を横切っている。 従って、netの取り得る範囲は、負と正のどちらの値も取り得る。

    【0031】また、仮に直線が32であったとする。 この場合、直線32が図3中で斜線で囲まれた部分を横切っていない。 従って、全ての入力ベクトルに対してne
    tの取り得る範囲は、負または正のどちらか一方である。 このセルは、すべての入力に対して常に活性あるいは非活性になる中間層のセル25である。

    【0032】消去可能なセルを検出するためには、中間層のセル25の重みベクトルwと敷居値θで決められる直線と、x 1とx 2の取り得る範囲の関係を調べれば良い。 このために、

    【0033】

    【0034】と直線との距離dの関係を求める。

    【0035】

    【数3】

    【0036】ここで、距離dが

    【0037】

    【0038】とx 1とx 2の取り得る範囲との距離の

    【0039】

    【0040】よりも大きければ、入力netが常に0の直線は図3中で斜線で囲まれた部分を横切らない。 この関係を用いることによって、すべての入力に対して常に活性あるいは非活性になる中間層のセル25を検出することができる。

    【0041】学習制御部14は検出部13で検出された不要なセルを消去し、消去可能なセルを消去した影響が現われないように、次の層のセルのバイアスを消去したセルの影響分だけ増加する。

    【0042】

    【発明の効果】本発明のニューラルネットワーク学習装置により、ニューラルネットワーク部中の不必要なセルを検出し、それらを削除することにより高速なニューラルネットワーク学習装置が実現できる。

    【図面の簡単な説明】

    【図1】本願発明のニューラルネットワーク学習装置の一実施例を示す構成図。

    【図2】ニューラルネットワーク部11の構成を示す図。

    【図3】ニューラルネットワーク部11中の不必要なセルを検出する方法を示す図。

    【符号の説明】

    11 ニューラルネットワーク部 12 例題記憶部 13 検出部 14 制御部 21 入力層 22 中間層 23 出力層 24 入力層のセル 25 中間層のセル 26 出力層のセル 31 入力が取り得る空間に含まれる場合 32 入力が取り得る空間に含まれない場合

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈