Neural network

阅读:633发布:2024-01-30

专利汇可以提供Neural network专利检索,专利查询,专利分析的服务。并且PURPOSE: To restore the three-dimensional shape of an object well from two parallactic pictures by using a neural network.
CONSTITUTION: A neuron element part 1 is provided with n neuron elements, the neuron elements are divided into m blocks and block sequential updating is performed. Then, the output state of the respective neuron elements is determined by a saturated type linear transfer function and the outputs of the respective elements are values between '0' and '1'. Also, parameters p, q and γfor determining the saturated type linear transfer function are changed by a prescribed form every time of the state updating. Also, in this neural network, by constraint conditions. The coupling of excitability is provided not only in the same parallax direction but also in the depth direction and the height direction.
COPYRIGHT: (C)1995,JPO,下面是Neural network专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】ニューロン素子が3次元的に配置され、各ニューロン素子はその近傍のニューロン素子と所定のシナプス結合を有する相互結合型ニューラルネットワークであって、 ニューロン素子はm個のブロックに分割されてなり、 第lブロック内(但し、l =1,2,…,m)のニューロン素子の出力状態ベクトルx (l)が結合荷重行列W klを介して第kブロック(但し、k=1,2,…,m)に流入すると共に、第kブロックには更に二つの視差画像の特徴量の類似度が入力バイアスベクトルθ (k)として加わって(1)式で表される第kブロックへの総入力ベクトルu
    (k)が得られ、 【数1】 前記総入力ベクトルu (k)に外部からの入力の影響を制御するパラメータαを乗じた値と、前記第kブロック内の素子の出力状態ベクトルx (k)に状態更新前の出力値の影響を制御するパラメータγを乗じた値とを加算して得られるベクトルの成分毎に、p,qをパラメータとして 【数2】 で表される飽和型線形伝達関数を作用させて得られるベクトルを次の時刻での第kブロックの出力状態ベクトルx (k)として、 【数3】 で表される式によって一斉に状態を更新し、この状態更新をブロック毎に順次行い、且つこの状態更新を行う過程において、 前記飽和型線形伝達関数のパラメータpは状態更新の度毎に 0に近付くように変化され、パラメータqは、シナプス結合行列Wの対角ブロック行列W kkの最小固有値を
    min{λ k }とするとき、−α×min{λ k }/2 以上の範囲で一定値または所望の態様で変化され、pとqの和がγとなされることを特徴とするニューラルネットワーク。
  • 【請求項2】視差が一定の方向に配置されているニューロン素子間及び奥行き方向に配置されているニューロン素子間に興奮性のシナプス結合があることを特徴とする請求項1記載のニューラルネットワーク。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【産業上の利用分野】本発明は、ニューラルネットワークに係り、特に、二つの視差のある画像(以下、視差画像と称す)から当該画像に写っている物体の3次元形状を復元する装置に用いて好適なニューラルネットワークに関する。

    【0002】

    【従来の技術】近年、ロボットにTVカメラを2台搭載し、これらのTVカメラで得た二つの視差画像から前方の物体の3次元形状を復元して認識し、所定の作業をさせたり、邪魔になる物体を避けて自動走行させたりすることが考えられている。

    【0003】このような視差画像から物体の3次元形状を復元させるものとしては種々考えられるところであるが、特に、ニューラルネットワーク(以下、ニューラルネットと略称する)を用いたものとしては、平井−福島モデルあるいはMarr−Poggioモデルが知られている。

    【0004】平井−福島モデルとMarr−Poggioモデルとでは、後述するように拘束条件等は異なるが、これらのモデルを、二つの視差画像から物体の3次元形状を復元するための装置に適用した場合の全体的な構成は殆ど同じであり、概略図10に示すような構成である。

    【0005】図10において、画像入部2は、レンズ4、6、及びCCDセンサ等からなる二つの受光部5、
    7を備えており、受光部5にはレンズ4により対象物体3の画像が結像され、受光部7にはレンズ6により対象物体3の画像が結像される。 これによって、受光部5と受光部7とからは、距離が略等しく、異なる視点から対象物体3を撮像した二つの視差画像データが得られる。

    【0006】そして、これらの画像データはニューラルネット1に入力される。 具体的には次のようである。 いま、例えばニューラルネット1のi方向のニューロン素子数が6、j方向のニューロン素子数が6、高さ方向h
    のニューロン素子数が6であるとすると、受光部7で得られた画像は図11Aに示すように、i方向に 6ドット、h方向に 6ドットの計36ドットの画像になされ、同様に受光部5で得られた画像は図11Bに示すように、
    j方向に 6ドット、h方向に 6ドットの計36ドットの画像になされる。

    【0007】そして、図11Aに示す画像の、高さがh
    位置にある各ドットの強度情報、即ち濃度情報は、図1
    2に示すようにニューラルネット1の高さhの位置の面1 hのi方向のニューロン素子に入力バイアスとして入力され、同様に図11Bに示す画像の、高さがh位置にある各ドットの強度情報は図12に示すようにニューラルネット1の高さhの位置の面1 hのj方向のニューロン素子に入力バイアスとして入力される。 なお、図1
    0、図12においてはニューロン素子は白丸あるいは黒丸で示している。 白丸は当該ニューロン素子の出力が「 0」であることを示し、黒丸は当該ニューロン素子の出力が「1」であることを示しているが、図10及び図12はある時刻における各ニューロン素子の出力の状態を例示しているに過ぎないものである。 また、画像のドットの強度情報を入力するに際して、ニューロン素子に対応するドットの強度情報を直接入力するのではなく、
    ニューロン素子に対応するドットの強度情報とその近傍のドットの強度情報を入力してもよいものである。

    【0008】従って、図10においてはニューラルネット1はニューロン素子が2次元的に配置されているものとして示してあるが、これはある高さにおけるニューロン素子の配置を示しているものである。

    【0009】さて、いま理解を容易にするために高さh
    が一定の面内で考えるものとすると、ニューラルネット1に入力された画像の強度情報は、図12に示すような互いに交差するラインに沿って送られ、交差するラインの交点に位置するニューロン素子には二つの画像中の対応するドットの強度情報の差が入力バイアスとして流入する。 即ち、例えば図12において8で示すニューロン素子にはQ i2で示すドットの強度情報とQ j4で示すドットの強度情報の差が入力バイアスとして流入する。

    【0010】そして、各ニューロン素子の出力にはシナプス結合荷重が掛け合わされて他のニューロン素子への入力となる。 つまり、各ニューロン素子には、他のニューロン素子の出力にシナプス結合荷重が掛け合わされた値と入力バイアスとが流入し、これに伝達関数の演算を施したものが次の時刻のニューロン素子の出力となるのである。

    【0011】各ニューロン素子は以上のようにして状態更新を行うのであるが、状態更新を繰り返し、定常状態になったときに「1」 を出力しているニューロン素子の位置が対象物体3の3次元形状の相対的な位置を推定していることになる。 例えば、いま理解を容易にするために、定常状態になったときに「1」 を出力しているニューロン素子から基準となる面まで垂線を引いたときに図13Aのようであったとすると、各垂線の先端の位置に対象物体の表面があることになり、対象物体は図13B
    に示すようなサドル型の形状であると推定することができることになる。

    【0012】従って、ニューラルネット1の出力側に形状復元部(図示せず)を設け、この形状復元部に、定常状態に達したときに 1を出力しているニューロン素子の座標を取り込ませ、その座標に基づいて対象物体の3次元形状を復元する処理を行わせればよい。

    【0013】さて、平井−福島モデルにおいては、伝達関数としては出力値が 0または 1だけを出力する関数を用いている。 即ち、平井−福島モデルはいわゆる2値モデルである。 そして、ニューロン素子間のシナプス結合は抑制性の結合のみであり、3次元形状を再構成する際に平滑化の処理を行うようになされている。 なお、平井−福島モデル及びその改良モデルに関しては、「電子情報通信学会技術研究報告 NC91 (1991)」の97〜102ページに詳しい。

    【0014】また、Marr−Poggioモデルは、2値モデルである点は平井−福島モデルと同じであるが、一つの画像中の1点は他方の画像中の高々1点とのみ対応するという制約を表す抑制性の結合を持たせ、更に、視差一定の面内において、近傍に位置するニューロン素子間にだけ興奮性の結合を持たせている。 なお、Marr−Poggioモデルに関しては、「Biological Cybernetics 28 (197
    8)」の 223〜 239ページの「Analysis of a Cooperativ
    e Stereo Algorithm」と題する論文に詳しい。

    【0015】

    【発明が解決しようとする課題】しかしながら、平井−
    福島モデルでは3次元形状を再構成する際に平滑化の処理が必要となるので、構成が複雑になるばかりでなく、
    処理時間も長くかかるという問題がある。

    【0016】更に、上記の論文には、平井−福島モデルを改良したモデルを用いてランダムドットステレオグラムから物体の3次元形状を復元する場合、ドット密度が大きくなると誤ったニューロンが発火する危険性が増すと述べられているので、このモデルを用いて良好に3次元形状を復元しようとすると、入力する二つの視差画像のドット数をあまり増やせないという制限が生じてくることになる。

    【0017】また、Marr−Poggioモデルにおいては、視差一定の面内の近傍に位置するニューロン素子間にだけしか興奮性の結合が入っていないので、平面の再構成は比較的良好に行うことができるが、奥行き方向に連続的に変化する曲面を有する物体を再構成することは非常に困難であるという問題がある。

    【0018】また、平井−福島モデルやMarr−Poggioモデルは2値モデルであるため、対象物体の3次元形状を良好に復元することが非常に困難である。 このことはシミュレーションの結果判明している。

    【0019】これらを解決するための手法として、シミュレーテッド・アニーリング法等が提案されてはいるが、この手法は状態の確率的繰り返しで平衡状態を実現するものであるので処理時間が非常に長くなり非現実的なものである。

    【0020】また、平井−福島モデルやMarr−Poggioモデルにおいて処理効率を向上させるためには複数個のニューロン素子を同時に状態更新することが考えられるが、この場合にはニューロン素子の出力が振動状態に陥ってしまい、定常状態にならない可能性があるものである。

    【0021】本発明は、上記の課題を解決するものであって、対象物体が平面であっても、あるいは奥行き方向に連続的に変化する曲面を有するものであっても、物体形状によらず視差画像から3次元形状を良好に復元することができるニューラルネットワークを提供することを目的とするものである。

    【0022】また、本発明は、処理を効率的に行え、しかも平滑化処理等の後処理を必要とせずに高速に3次元形状を復元できるニューラルネットワークを提供することを目的とする。

    【0023】

    【課題を解決するための手段】上記の目的を達成するために、本発明のニューラルネットワークは、ニューロン素子が3次元的に配置され、各ニューロン素子はその近傍のニューロン素子と所定のシナプス結合を有する相互結合型ニューラルネットワークであって、ニューロン素子はm個のブロックに分割されてなり、第lブロック内(但し、l=1,2,…,m)のニューロン素子の出力状態ベクトルx (l)が結合荷重行列W klを介して第kブロック(但し、k=1,2,…,m)に流入すると共に、第kブロックには更に二つの視差画像の特徴量の類似度が入力バイアスベクトルθ (k)として加わって(1)式で表される第kブロックへの総入力ベクトルu (k)が得られ、

    【0024】

    【数4】

    【0025】前記総入力ベクトルu (k)に外部からの入力の影響を制御するパラメータαを乗じた値と、前記第kブロック内の素子の出力状態ベクトルx (k)に状態更新前の出力値の影響を制御するパラメータγを乗じた値とを加算して得られるベクトルの成分毎に、p,qをパラメータとして

    【0026】

    【数5】

    【0027】で表される飽和型線形伝達関数を作用させて得られるベクトルを次の時刻での第kブロックの出力状態ベクトルx (k)として、

    【0028】

    【数6】

    【0029】で表される式によって一斉に状態を更新し、この状態更新をブロック毎に順次行い、且つこの状態更新を行う過程において、前記飽和型線形伝達関数のパラメータpは状態更新の度毎に 0に近付くように変化され、パラメータqは、シナプス結合行列Wの対ブロック行列W kkの最小固有値をmin{λ k }とするとき、−
    α×min{λ k }/2 以上の範囲で一定値または所望の態様で変化され、pとqの和がγとなされることを特徴とする。

    【0030】ここで、ニューロン素子間の結合は、請求項2記載のように、視差が一定の方向に配置されているニューロン素子間及び奥行き方向に配置されているニューロン素子間に興奮性のシナプス結合を持たせることが望ましいものである。

    【0031】

    【作用】本発明のニューラルネットワークは相互結合型ニューラルネットワークであり、ニューロン素子は3次元的に配置されている。 そして、ニューロン素子はm個のブロックに分割されている。 いくつのニューロン素子で一つのブロックとするかは任意である。 即ち、当該ニューラルネットワークのニューロン素子数をnとすると、1≦m≦nであり、m=1の場合は一つのニューロン素子で一つのブロックが構成され、m=nの場合は当該ニューラルネットワークの全てのニューロン素子で一つのブロックが構成されることになる。

    【0032】さて、第kブロック(但し、k=1,2,…,
    m)には、第lブロック(但し、l=1,2,…,m)内のニューロン素子の出力状態ベクトルx (l)に結合荷重行列W klが掛け合わされたものと、入力バイアスベクトルθ
    (k)が流入する。 この入力バイアスベクトルθ (k)は、
    二つの視差画像の特徴量の類似度を示すものである。

    【0033】そして、これらの流入によって(1)式で表される第kブロックへの総入力ベクトルu (k)が得られ、この総入力ベクトルu (k)に外部からの入力の影響を制御するパラメータαを乗じた値と、第kブロック内の素子の出力状態ベクトルx (k)に状態更新前の出力値の影響を制御するパラメータγを乗じた値とを加算して得られるベクトルの成分毎に、(2)式で表される飽和型線形伝達関数を作用させ、その結果得られるベクトルを次の時刻での第kブロックの出力状態ベクトルx (k)
    として、(3)式で表される式によって一斉に状態を更新し、この状態更新をブロック毎に順次行う。

    【0034】そして、以上のような状態更新を行う過程において、飽和型線形伝達関数のパラメータpは、状態更新を行う度毎に 0に近付くように変化される。 また、
    qも飽和型線形伝達関数のパラメータではあるが、このパラメータqは、シナプス結合行列Wの対角ブロック行列W kkの最小固有値をmin{λ k }とするとき、−α×mi
    n{λ k }/2 以上の範囲で一定値とすることもでき、あるいは所望の態様で変化させることも可能である。 そして、pとqの和がγとなされる。

    【0035】以上のように、まず、本発明においてはブロック・シーケンシャルな状態更新を行うことが特徴である。 即ち、ブロック内のニューロン素子は同期的に状態を更新し、第1ブロックから第mブロックまで逐次的に状態更新していくのであり、これによって処理を効率よく、高速に行うことができる。

    【0036】また、本発明においては、(2)式で表される飽和型線形伝達関数が、p<y<qの範囲内においては 0と 1の間の連続的な値をとることが特徴である。
    勿論、最終的に定常状態になったときにはニューロン素子の出力は 0または 1になるのであるが、定常状態に達するまでの間にはニューロン素子の出力は 0または 1あるいはその間の値をとるのである。 つまり、本発明のニューラルネットワークは従来のような2値モデルではないのである。

    【0037】更に、本発明においては、飽和型線形伝達関数のパラメータp,q及びγが固定値ではなく、状態更新を行う過程において変化されることが特徴である。
    勿論、qの値は状態更新の過程において一定値であってもよいことは上述した通りである。 これによって、従来の2値モデルの欠点を回避することができる。

    【0038】そして、これらが相互に作用することによって、従来の問題が解決され、処理効率が向上し、処理が高速になり、対象物体の形状によらずその形状を良好に復元することができる。

    【0039】

    【実施例】以下、図面を参照しつつ実施例を説明する。
    図1は本発明に係るニューラルネットワークの一実施例の構成を示す図、図2は図1に示すニューロン素子部1
    1の各ブロックの構成例を示す図であり、図中、11はニューロン素子部、12は演算評価部、13はパラメータ設定部、21は総入力演算部、22、23は演算部を示す。 なお、ここでは視差画像の縦方向のドット数と横方向のドット数は同じであるとする。

    【0040】ニューロン素子部1はn個のニューロン素子を備えているが、これらのニューロン素子はm個のブロックに分割されている。 即ち、第1ブロックは、x
    1,1 ,x 1,2 ,…,x 1,s1のs1 個のニューロン素子で構成され、第2ブロックは、x 2,1 ,x 2,2 ,…,x
    2,s2のs2 個のニューロン素子で構成され、同様に第m
    ブロックは、x m,1 ,x m,2 ,…,x m,smのsm 個のニューロン素子で構成されている。 即ち、s1 +s2 +…
    +sm =nである。

    【0041】ニューロン素子には、図10〜図12に関して説明したと同様に、距離が略等しく、異なる視点から撮像された二つの画像情報の画像データが入力され、
    状態更新が行われるが、以下、状態更新の態様について詳細に説明する。

    【0042】図1に示すニューラルネットワークにおいては状態更新はブロック・シーケンシャルな状態更新を行う。 つまり、n個のニューロン素子をm個のブロックに分割し、個々のブロック内のニューロン素子は同期的に状態を更新し、ブロック間では第1ブロックから第m
    ブロックまで逐次的に状態更新していく。

    【0043】そして、いま、n個のニューロン素子の状態を表す状態ベクトルx=(x 1 ,…,x nT (0 ≦
    l ≦ 1;l=1,2,…,n)をm個のサブベクトルx
    (k) (但し、k=1,2,…,m)に分割するものとすると、それぞれのサブベクトルは次の(1)式、(3)式に従って状態を更新していく。

    【0044】

    【数7】

    【0045】ここで、(1)式におけるθ (k)は、閾値ベクトルθ=[θ (1)T ,θ (2)T ,…,θ (m)T ]のサブベクトルであり、αは任意の係数である。 また、(1)式のW klは第lブロック(但し、l=1,2,…,m)から第k
    ブロックへのシナプス結合を示す小行列であり、シナプス行列Wとは次の式で関係付けられる。 なお、係数γについては後述する。

    【0046】

    【数8】

    【0047】また、(3)式において Satで表されている関数は次の(2)式で定義される飽和型の線形伝達関数であり、この関数 Satはベクトル成分毎に作用する。

    【0048】

    【数9】

    【0049】さて、(2)式におけるp,qは飽和型線形伝達関数 Satのパラメータであるが、これらのパラメータp,qがどのような値をとればいいのかを考えると次のようである。

    【0050】いま、対称行列W=(wl k )に対してエネルギー関数を次の(5)式で定義するとする。

    【0051】

    【数10】

    【0052】ここで、エネルギー関数Eの係数行列W及び係数ベクトルθは、二つの視差画像から対象物体の3
    次元形状を復元するという最適化問題の評価関数の係数と比較して決定されるものであり、従って、対象物体の3次元形状を良好に復元するためには、この(5)式で与えられるエネルギー関数Eの最小値もしくは良好な極小値を求めればよいことが分かる。 なお、係数行列W及び係数ベクトルθの求め方については後述する。

    【0053】ところで、いま、e (k) =(1,1,…,1)というk次元ベクトルe (k)を用いて、二つの関数F,G
    をそれぞれ次の(6)式、(7)式のように定義する。

    【0054】

    【数11】

    【0055】このような関数を定義して解を求める手法は、いわゆる決定論的アニーリングと称されている手法であるが、これらの関数の解析あるいは種々のシミュレーションの結果によれば、パラメータp,q,γが次の式を満足するとき、ニューロン素子の状態更新によって関数Gの値を減少させることができることが確認された。

    【0056】

    【数12】

    【0057】ここで、λ kはシナプス結合行列Wの対角ブロック行列W kkの固有値の集合であり、min{λ k }はその固有値の中の最小値、即ち最小固有値を示すものである。

    【0058】次に、パラメータpについてであるが、p
    を種々に変化させてみると次のことが判明した。

    【0059】pが十分に大きいときには、関数Fの最小点から少しずれた点が関数Gの唯一の極小点になり、
    エネルギー関数Eの極小点は関数Gの極小点としては現れない。

    【0060】pが 0に十分近いときには、エネルギー関数Eの全ての極小点が関数Gの極小点として現れ、且つ関数Gの極小点はエネルギー関数Eの極小点に限られる。

    【0061】pの値が上記との中間にあるときには、エネルギー関数Eの局所極小点が関数Gの極小点とはならない場合が生じて、エネルギー関数Eの局所極小点が解消される。

    【0062】このことに関して、簡単な場合を例にとって説明すると次のようである。

    【0063】いま、エネルギー関数Eが E(x,y)=−0.8xy+0.2x+0.2y という2変数x,yに関する斉次1次式で表されたとすると、このエネルギー関数Eのグラフは図3Aに示すようである。 このグラフから、エネルギー関数Eには最小点aと局所極小点bがあり、最急降下法により単純にエネルギー関数Eの山下りを行う方法を用いると、最小点aまたは局所極小点bのいずれか一方に収束することが分かる。

    【0064】また、このとき、関数F、及び関数Gは、 F(x,y)=0.5(x(x−1)+y(y−1)) G(x,y)=E(x,y)+F(x,y) となり、そのグラフはそれぞれ図3B,Cに示すようである。 図3Bのグラフによれば、関数Fは唯一の極小点として最小点cを持つことが分かる。 また、図3Cに示すグラフから、エネルギー関数Eの局所極小点bは、関数Gにおいては極小点ではなくなることが分かる。 即ち、エネルギー関数Eに関数Fを加えることによりエネルギー関数Eの局所極小点からより小さな値をとるエネルギー関数Eの極小点へ下っていく抜け道ができることになる。

    【0065】このように、エネルギー関数Eに関数Fを加えることにより新たに1つだけ生じる関数Gの極小点は、pが 0に近付く過程で解消されていくので、状態更新を繰り返していく過程においてpを次第に 0に近付けていけば、最終的にはエネルギー関数Eの最小点もしくは良好な極小点に収束させることができることが分かる。

    【0066】以上のことから、パラメータp,q,γの値を次の式に従って制御しながら状態更新を繰り返すのがよいことが判明した。

    【0067】

    【数13】

    【0068】なお、qについては、(4−c)式で定められる範囲で一定値としてもよく、またこの範囲内で適宜に変化させてもよいことが種々のシミュレーションの結果確認された。

    【0069】以上のようにして状態更新を繰り返すことによって最終的にはエネルギー関数Eの最小点もしくは良好な極小点に収束し、従ってニューロン素子の出力が定常状態に達したときに「1」 を出力しているニューロン素子の相対的な位置関係が求める対象物体の3次元形状とすることができる。

    【0070】本発明においては以上のような状態更新が繰り返されるのであるが、状態更新を行うについてはニューロン素子間の結合荷重W及び入力バイアスθが定まっている必要がある。 そこで、以下、ニューロン素子間の結合荷重W及び入力バイアスθの決定法について説明する。

    【0071】結合荷重及び入力バイアスを決定するには、まず物理的な拘束条件を定める必要がある。 ここでは、拘束条件として次の3つの条件を定める。

    【0072】(1)一つの画像中の1点は、他方の画像中の高々1点とのみ整合する(2)視差は画像中のほとんど全域で滑らかに変化する (3)同じ特徴を持ったもののみが整合する 上記の(1)、(2)の拘束条件はニューロン素子間の結合状態を定める条件であり、それぞれ次の(8)式、
    (9)式で表される。

    【0073】

    【数14】

    【0074】ここで、Dは最大視差である。 例えば、D
    =25と設定したとすれば、これは与えられた二つの視差画像の視差のずれ量が25段階の奥行きのあるものまで認識できるようにするという設定を意味するものである。
    また、Nは視差画像の縦方向及び横方向のドット数である。 従って、N= 128とすると、左右の画像のドット数は共に 128× 128= 16384である。

    【0075】上記の(1)、(2)の拘束条件から定まるニューロン素子間の結合状態を示すと図4のようである。 図4を説明すると次のようである。 いま、ある一つのニューロン素子に着目する。 この着目素子が図4の□
    で示される位置にあるものとすると、当該着目素子は、
    ○で示される位置にあるニューロン素子とは興奮性の結合を有し、△で示される位置にあるニューロン素子とは抑制性の結合を有している。 その他の位置のニューロン素子とは結合関係を有していない。

    【0076】図4から明らかなように、このニューラルネットワークにおいては、同一視差方向に位置されている近傍のニューロン素子間だけではなく、奥行き方向に位置されている近傍のニューロン素子間及び高さ方向に位置されている近傍のニューロン素子間にも興奮性の結合を有しているのであり、これによって対象物体の形状によらず、その3次元形状を良好に復元することが可能となるのである。

    【0077】なお、E 3の式におけるSは、図4において□で示されている着目素子と興奮性結合を有するニューロン素子の集合を示すインデックスセットを示すものである。

    【0078】また、上記(3)の拘束条件は入力バイアスを定める条件であり、次の(10)式で表される。

    【0079】

    【数15】

    【0080】ここで、Ψは閾値、R,Lはそれぞれ左及び右の画像の強度値を表している。 また、Vは、点(i,j,h)のhが一定である所定の範囲に位置するニューロン素子の集合のインデックスセットであり、ここでは点(i,j,h)のhが一定である3×3の範囲内に位置するニューロン素子の集合を表すインデックスセットであるとする。

    【0081】さて、ニューロン素子iの出力をX iで表すとき、以上の拘束条件は、A,B,Cを任意の定数として(11)式の形の評価関数で表される。

    【0082】 E=AE 1 +BE 2 +CE 3 …(11) また、このとき、エネルギー関数が下記の(12)式で表されるものとすると、上記の(11)式と下記の(1
    2)式のエネルギー関数との係数を比較することによって結合係数W ijh及び入力バイアスθ ijhを決定することができる。 なお、この入力バイアスθ ijhは、入力される二つの視差画像の特徴量の類似度を示すものである。

    【0083】

    【数16】

    【0084】具体的には次のようである。 (11)式と(12)式から次の(13)式が得られる。

    【0085】

    【数17】

    【0086】この(13)式において、両辺のx ijh 2をx ijhで置き換えることによって、2次形式を斉次一次形式に変形することができる。 なぜなら、この変形はエネルギー関数の極小点の位置を変えないからである。

    【0087】次に、この両辺をx ijhで微分し、

    【0088】

    【数18】

    【0089】を用いると次の(14)式を得る。

    【0090】

    【数19】

    【0091】ここで、この(14)式の右辺の各項は以下のようになる。

    【0092】

    【数20】

    【0093】そして更にここで、 2B, 2Cをそれぞれ新たにB,Cと置き換え、(14)式の両辺の係数を比較することによって、結合荷重と入力バイアスは次のように求められる。

    【0094】

    【数21】

    【0095】ここで、

    【0096】

    【数22】

    【0097】は共にクロネッカーのデルタであり、また

    【0098】

    【数23】

    【0099】である。

    【0100】次に、図1、図2に示す構成の動作について説明する。 まず、上述したようにして結合荷重Wと入力バイアスθを決定する。 そして、図1のニューロン素子部11の各ブロックに対して決定した結合荷重Wを与える。

    【0101】その後、状態更新が開始されることになるが、いま、第lブロックの状態更新が終了し、次に第k
    ブロックの状態更新が行われる場合について説明すると、まず第lブロックの状態更新に際しては、パラメータ設定部13でパラメータp,q,γの値を設定し、それをニューロン素子部11の各ブロックに与えると共に、各ブロックに対して決定した入力バイアスθを流入させる。

    【0102】これによって、第lブロックの総入力演算部21は(1)式により総入力ベクトルu (l)を求める。 求められた総入力ベクトルu (l)は演算部22に入力される。 また、演算部22には、パラメータ設定部1
    3からγが与えられると共に、前回に行った状態更新のときの出力状態ベクトルx (l) (t)が演算部23からフィードバックされる。

    【0103】これによって、演算部22は、予め設定されている係数αを用いて γx (l) (t)+αu (l) …(21) を演算し、演算部23に出力する。

    【0104】演算部23は、パラメータ設定部13から与えられたパラメータp,qを用いて演算部22から入力された値に対して(3)式の演算を施す。 これにより新たな出力状態ベクトルx (l) (t+1)が得られ、状態が更新されたことになる。 この出力状態ベクトルx
    (l) (t+1)は演算部22にフィードバックされると共に、演算評価部12に出力される。 演算部22にフィードバックされた出力状態ベクトルは次の状態更新の際に用いられることは上述したとおりである。

    【0105】演算評価部12は、各ブロックから入力される出力状態ベクトルに基づいて全てのニューロン素子の出力状態を監視し、定常状態に達したか否かを評価する。 この評価は、出力状態ベクトルが時刻tと時刻(t
    +1)とで変化しているかどうか、あるいは予め定められているエネルギー関数の値が時刻tと時刻(t+1)
    とで変化しているかどうか、または出力状態ベクトルが拘束条件を満たしているかどうか等により行うことができ、定常状態に達したと判断される場合には、1 を出力している全てのニューロン素子の座標を出力する。 そしてこの出力に基づいて3次元形状を復元することができることは上述した通りである。

    【0106】しかし、未だ定常状態に達していないと判断される場合には、演算評価部12は、パラメータ設定部13に対してパラメータp,q,γの次の値の出力を指示する。 パラメータ設定部13で設定された新たなp,q,γのパラメータ値はニューロン素子部11の各ブロックに与えられ、同時に各ブロックに対して入力バイアスθが流入される。

    【0107】これによって、第kブロックの総入力演算部21では(1)式により総入力ベクトルu (l)を演算され、演算部22では(21)式が演算され、更に演算部23では新たな出力状態ベクトルx (k) (t+2)が得られ、状態が更新される。

    【0108】この出力状態ベクトルx (k) (t+2)は演算部22にフィードバックされると共に、演算評価部12に出力され、以下、上述した処理が繰り返される。

    【0109】ここで、パラメータp,q,γは上述したように状態更新が行われる度毎に変化されるが、その変化の態様は任意である。 その一例を図5に示す。 なお、
    図5において、Y 0はy=−α×min{λ k }/2 の位置を示している。

    【0110】図5Aは、(p+q)を一定、即ちγを一定としてpを 0に近付けていくように変化させた場合のqの変化及び飽和型線形伝達関数 Satの線形部分の傾きの変化を示している。 また、図5Bは、qを一定としてpを 0に近付けていくように変化させた場合の飽和型線形伝達関数 Satの線形部分の傾きの変化を示している。
    更に、図5Cは、飽和型線形伝達関数 Satの線形部分の傾きを一定としてpを0に近付けていくように変化させた場合のqの変化を示している。

    【0111】なお、qの値を定めるのにはシナプス結合行列Wの対角ブロック行列W kkの最小固有値min{λ k
    が定められる必要がある。 この最小固有値は、実際にシナプス結合行列Wの対角ブロック行列W kkの全ての固有値を求め、その最小値を採用するのが基本ではあるが、
    図10、図12で示すi方向またはj方向に沿って並んでいるニューロン素子を一つのブロックとする場合には、第kブロック内での結合行列の最小固有値は、当該ブロックを構成するニューロン素子数をN kとしてB
    (1−N k )で求められることが分かっている。 なお、
    Bは上記の(11)式に用いられている係数Bである。

    【0112】従って、例えば図12において9で示す枠で囲んだi方向に沿って並んでいる6つのニューロン素子を一つのブロックとする場合には、このブロックではN k = 6であるから、このブロックの最小固有値は−5B
    であり、従ってqの最小値は 5B/ 2となる。

    【0113】以上のように、パラメータp,q,γの変化のさせ方は任意に設定できるのであるが、本発明者は、qは一定値とし、pのみを次式によって変化させれば殆どの場合良好に3次元形状を復元できることを見い出した。

    【0114】p=4.0−0.08z …(22) ここで、zは状態の更新回数であり、従ってこの場合には50回目の状態更新時にはp= 0となる。

    【0115】また、αは任意の係数であるので、実際にはα= 1としてよい。 更に、上記(10)式の閾値Ψ及び(11)式の係数A,B,Cについては、A=B=Ψ
    = 1.0,C=3.5 のように定めてよく、また、全てのニューロン素子の初期状態は例えば 0.0で与えてよいことが確認されている。

    【0116】以上のようにして、ニューラルネットを動作させ、拘束条件を満足した時点で1を出力しているニューロン素子の座標値を取り出してみると、それが対象物体の3次元形状の一つの解を与えていることが確認された。

    【0117】次に、上述した動作によってランダムドットステレオグラムから対象物体の3次元形状を復元する場合のシミュレーションを行い、従来のものと比較した結果について説明する。

    【0118】図6、図7は第1の例を示す図であり、図6Aに示す連続した曲面を有する物体に基づいて図6B
    に示すランダムドットステレオグラムを作成し、この二つの視差画像から3次元形状を復元させるシミュレーションを行った。

    【0119】このとき、N= 128,D=25,α= 1,A
    =B=Ψ= 1.0,C=3.5 とした。 ブロックはi方向に沿って並んでいる25個のニューロン素子を一つのブロックとした。 即ち、N k =25である。 従って、B= 1.0であるので各ブロックの最小固有値は−24であり、α= 1
    であるのでqの最小値は12となるが、ここではq=12の一定値とした。 以上のことからブロックの数mはm=12
    8 × 128 である。 また、pは(22)式により変化させた。 また、全てのニューロン素子の初期状態は 0.0とした。

    【0120】なおこの場合、N= 128に対してD=25であるので、ニューロン素子数が25未満のブロックができることになるが、ブロックの最小固有値が25素子のブロックの場合よりも大きくならなければよいことが確認されているので、ブロックの素子数が25未満であってもよいものである。

    【0121】以上の条件により、上述した本発明の動作をシミュレーションした結果、図7Aに示す3次元形状が復元された。

    【0122】これに対して、Marr−Poggioモデルを用いて3次元形状復元のシミュレーションを行うと、図7B
    に示すものが得られた。 なお、このものにおいてもN=
    128とし、全てのニューロン素子の初期状態は 0.0とした。

    【0123】図7Aと図7Bとを比較すると、本発明によれば、連続した曲面を有する物体に関しては、従来より良好に対象物体の3次元形状を復元できることが確認された。

    【0124】図8、図9は第2の例を示す図であり、図8Aに示す平面で構成される物体に基づいて図8Bに示すランダムドットステレオグラムを作成し、この二つの視差画像から3次元形状を復元させるシミュレーションを行った。 このときの条件は図6、図7に示すものと同じとした。

    【0125】上述した本発明の動作をシミュレーションした結果図9Aに示す3次元形状が復元された。

    【0126】これに対して、Marr−Poggioモデルを用いて3次元形状復元のシミュレーションを行うと、図9B
    に示すものが得られた。 なお、このものにおいてもN=
    128とし、全てのニューロン素子の初期状態は 0.0とした。

    【0127】図7Aと図7Bとを比較すると、本発明によれば、平面で構成される物体に関しても、従来より良好に対象物体の3次元形状を復元できることが確認された。

    【0128】

    【発明の効果】以上の説明から明らかなように、本発明によれば、復元しようとする対象物体の表面が平面で構成されていても、あるいは奥行き方向に連続的に変化する曲面を有していても、物体形状によらず視差画像から3次元形状を良好に復元することが可能である。

    【0129】しかも、3次元形状を復元するに際して、
    平滑化処理等の後処理は行う必要がないので、構成が複雑になることはないものである。

    【0130】更に、状態更新はブロック・シーケンシャルに行われるので、処理を高速に、且つ効率よく行うことが可能である。

    【図面の簡単な説明】

    【図1】 本発明に係るニューラルネットワークの一実施例の構成を示す図である。

    【図2】 図1に示すニューロン素子部11の各ブロックの構成例を示す図である。

    【図3】 パラメータp,qを説明するための図である。

    【図4】 本発明におけるニューロン素子の結合関係を示す図である。

    【図5】 パラメータp,qの変化の態様の例を示す図である。

    【図6】 本発明による3次元形状復元と従来の3次元形状復元の比較を示す第1のシミュレーション例を示す図である。

    【図7】 本発明による3次元形状復元と従来の3次元形状復元の比較を示す第1のシミュレーション例を示す図である。

    【図8】 本発明による3次元形状復元と従来の3次元形状復元の比較を示す第2のシミュレーション例を示す図である。

    【図9】 本発明による3次元形状復元と従来の3次元形状復元の比較を示す第2のシミュレーション例を示す図である。

    【図10】 ニューラルネットワークを用いて二つの視差画像から物体の3次元形状を復元するための装置の概略の構成を示す図である。

    【図11】 視差画像のニューラルネットワークへの入力を説明するための図である。

    【図12】 視差画像のニューラルネットワークへの入力を説明するための図である。

    【図13】 3次元形状の復元を説明するための図である。

    【符号の説明】

    1…ニューラルネットワーク、2…画像入力部、3…対象物体、4、6…レンズ、5、7…受光部、11…ニューロン素子部、12…演算評価部、13…パラメータ設定部、21…総入力演算部、22、23…演算部。

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈