首页 / 专利库 / 电脑图像 / 计算机图形学 / 面部动画 / Method for extracting expression from face animation

Method for extracting expression from face animation

阅读:1014发布:2020-08-10

专利汇可以提供Method for extracting expression from face animation专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a method for extracting an expression from a face animation, by which a section where the expression is extracted is extracted.
SOLUTION: A velocity vector is calculated from the inputted face animation, two-dimensional Fourier transform is executed in the respective components of the velocity vector and a feature vector string corresponding to the movement of the expression is extracted in a pre-processing part S10. An expression change detecting part S20 calculates a motion vector by integrating feature vectors by time and collates it with the previously decided respective expression patterns. An extraction recognizing part 30 previously generates HMM(hidden Marcov model) at every expression category of an object to be recognized by learning and calculates the feature vector string and a probability for generation in accordance with a collation result through the use of HMM. Then, the expression category corresponding to HMM by which the calculated probability becomes the max. one is adopted as a recognition result.
COPYRIGHT: (C)1999,JPO,下面是Method for extracting expression from face animation专利的具体信息内容。

【特許請求の範囲】
  • 【請求項1】 顔動画像から個別の表情を抽出する方法であって、 前記顔動画像中の連続する画像から顔要素の各位置の速度ベクトルを算出する第1のステップ、 前記算出された速度ベクトルの各成分にフーリエ変換を施し、そのフーリエ変換係数を特徴ベクトル列として抽出する第2のステップ、 前記抽出された特徴ベクトルを時間積分することによって表情の移動ベクトルを算出する第3のステップ、 前記算出された表情の移動ベクトルと予め定められる各表情パターンとの照合を行なう第4のステップ、 予め各表情ごとに、連続した出力確率を正規分布を用いて近似した複数の隠れマルコフモデルを作成する第5のステップ、 前記第4のステップでの照合結果に基づいて、前記特徴ベクトル列が生成される生成確率を、前記複数の隠れマルコフモデルによってそれぞれ算出する第6のステップ、および前記複数の隠れマルコフモデルのうち最大の生成確率を算出した隠れマルコフモデルに対応する表情を認識結果として判断する第7のステップを備えた、顔動画像からの表情抽出方法。
  • 说明书全文

    【発明の詳細な説明】

    【0001】

    【発明の属する技術分野】この発明は顔動画像からの表情抽出方法に関し、特に、顔動画像中の連続する画像から表情を抽出するような表情抽出方法に関する。

    【0002】

    【従来の技術】人間の表情のうち、6種類の基本表情(怒り,嫌悪,恐れ,悲しみ,幸福,驚き)は人種・文化によらず共通であることが知られている。 基本表情は、それぞれの表情が独立に生成される場合もあるが、
    複数の表情が連続して生成される場合もある。

    【0003】たとえば、ジェット機が上空を通過したときに、まず騒音に驚き、次に騒音の継続に対して嫌悪感と怒りを表わし、最後に騒音が終わって幸福感を示すという表情シーケンスが考えられる。 このような表情シーケンスを正しく認識するには、表情の変化を検出し、どの表情に変化したかを認識する必要がある。

    【0004】そこで、本願発明者らは、特願平9−55
    886において、顔画像からの表情認識方法を提案した。 この方法では、顔動画像から顔要素の速度ベクトルを算出してフーリエ変換し、そのフーリエ変換係数から特徴ベクトルを抽出し、各表情ごとに連続した出確率を正規分布を用いて近似した複数の隠れマルコフモデル(HMM)を作成し、HMMによって特徴ベクトルを生成する確率を算出し、算出したHMMに対応する表情を認識結果とするものである。

    【0005】

    【発明が解決しようとする課題】上述の提案された方法では、HMMの動作は初期状態から始まり、終了状態で終わるため、1つの表情しか認識することができない。
    また、表情筋が静止している状態は出力される特徴量の分布が類似しているため、HMMの誤動作が発生してしまうおそれがあった。

    【0006】それゆえに、この発明の主たる目的は、H
    MMにおける出力確率の値を出力確率が割付けられた状態の生起確率に応じて制御することにより、表情が表出された区間を抽出するような表情抽出方法を提供することである。

    【0007】

    【課題を解決するための手段】請求項1に係る発明は、
    顔動画像から個別の表情を抽出する方法であって、顔動画像中の連続する画像から顔要素の各位置の速度ベクトルを算出し、算出された速度ベクトルの各成分にフーリエ変換を施し、そのフーリエ変換係数を特徴ベクトル列として抽出し、抽出された特徴ベクトルを時間積分することによって表情の移動ベクトルを算出し、算出された表情の移動ベクトルと予め定められる各表情パターンとの照合を行ない、予め各表情ごとに連続した出力確率を正規分布を用いて近似した複数の隠れマルコフモデルを作成し、前述の照合結果に基づいて、特徴ベクトル列が生成される生成確率を複数の隠れマルコフモデルによってそれぞれ算出し、複数の隠れマルコフモデルのうち最大の生成確率を算出した隠れマルコフモデルに対応する表情を認識結果として判断するものである。

    【0008】

    【発明の実施の形態】図1はこの発明の一実施形態における顔動画像からの表情変化を検出して抽出し、認識する過程を説明するためのフローチャートである。 図1において、この発明の一実施形態では、前処理部S10と表情変化検出部S20と抽出・認識部S30とからなっている。 前処理部S10ではS11において入力された顔動画像から速度ベクトルが算出され、S12において算出された速度ベクトルの各成分に2次元フーリエ変換が施され、S13において表情の動きに応じた特徴ベクトル列が抽出される。

    【0009】一方、表情変化検出部S20では、S21
    で特徴ベクトルを時間積分することによって表情の移動ベクトルが算出され、S22で予め定められた各表情パターンとの照合が行なわれる。 また、抽出認識部S30
    では、S31において予め認識対象の表情カテゴリごとにHMMを学習により作成し、S32において前述のS
    22で照合された結果に応じて、特徴ベクトル系列の生成される確率がHMMを用いて算出される。 そして、算出された確率が最大となるHMMに対応する表情カテゴリが認識結果とされる。

    【0010】なお、以下においては、表情カテゴリとして怒り,嫌悪,恐れ,悲しみ,幸福,驚きの合計6種類の基本表情を考え、無表情から各基本表情への時系列画像の処理について説明する。

    【0011】図2は状態がループされたLeft−to
    −Right型HMMの構成を示す図である。 本願発明の一実施形態では、表情ごとに用意したHMMの状態により表情の種類および表情筋の状態(収縮,弛緩など)
    が区別され、画像処理により得られる特徴量に基づいて、推定結果(各状態に割付けられた確率分布)が更新される。

    【0012】各表情の時間変化は図2に示すように、L
    eft−to−Right型のHMMを用いてモデル化される。 各表情は無表情S 1から表情筋の収縮S 2 ,収縮の終了S 3 ,表情筋の弛緩S 4を経て無表情S 5に戻り、このループが繰返される。 各表情は状態S iから単位時間後に状態S jに遷移する確率α ij (遷移確率)
    と、状態S iにいるときにベクトルOを出力する確率b
    i (O)(出力確率密度)より特徴付けられる。 遷移確率と出力確率密度は、各表情を表出する動画像を画像処理して得られる特徴ベクトルの時系列からBaum−W
    elchアルゴリズムを用いて推定される。

    【0013】画像処理は、縦横それぞれ1/8に圧縮した画像を用い、時間軸上で連続する2枚の画像からオプティカルフローが求められる。 オプティカルフローの分布のうち、右眼および口の周期の領域に2次元フーリエ変換が施され、変換係数の低周波成分15個(右眼領域:7個,口領域:8個)が特徴量とされる。

    【0014】表情抽出処理では、次の第(1)式を用いて表情E kにおける状態S iの確率P i (k) (t)を算出し、表情筋の収縮が終了した状態S 3の確率P 3 (k)
    (t)があるしきい値P aを越えたときに表情E kが表出されたものと判定される。

    【0015】

    【数1】

    【0016】ここで、Nは状態数,a ik (k) ,b i (k)
    (O)は表情E kの遷移確率,出力確率密度である。 遷移確率a ik (k)は図2の矢印で結ばれた状態間のみ0でない値を持つ。 ただし、状態S 1 ,S 3 ,S 5は表情筋が静止した状態であるため、出力確率密度b 1 (O),
    3 (O),b 5 (O)は類似した関数となり、表情変化の微小なノイズにより状態S 1からS 3への遷移が発生する。

    【0017】そこで、このような遷移をなくすために、
    状態S 3の確率P 3 (k) (t)を計算する際に、P 2
    (k) (t−1)の値があるしきい値P bより小さい場合にはP 2 (k) (t−1)を0とする。 状態S 5の場合も同様である。 また、状態S 5の確率があるしきい値P c
    を越えたときは、無表情に戻ったものと見なして、状態の確率分布を次の第(2)式のように初期化する。

    【0018】

    【数2】

    【0019】図3は表情シーケンスを示す図であり、図4は図3の表情シーケンスに対する表情E kにおける状態S 3の確率P 3 (k)の変化と抽出された区間(矢印)
    を示す。

    【0020】表情シーケンスとしては、約15秒の間に6種類の基本表情、怒り,嫌悪,恐れ,悲しみ,幸福,
    驚きの順に表出されている。 ここで、異なった表情の間に無表情を経由する。 図3より個別表情を精度よく抽出していることがわかる。 また、確率の変化が急峻であるため、抽出結果のしきい値P aに対する依存性が少ない。

    【0021】上述のごとく、この実施形態では、表情ごとに用意したHMMの状態により表情の種類および表情筋の状態(収縮,弛緩など)を区別し、画像処理により得られる特徴量に基づいて、推定結果(各状態に割付けられた確率分布)を更新することにより、6種類の表情のシーケンスから個別表情を精度よく抽出できる。

    【0022】なお、上述の実施形態では、無表情から始まりある単一の表情が表出されて無表情に戻るというシーケンスしか抽出することができず、ある表情が表出されている状態から無表情を介さずに別の表情に変化するようなシーケンスを抽出することはできない。

    【0023】そこで、次に、表情ごとに独立に構成されたHMMを基に、任意の2つの表情の直接変化に対応する状態およびそれらの状態と元のHMMの表出状態との間の遷移を付加することにより、ある表情の表出過程における別の表情への変化が発生する場合にも表情を正しく抽出できる実施形態について説明する。

    【0024】図5はこの発明の他の実施形態のHMMの構成を示す図である。 図5において、無表情を介さない表情変化を抽出するために、状態数Nが2の場合として、1番目および2番目のカテゴリの表情が単独で表出されるシーケンスを抽出するループHMM 1 ,HMM 2
    と、1(2)番目のカテゴリから2(1)番目のカテゴリに直接変化する際に遷移する状態S 12 (S 21 )およびHMM 1 ,HMM 2の(表情表出)状態S 3へのリンクとから構成されている。

    【0025】HMMのパラメータとしては、ループHM
    iに関するものは単一の表情シーケンスから学習されたパラメータが用いられる。 ただし、状態S 3からは状態S ijへのリンクが追加されているので、元の遷移確率a 34を2つの状態への遷移確率a 34とa 3,i,jに2等分される。 状態S ijに関するパラメータは、単一の表情シーケンスから学習されたパラメータから算出される。 これにより、すべての組合せの表情変化のシーケンスを用いてパラメータを学習する必要がなくなる。

    【0026】出力確率分布はカテゴリiの筋肉伸長とカテゴリjの筋肉収縮とが同時に起こるものと仮定して次の第(3)式より求められる。

    【0027】

    【数3】

    【0028】ここで、μ j (i) ,σ j (i)はカテゴリj
    の状態S jの出力分布密度の平均,標準偏差である。 一方、生起確率は第(4),第(5)式に示すように、筋肉伸長と筋肉収縮状態のうち継続時間が長い方の生起確率が選択される。

    【0029】

    【数4】

    【0030】図6および図7はこの発明の他の実施形態において、“幸福”から“驚き”に変化するシーケンスの抽出結果例を示す図である。 図7は表情変化が遅い場合であって、ループに沿って状態遷移しているのに対して、図6は表情変化が速い場合であって、筋肉の収縮と伸長が同時に起こる状態を示している。

    【0031】

    【発明の効果】以上のように、この発明によれば、HM
    Mにおける出力確率の値を出力確率が割付けられた状態の生起確率に応じて制御することにより、表情が表出された区間を抽出することができる。

    【図面の簡単な説明】

    【図1】この発明の一実施形態における顔動画像から表情変化を検出して抽出し、認識する過程を説明するためのフローチャートである。

    【図2】状態がループにされたLeft−to−Rig
    ht型HMMの構成を示す図である。

    【図3】表情シーケンスを示す図である。

    【図4】表情シーケンスに対する表情の認識結果と抽出された区間を示す図である。

    【図5】この発明の他の実施形態のHMMの構成を示す図である。

    【図6】この発明の他の実施形態における表情変化が速い場合の抽出結果例を示す図である。

    【図7】この発明の他の実施形態における表情変化が遅い場合の抽出結果例を示す図である。

    【符号の説明】

    S10 前処理部 S20 表情変化検出部 S30 抽出・認識部

    ─────────────────────────────────────────────────────

    【手続補正書】

    【提出日】平成11年3月11日

    【手続補正1】

    【補正対象書類名】明細書

    【補正対象項目名】特許請求の範囲

    【補正方法】変更

    【補正内容】

    【特許請求の範囲】

    【手続補正2】

    【補正対象書類名】明細書

    【補正対象項目名】0007

    【補正方法】変更

    【補正内容】

    【0007】

    【課題を解決するための手段】請求項1に係る発明は、
    顔動画像から個別の表情を抽出する方法であって、顔動画像中の連続する画像から顔要素の各位置の速度ベクトルを算出し、算出された速度ベクトルの各成分にフーリエ変換を施し、そのフーリエ変換係数を表情の動きに応
    じた特徴ベクトル列として抽出し、抽出された特徴ベクトルを時間積分することによって表情の移動ベクトルを算出し、算出された表情の移動ベクトルと予め定められる各表情パターンとの照合を行ない、 第3のステップと
    並行して処理され、予め各表情ごとに連続した出力確率を正規分布を用いて近似した複数の隠れマルコフモデルを作成し、前述の照合結果に基づいて、特徴ベクトル列が生成される生成確率を複数の隠れマルコフモデルによってそれぞれ算出し、複数の隠れマルコフモデルのうち最大の生成確率を算出した隠れマルコフモデルに対応する表情を認識結果として判断するものである。

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈