System and method for improving accuracy in estimation of localization

申请号 JP2005056137 申请日 2005-03-01 公开(公告)号 JP2005249789A 公开(公告)日 2005-09-15
申请人 Microsoft Corp; マイクロソフト コーポレーション; 发明人 TASHEV IVAN J;
摘要 PROBLEM TO BE SOLVED: To provide a system and a method for performing post processing of initial localization data used to improve accuracy and reliability in estimation of localization derived from conventional localization system even in an environment which may contain noise, reflection or other interferences. SOLUTION: Such a localization estimation system includes a conventional Sound Source Localization (SSL) system based on microphone array input, a radio source localization system based on directive antenna array input, etc. Generally, these post processing system and method apply statistical real-time clustering to initial localization estimation, and then use this real-time clustering in multistage processes to develop new localization estimation of more improved accuracy and reliability compared with initial localization estimation. COPYRIGHT: (C)2005,JPO&NCIPI
权利要求
  • 初期定位推定の精度を自動的に改善するためのシステムであって、
    複数の定位推定を備えた初期の1組の定位データを生成することと、
    仕事量を所定の数の重なり合う領域に分割することと、
    各定位推定を任意の対応する重なり合う領域の1つまたは複数に割り当てて、前記重なり合う領域の1つまたは複数での定位推定の1つまたは複数のクラスタを形成することと、
    定位推定の各クラスタによって表されるオブジェクトの位置を推定することと、
    重なり合う領域におけるクラスタでの前記推定されたオブジェクトの位置を比較することによって前記オブジェクトのいずれかが重複オブジェクトであるかどうかを判定することと、
    各重複オブジェクトを削除することと、
    残りの推定された各オブジェクトの位置を提供して、1組の位置推定を作成することであって、前記1組の位置推定は、前記初期の1組の定位推定に比べて改善された1組の定位推定を表すことと を備えたことを特徴とするシステム。
  • 前記1組の位置推定での各位置推定の信頼度を算出することをさらに備えたことを特徴とする請求項1に記載のシステム。
  • 寿命が各定位推定に関連付けられ、期限切れの寿命を有する任意の定位推定が前記初期の1組の定位データから除外されることを特徴とする請求項1に記載のシステム。
  • 前記寿命は、推定されたオブジェクトの動きに応じて算出されることを特徴とする請求項3に記載のシステム。
  • 定位推定の各クラスタは、個別の寿命を有し、各クラスタの前記寿命は、推定されたオブジェクトの動きに応じて算出されることを特徴とする請求項3に記載のシステム。
  • 前記1組の位置推定を使用して、定位推定の各クラスタによって表されるオブジェクトの位置の任意の後続の推定を初期化することを特徴とする請求項1に記載のシステム。
  • 重なり合う領域の数は、ユーザ定義可能であることを特徴とする請求項1に記載のシステム。
  • 重なり合いの量は、ユーザ定義可能であることを特徴とする請求項1に記載のシステム。
  • 定位推定の各クラスタによって表されるオブジェクトの位置を推定するのに先立って、重みベースの閾値を使用して、特定のクラスタが実際にオブジェクトを表すかどうかを判定することをさらに備えたことを特徴とする請求項1に記載のシステム。
  • 前記オブジェクトのいずれかが重複オブジェクトであるかどうかを判定する基準は、任意の2つ以上の潜在的オブジェクトの間の算出された距離によって決まることを特徴とする請求項1に記載のシステム。
  • 1組の新しい位置推定を1組の初期位置推定から自動的に生成するための方法であって、コンピューティングデバイスを使用して、
    前記1組の初期位置推定内の各初期位置推定を、受信アレイによってモニタされている仕事量をカバーする1つまたは複数の対応する重なり合う領域に割り当てることによって初期位置推定の1つまたは複数のクラスタを形成し、
    初期位置推定の各クラスタから新しい位置推定を算出し、
    各クラスタからの前記新しい位置推定を比較して、前記位置推定のいずれかが重複オブジェクトの位置を表すかどうかを判定し、
    対応する重複位置推定より算出された重みが小さい各新しい位置推定を破棄することによって、重複オブジェクトを表す新しい位置推定を削除し、
    残りの各新しい位置推定を提供して、1組の新しい位置推定を作成する ことを備えることを特徴とする方法。
  • 初期位置推定のクラスタを形成するのに先立って、所定の時間の量より古い推定を前記1組の初期位置推定から自動的に削除することを特徴とする請求項11に記載の方法。
  • 前記所定の時間の量は、時間にわたっての位置推定から生成された推定オブジェクトの動きの関数を推定することによって算出されることを特徴とする請求項12に記載の方法。
  • 前記1組の新しい位置推定を作成するのに使用される各新しい位置推定の信頼度を算出することをさらに備えることを特徴とする請求項11に記載の方法。
  • 重なり合う領域の数および重なり合いの量は、ユーザ定義可能であることを特徴とする請求項11に記載の方法。
  • 初期位置推定の各クラスタから新しい位置推定を算出することは、所定の閾値を超える算出された重みを有するクラスタについてのみ実行されることを特徴とする請求項11に記載の方法。
  • 受信アレイから導出された初期定位推定の信頼性および精度を自動的に改善するためのコンピュータ実行可能命令を有するコンピュータ可読媒体であって、前記コンピュータ実行可能命令は、
    受信アレイから受信された入力から1組の初期定位推定を生成することと、
    前記受信アレイによってカバーされる仕事量を1組の少なくとも部分的に重なり合うセクションに分割することと、
    各初期推定を前記重なり合うセクションの1つまたは複数に割り当てて、前記重なり合うセクションの1つまたは複数内の初期定位推定の1つまたは複数のクラスタを作成することと、
    前記初期定位推定のクラスタが潜在的オブジェクトを表す前記重なり合う領域のいずれかを特定することと、
    潜在的オブジェクトを表すクラスタを含む重なり合う各領域内の前記潜在的オブジェクトの位置を推定することと、
    推定された各位置を比較して、前記推定された位置のいずれかが重複する潜在的オブジェクトの位置を表すかどうかを判定することと、
    重複する潜在的オブジェクトを表す推定位置を削除することと、
    残りの各推定位置を、前記初期定位推定と比べて信頼性および精度が改善された新しい定位推定を表す1組の推定位置に提供することと を備えたことを特徴とするコンピュータ可読媒体。
  • 前記1組の推定位置に提供された各推定位置についての信頼度を算出することをさらに備えたことを特徴とする請求項17に記載のコンピュータ可読媒体。
  • 寿命は、各定位推定に関連付けられ、前記1組の初期定位推定を生成することは、現在の経過時間が前記関連付けられた寿命を超えるどの定位推定も除外することをさらに備えたことを特徴とする請求項17に記載のコンピュータ可読媒体。
  • 重なり合う領域の数および重なり合いの量は、ユーザ定義可能であることを特徴とする請求項17に記載のコンピュータ可読媒体。
  • 前記初期定位推定のクラスタが潜在的オブジェクトを表す前記重なり合う領域のいずれかを特定することは、
    各クラスタの重みを算出することと、
    前記重みを所定の重み閾値と比較することと、
    その重みが前記所定の重み閾値未満の任意のクラスタを除外することと をさらに備えたことを特徴とする請求項17に記載のコンピュータ可読媒体。
  • 说明书全文

    本発明は、規定の探索エリア内でのオブジェクトの定位(localization)および追跡に関し、特に、初期定位測定または推定のクラスタベースの統計的後処理(cluster−based statistical post−processing)を提供することによって、マイクロフォンアレイ、指向性アンテナアレイ、レーダ受信機アレイなどの受信アレイの使用により生成された定位推定の精度を改善するためのシステムおよびプロセスに関する。

    規定の領域内でのオブジェクトの定位および追跡は、多くのシステムの重要な要素である。 例えば、従来のオーディオ会議用途のいくつかは、マイクロフォンアレイを従来の音源定位(SSL:sound source localization)処理(すなわち時間遅延推定、ビームステアリングなど)とともに使用して、特定の個人の発話音声または音を有効に分離し、望み通りに処理できるようにする。 同様の技術では、例えばワイヤレスコンピュータネットワーク内の特定のサブスクライバによってどのノードが使用されるべきかを判定するなどの、いくつかの用途での電波源の位置を特定するための指向性アンテナのアレイを使用している。 さらに別の同様の技術が、レーダまたはレーザ受信機アレイを用いてオブジェクトを追跡するのに使用されている。 一般に、このような技術は、当業者によく知られている。

    例えば、従来のマイクロフォンアレイは、通常、何らかのあらかじめ決められたレイアウトでのマイクロフォンの配置構成を含む。 一般にこれらのマイクロフォンを使用して、様々な方向からの、空間内の様々な点から発信される音波を捕捉する。 次いでいくつかの従来の技術の1つを使用してSSLを実行する。 一般に、こうしたSSL技術は、時間遅延推定(TDE:time delay estimates)に基づくもの、およびビームステアリングに基づくものを含む2つのカテゴリに分類される。 音源への方向を見つけることは、空間フィルタリング、すなわちビームを音源に向け、他の方向から来る任意のノイズを抑圧することにおいて重要な役割を果たす。 いくつかのケースでは、音源への方向が、話者の追跡、および記録された音声信号の後処理のために使用される。 ビデオ会議システムの状況では、話者の追跡は、ビデオカメラを話をしている人物に動的に向けるのに使用されることが多い。

    一般に、ほとんどの音源定位システムは、まずアレイの各マイクロフォンからの各信号を前処理することによってマイクロフォンアレイからの信号を処理する。 この前処理は通常、信号をフレームにパッケージし、ノイズ抑圧を行い、音源の位置を判定する目的で特定のフレームを処理するか、破棄するかを判定するために個々のフレームを分類する。

    前処理が完了すると、実際の音源定位は通常、例えばTDEやビームステアリング技術を含む従来のSSL技術の使用を伴って、初期の方向推定または音源がどこで特定されるかを示す確率分布関数(PDF)を提供する。 この位置特定は、1次元定位(すなわち音源が平面で特定される度)、2次元定位(すなわち3次元空間における音源の方向を表すベクトルを定義するための方向および高さの2つの角度)、および完全3次元定位(すなわち音源が特定される3次元空間の点の位置を特定する方向、高さおよび距離)の観点から定義することができる。 一般に、どのSSL技術を使用しても、目的は一般に、反響に対するロバスト性、複数の音源を区別する能、および潜在的に雑音のある環境での高い位置特定精度を提供することである。

    音源の場所のインジケータが算出されると、多くの場合、後処理段階が実施される。 一般に、この後処理は、いくつかの定位測定の結果を組み合わせて、精度を向上させたり、音源の動きを追ったり、または複数の音源を追跡したりする。 SSL後処理に使用される様々な従来の技術は、単純な平均化、統計的処理、カルマンフィルタリング、パーティクルフィルタリング(particle filtering)などを含む。 こうした技術は、通常用途に依存するが、一般に反響波および強い反射からの定位を取り除き、音源定位精度を改善することに向けられる。 一般に、定位推定または測定の精度が向上するにつれて、オーディオ信号の任意のさらなる処理(例えば、正確な音源追跡など)が強化される。

    無線信号、レーダ波などを含む他の信号タイプに対する信号源またはオブジェクトの定位は、マイクロフォンアレイを介して捕捉された音波の場合について上述したものと同様の前処理および後処理技術を用いて達成されることが多い。 一般に、このような定位技術は、異なる信号および受信機アレイタイプ(指向性アンテナアレイ、レーダまたはレーザ受信機アレイなど)に適応されたビームステアリング技術を含むことが多い。 オーディオ信号と同様に、他の信号タイプの定位は、通常(音波、電波、レーダ波の反射などの)信号の伝播の分析に基づく。

    このようなすべての定位システムでは、信号またはアレイのタイプに関係なく、1つの主な目的は、たとえノイズおよび他の影響、例えば定位の精度および信頼性を低減する傾向にある回折、干渉、反射などがある場合でも、迅速に正確な定位推定または測定を提供することである。

    上述したように、一般に定位推定の後処理は、定位推定の精度を向上させるように設計される。

    それゆえ、定位推定の精度を改善するための定位データの迅速かつ信頼できる後処理を提供するシステムおよびプロセスが必要とされている。 さらに、このようなシステムおよび方法は、既存の定位技術とともに動作可能であり、それに適応できるものとすべきである。

    本明細書に記載したシステムおよび方法は、従来の定位技術から導出された初期の定位推定の信頼性および精度を改善することによって1つまたは複数のオブジェクトまたは信号源を追跡し、またはその位置を特定するための既存の信号定位技術を強化するように動作する。 以下の説明を通じて、「オブジェクト」という用語は、定位方法を介して追跡される、または位置が特定される実際のオブジェクト、または信号源(喋っている人物からの音など)のいずれかを参照するのに使用されることに留意されたい。 後処理技術の使用を介して改善される従来の定位技術は、例えば、マイクロフォンアレイ入力に基づく従来の音源定位(SSL)システム、指向性アンテナアレイ入力に基づく従来の電波源定位システム、レーダまたはレーザ受信機アレイに基づく従来のターゲット定位および追跡システムなどを含む。 このような定位技術は、当業者にはよく知られており、本明細書では詳しく説明しないことに留意されたい。

    一般に、ここに記載した後処理システムおよび方法は、統計的リアルタイムクラスタ化プロセスを初期の定位推定に適用し、次いでこのリアルタイムクラスタ化を使用して、初期の定位推定に比べて精度および信頼性が改善された新しい定位推定を生成する。 上述したように、本明細書に記載した後処理技術は、信号源定位推定を提供する従来のシステムとの使用に適応できる。 さらに、ここに記載したシステムおよび方法は、ノイズ、反射、反響、または他の干渉を含むことがある環境において初期のオブジェクト定位推定が集められた場合、改善された精度および信頼性を提供することも観測されている。

    特に、ここに記載したプロセスは、従来のいくつかの定位技術のいずれかを使用して初期オブジェクト定位推定または測定を集め、生成し、そうでなければ取得することによって開始する。 一般に、従来の定位データは通常、時間の関数として1次元、2次元、または3次元(例えば方向、方向および角度、または方向、角度および距離)で提供される。 本明細書に記載した後処理技術は、任意の次元数の定位データに一般化することができるが、説明上、次の説明では、定位データは3次元、すなわち規定の領域内の方向、高さおよび距離に加えて、方向、高さおよび距離の既知のまたは算出された標準偏差σ φ 、σ θ 、σ ρであると想定することにする。

    位置推定を単に提供することに加えて、従来の定位技術は、定位推定ごとに算出または推定された信頼性を説明するための重みまたは確からしさの尺度または推定を提供することが多い。 さらに、通常、各定位推定の時刻も提供される。 この時刻を、以下各定位推定の「タイムスタンプ」と呼ぶ。 このすべての情報は、初期の定位推定の精度および信頼性を向上させるためのここに記載した後処理システムおよび方法に使用される。

    言い換えれば、本明細書に記載した後処理システムは、従来の定位推定の入力を取り、各定位推定は、1)位置データ、2)推定された位置の信頼性、および3)データタイムスタンプを備える。 次いでこのデータを使用して、入力定位推定に比べて信頼性が改善された新しい定位推定が導出される。 各初期定位推定のこの組の情報(すなわち位置、信頼性および時刻)を、この説明を通じて「初期定位推定」または単に「初期推定」と呼ぶことにする。

    位置または定位推定の信頼性は、特にオブジェクトの動きまたは受信アレイの動きが可能な場合、時間が経過するにつれて低減すると想定する。 それゆえ、一実施形態では、初期定位推定が与えられると、ここに記載した後処理システムおよび方法は、まず、所定の時間より古いすべての定位測定を破棄することによって開始する。 この所定の時間、または測定の「寿命」は、任意の特定の定位推定が有効であるとみなされることになる間の時間、それゆえ定位推定が後処理の演算に使用されることになる間の時間である。 この「寿命」とは、単に、特定の定位推定が生成されてからの時間(すなわち特定の定位推定のタイムスタンプと現在の時刻との間の時間)の尺度である。

    一般に、寿命が長くなるにつれて、より多くの定位推定が後処理のために利用可能となる。 通常、より長い寿命が与えられると、より多くの定位推定が利用可能になり、実際のオブジェクトと起こりうる反射との間の区別がより高い信頼性でできるようになり、それによってより高い定位推定精度を提供する。 しかし、より長い初期定位推定寿命を使用することによって、オブジェクトが動き、そうでなければ受信アレイに対して位置が変わると、定位応答時間も長くなる。 それゆえ定位推定寿命の最適な選択は、予想されるオブジェクトの動きに応じてなされる。 例えば、静止した、またはゆっくり動きするオブジェクトを仮定すると、通常より長い寿命が適している。 逆に、より短い寿命は、通常より速いオブジェクトの動きに適している。 その結果、一実施形形態では、適応的な寿命が、算出されたオブジェクトの動きに基づいて算出され、寿命は、応答時間と時間の関数としての位置の有効性との間のトレードオフとして選ばれる。 算出された動きは、時間の関数として位置推定を用いて単に算出される。

    本明細書でさらに詳しく説明するように、後処置は次に、1)空間的に広がった重なり合うセクションにおいて(所定の寿命内の)初期定位推定を「クラスタ化する」ことと、2)クラスタ内の「潜在的オブジェクト」を特定することと、3)クラスタ化に基づいて潜在的オブジェクトの位置および標準偏差を推定することと、4)重複している可能性の高いオブジェクトを削除することとを含む、多段階のプロセスを継続する。 一実施形態では、後処理は、さらに(重複するオブジェクトを削除した後)オブジェクトごとの定位推定の信頼度を算出することによって継続する。 その結果、本明細書に記載した後処理システムおよび方法の最終結果は、それぞれが位置、標準偏差、そして一実施形態ではオブジェクトの場所の信頼度が提示されたオブジェクトのリストとなる。

    上記の概要に照らして、ここに記載した後処理技術が従来の定位技術から導出された定位推定の精度を改善するための改善されたシステムおよびプロセスを提供することは明らかである。 今述べた利点に加えて、このシステムおよび方法の他の利点は、以下の詳細な説明を添付の図面と併せ読むことによって明らかとなるであろう。

    本発明の特定の特徴、態様および利点は、以下の説明、添付の特許請求の範囲および添付の図面との関連でよりよく理解できるようになるであろう。

    本発明の好ましい実施形態の以下の説明では、本明細書の一部を成し、本発明を実施することができる特定の実施形態を例として示す添付図面を参照している。 本発明の範囲を逸脱することなく、他の実施形態を使用、または構造的な変更を加えることができることを理解されたい。

    (1.0 例示的な動作環境
    図1は、本発明を実施することができる適切なコンピューティングシステム環境100の例を示している。 コンピューティングシステム環境100は、適したコンピューティング環境の一例にすぎず、本発明の使用または機能の範囲に関していかなる限定を示唆するものではない。 また、コンピューティング環境100を、例示的な動作環境100に示した構成要素のいずれか1つまたはその組合せに関するいかなる依存性または要件を有しているものとも解釈すべきではない。

    本発明は、他の多くの汎用または専用のコンピューティングシステム環境または構成で動作可能である。 本発明との使用に適する可能性のある周知のコンピューティングシステム、環境および/または構成の例には、それだけには限定されないが、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルド、ラップトップもしくはモバイルコンピュータまたはセルラー式電話およびPDAなどの通信デバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能な民生用電子機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記の任意のシステムまたはデバイスを含む分散コンピューティング環境などがある。

    本発明は、マイクロフォンアレイ198、または指向性無線アンテナアレイ、レーダ受信機などのその他の受信アレイ(図示せず)の構成要素を含む、ハードウェアモジュールとの組合せでコンピュータによって実行されるプログラムモジュールなどのコンピュータ実行可能命令の一般的な文脈で説明することができる。 一般に、プログラムモジュールは、特定のタスクを実行するか、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。 また、本発明は、通信ネットワークを通してリンクされるリモート処理デバイスによってタスクが実行される分散コンピューティング環境で実施することもできる。 分散コンピューティング環境では、プログラムモジュールを、メモリ記憶デバイスを含むローカルおよびリモートのコンピュータ記憶媒体に置くことができる。 図1を参照すると、本発明を実施するための例示的なシステムは、コンピュータ110の形態の汎用コンピューティングデバイスを含んでいる。

    コンピュータ110の構成要素は、それだけには限定されないが、処理ユニット120、システムメモリ130、およびシステムメモリを含む様々なシステム構成要素を処理ユニット120に結合するシステムバス121を含むことができる。 システムバス121は、メモリバスまたはメモリコントローラ、周辺バス、および様々なバスアーキテクチャのいずれかを使用するローカルバスを含むいくつかのタイプのバス構造のいずれかとすることができる。 例として、限定ではなく、このようなアーキテクチャには、ISA(Industry Standard Architecture)バス、MCA(Micro Channel Architecture)バス、EISA(Enhanced ISA)バス、VESA(Video Electronics Standards Association)ローカルバス、およびメザニンバスとしても知られているPCI(Peripheral Component Interconnect)バスなどがある。

    コンピュータ110は、一般に様々なコンピュータ可読媒体を含む。 コンピュータ可読媒体は、コンピュータ110によってアクセスすることができる任意の利用可能な媒体とすることができ、揮発性および不揮発性媒体、リムーバブルおよび非リムーバブル媒体を含む。 コンピュータ可読媒体には、例として、限定ではなく、コンピュータ記憶媒体および通信媒体を含むことができる。 コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータなど、情報の格納のための任意の方法または技術で実施された揮発性および不揮発性のリムーバブルおよび非リムーバブルの媒体を含む。

    コンピュータ記憶媒体には、それだけには限定されないが、RAM、ROM、PROM、EPROM、EEPROM、フラッシュメモリもしくは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)もしくは他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、または所望の情報の格納に使用することができ、コンピュータ110によってアクセスすることができる他の任意の媒体などが含まれる。 通信媒体は通常、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータを搬送波や他のトランスポート機構などの変調されたデータ信号に具体化し、任意の情報配送媒体を含む。 「変調されたデータ信号」という用語は、信号に情報を符号化するように1つまたは複数のその特性が設定または変更された信号を意味する。 例として、限定ではなく、通信媒体には、有線ネットワーク、直接配線された接続などの有線媒体、および音響、RF、赤外線、その他の無線媒体などの無線媒体が含まれる。 また、上記のいかなる組合せもコンピュータ可読媒体の範囲内に含まれるものとする。

    システムメモリ130は、読取り専用メモリ(ROM)131やランダムアクセスメモリ(RAM)132など、揮発性および/または不揮発性メモリの形態のコンピュータ記憶媒体を含む。 例えば起動中など、コンピュータ110内の要素間で情報の転送を助ける基本ルーチンが入っている基本入出力システム(BIOS)133は、通常ROM131に格納されている。 RAM132は通常、処理ユニット120によって直ぐにアクセス可能で、そして/または現在処理されているデータおよび/またはプログラムモジュールを収容する。 図1は、オペレーティングシステム134、アプリケーションプログラム135、その他のプログラムモジュール136、およびプログラムデータ137を示している。

    コンピュータ110は、他のリムーバブル/非リムーバブル、揮発性/不揮発性コンピュータ記憶媒体を含むこともできる。 一例にすぎないが、図1は、非リムーバブル不揮発性磁気媒体との間で読み取りまたは書き込みを行うハードディスクドライブ141、リムーバブル不揮発性磁気ディスク152との間で読み取りまたは書き込みを行う磁気ディスクドライブ151、およびCD−ROMや他の光媒体など、リムーバブル不揮発性光ディスク156との間で読み取りまたは書き込みを行う光ディスクドライブ155を示している。 例示的な動作環境で使用することができる他のリムーバブル/非リムーバブル、揮発性/不揮発性コンピュータ記憶媒体には、それだけには限定されないが、磁気テープカセット、フラッシュメモリカード、デジタル多用途ディスク、デジタルビデオテープ、半導体RAM、半導体ROMなどが含まれる。 ハードディスクドライブ141は通常、インターフェース140などの非リムーバブルメモリインターフェースを介してシステムバス121に接続され、磁気ディスクドライブ151および光ディスクドライブ155は通常、インターフェース150などのリムーバブルメモリインターフェースによってシステムバス121に接続される。

    上述し、図1に示したドライブおよび関連のコンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、およびコンピュータ110の他のデータのストレージを提供する。 図1では、例えば、ハードディスクドライブ141がオペレーティングシステム144、アプリケーションプログラム145、その他のプログラムモジュール146、およびプログラムデータ147を格納するものとして示されている。 これらのコンポーネントは、オペレーティングシステム134、アプリケーションプログラム135、その他のプログラムモジュール136、およびプログラムデータ137と同じものまたは異なるものとすることができることに留意されたい。 オペレーティングシステム144、アプリケーションプログラム145、その他のプログラムモジュール146、およびプログラムデータ147は少なくともそれらが異なるコピーであることを示すために、ここでは異なる番号を付している。 ユーザは、キーボード162、および一般にマウス、トラックボールまたはタッチパッドと呼ばれるポインティングデバイス161などの入力デバイスを介してコマンドおよび情報をコンピュータ110に入力することができる。

    他の入力デバイス(図示せず)は、ジョイスティック、ゲームパッド、衛星アンテナ、スキャナ、無線受信機、およびテレビまたはブロードキャストビデオ受信機などを含むことができる。 さらに、入力デバイス(図示せず)は、指向性無線アンテナアレイ、レーダ受信機アレイなどの受信アレイまたは信号入力デバイスを含むことができる。 これらおよびその他の入力デバイスは、多くの場合システムバス121に結合されている有線または無線のユーザ入力インターフェース160を介して処理ユニット120に接続されるが、例えばパラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)、IEEE1394インターフェース、Bluethooth(商標)ワイヤレスインターフェース、IEEE802.11ワイヤレスインターフェースなど他の従来のインターフェースおよびバス構造によって接続することもできる。 さらに、コンピュータ110は、マイクロフォンまたはマイクロフォンアレイ198、ならびにラウドスピーカ197またはこの場合もパラレル、シリアル、USB、IEEE1394、Bluetooth(商標)など従来の有線または無線インターフェースを含むオーディオインターフェース199を介して接続される他の音出力デバイスなど、音声またはオーディオ入力デバイスを含むこともできる。

    モニタ191または他のタイプの表示デバイスもビデオインターフェース190などのインターフェースを介してシステムバス121に接続される。 モニタに加えて、コンピュータは、出力周辺インターフェース195を介して接続することができるプリンタ196などの他の周辺出力デバイスを含むこともできる。

    コンピュータ110は、リモートコンピュータ180など1つまたは複数のリモートコンピュータへの論理接続を用いてネットワーク化された環境で動作することができる。 リモートコンピュータ180は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、または他の共通のネットワークノードとすることができ、通常、コンピュータ110に関連して上述した多くまたはすべての要素を含むが、図1にはメモリ記憶デバイス181のみを示している。 図1に示した論理接続は、ローカルエリアネットワーク(LAN)171およびワイドエリアネットワーク(WAN)173を含むが、他のネットワークを含むこともできる。 このようなネットワーキング環境は、オフィス、企業規模のコンピュータネットワーク、イントラネット、およびインターネットで一般的である。

    LANネットワーキング環境で使用する場合、コンピュータ110は、ネットワークインターフェースまたはアダプタ170を介してLAN171に接続される。 WANネットワーキング環境で使用する場合、コンピュータ110は通常、モデム172、またはインターネットなどWAN173を介して通信を確立するためのその他の手段を含む。 モデム172は、内蔵でも外付でもよく、ユーザ入力インターフェース160またはその他の適切なメカニズムを介してシステムバス121に接続することができる。 ネットワーク化された環境では、コンピュータ110に関連して示したプログラムモジュール、またはその一部をリモートメモリ記憶デバイスに格納することができる。 例として、限定ではなく、図1は、リモートアプリケーションプログラム185をメモリデバイス181上に存在するものとして示している。 図示したネットワーク接続は例示的であり、コンピュータ間の通信リンクを確立するためのその他の手段を使用することができることが理解されよう。

    例示的な動作環境について説明してきたが、この説明の残りの部分は、1つまたは複数の受信アレイから導出されるオブジェクト定位推定の信頼性および精度を自動的に改善するためのシステムおよび方法の説明に充てることになる。

    (2.0 イントロダクション
    ここに記載したシステムおよび方法は、従来の定位技術から導出された初期の定位推定の信頼性および精度を改善することによって1つまたは複数のオブジェクトまたは信号源を追跡したり、またはその位置を特定したりするための既存の信号定位技術を強化するように動作する。 以下の説明を通じて、「オブジェクト」という用語は、定位方法を介して追跡されるか、または位置が特定される実際のオブジェクト、または信号源(喋っている人物からの音、電波源、レーダ反射など)のいずれかを参照するのに使用することに留意されたい。 後処理技術の使用を通して改善される定位技術は、例えば、マイクロフォンアレイ入力に基づく従来の音源定位(SSL)システム、指向性アンテナアレイ入力に基づく従来の電波源定位システム、レーダまたはレーザ受信機アレイに基づく従来の目標物定位および追跡システムなどを含む。 このような定位技術は、当業者にはよく知られており、ここでは詳しく説明しないことに留意されたい。

    一般に、ここに記載した後処理システムおよび方法は、統計的リアルタイムクラスタ化プロセスを初期の定位推定に適用し、次いでこのリアルタイムクラスタ化を使用して、初期定位推定に比べて精度および信頼性が改善された新しい定位推定を生成する。 上述したように、ここに記載した後処理技術は、信号源定位推定を提供する従来のシステムとの使用に適応できる。 さらに、ここに記載したシステムおよび方法は、ノイズ、反射、反響、またはその他の干渉を含むことがある環境において初期のオブジェクト定位推定が集められた場合、改善した精度および信頼性を提供することも観測されている。

    (2.1 システムの概要
    ここに記載した定位推定の後処理のためのシステムおよび方法は、従来のいくつかの定位技術のいずれかを使用して初期のオブジェクト定位推定または測定を集め、生成し、そうでなければ取得することによって開始する。 一般に、従来の定位データは通常、時間の関数として1次元、2次元、または3次元(例えば方向、方向および角度、または方向、角度および距離)で提供される。 ここに記載した後処理技術は、任意の次元数の定位データに一般化することはできるが、説明上、次の説明では、定位データは3次元、すなわち規定の領域内の方向、高さおよび距離に加えて、方向、高さおよび距離の既知のまたは算出されたそれぞれの標準偏差σ φ 、σ θ 、σ ρであると想定する。

    位置推定を単に提供することに加えて、従来の定位技術は、定位推定ごとに算出または推定された信頼性を記述するための重みまたは信頼性の尺度または推定を提供することが多い。 さらに、通常、各定位推定の時刻も提供される。 この時刻を、以下、各定位推定の「タイムスタンプ」と呼ぶことにする。 このすべての情報は、初期定位推定の精度および信頼性を向上させるためにここに記載した後処理システムおよび方法において使用される。

    言い換えれば、ここに記載した後処理システムは、従来の定位推定の入力を取得し、各定位推定は、1)位置データ、2)推定された位置の信頼性、および3)データタイムスタンプを備える。 次いでこのデータを使用して、入力定位推定に比べて信頼性が改善された新しい定位推定が導出される。 各初期定位推定のこの組の情報(すなわち位置、信頼性および時刻)を、この説明を通じて「初期定位推定」または単に「初期推定」と呼ぶ。

    位置または定位推定の信頼性は、特にオブジェクトの動きまたは受信アレイの動きが可能な場合、時間の経過につれて減少すると想定する。 それゆえ、一実施形態では、初期定位推定が与えられると、ここに記載した後処理システムおよび方法は、まず所定の時間より古いすべての定位測定を破棄することによって開始する。 この所定の時間または測定の「寿命」は、任意の特定の定位推定が有効であるとみなされることになる間の時間、それゆえ定位推定が後処理の演算に使用されることになる間の時間である。 この「寿命」とは、単に、特定の定位推定が生成されてからの時間(すなわち特定の定位推定のタイムスタンプと現在の時刻との間の時間)の尺度である。

    一般に、寿命が長くなるにつれて、より多くの定位推定が後処理のために利用可能となる。 通常、より長い寿命が与えられると、より多くの定位推定が利用可能となることにより、実際のオブジェクトと起こりうる反射との間の区別がより高い信頼性でできるようになり、それによってより高い精度の定位推定が提供される。 しかし、より長い初期定位推定の寿命を使用することによって、オブジェクトが動き、そうでなければ受信アレイに対して位置が変わると、定位応答時間もより長くなる。 それゆえ定位推定寿命の最適な選択は、予想されるオブジェクトの動きに応じてなされる。 例えば、静止した、またはゆっくり動くオブジェクトを仮定すると、通常より長い寿命が適している。 逆に、より短い寿命は、通常より速いオブジェクトの動きに適している。 その結果、一実施形形態では、適応型の寿命は、算出されたオブジェクトの動きに基づいて算出され、寿命は、応答時間と時間の関数として位置の有効性との間のトレードオフとして選ばれる。 算出された動きは、時間の関数として位置推定を使用して簡単に算出される。

    ここでさらに詳しく説明するように、後処置は次いで、1)空間的に広がった重なり合うセクションに(所定の寿命内の)初期定位推定を「クラスタ化する」ことと、2)クラスタ内の「潜在的なオブジェクト」を特定することと、3)クラスタ化に基づいて潜在的なオブジェクトの位置および標準偏差を推定することと、4)重複している可能性の高いオブジェクトを削除することとを含む、多段階のプロセスを継続する。 一実施形態では、後処理は、さらに(重複するオブジェクトを削除した後)オブジェクトごとの定位推定の信頼度を算出することによって継続する。 その結果、本明細書に記載した後処理システムおよび方法の最終結果は、それぞれが位置、標準偏差、および一実施形態ではオブジェクトの位置の信頼度が提示されるオブジェクトのリストとなる。

    (2.2 システムアーキテクチャ
    上記で概説したプロセスが、図2の概略システム図によって示されている。 特に、図2のシステム図は、初期定位推定を後処理してこれらの定位推定の精度および信頼性を改善するためのシステムおよび方法を実施するためのプログラムモジュール間の相互関係を示している。 このシステムおよび方法を一般に、以下「ポストプロセッサ」と呼ぶ。 図2に破線で表したいずれのボックスおよびボックス間の相互接続は、ここに記載したポストプロセッサの代替の実施形態を表しており、これらの代替の実施形態の任意のものまたはすべては、後述するように、この文書を通じて説明する他の代替の実施形態との組合せで使用することができることに留意されたい。

    一般に、ポストプロセッサは、従来の受信機アレイ200および従来の初期定位推定モジュール210から導出された初期定位推定220を改善するように動作する。 上述したように、受信機アレイ200は、マイクロフォンアレイ、指向性アンテナアレイ、レーダアレイ、レーザ受信機アレイなど、従来の任意の受信アレイである。 さらに、受信機アレイ200は、受信機のアレイと同じように働く単一の受信機とすることもできる。 例えば、回転レーダ受信機など単一の回転受信機は、回転軸の周りの様々な方向から信号を取得する。 このようにレーダ受信機は、回転するときに様々な方向から信号を受信することによってレーダアレイと同じように働く。 しかし、このような受信機からの定位推定は、ここに記載した後処理と互換性はあるが、単一の受信機システムは(実際のアレイとは対照的に)、定位推定を提供するのに応答時間がより長くなる傾向があることに留意されたい。

    初期定位推定モジュール210は、受信機アレイ200から受信した信号または入力から定位推定を提供するための従来の定位または追跡システムである。 例えばマイクロフォンアレイの場合、初期定位推定モジュール210は、従来の音源定位(SSL)システムである。 説明上、以下の説明では、引き続き従来のマイクロフォンアレイを受信機アレイ200とし、SSLシステムを初期定位推定モジュール210として使用することにする。 しかし、ここで提供したポストプロセッサの詳細な説明に照らして、ポストプロセッサは、従来のいくつかの定位システムの任意のものと動作可能であり、単に従来のマイクロフォンアレイ/SSLシステムによって提供される定位推定の精度および信頼性を改善するだけに限定されないことを理解されたい。

    初期定位推定220が初期定位推定モジュール210によって提供されると、ポストプロセッサは、初期定位推定220を空間的に広がった重なり合うセクションにリアルタイムでクラスタ化するためのクラスタ化モジュール250を使用する。 空間的に広がった重なり合うセクションによるこのリアルタイムのクラスタ化プロセスについては、下記のセクション3.2.1で詳述する。 上述したように、一実施形態では、その寿命がまだ切れていない推定のみがリアルタイムクラスタ化プロセスを介して処理される。 その寿命が切れた定位推定は、ここに記載した後処理に関して単に破棄される。

    一実施形態では、寿命算出モジュール230は、算出されたオブジェクトの動きに基づいて最適化された定位推定寿命を自動的に算出する。 例えば、初期定位推定220は、各定位推定が生成された時刻を示すタイムスタンプを含んでいるので、時間の関数として近似のオブジェクトの動きを算出することは簡単なことである。 これらのオブジェクトの動きが与えられると、次いで寿命算出モジュール230は、オブジェクトごとに定位推定の適切な寿命を判定する。 上述したように、こうした寿命は、特定のオブジェクトの動きに依存する。 しかし寿命は、使用される受信機アレイ200および定位システムのタイプにも依存する。

    例えば、テストした実施形態では、マイクロフォンアレイのSSLとの組合せで、マイクロフォンアレイによってカバーされる仕事量(work volume)で話をしている人物の追跡に良好な結果を提供するのに約4秒程度の定位推定寿命が観測された。 同様に、テストした別の実施形態では、ワイヤレスコンピュータネットワークにおける特定のノードを受信するのにアンテナアレイのどの指向性アレイを使用するかの特定について良好な結果を提供するのに、約2秒程度の寿命が観測された。 それぞれの場合で、寿命算出モジュール230が次に、定位推定寿命を少しだけ上または下に自動調整して、算出されたオブジェクトの動きを考慮に入れる。 目的は、定位推定が比較的信頼できないほど古くないことを確実にする寿命を提供することである。 さらに、複数のオブジェクトの場合、各オブジェクトは、各特定のオブジェクトの動きに依存して異なる定位推定寿命を有することができる。

    別の実施形態では、特定のシステムの定位推定寿命の算出ではなく、寿命入力モジュール240を使用して、すべての初期定位推定220に使用する一定の寿命を提供する。 この場合もまた、寿命の長さは、受信機アレイ200のタイプ、使用している定位システムのタイプ、および予想されるオブジェクトの動きに依存するべきである。

    クラスタ化モジュール250が定位推定のクラスタ化を完了すると、潜在的オブジェクト特定モジュール260は次いで、定位推定クラスタの統計的分析を通して空間的に広がった重なり合う各セクション内の潜在的オブジェクトを表す位置推定のクラスタを特定する。 一般に、潜在的オブジェクトは、1つまたは複数のオブジェクトを含むセクションを特定するための閾値を使用することによって、これらの重なり合うセクションにおいて特定される。 下記のセクション3.2.2で詳述するように、非ゼロ数の測定を含む任意のセクションの算出された平均重みが所定の閾値を超えると、そのセクション中に潜在的オブジェクトがあると仮定され、さらに処理するために選択される。

    潜在的オブジェクト定位モジュール265は次いで、各クラスタを備える定位推定から各潜在的オブジェクトの位置を算出する。 この時点で、潜在的オブジェクトの位置は、初期定位推定220の改善(refinement)を表す。 しかし、重なり合うセクションの使用の結果、特定の定位推定または測定が2つ以上の隣接するセクションに存在することがある。 潜在的オブジェクトの位置の算出については、下記のセクション3.2.3でさらに詳しく説明する。

    それゆえ次のステップは、重複オブジェクト削除モジュール270を使用して、重なり合うセクションの使用により特定されたオブジェクトの重複を削除する。 一般に、オブジェクト特定モジュールが定位推定のクラスタを分析した後、それぞれが位置、標準偏差、および重みで表される仮説的または潜在的なオブジェクトのリストがある。 しかし、重なり合うセクションを使用するために、多くの場合、このリストには重複複製が存在し、そのため「潜在的オブジェクト」という用語を使用する。 一般に、下記のセクション3.2.4で詳述するように、任意の2つの仮説的なオブジェクトの間の距離が閾値距離より小さい場合に重複が存在すると考えられる。 重複が存在すると考えられる場合、重複オブジェクト削除モジュールは、単に重みが低い方の潜在的オブジェクトをリストから削除する。 万一重みが等しい場合、単に潜在的オブジェクトの一方が無作為に削除される。 任意の残りの潜在的オブジェクトが次いで新しい定位推定280として提供される。

    別の実施形態では、信頼度算出モジュール290が次いで新しい定位推定280のそれぞれの信頼度または尺度を算出する。 この信頼度の算出については、下記のセクション3.2.5でさらに詳しく説明する。

    最後に、さらに別の実施形態では、新しい定位推定が新しい初期定位推定220の生成に使用するために初期定位推定モジュール210に戻される。 定位推定の算出の初期化に既存の定位推定を使用することは、当業者にはよく知られており、ここでは詳述しない。

    (3.0 動作の概要
    上述したプログラムモジュールは、ここに記載したポストプロセッサの実施に用いられる。 上記で概説したように、このポストプロセッサシステムおよび方法は、入力定位推定データの多段階の後処理を通して定位推定の精度および信頼性を自動的に改善する。 以下のセクションでは、上記のプログラムモジュールを実施するための例示的な方法の動作について詳しく説明する。

    (3.1 初期定位結果の収集
    上述したように、ここに記載したポストプロセッサは、多くの異なる定位技術に適用可能である。 例えば、ここに記載した後処理システムおよび方法は、マイクロフォンアレイを使用したオーディオシステムでの音源定位(SSL)の結果を改善するよう動作する。 同様に、本明細書に記載した後処理システムおよび方法は、例えばワイヤレスコンピュータネットワーク中のコンピュータのエンドポイントとともに使用するためのアンテナアレイの特定の指向性アンテナを選択するなど、無線信号の定位を改善するように動作する。 他の例には、レーダおよびレーザ追跡システムが含まれる。 このようなすべてのシステムを、以下まとめて「ソースローカライザ」と呼ぶ。

    どのタイプの定位システムが使用されているかにかかわりなく、3次元定位データの場合、各定位測定は、1)方向、高さ、および距離によって表されるオブジェクトの位置、2)ソースローカライザがどれだけこの測定を信用するかを示す重み、および3)各定位測定の時間を示すタイムスタンプを含むと想定する。

    上述したように、初期定位推定を生成するためにローカライザによって使用される実際のアルゴリズムは、上記の情報(すなわちオブジェクトの位置、重み、および時間)を提供する限り、あまり重要ではない。 各測定が成功した後、初期定位推定は、ポストプロセッサ入力キューによって集められる。 ポストプロセッサは次いで、所与の寿命Tより古いすべての測定を入力キューから削除する。 上述したように、この寿命は、オブジェクトの動きに基づいて自動的に算出されるか、特定の定位システムにあらかじめ定義される。 一般に、より長い寿命を使用することは、より多くの結果が処理のために利用可能となり、それによって実際のオブジェクトと反射との間のより信頼性の高い区別が容易になり、よりよい精度が提供されることを意味する。 しかし、上述したように、寿命がより長いことによって、オブジェクトまたは信号源が動き、または位置を変えたとき、応答時間がより長くなるという結果になる。

    (3.2 初期定位推定の後処理
    初期定位推定の後処置は、クラスタ化、潜在的オブジェクト(すなわち音源、電波源など)の検出、潜在的オブジェクトの位置の推定、重複オブジェクトの低減または削除、および信頼度の計算を含むいくつかの段階を伴う。 これらの後処理段階について、次のセクションで説明する。

    (3.2.1 初期定位推定のクラスタ化
    仕事量(すなわち受信アレイによってモニタまたは提供される空間または量)は、あらかじめ定義されるか、従来の技術を使用して簡単に判定することができると想定する。 特に、以下のパラメータは、仕事量に関して既知であると想定する。
    ・最小および最大の方向角φ minおよびφ max
    ・最小および最大の仰角θ minおよびθ max
    ・最小および最大の距離ρ minおよびρ max
    これらのパラメータが与えられると、仕事量は、ある数のM個の重なり合う領域またはセクションに自動的に分割される。 等しいサイズの領域を使用することは必須ではないが、計算の複雑さを低減する役割を果たすことに留意されたい。 セクションのサイズは、初期推定量(estimator)の精度に依存し、通常、6σなど標準偏差の約4倍から6倍を上回らないようにすべきであることに留意されたい。

    あるいは、一実施形態では、重なり合う領域またはセクションの数、および重なり合う量は、ユーザ定義可能である。 任意の数またはサイズの領域を使用することができる。 しかし、小さいサイズの領域をより多く使用することは、計算のオーバーヘッドの増加を犠牲にして定位推定の精度を向上させる傾向がある。 特に、領域のサイズは、クラスタ当たり1つのオブジェクトを想定して、個別のオブジェクトを検出するポストプロセッサの分解能である。 しかし、最小のサイズは初期推定量の精度に依存し、この場合1つのオブジェクトからのほとんどすべての測定を同じクラスタに行かせることが望ましい。 それゆえ、標準分布では、これは、標準偏差の約6倍(例えば6σ)の領域サイズによりオブジェクトの測定の約99%を捕捉することを意味する。 しかし、特定の目的のために、クラスタまたは領域サイズを6σより大きくすることはできる。

    マイクロフォンアレイおよび音源定位推定を伴うテストした実施形態では、仕事量は、各次元(すなわち方向、高さ、および距離)においてそれぞれが標準偏差の6倍のサイズを有するM個の重なり合う領域に分割される。 このサイズのエリアを選び、領域間の50%の重なり合いを可能にすることによって、式(1)に従って重なり合う領域の数が得られる。

    このテストした実施形態では、式(1)の分母の6は、初期推定量の標準偏差の6倍の領域サイズの使用を表すことに留意されたい。 上述したように、他の領域サイズを使用して所望の精度を提供することができる。 しかし、6シグマの間隔(例えば平均の周りの±3シグマ)は測定の約99%を保持することに留意されたい。 さらに、式(1)の数字「8」は、領域間の重なり合いの量の結果である。 特に、この例では50%の重なり合いを使用したので、「8」の係数は、単に「2×2×2=8」(例えば3次元のそれぞれにおける50%の重なり合い)に起因する。 上記の説明に照らして、重なり合いがより多いことは、クラスタがより多く、よって重複したオブジェクトがより多く、結果的に、計算のオーバーヘッドが増加することを意味することが明らかである。 しかし、重なり合いがより少ないことは、クラスタ間の中央のオブジェクトを見逃す可能性があることを意味する。 6シグマのセクション幅では、最適な重なり合いは約66%であることが観測された。 これは、重なり合う領域は4シグマであり、最悪の場合、測定の約80%を保持することを意味する。 テストした実施形態では、単純に計算オーバーヘッドを低減するために50%の重なり合いが使用された。

    領域の数がわかると、次いで仕事量がその領域の数に単純に分割される。 次いで各初期定位推定は、各初期定位推定をカバーする仕事量の任意の領域に単純に割り当てられる。 各初期推定は関連の寿命を有しているので、通常オブジェクトごとに複数の定位推定が利用可能となる。 結果的に、定位推定を特定の領域に割り当てることによって、各領域内での定位推定クラスタの形成がもたらされる。 重なり合う領域の使用のため、特定の測定を、重なり合いの量に応じて2つ以上の隣接するセクションに割り当てることができることに留意されたい。 上述したように、より大きい重なり合いの領域を使用することによって、個別のオブジェクトの分解能はよりよくなるが、必要な計算が増加する。

    (3.2.2 潜在的オブジェクトを含むセクションの特定
    上記のセクション3.2.1で説明したように仕事量が領域に分割され、定位推定のクラスタが形成されると、どの領域が潜在的オブジェクトを有しているかに関する判定が行われる。 例えば、ある特定の領域には位置推定がない場合、その特定の領域内にはオブジェクトがないと想定され、その領域は、計算のオーバーヘッドを低減するためにさらなる処理から除外される。

    しかし、別の実施形態では、特定の領域が1つまたは複数の潜在的オブジェクトを含むかどうかの判定は、重みベースの閾値を用いて達成される。 特に、テストした実施形態では、潜在的オブジェクトを含むこれらのセクションの特定は、まず、非ゼロ数の測定を含む(すなわち少なくとも1つの定位推定がその特定の領域に割り当てられた)すべてのセクションについて、重みベースの閾値を表す、平均重みW thを計算することによって達成された。 この場合、W thは、仕事量の各領域の測定(gauge)に使用される閾値重みを表す。 閾値重みは初期定位推定の一部として提供された元の重みを用いて算出されることに留意されたい。 例えば、このような重みを算出するための1つの方法は、次の通り式(2)によって提供される。

    ここでW ijは、i番目のセクション中のj番目の測定の元の重み、N はi番目のセクション中の測定の数、Mはセクションの数、Lは非ゼロ数の推定を含むセクションの数、Kは定数である。

    Kの値は、セクションの数および誤った測定の数(すなわち実際のオブジェクトではなく反射およびノイズに起因するセクション中の測定)によって決まることに留意されたい。 テストした実施形態では、できるだけ多くのセクション中の誤った測定を無視するようにK=2の値が使用された。 特に、誤った測定を含むセクションは、通常、反射およびノイズの結果として約1つから2つの測定を含むことが観測された。 K=2の値を使用することによって、ポストプロセッサは、非常に少ない数の測定を伴うセクションを無視することができ、それゆえこのような測定は潜在的オブジェクトとして考慮されない。 Kの値はアプリケーション依存であり、ポストプロセッサの特定の実装形態では、時間の関数として初期推定量によってどれだけ多くの測定が提供されるかに応じて、3つ(または他の何らかの最低数)を下回る測定を含むセクションの処理を避けることが望ましいことがあることに留意されたい。

    次いで、各特定のセクションにおけるすべての測定の重みの和を表すセクションごとの合計セクション重みが、式(3)に示すようにセクションごとに算出される。

    任意のセクション重みW が閾値重みW thより大きい場合、そのセクションに潜在的オブジェクトがあると想定され、後述するように、さらなる処理のためにフラグが立てられる。

    (3.2.3 位置推定の算出
    仕事量の領域のすべてにおける潜在的オブジェクトについて定位推定を算出することができるが、前のステップで閾値W thを超える重みを有するものとしてフラグが立てられなかった領域には、実際には何のオブジェクト、または高い信頼性を有する何の定位推定もありそうにない。 結果として、一実施形態では、位置推定は、閾値W thを超える重みを有する領域内の潜在的オブジェクトについてのみ算出される。 一般に、後処理のこの段階中に提供された位置推定は、2段階の統計的な処理手法を伴う。

    特に、各セクションについて、第1の段階は、そのセクションにおけるすべての測定の加重平均を算出する。 一実施形態では、この統計的処理の速度は、式(4)に示すように、まず各位置p ijを直交座標系に変換することによって速くなる。

    次いで、次の通り式(5)および(6)によって示すように、加重平均および加重標準偏差が算出される。

    ここで、p はこのセクションにおけるオブジェクトの位置、およびσ はオブジェクトの定位推定の標準偏差である。

    重なり合うセクションの使用のため、および各セクションのサイズに依存して、同じオブジェクトに属する定位推定の一部が2つ以上の隣接するセクションに存在する可能性がある。 さらに、このような各セクションに存在するノイズ測定も存在し得る。 それゆえ、一実施形態では、これらの測定を削除し、全体的な位置の精度を改善するために、算出されたオブジェクトの位置p の特定の距離内の測定について、加重平均の第2のパスが実行される。

    (3.2.4 潜在的オブジェクトの低減

    (3.2.5 位置推定の信頼度の計算

    特に、測定の数がある所与の数N critより小さいとき、信頼度は低下し、それによってより信用に値しない位置測定を示す。 N critの値は、所望の反応時間、および初期推定量によってどれだけ多くの初期測定が提供されるかに依存することに留意されたい。 例えば、SSLシステムのテストした実施形態では、所望の反応時間は0.5秒であり、初期推定量は毎秒約10個の測定を提供した。 その結果、少なくとも5つの測定、すなわちN crit =5が、1の信頼を得るのに必要であった。 N critを増加することによって、誰かが特定の位置から話し始めた時から信頼度がゆっくり上昇する。 しかし、約5から10個の測定を下回る平均および統計的処理は、通常、このテストした実施形態で使用されたSSLシステムのタイプではあまり信頼できない。

    同様に、標準偏差がより大きい位置測定も通常あまり信用するに値しない。 最後に、特定の位置測定がより古いデータに基づくとき、こうした位置推定も通常あまり信用するに値しない。 例えば、テストした実施形態では、最も最近の測定の経過時間(age)が測定の寿命に近づくにつれて、オブジェクトの信頼度は低下した(測定の寿命の説明についてはセクション2.1および2.2を参照)。

    それゆえ、一実施形態では、上記の要因のそれぞれを考慮することによって各測定について信頼度を算出した。 3つの要因を考慮して位置測定の信頼度を生成するための1つのこのような方法は、次の通り式(9)および(10)によって提供される。

    ここで、c iNは測定の数に基づく信頼度であり、c iφ 、c iθ 、およびc iρは標準偏差に基づく信頼度であり、そしてc iTは最新の測定のタイムスタンプT iLastに基づく信頼度であり、tは現在の時刻、そしてT は測定の寿命である。 式(9)に示す信頼度のサブレベルの値を0および1の間の範囲に限定またはクリップした後、最終的な信頼度が次いで次の通り式(10)によって示すように算出される。

    =c iNiφiθiρiT式(10)
    ここで、最終的な信頼度c は、サブ信頼度のそれぞれをこの範囲に限定することによって0から1の間となる。

    次いで各測定についての算出された信頼度は、ポストプロセッサからの最終結果(セクション3.2.1から3.2.4に記載)とともに含められて、それぞれが位置、信頼度、および標準偏差で提示されるオブジェクトのリストを生成する。 上述したように、このリストは、初期定位推定の改善を表し、初期定位推定に比べてより正確で信頼できる定位測定または推定を提供する。

    (4.0 ポストプロセッサの動作の概要
    図2に関して上述し、セクション2および3に提供した詳細な説明に照らしたプロセスを、図3の概略動作フロー図によって示している。 特に、図3は、ポストプロセッサの動作を示す例示的な動作フロー図を示している。 図3に破線で表した任意のボックスおよびボックス間の相互接続は、ここに記載したポストプロセッサの代替の実施形態を表しており、これらの代替の実施形態の任意のものまたはすべては、後述するように、この文書を通じて説明する他の代替の実施形態との組合せで使用することができることに留意されたい。

    一般に、図3によって示すように、ポストプロセッサの動作は、受信アレイ200から位置測定を生成するための従来の定位技術を使用して生成された定位推定220の入力を受け付けることによって開始する(300)。 上述したように、これらの従来の定位技術は、当業者にはよく知られており、例えばマイクロフォンアレイを使用して仕事量内の音源の位置を特定する従来のSSL技術などの技術を含む。

    仕事量は次いで、いくつかの重なり合う領域またはセグメントに分割される(310)。 セクション3.2.1で上述したように、代替の実施形態では、重なり合う領域の数、および使用される重なり合いの量があらかじめ定義されているか、ユーザ定義可能であるか、または自動的に算出される。

    次に、各初期定位推定220は、こうした初期定位推定のそれぞれの位置に基づいて仕事量の対応する領域に単純に割り当てられる(320)。 しかし、上述したように、オブジェクトごとに複数の定位推定が、通常、利用可能となる。 結果として、領域の重なり合いの使用のため、特定の定位推定を2つ以上の領域に実際に割り当てることができる。 これらの初期定位推定を様々な領域に割り当てることは(320)、1つまたは複数の領域内の定位推定のクラスタを形成するように働く。

    次いで各領域中のクラスタの統計的分析を使用して、領域のどれが潜在的オブジェクトを含んでいるかを判定する(330)。 このステップのポイントは、潜在的オブジェクトを含んでいない領域の不必要な演算の実行を単に回避することである。 それゆえ、このステップは必須ではないが、ポストプロセッサの計算のオーバーヘッドを低減する。

    潜在的オブジェクトを含んでいる領域が特定されると(330)、次いで各領域内の各潜在的オブジェクトを表すクラスタの統計的分析を再度使用して、各潜在的オブジェクトの位置が推定される(340)。 次いでこうした推定位置を使用して、潜在的オブジェクトのいずれかが重複であるかどうかを判定する。 例えば、領域が重なり合っており、特定の測定がそれゆえ2つ以上の領域に同時に存在するので、特定のオブジェクトを、複数の領域での潜在的オブジェクトとして特定することができる。 この問題は、単に実際の位置と潜在的オブジェクトごとに算出された重みとを比較して、重みのより小さいオブジェクトを削除することによって対処される(350)。 この場合、潜在的オブジェクトの間の算出距離は、2つのオブジェクトが実際には同じオブジェクトであることを示す。

    最後に、一実施形態で、新しい定位推定280が、初期定位推定の生成(300)に使用される初期定位システムへの入力として提供される。 例えば、当業者にはよく知られているように、現在のまたは前の位置情報は、マイクロフォンアレイや他のデバイスなどの受信機アレイ200から提供された新しい観測に基づいて定位推定を算出するときに、初期設定ファクタとして使用されることが多い。

    初期定位推定の精度および信頼性を自動的に改善するためのポストプロセッサの上記の説明を、例示および説明の目的で提示した。 これは、網羅的なものではなく、または本発明を開示された正確な形態に限定するものではない。 上記の教示に照らして多くの変更形態および変形形態が可能である。 さらに、上記の代替の実施形態のいずれかまたはすべてを所望の任意の組合せで使用してポストプロセッサの追加的なハイブリッドの実施形態を形成することができることに留意されたい。 本発明の範囲は、この詳細な説明によって限定されるのではなく、むしろ本明細書に添付した特許請求の範囲によって限定されることが意図されている。

    初期定位データを後処理して精度および信頼性が改善された新しい定位推定を生成するための例示的なシステムを構成する汎用コンピューティングデバイスを描いた概略システム図である。

    初期定位データを後処理して精度および信頼性が改善された新しい定位推定を生成するためのポストプロセッサを実装するためのプログラムモジュール例を示す例示的なシステム図である。

    図2のポストプロセッサの動作を示す例示的な動作フロー図である。

    符号の説明

    120 処理ユニット 121 システムバス 130 システムメモリ 131 ROM
    132 RAM
    133 BIOS
    134 オペレーティングシステム 135 アプリケーションプログラム 136 他のプログラムモジュール 137 プログラムデータ 140 非リムーバブル不揮発性メモリインターフェース 141 ハードディスクドライブ 144 オペレーティングシステム 145 アプリケーションプログラム 146 他のプログラムモジュール 147 プログラムデータ 150 リムーバブル不揮発性メモリインターフェース 151 磁気ディスクドライブ 152 リムーバブル不揮発性磁気ディスク 155 光ディスクドライブ 156 リムーバブル不揮発性光ディスク 160 ユーザ入力インターフェース 161 マウス 162 キーボード 170 ネットワークインターフェース 171 ローカルエリアネットワーク 172 モデム 173 ワイドエリアネットワーク 180 リモートコンピュータ 181 メモリ記憶デバイス 185 リモートアプリケーションプログラム 190 ビデオインターフェース 191 モニタ 195 出力周辺インターフェース 196 プリンタ 197 スピーカ 198 マイクロフォンアレイ 199 オーディオインターフェース 200 受信機アレイ 210 初期定位推定モジュール 220 初期定位推定 230 寿命算出モジュール 240 寿命入力モジュール 250 クラスタ化モジュール 260 潜在的オブジェクト特定モジュール 265 潜在的オブジェクト定位モジュール 270 重複オブジェクト削除モジュール 280 新しい定位推定 290 信頼度算出モジュール

    QQ群二维码
    意见反馈