雑音キャンセリングマイクロホン装置

申请号 JP2016500267 申请日 2014-02-14 公开(公告)号 JP2016516343A 公开(公告)日 2016-06-02
申请人 コピン コーポレーション; コピン コーポレーション; 发明人 ファン・ダシェン;
摘要 【課題】雑音キャンセリングマイクロホン装置および該雑音キャンセリングマイクロホン装置の使用方法を提供する。【解決手段】雑音を低減する方法は、ビームフォーマ部で、主 信号 および少なくとも1つの参照信号を、受け取った少なくとも2つの音声信号に基づいて形成する過程と、音声区間検出部で、音声区間を検出する過程であって、主信号および参照信号を受け取り、目的音声区間信号を出 力 する過程と、適応雑音キャンセラ部で、適応的に雑音をキャンセルする過程であって、主信号、参照信号および目的音声区間信号を受け取り、適応雑音キャンセル信号を出力する過程と、雑音低減部で、雑音を低減する過程であって、目的音声区間信号および適応雑音キャンセル信号を受け取り、所望の発話信号を出力する過程と、を含む。【選択図】図1
权利要求

雑音を低減する方法であって、 a)ビームフォーマ部で、主信号および少なくとも1つの参照信号を、受け取った少なくとも2つの音声信号に基づいて形成する過程と、 b)音声区間検出部で、音声区間を検出する過程であって、当該音声区間検出部が、前記主信号および前記参照信号を受け取り、目的音声区間信号を出する過程と、 c)適応雑音キャンセラ部で、適応的に雑音をキャンセルする過程であって、当該適応雑音キャンセラ部が、前記主信号、前記参照信号および前記目的音声区間信号を受け取り、適応雑音キャンセル信号を出力する過程と、 d)雑音低減部で、雑音を低減する過程であって、当該雑音低減部が、前記目的音声区間信号および前記適応雑音キャンセル信号を受け取り、所望の発話信号を出力する過程と、 を含む、雑音低減方法。雑音キャンセリングデジタル信号プロセッサ(DSP)であって、 a)主信号および少なくとも1つの参照信号を、受け取った少なくとも2つの音声信号に基づいて出力するビームフォーマ部と、 b)前記主信号および前記参照信号を受け取り、目的音声区間信号を出力する音声区間検出部と、 c)前記主信号、前記参照信号および前記目的音声区間信号を受け取り、適応雑音キャンセル信号を出力する適応雑音キャンセラ部と、 d)前記目的音声区間信号および前記適応雑音キャンセル信号を受け取り、所望の発話信号を出力する雑音低減部と、 を備える、雑音キャンセリングDSP。請求項2に記載の雑音キャンセリングDSPにおいて、前記目的音声区間信号が、さらに、前記適応雑音キャンセラ部および前記雑音低減部を制御する、雑音キャンセリングDSP。請求項2に記載の雑音キャンセリングDSPにおいて、前記音声区間検出部が、さらに、 a)受け取った前記主信号および前記参照信号のそれぞれの短時間パワーを各々検出する少なくとも1つの短時間検出部、 b)それぞれの短時間検出部が検出した前記短時間パワーを各々変換する少なくとも1つのログスケーラ部、ならびに c)ログスケーラ部による処理を経た前記主信号の短時間パワー検出値およびログスケーラ部による処理を経た前記参照信号のうちの一つの短時間パワー検出値を受け取り、これらの検出値に基づいて音声区間差分信号を生成する少なくとも1つの結合部、 を含む、雑音キャンセリングDSP。請求項4に記載の雑音キャンセリングDSPにおいて、前記音声区間差分信号が、さらに、単一チャネル音声区間検出部に通信可能に接続され、当該単一チャネル音声区間検出部が、前記目的音声区間信号を出力する、雑音キャンセリングDSP。請求項5に記載の雑音キャンセリングDSPにおいて、前記音声区間検出部が、さらに、 マイクロホン構成に基づいてORゲートまたはANDゲート、 を含み、当該ORゲートまたはANDゲートは、複数の目的音声区間信号を受け取り、その複数の目的音声区間信号のうちの一つを出力する、雑音キャンセリングDSP。請求項4に記載の雑音キャンセリングDSPにおいて、前記短時間検出部が、二乗平均平方根検出部、パワー検出部またはエネルギー検出部である、雑音キャンセリングDSP。請求項2に記載の雑音キャンセリングDSPにおいて、前記ビームフォーマ部が、さらに、 前記主信号および前記参照信号のそれぞれを、前記音声区間検出部による受取りの前にフィルタリング処理する少なくとも1つのディエンファシスフィルタ、 を含む、雑音キャンセリングDSP。請求項8に記載の雑音キャンセリングDSPにおいて、前記ディエンファシスフィルタが、おおよそ1kHz〜4kHz間の周波数から始まり、おおよそナイキスト周波数まで続く緩やかな傾度のロールオフを有する、雑音キャンセリングDSP。請求項2に記載の雑音キャンセリングDSPにおいて、前記ビームフォーマ部が、さらに、 前記参照信号または前記主信号をフィルタリング処理する周波数応答マッチングフィルタ、 を含む、雑音キャンセリングDSP。請求項2に記載の雑音キャンセリングDSPにおいて、双指向性の音圧傾度型マイクロホンエレメントが、前記VADまたは音声区間検出モジュールおよび単一チャネルの前記雑音低減モジュールに対して音声信号を提供する、雑音キャンセリングDSP。請求項11に記載の雑音キャンセリングDSPにおいて、前記音圧傾度型マイクロホンエレメントが、音響延設体内にシールされており、当該音響延設体は、少なくとも1つの音響ポートに対する音響ダクトを含み、当該音響ダクトは、それぞれの音響ポートの範囲を各々拡張する、雑音キャンセリングDSP。請求項12に記載の雑音キャンセリングDSPにおいて、シールされた前記音圧傾度型マイクロホンエレメントが、略円筒のチューブ内に気密に取り付けられており、当該チューブが、さらに、a)各音響ポートの前記範囲以上の距離で長手方向に等間隔に離間した一対の音響開口、およびb)前記チューブの内部のうち、当該音響開口と前記音響ポートとの間を満たす風防体、を含む、雑音キャンセリングDSP。請求項13に記載の雑音キャンセリングDSPにおいて、前記チューブが、ヘッドセットデバイスに連結したショートブームである、雑音キャンセリングDSP。請求項11に記載の雑音キャンセリングDSPにおいて、さらに、 上部および下部を有する録音用の手持ち式デバイス、 を備えており、マイクロホンの第1のアレイが前記上部に位置し、マイクロホンの第2のアレイが前記下部に位置する、雑音キャンセリングDSP。請求項15に記載の雑音キャンセリングDSPにおいて、前記上部が、少なくとも2つのマイクロホンを収容しており、前記下部が、少なくとも2つのマイクロホンを収容している、雑音キャンセリングDSP。請求項2に記載の雑音キャンセリングDSPにおいて、さらに、 デジタル化された前記少なくとも2つの音声信号を生成するマイクロホンのアレイ、 を備える、雑音キャンセリングDSP。請求項17に記載の雑音キャンセリングDSPにおいて、マイクロホンの前記アレイが、2つの音圧傾度型マイクロホンエレメントを含み、それぞれの音圧傾度型マイクロホンエレメントが、2つの音響ポートを有する、雑音キャンセリングDSP。請求項18に記載の雑音キャンセリングDSPにおいて、前記2つの音圧傾度型マイクロホンエレメントが、双指向性で且つ同一である、雑音キャンセリングDSP。請求項18に記載の雑音キャンセリングDSPにおいて、前記2つの音圧傾度型マイクロホンエレメントが、音響延設体内に各々シールされており、当該音響延設体は、少なくとも1つの音響ポートに対する音響ダクトを含み、当該音響ダクトは、それぞれの音響ポートの範囲を各々拡張する、雑音キャンセリングDSP。請求項20に記載の雑音キャンセリングDSPにおいて、音響延設体によってシールされた前記2つの音圧傾度型マイクロホンエレメントが、略円筒のチューブ内に気密に且つ互いに列状に並ぶようにして取り付けられており、当該チューブが、さらに、a)各音響ポートの前記範囲以上の距離で長手方向に等間隔に離間した3つ以上の音響開口、およびb)前記チューブのうちの当該音響開口と前記音響ポートとの間の内部を満たす風防体、を含む、雑音キャンセリングDSP。請求項21に記載の雑音キャンセリングDSPにおいて、前記チューブが、ヘッドセットデバイスに連結したショートブームである、雑音キャンセリングDSP。請求項21に記載の雑音キャンセリングDSPにおいて、前記チューブが、グースネック式の卓上デバイスに連結されている、雑音キャンセリングDSP。請求項18に記載の雑音キャンセリングDSPにおいて、マイクロホンの前記アレイが、ロングブーム付きヘッドセットデバイスに接続されている、雑音キャンセリングDSP。請求項24に記載の雑音キャンセリングDSPにおいて、各エレメントの指向性パターンが実質的に同一の空間ベクトルで且つ互いに平行な向きで且つ当該ロングブームに対して直交するように、さらに、前記エレメントのうちの一つがユーザの口の前方に位置決めされるように且つ残りのエレメントがそのユーザの口の側方に位置決めされるように、前記ロングブームは、マイクロホンの前記アレイを配置する構成である、雑音キャンセリングDSP。請求項17に記載の雑音キャンセリングDSPにおいて、マイクロホンの前記アレイが、ヘッドホンのフィードコネクタに内蔵して設けられている、雑音キャンセリングDSP。請求項17に記載の雑音キャンセリングDSPにおいて、マイクロホンの前記アレイのうちの少なくとも第1および第2のマイクロホンが、眼鏡のフレームのハウジング内に設けられており、当該第1のマイクロホンは、ブリッジ支持部の近傍に位置し且つ第1の上部音響ポート及び第1の下部音響ポートを有しており、当該第2のマイクロホンは、レンズと支持アームとの間の智または端片(end piece)の近傍に位置し且つ第2の上部音響ポート及び第2の下部音響ポートを有している、雑音キャンセリングDSP。請求項27に記載の雑音キャンセリングDSPにおいて、さらに、 前記ハウジング内において、反対側の智または端片の近傍に位置し且つ第3の上部音響ポート及び第3の下部音響ポートを有している、第3のマイクロホン、 を備える、雑音キャンセリングDSP。請求項17に記載の雑音キャンセリングDSPにおいて、マイクロホンの前記アレイが、3つ以上の全指向性のマイクロホンエレメントを含み、前記ビームフォーマ部が、さらに、それぞれのマイクロホンエレメントについて音声信号を受け取る、雑音キャンセリングDSP。請求項29に記載の雑音キャンセリングDSPにおいて、前記ビームフォーマ部が、さらに、分割部、結合部、増幅部および位相調整部を含む、雑音キャンセリングDSP。請求項29に記載の雑音キャンセリングDSPにおいて、前記ビームフォーマ部は、さらに、隣接する音声信号が結合されることによって互いに等しい位相長さを有する2つ以上の音声差分信号を生成するように構成されている、雑音キャンセリングDSP。請求項2に記載の雑音キャンセリングDSPにおいて、当該DSPが、システムオンチップ(SoC)、Bluetoothチップ、DSPチップ、またはDSP集積回路を備えたコーデックである、雑音キャンセリングDSP。雑音を低減する非過渡的なコンピュータプログラムプロダクトであって、コンピュータ読取り可能な命令が記憶されたコンピュータ読取り可能な媒体を備えており、前記命令は、プロセッサによってロード及び実行されると、当該プロセッサに、 a)主信号および少なくとも1つの参照信号を、受け取った少なくとも2つの音声入力信号に基づいて生成する手順と、 b)前記主信号および前記参照信号に基づいて音声区間を検出し、目的音声区間信号を生成する手順と、 c)前記主信号、前記参照信号および前記目的音声区間信号に基づいて適応的に雑音をキャンセルし、適応雑音キャンセル信号を生成する手順と、 d)前記目的音声区間信号および前記適応雑音キャンセル信号に基づいて雑音を低減し、所望の発話信号を出力する手順と、 を実行させる、コンピュータプログラムプロダクト。a)双指向性の音圧傾度型マイクロホンエレメントと、 b)互いに正反対側に位置する第1および第2の音響ダクトを含み、前記マイクロホンエレメントを封入し、チューブの内側に沿って配置される音響収容体と、 を備える、雑音キャンセリングマイクロホン。請求項34に記載の雑音キャンセリングマイクロホンにおいて、さらに、 ヘッドセットと、 当該雑音キャンセリングマイクロホンを収容するショートブームと、 を備える、雑音キャンセリングマイクロホン。請求項35に記載の雑音キャンセリングマイクロホンにおいて、前記ショートブームが、2つの雑音キャンセリングマイクロホンを収容する、雑音キャンセリングマイクロホン。請求項34に記載の雑音キャンセリングマイクロホンにおいて、さらに、 当該雑音キャンセリングマイクロホンを収容する少なくとも1つのイヤホン、 を備える、雑音キャンセリングマイクロホン。請求項34に記載の雑音キャンセリングマイクロホンにおいて、さらに、 少なくとも1つのマイクロホンを収容するように構成された眼鏡、 を備える、雑音キャンセリングマイクロホン。請求項34に記載の雑音キャンセリングマイクロホンにおいて、さらに、 接話型デュアルマイクロホンロングブームを収容するように構成されたヘッドセット、 を備える、雑音キャンセリングマイクロホン。請求項34に記載の雑音キャンセリングマイクロホンにおいて、さらに、 少なくとも2つのマイクロホンエレメントを収容するように構成されたグースネック式のスタンド、 を備える、雑音キャンセリングマイクロホン。

说明书全文

関連出願

本願は、2013年3月13日付出願の米国仮特許出願第61/780,108号の利益を主張する。本願は、さらに、2013年6月25日付出願の米国仮特許出願第61/839,211号の利益を主張する。本願は、さらに、2013年6月25日付出願の米国仮特許出願第61/839,227号の利益を主張する。本願は、さらに、2013年12月6日付出願の米国仮特許出願第61/912,844号の利益を主張する。

本願は、Dashen Fanを発明者とする2014年2月14日付出願の“Eye Glasses With Microphone Array”(代理人管理番号:0717.2220-001)と同日出願である。本願は、さらに、Dashen Fanを発明者とする2014年2月14日付出願の“Sound Induction Ear Speaker For Eye Glasses”(代理人管理番号:0717.2221-001)と同日出願である。本願は、さらに、Kenny Chowらを発明者とする2014年2月14日付出願の“Eyewear Spectacle With Audio Speaker In The Temple”(代理人管理番号:0717.2229-001)と同日出願である。

上記の米国仮特許出願及び米国特許出願の全内容は、参照をもって本明細書に取り入れたものとする。

録音を行う数多くのコンピュータシステムや電子システムにおいて、背景雑音は低減されるのが望ましい。背景雑音の低減は、より明瞭な音声信号を出できるというような点でユーザにとって有利となり得る。また、背景雑音の低減は、自動音声認識のようなプロセスにとって有利となり得る。

接話型雑音キャンセリングマイクロホンの音響特性は、極めて有用な場合が多い。このようなマイクロホン(本明細書では「マイク」と称する場合もある)のフォームファクタまたは外形形状は、長い支持竿状であるブーム(ロングブームとも称する)の場合が多く、マイクロホンをユーザの口の前方に位置決めするようになっている。ただし、このようなフォームファクタは、ユーザの口からの分がマイクロホン膜またはマイクロホンメンブレン(ECMマイクロホン)の表面上に蓄積することで性能が低下するといった短所も含め様々な短所があり、大抵のユーザにとって不都合で厄介である。

そのため、上記の問題点を解消または最小化する、雑音キャンセリングマイクロホン装置および該雑音キャンセリングマイクロホン装置の使用方法が望まれている。

具体的に述べると、一部の実施形態は、ブームを短くし、マイクロホンをユーザの口から離し、かつ、高分子製またはゴム製の延設体やブーツ等の音響収容体を用いてマイクロホンの音響ポートを拡張することを含む。これにより、遠くの雑音に対する雑音キャンセリング特性を維持しながら、有効接話レンジを広げることができる。

本発明の例示的な実施形態は:企業コールセンター、産業用及び一般携帯用途に適した電話通信用オーディオヘッドセット等といったショートブーム付きヘッドセット;眼鏡のフレーム上にまたはフレーム内に入力ライン(電線、ケーブルまたはその他のコネクタ)が取り付けられたインライン「イヤーバッド」タイプのイヤホン付きヘッドセット;ニアトゥアイ(NTE)ヘッドセットディスプレイまたはヘッドセットコンピューティングデバイス;産業用途、軍事用途、航空用途等の雑音の多い環境で用いられるロングブーム付きヘッドセット;および劇場級またはシンフォニーホール級クオリティの音響を、構造コストをかけずに提供可能なグースネック式の卓上スタイルマイクロフォン;を含む。

本発明の例示的な実施形態、さらなる詳細およびさらなる利点を、特許請求の範囲に従って詳述する。本発明の構成/構成要素のうち、本明細書で「連結」または「接続」されていると説明された構成/構成要素は、(例えば、有線または無線等で)物理的におよび/または通信可能に「連結」または「接続」されたものであってもよい。

例示的な実施形態は、雑音を低減する方法を含む。この雑音低減方法は、ビームフォーマ部で、主信号および少なくとも1つの参照信号を、受け取った少なくとも2つの音声信号に基づいて形成する過程と、音声区間検出部で、音声区間を検出する過程であって、当該音声区間検出部が、前記主信号および前記参照信号を受け取り、目的音声区間信号を出力する過程と、適応雑音キャンセラ部で、適応的に雑音をキャンセルする過程であって、当該適応雑音キャンセラ部が、前記主信号、前記参照信号および前記目的音声区間信号を受け取り、適応雑音キャンセル信号を出力する過程と、雑音低減部で、雑音を低減する過程であって、当該雑音低減部が、前記目的音声区間信号および前記適応雑音キャンセル信号を受け取り、所望の発話信号を出力する過程と、を含む。

本発明の例示的な他の実施形態は、雑音キャンセリングデジタル信号プロセッサ(DSP)を含み得る。この雑音キャンセリングDSPは、ビームフォーマ部であって、少なくとも2つの音声信号を受け取り、主信号および少なくとも1つの参照信号を、前記少なくとも2つの音声信号に基づいて出力するように構成または通信可能に接続されたビームフォーマ部と、音声区間検出部であって、前記主信号および前記参照信号を受け取り、目的音声区間信号を出力または生成するように構成または通信可能に接続された音声区間検出部と、適応雑音キャンセラ部であって、前記主信号、前記参照信号および前記目的音声区間信号を受け取り、適応雑音キャンセル信号を出力または生成するように構成または通信可能に接続された適応雑音キャンセラ部と、雑音低減部であって、前記目的音声区間信号および前記適応雑音キャンセル信号を受け取り、所望の発話信号を出力または生成するように構成または通信可能に接続された雑音低減部と、を備えていてもよい。

本発明の例示的なさらなる他の実施形態は、前記適応雑音キャンセラ部および前記雑音低減部を制御するように構成または通信可能に接続された目的音声区間信号を含み得る。前記音声区間検出部は、さらに、受け取った前記主信号および前記参照信号のそれぞれの短時間パワーを各々検出するように構成または通信可能に接続された少なくとも1つの短時間検出部、それぞれの短時間検出部による前記短時間パワーの検出値(短時間パワー検出値)を各々(対数スケール(例えば、dB等)に)変換するように構成または通信可能に接続された少なくとも1つのログスケーラ部またはログアンプ部、ならびに増幅された前記主信号の前記短時間パワー検出値および増幅された前記参照信号のうちの一つの前記短時間パワー検出値を受け取り、これら主信号の検出値と参照信号の検出値との差分に基づいて(例えば、dB等の)音声区間差分信号を出力または生成するように構成または通信可能に接続された少なくとも1つの結合部、を含み得る。前記短時間検出部は、主信号または参照信号を入力として受け取り、検出した短時間パワーを直列の増幅(アンプ)部に出力するように接続され得る。それぞれの信号毎に、前記短時間検出部と前記増幅部とが直列接続され得る。前記増幅部は、対数変換部(ログアンプとも、ログスケーラとも称される)であり得る。前記結合部は、隣接する信号同士、例えば、前記主信号と前記少なくとも1つの参照信号のうちの一つとを結合し、前記主信号から前記参照信号の少なくとも1つの前記検出値を減算するか、またはその逆に、前記参照信号の少なくとも1つの前記検出値から前記主信号を減算することにより、音声区間差分信号を生成し得る。

例示的なさらなる他の実施形態において、前記音声区間差分信号は、さらに、単一信号チャネル音声区間検出部に通信可能に接続され、当該単一信号チャネル音声区間検出部が、前記目的音声区間信号を出力する。前記音声区間検出部は、さらに、少なくとも1つのORゲートまたはANDゲートを含み得て、ORゲートであるかANDゲートであるかはマイクロホン構成に基づいて選択され得る。当該ゲートは、複数の目的音声区間信号を受け取り、その複数の目的音声区間信号のうちの一つを、ORゲートの真理値表(または論理表)に基づいて出力し得る。前記複数の目的音声区間信号は、最終の統合された目的音声区間信号であり得る。前記短時間検出部は、二乗平均平方根(RMS)検出部、パワー検出部、エネルギー検出部等であり得る。

例示的なさらなる他の実施形態において、前記ビームフォーマ部は、少なくとも1つのローパスフィルタ(LPF)(例えば、ディエンファシスフィルタ等)を含む。当該LPFは、前記主信号および前記参照信号のそれぞれを、前記音声区間検出部による受取りの前にフィルタリング処理し得る。単一の多信号LPFが使用されてもよいし、それぞれの信号毎に個別のLPFが使用されてもよい。前記LPFは、互いに同一の周波数応答特性または伝達関数特性を有し得る。変形例として、LPFは、それぞれの信号毎に異なる周波数応答特性および伝達関数特性を有するものとされてもよい。前記LPFは、おおよそ1kHz〜4kHz間の周波数から始まり、ナイキスト周波数まで続く緩やかなロールオフ傾度を有し得る。前記ビームフォーマ部は、さらに、前記参照信号および/または前記主信号をフィルタリング処理する周波数応答マッチングフィルタを含み得る。当該周波数応答マッチングフィルタは、信号の利得の調整および/または位相の調整および/または周波数応答の形成を行うのに使用され得る。前記周波数応答マッチングフィルタは、前記参照信号の周波数応答および/または前記主信号の周波数応答をマッチングさせるのに使用され得る。

例示的なさらなる他の実施形態では、双指向性の音圧傾度型マイクロホンエレメントが、前記VAD(音声区間検出)モジュールおよび単一チャネルの前記雑音低減モジュールに対して前記少なくとも2つの音声信号を提供または出力する。前記双指向性の音圧傾度型マイクロホンエレメントは、2つの音響ポートを有し得る。前記音圧傾度型マイクロホンエレメントは、高分子製またはゴム製の延設体やブーツ等といった、音響収容体、音響延設体またはゴム製ブーツ内にシールされ得る。本明細書において「シール」や「シールされた」という表現は、一般的に気密または密閉を指す。前記音響延設体は、それぞれの音響ポート毎に音響ダクトを含み得る。当該音響ダクトは、それぞれの音響ポートの範囲を拡張し得る。これにより、マイクロホンの近距離発話レンジ(near-field talk range)を増大させることができる。前記音圧傾度型マイクロホンエレメントまたは前記音響収容体が付いた前記音圧傾度型マイクロホンエレメントは、さらに、チューブ内に気密に取り付けられ得る。当該チューブの形状は、円筒状、形、またはその他の任意の形状であり得る。前記チューブは、少なくとも一対の音響開口と風防体(ウインドスクリーン)とを含み得る。当該音響開口は、各音響ポートの前記範囲以上の距離間隔で前記チューブに沿って長手方向に離間し得る。前記風防体は、発泡体または風除体(wind guard material)であり得る。前記風防体は、前記チューブの内部(interior)のうち、前記音響延設体とチューブの端部との間を満たすのに用いられ得る。円筒状の前記チューブは、ヘッドセットデバイスに連結したショートブームであり得る。

例示的なさらなる他の実施形態では、マイクロホンのアレイが、前記少なくとも2つの音声信号を生成する。これら少なくとも2つの音声信号は、ビームフォーマ部で受け取られ得る。前記音声信号は、デジタル化されたものであり得る。マイクロホンの前記アレイは、少なくとも2つの音圧傾度型マイクロホンエレメントを含み得る。それぞれの音圧傾度型マイクロホンエレメントは、2つの音響ポートを有し得る。当該音響ポートは、音波の進入ポイント(入力)になり得る。2つの前記音圧傾度型マイクロホンエレメントは、双指向性で且つ同一であり得る。2つの前記音圧傾度型マイクロホンエレメントは、さらに、音響収容体、音響延設体または気密なゴム製ブーツ内にシールされ得る。前記音響収容体、前記音響延設体または前記ゴム製ブーツは、それぞれの音響ポート毎に音響ダクトを含み得る。当該音響ダクトは、それぞれの音響ポートの範囲を拡張し得る。これにより、マイクロホンの近距離発話レンジを増大させることができる。前記音圧傾度型マイクロホンエレメントは、さらに、略円筒のチューブ内において互いに列状に並ぶようにして且つ気密に取り付けられ得る。円筒状の前記チューブは、少なくとも3つの音響開口と風防体または発泡充填体とを含み得る。当該音響開口は、少なくとも各音響ダクトの範囲以上の距離または範囲で前記チューブに沿って長手方向に等間隔に離間し得る。前記風防体または前記発泡充填体は、前記チューブの内部のうち、前記音響開口と前記音響ポートとの間を満たすのに用いられ得る。これにより、風を遮ったり風音の発生を防いだりすることができる。前記風防体は、発泡体またはその他の部材(material)(例えば、前記ゴム製ブーツ上の風除スリーブなど)であり得る。円筒状の前記チューブは、ヘッドセットデバイスに連結されたショートブームであり得る。円筒状の前記チューブは、グースネック式の卓上マイクロホンデバイスに連結され得る。

さらなる他の実施形態では、音響延設体が付いた音圧傾度型マイクロホンが、2つの全指向性のマイクおよび追加のビームフォーミングによって置き換えられる。例えば、それぞれの音圧傾度型マイクロホンエレメントが、2つの全指向性のマイクロホンエレメントによって、その全指向性のマイクロホンエレメントが1つずつおおよそ各音響ポートの位置(各音響延設ダクトの端部)に配置されるように置き換えられてもよい。それら2つの全指向性のマイクロホンエレメントによって生成された出力または出力音声信号は、前記ビームフォーマ部で受け取られて音圧傾度型マイクロホンのビームパターンと等価なビームパターンを生成するように処理され得る。前記ビームフォーマ部は、アナログビームフォーマ部または(電子的にビームを形成する)デジタルビームフォーマ部であり得る。音響ポート延設体が付いた双指向性のマイクロホンは、2つの全指向性のマイクロホンによって、その全指向性のマイクロホンが1つずつおおよそ音響延設ダクトの端部の音響ポートの位置および追加のビームフォーマ回路の位置に配置されるように置き換えられ得る。

例示的なさらなる他の実施形態において、マイクロホンの前記アレイは、ロングブーム付きヘッドセットデバイスに接続され得る。このようなロングブーム付きヘッドセットは、従来どおりの接話型マイクに見えるかもしれないが、2つのマイクを並設した(in parallel)大きなブームマイクである。マイクロホンブームの端部がユーザの口の前方に位置決めされると同時に、残りのマイクロホンエレメントがそのユーザの口の少なくとも1つの側方に位置決めされ得る。これにより、当該マイクロホンのその端部は、ユーザの口から少ししか離れていない。このような接話型ロングブームの設計は、軍事環境、航空環境及び産業環境を含め、雑音が極めて多い環境で使用することができる。このようなデバイスは、有益な雑音キャンセル性能を発揮することができる。マイクの前記アレイは、2つの音圧傾度型雑音キャンセルマイクロホンを、一方のマイクロホンはユーザの口の直ぐ前方に位置決めされるように且つ他方のマイクロホンはそのユーザの口の側方に位置決めされるように含み得る。これら2つのマイクは、単一の収容体(ケーシング体)または別々の同一の収容体に収容された、同一のマイクとされ得る。これらのマイクロホンは、指向性パターンが互いに平行で且つブームに対して直交するものとされ得る。前記収容体内のそれぞれのマイクが、前側の開口および後側の開口を有し得る。マイク間には、前記収容体内において、デジタル信号処理回路が設けられ得る。前記アレイは、音圧傾度型雑音キャンセルマイクロホンに代えて、双指向性のマイクロホンを含むものであってもよい。前記アレイは、全指向性のマイクロホンを含むものであってもよい。前記アレイは、2〜4つのマイクロホンを含み得る。

例示的なさらなる他の実施形態では、マイクロホンの前記アレイが、ヘッドホンのフィードコネクタ(feed connector)に内蔵して(inline)設けられている。当該ヘッドホンのフィードコネクタは、一対のイヤーバッド(例えば、典型的には携帯電話でのハンズフリー通話用に使用されるタイプなど)またはその他の同様のオーディオヘッドセットデバイスであり得る。マイクロホンの前記アレイに用いられるマイクロホンは、音圧傾度型マイクロホン、全指向性のマイクロホンまたはその他のマイクロホンの種類であり得る。マイクロホンのこのようなアレイは、前記コネクタ(例えば、他に電線、ケーブルなど)に沿った様々な位置、例えば、ユーザの口の近傍、Y分岐の近傍、Y分岐よりも上、Y分岐の位置、Y分岐よりも下などに配置され得る(「Y」分岐とは、入力コードコネクタからのコードが左側のイヤーバッドコードと右側のイヤーバッドコードとに分岐する部分のことである)。

例示的なさらなる他の実施形態では、マイクロホンの前記アレイが、眼鏡のフレームのハウジング内に設けられるかまたは当該ハウジング上に取り付けられる。第1のマイクロホンは、ブリッジ支持部の近傍に位置し得る(ブリッジ支持部とは、眼鏡のレンズ同士を隔てる部分のことであり、ユーザの鼻に載置されるかまたはユーザの鼻の上方に位置決めされるのが典型的である)。前記第1のマイクロホンは、上部音響ポートおよび下部音響ポートを有し得る。第2のマイクロホンは、眼鏡のフレームの端点(end-point)の近傍(ユーザのこめかみの近傍、レンズと支持アームとの間)に位置し得る。前記第2のマイクロホンは、上部音響ポートおよび下部音響ポートを有し得る。例示的なさらなる他の実施形態は、第3のマイクロホンを備え、当該第3のマイクロホンは、前記第2のマイクと反対側の眼鏡の端点の近傍に位置し、かつ、上部音響ポートおよび下部音響ポートを有する。

さらなる他の実施形態では、マイクロホンの前記アレイが、3つ以上の全指向性のマイクロホンエレメントを含む。前記ビームフォーマ部が、さらに、それぞれのマイクロホンエレメントについて音声信号を受け取り得る。したがって、前記ビームフォーマ部には、3つ以上の音声信号が入力されることになる。前記ビームフォーマ部は、分割部(splitter)、結合部(combiner)、増幅部および位相調整部を含み得る。前記増幅部および前記位相調整部は、前記マイクロホンエレメントから生じるビームフォーミングネットワークのうち、前記分割部および前記結合部が使用されて形成する枝または信号に沿って直列接続され得る。前記ビームフォーマ部は、さらに、隣接する音声信号が結合されることによって2つ以上の音声差分信号を生成するように構成されている。これら2つ以上の音声差分信号は、互いに等しい位相長さを有し得る。

一般的に言えば、それぞれの双指向性のマイクロホンエレメントを、ビームフォーマ部を用いて互いに電子的に接続された2つの全指向性のマイクロホンエレメントによって置き換えることにより、代替的な実施形態を実現することが可能である。このような置換えは、同じビームパターンを達成することができる。2つの双指向性のマイクロホンエレメントと2つの全指向性のエレメントとを備える場合、一部の実施形態では、中央に位置する2つのマイクロホンエレメントのうちの一方を省略して、3つのマイクロホンエレメントが互いに列状に並ぶようにし、さらに、ビームフォーミングを適宜調節することにより、代替的な実施形態を実現することが可能になる。このような3つのマイクロホンエレメントの例では、中央のマイクロホンエレメントにビームフォーミングを使用することにより、前記主信号を形成する第1の双指向性のマイクロホンのビームパターンと等価なビームパターン、および前記参照信号を形成する第2の双指向性のマイクロホンのビームパターンと等価なビームパターンを生成する。

前記デジタル信号プロセッサ(DSP)の例示的な実施形態は、システムオンチップ(SoC)、Bluetooth(登録商標)チップ、DSPチップ、またはDSP集積回路(IC)を備えたコーデックを用いることで実現可能である。

さらなる他の例において、雑音を低減するプロセスは、コンピュータ読取り可能な命令が記憶されたコンピュータ読取り可能な媒体を備えた非過渡的なコンピュータプログラムプロダクトによって実行され得る。前記コンピュータ読取り可能な命令は、プロセッサによってロード及び実行されると、前記プロセッサに、少なくとも2つの音声信号入力に基づいてビームを形成し、主信号および少なくとも1つの参照信号を生成する手順と、前記主信号および前記参照信号に基づいて音声区間を検出し、目的音声区間信号を生成する手順と、前記主信号、前記参照信号および前記目的音声区間信号に基づいて適応的に雑音をキャンセルし、適応雑音キャンセル信号を生成する手順と、前記目的音声区間信号および前記適応雑音キャンセル信号に基づいて雑音を低減し、所望の発話信号を出力する手順と、を実行させ得る。

本発明の例示的な他の実施形態は、コンピュータプログラムプロダクトを用いて構成され得る。例えば、本発明の例示的な実施形態を実現するソフトウェアを用いて、制御をプログラムするようにしてもよい。本発明の例示的なさらなる他の実施形態は、プロセッサによって実行可能な命令を有する非過渡的なコンピュータ読取り可能な媒体であって、当該命令は、実行されると、前記プロセッサに本明細書で説明する方法全体を実行させ得る、非過渡的なコンピュータ読取り可能な媒体を含み得る。なお、本明細書で説明するブロック図やフロー図の要素/構成要素は、ソフトウェアでも、ハードウェアでも、ファームウェアでも、あるいは、将来登場し得るその他の同様の実現態様でも実現可能である。また、本明細書で説明するブロック図やフロー図の要素/構成要素は、ソフトウェア、ハードウェアまたはファームウェアにおいて適宜組み合わせたり適宜分割したりすることも可能である。ソフトウェアで実現する場合、そのソフトウェアは、本明細書に開示された例示的な実施形態をサポートすることが可能な言語であれば、どのような言語で書かれたものであってもよい。また、そのソフトウェアは、どのような形態のコンピュータ読取り可能な媒体に記憶されたものであってもよく、例えば、ランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、コンパクトディスク読出し専用メモリ(CD−ROM)、「フラッシュ」メモリ等に記憶され得る。動作時には、汎用プロセッサまたは特定用途向けプロセッサが、当該技術分野でよく理解されている様式により、ソフトウェアをロードし実行する。なお、ブロック図やフロー図の要素/構成要素は、その数が増えたり減ったりする場合も考えられ、その位置や向きが異なる場合も考えられ、その表現様式が異なる場合も考えられる。なお、ブロック図および/またはフロー図および/またはネットワーク図、ならびに本発明の実施形態の実行を示すブロック図やフロー図の数は、実現態様によって変わり得る。

他の実施形態では、録音用の手持ち式デバイスが、上部および下部を有する。マイクロホンの第1の前記アレイが前記上部に収容されており、マイクロホンの第2の前記アレイが前記下部に位置する。前記上部が少なくとも2つのマイクロホンを収容するものであってもよく、また、前記下部が少なくとも2つのマイクロホンを収容するものであってもよい。

一実施形態では、雑音キャンセリングマイクロホンが、さらに、ヘッドセットと、当該雑音キャンセリングマイクロホンを収容するショートブームと、を備える。前記ショートブームは、2つの雑音キャンセリングマイクロホンを収容するものであってもよい。

雑音キャンセリングマイクロホンは、さらに、当該雑音キャンセリングマイクロホンを収容する少なくとも1つのイヤホン、を備えるものであってもよい。雑音キャンセリングマイクロホンは、さらに、少なくとも1つのマイクロホンを収容するように構成された眼鏡、を備えるものであってもよい。

雑音キャンセリングマイクロホンは、さらに、接話型デュアルマイクロホンロングブームを収容するように構成されたヘッドセット、を備えるものであってもよい。

雑音キャンセリングマイクロホンは、さらに、少なくとも2つのマイクロホンエレメントを収容するように構成されたグースネック式のスタンド(podium)、を備えるものであってもよい。

本発明は、数多くの利点または効果を有する。例えば、本発明にかかるオーディオデバイスは、そのマイクロホンのアレイにより、不所望の雑音を最小限に抑えることで音声認識の精度を向上させることができるので、音声認識用のアレイを縮小することができる。これは、不所望の雑音を能動的にキャンセルするデジタル信号プロセッサを用いる実施形態において特にそうである。さらに、本発明により、マイクロホンのアレイとデジタル信号プロセッサとを、日常的に用いるうえで便利で且つ快適なフォーマットに統合することができる。

本発明にかかる雑音キャンセル回路の例示的な一実施形態を示すブロック図である。

雑音キャンセル回路に用いられ得る、本発明にかかるビームフォーミングモジュールの例示的な一実施形態を示すブロック図である。

本発明にかかる目的音声区間検出モジュールの例示的な一実施形態を示すブロック図である。

本発明にかかる雑音キャンセル回路の例示的な一実施形態であって、近距離マイクロホン信号、第1の遠距離マイクロホン信号および第2の遠距離マイクロホン信号をそれぞれ受け取る実施形態を示すブロック図である。

本発明の一実施形態の配置構成において、3つのマイクロホンを収容するブームチューブの一実施形態を示す図である。

本発明の一実施形態の配置構成において、4つのマイクロホンを収容するブームチューブの一実施形態を示す図である。

本発明にかかる3つの信号を受け入れるビームフォーミングモジュールの例示的な一実施形態を示すブロック図である。

本発明にかかる3つの信号を受け入れる目的音声区間検出(VAD)モジュールの例示的な一実施形態を示すブロック図である。

本発明の例示的な一実施形態であって、ディスプレイ、第1のマイクロホンおよび第2のマイクロホンを備える実施形態を示す図である。

本発明の例示的な一実施形態であって、ディスプレイ、第1のマイクロホンおよび第2のマイクロホンを備える実施形態を示す他の図である。

本発明にかかる眼鏡の一実施形態であって、2つの埋め込まれたマイクロホンを備える実施形態を示す図である。

本発明にかかる眼鏡の一実施形態であって、3つの埋め込まれたマイクロホンを備える実施形態を示す図である。

本発明にかかるゴム製ブーツとマイクロホンとの組立体の例示的な一実施形態を示す図である。

本発明にかかるゴム製ブーツとマイクロホンとの組立体の例示的な一実施形態を示す他の図である。

本発明にかかるマイクロホンの例示的な配置位置を示す図である。

本発明にかかる雑音キャンセル回路の例示的な一実施形態であって、単一のマイクロホンを用いる実施形態を示すブロック図である。

デュアルマイクロホンが取り付けられたヘッドセットの図である。

ショートブームを備えるヘッドセットの例示的な一実施形態を示す図である。

ショートブームを備えるヘッドセットの例示的な他の実施形態を示す図である。

双方向無線機の例示的な実施形態を示す図である。

双方向無線機の例示的な他の実施形態を示す図である。

双方向無線機の例示的なさらなる他の実施形態であって、当該無線機の下部に1つのマイクロホンを有し、上部に1つのマイクロホンを有する実施形態を示す図である。

双方向無線機の例示的なさらなる他の実施形態であって、4つのマイクロホンを有する実施形態を示す図である。

マイクロホンを備える携帯電話の図である。

携帯電話2302の例示的な一実施形態であって、4つのマイクロホンを有する実施形態を示す図である。

前述の内容は、添付の図面に示す本発明の例示的な実施形態についての以下の詳細な説明から明らかになる。図面では、異なる図をとおして、同一の符号は同一の構成/構成要素を指すものとする。図面は必ずしも縮尺どおりではなく、むしろ、本発明の実施形態を示すことに重点を置いている。

頭部装着型コンピュータでは、ユーザは、自身の口の前方にブームマイクロホンを有しない接話型雑音キャンセリングマイクロホンを望みうる。ユーザの口の前方にマイクロホンが位置すると、不快に見える可能性がある。さらに、ユーザの口からの水分がエレクトレットコンデンサマイクロホン(ECM)メンブレン(膜)の表面上に蓄積することで、長い間使用しているとマイクロホンの感度が劣化する可能性がある。

一実施形態では、ショートチューブブーム付きヘッドセットでは、ブームを短くし、ECMをユーザの口から離し、かつ、ゴム製ブーツを用いて雑音キャンセリングマイクロホンの音響ポートを拡張することによって上記の短所を克服し得る。これにより、ECMの有効接話レンジを広げることができる。また、これにより、遠くの雑音に対する雑音キャンセリングECM特性を維持することもできる。加えて、ブームチューブには、風防発泡体が詰め込まれ得る。これらの解決手段により、ヘッドセットコンピュータを、さらに企業コールセンター、産業用及び一般携帯用途に適したものとすることができる。同一のデュアルマイクロホンをチューブブーム内に有する実施形態では、それぞれのマイクロホンのゴム製ブーツも互いに同一とされ得る。

一実施形態では、前記ショートチューブブーム付きヘッドセットが、有線のヘッドセットまたは無線のヘッドセット(ワイヤレスヘッドセット)である。このヘッドセットは、短いマイクロホン(および、例えば、ECMなど)のチューブブームを有する。そのチューブブームは、ヘッドセットのハウジングからユーザの頬に沿って延びるものであり得て、かつ、真直または湾曲の形状をしている。そのチューブブームは、例えば、ユーザの頬からユーザの口の側方にかけての長さを延びるものであり得る。そのチューブブームは、内部に単一の雑音キャンセリングマイクロホンを有するものであり得る。

前記チューブブームは、チューブの内部にデュアルマイクロホンを有するものであってもよい。デュアルマイクロホンは、非定常雑音、ヒトの雑音(human noise)、音楽および高周波雑音をキャンセルするうえでより有効になり得る。デュアルマイクロホンは、さらに、モバイル通信、音声認識またはBluetooth(登録商標)ヘッドセットにより適し得る。これら2つのマイクロホンは互いに同一であり得るが、当業者であれば、マイクロホン同士のモデルが互いに異なるチューブブームも設計することも可能である。

デュアルマイクロホンを有する一実施形態では、それぞれのゴム製ブーツ内に封入された2つのマイクロホンが、チューブの内部に沿って互いに列状に並ぶようにして配置される。

チューブは円筒状であり得るが、その他の形状(例えば、角柱など)も可能である。前記ショートチューブブームは、先端部に1つと後部に1つとの、2つの開口を有し得る。チューブの表面は、音がチューブブーム内のマイクロホンに届くように少なくとも1つの穴またはスリットによるパターンで覆われ得る。他の実施形態では、前記ショートチューブブームが、先端部に1つと中央部に1つと後部に1つとの、3つの開口を有する。開口同士の間隔は等間隔であり得るが、当業者であれば、その他の間隔構成を設計することも可能である。

チューブブーム内のマイクロホンは、音圧傾度型マイクロホンエレメントを有する双指向性の雑音キャンセリングマイクロホンである。このマイクロホンは、音響ダクトを使用して当該マイクロホンの前側と後側との音響ポートを拡張するゴム製ブーツ内に封入され得る。マイクロホンエレメントは、この気密なゴム製ブーツ内にシールされる。

チューブ内では、前記ゴム製ブーツが付いたマイクロホンが、そのチューブの内部に沿って配置される。チューブの先端部に位置する音響ポートは、ブームのその場所の開口と揃い、チューブの後部に位置する音響ポートは、ブームのその場所の開口と揃う。前記ゴム製ブーツは、当該ゴム製ブーツとチューブの端部との間に空間が生じるように、チューブの端部からオフセットを有していてもよい。このような空間は、通気空間(breathing room)を設けたり、適切な厚さの風防体を設置するための空間を設けたりすることを可能にする。ただし、そのゴム製ブーツとチューブの内壁との間は気密に維持される。風防発泡体(例えば、前記ゴム製ブーツ上の風除スリーブなど)が、前記空気ダクト、さらに、音響ポートとチューブの内部/開口との間の空いた空間を満たす。

図1は、本発明にかかる雑音キャンセル回路の例示的な一実施形態を示すブロック図100である。

2つのマイクロホンからの信号110,112はデジタル化されており、雑音キャンセル回路101に送られる。雑音キャンセル回路101は、デジタル信号処理(DSP)ユニット(例えば、プロセッサ上で実行されるソフトウェア、ハードウェアブロック、複数のハードウェアブロックなど)であり得る。一実施形態において、雑音キャンセル回路101は、デジタル信号処理(DSP)チップ、システムオンチップ(SOC)、Bluetoothチップ、DSPチップを備えた音声コーデック等である。雑音キャンセル回路101は、ユーザの近傍のBluetoothヘッドセットの中、バッテリ付きインライン制御ケース内、コネクタ内部等に配置され得る。雑音キャンセル回路101は、バッテリによって給電されるものでも、ヘッドセットが接続されたデバイスにおける電源(例えば、そのデバイスにおけるバッテリ、USBからの電力、micro−USBからの電力、Lighteningコネクタからの電力など)によって給電されるものでもあり得る。

雑音キャンセル回路101は、ビームフォーミング(BF)モジュール102、適応(型)雑音キャンセル(ANC)モジュール104、単一信号雑音低減(NR)モジュール106および目的音声区間検出または目的音声活動検出(VAD)モジュール108の、4つの機能ブロックを含む。前記2つの信号110,112がBFモジュール102に送られて、BFモジュール102が主信号130および参照信号132を生成し、ANCモジュール104に対して出力する。近距離(すなわち、目的の音に対して比較的近い)マイクロホン信号110はユーザの口の近くにあるマイクロホンから収集されて、遠距離(すなわち、目的の音に対して比較的離れた)マイクロホン信号112はユーザの口から遠くにあるマイクロホンから収集される。BFモジュール102は、さらに、主信号120および参照信号122を目的VADモジュール108に対して生成する。一部の実施形態において、主信号120および参照信号122は、ANCモジュール104に対して生成される主信号130および参照信号132と異なりうる。

ANCモジュール104は、主信号130および参照信号132を処理してこれら2つの信号から雑音をキャンセルし、雑音キャンセル済み信号142を単一チャネルNRモジュール106に対して出力する。単一信号NRモジュール106は、ANCモジュール104からの雑音キャンセル済み信号142を後処理して、さらなる残留雑音を除去する。一方で、VADモジュール108は、主信号120および参照信号122から、これら主信号120および参照信号122における音声の有無を示す目的音声区間検出(DVAD)信号140を導き出す。次に、このDVAD信号140は、BFモジュール102の結果からANCモジュール104およびNRモジュール106を制御するのに用いられ得る。DVAD信号140は、前記信号のうちのどの部位が分析すべき音声データを有しているのかをANCモジュール104および単一チャネルNRモジュール106に知らせる。これにより、前記信号のうちの音声データを有していない部位を無視することによってANCモジュール104および単一チャネルNRモジュール106の処理効率を向上させることができる。単一チャネルNRモジュール106により、所望の発話信号144が生成される。

一実施形態において、BFモジュール102、ANCモジュール104、単一NR低減モジュール106、および目的VADモジュール108は、線形処理(例えば、線形フィルタなど)を用いる。(線形処理を用いる)線形系は、重畳特性と、スケーリング特性(または同次性特性)とを満足する。重畳特性とは、系の出力が入力に正比例することを意味する。例えば、次式が成立する場合、関数F(x)は線形系である。

F(x1+x2+…)=F(x1)+F(x2)+…

出力が入力に比例して変化する(scale)場合、第一度(degree one)のスケーリング特性(または第一度の同次性特性)を満足する。例えば、スカラーαについて次式が成立する場合、関数F(x)はスケーリング特性(または同次性特性)を満足する。

F(αx)=αF(x)

対照的に、非線形関数は、上記のいずれの条件も満足しない。

従来の雑音キャンセルシステムは、非線形処理を用いる。線形処理を用いた場合、入力が増加すると、出力もこれに対し比例して変化する。しかし、非線形処理では、入力が増加した際には、出力はこれに対し非比例的に変化する。線形処理を用いると、特徴抽出が向上するので音声認識において有用である。音声認識アルゴリズムは、静かな環境で記録された歪みのない無雑音音声に基づいて開発されている。線形雑音キャンセルアルゴリズムであれば、非線形歪みを雑音キャンセル後の音声に加えることがない。音声認識は、音声に加えられた線形歪みは対処できるものの、音声の非線形歪みは対処することができない。音声認識エンジンにとって、線形雑音キャンセルアルゴリズムは「透過的」または「透明的」なものである。非線形歪み雑音のバリエーションを音声認識に学習させることは不可能である。非線形歪みは、音声認識に必要な特徴抽出の妨げになり得る。

線形系の一例として、線形の単一チャネル雑音除去フィルタであるウィナーフィルタが挙げられる。ウィナーフィルタは、定常信号、雑音スペクトルおよび加法的雑音が分かっていると仮定したうえで、雑音の多い観測プロセスに時不変線形フィルタリングを適用することにより、目的の(または目標の)ランダムプロセスの推定を生成するフィルタである。ウィナーフィルタは、推定されるランダムプロセスと目的のプロセスとの間の平均二乗誤差を最小限にする。

図2は、雑音キャンセル回路101に用いられ得る、ビームフォーミングモジュール202の例示的な一実施形態を示すブロック図200である。BFモジュール202は、近距離マイクロホン信号210および遠距離マイクロホン信号212を受け取る。

遠距離マイクロホン信号212は、周波数応答マッチングフィルタ204に入力される。周波数応答マッチングフィルタ204は、遠距離マイクロホン信号212の利得の調整、位相の調整および周波数応答の形成を行う。例えば、周波数応答マッチングフィルタ204は、遠距離マイクロホン信号212を、この遠距離マイクロホン信号212を表す(当該フィルタ204から出力された)参照信号232が近距離マイクロホン信号210を表す主信号230と共に処理可能なものとなるように、これら2つのマイクロホン間の距離に関して調整し得る。そして、主信号230および参照信号232は、ANCモジュールに送信される。

近距離マイクロホン信号210は、ANCモジュールに対して主信号230として出力される。近距離マイクロホン信号210は、さらに、ローパスフィルタ206に入力される。参照信号232は、ローパスフィルタ208に入力される。ローパスフィルタ208は、目的VADモジュールに送信される参照信号222を生成する。ローパスフィルタ206およびローパスフィルタ208は、信号を「接話事象(case)」用に調整する。これは、例えばローパスフィルタ206,208が、一実施形態として2kHzから4kHzにかけて緩やかなロールオフを有する、すなわち徐々に信号を減衰させることによって達成される。しかしながら、ユーザの口に対するマイクロホンの設計や距離が異なる場合は、その他の周波数に設定されてもよい。

図3は、目的音声区間検出モジュール302の例示的な一実施形態を示すブロック図である。DVADモジュール302は、前記ビームフォーミングモジュールから主信号320および参照信号322を受け取る。これら主信号320および参照信号322は、それぞれの短時間パワーモジュール304,306によって処理される。短時間パワーモジュール304,306は、二乗平均平方根(RMS)検出部、パワー(PWR)検出部またはエネルギー検出部を有し得る。短時間パワーモジュール304,306は、それぞれの増幅部308,310に信号を出力する。これら増幅部は、対数変換部(すなわち、ログアンプ/対数増幅部)であり得る。対数変換部308,310は、結合部312に対して出力する。結合部312は、信号同士、例えば、前記主信号と少なくとも1つの前記参照信号のうちの一つとを結合し、すなわち、前記主信号から前記参照信号の少なくとも1つの検出値を減算するか、またはその逆に、前記参照信号の少なくとも1つの検出値から前記主信号を減算することにより、音声区間差分信号を生成する。この音声区間差分信号は、単一チャネルVADモジュール314に入力される。この単一チャネルVADモジュールは、従来のVADモジュールであり得る。単一チャネルVAD314は、目的音声区間信号を出力する。

図4は、雑音キャンセル回路401の例示的な一実施形態であって、近距離マイクロホン信号410、第1の遠距離マイクロホン信号412および第2の遠距離マイクロホン信号414をそれぞれ受け取る実施形態を示すブロック図400である。この雑音キャンセル回路401は、図1を参照しながら説明した雑音キャンセル回路101と類似しているが、2つの信号ではなく3つの信号を受け取る点で異なる。ビームフォーミング(BF)モジュール402は、それら3つの信号410,412,414を受け取り、適応雑音キャンセルモジュール404に対して主信号430、第1の参照信号432および第2の参照信号434を出力する。前記ビームフォーミングモジュールは、さらに、音声区間検出(VAD)モジュール408に対して主信号422、第1の参照信号420および第2の参照信号424を出力する。

ANCモジュール404は、図1のANCモジュール104と同様に、雑音キャンセル済み信号442を単一チャネル雑音低減(NR)モジュール406に対して出力する。そして、単一NRモジュール406は、所望の発話444を出力する。VADモジュール408は、DVAD信号をANCモジュール404および単一チャネルNRモジュール406に対して出力する。

図5は、3つのマイクロホン506,508,510を収容するブームチューブ502からビームフォーミングを行う例示的な一実施形態を示す。第1のマイクロホン506はブームチューブ502の先端部504に最も近くなるように配置され、第2のマイクロホン508はブームチューブ502内で先端部504から遠くに配置され、第3のマイクロホン510はブームチューブ502内で先端部504からさらに遠くに配置される。第1のマイクロホン506および第2のマイクロホン508は、左(Left)信号526を出力するためのデータを提供する。具体的に述べると、第1のマイクロホンは、その信号を利得モジュール512および遅延モジュール514に対して出力し、その後、結合部522へと出力される。第2のマイクロホンは、結合部522に直接接続されている。結合部522は、提供された2つの信号を減算して雑音をキャンセルし、前記Left信号526を生成する。

同様に、第2のマイクロホン508は、さらに、利得モジュール516および遅延モジュール518に接続されており、その出力は結合部520へと出力される。第3のマイクロホン510は、結合部520に直接接続されている。結合部520は、提供された2つの信号を減算して雑音をキャンセルし、右(Right)信号524を生成する。

図6は、4つのマイクロホン656,658,660,662を収容するブームチューブ652からビームフォーミングを行う例示的な一実施形態を示す。第1のマイクロホン656はブームチューブ652の先端部654に最も近くなるように配置され、第2のマイクロホン658はブームチューブ652内で先端部654から遠くに配置され、第3のマイクロホン660はブームチューブ652内で先端部654からさらに遠くに配置され、第4のマイクロホン662はブームチューブ652内で先端部654からなおいっそう遠くに配置される。第1のマイクロホン656および第2のマイクロホン658は、Left信号686を出力するためのデータを提供する。具体的に述べると、第1のマイクロホンは、その信号を利得モジュール672および遅延モジュール674に対して出力し、その後結合部682へと出力される。第2のマイクロホンは、結合部658に直接接続されている。結合部682は、提供された2つの信号を減算して雑音をキャンセルし、前記Left信号686を生成する。

同様に、第3のマイクロホン660は、利得モジュール676および遅延モジュール678に接続されており、その出力は結合部680へと出力される。第4のマイクロホン662は、結合部680に直接接続されている。結合部680は、提供された2つの信号を減算して雑音をキャンセルし、Right信号684を生成する。

図7は、3つの信号710,712,714を受け入れるビームフォーミングモジュール702の例示的な一実施形態を示すブロック図700である。近距離マイクロホン信号710は、ANCモジュールに対して主信号730として出力される。近距離マイクロホン信号710は、さらに、ローパスフィルタ717に入力されて、VADモジュールに対して主信号720として出力される。第1の遠距離マイクロホン信号712および第2の近距離マイクロホン信号714は、それぞれの周波数応答マッチングフィルタ706,704に入力される。そして、周波数応答マッチングフィルタ706,704の出力は、ANCモジュールに対して第1の参照信号732および第2の参照信号734として出力される。周波数応答マッチングフィルタ706,704の出力は、さらに、それぞれのローパスフィルタ716,718に対して出力される。そして、ローパスフィルタ716が第1の参照信号722を出力し、ローパスフィルタ718が第2の参照信号724を出力する。

図8は、3つの信号820,822,824を受け入れる目的音声区間検出(VAD)モジュール802の例示的な一実施形態を示すブロック図800である。VADモジュール802は、主信号820、第1の参照信号822および第2の参照信号824を、それぞれの短時間パワーモジュール804,805,806で受け取る。短時間パワーモジュール804,805,806は、図3を参照しながら説明した短時間パワーモジュールと同様のものである。短時間パワーモジュール804,805,806は、それぞれの増幅部808,809,810に対して出力する。これら増幅部808,809,810は、それぞれ対数変換部であり得る。増幅部808および増幅部809は、結合モジュール811に対して出力する。結合モジュール811は、それら2つの信号を減算し、その差分を単一チャネルVADモジュール814に出力する。増幅部810および増幅部808は、結合モジュール812に対して出力する。結合モジュール812は、それら2つの信号を減算し、その差分を単一チャネルVADモジュール816に出力する。単一チャネルVADモジュール814,816は、論理ORゲート818に対して出力する。そして、論理ORゲート818は、DVAD信号840を出力する。

図9Aは、第1のマイクロホン904および第2のマイクロホン906を備えたディスプレイ902の例示的な一実施形態を示す図900である。第1のマイクロホン904は、第2のマイクロホン906に比べてユーザの口のより近くに位置決めされる。他方で、第2のマイクロホン906は、ユーザの口から遠くに位置決めされる。一実施形態において、マイクロホン904,906は、ディスプレイ902のハウジングの円筒孔内に設置される。

図9Bは、第1のマイクロホン954および第2のマイクロホン956を備えたディスプレイ952の例示的な一実施形態を示す図950である。第1のマイクロホン954は、第2のマイクロホン956に比べてユーザの口のより近くに位置決めされる。他方で、第2のマイクロホン956は、ユーザの口から遠くに位置決めされる。一実施形態において、マイクロホン954,956は、ディスプレイ952のハウジングの円筒孔内に設置される。

図10は、マイクロホンが埋め込まれた眼鏡1002の例示的な一実施形態を示す図1000である。眼鏡1002は、その眼鏡1002のフレームの中央部に配置された第1のマイクロホン1004と、その眼鏡1002のフレームの側方部に配置された第2のマイクロホン1006との、2つのマイクロホン1004,1006を備える。マイクロホン1004,1006は、双指向性または単一指向性の音圧傾度型マイクロホンエレメントであり得る。それぞれのマイクロホン1004,1006は、ゴム製ブーツ内に設けられる。このゴム製ブーツは、マイクロホンの前側と後側との音響ポートに対して音響ダクトを配する。それら2つのマイクロホン1004,1006は、互いに同一でありえ、およびそれぞれのブーツは、互いに同一であり得る。マイクロホンエレメント1004,1006は、前記ゴム製ブーツ内に気密にシール(例えば、密閉など)され得る。前記音響ダクトには、風防体が充填される。前記ポートは、織布層によってシールされる。上部音響ポートおよび下部音響ポートは、防水膜によってシールされる。これらのマイクロホンは、前記眼鏡のフレームの構造に組み込まれ得る。それぞれのマイクロホンは上部孔および下部孔を有しており、これらが音響ポートとなる。一実施形態では、音圧傾度型マイクロホンエレメントであり得る2つのマイクロホン1004,1006のそれぞれが、2つの全指向性のマイクロホンによって置き換えられ得る。

図11は、3つのマイクロホンが埋め込まれた眼鏡1152の例示的な一実施形態を示す図1150である。図11の眼鏡1152は、図10の眼鏡1002と類似しているが、2つのマイクロホンではなく3つのマイクロホンを備える点で異なる。図11の眼鏡1152は、その眼鏡1152の中央部に配置された第1のマイクロホン1154、その眼鏡1152の左側部に配置された第2のマイクロホン1156、およびその眼鏡1152の右側部に配置された第3のマイクロホン1158を備える。これらの3つのマイクロホンは、これまでに説明した3つのマイクロホンに基づく実施形態で利用可能である。

図12Aは、本発明にかかるマイクロホン組立体1200の分解図である。図示のとおり、ゴム製ブーツ1202a,1202bは、2つに分かれた各々第1のゴム製ブーツ半割体1202aと第2のゴム製ブーツ半割体1202bである。これらゴム製ブーツ半割体間に、マイクロホン1204が設けられる。それぞれのゴム製ブーツ1202a,1202bには、風防体1208が詰め込められている(ただし、図12Aには、第2のゴム製ブーツ半割体1202bに設けられた風防体のみが示されている)。音圧傾度型マイクロホンの場合、前記空気ダクトおよび音響ポートとブームの内側との間の空いた空間が、風防発泡体(例えば、前記ゴム製ブーツ上の風除スリーブなど)によって満たされる。

マイクロホン1204は、2つのゴム製ブーツ半割体1202a,1202b間に、遊びを有するようにして設けられる。マイクロホン1204およびゴム製ブーツ1202a,1202bは、そのマイクロホン1204がゴム製ブーツ半割体1202a,1202b間の内部空間に収まるように寸法決めされている。そのマイクロホンには、ゴム製ブーツ1202a,1202bから外部に延出する電線1206が接続されている。電線1206は、例えば前述した雑音キャンセル回路等に接続可能である。

図12Bは、マイクロホン組立体1200の組立後の状態を示す斜視図である。図12Bのゴム製ブーツ1252は、内部にマイクロホン(図示せず)を設けて双方の半割体1202a,1202b同士を繋げたものである。そのマイクロホンに接続された電線1256が、例えば前述した雑音キャンセル回路等に接続可能なようにゴム製ブーツ1252内に存在している。

図13は、本発明の一実施形態を示す図1300であり、マイクロホンの様々な任意の配置位置1304a〜1304eが描かれている。マイクロホンは、先に説明したような音圧傾度型マイクロホンである。一実施形態において、マイクロホンは、図13に示す位置のうち、任意の単一の位置、あるいは、組み合わされた任意の複数の位置に配置される。一例として、2つのマイクロホンを備えるシステムを例に挙げて説明する。ユーザの口に近距離マイクロホンをMIC1と称し、ユーザの口から遠距離マイクロホンをMIC2と称することにする。一実施形態では、MIC1とMIC2の両方が、第1の位置1304aに内蔵して設けられる。他の実施形態として、下記の配置構成が挙げられる: MIC1は第1の位置1304aに設けて、MIC2は第2の位置1304bに設ける; MIC1は第1の位置1304aに設けて、MIC2は第3の位置1304cに設ける; MIC1は第1の位置1304aに設けて、MIC2は第4の位置1304dに設ける; MIC1は第4の位置1304dに設けて、MIC2は第5の位置1304eに設ける:および MIC1とMIC2の両方が、第4の位置1304dに設けられる。

第4の位置1304dにマイクロホンを有する場合、当該マイクロホンは、ペンダント状の部材(pendant)内に設けられる。

マイクロホンの配置位置は、位置1304a〜1304eの上記以外の組合せであってもよいし、図13に描かれていない位置であってもよい。

それぞれの音圧傾度型マイクロホンエレメントは、2つの全指向性のマイクロホンが、各音響ポートの位置に配置されるように置き換えられてもよく、これにより、合計4つのマイクロホンとなる。それら2つの全指向性のマイクロホンからの信号は、前述した電子ビームフォーミング回路(すなわち、デジタルビームフォーミング回路)によって処理されて音圧傾度型のビームパターンを生成し得る。この音圧傾度型のビームパターンにより、等価な音圧傾度型マイクロホンと置き換えることができる。

本発明の一実施形態において、音圧傾度型マイクロホンが使用される場合、それぞれのマイクロホンは、音響ダクトを有して当該マイクロホンの前側と後側との音響ポートを拡張するゴム製ブーツ内に設けられる。ゴム製ブーツの端部で新たに生じる音響ポートが、チューブの開口と揃えられ、空いた空間が風防体で満たされる。1つの音圧傾度型マイクロホンに代えて2つの全指向性のマイクロホンを使用する場合には、それぞれのマイクロホンの音響ポートが、開口と揃えられる。

一実施形態において、従来どおりの接話型ブームマイクロホンに見えるかもしれないが、ロングブームデュアルマイクロホン付きヘッドセットは、2つのマイクロホンを並設した大きなブームである。このブームの端部側のマイクロホンが、ユーザの口の前方に位置決めされる。このような接話型ロングブームデュアルマイクロホンの設計は、軍事、航空及び産業での雑音が極めて多い用途をターゲットとしており、圧倒的な雑音キャンセル性能を発揮する。例えば、1つの主要なマイクロホン(またはメインマイクロホン)は、口の直ぐ前方に位置決めされ得る。第2のマイクロホンは、口の側方に位置決めされ得る。これら2つのマイクロホンは、同一のケーシングで且つ同一のマイクロホンとされ得る。これら2つのマイクロホンは、ブームと直交するようにして並設または平行に配置され得る。それぞれのマイクロホンが、前側の開口および後側の開口を有する。これら2つのマイク間には、前記収容体内において、DSP回路が設けられ得る。

マイクロホンは、音響ポートに適宜延びる空気ダクトを備えたゴム製またはシリコン製のホルダ(例えば、前記ゴム製ブーツなど)内に収容される。このような収容体は、マイクロホンを気密な入れ物またはコンテナ内に保持し、衝撃を吸収することができる。マイクロホンの前側のポートおよび後側のポートは、風音を抑える織布層で構成された風防層、または風防発泡体で覆われる。マイクロホンのプラスチック製の収容体における出口孔は、耐水性の薄膜体または特殊な耐水性コーティングで覆われ得る。

他の実施形態では、グースネック式の会議用マイクロホンが、雑音キャンセルを提供しうる。大きな会議場(会議ホール)では、録音を行うにあたってエコーが問題となり得る。マイクロホンで録音されたエコーは、ハウリングを引き起こし得る。エコーが酷いと、ユーザはスピーカの音量を上げることができず、可聴性が限られてしまう。これに対し、会議場や会議室の壁にエコーを抑える高価な吸音体を設置することで、音量を大きくすることができ、音場を聴衆全体にわたって均一に分布させることが考えられる。電子的なエコーキャンセル機器を用いることで、エコーを抑えてスピーカの音量を上げることも考えられるが、それらの機器は高価であり、セットアップが困難になり得るし、しばしば音響の専門家が必要となる。

一実施形態では、デュアルマイクロホン構成の会議用雑音キャンセルマイクロホンが、会議場または会議室でのエコーの問題に対する安価で簡単に実施可能な解決手段となりうる。具体的に述べると、これまでに説明したデュアルマイクロホンシステムを、グースネック式の卓上マイクロホン内に設置すればよい。チューブ内のそれぞれのマイクロホンは、双指向性、単一指向性または超指向性の音圧傾度型マイクロホンとされる。

図14は、本発明にかかる雑音キャンセル回路の例示的な一実施形態であって、単一のマイクロホンを用いる実施形態を示すブロック図1400である。単一のマイクロホン信号1402が、区間検出(VAD)モジュール1404および単一チャネル雑音低減(NR)モジュール1406で受け取られる。区間検出(VAD)モジュール1404は、前記単一マイクロホン信号1402が音声を含んでいるか否かを判定し、単一チャネル雑音低減(NR)モジュール1406に報知する。単一チャネル雑音低減(NR)モジュール1406は、区間検出(VD)モジュール1404からの信号に応答して、前記単一のマイクロホン信号1402の雑音を低減し、所望の発話1408を出力する。

図15は、デュアルマイクロホン1503が取り付けられたヘッドセット1502の図1500である。デュアルマイクロホン1503は、ハウジング内に収容されている。このハウジング内に設けられた個々のマイクロホンは、マイクロホン1504の図およびマイクロホン1506の図で示されている。

図16は、ショートブーム1604を備えるヘッドセット1602の例示的な一実施形態を示す図1600である。ショートブーム1604は、本明細書において前述したゴム製ブーツ内に封入された、単一のマイクロホン1606を収容している。

図17は、ショートブーム1704を備えるヘッドセット1702の例示的な他の実施形態を示す図1700である。ショートブーム1704は、マイクロホン1706aとマイクロホン1706bとで構成されたデュアルマイクロホン1706を収容している。いずれのマイクロホン1706a,1706bも、本明細書において前述したゴム製ブーツ内に封入されている。

図18は、双方向無線機1802,1804の例示的な実施形態を示す図1800である。双方向無線機は、公衆安全、企業用途、産業用途および消費者用途に広く用いられている。

図19は、双方向無線機1902の例示的な他の実施形態を示す図1900である。この双方向無線機は、その下部に1つのマイクロホン1904を備え、その上部に1つのマイクロホン1906を備えている。従来の双方向無線機は、その上部のみにマイクロホンを備えている。本発明の一実施形態では、第2のマイクロホンを双方向無線機1902の下部に設けることにより、主要なマイクロホンを上部に且つ参照用のマイクロホンを下部に配している。ユーザは、当該デバイスの頂部近傍にあるプッシュ−トゥ−トークのボタンまたは類似の構成を利用する。

図20は、双方向無線機2002の例示的なさらなる他の実施形態であって、下部に1つのマイクロホン2004を有し、上部に1つのマイクロホン2006を有する実施形態を示す図2000である。マイクロホン2004,2006は、当該デバイスの筐体の正面と裏面とに設けられたポートに延びる音響延設体(extension)が付いた、双指向性のマイクロホンであり得る。

図21は、双方向無線機2102の例示的なさらなる他の実施形態であって、4つのマイクロホンを有する実施形態を示す図2100である。双方向無線機2102は、下部に2つのマイクロホン2104,2106を有し、上部に2つのマイクロホン2108,2110を有する。すなわち、直前に説明した実施形態において示した、延設体付きの双指向性のマイクロホンを1つずつ、2つの全指向性のマイクロホン(例えば、マイクロホン2104およびマイクロホン2106、マイクロホン2108およびマイクロホン2110など)によって、当該全指向性のマイクロホンが各ポートの位置に配置されるように置き換えうる。4つの全指向性のマイクロホンを用いる構成であれば、占めるスペースが減るので、より小型のデバイスに収めることが可能になる。当該全指向性のマイクロホンは、MEMSマイクロホンであり得る。4つのマイクロホンを用いる構成であれば、さらに、遠くからの音声を記録するうえでより融通が利く。上部の2つのマイクロホンは、遠距離発話用または録画用の単一指向性のビーム(またはビーム状の単一指向性)を電子的に形成できるものとされてもよい。

図22は、マイクロホン2204,2206を備える携帯電話2202の図2200である。従来の手持ち式スマートフォンは、その下部にマイクロホンを備えている。ユーザは、当該デバイスを持ちながら当該デバイスの下部に向かって近くで発話する。これに対し、当該デバイスの筐体の正面と裏面とに、ポートに延びる音響延設体が付いた同一の双指向性のマイクロホンを設けることができる。主要なマイクロホンが携帯電話2202の下部に位置し、参照用のマイクロホンがその上部に位置し得る。

図23は、携帯電話2302の例示的な一実施形態であって、4つのマイクロホンを有する実施形態を示す図2300である。すなわち、上記の延設体付きの双指向性のマイクロホンを1つずつ、2つの全指向性のマイクロホンによって、当該全指向性のマイクロホンが各ポートの位置に配置されるように置き換えうる。4つの全指向性のマイクロホンを用いる構成であれば、より小型のデバイスに収めることが可能となるので、占めるスペースも減る。当該全指向性のマイクロホンは、MEMSマイクロホンであり得る。4つのマイクロホンを用いる構成であれば、さらに、距離が離れている場合においてより融通が利く。上部の2つのマイクロホンは、遠距離発話用または録画用のビーム状の単一指向性を電子的に形成できるものとされてもよい。

本明細書で引用した全ての特許公報、特許出願公開公報および刊行物の関連する内容は、参照をもって全てを本明細書に取り入れたものとする。

本発明を例示的な実施形態を参照しながら具体的に図示・説明したが、その形態及び詳細について、添付の特許請求の範囲に包含される本発明の範囲を逸脱することなく、本発明の範囲内において、様々な変更を施せることは、当業者であれば理解できるであろう。

QQ群二维码
意见反馈