序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
161 Method and system for generating suppression standard pattern of speaker recognition, namely, cohort and speaker collating device including the same system JP4010297 1997-02-07 JPH10222189A 1998-08-21 YAMADA EIKO; HATTORI HIROAKI
PROBLEM TO BE SOLVED: To provide a method for generating a suppression standard pattern with uses adaptation and a speaker collating device. SOLUTION: An input speech is sent to an analysis part 10 and converted into feature vectors by the analysis part 10. The feature vectors analyzed by the analysis part 10 are sent to a suppression speaker selection part 40 and a feature vector storage part 30. The suppression speaker selection part 40 calculates the similarity between a standard pattern stored in the suppression speaker standard pattern storage part 20 and the feature vector of an object person sent from a feature vector storage part 30 to select a suppression speaker. The standard pattern of the selected suppression speaker is sent to an estimation part 50. The estimation part 50 finds a mapping function from the feature vector space of the suppression speaker to the feature vector space of the object person based on the standard pattern sent from the suppression speaker selection part and the feature vector of the object person sent from the feature vector storage part 30. The found mapping function is sent to an adaptation part 60. The adaptation part 60 uses the mapping function sent from the estimation part 50 to adapt the suppression standard pattern selected by the suppression speaker selection part 40. The adapted suppression standard pattern is an output.
162 音声データを使用して操作を開始するための方法および装置 JP2018518633 2016-10-13 JP2018536889A 2018-12-13 スー,ミンキアン; ヤン,ジージエ; ガオ,ジエ; チュー,ミン
音声を使用して操作を開始するための方法が提供される。該方法は、使用段階で検出された第1のオーディオデータに基づいて1つまたは複数の音声特徴を抽出するステップと、1つまたは複数の音声特徴に従って第1のオーディオデータと事前設定の第1の音声モデルとの間の類似度を判定するステップであって、第1の音声モデルはユーザの第2のオーディオデータに関連付けられ、第2のオーディオデータは1つまたは複数の事前選択の音声コンテンツに関連付けられる、判定ステップと、類似度に基づいて第1の音声モデルに対応する操作を実行するステップとを含む。
【選択図】図1
163 動画撮影方法及びその装置、プログラム、及び記憶媒体 JP2017531938 2015-09-22 JP6405470B2 2018-10-17 傅 ▲強▼; 王 ▲陽▼; 侯 恩星
164 声紋認証方法および装置 JP2015218244 2015-11-06 JP6344696B2 2018-06-20 リ、チャオ; グアン、ヨン
165 音声データを処理するための方法及び装置 JP2017109505 2017-06-01 JP2018081297A 2018-05-24 イェ ツァン; ポン イーユィ
【課題】ユーザの登録声紋ベクトルの正確性を向上させる方法及び装置を提供する。
【解決手段】ユーザ端末から送信された音声データを受信するステップ201と、音声データにおける声紋特徴ベクトルを抽出するステップ202と、声紋特徴ベクトルと予め記憶したユーザの登録声紋ベクトルとをマッチングし、声紋特徴ベクトルと登録声紋ベクトルとのマッチング度を生成するステップ203と、マッチング度が予め設定した更新閾値以上であるかどうかを決定するステップ204と、マッチング度が予め設定した更新閾値以上であると決定したことに応答して、声紋特徴ベクトルと音声データとによって登録声紋ベクトルを更新するステップ205と、を含む。
【選択図】図2
166 動的パスワード音声に基づいた自己学習機能を有する身分認証システム及び方法 JP2017539339 2015-07-08 JP2018509649A 2018-04-05 ▲鄭▼方; ▲ウー▼▲シャオ▼▲鈞▼; 李▲藍▼天; 王▲剛▼; 王小▲鋼▼; ▲劉▼▲楽▼
動的パスワード音声に基づいた自己学習機能を有する身分認証システム及び方法は、時間をラベルとして各ユーザの音声データを蓄積する時変データ蓄積手段と、最新の音声データを時変データ蓄積手段に蓄積する時変データ更新モジュール(23)と、時間ラベル順に従って時変データ蓄積手段から音声データを抽出し、複数のグループの音声データを含む時間窓パイプを構築し更新する時間窓パイプ構築モジュール(24)と、更新された時間窓パイプに含まれている複数のグループの音声データを使用して、ユーザ声紋モデルを再構築する声紋モデル再構築モジュール(25)とを備える。【選択図】図1
167 アプリケーションへのアクセスを制御するための方法および装置 JP2016542025 2014-09-05 JP6306190B2 2018-04-04 ユン、スングラック; キム、テス; チョ、ジュン−チョル; パク、ミン−キュ; ホワン、キュ・ウォン
168 動的に生成された句を使用するセグメントベースの話者検証 JP2017233255 2017-12-05 JP2018036675A 2018-03-08 ドミニク・ロブレック; マシュー・シャリフィ
【課題】ユーザの身元を検証するための、コンピュータ記憶媒体上に符号化されたコンピュータプログラムを含む方法、システム、および装置。
【解決手段】方法、システム、および装置は、ユーザの身元を検証するための検証句を求める要求を受信するアクションを含む。さらなるアクションは、ユーザの身元を検証するための検証句を求める要求を受信することに応答して、検証句に含められるべき部分語を識別すること、および検証句に含められるべき部分語を識別することに応答して、識別された部分語のうちの少なくともいくつかを含む候補句を検証句として獲得することを含む。さらなるアクションは、その検証句を、ユーザの身元を検証するための検証句を求める要求に対する応答として提供することを含む。
【選択図】図1
169 動的に生成された句を使用するセグメントベースの話者検証 JP2016208468 2016-10-25 JP6258438B2 2018-01-10 ドミニク・ロブレック; マシュー・シャリフィ
170 声紋情報管理方法および声紋情報管理装置、ならびに本人認証方法および本人認証システム JP2017518071 2015-09-30 JP2017534905A 2017-11-24 ション,ジアン
本出願は、声紋情報管理方法および声紋情報管理装置、ならびに本人認証方法および本人認証システムに関し、関連するシステムに格納された履歴音声ファイルをフィルタリングして、第1のユーザの音声情報を取得するステップと、テキスト認識処理を用いて、その音声情報に対応するテキスト情報を取得するステップと、音声情報および対応するテキスト情報を、第1のユーザの参照声紋情報に編集するステップと、を含んでいる。参照声紋情報中のテキスト情報および音声情報はいずれも、関連するシステムによって予め設定されたものではなく、すなわち開示されたものではなく、上述の履歴音声ファイルに基づいて取得されるので、いかなるユーザも、本人認証を実行する際に再度読み上げる必要があるテキスト情報の具体的な内容を予測し得ないことにより、対応する音声ファイルを前もって記録することができないようにすることで、前もって記録された音声ファイルを再生して首尾よく認証目的を達成することもできないようにしている。したがって、本人認証が本出願の諸実施形態によって提供される声紋情報管理方法に基づいて実行されることにより、認証結果がさらに正確になり、潜在的なセキュリティ上の危険が存在せず、アカウントのセキュリティが高くなる。
171 話者認識方法及び話者認識装置 JP2017064889 2017-03-29 JP2017187768A 2017-10-12 シ・ズチアン; リィウ・リィウ; リィウ・ルゥジエ
【課題】話者認識方法及び話者認識装置を提供する。
【解決手段】話者認識方法は、認識すべき話者のコーパスから、認識すべき話者の音声特徴を抽出するステップと、抽出された認識すべき話者の音声特徴、音声特徴の特徴空間における分布を示すUBM、音声特徴の特徴空間における分布の変化の統計値を示すGUSM及び環境変化を示す総体的変化行列に基づいて、認識すべき話者のモデルを取得するステップと、認識すべき話者のモデルと既知話者のモデルとを比較し、認識すべき話者が既知話者の1つであるか否かを決定するステップとを含む。
【選択図】図1
172 動的に生成された句を使用するセグメントベースの話者検証 JP2016551220 2015-03-27 JP6208375B2 2017-10-04 ドミニク・ロブレック; マシュー・シャリフィ
173 人工ニューラル・ネットワーク・ベースのサブ音素単位区別を用いた話者照合および同定 JP2015552632 2013-12-05 JP6158348B2 2017-07-05 ホーソン、ジョン−ポール; バーミューレン、ピーター・ジェイ.; シャウ、ジョナサン
174 発話者の検証のための動的な閾値 JP2016151822 2016-08-02 JP2017068243A 2017-04-06 ジェイコブ・ニコラウス・フォースター; ディエゴ・メレンド・カサド
【課題】発話者の検証に関する方法、装置、コンピュータプログラムを提供する。
【解決手段】ホットワードの複数の発話の各々に関して、少なくとも発話者検証信頼性スコアおよび周囲状況データを含むデータセットを受け取る行為を含む。行為は、特定の周囲の状況に関連するデータセットのサブセットをデータセットの中から選択することをさらに含む。行為は、1つまたは複数の選択基準に基づいてデータセットのサブセットの中から特定のデータセットを選択することをさらに含む。行為は、発話者検証信頼性スコアを、特定の周囲の状況のための発話者検証閾値として選択することをさらに含む。行為は、特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための発話者検証閾値を提供することをさらに含む。
【選択図】図1
175 動的に生成された句を使用するセグメントベースの話者検証 JP2016208468 2016-10-25 JP2017058689A 2017-03-23 ドミニク・ロブレック; マシュー・シャリフィ
【課題】ユーザの身元を検証するための、コンピュータ記憶媒体上に符号化されたコンピュータプログラムを含む方法、システム、および装置。
【解決手段】方法、システム、および装置は、ユーザの身元を検証するための検証句を求める要求を受信するアクションを含む。さらなるアクションは、ユーザの身元を検証するための検証句を求める要求を受信することに応答して、検証句に含められるべき部分語を識別すること、および検証句に含められるべき部分語を識別することに応答して、識別された部分語のうちの少なくともいくつかを含む候補句を検証句として獲得することを含む。さらなるアクションは、その検証句を、ユーザの身元を検証するための検証句を求める要求に対する応答として提供することを含む。
【選択図】図1
176 発話者の検証のための動的な閾値 JP2016549233 2015-05-01 JP2017507352A 2017-03-16 ジェイコブ・ニコラウス・フォースター; ディエゴ・メレンド・カサド
発話者の検証のための動的な閾値のための、コンピュータストレージ媒体に符号化されたコンピュータプログラムを含む方法、システム、および装置が、開示される。一態様においては、方法が、ホットワードの複数の発話の各々に関して、少なくとも発話者検証信頼性スコアおよび周囲状況データを含むデータセットを受け取る行為を含む。行為は、特定の周囲の状況に関連するデータセットのサブセットをデータセットの中から選択することをさらに含む。行為は、1つまたは複数の選択基準に基づいてデータセットのサブセットの中から特定のデータセットを選択することをさらに含む。行為は、発話者検証信頼性スコアを、特定の周囲の状況のための発話者検証閾値として選択することをさらに含む。行為は、特定の周囲の状況に関連する発話の発話者の検証を実行する際に使用するための発話者検証閾値を提供することをさらに含む。
177 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 JP2015113949 2015-06-04 JP6084654B2 2017-02-22 畠山 泰貴
178 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 JP2015113949 2015-06-04 JP2017003611A 2017-01-05 畠山 泰貴
【課題】学習をユーザに意識させることなく話者識別ができるシステムを提供する。
【解決手段】音声認識システムは、端末300とサーバ350とを備える。端末300は、音声の入を受け付ける音声入力部31と、音声を出力する音声出力部32とを備える。サーバ350は、その動作を制御する制御部30と、当該信号と端末300に保存されているデータとに基づいて話者を識別する話者識別部33と、話者識別部33により識別された話者の情報(ユーザID等)を用いて、話者毎のデータ(ユーザプロファイル)を作成する話者識別学習部34と、端末300のユーザ情報を保存するユーザ管理部35と、音声認識処理を実行する音声認識部36と、音声認識の結果に基づいて端末300に対するメッセージを分析し、当該分析の結果に応じて、当該メッセージに応じた応答を生成する対話分析・生成部37とを備える。
【選択図】図3
179 話者識別方法及び話者識別装置 JP2016079449 2016-04-12 JP2016206660A 2016-12-08 辻川 美沙貴; 松井 知子
【課題】識別対象である話者の話者モデルが作成されていない場合であっても、より高い精度で話者を識別する。
【解決手段】第1の類似度算出部14は、複数の第1の話者のそれぞれの音声信号における特徴量と、複数の不特定話者の複数の不特定話者モデルにおける各特徴量との第1の類似度をそれぞれ算出し、モデル特定部15は、第1の類似度が所定の値以上である複数の不特定話者モデルを特定し、第2の話者モデル格納部16は、複数の第1の話者のそれぞれと、特定された複数の不特定話者モデルとを対応付けて記憶し、第2の類似度算出部18は、第2の話者の音声信号における特徴量と、第2の話者モデル格納部16に記憶されており、第1の話者に対応付けられている複数の不特定話者モデルにおける各特徴量との複数の第2の類似度を複数の第1の話者毎にそれぞれ算出し、話者識別部19は、複数の第2の類似度に基づいて、第2の話者に対応する複数の第1の話者の中の一人を特定する。
【選択図】図1
180 声紋特徴モデルを更新するための方法及び端末 JP2015509296 2013-07-08 JP5996783B2 2016-09-21 ▲盧▼ ▲ティン▼
QQ群二维码
意见反馈