专利汇可以提供Retrieval device and method therefor专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To supply a foreign language retrieval device which can retrieve a word even if a part of pronunciation is lost or changed.
SOLUTION: A retrieval device is constituted of a characteristic pronunciation extraction rule table 7 for extracting a characteristic phoneme from KANA (Japanese syllabary), a pronunciation conversion table 8 for storing a conversion rule from the Japanese phoneme to the phoneme of a foreign language and a dictionary file 9 for storing a group of spellings of the foreign language and phonetic symbols. The device is further provided with an input means 1, a characteristic phonetic sign generation means 2 for deleting a prolonged sound '-' and a doubled consonant from the foreign language of inputted KANA notation and extracting only the characteristic phoneme in one character unit, a foreign language phonetic sign generation means 3 for substituting the respective phonemes of the characteristic phonetic sign for the corresponding phoneme of the foreign language, a foreign language phonetic sign generation means 4 with wild card, which inserts the wild card into the head/end of the foreign language phonetic sign and between the respective phonemes, a foreign language retrieval means 5 for retrieving the spelling of the foreign language having a phonetic sign matched with the phonetic sign having the wild card and an output means 6.
COPYRIGHT: (C)1999,JPO,下面是Retrieval device and method therefor专利的具体信息内容。
【0001】
【発明の属する技術分野】本発明は、検索装置及び検索方法に関し、特に外国語の発音の全体または一部をカナ表記で入力することにより、該当する外国語を検索する検索装置及び検索方法に関する。
【0002】
【従来の技術】従来から、カナ表記の発音から外国語を検索する外国語検索装置が知られているが、従来のこの種の装置では、検索したい外国語の発音の全体を入力する必要があった。
【0003】しかしながら、外国語の発音は前後の単語の発音や話される速さによって発音の一部が欠落したり、変化したりすることがあり、さらに聞き取りが苦手な日本人が外国語を聞いた場合には発音を一部聞き落としたり、聞き間違えたりすることもある。
【0004】このため、検索したい外国語の発音の全体を入力しなければ検索できない従来の外国語検索装置では、例えば耳で聞いた発音から該当する外国語を検索したい場合において、利用者が耳で聞いたとおりの発音を入力しても目的とする外国語を検索できないことがあるという問題があった。
【0005】発音の部分的なゆらぎを考慮したシステムとしては、例えば特開平8−339376号公報において提案されている情報検索システムがある。
【0006】このシステムでは、入力されたカタカナ表記の発音とデータベースに登録されているカタカナ単語とを比較して該当する外国語単語を検索する際に、文字毎の類似度を計算し、算出された文字毎の類似度から単語類似度を算出し、既定値以上の単語類似度を持つカタカナ単語に対する外国語単語を検索結果として出力するようになっている。 このため、例えば英単語「libr
ary」を検索する場合に、「ライブラリ」と「ライブレリ」のどちらの発音表記でも検索を行っても求める結果を得ることができる。
【0007】しかしながら、かかる情報検索システムの類似度算出方法では、発音が一部欠落している場合には検索を正しく行なうことができなくなるという問題がある。 例えば、英単語「identification」
を検索する楊合、「アイデンティフィケーション」と表記すれば検索は可能であるが、先頭の「アイ」を聞き落とし、「identi−」の「t」の発音が欠落した「デネフィケーション」ではもとの「identifi
cation」を検索することはできない。
【0008】
【発明が解決しようとする課題】上述したように、従来の外国語検索装置では、検索したい外国語の発音の全体を入力する必要があり、発音の一部が欠落したり、変化したりしている場合には検索することができず、このため聞き取りが苦手な日本人にとって不便であるという問題がある。
【0009】また、発音の部分的なゆらぎを考慮した情報検索システムの類似度算出方法も提案されているが、
この方法を用いる場合にも、発音が一部欠落している場合には検索を正しく行なうことができなくなるという問題がある。
【0010】本発明は、かかる従来の問題を解消すべくなされたもので、欠落・変化・聞き落とし・聞き間違いを含む発音のカナ表記を入力した場合でも、意図する外国語を検索することができる外国語検索装置を提供することを目的とする。
【0011】
【課題を解決するための手段】この目的を達成するために、請求項1記載の検索装置は、音声を入力するための手段と、前記入力された音声に適応的に音素を補う手段と、前記音素を補われた音声に対応する綴りを検索する手段とを具備する。
【0012】請求項2記載の検索装置は、音声を入力するための手段と、前記入力された音声から第1の音素を抽出する手段と、前記抽出された第1の音素を対応する第2の音素に変換し、この第2の音素と変数記号とを組み合わせて変数記号付発音記号を求める手段と、前記求められた変数記号付発音記号に適合する綴りを発音記号と綴りとを対応させて記録させた記録部から検索する検索手段とを具備する。 請求項3記載の検索装置は、請求項2記載の検索装置において、前記検索手段により検索された綴りの数をカウントし、このカウントされた数が所定値を越えたときには前記検索手段の処理を中断させる手段をさらに具備する。
【0013】請求項4記載の検索装置は、音声を入力するための手段と、前記入力された音声に適応的に音素を補う手段と、前記音素を補われた音声に対応する綴りを画面に表示する手段とを具備する。
【0014】請求項5記載の検索方法は、音声を入力するためのステップと、前記入力された音声に適応的に音素を補うステップと、前記音素を補われた音声に対応する綴りを検索するステップとを具備する。
【0015】請求項6記載の検索方法は、検索の対象の音声を入力するためのステップと、前記入力された音声から第1の音素を抽出するステップと、前記抽出された第1の音素を対応する第2の音素に変換し、この第2の音素と変数記号とを組み合わせて変数記号付発音記号を求めるステップと、前記求められた変数記号付発音記号に適合する綴りを発音記号と綴りとを対応させて記録させた記録部から検索するステップとを具備する。
【0016】外国語検索装置は、入力手段からカナ表記の外国語を入力すると、特徴発音記号作成手段は、特徴発音抽出規則テーブルを用いて入力されたカナ表記の外国語から長音記号「ー」と促音記号「っ」を削除して1
文字単位の特徴的な音素のみを抽出して特徴発音記号を作成する。
【0017】外国語発音記号作成手段は、発音変換テーブルを用いて特徴発音記号の各音素を対応する外国語の音素に置換して外国語発音記号を作成し、ワイルドカードつき外国語発音記号作成手段は外国語発音記号の先頭、末尾及び各音素の間にワイルドカード記号を挿入してワイルドカードつき外国語発音記号を作成する。
【0018】そして、外国語検索手段は、辞書ファイルを用いてワイルドカードつき外国語発音記号にマッチする外国語発音記号を持つ外国語の綴りを検索し、出力手段により、この外国語の綴りを直接又は対応するメッセージとして出力する。
【0019】外国語検索手段により検索された外国語の数が非常に多くなることが予想される場合には、外国語検索数制限手段により外国語検索手段により検索された外国語の数をカウントさせ、カウントされた数が予め設定したしきい値を越えたとき外国語検索手段の処理を中断させる。
【0020】
【発明の実施の形態】以下、本発明の実施の形態を図面を用いて説明する。
【0021】図1は本発明の一実施形態に係る外国語検索装置の構成を示すブロック図、図2はこの外国語検索装置の動作を説明するためのフローチャート、図3はこの外国語検索装置の動作を説明するための概念図である。
【0022】なお、図3で用いている正規表現の記号の意味は次のとおりである。
【0023】・*:ワイルドカード記号(0個以上の任意の個数の文字にマッチする)。 ・(A|B):AまたはBとマッチする。
【0024】また、この外国語検索装置は、変換対象が英語の場合についてのものである。 この外国語検索装置は、カナ入力部1と、特徴発音抽出部2と、発音変換部3と、ワイルドカード挿入部4と、検索処理部5と、検索結果出力部6と、特徴発音抽出規則テーブル7と、発音変換テーブル8と、辞書ファイル9から構成されている。
【0025】カナ入力部1は、検索したい外国語を入力する機能を有するように構成され、例えばキーボード、
マウス、音声入力装置などによって実現される。
【0026】特徴発音抽出部2は、カナ入力部1に入力された外国語から特徴発音抽出規則テーブル7を用いて特徴発音を抽出する機能を有するように構成される。
【0027】発音変換部3は、特徴発音抽出部2で抽出された特徴発音を発音変換テーブル8を用いて外国語発音記号に変換する機能を有するように構成される。
【0028】ワイルドカード挿入部4は、発音変換部3
で変換された外国語発音記号の各音素間にワイルドカードを挿入する機能を有するように構成される。
【0029】検索処理部5は、ワイルドカード挿入部4
でワイルドカードを挿入された外国語発音記号にマッチする外国語の綴りを辞書ファイル9から取り出す機能を有するように構成される。
【0030】検索結果出力部6は、検索処理部5の検索結果を出力する機能を有するように構成され、例えばディスプレイ、プリンタなどによって実現される。
【0031】特徴発音抽出規則テーブル7は、例えば図3のテーブル309のように構成されており、それぞれのカナ文字の発音を特徴づけている音素を容易に求めることができるようになっている。 一般に外国語をカナ表記した場合には子音に付随する母音は定まりにくいので、カ行以下のカナ文字については子音の部分が特徴的音素とされている。
【0032】発音変換テーブル8は、例えば図3のテーブル310のように構成されており、それぞれの日本語音素に対応する外国語音素を容易に求めることができるようになっている。 なお、例えば英語の「s」と「t
h」の音は、日本語の発音で表記する場含どちらも「ス」になってしまうように、日本語の音素に対応する外国語の音素は複数存在することがある。 このため、外国語音素が正規表現で書かれることもある。 前述の例では、日本語の音素「s」には外国語の音素として正規表現(s|θ)が対応する。 同様に日本語の音素「N」には外国語の音素として(n|m)が対応する。
【0033】辞書フアイル9は、例えば図3のファイル311のように構成されており、外国語の綴りが当該外国語の発音記号と組になって格納されている。 各組は発音記号の長さをキーとして昇順にソートしてある。
【0034】次に図1、図2及び図3に基づいてこの外国語検索装置の動作を説明する。
【0035】「identification」を「デネフィケーション」と誤って認識した利用者はカナ入力部1より、カナ表記の発音「デネフィケーション」を入力する(ステップ201,301)。
【0036】入力されたカナを受け取った特徴発音抽出部2は、特徴発音抽出規則テーブル7に格納されている抽出規則に従ってこのカナ「デネフィケーション」から特徴発音を抽出し、特徴発音記号「d,n,f,k,s
h,N」を作成する(ステップ202,302,30
3)。 この際、長音記号「一」及び促音「っ」は削除される。
【0037】作成された特徴発音記号「d,n,f,
k,sh,N」を受け取った発音変換部3は、発音変換テーブル8に格納されている変換規則に従って特徴発音記号を外国語発音記号
【数1】
に変換する(ステップ203,304,305)。 【0038】変換された外国語発音記号を受け取ったワイルドカード挿入部4は、外国語発音記号の先頭、末尾及び各音素の間にワイルドカード記号「*」を挿入し、
ワイルドカードつき外国語発音記号
【数2】
を作成する(ステップ204,306)。 ただし、図3
で括弧でくくられた部分は1つの音素のように扱うことにする。 すなわち、括弧の中にはワイルドカード記号を挿入しない。
【0039】作成されたワイルドカードつき外国語発音記号を受け取った検索処理部5は、辞書ファイル9から外国語の綴りと当該外国語の発音記号の組を先頭から順次取り出し(ステップ205,307)、取り出した外国語の発音記号が前記ワイルドカードつき外国語発音記号とマッチするかどうかを調べる(ステップ206、3
07)。
【0040】マッチした場合、当該発音記号を持つ外国語の綴り「identification」を検索結果出力部6より出力する(ステップ207、308)。
【0041】以上の処理を、辞書ファイル9に格納されている総ての外国語について行なう(ステップ20
9)。 なお、場合によってはマッチする外国語の個数が膨大になるため、あるしきい値を設けておき、しきい値より多くの外国語かマッチした場合、それまでにマッチした外国語だけを得られた結果とし、処理を中断する(ステップ208)。 総ての発音記号を辞書ファイル9
から取り出し終えると処理を終了する。
【0042】このように本発明の一実施形態に係る外国語検索装置によれば、ワイルドカード付発音記号に合うものを辞書ファイルから検索するので、不完全な発音からも意図する外国語を検索することができる。
【0043】なお、本発明は、上述した実施形態には限定されず、本発明の技術思想の範囲内で様々な変形が可能である。
【0044】例えば、上述した実施形態では、本発明を具現化する対象として外国語検索装置を例にとり説明したが、上述した実施形態を外国語検索としてとらえることも可能である。
【0045】また、検索結果は、外国語をそのまま出力させずに、対応する他のメッセージの形式で出力させるようにしてもよい。
【0046】以上の実施例では、変換対象として英語を考えたが、これに限られることはなく、他の外国語でも特徴発音抽出テーブル7と発音変換テーブル8と辞書ファイル9のデータを変換することにより同様の効果を得ることができる。
【0047】また、入力したカナ表記に誤りがない場合に対応する外国語の検索が誤りなく行われることはもちろんである。
【0048】
【発明の効果】以上説明したように、本発明の外国語検索装置においては、利用者が検索したい単語の正しい発音を知っている必要はなく、欠落・変化・聞き落とし・
聞き間違いがあるような不完全な発音からも意図する外国語を検索することができる。
【図1】本発明の一実施形態に係る外国語検索装置の構成を示すブロック図である。
【図2】本外国語検索装置の動作を示すフローチャートである。
【図3】本外国語検索装置の動作を説明するための概念図である。
1……カナ入力部 2……特徴発音抽出部 3……発音変換部 4……ワイルドカード挿入部 5……検索処理部 6……検索結果出力部 7……特徴発音抽出規則テーブル 8……発音変換テーブル 9……辞書ファイル
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl. 6識別記号 FI G06F 15/40 370J 15/403 310Z
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种在线日志解析方法、系统及其电子终端设备 | 2020-05-11 | 581 |
一种基于私有云的骚扰电话拦截方法 | 2020-05-12 | 536 |
一种加密文件的检索方法、系统、终端设备及存储介质 | 2020-05-12 | 410 |
一种基于可视化流程图的智能问答多轮交互方法和系统 | 2020-05-12 | 943 |
一种可自定义的dex分包的方法 | 2020-05-12 | 841 |
日志异常检测方法 | 2020-05-13 | 440 |
用于双向链接的区块链的哈希值 | 2020-05-15 | 37 |
一种工作流中条件配置的方法和装置 | 2020-05-15 | 778 |
一种终端设备存储器件过度编程快速定位方法 | 2020-05-12 | 650 |
一种基于代码注释自动生成开发文档的方法及系统 | 2020-05-12 | 814 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。