一种用于语言障碍的语音翻译的方法和装置 |
|||||||
申请号 | CN201510330997.1 | 申请日 | 2015-06-15 | 公开(公告)号 | CN106328142A | 公开(公告)日 | 2017-01-11 |
申请人 | 中兴通讯股份有限公司; | 发明人 | 潘春岭; | ||||
摘要 | 本 发明 实施例 公开了一种用于语言障碍的语音翻译的方法和装置,该方法可以包括:对接收到的非正常语音信息按照预设的分隔策略划分为至少一个非正常子语音信息;根据所述非正常子语音信息从预先设置的语音 数据库 中查询得到与所述非正常子语音信息对应的正常子语音信息;将所述正常子语音信息拼接得到与所述非正常语音信息对应的正常语音信息。 | ||||||
权利要求 | 1.一种用于语言障碍的语音翻译的方法,其特征在于,所述方法包括: |
||||||
说明书全文 | 一种用于语言障碍的语音翻译的方法和装置技术领域背景技术[0002] 随着通信技术的不断提高,通信网络覆盖面积地不断延伸,以及通信终端设备的普及,不同国家之间以及不同方言地区之间的通话需求越来越多,为了解决语言差异给通话带来的不便,语音翻译系统已经能够实现不同国家之间以及不同方言地区之间的语言转换,从而使得不同国家之间以及不同方言地区之间的用户能够通过语音翻译系统进行日常的交流。例如:百度翻译能够实现多国语言之间的翻译以及粤语和普通话、文言文和普通话之间的翻译转换。 [0003] 但是,目前所出现的语音翻译系统,仅能够针对正常的语音,比如可以对语音中完整的一句话,一个单词进行翻译;并不能针对非正常语音,比如有语言障碍的用户所发出的语音进行翻译。因此目前现有的语音翻译系统无法应用于语音障碍用户的使用环境,也无法实现语音障碍者与正常人之间的语音交流。 发明内容[0004] 为解决上述技术问题,本发明实施例期望提供一种用于语言障碍的语音翻译的方法和装置,能够将语音障碍者所发出的非正常语音翻译转换为正常语音,从而能够实现语音障碍者与正常人之间的语音交流。 [0005] 本发明的技术方案是这样实现的: [0006] 本发明提供了一种用于语言障碍的语音翻译的方法,所述方法包括: [0007] 对接收到的非正常语音信息按照预设的分隔策略划分为至少一个非正常子语音信息; [0008] 根据所述非正常子语音信息从预先设置的语音数据库中查询得到与所述非正常子语音信息对应的正常子语音信息; [0009] 将所述正常子语音信息拼接得到与所述非正常语音信息对应的正常语音信息。 [0010] 较佳地,所述方法还包括:设置所述语音数据库。 [0011] 较佳地,所述设置所述语音数据库,具体包括: [0012] 确定正常语音样本集;其中,所述正常语音样本集中的正常语音样本在日常语言交流中的覆盖率超过预设的阈值; [0013] 采集所述正常语音样本对应的非正常语音样本,建立非正常语音样本集; [0014] 建立所述正常语音样本集与所述非正常语音样本集之间的对应关系; [0015] 将所述正常语音样本集、所述非正常语音样本集以及所述正常语音样本集与所述非正常语音样本集之间的对应关系存储至语音数据库。 [0016] 较佳地,所述方法还包括: [0017] 根据外界的条件对所述正常语音样本集与所述非正常语音样本集之间的对应关系进行修正和更新。 [0018] 较佳地,在得到所述正常语音信息之后,所述方法还包括: [0019] 对所述非正常语音信息的用途进行判定; [0020] 当所述非正常语音信息用于交流时,将与所述非正常语音信息对应的正常语音信息进行播放; [0021] 当所述非正常语音信息用于终端控制时,获取所述正常语音信息对应的控制指令;所述控制指令用于对终端进行控制。 [0022] 较佳地,所述对所述非正常语音信息的用途进行判定,包括: [0023] 将与所述非正常语音信息对应的正常语音信息与预设的语音控制指令进行比较; [0024] 当所述正常语音信息与所述预设的语音控制指令匹配时,所述非正常语音信息用于终端控制; [0025] 当所述正常语音信息与所述预设的语音控制指令不匹配时,所述非正常语音信息用于交流。 [0026] 本发明又提供了一种用于语言障碍的语音翻译的装置,所述装置包括:接收单元、划分单元、查询单元和拼接单元,其中, [0027] 所述接收单元,用于接收非正常语音信息,并将所述非正常语音信息传输至所述划分单元; [0028] 所述划分单元,用于对所述接收单元接收到的非正常语音信息按照预设的分隔策略划分为至少一个非正常子语音信息; [0029] 所述查询单元,用于根据所述非正常子语音信息从预先设置的语音数据库中查询得到与所述非正常子语音信息对应的正常子语音信息; [0030] 所述拼接单元,用于将所述正常子语音信息拼接得到与所述非正常语音信息对应的正常语音信息。 [0031] 较佳地,所述装置还包括设置单元,用于设置所述语音数据库。 [0032] 较佳地,所述设置单元,包括确定子单元、采集子单元、建立子单元和存储子单元,其中, [0033] 所述确定子单元,用于确定正常语音样本集;其中,所述正常语音样本集中的正常语音样本在日常语言交流中的覆盖率超过预设的阈值; [0034] 所述采集子单元,用于采集所述正常语音样本对应的非正常语音样本,建立非正常语音样本集; [0035] 所述建立子单元,用于建立所述正常语音样本集与所述非正常语音样本集之间的对应关系; [0036] 所述存储子单元,用于将所述正常语音样本集、所述非正常语音样本集以及所述正常语音样本集与所述非正常语音样本集之间的对应关系存储至语音数据库。 [0037] 较佳地,所述装置还包括:更新单元,用于根据外界的条件对所述正常语音样本集与所述非正常语音样本集之间的对应关系进行修正和更新。 [0038] 较佳地,所述装置还包括:判定单元、播放单元和获取单元,其中,[0039] 所述判定单元,用于对所述非正常语音信息的用途进行判定; [0040] 当所述非正常语音信息用于交流时,触发所播放单元; [0041] 当所述非正常语音信息用于终端控制时,触发所述获取单元; [0042] 所述播放单元,用于将与所述非正常语音信息对应的正常语音信息进行播放; [0043] 所述获取单元,用于获取所述正常语音信息对应的控制指令;所述控制指令用于对终端进行控制。 [0044] 较佳地,所述判定单元,具体用于: [0045] 将与所述非正常语音信息对应的正常语音信息与预设的语音控制指令进行比较; [0046] 当所述正常语音信息与所述预设的语音控制指令匹配时,所述非正常语音信息用于终端控制; [0047] 当所述正常语音信息与所述预设的语音控制指令不匹配时,所述非正常语音信息用于交流。 [0049] 本发明实施例提供了一种用于语言障碍的语音翻译的方法和装置,通过将采集到的非正常语音信息通过语音样本库的匹配获取对应的正常语音信息,能够将语音障碍者所发出的语音翻译转换为正常语音,从而能够实现语音障碍者与正常人之间的语音交流。附图说明 [0050] 图1为本发明实施例提供的一种用于语言障碍的语音翻译的方法流程示意图; [0051] 图2为本发明实施例提供的一种用于语言障碍的语音翻译的装置结构示意图; [0052] 图3为本发明实施例提供的另一种用于语言障碍的语音翻译的装置结构示意图; [0053] 图4为本发明实施例提供的又一种用于语言障碍的语音翻译的装置结构示意图。 具体实施方式[0054] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。 [0055] 参见图1,其示出了本发明实施例提供的一种用于语言障碍的语音翻译的方法,该方法可以由语音翻译的装置来执行,该装置可以配置在任何终端上,该方法可以包括: [0056] S101:对接收到的非正常语音信息按照预设的分隔策略划分为至少一个非正常子语音信息; [0057] 需要说明的是,对于语言障碍者来说,无法通过完整句子和词组来表述自身所希望表达的含义,因此,语言障碍者所发出的非正常语音中间会有多次的停顿。本实施例中,优选地,可以将非正常语音信息中的停顿作为一种进行划分的分隔策略。 [0058] S102:根据非正常子语音信息从预先设置的语音数据库中查询得到与非正常子语音信息对应的正常子语音信息; [0059] 示例性地,语音数据库的具体设置过程如下: [0060] 确定正常语音样本集;其中,正常语音样本集中的正常语音样本在日常语言交流中的覆盖率超过预设的阈值; [0061] 采集正常语音样本对应的非正常语音样本,建立非正常语音样本集; [0062] 建立正常语音样本集与非正常语音样本集之间的对应关系; [0063] 将正常语音样本集、非正常语音样本集以及正常语音样本集与非正常语音样本集之间的对应关系存储至语音数据库。 [0064] 比如,预先可以根据《现代汉语常用字表》中所包括的2500个常用字和1000个次常用字遴选出一篇文章,该文章在日常语言交流中的覆盖率达到99.48%,因此,该文章对应的正常语音则为正常语音样本集;该文章中的文字对应的正常语音则为正常语音样本集中的正常语音样本;接着采集语言障碍者对于该文章的非正常语音,通过采集语言障碍者对于该文章中的文字的非正常语音建立非正常语音样本集;可以理解地,对于该文章中的文字来说,既可以对应为正常语音样本集中的正常语音样本,又能够对应为非正常语音样本集中的非正常语音样本。因此,根据文章中的文字,建立正常语音样本集中的正常语音样本与非正常语音样本集中的非正常语音样本之间的对应关系,也就是建立正常语音样本集与非正常语音样本集之间的对应关系。 [0065] 可以理解地,以上两个样本集以及两个样本集之间的对应关系可以存储在语音数据库中,该语音数据库既可以保存在终端上,又可以保存在服务器中以避免更换终端后造成数据库丢失。 [0066] 需要说明的是,正常语音样本集与非正常语音样本集之间的对应关系还可以根据外界的条件进行修正和更新,例如,非正常语音样本的采集并不可能一次成功,需要有个修正和完善的过程,可以加入语言障碍者自己或是家人的干预进行修正;或者,在语言障碍者的语言障碍情况逐渐好转的过程中,同一正常语音样本对应的非正常语音样本会发生改变,因此,对应关系也可以进行相应地更新。 [0067] S103:将正常子语音信息拼接得到与非正常语音信息对应的正常语音信息。 [0068] 示例性地,在得到正常语音信息之后,还可以包括: [0069] 对非正常语音信息的用途进行判定; [0070] 当非正常语音信息用于交流时,将与非正常语音信息对应的正常语音信息进行播放; [0071] 当非正常语音信息用于终端控制时,获取正常语音信息对应的控制指令;该控制指令用于对终端进行控制。 [0072] 可以理解地,目前终端均能够支持语音操作,因此,对于语言障碍者来说,所发出的非正常语音信息除了用于日常的交流以外,还可能是用于对终端进行控制操作,因此,当通过步骤S101至步骤S103将非正常语音信息翻译转换为正常语音信息之后,还需要对非正常语音信息的用途进行判定;具体的判定过程可以是:将与非正常语音信息对应的正常语音信息与预设的语音控制指令进行比较;当正常语音信息与预设的语音控制指令匹配时,非正常语音信息用于终端控制;当正常语音信息与预设的语音控制指令不匹配时,非正常语音信息用于交流。 [0073] 本实施例提供了一种语音翻译的方法,通过将采集到的非正常语音信息通过语音样本库的匹配获取对应的正常语音信息,能够将语音障碍者所发出的语音翻译转换为正常语音,从而能够实现语音障碍者与正常人之间的语音交流。 [0074] 基于前述实施例相同的技术构思,参见图2,其示出了本发明实施例提供的一种用于语言障碍的语音翻译的装置20,该装置20可以包括:接收单元201、划分单元202、查询单元203和拼接单元204,其中, [0075] 接收单元201,用于接收非正常语音信息,并将非正常语音信息传输至划分单元202; [0076] 划分单元202,用于对接收单元201接收到的非正常语音信息按照预设的分隔策略划分为至少一个非正常子语音信息; [0077] 查询单元203,用于根据非正常子语音信息从预先设置的语音数据库中查询得到与非正常子语音信息对应的正常子语音信息; [0078] 拼接单元204,用于将正常子语音信息拼接得到与非正常语音信息对应的正常语音信息。 [0079] 示例性地,参见图3,装置20还包括设置单元205,用于设置语音数据库。 [0080] 进一步地,参见图3,设置单元205,包括:确定子单元2051、采集子单元2052、建立子单元2053和存储子单元2054,其中, [0081] 确定子单元2051,用于确定正常语音样本集;其中,正常语音样本集中的正常语音样本在日常语言交流中的覆盖率超过预设的阈值; [0082] 采集子单元2052,用于采集正常语音样本对应的非正常语音样本,建立非正常语音样本集; [0083] 建立子单元2053,用于建立正常语音样本集与非正常语音样本集之间的对应关系; [0084] 存储子单元2054,用于将正常语音样本集、非正常语音样本集以及正常语音样本集与非正常语音样本集之间的对应关系存储至语音数据库。 [0085] 进一步地,参见图3,装置20还可以包括:更新单元206,用于根据外界的条件对正常语音样本集与非正常语音样本集之间的对应关系进行修正和更新。 [0086] 示例性地,参见图4,装置20还可以包括:判定单元207、播放单元208和获取单元209,其中, [0087] 判定单元207,用于对非正常语音信息的用途进行判定; [0088] 当非正常语音信息用于交流时,触发所播放单元208; [0089] 当非正常语音信息用于终端控制时,触发获取单元209; [0090] 播放单元208,用于将与非正常语音信息对应的正常语音信息进行播放; [0091] 获取单元209,用于获取正常语音信息对应的控制指令;控制指令用于对终端进行控制。 [0092] 进一步地,判定单元207,具体用于: [0093] 将与非正常语音信息对应的正常语音信息与预设的语音控制指令进行比较;以及, [0094] 当正常语音信息与预设的语音控制指令匹配时,非正常语音信息用于终端控制;以及, [0095] 当正常语音信息与预设的语音控制指令不匹配时,非正常语音信息用于交流。 [0096] 本实施例提供了一种语音翻译的装置,通过将采集到的非正常语音信息通过语音样本库的匹配获取对应的正常语音信息,能够将语音障碍者所发出的语音翻译转换为正常语音,从而能够实现语音障碍者与正常人之间的语音交流。 [0097] 基于前述实施例相同的技术构思,本发明实施例提供了一种终端,该终端包括上述实施例中任一所述的用于语言障碍的语音翻译的装置。 [0098] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。 [0099] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。 [0100] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。 [0101] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。 [0102] 以上,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。 |