首页 / 专利库 / 广播 / 音频信号 / 语音信号 / 基于语音识别的设备控制方法

基于语音识别的设备控制方法

阅读:928发布:2020-05-08

专利汇可以提供基于语音识别的设备控制方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于 语音识别 的设备控制方法,通过将采集到的外部语音 信号 与先前已经存储到设备内的预设标准语音控制指令 数据库 做匹配,一旦采集的外部 语音信号 与任一预设标准语音控制指令匹配一致,则设备执行该任一预设标准语音控制指令所对应的动作,并且还通过令设备针对用户语音执行 自学习 ,从而得到符合用户个性化特点的语音特征参数集,避免了设备难以将用户发音时的方言与预设标准语音控制指令匹配准确度不高的问题,由此使得该设备后续一旦再次采集到同样具有该语音特征参数集的语音时,设备就可以准确地识别出用户的个性化语音,提高了设备对用户语音的识别准确率以及设备对用户语音控制的交互响应效率。,下面是基于语音识别的设备控制方法专利的具体信息内容。

1.基于语音识别的设备控制方法,其特征在于,包括如下步骤1至步骤4:
步骤1,构建控制设备执行动作的预设标准语音控制指令数据库;其中,所述预设标准语音控制指令数据库内存储有与设备所执行动作相对应的预设标准语音;
步骤2,检测、获取设备外的外部语音信号,并对该外部语音信号做预处理;
步骤3,将所述预处理后的外部语音信号与所述预设标准语音控制指令数据库做匹配判断处理:
当所述预处理后的外部语音信号与所述预设标准语音控制指令数据库内的任一预设标准语音匹配一致时,将该预设标准语音作为外部语音控制指令,转入步骤4;否则,转入步骤2;
步骤4,命令设备执行与所述外部语音控制指令相对应的动作。
2.根据权利要求1所述基于语音识别的设备控制方法,其特征在于,在步骤2中,针对所述外部语音信号的预处理过程包括如下步骤2-1至步骤2-4:
步骤2-1,针对所述外部语音信号做端点检测,获取所述外部语音信号中的用户语音信号和外部噪声信号;
步骤2-2,消除所述外部语音信号中的外部噪声信号,得到消噪处理后的用户语音信号;
步骤2-3,按照预设的语音特征参数,提取所述用户语音信号中的语音特征参数集合;
步骤2-4,将提取的所述语音特征参数集合作为针对所述外部语音信号的预处理结果。
3.根据权利要求2所述基于语音识别的设备控制方法,其特征在于,在步骤2-1中,所述外部语音信号中的用户语音信号和外部噪声信号获取过程如下步骤a1至步骤a3:
步骤a1,构建融合有用户语音信号和外部噪声信号的语音模型;其中,所述语音模型如下:
其中,xk是所选取信号的子带能量;z=0时,代表所选取信号为外部噪声信号;z=1时,代表所选取信号为用户语音信号;rk是包括参数μz和参数σ2的参数集合;μz表示信号z振幅的均值,σ2表示信号z的能量;p(xk|z,rk)表示所选取信号为z的概率;
步骤a2,根据构建的所述语音模型,计算所述外部语音信号内的信号分别为用户语音信号的概率和外部噪声信号的概率;
步骤a3,根据步骤a2所得概率结果,利用假设检验方法确定所述外部语音信号的信号类型;其中所述信号类型为用户语音信号或者外部噪声信号。
4.根据权利要求3所述基于语音识别的设备控制方法,其特征在于,在步骤a3中,所述外部语音信号中的用户语音信号和外部噪声信号的信号类型确定过程包括如下步骤b1至步骤b7:
步骤b1,利用启动步骤3前的第一预设数的信号特征数据构建噪声模型;
步骤b2,利用启动步骤3前的第二预设帧数的信号强度计算归一化频谱差值;
步骤b3,根据构建的所述噪声模型以及所得归一化频谱差值,采用概率密度函数计算出每帧信号内的信噪比以及区分出用户语音信号和外部噪声信号;
步骤b4,根据所得每帧信号内的信噪比,使用维纳滤波器在频域内消除所述外部语音信号中的外部噪声信号;
步骤b5,计算所述外部语音信号在消噪前后所对应的消噪前后能量比以及所述外部语音信号在消噪前后所对应的消噪前后信噪似然比;
步骤b6,利用所述消噪前后能量比和所述消噪前后信噪似然比,对消除噪声后的所述外部语音信号做修复调整;
步骤b7,将修复调整后的所述外部语音信号作为用户语音信号输出。
5.根据权利要求1所述基于语音识别的设备控制方法,其特征在于,在步骤4成功执行完毕后还包括:步骤5,设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作。
6.根据权利要求5所述基于语音识别的设备控制方法,其特征在于,所述设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作的过程包括如下步骤c1至步骤c5:
步骤c1,将与所述任一预设标准语音数据匹配一致的所述外部语音信号作为设备的待学习语音指令;
步骤c2,获取用户再次发出的与该待学习语音指令内容相同的多次用户语音控制指令;
步骤c3,按照同样的语音特征参数提取方法,分别提取所述待学习语音指令的待学习语音特征参数集以及所述各次用户语音控制指令的用户语音特征参数集;
步骤c4,根据提取的所述待学习语音特征参数集和各次用户语音特征参数集做匹配判断:
当所述用户语音特征参数集与所述待学习语音特征参数集的匹配次数达到预设次数时,则将所述待学习语音特征参数集作为表征所述用户控制该设备的用户控制语音特征参数集;转入步骤c5;否则,反馈学习语音指令失败的提示信息给所述用户;
步骤c5,再次获取到包含有与所述用户控制语音特征参数集匹配一致的用户控制语音时,则由所述设备执行与该待学习语音指令相对应的动作。
7.根据权利要求1~6任一项所述基于语音识别的设备控制方法,其特征在于,所述预设标准语音控制指令数据库内的预设标准语音为设备系统自带的语音控制指令或者为由用户录入的语音指令。
8.根据权利要求1~6任一项所述基于语音识别的设备控制方法,其特征在于,所述设备为家用电器设备。

说明书全文

基于语音识别的设备控制方法

技术领域

[0001] 本发明涉及设备控制领域,尤其涉及一种基于语音识别的设备控制方法。

背景技术

[0002] 随着设备智能化的不断发展,市场上不断涌现出具备各式各样操控功能的智能化设备。例如,相对设备的传统按键操控方式,现有智能设备具备了触摸式操控功能以及基于用户动作的手势操控功能。
[0003] 然而,现有智能设备的操控方式存在一些缺陷:在用户操控诸如抽油烟机、蒸箱或者烤箱等设备过程中,现有设备的按键操控方式、触摸式操作以及手势操控仍然需要占用用户的单手或者双手,导致该用户将难以再腾出空闲的手去做其他事务,如此一来,势必降低用户对设备的操控体验效果。

发明内容

[0004] 本发明所要解决的技术问题是针对上述现有技术提供一种基于语音识别的设备控制方法。
[0005] 本发明解决上述技术问题所采用的技术方案为:基于语音识别的设备控制方法,其特征在于,包括如下步骤1至步骤4:
[0006] 步骤1,构建控制设备执行动作的预设标准语音控制指令数据库;其中,所述预设标准语音控制指令数据库内存储有与设备所执行动作相对应的预设标准语音;
[0007] 步骤2,检测、获取设备外的外部语音信号,并对该外部语音信号做预处理;
[0008] 步骤3,将所述预处理后的外部语音信号与所述预设标准语音控制指令数据库做匹配判断处理:
[0009] 当所述预处理后的外部语音信号与所述预设标准语音控制指令数据库内的任一预设标准语音匹配一致时,将该预设标准语音作为外部语音控制指令,转入步骤4;否则,转入步骤2;
[0010] 步骤4,命令设备执行与所述外部语音控制指令相对应的动作。
[0011] 进一步地,在所述基于语音识别的设备控制方法中,在步骤2中,针对所述外部语音信号的预处理过程包括如下步骤2-1至步骤2-4:
[0012] 步骤2-1,针对所述外部语音信号做端点检测,获取所述外部语音信号中的用户语音信号和外部噪声信号;
[0013] 步骤2-2,消除所述外部语音信号中的外部噪声信号,得到消噪处理后的用户语音信号;
[0014] 步骤2-3,按照预设的语音特征参数,提取所述用户语音信号中的语音特征参数集合;
[0015] 步骤2-4,将提取的所述语音特征参数集合作为针对所述外部语音信号的预处理结果。
[0016] 再进一步地,在步骤2-1中,所述外部语音信号中的用户语音信号和外部噪声信号获取过程如下步骤a1至步骤a3:
[0017] 步骤a1,构建融合有用户语音信号和外部噪声信号的语音模型;其中,所述语音模型如下:
[0018]
[0019] 其中,xk是所选取信号的子带能量;z=0时,代表所选取信号为外部噪声信号;z=1时,代表所选取信号为用户语音信号;rk是包括参数μz和参数σ2的参数集合;μz表示信号z振幅的均值,σ2表示信号z的能量;p(xk|z,rk)表示所选取信号为z的概率;
[0020] 步骤a2,根据构建的所述语音模型,计算所述外部语音信号内的信号分别为用户语音信号的概率和外部噪声信号的概率;
[0021] 步骤a3,根据步骤a2所得概率结果,利用假设检验方法确定所述外部语音信号的信号类型;其中所述信号类型为用户语音信号或者外部噪声信号。
[0022] 再进一步地,在步骤a3中,所述外部语音信号中的用户语音信号和外部噪声信号的信号类型确定过程包括如下步骤b1至步骤b7:
[0023] 步骤b1,利用启动步骤3前的第一预设数的信号特征数据构建噪声模型;
[0024] 步骤b2,利用启动步骤3前的第二预设帧数的信号强度计算归一化频谱差值;
[0025] 步骤b3,根据构建的所述噪声模型以及所得归一化频谱差值,采用概率密度函数计算出每帧信号内的信噪比,并且区分出用户语音信号和外部噪声信号;
[0026] 步骤b4,根据所得每帧信号内的信噪比,使用维纳滤波器在频域内消除所述外部语音信号中的外部噪声信号;
[0027] 步骤b5,计算所述外部语音信号在消噪前后所对应的消噪前后能量比以及所述外部语音信号在消噪前后所对应的消噪前后信噪似然比;
[0028] 步骤b6,利用所述消噪前后能量比和所述消噪前后信噪似然比,对消除噪声后的所述外部语音信号做修复调整;
[0029] 步骤b7,将修复调整后的所述外部语音信号作为用户语音信号输出。
[0030] 改进地,在所述基于语音识别的设备控制方法中,在步骤4成功执行完毕后还包括:步骤5,设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作。
[0031] 进一步地,所述设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作的过程包括如下步骤c1至步骤c5:
[0032] 步骤c1,将与所述任一预设标准语音数据匹配一致的所述外部语音信号作为设备的待学习语音指令;
[0033] 步骤c2,获取用户再次发出的与该待学习语音指令内容相同的多次用户语音控制指令;
[0034] 步骤c3,按照同样的语音特征参数提取方法,分别提取所述待学习语音指令的待学习语音特征参数集以及所述各次用户语音控制指令的用户语音特征参数集;
[0035] 步骤c4,根据提取的所述待学习语音特征参数集和各次用户语音特征参数集做匹配判断:
[0036] 当所述用户语音特征参数集与所述待学习语音特征参数集的匹配次数达到预设次数时,则将所述待学习语音特征参数集作为表征所述用户控制该设备的用户控制语音特征参数集;转入步骤c5;否则,反馈学习语音指令失败的提示信息给所述用户;
[0037] 步骤c5,再次获取到包含有与所述用户控制语音特征参数集匹配一致的用户控制语音时,则由所述设备执行与该待学习语音指令相对应的动作。
[0038] 可选择地,在所述基于语音识别的设备控制方法中,所述预设标准语音控制指令数据库内的预设标准语音为设备系统自带的语音控制指令或者为由用户录入的语音指令。
[0039] 进一步地,在所述基于语音识别的设备控制方法中,所述设备为家用电器设备。
[0040] 与现有技术相比,本发明的优点在于:
[0041] 本发明中的设备控制方法通过将采集到的外部语音信号与先前已经存储到设备内的预设标准语音控制指令数据库做匹配,一旦采集的外部语音信号与任一预设标准语音控制指令匹配一致,则设备执行该任一预设标准语音控制指令所对应的动作,从而使得用户通过语音就可以对设备进行控制,避免了手动操控设备,有地解放了用户的双手,提高了用户对设备的控制体验效果;
[0042] 不仅如此,本发明还通过令设备针对用户语音执行自学习,从而得到符合用户个性化特点的语音特征参数集,避免了设备难以将用户发音时的方言与预设标准语音控制指令匹配准确度不高的问题,由此使得该设备后续一旦再次采集到同样具有该语音特征参数集的语音时,设备就可以准确地识别出用户的个性化语音,提高了设备对用户语音的识别准确率以及设备对用户语音控制的交互响应效率。附图说明
[0043] 图1为本发明实施例中基于语音识别的设备控制方法流程示意图。

具体实施方式

[0044] 以下结合附图实施例对本发明作进一步详细描述。
[0045] 本实施例以厨电设备(或称厨房电器设备)作为例子,对本发明中的设备控制方法做出说明。参见图1所示,该实施例中基于语音识别的设备控制方法包括如下步骤1至步骤4:
[0046] 步骤1,构建控制厨电设备执行动作的预设标准语音控制指令数据库;其中,在该预设标准语音控制指令数据库内存储有与该厨电设备所执行动作相对应的预设标准语音;
[0047] 例如,针对厨电设备,该预设标准语音控制指令数据库内存储有使用标准普通话录入的“启动”语音控制指令S1、“结束”语音控制指令S2、“增大档位”语音控制指令S3以及“降低档位”语音控制指令S4等符合该厨电设备各种功能的标准语音;也就是说,只要用户发出的语音与这里存储的标准语音匹配程度达到所设置的程度,就可以认为用户发出了该标准语音;
[0048] 当然,这里的预设标准语音控制指令数据库内的预设标准语音不仅可以是厨电设备在出厂时系统自带的语音控制指令,也可以是在用户购买该厨电设备后,由用户录入的语音控制指令;
[0049] 步骤2,检测、获取该厨电设备外的外部语音信号,并对该外部语音信号做预处理;
[0050] 具体地,在本实施例的步骤2中,针对此处外部语音信号的预处理过程包括如下步骤2-1至步骤2-4:
[0051] 步骤2-1,针对外部语音信号做端点检测,获取该外部语音信号中的用户语音信号和外部噪声信号;
[0052] 假设设备采集到的外部语音信号标记为X,通过执行端点检测后,该外部语音信号X中的用户语音信号为Sound,该外部语音信号X中的外部噪声信号为Noise;本实施例中的端点检测属于现有技术,此处不再赘述;
[0053] 需要说明的是,本实施例所说外部语音信号中的用户语音信号和外部噪声信号获取过程如下步骤a1至步骤a3:
[0054] 步骤a1,构建融合有用户语音信号和外部噪声信号的语音模型;其中,该语音模型如下:
[0055]
[0056] 其中,xk是所选取信号的子带能量;z=0时,代表所选取信号为外部噪声信号;z=1时,代表所选取信号为用户语音信号;rk是包括参数μz和参数σ2的参数集合;μz表示信号z振幅的均值,σ2表示信号z的能量;p(xk|z,rk)表示所选取信号为z的概率;
[0057] 步骤a2,根据构建的语音模型,计算外部语音信号内的信号分别为用户语音信号的概率和外部噪声信号的概率;
[0058] 步骤a3,根据步骤a2所得概率结果,利用作为现有技术的假设检验方法确定外部语音信号的信号类型;其中,信号类型为用户语音信号或者外部噪声信号;
[0059] 具体地,在步骤a3中,外部语音信号中的用户语音信号和外部噪声信号的信号类型确定过程包括如下步骤b1至步骤b7:
[0060] 步骤b1,利用启动步骤3前的第一预设帧数的信号特征数据构建噪声模型;
[0061] 步骤b2,利用启动步骤3前的第二预设帧数的信号强度计算归一化频谱差值;
[0062] 步骤b3,根据构建的噪声模型以及所得归一化频谱差值,采用概率密度函数计算出每帧信号内的信噪比,并且区分出用户语音信号和外部噪声信号;
[0063] 步骤b4,根据所得每帧信号内的信噪比,使用维纳滤波器在频域内消除外部语音信号中的外部噪声信号;
[0064] 步骤b5,计算外部语音信号在消噪前后所对应的消噪前后能量比以及外部语音信号在消噪前后所对应的消噪前后信噪似然比;
[0065] 步骤b6,利用消噪前后能量比和消噪前后信噪似然比,对消除噪声后的外部语音信号做修复调整;
[0066] 步骤b7,将修复调整后的外部语音信号作为用户语音信号输出。也就是说,经过步骤b6的修复调整处理,消除噪声后的外部语音信号就只剩下用户语音信号,从而达到了确定外部语音信号中的用户语音信号和外部噪声信号的目的;
[0067] 在本实施例中,通过采用步骤b1~步骤b7的方式,可以将厨电设备所采集外部语音信号中的噪声消除,进而只剩下用户发出的语音指令,由此避免噪声对识别用户语音指令过程中的不利影响,提高针对厨电设备的语音控制指令识别率,增强厨电设备对用户所发出语音响应的及时性;
[0068] 步骤2-2,消除该外部语音信号X中的外部噪声信号Noise,得到消噪处理后的用户语音信号Sound;也就是说,在执行完毕该步骤2-2后,此处的所谓外部语音信号X中只剩下了用户的语音信号Sound;至于针对此处外部噪声信号Noise的消除,可以采用传统的小波滤噪方法,或者也可以按照上述步骤b1~步骤b4的方式消除此处的外部噪声信号Noise;
[0069] 步骤2-3,按照预设的语音特征参数,提取用户语音信号中的语音特征参数集合;
[0070] 例如,预设的语音特征参数可以是基于声音信号的振幅、频率或者频谱等参数得到的特征参数,而在语音特征参数集合中则包含了所需要用来识别语音用的特征参数;语音特征参数集合内的特征参数个数或者类型可以根据实际的需要选择性的设置;
[0071] 步骤2-4,将提取的语音特征参数集合作为针对该外部语音信号的预处理结果;
[0072] 步骤3,将预处理后的外部语音信号与预设标准语音控制指令数据库做匹配判断处理:
[0073] 当预处理后的外部语音信号与预设标准语音控制指令数据库内的任一预设标准语音匹配一致时,说明预处理后的该外部语音信号内容就是要发送该任一预设标准语音所对应的内容,此时将该预设标准语音作为外部语音控制指令,转入步骤4;否则,转入步骤2;
[0074] 步骤4,命令设备执行与该外部语音控制指令相对应的动作。例如,一旦判断预处理后的外部语音信号(具体地应该是经消噪处理后的用户语音信号Sound)与预设的标准语音“增大档位”语音控制指令S3匹配相一致时,说明用户此时向该厨电设备发出了“增大档位”的控制指令,从而此时的厨电设备就在自身当前档位的基础上增大档位,满足用户对该厨电设备的控制要求。
[0075] 当然,为了符合用户语音的个性化特点,避免此处的厨电设备难以将用户发音时的方言与预设标准语音控制指令匹配准确度不高的问题,本实施例的设备控制方法在步骤4成功执行完毕后还包括:步骤5,厨电设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作。其中,厨电设备针对用户语音执行自学习以及根据自学习结果再次执行相应动作的过程具体包括如下步骤c1至步骤c5:
[0076] 步骤c1,将与所述任一预设标准语音数据匹配一致的外部语音信号作为厨电设备的待学习语音指令;
[0077] 由于本实施例中假设预处理后的外部语音信号(具体地应该是经消噪处理后的用户语音信号Sound)与预设的标准语音“增大档位”语音控制指令S3匹配相一致,则在该步骤c1中,就将与该“增大档位”语音控制指令S3匹配一致的外部语音信号(具体地应该是经消噪处理后的用户语音信号Sound)作为该厨电设备的待学习语音指令;
[0078] 步骤c2,获取用户再次发出的与该待学习语音指令内容相同的多次用户语音控制指令;
[0079] 步骤c3,按照同样的语音特征参数提取方法,分别提取待学习语音指令的待学习语音特征参数集以及各次用户语音控制指令的用户语音特征参数集;
[0080] 步骤c4,根据提取的待学习语音特征参数集和各次用户语音特征参数集做匹配判断:
[0081] 当用户语音特征参数集与待学习语音特征参数集的匹配次数达到预设次数时,则将所述待学习语音特征参数集作为表征所述用户控制该设备的用户控制语音特征参数集;转入步骤c5;否则,反馈学习语音指令失败的提示信息给所述用户;
[0082] 例如,这里要求厨电设备获取到与该待学习语音指令S3内容相同的三次用户语音控制指令,即第一次提取的用户语音指令标记为K1、第二次提取的用户语音指令标记为K3以及第三次提取的用户语音指令标记为K3;假设针对待学习语音指令和这三次用户语音控制指令所采用的语音特征参数集均包含语音特征参数1、语音特征参数2和语音特征参数3;
[0083] 针对步骤c4的匹配判断过程补充说明如下:
[0084] 在利用预设的语音特征参数集(包含语音特征参数1、语音特征参数2和语音特征参数3)去对待学习语音指令S3和第一次提取的用户语音指令K1做匹配时,如果两个语音指令所对应的三个语音特征参数均位于允许的匹配范围内时,就认为该用户语音指令K1与待学习语音指令S3匹配一致;
[0085] 同样地,再次执行针对用户语音指令K2与待学习语音指令S3、以及用户语音指令K3与待学习语音指令S3的匹配判断;一旦在执行的这三次匹配过程中的匹配一致次数达到预设次数(例如,预设次数是两次),那么就将此处匹配用的语音特征参数集(包含语音特征参数1、语音特征参数2和语音特征参数3)作为表征该用户控制该设备的用户控制语音特征参数集;也就是说,后续针对该厨电设备的语音控制就以该用户控制语音特征参数集作为识别匹配的标准;
[0086] 步骤c5,再次获取到包含有与用户控制语音特征参数集匹配一致的用户控制语音时,则由设备执行与该待学习语音指令相对应的动作。由此,通过令此处的厨电设备针对用户语音执行自学习,从而得到符合用户个性化特点的语音特征参数集,避免了厨电设备难以将用户发音时的方言与预设标准语音控制指令匹配准确度不高的问题,由此使得该厨电设备后续一旦再次采集到同样具有该语音特征参数集的语音时,厨电设备就可以准确地识别出用户的个性化语音,提高了厨电设备对用户语音的识别准确率以及该厨电设备对用户语音控制的交互响应效率。
[0087] 需要说明的是,本实施例中基于语音识别的设备控制方法还可以应用在诸如空调器和电视机等家用电器设备或者工厂内的其他设备上。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈