技术领域
[0001] 本
发明涉及语音处理技术领域,特别是涉及一种噪声消除方法、智能音箱及存储介质。
背景技术
[0002] 随着科技的发展,越来越多的家庭中开始使用具有
语音识别功能的智能音箱设备,在家庭中,用户通常会将智能音箱放置在电视柜上电视机旁,当电视机播放声音时,智能音箱会拾取到电视机声音,电视机声音较大且为非噪声形态,智能音箱会将电视机声音识别为用户声音,进而从用户声音中误识别出用户指令,从而做出用户不期望的回应,严重降低用户体验。
发明内容
[0003] 本发明主要提供一种噪声消除方法,能够克服现有的智能音箱因误识别电视机声音为用户指令而做出用户不期望的回应,降低用户体验的问题。
[0004] 为解决上述技术问题,本发明采用的一个技术方案是:提供一种噪声消除方法,所述噪声消除方法应用于语音交互设备,所述语音交互设备与电视机之间无线连接,所述噪声消除方法包括:
[0005] 当被唤醒后,发送被唤醒通知至所述电视机;
[0006] 接收电视机通过无线传输方式发送的当前播放的电视音频
信号;
[0007] 拾取包括电视噪声信号和用户
语音信号的混合
声音信号,并基于所述电视
音频信号将所述混合声音信号中的电视噪声信号消除。
[0008] 优选地,所述基于所述电视音频信号将所述混合声音信号中的电视噪声信号消除的步骤具体包括以下步骤:
[0009] 对所述电视音频信号的幅值和
相位进行调整,以生成电视噪声参考信号;所述电视噪声参考信号的幅值和相位分别与所述电视噪声信号的幅值和相位相等;
[0010] 基于所述电视噪声参考信号将所述混合声音信号中的电视噪声信号消除。
[0011] 优选地,所述对所述电视音频信号的幅值和相位进行调整,以生成电视噪声参考信号的步骤具体包括:
[0013] 基于所述频谱分析结果,从所述混合声音信号中提取与所述频谱分析结果中相同
频率分布的电视噪声信号;
[0014] 计算所述电视音频信号与所述电视噪声信号的幅值差和
相位差;
[0015] 基于所述幅值差和所述相位差对所述电视音频信号的幅值和相位进行调整,以生成电视噪声参考信号。
[0016] 优选地,所述基于所述电视噪声参考信号将所述混合声音信号中的电视噪声信号消除的步骤具体包括:
[0017] 对所述电视噪声参考信号进行自适应滤波处理以得到抵消估算信号;
[0018] 将所述混合声音信号减去所述抵消估算信号,以消除所述混合声音信号中的所述电视噪声信号。
[0019] 优选地,所述对所述电视噪声参考信号进行自适应滤波处理的步骤具体包括:
[0020] 基于最小均方
算法或递归最小二乘算法对所述电视噪声参考信号进行自适应滤波处理。
[0021] 优选地,所述噪声消除方法还包括:
[0022] 当被唤醒后,发送被唤醒通知至所述电视机,以使所述电视机根据所述被唤醒通知降低所述电视音频信号的音量。
[0023] 优选地,所述噪声消除方法还包括:
[0024] 当退出唤醒后,发送退出唤醒通知至所述电视机,以使所述电视机根据所述退出唤醒通知调高所述电视音频信号的音量。
[0025] 为解决上述技术问题,本发明采用的另一个技术方案是:提供一种噪声消除方法,所述噪声消除方法包括:
[0026] 当语音交互设备被唤醒后,所述语音交互设备发送被唤醒通知至电视机;
[0027] 所述电视机根据所述被唤醒通知通过无线传输方式将当前播放的电视音频信号发送至所述语音交互设备;
[0028] 所述语音交互设备拾取包括电视噪声信号和用户语音信号的混合声音信号,并基于所述电视音频信号将所述混合声音信号中的电视噪声信号消除。
[0029] 为解决上述技术问题,本发明采用的另一个技术方案是:提供一种智能音箱,所述智能音箱包括处理器以及
存储器,所述处理器耦合所述存储器,所述处理器在工作时执行指令以实现上述的噪声消除方法。
[0030] 为解决上述技术问题,本发明采用的另一个技术方案是:提供一种存储介质,其上存储有
计算机程序,所述计算机程序被处理器执行以实现上述的噪声消除方法。
[0031] 本发明的有益效果是:区别于
现有技术的情况,本发明中语音交互设备与电视机之间无线连接,语音交互设备当被唤醒后,发送被唤醒通知至电视机;接收电视机通过无线传输方式发送的当前播放的电视音频信号;拾取包括电视噪声信号和用户语音信号的混合声音信号,并基于电视音频信号将混合声音信号中的电视噪声信号消除。本发明中可基于电视机发送的电视音频信号将拾取的混合声音信号中电视噪声信号消除,从而消除电视噪声信号对语音识别的干扰,提升语音识别准确率,提升用户体验。
附图说明
[0032] 为了更清楚地说明本发明
实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,其中:
[0033] 图1是本发明一实施例提供的噪声消除方法的
流程图;
[0034] 图2是图1中步骤S300的具体实现流程图;
[0035] 图3是本发明另一实施例提供的噪声消除方法的流程图;
[0036] 图4是本发明另一实施例提供的智能音箱的结构示意图;
[0037] 图5是本发明另一实施例提供的存储介质的结构示意图。
具体实施方式
[0038] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039] 实施例一
[0040] 图1为本发明一实施例提供的噪声消除方法的流程图,噪声消除方法应用于语音交互设备,语音交互设备可为智能音箱或带有语音交互功能的设备,语音交互设备与电视机之间无线连接,语音交互设备与电视机之间可通过WIFI、蓝牙、ZigBee等无线连接方式连接,噪声消除方法包括步骤S100、步骤S200及步骤S300。
[0041] 步骤S100:当被唤醒后,发送被唤醒通知至电视机。
[0042] 具体地,当语音交互设备被用户唤醒后,发送被唤醒通知至电视机。其中,用户可通过固定唤醒词唤醒语音交互设备,如:用户输入语音“你好小洛”,则语音交互设备被唤醒。
[0043] 步骤S200:接收电视机通过无线传输方式发送的当前播放的电视音频信号。
[0044] 具体地,电视机接收到语音交互设备发送的被唤醒通知后,即通过无线传输方式将当前所播放的电视音频信号发送给语音交互设备。
[0045] 步骤S300:拾取包括电视噪声信号和用户语音信号的混合声音信号,并基于所述电视音频信号将所述混合声音信号中的电视噪声信号消除。
[0046] 具体地,语音交互设备通过麦克
风拾取包括电视噪声信号和用户语音信号的混合声音信号,其中,电视噪声信号为电视机播放电视音频信号后被语音交互设备的麦克风拾取到的声音信号。
[0047] 具体地,语音交互设备对接收到的电视音频信号的幅值和相位进行调整,以生成电视噪声参考信号,使得调整得到的电视噪声参考信号的幅值与拾取的电视噪声信号的幅值相等,电视噪声参考信号的相位与电视噪声信号的相位相等。进而,语音交互设备基于电视噪声参考信号将混合声音信号中的电视噪声信号消除。
[0048] 进一步具体地,如图2所示,对电视音频信号的幅值和相位进行调整,以生成电视噪声参考信号的步骤具体包括步骤S301、步骤S302、步骤S303及步骤S304。
[0049] 步骤S301:对电视音频信号进行频谱分析。
[0050] 具体地,基于傅里叶变换方法对电视音频信号进行频谱分析,以得到电视音频信号的频率分布。
[0051] 步骤S302:基于频谱分析结果,从混合声音信号中提取与频谱分析结果中相同频率分布的电视噪声信号。
[0052] 具体地,基于电视音频信号的频谱分析结果,根据其频率分布,从混合声音信号中提取与该频率分布相同的声音信号,所提取出的声音信号即为电视噪声信号。
[0053] 步骤S303:计算电视音频信号与电视噪声信号的幅值差和相位差。
[0054] 具体地,获取电视音频信号和电视噪声信号的幅值、相位,计算电视音频信号与电视噪声信号的幅值差、相位差。
[0055] 步骤S304:基于幅值差和相位差对电视音频信号的幅值和相位进行调整,以生成电视噪声参考信号。
[0056] 具体地,基于电视音频信号、幅值差及相位差,调整电视音频信号的幅值和相位以生成电视噪声参考信号。电视音频信号的幅值与电视噪声参考信号的幅值的差值为该幅值差,电视音频信号的相位与电视噪声参考信号的相位的差值为该相位差。
[0057] 进一步具体地,在得到电视噪声参考信号后,对电视噪声参考信号进行自适应滤波处理以得到抵消估算信号,将混合声音信号减去该抵消估算信号,以消除混合声音信号中的电视噪声信号,从而得到用户声音信号。其中,可基于最小均方算法(Least Mean Square,LMS)或递归最小二乘算法(Recursive Least Squares,RLS)对电视噪声参考信号进行自适应滤波,也可基于LMS算法的
优化算法或RLS算法的优化算法进行自适应滤波,根据用户声音信号得到自适应滤波的反馈参考信号。
[0058] 作为本发明中的另一实施方式,当语音交互设备被唤醒后,发送被唤醒通知至电视机,以使电视机根据被唤醒通知降低电视音频信号的音量,以减弱电视声音对语音交互设备语音识别的影响;当退出唤醒后,发送退出唤醒通知至电视机,以使电视机根据退出唤醒通知调高电视音频信号的音量,以使电视机恢复正常播放状态,其中,退出唤醒指用户与语音交互设备结束语音交互。
[0059] 在本发明实施例中,语音交互设备与电视机之间无线连接,语音交互设备当被唤醒后,发送被唤醒通知至电视机;接收电视机通过无线传输方式发送的当前播放的电视音频信号;拾取包括电视噪声信号和用户语音信号的混合声音信号,并基于电视音频信号将混合声音信号中的电视噪声信号消除。本发明中可基于电视机发送的电视音频信号将拾取的混合声音信号中电视噪声信号消除,从而消除电视噪声信号对语音识别的干扰,提升语音识别准确率,提升用户体验。
[0060] 实施例二
[0061] 图3为本发明另一实施例提供的噪声消除方法的流程图,噪声消除方法应用于语音交互设备和电视机,语音交互设备可为智能音箱或带有语音交互功能的设备,语音交互设备与电视机之间无线连接,语音交互设备与电视机之间可通过WIFI、蓝牙、ZigBee等无线连接方式连接,噪声消除方法包括步骤S400、步骤S500及步骤S600。
[0062] 步骤S400:当语音交互设备被唤醒后,语音交互设备发送被唤醒通知至电视机。
[0063] 具体地,当语音交互设备被用户唤醒后,发送被唤醒通知至电视机。其中,用户可通过固定唤醒词唤醒语音交互设备,如:用户输入语音“你好小洛”,则语音交互设备被唤醒。
[0064] 步骤S500:电视机根据被唤醒通知通过无线传输方式将当前播放的电视音频信号发送至语音交互设备。
[0065] 具体地,电视机接收到语音交互设备发送的被唤醒通知后,即通过无线传输方式将当前所播放的电视音频信号发送给语音交互设备。
[0066] 步骤S600:语音交互设备拾取包括电视噪声信号和用户语音信号的混合声音信号,并基于电视音频信号将混合声音信号中的电视噪声信号消除。
[0067] 具体地,语音交互设备通过麦克风拾取包括电视噪声信号和用户语音信号的混合声音信号,其中,电视噪声信号为电视机播放电视音频信号后被语音交互设备的麦克风拾取到的声音信号。
[0068] 具体地,语音交互设备对接收到的电视音频信号的幅值和相位进行调整,以生成电视噪声参考信号,使得调整得到的电视噪声参考信号的幅值与拾取的电视噪声信号的幅值相等,电视噪声参考信号的相位与电视噪声信号的相位相等。进而,语音交互设备基于电视噪声参考信号将混合声音信号中的电视噪声信号消除。
[0069] 进一步具体地,对电视音频信号的幅值和相位进行调整,以生成电视噪声参考信号的步骤详见上述步骤S301、步骤S302、步骤S303及步骤S304中的描述,在此不再赘述。
[0070] 作为本发明中的另一实施方式,当语音交互设备被唤醒后,语音交互设备发送被唤醒通知至电视机,电视机根据被唤醒通知降低电视音频信号的音量,以调低播放音量,从而减弱电视播放的声音对语音交互设备语音识别的影响;当语音交互设备退出唤醒后,语音交互设备发送退出唤醒通知至电视机,电视机根据退出唤醒通知调高电视音频信号的音量,以调高播放音量,从而使电视机恢复正常播放状态,其中,退出唤醒指用户与语音交互设备结束语音交互。
[0071] 本发明实施例中,语音交互设备与电视机之间无线连接,当语音交互设备被唤醒后,发送被唤醒通知至电视机;电视机根据被唤醒通知通过无线传输方式将当前播放的电视音频信号发送至语音交互设备;语音交互设备拾取包括电视噪声信号和用户语音信号的混合声音信号,并基于电视音频信号将混合声音信号中的电视噪声信号消除。本发明中语音交互设备可基于电视机发送的电视音频信号将拾取的混合声音信号中电视噪声信号消除,从而消除电视噪声信号对语音识别的干扰,提升语音识别准确率,提升用户体验。
[0072] 实施例三
[0073] 图4为本发明另一实施例提供的智能音箱的结构示意图,智能音箱包括处理器100以及存储器200,处理器100耦合存储器200,处理器100在工作时执行指令以实现上述实施例一中的噪声消除方法。
[0074] 其中,处理器100还可以称为CPU(Central Processing Unit,中央处理单元)。处理器100可能是一种集成
电路芯片,具有信号的处理能
力。处理器100还可以是通用处理器、
数字信号处理器(DSP)、
专用集成电路(ASIC)、现成可编程
门阵列(FPGA)或者其他
可编程逻辑器件、分立门或者晶体管逻辑器件、分立
硬件组件。通用处理器可以是
微处理器或者该处理器也可以是任何常规的处理器,但不仅限于此。
[0075] 实施例四
[0076] 参阅图5,图5是本发明另一实施例提供的存储介质的示意图,本实施例中的计算机可读存储介质存储有计算机程序300,该计算机程序300能够被处理器100执行以实现上述实施例一中的噪声消除方法。
[0077] 可选的,该可读存储介质可以是U盘、移动
硬盘、
只读存储器(ROM,Read-Only Memory)、
随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、
服务器、手机、平板等终端设备。
[0078] 本发明中,语音交互设备与电视机之间无线连接,语音交互设备当被唤醒后,发送被唤醒通知至电视机;接收电视机通过无线传输方式发送的当前播放的电视音频信号;拾取包括电视噪声信号和用户语音信号的混合声音信号,并基于电视音频信号将混合声音信号中的电视噪声信号消除。本发明中可基于电视机发送的电视音频信号将拾取的混合声音信号中电视噪声信号消除,从而消除电视噪声信号对语音识别的干扰,提升语音识别准确率,提升用户体验。
[0079] 以上所述仅为本发明的实施例,并非因此限制本发明的
专利范围,凡是利用本发明
说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。