技术领域
[0001] 本
发明实施例涉及智能音箱技术领域,具体涉及一种智能音效处理方法、电子设备、存储介质以及多音效音箱。
背景技术
[0002] 随着智能音箱的普及与发展,用户对智能音箱高品质音效的需求更加强烈,智能音箱由于存在多种语音场景,比如语音播报、播放音乐、有声读物等,采用同一套EQ音频参数处理以上不同类型的音频显然不能满足需求。
[0003] 人工合成的语音播报声音干硬不够柔美、音乐播放不够圆润清晰饱满,有声读物缺乏亲和
力,实际效果很难达到用户要求。
[0004] 而且智能音箱的结构设计区别很大,仅靠
云端处理原始音频很难针对不同
硬件结构进行处理,效率低,设计不方便。
发明内容
[0005] 为了克服
现有技术的不足,本发明的目的在于提供一种智能音效处理方法、电子设备、存储介质以及多音效音箱,其可以实现多类型音频动态加载音效。
[0006] 第一方面,本发明实施例提供了一种智能音效处理方法,其包括以下步骤:
[0007] 接收用户语音,根据所述用户语音确定语音命令;根据所述语音命令得到即将播放音频信息的音频类型;
[0008] 根据所述音频类型加载对应的音效
插件,所述音效插件加载有对应的EQ参数文件;
[0009] 根据语音命令播放音频信息,所述音频信息先经过所述音效插件处理后再进行播放;
[0010] 接收播放后的音频并获取所述播放后的音频的
频谱参数;将所述频谱参数与预设的对应音频类型的EQ曲线进行比对;
[0011] 如果所述频谱参数不满足所述EQ曲线,则调整所述EQ参数文件,直至所述频谱参数满足所述EQ曲线。
[0012] 在一个优选的实施例中,所述根据所述用户语音确定语音命令,根据所述语音命令得到即将播放音频信息的音频类型;包括:
[0013] 将所述用户语音发送至云端
服务器进行
语音识别,获取语音识别结果,根据语音识别结果区分语音命令;
[0014] 根据语音命令的关键词在音频类型集合中查找对应的音频类型,得到即将播放音频信息的音频类型。
[0015] 在一个优选的实施例中,所述音效插件为ALSA音效插件。
[0016] 在一个优选的实施例中,接收播放后的音频并获取所述播放后的音频的频谱参数,包括:
[0017] 接收播放后的音频并将播放后的音频转换为数字音频,分析所述数字音频,得到数字音频的频谱参数。
[0018] 第二方面,本发明实施例提供一种电子设备,其包括处理器、存储介质以及
计算机程序,所述计算机程序存储于存储介质中,其特征在于,所述计算机程序被处理器执行时实现上述第一方面的智能音效处理方法。
[0019] 第三方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时上述第一方面的智能音效处理方法。
[0020] 第四方面,本发明实施例提供一种多音效音箱,其包括:
[0021] 麦克
风阵列,用于拾取用户语音以及扬声器播放后的音频;
[0022]
存储器,用于存储音频类型集合、每个音频类型对应的音效插件、每个音效插件对应的EQ参数文件、以及每个音频类型对应的EQ曲线;
[0023] 主
控制器,用于接收麦克风阵列拾取的用户语音,根据所述用户语音确定语音命令;根据所述语音命令得到即将播放音频信息的音频类型;根据所述音频类型加载对应的音效插件,所述音效插件加载有对应的EQ参数文件;
[0024] 扬声器,用于根据语音命令播放音频信息,所述音频信息先经过所述音效插件处理后再通过所述扬声器进行播放;
[0025] 所述
主控制器还接收麦克风阵列拾取的扬声器播放的音频,并获取扬声器播放的音频的频谱参数;将所述频谱参数与预设的对应音频类型的EQ曲线进行比对;如果所述频谱参数不满足所述EQ曲线,则调整所述EQ参数文件,直至所述频谱参数满足所述EQ曲线。
[0026] 在一个优选的实施例中,所述多音效音箱还包括无线网络,所述主控制器通过无线网络与云端服务器相连,所述主控制器将所述用户语音发送至云端服务器进行语音识别,获取语音识别结果,根据语音识别结果区分语音命令;根据语音命令的关键词在音频类型集合中查找对应的音频类型,得到即将播放音频信息的音频类型。
[0027] 在一个优选的实施例中,所述音效插件为ALSA音效插件。
[0028] 在一个优选的实施例中,所述主控制器将扬声器播放的音频转换为数字音频,并分析所述数字音频,得到数字音频的频谱参数。
[0029] 相比于现有技术,本发明实施例通过将要播放的音频信息先经过音效插件处理后再进行播放,然后将播放的音频的频谱参数与EQ曲线进行比对,动态调整音效插件的参数文件,达到自适应和
自学习效果,可以实现多类型音频动态加载音效。
附图说明
[0030] 图1为实施例1的智能音效处理方法的
流程图;
[0031] 图2为实施例2的电子设备的原理
框图;
[0032] 图3为实施例4的多音效音箱的原理框图。
[0033] 具体实施例方式
[0034] 下面,结合附图以及具体实施例方式,对本发明实施例做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。除特殊说明的之外,本实施例中所采用到的材料及设备均可从市场购得。
[0035] 实施例1:
[0036] 本发明实施例1示出了一种智能音效处理方法。请参照图1所示,其主要包括以下步骤:
[0037] S110、接收用户语音,根据所述用户语音确定语音命令;根据所述语音命令得到即将播放音频信息的音频类型;
[0038] 用户语音为用户发送的语音命令,其发出的语音命令可以通过麦克风阵列进行采集,然后由处理器(也即是主控制器)接收。
[0039] 主控制器将所述用户语音发送至云端服务器进行语音识别,获取语音识别结果,语音识别结果为文字形式,根据语音识别结果的关键词区分不同的语音命令,也就是说不同的语音命令具有不同的关键词,根据语音识别结果的关键词也即是语音命令的关键词;主控制器根据语音命令的关键词在音频类型集合中查找对应的音频类型,得到即将播放音频信息的音频类型。音频类型可以是播放音乐、天气预报以及有声读物等。
[0040] S120、根据所述音频类型加载对应的音效插件,所述音效插件加载有对应的EQ参数文件。
[0041] 为了实现不同音频类型具有不同的音效,达到高品质音频播放的目的,对每个不同的音频类型均设置对应的音频插件,在linux系统中,音频插件可以是 ALSA音效插件。每个音效插件会对应不同的EQ参数文件。音效插件、EQ参数文件以及上述的音频类型集合和下述的EQ曲线均可以存储于存储器中,同时还设置音效插件、EQ参数文件、音频类型集合的音频类型和EQ曲线之间关系的关联表。
[0042] S130、根据语音命令播放音频信息,所述音频信息先经过所述音效插件处理后再进行播放。
[0043] 根据语音命令播放音频信息在现有的智能音箱中已得到广泛的应用,当然,在其他音频播放设备中也与之类似,这里仅做简单介绍:主控制器解析语音命令,选取语音命令中相关的关键词,从智能音箱的存储器中或者从云端服务器中选取相应的符合相关关键词的音频信息,由扬声器进行播放。
[0044] 在本发明较佳的实施例中,在音频播放之前,要调整音频通路顺序,即向将音频信息经过音效插件进行处理后,再进行播放,从而可以在音效插件处理后得到符合品质需求的播放效果,当然,如果播放效果仍不满意,则根据S140 和S150进行自动调整。
[0045] S140、接收播放后的音频并获取所述播放后的音频的频谱参数;将所述频谱参数与预设的对应音频类型的EQ曲线进行比对。
[0046] 拾取扬声器播放的音频,这里将扬声器播放的音频称为初始音频,将初始音频经过数字处理,转换为数字音频,分析数字音频,得到数字音频的频谱参数。对数字音频分析得到频谱参数的方式可以通过现有常规
软件实现,也可以通过主控制器通过常规
算法实现,这里不再赘述。
[0047] S150、如果所述频谱参数不满足所述EQ曲线,则调整所述EQ参数文件,直至所述频谱参数满足所述EQ曲线。
[0048] EQ曲线为预设的每个音频类型达到高品质音效的曲线,例如EQ曲线使语音播报声音更加柔美、音乐播放更加圆润清晰饱满,有声读物增加亲和力等。 EQ曲线可以通过多次试验方式完成,也可以将现有不同音频类型的高品质音效的音频进行分析得到的EQ曲线作为预设EQ曲线。
[0049] 音效插件的EQ参数文件可以动态调整,调整的方式可以是预设的规则进行数值的增加或减小,或者通过创建神经网络模型方式进行训练,训练结果即对应的EQ曲线,需要调整EQ参数文件时,则可以根据对应的EQ曲线和神经网络模型反向传播方式进行调整。当然,如果频谱参数满足所述EQ曲线,则不在进行EQ参数的处理。
[0050] 通过将要播放的音频信息先经过音效插件处理后再进行播放,然后将播放的音频的频谱参数与EQ曲线进行比对,动态调整音效插件的参数文件,达到自适应和自学习效果,可以实现多类型音频动态加载音效。
[0051] 实施例2:
[0052] 图2为本发明实施例四提供的一种电子设备的结构示意图,如图2所示,该电子设备包括处理器210、存储器220、输入装置230和输出装置240;计算机设备中处理器210的数量可以是一个或多个,图2中以一个处理器210为例;电子设备中的处理器210、存储器220、输入装置230和输出装置240可以通过总线或其他方式连接,图2中以通过总线连接为例。
[0053] 这里的电子设备可以是任意具有音频需求的产品,例如智能音箱等。
[0054] 存储器220作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模
块,如本发明实施例中的智能音效处理方法对应的程序指令/ 模块。处理器210通过运行存储在存储器220中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及
数据处理,即实现上述实施例的智能音效处理方法。
[0055] 存储器220可主要包括存储程序区和存储数据区,其中,存储程序区可存储
操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器220可以包括高速
随机存取存储器,还可以包括
非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器220可进一步包括相对于处理器210 远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0056] 输入装置230可用于输入音频类型、音效插件、EQ参数文件、EQ曲线的数据
接口,以及麦克风阵列等。输出装置240可包括扬声器等。
[0057] 实施例3:
[0058] 本发明实施例3还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行智能音效处理方法,该方法包括:
[0059] 接收用户语音,根据所述用户语音确定语音命令;根据所述语音命令得到即将播放音频信息的音频类型;
[0060] 根据所述音频类型加载对应的音效插件,所述音效插件加载有对应的EQ参数文件;
[0061] 根据语音命令播放音频信息,所述音频信息先经过所述音效插件处理后再进行播放;
[0062] 接收播放后的音频并获取所述播放后的音频的频谱参数;将所述频谱参数与预设的对应音频类型的EQ曲线进行比对;
[0063] 如果所述频谱参数不满足所述EQ曲线,则调整所述EQ参数文件,直至所述频谱参数满足所述EQ曲线。
[0064] 实施例4:
[0065] 请参照图3所示,实施例4公开了一种多音效音箱,其包括:
[0066] 麦克风阵列310,用于拾取用户语音以及扬声器播放后的音频;
[0067] 存储器320,用于存储音频类型集合、每个音频类型对应的音效插件、每个音效插件对应的EQ参数文件、以及每个音频类型对应的EQ曲线;
[0068] 主控制器330,用于接收麦克风阵列拾取的用户语音,根据所述用户语音确定语音命令;根据所述语音命令得到即将播放音频信息的音频类型;根据所述音频类型加载对应的音效插件,所述音效插件加载有对应的EQ参数文件;
[0069] 扬声器340,用于根据语音命令播放音频信息,所述音频信息先经过所述音效插件处理后再通过所述扬声器进行播放;
[0070] 所述主控制器还接收麦克风阵列拾取的扬声器播放的音频,并获取扬声器播放的音频的频谱参数;将所述频谱参数与预设的对应音频类型的EQ曲线进行比对;如果所述频谱参数不满足所述EQ曲线,则调整所述EQ参数文件,直至所述频谱参数满足所述EQ曲线。
[0071] 进一步地,所述多音效音箱还包括无线网络350,无线网络可以是射频网络,也可以是蓝牙、WIFI、4G、5G、GPS等。所述主控制器通过无线网络与云端服务器360相连,所述主控制器将所述用户语音发送至云端服务器进行语音识别,获取语音识别结果,根据语音识别结果区分语音命令;根据语音命令的关键词在音频类型集合中查找对应的音频类型,得到即将播放音频信息的音频类型。
[0072] 进一步地,所述音效插件为ALSA音效插件。
[0073] 进一步地,所述主控制器将扬声器播放的音频转换为数字音频,并分析所述数字音频,得到数字音频的频谱参数。
[0074] 相比于现有技术,本发明实施例通过将要播放的音频信息先经过音效插件处理后再进行播放,然后将播放的音频的频谱参数与EQ曲线进行比对,动态调整音效插件的参数文件,达到自适应和自学习效果,可以实现多类型音频动态加载音效。
[0075] 通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过
硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的
软盘、
只读存储器 (Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、闪存(FLASH)、
硬盘或光盘等,包括若干指令用以使得一台电子设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0076] 上述实施方式仅为本发明实施例的优选实施例方式,不能以此来限定本发明实施例保护的范围,本领域的技术人员在本发明实施例的
基础上所做的任何非实质性的变化及替换均属于本发明实施例所要求保护的范围。