首页 / 专利库 / 资料储存系统 / 智能卡 / 智能芯片 / 一种智能语音识别开关面板

一种智能语音识别开关面板

阅读:1024发布:2020-06-13

专利汇可以提供一种智能语音识别开关面板专利检索,专利查询,专利分析的服务。并且本 发明 请求 保护一种智能 语音识别 开关 面板,其包括:电源模 块 、语音识别模块、按键和 LED灯 指示模块、通讯模块、存储模块和处理器模块,电源由市电110-220VAC提供,并由 开关电源 降压到12V和线性降压到3.3V和5V给整个智能语音识别开关面板提供稳定电源;处理器模块用于处理语音识别模块、通讯模块数据交换和按键指示模块的协调;语音识别模块是智能识别面板所对应功能的语音,由处理器模块处理语音相对应的动作,用于对人 耳 听觉系统的语音 信号 进行处理识别;通讯模块是与整个系统之间通信来实现远程控制的 桥梁 ,存储模块用于存储处理器模块的信息,LED灯指示语音识别和开关状态;所述语音识别模块又包括噪声获取模块、语音分离模块、目标 语音信号 获取模块、预处理模块。本发明可以提高智能语音识别开关面板的识别准确度。,下面是一种智能语音识别开关面板专利的具体信息内容。

1.一种智能语音识别开关面板,其特征在于,包括:电源模、语音识别模块、按键和LED灯指示模块、通讯模块、存储模块和处理器模块,电源由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音识别开关面板提供稳定电源;处理器模块用于处理语音识别模块、通讯模块数据交换和按键指示模块的协调;语音识别模块是智能识别面板所对应功能的语音,由处理器模块处理语音相对应的动作,用于对人听觉系统的语音信号进行处理识别;通讯模块是与整个系统之间通信来实现远程控制的桥梁,存储模块用于存储处理器模块的信息,LED灯指示语音识别和开关状态;
所述语音识别模块又包括噪声获取模块、语音分离模块、目标语音信号获取模块、预处理模块,噪声获取模块用于采用模拟人耳听觉系统获取含噪声的语音信号;语音分离模块用于对得到的含噪声的语音信号,采用基于人耳听觉特性的语音分离方法进行语音分离;
目标语音信号获取模块用于采用语音定位获取目标语音信号;预处理模块用于对获取的目标语音信号再进行其他预处理,其他预处理包括预加重、分加窗、双限端点检测、听觉掩蔽谱减法进行处理,所述双门限端点检测主要是改变短时过零率的阈值,不再寻找过零率大于某一个阈值,而是小于某一阈值完成语音识别;
听觉掩蔽谱减法具体为:在计算听觉掩蔽值之前,首先求得临界带宽的功率谱、扩展临界带宽的功率谱以及噪声掩蔽扩展门限,然后把噪声掩蔽扩展门限与人耳听觉的设定绝对门限值进行对比,听觉掩蔽阈值就是它们之中的最大值。
2.根据权利要求1所述的一种智能语音识别开关面板,其特征在于,所述电源模块由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音开关面板提供稳定电源;处理器模块采用Microchip的PIC24内核16位先进的低功耗芯片;按键和LED灯指示模块用于面板开关操作、语音识别和开关状态指示;存储模块用于存储语音识别离线版本的数据,和存储开关状态。
3.根据权利要求1所述的一种智能语音识别开关面板,其特征在于,所述语音分离模块采用基于人耳听觉特性的语音分离方法进行语音分离具体包括:2-1)经过耳蜗基底膜模型进行频谱分析;选择具有人耳听觉特性的Gammatone滤波器组对语音信号进行频率分解;所述Gammatone滤波器组频率的选择范围从20Hz-4KHz分别对左、右耳混叠信号按时间帧进行频率分解;耳蜗基底膜模型将语音信号按照滤波器个数进行传递;2-2)再通过上橄榄核模型进行语音信息提取;2-3)最后在下丘脑细胞模型中完成语音分离。
4.根据权利要求3所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,所述步骤2-2)通过上橄榄核模型进行语音信息提取具体为;
耳蜗基底膜处理语音信号后分成多个通道传递给上橄榄复合体进行语音信号的双耳时间差ITD和双耳平差ILD定位信息的提取,ITD的计算公式如下:
式中:
——左耳和右耳的语音信号的互相关,可由下式计算:
式中:
——左耳和右耳语音信号互功率谱
ILD的计算公式如下:
式中:
——左耳和右耳的ILD值;Ωi——子带i的频率范围(1KHz~4KHz)Wi(ω)——滤波器权重;S(ω)——声源功率谱。
5.根据权利要求4所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,当信号为20Hz到1000Hz低频语音信号时,重合神经元模型只有来自上橄榄内侧的语音特征输入;1000Hz到4KHz语音信号时,上橄榄外侧和上橄榄内侧的语音特征都输入重合神经元;高于4KHz语音信号时,重合神经元只有上橄榄外侧语音特征的输入。
6.根据权利要求5所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,所述临界带宽的表达式如下:
Z=26.18f/(1960+f)-0.53
其中,Z表示临界带宽编号,f表示频率;
所述扩展临界带宽的功率谱 在式中,P(k)为信号快速傅里叶变换的功率
谱,li和hi分别表示第i个临界带宽的最小频率和最大频率,i在[1,imax]的范围内,并且语音信号的采样频率决定imax;
计算出噪声掩蔽阈值后,利用噪声掩蔽阈值和自适应的谱减法系数,得到两个谱减法系数,再结合Berouti提出的改进谱减法的方法,得到听觉掩蔽谱减法表达式。

说明书全文

一种智能语音识别开关面板

技术领域

[0001] 本发明属于智能家居领域,尤其涉及智能语音开关面板技术。

背景技术

[0002] 面板开关插座是一种安装在墙里的接线盒。面板开关插座包括底盒和面板。以外型尺寸可以将面板开关插座分为如86型、120型、118型等。
[0003] 目前,一般家用电器的控制开关为手动开关,而随着智能家居的发展,出现了应用于控制室内家用电器的声控开关。但是,声控开关仅仅实现对被控对象的简单的单向控制,并不能满足智能语音识别并交互的要求。

发明内容

[0004] 本发明旨在解决以上现有技术的问题。提出了一种智能语音识别开关面板。
[0005] 本发明的技术方案如下:
[0006] 一种智能语音识别开关面板,其包括:电源模、语音识别模块、按键和LED灯指示模块、通讯模块、存储模块和处理器模块,电源由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音识别开关面板提供稳定电源;处理器模块用于处理语音识别模块、通讯模块数据交换和按键指示模块的协调;语音识别模块是智能识别面板所对应功能的语音,由处理器模块处理语音相对应的动作,用于对人听觉系统的语音信号进行处理识别;通讯模块是与整个系统之间通信来实现远程控制的桥梁,存储模块用于存储处理器模块的信息,LED灯指示语音识别和开关状态;
[0007] 所述语音识别模块又包括噪声获取模块、语音分离模块、目标语音信号获取模块、预处理模块,噪声获取模块用于采用模拟人耳听觉系统获取含噪声的语音信号;语音分离模块用于对得到的含噪声的语音信号,采用基于人耳听觉特性的语音分离方法进行语音分离;目标语音信号获取模块用于采用语音定位获取目标语音信号;预处理模块用于对获取的目标语音信号再进行其他预处理,其他预处理包括预加重、分加窗、双限端点检测、听觉掩蔽谱减法进行处理,所述双门限端点检测主要是改变短时过零率的阈值,不再寻找过零率大于某一个阈值,而是小于某一阈值完成语音识别;
[0008] 听觉掩蔽谱减法具体为:在计算听觉掩蔽值之前,首先求得临界带宽的功率谱、扩展临界带宽的功率谱以及噪声掩蔽扩展门限,然后把噪声掩蔽扩展门限与人耳听觉的设定绝对门限值进行对比,听觉掩蔽阈值就是它们之中的最大值。
[0009] 进一步的,所述电源模块由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音开关面板提供稳定电源;处理器模块采用Microchip的PIC24内核16位先进的低功耗芯片;按键和LED灯指示模块用于面板开关操作、语音识别和开关状态指示;存储模块用于存储语音识别离线版本的数据,和存储开关状态。
[0010] 进一步的,所述语音分离模块采用基于人耳听觉特性的语音分离方法进行语音分离具体包括:2-1)经过耳蜗基底膜模型进行频谱分析;选择具有人耳听觉特性的Gammatone滤波器组对语音信号进行频率分解;所述Gammatone滤波器组频率的选择范围从20Hz-4KHz分别对左、右耳混叠信号按时间帧进行频率分解;耳蜗基底膜模型将语音信号按照滤波器个数进行传递;2-2)再通过上橄榄核模型进行语音信息提取;2-3)最后在下丘脑细胞模型中完成语音分离。
[0011] 进一步的,所述步骤2-2)通过上橄榄核模型进行语音信息提取具体为;
[0012] 耳蜗基底膜处理语音信号后分成多个通道传递给上橄榄复合体进行语音信号的双耳时间差ITD和双耳平差ILD定位信息的提取,ITD的计算公式如下:
[0013]
[0014] 式中:
[0015] ——左耳和右耳的语音信号的互相关,可由下式计算:
[0016]
[0017] 式中:
[0018] Gxlxr(ω)——左耳和右耳语音信号互功率谱
[0019] ILD的计算公式如下:
[0020]
[0021]
[0022] 式中:
[0023] ——左耳和右耳的ILD值;Ωi——子带i的频率范围(1KHz~4KHz)Wi(ω)——滤波器权重;S(ω)——声源功率谱。
[0024] 进一步的,当信号为20Hz到1000Hz低频语音信号时,重合神经元模型只有来自上橄榄内侧的语音特征输入;1000Hz到4KHz语音信号时,上橄榄外侧和上橄榄内侧的语音特征都输入重合神经元;高于4KHz语音信号时,重合神经元只有上橄榄外侧语音特征的输入。
[0025] 进一步的,所述临界带宽的表达式如下:
[0026] Z=26.18f/(1960+f)-0.53
[0027] 其中,Z表示临界带宽编号,f表示频率;
[0028] 所述扩展临界带宽的功率谱 在式中,P(k)为信号快速傅里叶变换的功率谱,li和hi分别表示第i个临界带宽的最小频率和最大频率,i在[1,imax]的范围内,并且语音信号的采样频率决定imax;
[0029] 计算出噪声掩蔽阈值后,利用噪声掩蔽阈值和自适应的谱减法系数,得到两个谱减法系数,再结合Berouti提出的改进谱减法的方法,得到听觉掩蔽谱减法表达式。
[0030] 本发明的优点及有益效果如下:
[0031] 本发明语音识别模块对传统语音识别预处理模型抗噪性能差的问题,提出了具有人耳听觉特性的语音识别预处理方法,并详细阐述了整个模型的构建过程,包括基于人耳听觉特性的语音分离、目标语音信号的确立、端点检测等其他预处理过程。基于人耳听觉特性的预处理的抗噪性能远好于传统的语音增强预处理模型的抗噪性能,基于人耳听觉特性的预处理具有良好的抗噪性能。
[0032] 本发明改进的双门限检测方法有如下优点:
[0033] A、解决了噪声的影响。噪声是影响端点检测的重要因素,是语音识别过程中必须要解决的问题,本专利所使用的双门限法在考虑实际情况之后进行了改进,主要是改变短时过零率的阈值,不再寻找过零率大于某一个阈值,而是小于某一阈值。
[0034] B、有效地应对了低信噪比的问题。低信噪比情况下噪声的能量比较大,能量曲线和短时过零率曲线的起伏较大,为了解决这个问题,本专利引入了中值滤波器对能量曲线和短时过零率曲线进行了平滑处理。进过平滑处理的能量曲线和过零率曲线可以减少有效地取出少量的点,又不会破坏数据在两个平滑段之间阶跃性变化。
[0035] C、引入语音结束最小长度设定。为了使得语音信号更符合人的发音特点,引入语音段结束最小长度,这是考虑到人发音是单词之间的静音去会有一个最小长度表示发音间的停顿,即在小于阈值时满足一个最小长度才判断此语音结束,实际上相当于延长了语音尾音的长度。附图说明
[0036] 图1是本发明提供优选实施例智能语音识别开关面板的结构示意图;
[0037] 图2是语音识别模块的结构示意图。

具体实施方式

[0038] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
[0039] 本发明解决上述技术问题的技术方案是:
[0040] 如图1所示为一种智能语音识别开关面板,其包括:电源模块、语音识别模块、按键和LED灯指示模块、通讯模块、存储模块和处理器模块,电源由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音识别开关面板提供稳定电源;处理器模块用于处理语音识别模块、通讯模块数据交换和按键指示模块的协调;语音识别模块是智能识别面板所对应功能的语音,由处理器模块处理语音相对应的动作,用于对人耳听觉系统的语音信号进行处理识别;通讯模块是与整个系统之间通信来实现远程控制的桥梁,存储模块用于存储处理器模块的信息,LED灯指示语音识别和开关状态;
[0041] 如图2所示,所述语音识别模块又包括噪声获取模块、语音分离模块、目标语音信号获取模块、预处理模块,噪声获取模块用于采用模拟人耳听觉系统获取含噪声的语音信号;语音分离模块用于对得到的含噪声的语音信号,采用基于人耳听觉特性的语音分离方法进行语音分离;目标语音信号获取模块用于采用语音定位获取目标语音信号;预处理模块用于对获取的目标语音信号再进行其他预处理,其他预处理包括预加重、分帧加窗、双门限端点检测、听觉掩蔽谱减法进行处理,所述双门限端点检测主要是改变短时过零率的阈值,不再寻找过零率大于某一个阈值,而是小于某一阈值完成语音识别;
[0042] 听觉掩蔽谱减法具体为:在计算听觉掩蔽值之前,首先求得临界带宽的功率谱、扩展临界带宽的功率谱以及噪声掩蔽扩展门限,然后把噪声掩蔽扩展门限与人耳听觉的设定绝对门限值进行对比,听觉掩蔽阈值就是它们之中的最大值。
[0043] 进一步的,所述电源模块由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音开关面板提供稳定电源;处理器模块采用Microchip的PIC24内核16位先进的低功耗芯片;按键和LED灯指示模块用于面板开关操作、语音识别和开关状态指示;存储模块用于存储语音识别离线版本的数据,和存储开关状态。
[0044] 进一步的,所述语音分离模块采用基于人耳听觉特性的语音分离方法进行语音分离具体包括:2-1)经过耳蜗基底膜模型进行频谱分析;选择具有人耳听觉特性的Gammatone滤波器组对语音信号进行频率分解;所述Gammatone滤波器组频率的选择范围从20Hz-4KHz分别对左、右耳混叠信号按时间帧进行频率分解;耳蜗基底膜模型将语音信号按照滤波器个数进行传递;2-2)再通过上橄榄核模型进行语音信息提取;2-3)最后在下丘脑细胞模型中完成语音分离。
[0045] 进一步的,所述步骤2-2)通过上橄榄核模型进行语音信息提取具体为;
[0046] 耳蜗基底膜处理语音信号后分成多个通道传递给上橄榄复合体进行语音信号的双耳时间差ITD和双耳水平差ILD定位信息的提取,ITD的计算公式如下:
[0047]
[0048] 式中:
[0049] ——左耳和右耳的语音信号的互相关,可由下式计算:
[0050]
[0051] 式中:
[0052] ——左耳和右耳语音信号互功率谱
[0053] ILD的计算公式如下:
[0054]
[0055]
[0056] 式中:
[0057] ——左耳和右耳的ILD值;Ωi——子带i的频率范围(1KHz~4KHz)
[0058] Wi(ω)——滤波器权重;S(ω)——声源功率谱。
[0059] 进一步的,当信号为20Hz到1000Hz低频语音信号时,重合神经元模型只有来自上橄榄内侧的语音特征输入;1000Hz到4KHz语音信号时,上橄榄外侧和上橄榄内侧的语音特征都输入重合神经元;高于4KHz语音信号时,重合神经元只有上橄榄外侧语音特征的输入。
[0060] 进一步的,所述临界带宽的表达式如下:
[0061] Z=26.18f/(1960+f)-0.53
[0062] 其中,Z表示临界带宽编号,f表示频率;
[0063] 所述扩展临界带宽的功率谱 在式中,P(k)为信号快速傅里叶变换的功率谱,li和hi分别表示第i个临界带宽的最小频率和最大频率,i在[1,imax]的范围内,并且语音信号的采样频率决定imax;
[0064] 计算出噪声掩蔽阈值后,利用噪声掩蔽阈值和自适应的谱减法系数,得到两个谱减法系数,再结合Berouti提出的改进谱减法的方法,得到听觉掩蔽谱减法表达式。
[0065] 以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈