专利汇可以提供一种智能语音识别开关面板专利检索,专利查询,专利分析的服务。并且本 发明 请求 保护一种智能 语音识别 开关 面板,其包括:电源模 块 、语音识别模块、按键和 LED灯 指示模块、通讯模块、存储模块和处理器模块,电源由市电110-220VAC提供,并由 开关电源 降压到12V和线性降压到3.3V和5V给整个智能语音识别开关面板提供稳定电源;处理器模块用于处理语音识别模块、通讯模块数据交换和按键指示模块的协调;语音识别模块是智能识别面板所对应功能的语音,由处理器模块处理语音相对应的动作,用于对人 耳 听觉系统的语音 信号 进行处理识别;通讯模块是与整个系统之间通信来实现远程控制的 桥梁 ,存储模块用于存储处理器模块的信息,LED灯指示语音识别和开关状态;所述语音识别模块又包括噪声获取模块、语音分离模块、目标 语音信号 获取模块、预处理模块。本发明可以提高智能语音识别开关面板的识别准确度。,下面是一种智能语音识别开关面板专利的具体信息内容。
1.一种智能语音识别开关面板,其特征在于,包括:电源模块、语音识别模块、按键和LED灯指示模块、通讯模块、存储模块和处理器模块,电源由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音识别开关面板提供稳定电源;处理器模块用于处理语音识别模块、通讯模块数据交换和按键指示模块的协调;语音识别模块是智能识别面板所对应功能的语音,由处理器模块处理语音相对应的动作,用于对人耳听觉系统的语音信号进行处理识别;通讯模块是与整个系统之间通信来实现远程控制的桥梁,存储模块用于存储处理器模块的信息,LED灯指示语音识别和开关状态;
所述语音识别模块又包括噪声获取模块、语音分离模块、目标语音信号获取模块、预处理模块,噪声获取模块用于采用模拟人耳听觉系统获取含噪声的语音信号;语音分离模块用于对得到的含噪声的语音信号,采用基于人耳听觉特性的语音分离方法进行语音分离;
目标语音信号获取模块用于采用语音定位获取目标语音信号;预处理模块用于对获取的目标语音信号再进行其他预处理,其他预处理包括预加重、分帧加窗、双门限端点检测、听觉掩蔽谱减法进行处理,所述双门限端点检测主要是改变短时过零率的阈值,不再寻找过零率大于某一个阈值,而是小于某一阈值完成语音识别;
听觉掩蔽谱减法具体为:在计算听觉掩蔽值之前,首先求得临界带宽的功率谱、扩展临界带宽的功率谱以及噪声掩蔽扩展门限,然后把噪声掩蔽扩展门限与人耳听觉的设定绝对门限值进行对比,听觉掩蔽阈值就是它们之中的最大值。
2.根据权利要求1所述的一种智能语音识别开关面板,其特征在于,所述电源模块由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音开关面板提供稳定电源;处理器模块采用Microchip的PIC24内核16位先进的低功耗芯片;按键和LED灯指示模块用于面板开关操作、语音识别和开关状态指示;存储模块用于存储语音识别离线版本的数据,和存储开关状态。
3.根据权利要求1所述的一种智能语音识别开关面板,其特征在于,所述语音分离模块采用基于人耳听觉特性的语音分离方法进行语音分离具体包括:2-1)经过耳蜗基底膜模型进行频谱分析;选择具有人耳听觉特性的Gammatone滤波器组对语音信号进行频率分解;所述Gammatone滤波器组频率的选择范围从20Hz-4KHz分别对左、右耳混叠信号按时间帧进行频率分解;耳蜗基底膜模型将语音信号按照滤波器个数进行传递;2-2)再通过上橄榄核模型进行语音信息提取;2-3)最后在下丘脑细胞模型中完成语音分离。
4.根据权利要求3所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,所述步骤2-2)通过上橄榄核模型进行语音信息提取具体为;
耳蜗基底膜处理语音信号后分成多个通道传递给上橄榄复合体进行语音信号的双耳时间差ITD和双耳水平差ILD定位信息的提取,ITD的计算公式如下:
式中:
——左耳和右耳的语音信号的互相关,可由下式计算:
式中:
——左耳和右耳语音信号互功率谱
ILD的计算公式如下:
式中:
——左耳和右耳的ILD值;Ωi——子带i的频率范围(1KHz~4KHz)Wi(ω)——滤波器权重;S(ω)——声源功率谱。
5.根据权利要求4所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,当信号为20Hz到1000Hz低频语音信号时,重合神经元模型只有来自上橄榄内侧的语音特征输入;1000Hz到4KHz语音信号时,上橄榄外侧和上橄榄内侧的语音特征都输入重合神经元;高于4KHz语音信号时,重合神经元只有上橄榄外侧语音特征的输入。
6.根据权利要求5所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,所述临界带宽的表达式如下:
Z=26.18f/(1960+f)-0.53
其中,Z表示临界带宽编号,f表示频率;
所述扩展临界带宽的功率谱 在式中,P(k)为信号快速傅里叶变换的功率
谱,li和hi分别表示第i个临界带宽的最小频率和最大频率,i在[1,imax]的范围内,并且语音信号的采样频率决定imax;
计算出噪声掩蔽阈值后,利用噪声掩蔽阈值和自适应的谱减法系数,得到两个谱减法系数,再结合Berouti提出的改进谱减法的方法,得到听觉掩蔽谱减法表达式。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于蓝牙mesh网络的楼宇监测系统 | 2020-05-11 | 503 |
一种智能显示系统 | 2020-05-11 | 843 |
数据流检测方法、装置及存储介质 | 2020-05-08 | 510 |
一种液化气智能监测仪及监测方法 | 2020-05-08 | 122 |
无线耳机控制装置及控制方法、语音控制设置方法和系统 | 2020-05-08 | 239 |
一种安全驾驶系统解锁启动方法和系统 | 2020-05-08 | 332 |
一种智能医用周转箱 | 2020-05-08 | 111 |
一种智能电动车防盗系统 | 2020-05-11 | 612 |
直流智能PDU | 2020-05-08 | 431 |
一种智能仓的主控板 | 2020-05-08 | 321 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。