专利汇可以提供人工耳蜗听觉场景识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种人工 耳 蜗听觉场景识别方法,其包括如下步骤:(A)预处理程序模 块 将声音 信号 进行分 帧 与 加窗 处理;(B)特征提取程序模块将预处理后的 声音信号 进行特征提取;(C)场景识别程序模块将特征提取后的声音信号进行CNN运算,得出各预设场景的概率值,将概率值最大的场景判定为最终场景并输出。该通过CNN处理,能识别不同的听觉场景,为语音处理器后续语音增强及言语策略等 信号处理 模块提供指示,使语音处理器的信号处理与听觉场景更加匹配,输出与实际听觉场景更加相符的刺激信号,提高患者在噪声环境下的 语音信号 的清晰度、可懂度,同时还可提高音乐场景下的聆听效果,进一步改善 人工耳蜗植入 患者的 生活 质量 。,下面是人工耳蜗听觉场景识别方法专利的具体信息内容。
1.一种人工耳蜗听觉场景识别方法,其包括如下步骤:(A)预处理程序模块将声音信号进行分帧与加窗处理;(B)特征提取程序模块将预处理后的声音信号进行特征提取;(C)场景识别程序模块将特征提取后的声音信号进行CNN运算,得出各预设场景的概率值,将概率值最大的场景判定为最终场景。
2.如权利要求1所述的人工耳蜗听觉场景识别方法,其特征在于:在步骤A中,该加窗处理使用Hamming窗或Hanning窗。
3.如权利要求2所述的人工耳蜗听觉场景识别方法,其特征在于:Hamming窗:
其中,窗长N=256,帧移取128。
4.如权利要求1所述的人工耳蜗听觉场景识别方法,其特征在于:在步骤B中,该特征向量提取采用MFCC、FBank或语谱图。
5.如权利要求4所述的人工耳蜗听觉场景识别方法,其特征在于:Fbank的特征提取流程:对预处理输出的每一帧声音信号进行FFT变换:X[i,k]=FFT[xi(m)];对每一帧FFT后的数据 计算 谱线能 量 :E [i ,k] = [xi (k) ] 2 ;计算 Me l滤 波器能 量 :
其中,Hm(k)为Mel滤波器的频率响应,m为Mel滤波
器个数,这里取40;取对数运算:Fbank=log[S(i,m)]。
6.如权利要求1所述的人工耳蜗听觉场景识别方法,其特征在于:在步骤C中,该CNN包括输入层,中间层及输出层,其中,该输入层为声音信号特征构成的二维数据矩阵,该中间层包括卷积输出层,池化输出层以及全连接输出层,该全连接输出层由一个一维数据组成,该池化输出层比该卷积输出层少一个。
7.如权利要求6所述的人工耳蜗听觉场景识别方法,其特征在于:池化处理采用Maxpooling或Meanpooling。
8.如权利要求7所述的人工耳蜗听觉场景识别方法,其特征在于:激活函数使用ReLU、sigmoid、tanh或Logistic,其中,ReLU公式:
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种智能音乐控制播放装置、方法 | 2020-05-08 | 451 |
一种将心跳信号转换成音乐的系统 | 2020-05-16 | 704 |
背景音乐的提示及识别方法、装置、设备以及介质 | 2020-05-14 | 965 |
BPM检测方法及装置 | 2020-05-15 | 610 |
一种具有远红外热释电感应功能的无人售货柜 | 2020-05-14 | 820 |
一种自动调节转向的音响 | 2020-05-11 | 937 |
多态新能源汽车氛围灯系统及其控制方法 | 2020-05-12 | 706 |
一种缓解心理症状的可视化音乐装置 | 2020-05-15 | 429 |
基于单片机的抢答器电路 | 2020-05-13 | 282 |
一种智能睡眠系统 | 2020-05-16 | 720 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。