首页 / 专利库 / 信号处理 / 信号 / 音频信号 / 语音信号 / 一种云数据中心语音识别方法

一种数据中心语音识别方法

阅读:394发布:2024-02-20

专利汇可以提供一种数据中心语音识别方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种 云 数据中心 语音识别 方法,利用HBR110芯片,通过动态时间规整 算法 进行语音处理与分析,识别语音所有者的权限,实现语音的识别,系统包括:1)整体架构设计,2) 硬件 设计和3) 软件 设计,其中,1)整体架构设计,是该系统的首要设计工作,通过分析系统需求与调研市场上的主流语音识别产品,设计系统整体架构;选择人语音识别处理器HBR110芯片,结合8031 单片机 、音频放大 电路 、SPIFLASH 存储器 以及必要的外围电路,利用动态时间规整算法进行语音处理与分析,实现语音识别和权限分配的安全功能。,下面是一种数据中心语音识别方法专利的具体信息内容。

1.一种数据中心语音识别方法, 其特征在于利用HBR110芯片,通过动态时间规整算法进行语音处理与分析,识别语音所有者的权限,实现语音的识别,系统包括:1)整体架构设计,2)硬件设计和3)软件设计,其中,
1)整体架构设计,是该系统的首要设计工作,通过分析系统需求与调研市场上的主流语音识别产品,设计系统整体架构;选择人语音识别处理器HBR110芯片,结合8031单片机、音频放大电路、SPI FLASH存储器以及必要的外围电路,利用动态时间规整算法进行语音处理与分析,实现语音识别和权限分配的安全功能;
2)硬件设计,硬件设计工作,包括系统原理图设计、PCB设计;
3)软件设计,软件的设计工作,使用汇编语言对8031单片机进行编程,实现对硬件系统的控制;控制HBR110芯片完成如下操作:
S1 预处理:包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响,并涉及到语音识别基元的选取和端点检测问题;
S2特征提取:用于提取语音中反映本质特征的声学参数,包括平均能量、平均跨零率、共振峰;
S3 训练:在识别之前通过让讲话者多次重复语音,从原始语音样本中去除冗余信息,保留关键数据,再按照一定规则对数据加以聚类,形成模式库;
S4 模式匹配:是整个语音识别系统的核心,它根据一定规则以及专家知识,计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。

说明书全文

一种数据中心语音识别方法

技术领域

[0001] 本发明涉及计算机应用领域, 具体地说是一种云数据中心语音识别方法。

背景技术

[0002] 随着信息科技的发展,云计算逐步成为业界的发展热点,国内外各大厂商的云计算服务平台也开始纷纷投入到科学、教育、文化、卫生、政府、高性能计算电子商务、物联网等多个领域进行使用。
[0003] 为了保障云数据中心的安全,大多数云数据中心的机房中安装了密码身份识别系统。但是由于传统的文本密码具有易复制、易失窃、易遗忘等缺点,导致密码身份识别系统存在很多安全漏洞。
[0004] 语音作为一种生物特征,具有人体所固有的不可复制的唯一性。将语音识别系统与云数据中心相连,可以将不同用户的不同声音信息作为密钥,识别用户的身份,并决定用户的使用权限。这样,相对于传统的文本密码,更加难以破译,具有更高的安全性。
[0005] 除此之外,针对市场上语音识别系统一般为单特定人识别和非特定人识别的局限,本系统提出多特定人语音识别方案,解决了云数据中心多用户使用权限的分配问题。

发明内容

[0006] 本发明的目的是提供一种云数据中心语音识别方法。
[0007] 本发明的目的是按以下方式实现的,利用HBR110芯片,通过动态时间规整算法进行语音处理与分析,识别语音所有者的权限,实现语音的识别,系统包括:1)整体架构设计,2)硬件设计和3)软件设计,其中,
1)整体架构设计,是该系统的首要设计工作,通过分析系统需求与调研市场上的主流语音识别产品,设计系统整体架构;选择人语音识别处理器HBR110芯片,结合8031单片机、音频放大电路、SPI FLASH存储器以及必要的外围电路,利用动态时间规整算法进行语音处理与分析,实现语音识别和权限分配的安全功能;
2)硬件设计,硬件设计工作,包括系统原理图设计、PCB设计;
3)软件设计,软件的设计工作,使用汇编语言对8031单片机进行编程,实现对硬件系统的控制;控制HBR110芯片完成如下操作:
S1 预处理:包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响,并涉及到语音识别基元的选取和端点检测问题;
S2特征提取:用于提取语音中反映本质特征的声学参数,包括平均能量、平均跨零率、共振峰;
S3 训练:在识别之前通过让讲话者多次重复语音,从原始语音样本中去除冗余信息,保留关键数据,再按照一定规则对数据加以聚类,形成模式库;
S4 模式匹配:是整个语音识别系统的核心,它根据一定规则以及专家知识,计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。
[0008] 本发明的有益效果是:a)多特定人语音识别技术:突破了目前市场上一般为单特定人识别或非特定人识别的语音识别系统局限;
b)权限分配提高安全性:本系统能够针对不同用户分配不同的使用权限,从而提高了系统的安全性能;
c)独特口音的处理技术:用户不须使用标准发音,即可顺畅使用该系统;
d)多样化语音模型样本:机器训练时输入的语音模型可由用户需求而定,不必使用系统提供的特定样本。
[0009] 经过实验验证,本系统具有较高的准确性和实用性,语音匹配正确率达90%以上。附图说明
[0010] 图1是语音识别流程图;图2是语音识别硬件架构图。

具体实施方式

[0011] 参照说明书附图对本发明的方法作以下详细地说明。
[0012] 本发明的一种云数据中心语音识别方法, 其结构是由本系统的实现流程如附图1所示。正如发明内容中所描述的,本发明的体系结构主要包括:整体架构设计,硬件设计,软件设计。
[0013] 其中,整体架构设计是系统的首要设计工作,通过广泛调研,选择采用如附图2的硬件架构。协处理器HBR110负责完成对声音的输入、识别、处理、输出工作由,主控芯片8031负责完成相应的控制操作,后者通过程序控制整个系统的工作,是系统的核心。
[0014] 硬件设计是系统设计的第二步。通过综合分析各电子元件的元件特性、散热要求、工作环境等,分别设计主处理器8031单片机、协处理器HBR110芯片的外围电路及音频放大电路和SPI FLASH存储设备电路,完成系统原理图和PCB图。
[0015] 软件设计是系统设计的最后一步。使用汇编语言对8031单片机进行编程,控制HBR110芯片完成如下操作:S1 预处理:包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等,并涉及到语音识别基元的选取和端点检测问题;
S2特征提取:用于提取语音中反映本质特征的声学参数,如平均能量、平均跨零率、共振峰等;
S3 训练:在识别之前通过让讲话者多次重复语音,从原始语音样本中去除冗余信息,保留关键数据,再按照一定规则对数据加以聚类,形成模式库;
S4 模式匹配:是整个语音识别系统的核心,它根据一定规则以及专家知识,计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。
[0016] 除说明书所述的技术特征外,均为本专业技术人员的已知技术。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈