专利汇可以提供一种端到端的语音意图识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种端到端的语音意图识别方法,涉及语音意图识别技术领域。现有语音意图识别的应用,大多都是先通过 语音识别 获取文本再进行意图识别,这种基于文本的意图识别方式,其准确率严重依赖于语音识别转译文本的准确率,存在语音意图识别不准确的文图。为解决该问题,本发明技术方案要点是输入待识别语音,对其进行降噪、特征提取处理,将待识别语音转化为包含声音信息的 特征向量 ,再将特征向量输入至语音意图识别模型,输出语音意图。其中,语音意图识别模型采用 深度学习 网络的预训练模型思想。本发明达到了减少语音识别造成的信息缺失,提高语音意图识别准确率的效果。,下面是一种端到端的语音意图识别方法专利的具体信息内容。
1.一种端到端的语音意图识别方法,其特征在于,包括以下步骤:
S1、输入待识别语音,对其进行降噪、特征提取处理,将待识别语音转化为包含声音信息的特征向量;
S2、将特征向量输入至语音意图识别模型,输出语音意图。
步骤S2中,语音意图识别模型包括有预训练模型和意图识别训练模型两部分,具体模型训练包括以下步骤:
S2.1、收集并截取大量包含用户意图的语音,人工标注用户语音中所包含的用户意图类别,得到大量带有意图标签的用户语音;
S2.2、将带有用户意图的语音,通过预训练模型,训练出包含语音意图特征的音素和字素;
S2.3、将带有意图标签的用户语音作为训练集,载入预训练模型,构建意图识别训练模型。
预训练模型的构建包括如下步骤:
a、接收声序列数据输入;
b、使用卷积神经网络提取语音特征;
c、使用循环神经网络提取音素、字素特征;
d、调整神经网络参数形成预训练模型。
2.根据权利要求1所述的一种端到端的语音意图识别方法,其特征在于:在预训练模型的基础上,语音意图识别模型的构建包括如下步骤:
a、接收包含意图标签的语音输入数据;
b、载入预先训练完成的预训练模型,导入循环神经网络中进行意图识别训练模型训练;
c、针对输入的语音数据进行模型参数的调整,完成语音意图识别模型训练。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种端到端的语音意图识别方法 | 2020-05-08 | 72 |
快速识别性别的方法及装置、用于识别性别的算法模型的生成方法 | 2020-05-08 | 880 |
一种基于画屏的语音交互方法、画屏及存储介质 | 2020-05-08 | 8 |
端到端的语音合成方法、装置及存储介质 | 2020-05-12 | 473 |
音频生成方法、装置、计算机可读存储介质及计算设备 | 2020-05-11 | 524 |
与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法 | 2020-05-08 | 805 |
キーワード検出装置、キーワード検出方法及びキーワード検出用コンピュータプログラム | 2020-05-11 | 643 |
計量機及び計量機の使用方法 | 2020-05-12 | 94 |
言語識別プログラム、言語識別方法及び言語識別装置 | 2020-05-12 | 911 |
検索インデクス生成装置、検索インデックス生成方法、音声検索装置、音声検索方法及びプログラム | 2020-05-11 | 926 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。