专利汇可以提供一种汉语口语重音自动检测方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种汉语口语重音自动检测方法,是通过 语音识别 技术对说话人的朗读语音结合其朗读或跟读文本内容进行自动切分与对齐,利用语音 信号 处理技术结合语言学的基本理论对切分的语音段进行特征参数的提取,然后通过 机器学习 的方法对提取的特征参数进行分类处理得到说话人汉语口语重音与非重音的检测及其诊断信息。本发明能自动、有效地检测出朗读者发音的重音 位置 是否正确,应用于普通话自动测试与评估系统中,有助于让学生更好的把握汉语的重音,表达的意思更加明确。在普通话辅助教学 软件 中增加重音的检测及其诊断功能,有助于使发音者的普通话更加纯正和地道,从而达到高效交际的目的。,下面是一种汉语口语重音自动检测方法专利的具体信息内容。
1.一种汉语口语重音自动检测方法,其特征是:
步骤1:对语音文件结合其对应的标准朗读文本内容进行自动切分对齐;
步骤2:利用语音信号处理技术结合语言学的基本理论对切分的语音段提取基频特征参数、音长特征参数、绝对能量特征参数及其频谱特征参数;
步骤3:对提取的上述特征参数进行句中归一化,得到归一化的特征参数;
步骤4:对归一化的特征参数进行数据预处理,得到用于分类的特征参数;
步骤5:利用分类器对预处理后的分类特征参数进行分类,得到各音节的机器得分;
步骤6:设定门限对所要检测出来的重音或非重音音节进行检测及其输出诊断信息。
2.根据权利要求1所述的汉语口语重音检测方法,其特征是:所述自动切分对齐是通过语音文件及其朗读文本内容结合声学模型、发音词典得到声学得分,再利用维特比搜索技术得到最终的各音节片段信息,该各音节片段信息包括各音节及其声母、韵母的起始时间和终止时间。
3.根据权利要求1所述的汉语口语重音检测方法,其特征是:所述基频特征参数提取包括:
步骤21:用自相关法以帧为单位对语音文件做基频提取,并修正提取过程中产生的倍频或半频,利用样条函数对没有基频的位置进行插值,得到整句语音的连续的基音频率曲线,切分后的一个音素由至少3帧或3帧以上组成,插值后每帧得到一个基频值;然后分别求得各音节的基频均值、基频最大值、基频最小值、终点基频值和基频幅度差值作为基频特征参数,计算上述基频特征参数过程中的各音节语音帧的范围为该音节的元音音素段部分;
步骤22:对句中各基频特征参数做归一化:是先求得整句语音的基频均值,然后用各音节的基频均值、基频最大值、基频最小值、终点基频值和基频幅度差值除以整句语音的基频均值得到句中归一化的基频特征参数。
4.根据权利要求1所述的汉语口语重音检测方法,其特征是:所述绝对能量特征参数提取是先求得各音节的绝对能量和句平均绝对能量;然后对各音节的绝对能量通过句平均绝对能量做句中归一化得到各音节的绝对能量特征参数。
5.根据权利要求4所述的汉语口语重音检测方法,其特征是:所述句中归一化的方法:是用各音节的绝对能量去除以句平均绝对能量。
6.根据权利要求1所述的汉语口语重音检测方法,其特征是:所述的音长特征参数提取,是首先计算一段语音的平均音长,平均音长的计算为各音节的长度之和除以音节的个数;通过各音节音长去除以平均音长,得到各音节音长的平均音长归一化特征参数。
7.根据权利要求1所述的汉语口语重音检测方法,其特征是:所述的音长特征参数提取,利用各音节的音长除以语速做归一化得到音长的语速归一化特征参数。
8.根据权利要求1所述的汉语口语重音检测方法,其特征是:所述的频谱特征参数是以帧为单位对各音节的语音进行高频预加重,加汉明窗,通过快速傅立叶变换得到各帧的频域信息,采用带通滤波器滤波计算各帧的子带能量,结合音节的时间信息求得各音节的子带能量和句平均子带能量,用音节平均子带能量除以句平均子带能量各做句中归一化得到各音节的子带能量特征参数。
9.根据权利要求1所述的汉语口语重音检测方法,其特征是:所述重音的检测是采用机器学习方法对所提取的特征参数进行分类处理,得到最后的重音检测结果;分类器可选用支持向量机、人工神经网络、决策树、随机森林或高斯混合模型分类器;对预处理过的特征参数通过分类器处理后,每一个音节得到一个机器得分,再通过设定门限来确定该得到一句朗读语音信息中的重音与非重音部分的检测结果。
10.根据权利要求9所述的汉语口语重音检测方法,其特征是:对分类器检测出来的重音结果与标注好重音部分的朗读文本内容进行对比,确认重音词是否发音正确;通过文本的形式提示朗读者在发音的时候应该重读的字或词是否重读、没有标记重读的字或词是否发成了重音。
本发明涉及语音识别、普通话自动测试与评估以及汉语口语教学领域,涉及一种实用的汉语口语重音检测方法。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种以太坊网络行为分析方法及相应存储介质与电子装置 | 2020-05-08 | 818 |
项目加速的自动评估 | 2020-05-11 | 820 |
一种断路器缺陷识别方法 | 2020-05-11 | 529 |
一种基于投票集成学习的心电数据智能分类方法 | 2020-05-12 | 330 |
基于深度森林的文本对象推荐方法 | 2020-05-11 | 660 |
基于上下文检测的智能手机隐式身份认证方法 | 2020-05-11 | 663 |
一种基于图分析的反欺诈检测方法及检测系统 | 2020-05-08 | 493 |
一种CNS药物关键特征识别方法 | 2020-05-08 | 725 |
一种基于基因谱的乳腺癌淋巴结转移预测方法及预测系统 | 2020-05-08 | 66 |
城市公共安全态势展示方法、装置、存储介质及电子设备 | 2020-05-08 | 170 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。