首页 / 技术领域 / 音频分类 / 专利数据
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
21 音频信号分类处理方法、装置及设备 PCT/CN2014/081400 2014-07-01 WO2015000401A1 2015-01-08 许丽净

提供一种音频信号分类处理方法、装置及设备,所述方法包括:获取音频信号中待分类中满足连续性约束条件的音调分量的数量、所述音频信号中待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项(101);根据所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项,确定所述音频信号中待分类帧是音乐信号或是语音信号(102)。

22 音频信号的分类方法及装置 PCT/CN2010/071373 2010-03-27 WO2010108458A1 2010-09-30 许丽净; 吴顺妹; 陈立维; 张清

23 基于音频特征空间分层描述的音频分类方法 CN201710398853.9 2017-05-31 CN107301858A 2017-10-27 贺前华; 汪星; 庞文丰; 李艳雄
发明公开一种基于音频特征空间分层描述的音频分类方法,步骤为:通过考察各音频类型GMM模型高斯空间分布之间的重叠程度,将重叠度大的不同类型的高斯分布进行合并,构建音频特征空间描述子;音频类型对区分子模型:根据音频特征空间描述子的构成信息,筛选出音频类型对的非重叠空间描述子以及重叠度小的描述子,然后利用所筛选出的区分描述子构建音频类型对的区分子模型;复杂音频类型的子类型模型采用UBM-GMM的方法;一个音频样本分别从音频特征空间、音频类型空间、音频类型子空间三个层次进行评价,并辅以音频类型对区分子模型评价构建识别方法。本发明既结合传统高斯混合模型的优点,又能很好地对复杂音频进行区分,能较大提高音频分类的准确率。
24 音频特征提取模型的训练方法和音频分类方法 CN202210689267.0 2022-06-16 CN115148195A 2022-10-04 陆劲鸿
申请公开了一种音频特征提取模型的训练方法和音频分类方法,属于计算机技术领域。所述方法包括:获取样本音频对应的原始频谱数据和基准识别结果;对原始频谱数据进行元素遮挡处理,得到原始频谱数据对应的模糊频谱数据;由待训练的音频特征提取模型对模糊频谱数据进行特征提取,得到样本音频对应的音频特征;由待训练的音频识别模型对音频特征进行结果识别,得到样本音频对应的预测识别结果;基于基准识别结果和预测识别结果,对待训练的音频特征提取模型和待训练的音频识别模型进行调参。采用本申请,可以提高训练完成的音频特征提取模型的抗噪声性能,使其可以适用于更多复杂场景中的音频,从而得到更为准确的音频特征。
25 基于音频特征空间分层描述的音频分类方法 CN201710398853.9 2017-05-31 CN107301858B 2020-09-22 贺前华; 汪星; 庞文丰; 李艳雄
发明公开一种基于音频特征空间分层描述的音频分类方法,步骤为:通过考察各音频类型GMM模型高斯空间分布之间的重叠程度,将重叠度大的不同类型的高斯分布进行合并,构建音频特征空间描述子;音频类型对区分子模型:根据音频特征空间描述子的构成信息,筛选出音频类型对的非重叠空间描述子以及重叠度小的描述子,然后利用所筛选出的区分描述子构建音频类型对的区分子模型;复杂音频类型的子类型模型采用UBM‑GMM的方法;一个音频样本分别从音频特征空间、音频类型空间、音频类型子空间三个层次进行评价,并辅以音频类型对区分子模型评价构建识别方法。本发明既结合传统高斯混合模型的优点,又能很好地对复杂音频进行区分,能较大提高音频分类的准确率。
26 应用数字音频特征集分类音频的系统及其方法 CN200610162129.8 2006-12-05 CN101196888A 2008-06-11 林宗庆; 王建兴; 丁彬; 麦文伟; 王舜正
发明提供一种应用数字音频特征集分类音频的系统及其方法,该方法包含下列步骤。首先,将该音频译码为一无编码音频。接着,将该无编码音频区分为多个音频片段,并以一包括九组特征运算式的数字音频特征集将每一音频片段进行特征抽取,该九组特征运算式分别用以计算过零次数变异数、过零次数的第三阶扭矩、过零次数分布、归一化能量标准差、归一化能量最小值、归一化能量的差值、四频段的对数能量平均值、四频段的对数能量标准差以及归一化能量的差,而可达到分类音频的目的。本发明自动从大量播送音频的公开音频源中搜集所喜爱类型的音频,如音乐,收听者不需费时费心地录音,便可以拥有一首首完整的音乐。
27 用于音频场景分类的音频处理装置及其方法 CN201880099051.0 2018-12-21 CN112955954B 2024-04-12 耶塞妮娅·拉库蒂尔·帕罗蒂; 弗洛里安·艾本; 安德里亚·克雷斯皮; 邓军
发明涉及一种被配置为将音频信号分类为一个或多个音频场景类别的音频处理装置(200),所述音频信号包括分量信号。所述装置(200)包括:处理电路,被配置为:将所述音频信号的所述分量信号分类为前景层分量信号或背景层分量信号;基于所述音频信号获得音频信号特征;根据对所述分量信号的所述分类,选择第一权重集或第二权重集;以及基于所述音频信号特征、所述前景层分量信号或所述背景层分量信号以及所述选择的权重集,对所述音频信号进行分类。
28 用于音频场景分类的音频处理装置及其方法 CN201880099051.0 2018-12-21 CN112955954A 2021-06-11 耶塞妮娅·拉库蒂尔·帕罗蒂; 弗洛里安·艾本; 安德里亚·克雷斯皮; 邓军
发明涉及一种被配置为将音频信号分类为一个或多个音频场景类别的音频处理装置(200),所述音频信号包括分量信号。所述装置(200)包括:处理电路,被配置为:将所述音频信号的所述分量信号分类为前景层分量信号或背景层分量信号;基于所述音频信号获得音频信号特征;根据对所述分量信号的所述分类,选择第一权重集或第二权重集;以及基于所述音频信号特征、所述前景层分量信号或所述背景层分量信号以及所述选择的权重集,对所述音频信号进行分类。
29 用于音频分类和音频处理的设备和方法 CN201310100367.6 2013-03-26 CN104078050A 2014-10-01 芦烈; 阿兰·西费尔特; 王珺
发明公开了用于音频分类和音频处理的设备和方法。在一个实施方式中,音频处理设备包括:音频分类器,用于实时地将音频信号分类到至少一个音频类型中;音频改善装置,用于改善听众的体验;以及调整单元,用于基于该至少一个音频类型的置信度值来以连续的方式调整音频改善装置的至少一个参数。
30 零样本音频分类模型训练方法、零样本音频分类方法 CN202311629438.1 2023-11-30 CN117649857A 2024-03-05 俞凯; 吴梦玥; 徐薛楠; 张平越
申请公开一种零样本音频分类模型训练方法,包括:获取样本音频所属声音类别对应的声音属性描述;根据所述声音属性描述确定对应于所述样本音频的属性描述文本;根据所述样本音频和所述属性描述文本之间的相似度进行零样本音频分类模型训练。本申请根据声音属性描述确定对应于所述样本音频的属性描述文本,使得本申请中的描述文本侧重多样化的声音属性,声音属性更能代表声音的内在特征,从而提升了训练得到的零样本音频分类模型的识别准确率。
31 音频分类模型的训练方法、音频分类方法、以及装置 CN202310891475.3 2023-07-19 CN116913257A 2023-10-20 江益靓; 姜涛; 赵伟峰
本公开公开了一种音频分类模型的训练方法、音频分类方法、以及装置,属于计算机技术领域。所述方法包括:获取待训练的音频分类模型对应的类型标签层级关系;获取样本音频的音频数据和样本音频的基准分类结果;将样本音频的音频数据输入待训练的音频分类模型,得到预测分类结果;基于预测分类结果和基准分类结果之间的匹配情况,确定第一损失值;基于类型标签层级关系中存在关联关系的类型标签在预测分类结果中对应的匹配概率值,确定第二损失值;基于第一损失值和第二损失值,对待训练的音频分类模型进行训练,若满足预设训练结束条件则得到训练完成的音频分类模型。采用本公开,提高了训练完成的音频分类模型对各层级预测的准确性和一致性。
32 音频分类模型的训练方法、音频分类方法、装置及设备 CN202010173624.9 2020-03-13 CN111369982B 2024-06-25 邓菁; 王秋明
申请提供一种音频分类模型的训练方法、音频分类方法、装置及设备,属于音频处理技术领域。音频分类模型的训练方法包括:获取音频样本,音频样本包括:语音音频样本、音乐音频样本;对各音频样本进行分,并提取帧特征;采用预设窗函数,提取各音频样本中每帧的窗特征,并根据帧特征获取组合特征,其中,组合特征标记语音标签或音乐标签;采用组合特征和预设神经网络,训练获取音频分类模型。本申请可以将复杂程度较高的音乐音频和语音音频进行分类,进而提高分类结果的准确性。
33 一种音频分类模型的训练方法、音频的分类方法及装置 CN202010673260.0 2020-07-14 CN111916107A 2020-11-10 何维祯
发明公开了一种音频分类模型的训练方法,包括:根据预设的高斯概率模型对预先采集的音频样本集中的音频数据进行计算,得到音频的训练集;将所述音频的训练集中的音频数据进行傅里叶变换得到对应的频谱;将所述频谱输入至预设的GRU神经网络中进行后向传播训练,直至损失收敛,以得到训练完成的音频分类模型。本发明实施例还公开了一种音频的分类方法及装置,能有效解决现有技术由于环境噪音的影响经常出现误检的问题。
34 音频分类模型的训练方法、音频分类方法、装置及设备 CN202010173624.9 2020-03-13 CN111369982A 2020-07-03 邓菁; 王秋明
申请提供一种音频分类模型的训练方法、音频分类方法、装置及设备,属于音频处理技术领域。音频分类模型的训练方法包括:获取音频样本,音频样本包括:语音音频样本、音乐音频样本;对各音频样本进行分,并提取帧特征;采用预设窗函数,提取各音频样本中每帧的窗特征,并根据帧特征获取组合特征,其中,组合特征标记语音标签或音乐标签;采用组合特征和预设神经网络,训练获取音频分类模型。本申请可以将复杂程度较高的音乐音频和语音音频进行分类,进而提高分类结果的准确性。
35 一种宽带音频编解码器中的音频信号分类装置及分类方法 CN200710152235.2 2007-09-19 CN101393741A 2009-03-25 钟毅睿
发明公开了一种宽带音频编解码器中的音频信号分类装置,背景噪声估计控制模用于接收分类参数提取模块的频谱分布参数,并将更新速率发送到信号初始分类模块;信号初始分类模块根据子带能量参数和更新速率对所述音频输入信号进行初始分类,将初始分类结果发送到分类参数提取模块和信号分类判决模块;分类参数提取模块用于对输入信号进行提取和分类,将得到的信号分类特征参数发送到信号分类判决模块,同时将得到的频谱分布参数反馈到背景噪声估计控制模块;信号分类判决模块根据所述初始分类结果对所述分类特征参数设置类别最终标志,所述类别最终标志用于定义输出信号的判决类型。本发明还公开了一种宽带音频编解码器中的音频信号分类方法。
36 基于再次分类的音频分类装置及其实现方法 CN200810240339.3 2008-12-19 CN101751920A 2010-06-23 张培; 闫建新
发明涉及一种音频分类方法,其在音频编码前对音频信号进行分类,该音频分类方法包括初次分类和再次分类,其特征在于,再次分类包括对初次分类结果进行平滑。另外,本发明还公开了一种音频分类装置,其被设置在音频编码器前端用于对音频信号分类,该音频分类装置包括初次分类器和再次分类器,其特征在于,再次分类器包括对初次分类结果进行平滑处理的平滑模。使用根据本发明的方法及装置,能从音频信号中正确区分出音乐和语音。由于再次分类包括对初次分类结果进行平滑,因此剔除了音频类型切换过快时导致的偶尔的误判,同时也减少了运算复杂度,从而实现了正确并且简单区分音乐和语音。
37 用于分类音频信号的设备及方法 CN202380067093.7 2023-09-26 CN119947652A 2025-05-06 P·比斯金; P·伦宁格; C·M·舒默尔
本公开涉及一种用于对至少一个音频信号(20)分类之设备(10)。该设备(10)包括:输入接口(12),其经配置以接收该音频信号(20)的输入信息(22);经训练第一基于机器学习的分类器(16),其经配置以将该输入信息(22)映像至音频信号的第一类别及和第二类别(24;26)中的一个;经训练第二基于机器学习的分类器(18),其经配置以若该音频信号(20)属于音频信号的该第一类别(24),则将属于音频信号的该第一类别(24)的该音频信号的该输入信息(22)映像至音频信号的复数个第三类别(28)中的一个;和输出接口,其经配置以输出关于该音频信号(20)属于何类别的信息。
38 用于音频编码模式选择的频谱分类器 CN202411598730.6 2021-06-29 CN119323963A 2025-01-17 C·基努蒂亚; E·诺维尔
发明涉及用于音频编码模式选择的频谱分类器。提供了一种在编码器中的确定要使用两个编码模式中的哪一个或两组编码模式中的哪一组的方法。该方法包括导出(1001)输入音频信号的频谱。该方法包括获得(1003)频谱的临界频率区域的幅度。该方法包括获得(1005)的峰度测量。该方法包括获得(1007)噪声频带检测测量。该方法包括至少基于峰度测量和噪声频带检测测量,确定(1009)要使用两个编码模式中的哪一个或两组编码模式中的哪一组。该方法包括基于被确定为要使用的编码模式,对输入音频信号进行编码(1011)。
39 一种音频数据的聚类分类方法及系统 CN202410600198.0 2024-05-15 CN118538235B 2024-11-15 徐燕萍
发明提供一种音频数据的聚类分类方法及系统,其中方法包括:辅助用户个性化选择音频聚类分类模型训练样本;当选择完成时,利用音频聚类分类模型训练样本,训练神经网络模型,得到音频聚类分类模型;获取待聚类分类的音频数据;利用音频聚类分类模型,对音频数据进行聚类分类,并输出聚类分类结果。本发明的音频数据的聚类分类方法及系统,提供用户个性化选择音频聚类分类模型的音频聚类分类模型训练样本的途经,用户可以结合自身的音频聚类分类预期进行实施,使得利用音频聚类分类模型对音频数据进行聚类分类的聚类分类结果符合用户的音频聚类分类预期,极大程度上提升了用户体验。
40 音频数据的分类方法及相关装置 CN202410349445.4 2024-03-25 CN118675545A 2024-09-20 向国徽
申请提供一种音频数据的分类方法及及相关装置。该方法包括:获取有标签音频序列和无标签音频信号,其中,有标签音频序列包含多个时间连续的音频信号,且标记有每个音频信号的类别标签;确定有标签音频序列和无标签音频信号之间的距离矩阵;根据距离矩阵,确定无标签音频信号的预测类别信息,预测类别信息包含候选的类别标签以及每个候选的类别标签的频率;基于每个候选的类别标签的频率,从候选的类别标签中为无标签音频信号确定目标类别标签。可以解决现有技术中无标签音频信号的分类结果不准确的问题。
QQ群二维码
意见反馈