专利汇 - 音频分类相关的专利数据 - PatentHub专利检索|专利汇|专利查询网|发明专利查询分析

序号	专利名	申请号	申请日	公开（公告）号	公开（公告）日	发明人
181	一种抗噪的SVM分类器的音频特征选择方法	CN201810962428.2	2018-08-22	CN109192196A	2019-01-11	龙华; 周金傲; 邵玉斌; 杜庆治
发明涉及一种抗噪的SVM分类器的音频特征选择方法，属于音频信号处理技术领域。本发明具体为S1：利用PAFSA产生初始种群。S2：生成初始SVM参数。S3：送入SVM进行训练和测试。S4：计算个体适应值。S5：进行迭代寻优。S6：调整个体适应值。S7：若满足则输出结果，若不满足，则进入S3进行循环。通过上述步骤，可以过滤掉环境中的噪音，提高了SVM分类器的识别率，提高了语音识别的精度。本发明在寻优的过程中维持样本个体的多样性，提高求解速度和解的精确性，并利用测试函数对该优化方法进行测试和比较。
182	音频分类方法及装置、计算机设备及存储介质	CN201711107617.3	2017-11-10	CN107885845A	2018-04-06	劳振锋; 刘翠
本发明公开了一种音频分类方法及装置、计算机设备及存储介质，属于计算机技术领域。所述方法包括：获取待分类音频所属的目标词条，所述目标词条中包括音频属性相同的音频，所述音频属性用于表征音频的特征；判断所述目标词条是否为纯音乐词条；当所述目标词条为纯音乐词条时，确定所述待分类音频为纯音乐。本发明解决了相关技术中对音频分类的可靠性较低的问题。本发明用于音频分类。
183	基于人工智能的电话拨测音频分类方法及装置	CN201610921879.2	2016-10-21	CN106504768A	2017-03-15	李超; 李先刚; 孙珏
本发明提出一种基于人工智能的电话拨测音频分类方法及装置，其中，该方法包括：获取电话拨测音频数据；利用预设的分类器，对所述电话拨测音频数据进行处理，确定所述电话拨测音频与各类型的相似度，其中，所述预设的分类器为根据历史电话拨测音频数据及其分别对应的电话类型，确定的深度学习模型；根据所述电话拨测音频与各类型的相似度，确定所述电话拨测音频对应的电话类型。通过本发明提供的基于人工智能的电话拨测音频分类方法及装置，实现了利用机器学习的方法，对电话拨测音频进行分类，以确认用户是否是正常用户，从而节省了人工成本，提高了拨测效率。
184	一种具有自定义功能的音频检测分类方法	CN201410055255.8	2014-02-19	CN103824557B	2016-06-15	杨毅; 刘加
一种具有自定义功能的音频检测分类方法，对音频数据进行音频激活检测，通过将部分原始训练集首先按照类型分为若干类训练集，针对每类训练集进行特征提取，并训练与其对应的高斯混合模型及其参数，得到一个全局高斯混合模型；进一步将其他训练集作为新的训练样本，对全局高斯混合模型进行参数更新得到一个局部模型；最后对测试集提取特征，输入局部模型分类器，并对结果进行平滑和输出，本发明通过全局及局部高斯混合模型的训练，可以使高斯混合模型的类别和参数随着样本的增加而更新，与分类器的结合进一步提高了系统性能，最终实现音频检测分类，可广泛应用于涉及音频检测分类的说话人识别、语音识别、人机交互等多种机器学习领域。
185	一种基于音频内容分类的水印嵌入及检测方法	CN201510069647.4	2015-02-10	CN104700841A	2015-06-10	黄寅; 王晓光; 程伟; 吴小茜
本发明提供了一种基于音频内容分类的水印嵌入方法，其步骤如下：步骤一，将来自音频广播系统制作室输出的AES/EBU格式或者模拟音频左右声道格式的广播音频节目源音频信号进行分段；步骤二，对某一段音频信号进行自适应能量检测，如该段音频信号经检测为静音信号，则不进行水印信号的嵌入，否则转入步骤三；步骤三，将音频信号段进行音频特征分析，并基于内容进行分类，包括语音、音乐两类；步骤四，根据该音频信号段所属类别，首先在音频段前半部嵌入音频类别码，然后分别采用不同的水印嵌入算法进行嵌入。本发明在对音频进行分类的基础上，有针对性地选择适应音频所属分类的水印嵌入算法，有效发挥单一算法的优势，提高水印的各项性能。
186	一种具有自定义功能的音频检测分类方法	CN201410055255.8	2014-02-19	CN103824557A	2014-05-28	杨毅; 刘加
一种具有自定义功能的音频检测分类方法，对音频数据进行音频激活检测，通过将部分原始训练集首先按照类型分为若干类训练集，针对每类训练集进行特征提取，并训练与其对应的高斯混合模型及其参数，得到一个全局高斯混合模型；进一步将其他训练集作为新的训练样本，对全局高斯混合模型进行参数更新得到一个局部模型；最后对测试集提取特征，输入局部模型分类器，并对结果进行平滑和输出，本发明通过全局及局部高斯混合模型的训练，可以使高斯混合模型的类别和参数随着样本的增加而更新，与分类器的结合进一步提高了系统性能，最终实现音频检测分类，可广泛应用于涉及音频检测分类的说话人识别、语音识别、人机交互等多种机器学习领域。
187	用于音频内容识别的分类器参数更新方法	CN200810035350.6	2008-03-28	CN101546557B	2011-03-23	黄鹤云; 林福辉
一种用于音频内容识别的分类器参数更新方法，包括如下步骤：获取新的训练数据；进行数据选择，得到数据集一及数据集二；利用数据集一更新高斯混合模型参数；而对于数据集二，则先判断其数据量是否大于一门限值，如其数据量是大于一门限值，则利用数据集二的数据更新整体的高斯混合模型参数，如此本发明可针对当前的高斯混合模型，根据实际测试样本来更新分类器参数，从而可以达到最优化分类的目的。
188	用于音频内容识别的分类器参数更新方法	CN200810035350.6	2008-03-28	CN101546557A	2009-09-30	黄鹤云; 林福辉
一种用于音频内容识别的分类器参数更新方法，包括如下步骤：获取新的训练数据；进行数据选择，得到数据集一及数据集二；利用数据集一更新高斯混合模型参数；而对于数据集二，则先判断其数据量是否大于一门限值，如其数据量是大于一门限值，则利用数据集二的数据更新整体的高斯混合模型参数，如此本发明可针对当前的高斯混合模型，根据实际测试样本来更新分类器参数，从而可以达到最优化分类的目的。
189	一种基于音频摘要的鼾声阻塞部位分类方法	CN202411943776.7	2024-12-26	CN119889365A	2025-04-25	伏长虹; 郭震文; 薛彪; 洪弘
本发明提供一种基于音频摘要的鼾声阻塞部位分类方法，旨在解决现有鼾声分析中数据冗余和分类准确性的问题，为睡眠呼吸暂停综合征的诊断提供可靠的技术支持。通过五个核心模块实现从整夜音频数据中提取关键鼾声片段并进行阻塞部位识别：第一，对麦克风录制的整夜音频信号进行预加重和滑窗分帧等预处理以及生成梅尔频谱图。第二，基于预训练的openL3网络，该模块接收预处理生成的梅尔频谱图作为输入，通过多层卷积网络进行特征提取。第三，基于声学深度特征，通过无监督学习方法实现鼾声片段的聚类和重要性评估。第四，包括基于高斯混合模型的语音端点检测算法，提取非静音的鼾声片段。第五，采用在公开数据集MPSSC上预训练的深度学习网络实现鼾声阻塞部位的识别。
190	音频分类方法、装置、存储介质和电子设备	CN202411907673.5	2024-12-23	CN119673211A	2025-03-21	陈占营; 柯昱企; 唐诗雨; 李翔宇
本发明公开了一种音频分类方法、装置、存储介质和电子设备，可以对目标音频进行解码分析，得到时域下的数字音频信号；基于预先训练的卷积神经网络对所述数字音频信号进行特征提取，得到相应的特征向量；对所述特征向量进行分类，得到所述特征向量分别属于各音频类别的置信度，其中，一个音频类别对应一个置信度；根据各所述置信度，确定所述目标音频的音频类别。由此可以看出，本发明可以直接对时域的数字音频信号进行分类，无需将时域的数字音频信号转换到频域，降低了整体耗时，提高响应速度。
191	经由音频分类进行动态音量调节的方法和装置	CN202411143348.6	2019-09-06	CN119127114A	2024-12-13	M·克里默; R·库弗; S·D·舍夫; C·A·萨默斯
公开了经由音频分类进行动态音量调节的方法和装置。示例方法包括：利用经神经网络训练的模型对与第一音量水平相关联的音频信号的参数进行分析，以确定与音频信号相关联的分类组；确定音频信号的输入音量，所述选择基于与音频信号相关联的分类组；向音频信号施加增益值，所述增益值基于分类组和输入音量，所述增益值将第一音量水平修改成第二音量水平；以及向音频信号施加压缩值，所述压缩值将第二音量水平修改成满足目标音量阈值的第三音量水平。
192	一种音频多模态分类方法、系统及计算机设备	CN202410512520.4	2024-04-26	CN118366472A	2024-07-19	金向锋; 尹嘉航; 潘乐
本发明涉及音频分类技术领域，具体涉及一种音频多模态分类方法、系统及计算机设备，包括以下步骤：获取音频数据；利用多个分类器，对音频数据进行多个模态特征的分类学习，得到多个音频模态分类模型；利用动量梯度对多个音频模态分类模型进行多模态融合，得到用于提高音频分类性能的音频多模态分类模型。本发明利用音频数据的多模态特征进行分类，增加特征量，使得分类结果取决于多样化特征数据，提升分类的准确性，而且在分类过程中利用动量梯度下降法进行各分类模型的融合，保证了各分类模型拟合能力和泛化能力的均衡，进一步提高多模态分类的准确性。
193	一种基于多粒度切片的音频分割与分类方法	CN202310666062.5	2023-06-06	CN116580703A	2023-08-11	刘强; 郑铸
本发明公开了一种基于多粒度切片的音频分割与分类方法，包括对音频进行预处理后得到统一采样率的音频文件；将音频文件在不同的时间粒度下分别按相应的时间粒度进行切片；对不同时间粒度下的每段切片进行MFCC特征提取后作图像化处理；建立图像分类卷积神经网络模型，并进行训练和验证；将待处理音频处理后输入图像分类卷积神经网络模型，得到每个切片的分类结果；根据分类结果进行聚合分析，得到音频文件的分割点和分段类型。本发明通过采用不同时间粒度对长音频进行切割，利用图像分类卷积神经网络模型进行类型判断和分类归集，最后进行聚合分析，从而可快速准确的找到不同类型音频之间的切割点，并判断切割点前后音频段的音频类型。
194	音频分类的方法、装置、设备以及存储介质	CN202010358102.6	2020-04-29	CN111613213B	2023-07-04	吕俊领; 卢传泽; 邱威
本申请公开了一种音频分类的方法、装置、设备以及存储介质，属于计算机技术领域。所述方法包括：获取待分类的音频数据；在目标音频流中按时间顺序获取单位时长的音频数据；每获取一个单位时长的音频数据，基于音频分类模型确定音频数据对应的音频类型；当检测到第一音频数据为人声类型且第一音频数据的前一个音频数据为非人声类型时，确定第一音频数据为人声起点音频数据，当检测到第二音频数据为非人声类型且第二音频数据的前一个音频数据为人声类型时，确定第二音频数据为人声终点音频数据；基于人声起点音频数据和人声终点音频数据，确定目标音频流中的人声音频段，对人声音频段执行目标处理。通过本申请可以提高音频分类的准确性。
195	一种音频分类方法、系统、装置及存储介质	CN202111560886.1	2021-12-20	CN114283841B	2023-06-06	王伟
本发明公开了一种音频分类方法、系统、装置及存储介质，方法包括：获取待分类的第一音频信号，对第一音频信号进行分帧处理得到第二音频信号；对第二音频信号进行端点检测，去除位于第二音频信号的首部和尾部的低能量音频段得到第三音频信号；确定第三音频信号中每一音频帧的短时平均过零率，确定短时平均过零率大于等于预设的第一阈值的第一音频帧数量以及短时平均过零率的波动情况；根据第一音频帧数量和波动情况对第一音频信号进行分类。本发明通过对音频信号进行分帧处理、端点检测并确定音频帧的短时平均过零率，可以对音频信号进行分类，识别出纯音乐音频、纯语音音频以及混合音频，提高了音频分类的准确性，可广泛应用于音频分类技术领域。
196	一种检波器及分类音频信号自动增益控制装置	CN202111289068.2	2021-11-02	CN114124116B	2023-01-24	梁富林; 张百川; 高振中; 龙平
本发明提出了一种数字检波器,所述检波器包括，取模运算模块，其用于获取数字音频信号并进行取模运算，得到取模运算后的值；延时器，其用于延时当前幅度包络值一个周期的包络信号，将取模运算模块第一次运算得到的第一值传输到第一比较器中；第一比较器，其用于接收所述第一值和取模运算模块第二次运算得到的第二值，将所述第一值和第二值进行比较；第二比较器，其用于接收所述第一值和噪声门限值，并将所述第一值与噪声门限值进行比较；第三比较器，用于接收所述第一值与时间参数的乘积和噪声门限值，并将所述第一值与时间参数的乘积和噪声门限值进行比较；本发明可以快速检波和设置噪声门限阻止噪声信号输出，提高效率和改善播音效果。
197	组合音频信号的分离和分类的方法和装置	CN202180032874.3	2021-05-03	CN115485771A	2022-12-16	A·S·马斯特; 芦烈; H-M·莱托宁
提供了用于组合音频分离和分类的计算机实施的方法和设备。基于音频分类器至少部分地对分离前的原始的信号混合物的确定来对估计的分离信号进行时间门控。还提供了对估计信号和残余信号二者进行的组合分离、分类和时间门控。
198	使用合成图像特征来对音频场景进行分类	CN202080093349.8	2020-11-24	CN115004299A	2022-09-02	E·C·W·索默拉德; Y·刘; A·尼奥菲图; S·森古普塔
一种计算系统包括接收输入图像并将该输入图像编码成真实图像特征的编码器；将该真实图像特征解码成经重构图像的解码器；生成器，该生成器接收对应于该输入图像的第一音频数据并从该第一音频数据中生成第一合成图像特征，并且接收第二音频数据并从该第二音频数据中生成第二合成图像特征；鉴别器，该鉴别器接收真实和合成图像特征这两者并确定目标特征是真实的还是合成的；以及分类器，该分类器基于第二合成图像特征来对第二音频数据的场景进行分类。
199	一种音频分类方法、装置、设备及存储介质	CN202110550191.9	2021-05-20	CN114694642A	2022-07-01	闫建新; 王磊
本发明实施例提供了一种音频分类方法、装置、设备及存储介质，方法包括：对待分类音频进行分帧处理，得到多个超帧，每个超帧中包括多个音频帧，每个音频帧包括多个子帧；针对每个超帧，计算该超帧的能量值；针对该超帧中的每个子帧，按照设定的对比条件，将该子帧的能量值与该超帧的能量值进行对比，得到该子帧对应的对比结果；将该超帧中的每个子帧对应的对比结果进行量化处理，得到量化结果；将量化结果与设定的分类阈值进行对比，根据对比结果，确定该超帧的分类结果。可见，本方案中，通过对音频进行分帧以及能量对比，能够确定每个超帧的分类结果，而不需要利用不同的编解码方式对音频进行编解码处理，降低了数据处理量。
200	一种音频分类方法、系统、装置及存储介质	CN202111560886.1	2021-12-20	CN114283841A	2022-04-05	王伟
本发明公开了一种音频分类方法、系统、装置及存储介质，方法包括：获取待分类的第一音频信号，对第一音频信号进行分帧处理得到第二音频信号；对第二音频信号进行端点检测，去除位于第二音频信号的首部和尾部的低能量音频段得到第三音频信号；确定第三音频信号中每一音频帧的短时平均过零率，确定短时平均过零率大于等于预设的第一阈值的第一音频帧数量以及短时平均过零率的波动情况；根据第一音频帧数量和波动情况对第一音频信号进行分类。本发明通过对音频信号进行分帧处理、端点检测并确定音频帧的短时平均过零率，可以对音频信号进行分类，识别出纯音乐音频、纯语音音频以及混合音频，提高了音频分类的准确性，可广泛应用于音频分类技术领域。

5 6 7 8 9 10 11 12 13 14

该功能需要专业版企业版VIP权限，您可以：