专利汇 - 音频分类相关的专利数据 - PatentHub专利检索|专利汇|专利查询网|发明专利查询分析

序号	专利名	申请号	申请日	公开（公告）号	公开（公告）日	发明人
1	音频分类器	CN201610601995.6	2016-07-27	CN106409312A	2017-02-15	卢多维克·多米尼克·乔尔·勒保; 罗克; 劳伦·勒福舍尔
本发明涉及一种音频分类器，该音频分类器包括：第一处理器，该第一处理器具有硬连线逻辑，该硬连线逻辑被配置成接收音频信号且从该音频信号检测音频活动；以及第二处理器，该第二处理器具有可重新配置的逻辑，该可重新配置的逻辑被配置成响应于该第一处理器检测音频活动而将该音频信号分类为一类型的音频信号。
2	音频分类器	CN201610601995.6	2016-07-27	CN106409312B	2021-12-10	卢多维克·多米尼克·乔尔·勒保罗克; 劳伦·勒福舍尔
本发明涉及一种音频分类器，该音频分类器包括：第一处理器，该第一处理器具有硬连线逻辑，该硬连线逻辑被配置成接收音频信号且从该音频信号检测音频活动；以及第二处理器，该第二处理器具有可重新配置的逻辑，该可重新配置的逻辑被配置成响应于该第一处理器检测音频活动而将该音频信号分类为一类型的音频信号。
3	音频信号的分类	CN201310059627.X	2005-02-16	CN103177726B	2016-11-02	雅纳·韦尼奥; 阿尼·米克科拉; 帕西·奥雅拉; 雅里·马基南
本发明涉及一种编码器(200)，该编码器包括一个输入(201)，用来输入在一个频带中的音频信号的帧，包括至少第一激励块(206)，用来对类语音音频信号执行第一激励，以及第二激励块(207)，用来对非类语音音频信号执行第二激励。该编码器(200)还包括滤波器(300)，用来将该频带划分成多个子带，每个子带的带宽比所述频带更窄。该编码器(200)还包括激励选择块(203)，用于根据至少在一个所述子带处的所述音频信号的性质在所述至少第一激励块(206)和所述第二激励块(207)之中选择一个激励块，用来为该音频信号的帧执行激励。本发明还涉及一种设备、一种系统、一种方法和一种计算机程序的存储介质。
4	音频信号的分类	CN201310059627.X	2005-02-16	CN103177726A	2013-06-26	雅纳·韦尼奥; 阿尼·米克科拉; 帕西·奥雅拉; 雅里·马基南
本发明涉及一种编码器(200)，该编码器包括一个输入(201)，用来输入在一个频带中的音频信号的帧，包括至少第一激励块(206)，用来对类语音音频信号执行第一激励，以及第二激励块(207)，用来对非类语音音频信号执行第二激励。该编码器(200)还包括滤波器(300)，用来将该频带划分成多个子带，每个子带的带宽比所述频带更窄。该编码器(200)还包括激励选择块(203)，用于根据至少在一个所述子带处的所述音频信号的性质在所述至少第一激励块(206)和所述第二激励块(207)之中选择一个激励块，用来为该音频信号的帧执行激励。本发明还涉及一种设备、一种系统、一种方法和一种计算机程序的存储介质。
5	音频分类方法	CN200610127413.1	2006-09-13	CN101145345B	2011-02-09	郭利斌; 马付伟
本发明公开了一种音频分类方法，该方法包括：对输入的音频信号进行预处理，再计算预处理过的音频信号的线性预测编码系数；根据线性预测编码系数得到信号的频谱包络，再由计算得到的导谱对参数确定幅度差异值；根据幅度差异值的统计结果设置门限，再根据门限对音频信号进行分类。利用本发明能够大大减少对音频信号进行分类所带来的计算量，同时本发明对音频信号进行分类的准确性较高。另外，将本发明应用到扩展带宽自适应多码率编码标准中的信号处理流程时可以使对音频信号分类的计算量非常小，并且可使信号处理流程不采用预先编码方式，直接采用相应的编码模式进行编码，进而可以提高编码的效率。
6	音频分类方法	CN200610127413.1	2006-09-13	CN101145345A	2008-03-19	郭利斌; 马付伟
本发明公开了一种音频分类方法，该方法包括：对输入的音频信号进行预处理，再计算预处理过的音频信号的线性预测编码系数；根据线性预测编码系数得到信号的频谱包络，再由计算得到的导谱对参数确定幅度差异值；根据幅度差异值的统计结果设置门限，再根据门限对音频信号进行分类。利用本发明能够大大减少对音频信号进行分类所带来的计算量，同时本发明对音频信号进行分类的准确性较高。另外，将本发明应用到扩展带宽自适应多码率编码标准中的信号处理流程时可以使对音频信号分类的计算量非常小，并且可使信号处理流程不采用预先编码方式，直接采用相应的编码模式进行编码，进而可以提高编码的效率。
7	音频信号的分类	CN200580005608.2	2005-02-16	CN1922658A	2007-02-28	雅纳·韦尼奥; 阿尼·米克科拉; 帕西·奥雅拉; 雅里·马基南
本发明涉及一种编码器(200)，该编码器包括一个输入(201)，用来输入在一个频带中的音频信号的帧，包括至少第一激励块(206)，用来对类语音音频信号执行第一激励，以及第二激励块(207)，用来对非类语音音频信号执行第二激励。该编码器(200)还包括滤波器(300)，用来将该频带划分成多个子带，每个子带的带宽比所述频带更窄。该编码器(200)还包括激励选择块(203)，用于根据至少在一个所述子带处的所述音频信号的性质在所述至少第一激励块(206)和所述第二激励块(207)之中选择一个激励块，用来为该音频信号的帧执行激励。本发明还涉及一种设备、一种系统、一种方法和一种计算机程序的存储介质。
8	音频场景识别分类方法	CN202011545446.4	2020-12-24	CN112700792B	2024-02-06	邓立新; 濮勇; 孙明铭; 徐艳君
本发明公开了一种音频场景识别分类方法，属于音频场景和事件的检测和分类技术领域。该方法通过将测试集数据输入到使用训练集数据训练完成的CNN模型中进行分类并得到分类结果，再对分类结果进行判断，若分类结果是初次分类，则保存为初次识别分类结果，并对训练集数据重新标记后继续进行分类；若分类结果不是初次分类，则保存为二次分类结果，并对二次分类结果进行维度映射，融合初次识别分类结果和二次分类结果得到最终分类结果。本发明的音频场景识别分类方法实现了在不扩大数据集的情况下，充分利用数据，有针对性地提高初次分类效果不好的类别，从而提高整体识别准确率，且该方法能有效减小分类结果的偏差。
9	音频分类方法和装置	CN201910117805.7	2019-02-15	CN111583890A	2020-08-25	陈燕青; 李腾; 陈斯枫; 黄杰; 陆品冰; 马辉; 任佳亮; 张启晟; 张宏吉
公开了一种基于机器学习的音频分类及相应的歌曲推荐方案。分类方法包括：将待分类音频进行频谱化，以得到音频频谱图；将音频频谱图送入机器学习(ML)图像分类器进行分类；根据所述ML图像分类器的分类结果，确定所述待分类音频的所属分类。在此，ML图像分类器尤其可以是经训练ANN，例如CNN分类器或是仅进行二分类判断的打标签器。由此，本发明通过将待分类音频进行频谱可视化，并使用机器学习进行图像分类，从而能够从频谱分布的角度更为客观、准确地对音频进行分类。上述频谱图像在进行图像分类之前，还可以送入例如专门训练的ANN进行降维处理，从而在保存音频主要信息的同时，大幅降低图像分类的复杂度，提升分类和打标效率。
10	音频信号分类和编码	CN201580026065.6	2015-05-12	CN106415717B	2020-03-13	艾力克·诺维尔; 斯蒂芬·布鲁恩
本发明涉及编解码器和信号分类器以及其中的基于音频信号特征进行的信号分类和编码模式选择的方法。一种由解码器执行的方法实施例包括，针对帧m：基于变换域中帧m的频谱包络的范围和相邻帧m‑1的频谱包络的相应范围之间的差，确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括：基于所述稳定性值D(m)从多个解码模式中选择解码模式；以及应用所选的解码模式。
11	音频信号分类和编码	CN202010186693.3	2015-05-12	CN111192595B	2023-09-22	艾力克·诺维尔; 斯蒂芬·布鲁恩
本发明涉及编解码器和信号分类器以及其中的基于音频信号特征进行的信号分类和编码模式选择的方法。一种由解码器执行的方法实施例包括，针对帧m：基于变换域中帧m的频谱包络的范围和相邻帧m‑1的频谱包络的相应范围之间的差，确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括：基于所述稳定性值D(m)从多个解码模式中选择解码模式；以及应用所选的解码模式。
12	音频分类方法及装置	CN202110170724.0	2021-02-08	CN112992181A	2021-06-18	马进
本申请实施例提供了音频分类方法及装置，其中，所述音频分类方法包括：提取多个待分类音频的第一音频特征以及第二音频特征，根据所述第一音频特征对所述多个待分类音频进行聚类处理，生成至少两个聚类簇，确定目标聚类簇对应的待分类音频集，并根据所述待分类音频集中待分类音频的第二音频特征，对所述待分类音频集中的待分类音频进行筛选获得目标分类音频集，其中，所述目标聚类簇为所述至少两个聚类簇之一，根据获得的至少两个目标分类音频集确定所述多个待分类音频的音频分类结果。
13	音频分类方法和系统	CN201110269279.X	2011-09-02	CN102982804B	2017-05-03	程斌; 芦烈
描述了用于音频分类的实施例。音频分类系统包含对音频信号执行音频分类的过程的至少一个装置。该至少一个装置能够在需要不同资源的至少两个模式下工作。音频分类系统也包含复杂度控制器，其确定组合并且指示该至少一个装置根据该组合来工作。对于该至少一个装置中的每个，该组合指定该装置的模式之一，而该组合的资源要求不超过最大可用资源。通过控制模式，音频分类系统改善了针对运行环境的可伸缩性。
14	音频信号分类和编码	CN201580026065.6	2015-05-12	CN106415717A	2017-02-15	艾力克·诺维尔; 斯蒂芬·布鲁恩
本发明涉及编解码器和信号分类器以及其中的基于音频信号特征进行的信号分类和编码模式选择的方法。一种由解码器执行的方法实施例包括，针对帧m：基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差，确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括：基于所述稳定性值D(m)从多个解码模式中选择解码模式；以及应用所选的解码模式。
15	音频内容生成和分类	CN202280081896.3	2022-11-03	CN118382892A	2024-07-23	B·J·波特; H·诺斯拉提
一些公开的方法涉及接收至少第一音频数据类型和第二音频数据类型的音频数据，包括音频信号和指示音频信号的预期感知空间位置的相关空间数据，从音频数据确定至少第一特征类型，并且对音频数据应用位置编码处理，以产生编码音频数据。编码音频数据可以包括嵌入维度的第一嵌入向量中的至少空间数据和第一特征类型的表示。一些方法可以包括基于编码音频数据训练神经网络，以将音频数据从具有输入空间数据类型的输入音频数据类型变换为具有变换后空间数据类型的变换后音频数据类型。一些方法可能涉及训练神经网络来识别输入音频数据类型。
16	音频场景识别分类方法	CN202011545446.4	2020-12-24	CN112700792A	2021-04-23	邓立新; 濮勇; 孙明铭; 徐艳君
本发明公开了一种音频场景识别分类方法，属于音频场景和事件的检测和分类技术领域。该方法通过将测试集数据输入到使用训练集数据训练完成的CNN模型中进行分类并得到分类结果，再对分类结果进行判断，若分类结果是初次分类，则保存为初次识别分类结果，并对训练集数据重新标记后继续进行分类；若分类结果不是初次分类，则保存为二次分类结果，并对二次分类结果进行维度映射，融合初次识别分类结果和二次分类结果得到最终分类结果。本发明的音频场景识别分类方法实现了在不扩大数据集的情况下，充分利用数据，有针对性地提高初次分类效果不好的类别，从而提高整体识别准确率，且该方法能有效减小分类结果的偏差。
17	音频信号分类和编码	CN202010186693.3	2015-05-12	CN111192595A	2020-05-22	艾力克·诺维尔; 斯蒂芬·布鲁恩
本发明涉及编解码器和信号分类器以及其中的基于音频信号特征进行的信号分类和编码模式选择的方法。一种由解码器执行的方法实施例包括，针对帧m：基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差，确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括：基于所述稳定性值D(m)从多个解码模式中选择解码模式；以及应用所选的解码模式。
18	多通道音频信号分类器	CN201480077074.3	2014-01-13	CN106104684A	2016-11-09	A·瓦西拉凯; L·J·拉克索宁; A·S·拉莫
尤其是公开了一种方法，其包括：估计针对多通道音频信号的熵值；从所述熵值，确定所述多通道音频信号的通道配置；以及对所述多通道音频信号进行编码，其中编码模式依赖于所述通道配置。
19	音频分类方法和系统	CN201110269279.X	2011-09-02	CN102982804A	2013-03-20	程斌; 芦烈
描述了用于音频分类的实施例。音频分类系统包含对音频信号执行音频分类的过程的至少一个装置。该至少一个装置能够在需要不同资源的至少两个模式下工作。音频分类系统也包含复杂度控制器，其确定组合并且指示该至少一个装置根据该组合来工作。对于该至少一个装置中的每个，该组合指定该装置的模式之一，而该组合的资源要求不超过最大可用资源。通过控制模式，音频分类系统改善了针对运行环境的可伸缩性。
20	一种音频信号分类方法和装置	PCT/CN2013/084252	2013-09-26	WO2015018121A1	2015-02-12	王喆
一种音频信号分类的方法，该方法包括：根据当前音频帧的声音活动性，确定是否获得当前音频帧的频谱波动并存储于频谱波动存储器中（101）；根据音频帧是否为敲击音乐或历史音频帧的活动性，更新频谱波动存储器中存储的频谱波动（102）；根据频谱波动存储器中存储的频谱波动的部分或全部有效数据的统计量，将所述当前音频帧分类为语音帧或者音乐帧（103）；还提供了一种音频信号分类装置。

1 2 3 4 5 6 7 8 9 10

该功能需要专业版企业版VIP权限，您可以：