首页 / 专利分类库 / 乐器;声学
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
1 具有空间元数据输出的音乐合成器 CN202280059728.4 2022-08-24 CN117897765A 2024-04-16 D·M·库珀
描述了一种用于生成和/或处理音频信号的装置。一种装置包括:第一级,用于获得音频信号;第二级,用于基于一个或多个控制信号修改所述音频信号,所述控制信号用于对由所述音频信号表示的声音进行整形;第三级,用于至少部分地基于所述一个或多个控制信号生成与修改后的音频信号相关的空间元数据;以及输出级,用于将修改后的音频信号与所生成的空间元数据一起输出。还描述了相对应的方法、以及相对应的程序和计算机可读存储介质。
2 打击乐器及打击乐器的音量的减音方法 CN202180102039.2 2021-12-28 CN117897764A 2024-04-16 吉野澄; 胜田雅人
发明提供一种可在对打击乐器的音量进行减音的同时使原声鼓的音色再现的打击乐器及打击乐器的音量的减音方法。圆盘状的吸音材7在划分了打击面皮3及共鸣面皮4之间的状态下,其外缘接合(粘接)于主体部2的内周面。由此,在对打击面皮3进行打击时向下方传播的振动(打击音)进入多孔质的吸音材7中而衰减。此时,通过吸音材7的振动,也向共鸣面皮4传递适度的振动,因此,可使共鸣面皮4共鸣。如此,通过在利用吸音材7对打击面皮3被打击时的声音进行吸音的同时使共鸣面皮4共鸣,可在对打击乐器1的音量进行减音的同时使原声鼓的音色再现。
3 人工智能辅助的实况体育数据质量保证 CN202280052732.8 2022-09-21 CN117897738A 2024-04-16 法迪·阿布达尔马莱克; 马特加兹·爱丽斯; 卡尔·费尔克; 菲利普·格洛纳里克; 赫克托耳·鲁伊斯; 克里斯蒂安·马可; 卡内·巴斯; 克劳迪奥·布里迪; 德米特里·奥巴什维利
发明公开了一种计算系统,该计算系统接收对应于实况比赛的实况事件数据。该实况事件数据包括在该实况比赛内发生的事件。该计算系统分析该实况事件数据以识别该实况事件数据中的潜在错误。该计算系统生成对应于在该实况事件数据中标记的该潜在错误的票据。该计算系统将该票据分配给第一质量保证代理以进行解决。该计算系统接收该票据已由该第一质量保证代理审阅的指示,该计算系统向最终用户提供所审阅的事件数据。
4 一种显示设备及语音连续识别方法 CN202311696613.9 2023-12-11 CN117896562A 2024-04-16 崔保磊; 杜永花; 张大钊
申请提供一种显示设备及语音连续识别方法。显示设备存储有历史识别结果和本次唤醒之后采集到的n‑1段语音,该n‑1段语音中相邻两段语音之间的时间间隔大于或者等于第一时长,且符合启动连续识别机制的条件。显示设备获取对以n‑1段语音为整体的第一识别结果,并根据历史识别结果和第一识别结果,判断是否符合启动连续识别机制的条件。如果符合,则启动连续识别机制,并在采集到第n段语音之后,且在第一时长内未检测到第n+1段语音的信号时,以该n段语音为整体进行识别,得到第二识别结果。这样,在用户输入的多段语音之间的停顿较长时,显示设备仍然可以在一次语音识别过程中连续识别该多段语音。
5 视频通话方法、装置、电子设备及系统 CN202311687152.9 2023-12-08 CN117896483A 2024-04-16 高顺; 于鑫
发明提供一种视频通话方法、装置、电子设备及系统,涉及通信技术领域,其中方法包括:接收第一终端发送的第一语义信息;所述第一语义信息为所述第一终端对应的第一用户和第二终端对应的第二用户在进行视频通话过程中,所述第一终端确定网速小于预设值的情况下,对采集的第一视频流进行语义理解得到的;基于所述第一语义信息和所述第一用户的人脸模型,生成第二视频流;将所述第二视频流发送至第二终端。本发明在第一终端的网速较差的情况下,视频服务器基于第一用户的人脸模型和接收到的第一语义信息重新生成第二视频发送至第二终端,这样能够确保第二终端能够及时显示第一终端对应的视频,从而提高了视频通话质量
6 一种用于电话通信的偏差补偿回声消除方法及系统 CN202410297857.8 2024-03-15 CN117896468A 2024-04-16 倪锦根; 宋钦
申请涉及电话通信领域,具体提供了一种用于电话通信的偏差补偿回声消除方法及系统,所述方法包括:分别根据自适应权值和含噪语音信号采样值构建自适应权值向量和含噪输入信号向量,对其进行内积生成输出信号;根据输出信号生成估计误差信号,并根据其生成误差平方中值;分别根据误差平方中值和自适应权值向量计算误差信号方差估计值和自适应权值向量功率估计值;根据误差信号方差估计值和自适应权值向量功率估计值计算输入噪声方差估计值;根据增广权值向量、自适应权值向量和输入噪声方差估计值计算偏差补偿项;根据偏差补偿项、含噪输入信号向量和估计误差信号更新自适应权值向量。有效降低输入噪声带来的不利影响。
7 用于识别安装在安装位置处的联网设备的方法和系统 CN202311292090.1 2023-10-08 CN117896427A 2024-04-16 芒努斯·罗泽尔; 达里娅·沙尔沙科瓦; 弗里达·约翰松; 伊利斯·奥尔德费尔特; 穆斯塔法·阿尔巴亚提; 奥利弗·贝延多夫
发明涉及用于识别安装在安装位置处的联网设备的方法和系统。公开了识别一组联网设备中的安装在该组联网设备的安装位置中的在管理服务器中已知的第一安装位置处的联网设备的系统和方法。该组联网设备中的每个联网设备具有唯一标识符。使用便携式设备的扬声器发出预定声音。指示第一安装位置的信息进一步从便携式设备发送至管理服务器。在使用该组联网设备中的第一联网设备中的麦克检测到预定声音时,将第一联网设备的唯一标识符从第一联网设备发送至管理服务器。然后,在管理服务器处,第一联网设备的唯一标识符被链接至第一安装位置。
8 一种新能源汽车减速器背景噪声分离及降噪方法 CN202311794873.X 2023-12-25 CN117894336A 2024-04-16 李威霖; 张众杰; 赵梦培; 翁海舟; 刘婷; 林听; 王恪聿; 郑伟军; 蔡敏旭; 赵天舒; 程力; 陈锋
发明公开了属于车辆工程技术领域,公开了一种新能源汽车减速器背景噪声分离及降噪方法,包括:获取汽车噪声性能测试台架在不同工况下的背景噪声信号;对背景噪声信号进行预处理,并采用变分模态分解计算出中心频率与对应模态数;对不同工况下的本征模态函数时域分量进行相关性匹配;将不同工况下分解得到的本征模态函数时域分量作为快速独立成分分析的观测信号,得到独立信号分量;根据相关性匹配结果对独立信号分量进行滤波与重构,得到降噪后减速器背景噪声的时域信号。本发明能够有效分离减速器噪声测试的混合信号,实现背景噪声的提取识别、分离降噪,降低了减速器噪声测试环境对数据信号的干扰,提升了新能源汽车减速器噪声测试精度
9 一种燃油车引擎声浪智能模拟系统及方法 CN202410109819.5 2024-01-25 CN117894328A 2024-04-16 周天怡; 张嘉桐; 王维莉
发明提出一种燃油车引擎声浪智能模拟系统及方法,该系统包括数据采集,获取车辆行驶状态数据;人机交互模块,集成于车载信息娱乐系统,包括工况识别模块、样本调音模块、音频拼接模块和声音修正模块。工况识别模块存储、管理驾驶工况识别模型,根据车辆行驶状态数据判别实时驾驶工况,并选定实时驾驶工况对应的引擎声浪音频样本。样本调音模块对选定的引擎声浪音频样本进行调音处理。音频拼接模块对音频进行音频拼接和/或参数调整。声音修正模块对音频进行修正处理。声音输出模块将修正处理后的引擎声浪音频通过车载信息娱乐系统在车内播放。本发明既不依赖于额外的硬件装置,又可根据实时驾驶工况动态调节引擎声浪的模拟发声。
10 一种语音的编码方法、装置、设备及存储介质 CN202311868547.9 2023-12-29 CN117894327A 2024-04-16 巴万琴; 朱昊; 田文强; 刘伟; 邵智勇; 王智国
申请公开了一种语音的编码方法、装置、设备及存储介质。在执行本申请实施例提供的方法时,首先可以获取待编码语音,提取待编码语音中的语音信号。识别语音信号的特征参数,根据特征参数对语音信号进行分类得到分类结果,分类结果包括高复杂度信号或低复杂度信号。再根据分类结果对待编码语音进行编码。本申请通过对待编码语音进行特征提取、分类和编码,根据语音信号的复杂度选择合适的处理方法和算法。对于低复杂度的语音信号,可以采用简化的算法和模型,减少计算开销,降低系统的计算资源需求。同时,根据语音信号的分类结果对待编码语音进行编码,选择适当的编码方法和压缩算法,以减少所需的存储空间,从而降低系统的存储成本和资源占用。
11 音频处理模型的训练方法及装置、存储介质、电子设备 CN202410063886.8 2024-01-16 CN117894318A 2024-04-16 吕安超; 范璐; 彭毅; 吴友政; 李清涛; 何晓冬
本公开涉及人工智能技术领域,提供了一种音频处理模型的训练方法、音频处理模型的训练装置、计算机存储介质、电子设备,其中,音频处理模型的训练方法包括:获取训练样本集;利用第一样本集对待训练的音频处理模型的第一分支网络进行预训练,获得预训练的第一分支网络,以及,利用第二样本集对待训练的音频处理模型的第二分支网络进行预训练,获得预训练的第二分支网络;利用训练样本集对预训练的第一分支网络和预训练的第二分支网络进行联合训练,获得训练好的音频处理模型;其中,第一分支网络用于执行回声消除和语音增强任务,第二分支网络用于执行语音端点检测任务。本公开能够通过一个模型执行多个音频处理任务,降低了系统功率。
12 一种基于嵌入式系统的大语言模型边切换方法、系统 CN202311789833.6 2023-12-22 CN117894316A 2024-04-16 叶昌; 杨武
发明提供的一种基于嵌入式系统的大语言模型边切换方法及系统,包括第一数据交换模,第二数据交换模块、音频模块、文本生成器、模型选择器、边云管理组件、本地模型库,部署在嵌入式实时操作系统中,可以使得从语音输入到最终自然语言处理过程实时性、稳定性更强。
13 模型训练方法、电子设备、存储介质及程序产品 CN202410108323.6 2024-01-25 CN117894315A 2024-04-16 张莉娜; 魏光辉; 宋莎莎
本公开提供了模型训练方法、电子设备、存储介质及程序产品。本公开还提供的模型训练方法包括:获取多媒体文件集;对于多媒体文件集中任一多媒体文件,将该多媒体文件的语音输入第一语音识别模型,得到语音识别结果;对该多媒体文件的字幕进行光学字符识别,得到文本识别结果;根据多媒体文件集中多媒体文件的语音、语音识别结果和文本识别结果训练第二语音识别模型。
14 语音数据处理系统、移动终端和服务器 CN202410172212.1 2024-02-06 CN117894309A 2024-04-16 刘玉颉; 张岩; 郭雅林
申请公开一种语音数据处理系统、移动终端和服务器。语音数据处理系统包括用于接收语音请求并发送到服务器的移动终端和用于对接收的语音请求进行逐识别的服务器;服务器用于根据所接收的当前帧语音请求获取第一预测请求,第一预测请求为非完整语音请求;根据第一预测请求生成第一预测结果信息,第一预测结果信息包括非确定信息;根据当前帧之后所接收的语音请求获取第二预测请求和相应的第二预测结果信息,第二预测结果信息包括确定信息和非确定信息;根据第二预测结果信息的确定信息判断第一预测请求是否准确;是则根据第一预测结果获取对应的第一管道数据并存储;否则根据确定信息获取对应的第二管道数据并存储,提高语音交互速度。
15 一种基于分布式协同质检方法 CN202311720811.4 2023-12-14 CN117894304A 2024-04-16 饶庆炜; 郑新锴; 卢家文
发明公开一种基于分布式协同质检方法,步骤1,特征数据集预处理:获取音频文件并进行预处理得到FBank特征,形成特征数据集,特征数据集按设定比例分为训练集、验证集和测试集;步骤2,构建神经网络:神经网络包括7层卷积、3层最大池化以及1层平均池化,使用relu激活函数以及softmax激活函数;步骤3,对构建好的神经网络进行模型训练得到自由质检模型和声纹识别模型;步骤4,利用训练好的模型对客服业务场景的语音大数据进行声纹识别与音频分离,并基于分离的音频文件进行质检分析得到对应质检报告。本发明可以为音频打上标签、分类的信息,有助于业务的精细化运营。
16 一种语音识别模型的训练方法、语音识别方法和相关装置 CN202311870858.9 2023-12-29 CN117894301A 2024-04-16 杨阳; 程磊; 朱家泉; 蔡旭浦; 陆海俊
申请公开了一种语音识别模型的训练方法、语音识别方法和相关装置,该方法包括:利用语音识别模型对第一样本语音特征进行多次编码处理,得到第一样本语音编码特征,其中,至少一次编码处理作为目标编码处理,目标编码处理得到的编码特征作为样本目标特征,目标编码处理的输出特征为基于目标编码处理对应的样本分类特征得到,样本分类特征是对样本目标特征进行对应的目标建模单元的分类预测得到,对第一样本语音编码特征进行解码,得到第一样本语音对应的第一样本识别文本;基于第一样本识别文本和样本分类特征,调整语音识别模型的模型参数,能够提升语音识别模型的训练效率。
17 语音识别方法、装置、系统、电子设备及存储介质 CN202311833335.7 2023-12-28 CN117894299A 2024-04-16 茆廷志; 万根顺; 高建清; 潘嘉; 刘聪; 付中华
申请提出一种语音识别方法、装置、系统、电子设备及存储介质,该方法包括:在待识别语音为第一类型的语音数据的情况下,通过加载了混合专家适配器模的语音识别模型对所述待识别语音进行识别,得到对所述待识别语音的识别结果;其中,所述混合专家适配器模块包括多个专家模型,所述多个专家模型至少包括用于对所述第一类型的语音数据进行识别的专家模型。上述方案能够以更轻量化的模型结构实现对不同类型语音的识别。
18 拟人化的副语言语音合成方法及系统 CN202410288143.0 2024-03-14 CN117894294A 2024-04-16 刘刚; 苏江
发明提供了一种拟人化的副语言语音合成方法及系统,对包含副语言的原始音色语音数据进行副语言标签标注,根据标注后的原始音色语音数据,结合目标音色的参考音频获取具有目标音色的副语言发音单元;接收语言输入文本,语言输入文本包括TTS文本和在TTS文本中相应位置标注的副语言标签;将TTS文本合成目标音色TTS语音,根据副语言标签选择相应的具有目标音色的副语言发音单元,并与目标音色TTS语音进行拼接,生成具有目标音色的音频。本发明能以低成本实现语音库中的说话人具备副语言发音能,提升TTS说话人在对话过程的自然度及真实度,使AI在人机交互中零距离交流。
19 语音合成方法、装置、计算机设备和存储介质 CN202311829206.0 2023-12-28 CN117894293A 2024-04-16 周远侠
申请涉及一种语音合成方法、装置、计算机设备、存储介质和计算机程序产品,涉及人工智能技术领域。所述方法包括:获取语音库问题集;基于语音库问题集、目标标注文件和声学参数提取结果,对单音素模型进行训练,得到语音合成模型库;声学参数提取结果包括针对训练语音数据库进行声学参数提取处理后的提取结果;根据语音合成模型库合成得到与待合成语音文本对应的目标语音音频。采用本方法能够提升语音合成质量
20 一种多初级声源条件下的虚拟误差信号计算方法 CN202410058758.4 2024-01-16 CN117894291A 2024-04-16 韩宁; 张天; 段哲华
发明公开了一种多初级声源条件下的虚拟误差信号计算方法,涉及主动降噪技术领域,包括:根据初级声源个数,以确定观测传声器个数,确定待降噪位置,在待降噪位置附近布放观测传声器,在待降噪位置布放临时传声器;通过观测传声器和临时传声器分别接收多个初级声源发出的初级声场信号,分别输出得到第一观测传声器信号和临时传声器信号;对第一观测传声器信号做自相关处理,得到自相关序列,对第一观测传声器信号和临时传声器信号做互相关处理,得到互相关序列;利用自相关序列和互相关序列计算得出观测传声器对临时传声器的观测路径序列;利用第二观测传声器信号与观测传声器对临时传声器的观测路径序列计算得出待降噪位置的虚拟误差信号。
QQ群二维码
意见反馈