181 |
一种视频解说配音信息的处理方法、装置及设备 |
CN202110910573.8 |
2021-08-09 |
CN113630630A |
2021-11-09 |
刘养亭; 佘志强 |
本发明公开了一种视频解说配音信息的处理方法、装置及设备,该方法包括:获取视频数据和第一目标观众的用户信息;对所述视频数据进行分段,得到视频段;从所述视频段中,确定与所述用户信息匹配的第一目标视频段;将所述第一目标观众对所述第一目标视频段的解说配音信息与所述第一目标视频段进行合成处理,得到第二目标视频段。通过上述方式,本发明实现了用户个性化的需求,极大的提高了用户的参与感。 |
182 |
一种基于视频配音和纠音训练的语言学习方法及系统 |
CN202010304733.X |
2020-04-17 |
CN111462553B |
2021-03-30 |
刘勇 |
本发明公开了一种基于视频配音和纠音训练的语言学习方法及系统,方法包括:显示用户选择的待配音视频;在获取到用户开始配音触发信号后,生成待配音视频的字幕列表;接收用户选择的字幕句子,播放字幕句子对应的视频画面,采集用户的配音内容;将配音内容的音素与标准音素进行比对,计算第一评分;计算所述配音内容与视频原音的相似度,作为第二评分;基于第一评分、第二评分计算各配音内容评测评分;基于所有字幕句子的评测评分,生成视频配音报告;提取视频配音报告中有待加强的单词,进入纠音模式。本发明使用户无论何时何地都可以学习,解决用户不敢开口说语言、发音不准问题,同时提高了配音评测的准确性。 |
183 |
基于语音合成的配音方法、装置、设备和存储介质 |
CN202010947057.8 |
2020-09-10 |
CN112185341A |
2021-01-05 |
徐波 |
本发明公开了一种基于语音合成的配音方法,包括:获取待配音文本,并对所述待配音文本进行预处理;识别所述待配音文本中单个句子的控制参数;其中,所述控制参数包括句子类型、句子情绪和句子关键度中的至少一种;将所述待配音文本中的单个句子和对应的控制参数输入到预先训练好的语音合成模型中,以合成对应的若干条单句语音;将所述若干条单句语音拼接,输出拼接后的配音信号。本发明还公开了一种基于语音合成的配音装置、一种基于语音合成的配音设备和一种计算机可读存储介质。采用本发明实施例,能为文字配音指定合适的发音人和韵律,提高用户体验。 |
184 |
漫画配音方法及装置、计算机可读存储介质、电子设备 |
CN201811261581.9 |
2018-10-26 |
CN109493888B |
2020-07-10 |
孙译滨 |
本发明涉及计算机技术领域,提供了一种漫画配音方法、装置、计算机可读介质及电子设备,该漫画配音方法包括:获取音频信息和漫画图片;对所述音频信息进行识别以获取音频内容,并对所述漫画图片进行识别以获取漫画内容,所述音频内容与所述漫画内容相对应;根据所述音频信息对应的时间区间和所述漫画图片获取第一视频;将所述音频内容与所述漫画内容进行匹配,以对所述第一视频进行配音形成第二视频。本发明中的漫画配音方法一方面能够对用户喜欢的漫画片段进行配音,避免了人工剪裁生成视频,节省了人力,降低了成本;另一方面能够丰富对漫画进行配音的方法,提高用户体验。 |
185 |
视频配音方法、装置、计算机设备及计算机可读存储介质 |
CN201911248806.1 |
2019-12-09 |
CN110933330A |
2020-03-27 |
吴晗; 李文涛 |
本申请公开了一种视频配音方法、装置、计算机设备及计算机可读存储介质,属于计算机技术领域。本申请通过显示配音界面,该配音界面上显示有目标视频的多个视频帧,基于在该配音界面所采集的文本信息以及被选中的音色类型,生成与该文本信息相对应的语音数据,该语音数据的音频特征基于该音色类型确定,基于该多个视频帧中被选中的目标视频帧,将该语音数据添加至目标视频中,该语音数据的起始播放时刻与该目标视频帧的播放时刻相同,在上述视频配音过程中,可以将用户提供的文本信息按照特定的音色转换为配音,添加到视频中,无需人工配音,提高了配音效率,进而可以提高视频制作效率。 |
186 |
基于区块链的配音信息记录方法、查询方法、装置及设备 |
CN201910979380.0 |
2019-10-15 |
CN110689909A |
2020-01-14 |
杨威伟 |
本申请公开了一种基于区块链的配音信息记录方法、查询方法、装置及设备。所述方法包括:接收第一设备发送的配音信息记录请求,该配音信息记录请求用于请求在区块链中存储第一配音信息,第一配音信息用于指示第一配音演员在第一产品中为第一角色进行配音;向第一配音演员对应的第二设备发送授权验证请求,该授权验证请求用于请求验证第一角色的配音是否经过第一配音演员的授权;在接收到对应于授权验证请求的授权确认响应之后,在区块链中存储第一配音信息。本申请一方面保证了记录的配音信息是经过配音演员鉴权认可的,有助于降低盗版现象的发生,另一方面由于区块链中数据具有不可篡改的特性,因此能够保证记录的配音信息的真实性和可信度。 |
187 |
漫画配音方法及装置、计算机可读存储介质、电子设备 |
CN201811261581.9 |
2018-10-26 |
CN109493888A |
2019-03-19 |
孙译滨 |
本发明涉及计算机技术领域,提供了一种漫画配音方法、装置、计算机可读介质及电子设备,该漫画配音方法包括:获取音频信息和漫画图片;对所述音频信息进行识别以获取音频内容,并对所述漫画图片进行识别以获取漫画内容,所述音频内容与所述漫画内容相对应;根据所述音频信息对应的时间区间和所述漫画图片获取第一视频;将所述音频内容与所述漫画内容进行匹配,以对所述第一视频进行配音形成第二视频。本发明中的漫画配音方法一方面能够对用户喜欢的漫画片段进行配音,避免了人工剪裁生成视频,节省了人力,降低了成本;另一方面能够丰富对漫画进行配音的方法,提高用户体验。 |
188 |
一种自动生成配音文字的方法、装置以及电子设备 |
CN201611196447.6 |
2016-12-22 |
CN108228658A |
2018-06-29 |
阳鹤翔 |
本申请公开了一种自动生成配音文字的方法、装置以及电子设备。其中,所述生成配音文字的方法,包括:对音频信息进行识别,获取识别出的各个音频基本语义单位的起止时间信息;获取与所述音频信息对应的文本信息,并识别所述文本信息,从而获取文本基本语义单位;将各个所述音频基本语义单位的起止时间信息,记录到相应的所述文本基本语义单位中;对记录了所述起止时间信息的所述文本基本语义单位进行处理,生成对应所述音频信息的配音文字。采用上述方法,能够使动态歌词文件不再采用人工的方式进行制作,提高了制作的效率降低了制作成本,简化了制作的流程。 |
189 |
一种特定人语音合成技术在手机漫画配音中的应用方法 |
CN201210579314.2 |
2012-12-27 |
CN103117057B |
2015-10-21 |
唐义平; 江源; 孙见青; 江涛; 聂小林; 徐佳佳 |
本发明公开了一种特定人语音合成技术在手机漫画配音中的应用方法,该方法在手机上接收用户输入的文字,通过特定人语音合成技术,生成模拟多种不同发音人音调和音色的音频数据,对图片或漫画进行配音;接收用户在手机上输入的文字,将文字通过特定人语音合成技术,并设置合成模版参数,实现各种模拟男女对话、老少对话等的合成音频,实现手机图片、漫画的配音。本发明将用户输入的文字,转化为指定人的声音甚至是自己亲属的声音,实现对手机图片、漫画的配音,增加了趣味性,提升了用户交互体验。 |
190 |
一种用于对多媒体信号执行自动配音的方法和设备 |
CN200680019320.5 |
2006-05-24 |
CN101189657A |
2008-05-28 |
A·普罗伊德尔; N·安杰洛瓦 |
本发明涉及一种用于对诸如TV或DVD信号的多媒体信号执行自动配音的方法和系统,其中多媒体信号包括关于视频和语音的信号,并进一步包括对应于所述语音的文本信息。初始由接收机接收多媒体信号。然后语音和文本信息分别被提取,其产生所述语音和文本信息。语音被分析以产生至少一个话音特征参数,并基于该至少一个话音特征参数将文本信息转换为新语音。 |
191 |
配音中多模态媒介模拟视频媒介的方法、装置及其可读存储介质 |
CN202510142379.8 |
2025-02-10 |
CN119629292B |
2025-04-22 |
胥旺; 周咏炀 |
本发明提出了配音中多模态媒介模拟视频媒介的方法、装置及其可读存储介质。在配音领域,传统视频媒介存在成本高、灵活性差等问题。本发明针对此,在程序运行时动态加载音频、图片、文本等多模态媒介,通过特定步骤模拟视频效果。首先初始化项目,接着配置资源,再请求和解析数据,然后加载UI控件并同步数据与控件,添加交互操作和扩展功能,最后释放资源。该技术有效降低成本,实现资源共用,提升操作效率和灵活性,具有跨平台兼容性,在配音及其他多媒体应用场景中具有重要实用价值,能为用户带来更高效、便捷的体验。 |
192 |
配音的补录方法、装置、存储介质以及电子设备 |
CN202411184772.5 |
2024-08-27 |
CN118942490A |
2024-11-12 |
文博龙; 李海; 陈海涛; 闫影; 李娜 |
本申请涉及一种配音的补录方法、装置、存储介质以及电子设备。该方法包括:获取补录台词和补录台词的目标配音员;确定补录台词的目标情绪,并根据目标情绪,在目标配音员的配音数据库中获取目标音频,其中,目标音频的情绪与目标情绪相同;获取目标配音员的目标语音合成大模型;将补录台词和目标音频输入至目标语音合成大模型,得到补录台词的补录音频。本申请解决了在影视剧制作过程中的人工补录配音的工作效率太低的技术问题。 |
193 |
一种视频机器配音的方法、装置、设备及可读介质 |
CN202210858235.9 |
2022-07-20 |
CN115278111B |
2024-08-16 |
宋君; 王正航 |
本发明公开了一种视频机器配音的方法,包括:从字幕文件中逐个读取每条字幕,分别对每条字幕进行TTS合成以得到对应的音频;计算每条字幕的字幕时长、字幕间隙和对应的音频的配音时长,并基于字幕时长、字幕间隙和配音时长分别判断每个字幕是否为音频重叠字幕;若是字幕为音频重叠字幕,则基于字幕时长、字幕间隙和配音时长计算音频重叠字幕的重叠率,并基于重叠率调整配音语速和/或视频显示时长,并基于配音语速对音频重叠字幕重新进行TTS合成以更新对应的音频和/或基于视频显示时长调整音频重叠字幕对应的视频;依次读取每条字幕对应的音频,并将音频插入到对应的视频节点中。本发明还公开了一种视频机器配音的装置、计算机设备和可读存储介质。 |
194 |
一种在视频中实现等效声纹情感配音的系统与方法 |
CN202410432394.1 |
2024-04-11 |
CN118250526A |
2024-06-25 |
陈啸冬; 曹宇飞; 张良 |
本发明公开了一种在视频中实现等效声纹情感配音的系统与方法,包括以下模块:视频输入模块、声纹分析模块、情感识别模块、声纹合成模块和输出模块;所述视频输入模块用于接收原始视频文件;所述声纹分析模块用于从视频中提取人物的声纹特征;所述情感识别模块用于识别视频中人物的情感状态;所述声纹合成模块用于根据情感状态调整声纹特征,并生成新的声音;本系统采用自动化技术,无需人工干预,能够在短时间内完成对视频的情感配音;基于声纹分析和情感识别技术,能够准确捕捉视频中人物的声音特征和情感状态,精准度高;相比传统的配音方式,本系统无需额外的人力资源和时间成本,能够降低视频制作的成本。 |
195 |
一种视频配音的方法、相关设备以及计算机可读存储介质 |
CN202110205548.X |
2021-02-24 |
CN115037975B |
2024-03-01 |
马玉; 王卫星; 梅浩 |
本申请提供了一种视频配音的方法、相关设备以及计算机可读存储介质;其中,所述方法包括:第一终端检测到针对当前显示视频的截取配音操作指令后,截取所述当前显示视频,得到视频截取片段并显示视频配音控件;所述第一终端检测到针对所述视频配音控件的触发操作后,创建并显示针对所述视频截取片段的配音间;在所述第一终端分析所述视频截取片段的配音角色数量不为0的情况下,所述第一终端检测到针对所述配音间的第一输入操作后,显示配音界面。通过上述方法,配音素材可以从视频资源库中获取,而不用将配音素材预先上传并处理,使得配音素材的来源更加广泛,从而给予用户更好的配音体验。 |
196 |
一种视频机器配音的方法、装置、设备及可读介质 |
CN202210858235.9 |
2022-07-20 |
CN115278111A |
2022-11-01 |
宋君; 王正航 |
本发明公开了一种视频机器配音的方法,包括:从字幕文件中逐个读取每条字幕,分别对每条字幕进行TTS合成以得到对应的音频;计算每条字幕的字幕时长、字幕间隙和对应的音频的配音时长,并基于字幕时长、字幕间隙和配音时长分别判断每个字幕是否为音频重叠字幕;若是字幕为音频重叠字幕,则基于字幕时长、字幕间隙和配音时长计算音频重叠字幕的重叠率,并基于重叠率调整配音语速和/或视频显示时长,并基于配音语速对音频重叠字幕重新进行TTS合成以更新对应的音频和/或基于画面显示时长调整音频重叠字幕对应的视频;依次读取每条字幕对应的音频,并将音频插入到对应的视频节点中。本发明还公开了一种视频机器配音的装置、计算机设备和可读存储介质。 |
197 |
一种视频内容同步新配音音频内容的方法及装置 |
CN202210880783.1 |
2022-07-26 |
CN114945075A |
2022-08-26 |
肖笛; 刘振颖; 李梓申; 赵少华; 赵磊; 刘孟卫 |
一种视频内容同步新配音音频内容的方法及装置,该方法通过对视频中的音频内容进行识别,识别出每段音频的原语种文字内容和原语种配音音频出现的时间段;对翻译得到的目标语种文字内容进行目标语种语音合成;将前后配音时长进行比较;定位目标语种语音合成后的配音时长超出原语种配音时长的音频在视频时间轴上的视频时间点位置,计算出超出时长;根据定位的视频时间点、计算的超出时长和对应的视频帧率,对视频的画面进行视频帧数增加处理;对视频画面进行帧数增加处理后,将视频画面与目标语种音频文件合并,获得新配音视频。本发明提高原语种视频转译为新配音语种视频的效率,节约了制作时间,降低人工成本,且使新配音语种视频观赏更加流畅。 |
198 |
视频节目配音效果评估方法、装置及计算机可读存储介质 |
CN201910312601.9 |
2019-04-18 |
CN110087129B |
2022-07-01 |
朱胜强 |
本发明提出一种视频节目配音效果的评估方法,该方法包括:将待播放视频节目对应的配音部分转换为相应文本T1;将配音部分转换所得的文本T1与待播放视频节目的脚本S进行对比,由对比的结果计算第一配音效果得分Score1;将待播放视频节目的脚本S转换为相应语音V;将脚本S转换所得的语音V与待播放视频节目对应的配音部分进行对比,由对比的结果计算第二配音效果得分Score2;根据转换的权重、所述第一配音效果得分Score1和所述第二配音效果得分Score2,得到最终的配音效果得分。本申请提供的技术方案既降低了配音部分与文本之间转换效果的审核成本,又可更加客观、公正、准确地评价配音人员的配音效果。 |
199 |
英文配音的合成方法及装置、存储介质及电子设备 |
CN202111412688.0 |
2021-11-25 |
CN114120963A |
2022-03-01 |
李健保; 盛沛 |
本申请公开了一种英文配音的合成方法及装置、存储介质及电子设备,可应用于金融领域或其他领域。该方法包括:当接收到对英文文本进行语音合成的指令时,确定英文文本中的每个英文单词是否符合预设的替换条件,并将符合该替换条件的英文单词确定为待替换单词;在预设的多个拼接单词组中,确定每个待替换单词对应的目标拼接单词组;将英文文本中每个待替换单词替换为其对应的目标拼接单词组,得到替换后的英文文本;通过预设的语音合成模型对替换后的英文文本进行处理,将处理得到的合成语音作为该英文文本对应的英文配音。应用本申请的方法,可将不易准确发音的英文单词替换成拼接词组,有利于提高合成发音的准确度,可避免人工纠正,提高效率。 |
200 |
识别媒体文件中人声配音类型的方法、装置及存储介质 |
CN202110383017.X |
2021-04-09 |
CN113516154A |
2021-10-19 |
马天泽 |
本公开是关于一种识别媒体文件中人声配音类型的方法、装置及存储介质。一种识别媒体文件中人声配音类型的方法,包括:获取待识别的媒体文件,媒体文件至少包括音频数据,音频数据至少包括人声配音数据。基于预先训练得到的类型识别模型,确定人声配音数据中的人声配音的配音类型,配音类型包括真实人声和模拟人声。通过本公开提供的识别媒体文件中人声配音类型的方法,能够通过预先训练得到的类型识别模型将媒体文件中人声配音数据中的人声配音进行识别,进而确定该人声配音的配音类型属于真实人声还是模拟人声,从而提高音频分类的辨识度,解决无法有效分辨人声配音的配音类型的问题。 |