61 |
视频生成方法、装置以及存储介质 |
CN202311160299.2 |
2023-09-08 |
CN119603523A |
2025-03-11 |
豆子飞; 张翔云 |
本公开是关于一种视频生成方法、装置及存储介质。视频生成方法包括:拍摄视频画面,并在拍摄视频画面过程中,监测视频画面中目标对象的移动速度;确定移动速度达到速度阈值的第一时间点;在第一时间点之后继续拍摄视频画面,并对齐第一时间点和第二时间点,将媒体文件添加至拍摄的视频中,生成目标视频;其中,目标视频满足当拍摄画面播放至第一时间节点时,媒体文件同步播放至第二时间节点。通过本公开,能够实现在视频画面拍摄完毕后立刻生成一段带有背景音乐,且背景音乐和视频画面相匹配的视频。 |
62 |
字幕显示方法、装置、设备、存储介质及程序产品 |
CN202411680285.8 |
2024-11-22 |
CN119603521A |
2025-03-11 |
郁文清; 邱阳; 吴卫民 |
本申请公开了一种字幕显示方法、装置、设备、存储介质及程序产品,用于提高字幕显示的效率和准确率,确保字幕与视频画面的情境相匹配。所述方法包括:从视频文件中分离出音频流和视频帧序列;基于所述音频流的音频特征和所述视频帧序列中每个视频帧的图像特征,确定所述视频帧序列中与所述音频流中语音信号同步的目标视频帧;基于所述目标视频帧对应的语音信号,生成所述目标视频帧对应的字幕文本;基于所述语音信号的时间信息,在所述目标视频帧上显示所述字幕文本。 |
63 |
视频同步回放方法、系统、设备及存储介质 |
CN202411341361.2 |
2024-09-25 |
CN119603480A |
2025-03-11 |
康守伟; 张剑; 张南南; 张海达; 赵石岩 |
本申请提供了一种视频同步回放方法、系统、设备及存储介质,该方法包括:从多个媒体资源接收到视频帧并进行缓冲;对于每个媒体资源,确定对应的当前时钟频率;其中,在一个统计周期内,基于总接收时间和RTP时间戳差值计算该统计周期内的平均时钟频率,根据平均时钟频率确定当前时钟频率;对于缓冲的视频帧,基于RTCP发送者报告和所对应的当前时钟频率计算绝对时间戳;封装缓冲的视频帧得到多个媒体资源的封装视频文件,将封装视频文件和其中视频帧的绝对时间戳列表发送至客户端,客户端配置为接收到多个媒体资源的封装视频文件后,根据绝对时间戳列表,同步回放封装视频文件中的视频帧。通过采用本申请,能够很好地兼容各种类型的媒体资源视频数据。 |
64 |
一种飞屏交互方法、装置、电子设备及存储介质 |
CN202411534693.2 |
2024-10-31 |
CN119603352A |
2025-03-11 |
曹明 |
本发明提供了一种飞屏交互方法、装置、电子设备及存储介质,涉及智能座舱技术领域。本发明所述方法应用于终端设备,至少两个终端设备与云端连接,云端部署有云端实例,飞屏交互方法包括:对当前终端设备的显示屏上的交互操作进行识别,根据识别结果确定当前终端设备中的待飞屏应用以及待飞屏的目标终端设备,其中,当前终端设备与目标终端设备绑定相同的云端实例,当前终端设备为至少两个终端设备中的任意一个,目标终端设备为至少两个终端设备中除当前终端设备以外的任意一个;向云端发送待飞屏应用的状态数据,以使云端在接收到状态数据后通过云端实例将待飞屏应用推送至目标终端设备。本发明有效提升了多屏联动体验。 |
65 |
图像显示方法、系统和存储介质 |
CN202411648426.8 |
2024-11-18 |
CN119598044A |
2025-03-11 |
周新科; 朱超; 丁海兵; 程思伟 |
本发明公开了图像显示方法、系统和存储介质,所述方法包括:获得第一图像集合和第二图像集合,并将处理后的第一图像信息和第二图像信息分别存储至缓存区域;第一图像集合以第一频率采样得到,第二图像集合以第二频率采样得到,所述第一频率大于所述第二频率;以第三频率扫描所述缓存区域,显示第一图像和/或第二图像,所述第三频率大于等于所述第一频率。该方法通过以一个大于等于最高采样频率(即第一频率)的第三频率来扫描缓存区域,确保即使图像集合的采样频率不同,也能以足够的频率刷新显示内容,从而避免了图像卡顿或显示延迟的问题,同时保证了图像的高流畅度和实时性。 |
66 |
基于生成式人工智能的音视频联合编码、解码方法和系统 |
CN202411787828.6 |
2024-12-06 |
CN119583873A |
2025-03-07 |
徐正春; 许道礼; 陈志波; 黄瑞丰; 向国强; 沙克成; 管健 |
本发明公开一种基于生成式人工智能的音视频联合编码、解码方法,编码包括:从音频信号和视频中提取各种模态特征;在跨模态注意力中进行融合;任务识别,首先识别当前的任务类型,确定了任务类型,系统将分析该任务的具体需求;动态自适应权重分配;融合特征,将分配了不同权重的多模态特征进行融合。本发明的优点在于:将音视特征提取、视频特征提取和基于AI的生成技术,首次应用在对音视频的联合编码中,解决了传统方法在进行视频的编解码的时候,压缩效率低以及不能应对更高质量的追求的问题。同时,基于生成式的编解码方式,可以灵活根据用户的个人需求,进行风格和质量的调整。 |
67 |
用于播放数据的方法、计算设备和存储介质 |
CN202510083709.0 |
2025-01-20 |
CN119583835A |
2025-03-07 |
陈建飞; 周天文; 张静; 解群眺; 王迎; 罗丁元; 李红波; 朱宗志 |
本发明的实施例涉及一种用于播放数据的方法、计算设备和存储介质。该方法包括在主设备处,从参与解析任务的设备处,实时获取多源待播放数据,参与解析任务的设备包括主设备和/或至少一个叶子设备,解析任务由主设备基于来自多个输入源的待解析数据生成并分配;基于预定参数或者响应于用户的操作,确定关于多源待播放数据的播放方案,以便生成多个播放线程;基于所生成的播放线程,重构所获取的多源待播放数据;以及基于播放方案和经重构的多源待播放数据,在目标播放窗口中播放多源待播放数据的部分或全部。由此,能够有效的提高针对多源解析数据的播放流畅度,并且支持多源解析数据的同步播放、实时播放和比对播放。 |
68 |
多相机时空联合同步采集处理方法、设备及存储介质 |
CN202411790843.6 |
2024-12-06 |
CN119583732A |
2025-03-07 |
黄敦笔; 薛飞洁 |
本发明提供一种多相机时空联合同步采集处理方法、设备及存储介质,该方法包括:接收各个相机上传的数据包,并生成对应的视频数据包队列;获取每一队列的第一帧视频数据包的UTC绝对时间戳和每一视频数据包的PTS;计算每一视频数据包的PTS相对于第一帧视频数据包的PTS的递增偏移量,根据第一帧视频数据包的UTC绝对时间戳以及各个视频数据包对应的递增偏移量计算各个视频数据包的UTC绝对时间戳;根据不同视频接收时刻接收到的各相机的视频数据包的UTC绝对时间戳确定相对同步性程度最优的视频接收时刻作为视频同步时间点,并根据视频同步时间点对应的视频数据包生成基于多相机的同步多视点视频序列,实现多相机视频数据的时空联合同步采集。 |
69 |
用于显示针对一组用户的内容推荐的用户界面 |
CN202411667576.3 |
2022-06-03 |
CN119576459A |
2025-03-07 |
C·J·桑德斯; N·P·科密肯; T·J·佩恩 |
本公开涉及用于显示针对一组用户的内容推荐的用户界面。在一些实施方案中,电子设备根据本公开的一些实施方案为一组用户呈现推荐内容。该电子设备与包括第一用户账户的多个用户账户相关联,经由显示生成部件显示与该第一用户账户相关联的媒体浏览用户界面。根据确定该第一用户账户满足一个或多个标准并且根据确定与该电子设备相关联的该多个用户账户中的第一用户账户子集已被选择用于包括在内容推荐中,该电子设备被配置为在该媒体浏览用户界面中显示基于该第一用户账户和该第一用户账户子集的一个或多个特性的媒体内容推荐的一个或多个表示。 |
70 |
基于音频的文本处理方法、装置、设备及存储介质 |
CN202311134444.X |
2023-09-04 |
CN119562114A |
2025-03-04 |
曹堃 |
本公开实施例提供了一种基于音频的文本处理方法、装置、设备及存储介质。包括:获取最新基准音频进度及连麦端对应的音频流;其中,所述连麦端包括嘉宾端和/或主播端;基于本地系统时间和所述最新基准音频进度确定所述音频流的当前音频进度;播放所述音频流,并根据所述当前音频进度渲染所述音频流对应的目标文本内容。本公开实施例提供的基于音频的文本处理方法,基于本地系统时间和最新基准音频进度确定音频流的当前音频进度,以根据当前音频进度渲染音频流对应的目标文本内容,由此提升了文本的显示进度与音频的播放进度对齐效果。 |
71 |
一种为嵌入式设备优化的高精度新闻字幕实时生成方法及装置 |
CN202411457935.2 |
2024-10-18 |
CN119545070A |
2025-02-28 |
甘泉; 张平; 李雨情 |
本发明公开了一种为嵌入式设备优化的高精度新闻字幕实时生成方法及装置,涉及字幕生成技术领域。首先对输入的音视频进行提取音频数据及预处理,作为下一步模型的输入数据;接下来进行垂直领域语音识别压缩,主要分为压缩和推理两个阶段,其中压缩阶段基于新闻语音的特征,对现有的神经网络语音识别模型进行新闻语音特征提取和模型压缩,减少模型中通用语音识别领域的知识;而推理阶段则利用压缩后的模型进行自动化语音识别。然后将文本信息与音频数据的时间轴同步,生成时间戳;根据时间戳和文本内容,动态生成新闻字幕。本发明聚焦于新闻字幕生成,针对嵌入式的运行场景进行优化,基于垂直领域语音识别模型压缩技术实现自动化字幕实时生成。 |
72 |
时钟同步的方法以及视频传输装置 |
CN202411710112.6 |
2024-11-27 |
CN119545061A |
2025-02-28 |
石永双 |
本发明公开一种时钟同步的方法以及视频传输装置。其中,该方法包括:接收目标端基准时钟信号、发送自源端的视频输入信号;根据视频输入信号,度量出帧时长度;用目标端基准时钟信号度量出输入视频信号两个特定位置间的目标端时钟度量数据,根据帧时长度求得输入视频信号两个特定位置间的源端时钟度量数据;根据基准视频时序与输入视频信号的同步位置差值,生成控制指令;发送所述控制指令和时钟度量数据给源端,以指示源端根据控制指令和时钟度量数据改变时钟频率。本发明能够在常见的视频传输方式中实现视频同步,并且不增加成本,不破坏传输链路。 |
73 |
一种视频画面的多屏幕显示方法与系统 |
CN202411655620.9 |
2024-11-19 |
CN119545059A |
2025-02-28 |
程胜利; 胡文 |
本申请涉及视频数据传输技术领域,具体涉及一种视频画面的多屏幕显示方法与系统,该方法包括:获取各屏幕中待显示的视频帧图像以及对应各屏幕传输时的带宽数据,确定视频帧图像中各区域的运动显著值,结合区域内的纹理分布情况,获取视频帧图像中各区域的视频编码质量系数,计算各带宽数据的跳变骤减系数,获取各屏幕在显示各视频帧图像时的画面压缩程度值;基于所述画面压缩程度值,对各屏幕中各视频帧图像的压缩编码参数进行优化。本申请可提高视频画面多屏幕显示的稳定性。 |
74 |
视频共享和同步方法 |
CN202311098451.9 |
2023-08-29 |
CN119545058A |
2025-02-28 |
文志平; 李祖金; 张华; 沈奇力; 裘昊 |
本发明公开了一种视频共享和同步方法,应用于包括一个主屏和多个副屏的视频播放系统,包括以下步骤:启动各屏系统中的设备发现服务,每个系统中的设备发现服务收集挂载在该系统上的屏的信息,并获取当前系统的通信地址;设备发现服务将收集到的屏信息进行发布,各个系统上的设备发现服务监测并收集到其它屏的信息;一芯多屏系统的多屏属于同一个系统,在一芯多屏系统的播放应用启动后,一芯多屏系统的多屏将自己的屏幕窗口画布注册给播放应用;根据主屏的类型,进行对应的视频共享和同步。本发明实现了一芯多屏和独立芯片多屏混合场景下的视频数据共享解决方案的性能优化。 |
75 |
一种直播视频的处理方法、装置、设备及存储介质 |
CN202311121758.6 |
2023-08-31 |
CN119545031A |
2025-02-28 |
刘珂; 徐邦智; 赵元源; 胡安迪; 郑通; 曹石琦 |
本公开提供了一种直播视频的处理方法、装置、设备及存储介质,所述方法包括:响应于携带预设辅助看播标识的看播请求,获取所述看播请求对应的直播视频流中的音频片段;提取所述音频片段对应的文本片段中的关键词,并获取所述关键词对应的辅助看播视频素材;基于所述关键词对应的辅助看播视频素材,生成所述音频片段对应的辅助看播视频片段;针对所述看播请求返回所述辅助看播视频片段。可见,本公开实施例能够基于直播视频流中的音频片段对应的关键词以及辅助看播视频素材,生成音频片段对应的辅助看播视频片段,并返回辅助看播视频片段,能够便于用户基于辅助看播视频片段了解直播内容,从而提升了用户的体验。 |
76 |
音效控制方法、装置及计算设备 |
CN202411654160.8 |
2024-11-19 |
CN119520893A |
2025-02-25 |
裴悦希; 张鹏宇; 郑婷婷 |
本说明书实施例提供音效控制方法、装置及计算设备,其中音效控制方法包括:将待控制的场景画面划分为至少两个场景区域;响应于目标场景区域的音效控制事件,确定目标场景区域的区域内容信息,并根据区域内容信息确定目标场景区域的目标音效参数,其中,目标场景区域为至少两个场景区域中的任一个;根据目标场景区域的目标音效参数,控制目标场景区域的音效。通过对待控制的场景画面进行区域划分,不同场景区域的音效独立调控,允许不同的场景区域播放不同的音效,提升音效的层次感和动态表现力,且基于场景动态变化的区域内容信息,实现了动态的音效控制,避免在复杂场景中音效与实际场景脱节,提高了音效的控制效果。 |
77 |
屏幕共享处理方法和装置 |
CN202411461487.3 |
2024-10-18 |
CN119520875A |
2025-02-25 |
祝伟; 陈秀红; 吴凯; 庞亚淳; 许永涛; 陈庆; 黄敏华; 王劲鹏; 黄海龙; 罗焕发 |
本发明提供了一种屏幕共享处理方法和装置,该方法包括:第一终端通过通话应用程序与第二终端建立通话后,根据服务应用程序的访问指令进入服务应用程序,获取在服务应用程序内提交的屏幕共享指令,响应于屏幕共享指令,通过服务应用程序进行屏幕录制,获得进行屏幕共享的屏幕视频流,实现在通话过程中的屏幕共享。 |
78 |
显示设备、内容推送及接力方法 |
CN202111139380.3 |
2021-09-26 |
CN113891129B |
2025-02-25 |
马晓燕; 庞秀娟; 宋子全; 张娜; 刘美玉; 贾亚洲 |
本申请公开了显示设备、内容推送及接力方法,显示设备在呈现由内容应用提供的目标内容时,搜索支持目标接力能力的外部终端设备,目标接力能力是指终端设备呈现目标内容所需的能力;呈现搜索到的外部终端设备的设备信息,以供用户从支持目标接力能力的外部终端设备中指定目标接收端设备;响应于输入的指示将目标内容推送至目标接收端设备的内容推送指令,从内容应用获取目标内容的播放信息;根据目标内容的播放信息向目标接收端设备发送接力请求,以请求目标接收端设备根据所述目标内容的播放信息继续呈现目标内容。 |
79 |
用于不对称音箱的混合编解码器当前延迟同步 |
CN202280098351.3 |
2022-08-02 |
CN119497995A |
2025-02-21 |
张楠 |
实施例包括由主机设备执行的用于同步蓝牙低功耗(BLE)音频的方法,该方法包括:确定经由第一BLE连接耦接到主机设备的第一连接的音频输出设备的第一编解码器解码延迟,确定经由第二BLE连接通信地耦接到主机设备的第二连接的音频输出设备的第二编解码器解码延迟,确定第一编解码器和第二编解码器的解码延迟的差,将补偿延迟确定为第一编码‑解码延迟和第二编码‑解码延迟之间的时间差,将所述第一BLE连接或所述第二BLE连接中的一个配置为包括当前补偿延迟,并且经由所述第一BLE连接和所述第二BLE连接向所述第一连接的音频输出设备和所述第二连接的音频输出设备发送音频数据。 |
80 |
一种脑机接口系统脑电数据与图像同步系统及方法 |
CN202411613461.6 |
2024-11-13 |
CN119496937A |
2025-02-21 |
史峻逸 |
本发明公开了一种脑机接口系统脑电数据与图像同步系统,包括PC、接收机主机、若干接收机从机和摄像头,PC向接收机主机发送命令,并接收和处理接收机主机的数据,并控制摄像头录像或拍照,且接收和处理摄像头拍摄的视频或图像;启动接收机主机向PC发送脑电数据包,同时启动接收机从机向PC进行数据传输,向接收机从机和摄像头发出固定频率和固定周期脉冲,使得若干接收机从机之间同步和摄像头的拍照功能。本发明提供的一种脑机接口系统脑电数据与图像同步系统及方法,通过在接收机主机,向接收机从机和摄像头发出统一的启停信号和固定周期的脉冲,使主机、从机和摄像头同时开始向PC端传输脑电数据和图像,达到脑电数据和图像的同步效果。 |