首页 / 专利库 / 广播 / 帧内预测 / 用于确定多媒体序列的帧尺寸的方法

用于确定多媒体序列的尺寸的方法

阅读:387发布:2022-10-02

专利汇可以提供用于确定多媒体序列的尺寸的方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种 电子 设备,该电子设备包括多媒体播放单元和处理器。该处理器:接收多媒体序列;从所接收的多媒体序列中获取第一 帧 头的第一比特率;通过公式来预测包括第一帧头的第一帧的第一长度,该公式至少使用了包括第一比特率以及第二长度与位于第一帧头之前的第二帧头的第二比特率之比在内的参数;并且根据所预测的第一帧的第一长度来指导该多媒体播放单元播放第一帧的帧数据。,下面是用于确定多媒体序列的尺寸的方法专利的具体信息内容。

1、一种电子设备,该电子设备包括多媒体播放单元和处理器,所述处理器:接收多媒体序列;从所接收的多媒体序列中获取第一头的第一比特率;通过公式来预测包括第一帧头的第一帧的第一长度,所述公式使用的参数至少包括第一比特率以及第二长度与第二帧头的第二比特率的比,该第二帧报头在所述第一帧报头之前;并且根据所述预测的第一帧的第一长度来指导所述多媒体播放单元播放所述第一帧的帧数据。
2、 根据权利要求l所述的电子设备,其中所述处理器还根据所述预测的 第一长度确定位于第一帧之后的第三帧报头的开始位置,并且根据所述第一 帧报头的开始位置与所述第三帧报头的开始位置之间的长度更新所述第一长 度,并且所述第三帧报头的所述开始位置位于第一搜索区域中,该第一搜索 区域包括第一帧头的开始位置加上所预测的第一长度的位置。
3、 根据权利要求2所述的电子设备,其中所述处理器还从所述第二帧报头中获取所述第二比特率并且通过测量所述第二帧头与所述第一帧报头之间 的长度确定所述第二长度,并且第一帧报头、第二帧报头和第三帧报头中的 每一个包括相同特定构造的相同公共模式。
4、 根据权利要求3所述的电子设备,其中所述多媒体序列是MPEG-1、 11172-3(.mp3)文件,并且所述公共模式符合MP3报头格式。
5、 根据权利要求2所述的电子设备,其中所述处理器还在所述第一搜索区域内搜索所述第三帧报头的同步模式以确定所述第三帧头的所述开始位置。
6、 根据权利要求2所述的电子设备,其中所述处理器还获取所述第三帧 头的第三比特率,当所述第三比特率等于所述第一比特率时将包括第三帧报 头的所述第三帧的第三长度确定为更新后的所述第一长度,根据第三帧报头 的所述开始位置与位于所述第三帧之后的第四帧报头的开始位置之间的长度 更新所述第三长度,并且指导所述多媒体播放单元播放所述第三帧的帧数据,其中所述第四帧报头的所述开始位置位于第二搜索区域中,该第二搜索区域 包括第三帧报头的开始位置加上预定的第三长度的位置。
7、 根据权利要求6所述的电子设备,其中所述第二搜索区域小于所述第 一搜索区域。
8、 根据权利要求6所述的电子设备,该电子设备还包括数据存储装置, 该数据存储装置被构造用于存储査找表,该査找表包括所述更新后的第一长 度与所述第一比特率之间的映射,其中所述处理器还查阅所述查找表以确定 所述第三比特率与所述第一比特率是否匹配,以及如果所述第三比特率等于 所述第一比特率时,则读出所述更新后的第一长度。
9、 一种用于找出多媒体序列的帧尺寸的方法,所述方法包括: 从所述多媒体序列中获取第一帧报头的第一比特率; 通过公式来预测包括所述第一帧报头的第一帧的第一长度,该公式使用的参数至少包括所述第一比特率以及第二长度与第二帧报头的第二比特率之 比,该第二帧报头在所述第一帧报文之前;在第一搜索区域内搜索同步模式,以确定位于第一帧之后的第三帧头的 开始位置,该第一搜索区域包括第一帧头的开始位置加上所预测的第一长度 的位置的;将第一长度更新为所述第一帧报头与所述第三帧报头的开始位置之间的 长度;以及播放第一帧的帧数据。
10、 根据权利要求9所述的方法,其中预测所述第一长度进一步包括: 从所述第二帧报头中获取所述第二比特率;以及通过测量所述第二帧报头的开始位置与所述第一帧报头的开始位置之间 的长度来确定所述第二长度。
11、 根据权利要求9所述的方法,该方法进一步包括: 获取所述第三帧报头的第三比特率;当所述第三比特率等于所述第一比特率时,将包括所述第三帧报头的第 三帧的第三长度确定为所述更新后的第一长度;在第二搜索区域内搜索所述同步模式,以确定位于第三帧之后的第四帧 头的开始位置,该第二搜索区域包括所述第三帧头的开始位置加上所预测的 第三长度的位置;将所述第三长度确定为所述第三帧报头与第四帧报头的开始位置之间的 长度;以及播放所述第三帧的帧数据。
12、 根据权利要求ll所述的方法,其中确定所述第三长度进一步包括: 将更新后的第一长度与第一比特率之间的映射存储在查找表中; 查阅所述查找表以确定所述第三比特率是否等于所述第一比特率;以及 如果所述第三比特率等于第一比特率,则将所述第三长度设定为更新后的第一长度。
13、 根据权利要求ll所述的方法,其中所述第二搜索区域小于所述第一 搜索区域。
14、 根据权利要求11所述的方法,其中所述第一搜索区域被定义在第一 预测位置减去第一公差长度与所述第一预测位置加上所述第一公差长度再加 上预定报头长度之间,所述第二搜索区域被定义在第二预测位置减去第二公 差长度与所述第二预测位置加上所述第二公差长度再加上所述预定报头长度 之间,所述第一预测位置与所述第一帧的所述预测的第一长度相应,并且所 述第二预测位置与所述第三帧的所述确定的第三长度相对应。
15、 根据权利要求14所述的方法,其中所述第一公差长度是大于可能的 最大比特率与可能的最小比特率的最小整数,并且所述第二公差长度是一个 字节。
16、 根据权利要求9所述的方法,其中通过公式Brlx(L0/Br0)预测所述第一帧的所述第一长度,Brl表示所述第一比特率,L0表示所述第二长度,而Br0表示所述第二比特率。
17、 根据权利要求9所述的方法,其中所述多媒体序列是MPEG-1 Audio Layer 3(.mp3)文件,并且所述同步模式是MP3报头格式的同步字。
18、 根据权利要求9所述的方法,其中所述同步模式是"OxFFF"或 "0xFFE"。
19、 一种存储有计算机程序的机器可读存储介质,该计算机程序执行包括以下步骤的方法:接收多媒体序列;从所述多媒体序列中获取第一帧头的第一比特率;通过公式来预测包括第一帧头的第一帧的第一长度,该公式使用的参数 至少包括所述第一比特率以及第二长度与位于第一帧头之前的第二帧头的第 二比特率的比在内的参数;根据所述预测的第--长度确定第三帧的开始位置,该第三帧位于所述第 一帧之后;将所述第一长度更新为所述第一帧报头的开始位置与所述第三帧报头的 开始位置之间的长度;以及 播放第一帧的帧数据。
20、 根据权利要求19所述的机器可读存储介质,其中该方法进一步包括: 在第一搜索区域内搜索同步模式,以确定第三帧头的开始位置,该第一搜索 区域内包括所述第一帧头的开始位置加上所述预测的第一长度的位置。
21、 根据权利要求19所述的机器可读存储介质,其中该方法进一步包括: 从所述第二帧报头中获取所述第二比特率;以及通过测量所述第二帧头的开始位置与所述第一帧头的开始位置之间的长 度以确定所述第二长度。

说明书全文

用于确定多媒体序列的尺寸的方法

技术领域

发明涉及用于多媒体解码的系统和方法,更具体地涉及一种用于确 定多媒体序列的帧头的开始位置的系统和方法。

背景技术

MPEG-1定义了由MPEG (运动图像专家组)承认的一组音频和视频 (AV)编码和压縮标准。MPEG-1、 Audio Layer 3是被称为MP3的流行音 频格式。随着消费者解码硬件变得更廉价和更强大,开发出了例如MPEG-2 和MPEG-4的更先进的格式。这些较新的格式更为复杂并且需要更强大的 硬件,但是这些格式也实现了更高的编码效率。
通常来讲,MP3文件由多个MP3帧组成,而MP3帧由MP3报头和 MP3数据构成。这种帧的序列被称为基本流。帧是独立的信息(item):可 以从文件中剪辑出帧,并且MP3播放器能够播放该帧。MP3报头包含了 编码机制的信息(例如,编码版本、采样率和比特率),并且MP3数据是 实际音频有效载荷。然而,各个帧的长度可能由于编码比特率等的多样性 而不固定,所以需要确定MP3文件的各个帧的长度以便进行后续解码。

发明内容

本发明提供了一种用于多媒体解码的电子设备。该电子设备包括多媒 体播放单元和处理器。该处理器:接收多媒体序列;从所接收的多媒体序 列中获取第一帧报头的第一比特率;通过公式来预测包括第一帧报头的第 一帧的第一长度,该公式使用的参数至少包括第一比特率以及第二长度与 位于第一帧头之前的第二帧头的第二比特率的比;并且根据所预测的第一帧的第一长度,指导该多媒体播放单元播放第一帧的帧数据。
本发明提供了一种用于确定多媒体序列的帧尺寸的方法。首先,从多 媒体序列中获取第一帧头的第一比特率。然后,通过公式来预测第一帧的 第一长度,该第一帧包括第一帧报头。该公式使用的参数至少包括第一比 特率以及第二长度与第二比特率的比。第二比特率是位于第一帧头之前的 第二帧头的比特率。然后,在第一搜索区域内搜索同步模式,以确定位于 第一帧之后的第三帧头的开始位置,该第一搜索区域包括第一帧头的开始 位置加上所预测的第一长度的位置的。然后,将第一长度更新为第一帧头 与第三帧头的开始位置之间的长度。最后,播放第一帧的帧数据。
本发明提供了一种存储有执行多媒体解码方法的计算机程序的机器可 读存储介质。首先,接收多媒体序列。然后,从该多媒体序列中获取第一 帧头的第一比特率。然后,通过公式来预测第一帧的第一长度,该第一帧 包括第一帧报头,该公式使用的参数至少包括第一比特率以及第二长度与 位于第一帧头之前的第二帧头的第二比特率的比。然后,根据所预测的第 一长度,确定位于第一帧之后的第三帧头的开始位置。然后,将第一长度 更新为第一帧头与第三帧头的开始位置之间的长度。最后,播放第一帧的 帧数据。
附图说明
通过参照附图来阅读后面的详细说明书实施例,可以更全面地理解 本发明,附图中:
图1示出了用于播放多媒体文件的系统的实施方式;
图2示出了音频报头格式的例子,MPEG1、 11172-3; 图3A是用于确定多媒体序列的帧尺寸的方法的流程图; 图3B是图3A的接续流程图;而
图4A至4B示出了与图3A的方法相对应的一段多媒体序列。
具体实施方式图1示出了用于播放多媒体文件的系统的实施方式。系统ioo包括多媒 体解码器102、多媒体播放单元104、处理器106、易失性存储器108和非易 失性存储器110。非易失性存储器110 (例如,硬盘或闪存)可以存储诸如音 频文件、视频文件或其组合的多媒体文件。多媒体文件通常包括按序排列(in sequence)的多个帧(multiple frame),并且每个帧通常都由两部分组成,开始 部分(leadingpart)是帧报头,后面部分是帧数据。每个帧报头都具有特定构 造的公共模式,该公共模式通常由同步模式和多媒体概况信息(例如,文件 类型、比特率、编码方案等)组成。各个帧数据可以存储一段(segment)经 编码的多媒体数据,并且可以根据各个相应的帧报头而被解码。在多媒体文 件中,各个帧报头的长度(或尺寸)是固定的,然而,因为帧数据的比特率 可能随编码机制而变换,所以各帧的长度可能不是固定的。因此,处理器106 可以运行执行用于找到多媒体文件的帧头的方法的计算机程序,以确定帧的 开始位置。多媒体解码器102可以根据存储在相应帧报头中的多媒体概况信 息来对帧数据进行解码。随后,处理器106可以指导诸如显示单元或扬声器 的多媒体播放单元104来播放被解码的帧数据。易失性存储器108可以存储 该计算机程序并由处理器106来访问,该易失性存储器108例如是动态随机 存取存储器(DRAM)、静态随机存取存储器(SRAM)等。
图2示出了通常被称为MP3的音频报头格式的例子,MPEG1、 11172-3。 音频报头格式包括多个字段。在多媒体文件中,各个帧报头具有相同的报头 长度。字段SYNC—WORD可以用作同步模式(例如,OxFFF或OxFFE)以验 证有效帧的开始。字段ID表示了 MPEG音频版本ID,而字段LAYER表示了 编码层。字段SAMPLING—RATE表示了 MP3文件的采样率,例如16 kHz或 24 kHz。在MP3文件中,字段SYNC—WORD、 ID、LAYER和SAMPLING—RATE 在整个MP3文件的每个帧头中被看作是不变的(constant)。字段BITRATE 表示了相应帧数据的比特率,并且在多媒体编码器对MP3文件进行编码时有 若干个预定比特率可供选择。注意到,诸如MPEG-2或MPEG-4的其他多媒 体帧头可以包含具有不同同步模式的不同报头格式。
8表1示出了MPEG1、 11172-3的比特率表的例子,其中Fs表示采样率并
且字段BITRATE的长度为4位。
table see original document page 9

表l
图3A是用于确定多媒体序列的帧尺寸(frame size)的方法的流程图,并且该方法可以被存储在计算机程序中并由图1中所示的处理器来执行。图4A至图4B示出了与图3A方法对应的一段多媒体序列。参照图3A和图4A,从多媒体序列中获取第一代码段H0和第二代码段H1 (步骤S302),并且从第一代码段HO中获取第一可能比特率(potential bitmte) Br0 (步骤S304)。第一代码段H0和第二代码段Hl都包括特定构成(specific organization)的相同模式(即,公共模式)。确定第一代码段(code segment)与第二代码段的开始位置P0与Pl之间的第一帧的长度L0,并且将Br0与L0之间的映射存储在查找表中(步骤S306)。查找表可以被存储在图1所示的易失性存储器中,并且图1所示的处理器可以査阅该査找表并从易失性存储器中读出相应长度。表2示出了假定多媒体文件是MPEG1、 11172-3、 Layer II或Layer III的文件的查找表的例子。例如,如果可能比特率BrO是40kbit/s,则可以将第一长度LO在査找表中存储为Len(BMO)。因此,从第二代码段HI中获取可能比特率Brl (步骤S308),并且核对与所获取的比特率Brl对应的长度在查找表中是否已被确定(步骤S310)。
table see original document page 10
当获取的比特率Brl对应的长度没有被确定(例如,比特率Brl是96kbt/s而表2中没有存储与比特率Brl对应的帧长度),则利用公式来预测第二帧的长度Ll,该公式使用的参数至少包括长度L0与比特率Br0和Brl的比(步骤S312)。例如,长度L1被预测为Brlx(L0/Br0)。位置Pc被设定为Pl加上所预测的长度Ll (步骤314)。在Pc减去公差长度Lbl与Pc加上公差长度LM再加上预定报头长度之间定义搜索区域(步骤S316)。公差长度Lbl可以是大于Brmax/Brmin的最小整数,其中Brmax和Brmin分别是帧的可能的最大比特率和最小比特率。参照图4B,从搜索区域中获取开始位置为P2的第三代码段H2,第三代码段H2包括该特定构造的公共模式(步骤S318)。因此,根据开始位置Pl与P2之间的实际长度更新长度Ll,并将Brl与Ll之间的映射存储在查找表中(步骤S320)。
当获取的比特率Brl对应的长度被确定(例如,比特率Brl是40kbit/s,并且在表2中找到了相应的帧长度Len(Br40)),则从査找表中获取与比特率Brl相应的预定(即,存储的)长度Ld (步骤S322),并且位置Pc被设定为Pl加上该预定长度Ld(步骤S324)。在Pc减去公差长度Lb2 (例如,1字节)与Pc加上公差长度Lb2再加上预定报头长度之间定义搜索区域(步骤S326)。从搜索区域中获取包括特定构造的公共模式的开始位置为P2的第三代码段H2,第三代码段H2包括特定构造的公共模式(步骤S328)。
另外,当开始位置P2可以从搜索区域中发现时,则长度LO可以被认为是可靠的并且LO与BrO的比也可以被认为是可靠的。此外,代码段H0和H1被发现的具有特定构造的相同模式也可以被认为是可靠的。然而,当搜索区域中不能发现开始位置P2时,需要确定另一公共模式来获取新长度L0,并且需要对新的LO进行再次验证。为了解决这种例外的结果,可以在先前获取的多媒体序列的代码段H0之后重新执行步骤S302到S328。
图3B是图3A的接续流程图。第三代码段H2被设定为开始位置为P(i-l)的帧报头H(i-l)(步骤S330)。从帧报头H(i-l)获取比特率Br(i-l)(步骤S332),随后检查与所获取的比特率Br(i-l)对应的长度是否己被确定(步骤S334)。当获取的比特率Br(i-l)对应的长度没有被确定时,则利用公式来预测第(i-l)帧的长度L(i-l),该公式使用的参数至少包括Br(i-l)以及长度LO与比特率Br0的比(步骤S336)'并且位置Pc被设定为P(i-l)加上预测的长度L(i-l)(步骤S33S)。在Pc减去公差长度Lbl与Pc加上公差长度Lbl再加上预定报头长度之间定义搜索区域(步骤S340)。公差长度Lbl例如可以是大于Brmax/Brmin的最小整数,其中Brmax和Brmin分别是帧的可能的最大比特率和最小比特率。从搜索区域中获取开始位置为P(i)的帧报头,该帧报头包括特定构造的公共模式(步骤S342)。因此,根据开始位置P(i-l)与P(i)之间的实际长度,更新长度L(i-l),并将Br(i-l)与L(i-l)之间的映射存储在查找表中(步骤S344)。
另外,当获取的比特率Br(i-l)对应的长度被确定时,从查找表中获取与比特率Br(i-l)相应的预定长度Ld (步骤S346),并且位置Pc被设定为P(i-l)加上该预定长度Ld(步骤S348)。搜索区域被定义在Pc减去公差长度Lb2(例如,l字节)与Pc加上公差长度Lb2再加上预定报头长度之间(步骤S350)。从搜索区域中获取开始位置为P(i)的帧报头,该帧报头包括特定构造的公共模式(步骤S352)。在找到了包括P(i)的帧报头之后,确定多媒体文件是否结束(步骤S354)。如果是,则整个处理也结束;如果否,则将所获取的帧头设定为帧报头H(i-l)(步骤S356),然后返回到步骤S332以发现后续多媒体帧。
该实施方式的优点是,仅通过一个变量(即,帧比特率)就可以从多媒体序列中确定帧尺寸,该多媒体序列的每个帧报头中具有同步模式(或公共模式)和比特率信息。该实施方式的另一个优点是,因为比特率的类型是有限的,所以可以在通过公式获取映射以及通过检查下一帧头对映射进行验证之后,生成并存储与查找表中与比特率类型相应的帧长度的记录。因此,可以縮短解码过程中的搜索时间。
尽管已经通过实施例并就优选实施方式对本发明进行了描述,但是应当理解本发明并不限于此。在不脱离本发明的主旨或范围的条件下,本领域技术人员可以做出任何变型或修改。因此,所附权利要求书的范围应当被给予最宽泛的解释以涵盖所有这种修改和相似设置。
标题 发布/更新时间 阅读量
一种基于块编码特性的3D视频错误隐藏方法 2020-05-08 55
手语识别系统 2020-05-08 975
一种基于手机惯性传感器的行人移动方向识别方法 2020-05-08 857
影像处理设备和影像处理方法 2020-05-08 951
一种视频解码中运动补偿的方法及装置 2020-05-08 971
基于多特征融合的景区游玩轨迹预测系统 2020-05-08 186
编码和解码图像的方法及使用该方法的设备 2020-05-08 130
一种柜面助手履职监控装置和方法 2020-05-08 867
一种基于无锚点机制的火焰检测方法及装置 2020-05-11 848
安全预警方法、装置、计算设备及存储介质 2020-05-08 144
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈