对使用AMR净荷格式的基于IP的系统提高音频质量的系统和方法

申请号 CN200580040685.1 申请日 2005-06-20 公开(公告)号 CN101065946A 公开(公告)日 2007-10-31
申请人 索尼爱立信移动通讯股份有限公司; 发明人 G·R·科尔;
摘要 对使用自适应多速率(AMR)净荷格式的基于因特网协议(IP)的系统提高音频 质量 的方法被提出。如果指示网络拥塞的网络 缓冲器 超过其 阈值 210,则确定是否将NO DATA 帧 置于当前RTP分组中来代替所述AMR帧240。如果网络状况过于拥塞,则NO DATA帧被置于当前RTP分组中245。对每个输入AMR帧重复该过程。在用NO DATA帧替代AMR帧245之前,该过程首先确保所述AMR编码速率被设置为其最低可能的编码速率230。替代模式遍布在整个RTP分组上,以避免NO DATA帧群。该过程也可以挑选出对于替代将是好的候选者的较低 能量 值的AMR帧320。
权利要求

1.一种对使用自适应多速率(AMR)净荷格式的基于因特网协议 (IP)的系统提高音频质量的方法,包括:
获得AMR205;
确定实时传输协议(RTP)分组的缓冲器是否由于拥塞的网络状 况而已经达到阈值容量210;
如果缓冲器还没有达到其容量,则将AMR帧放置到RTP分组中 215;
否则,基于当前的网络拥塞状况,确定何时将NO DATA帧放置 到当前RTP分组中240;以及
当网络状况表明过于拥塞时,将NO DATA帧放置到当前RTP分 组中245。
2.权利要求1所述的方法,进一步包括:
在用NO DATA帧替代AMR帧以进入当前RTP分组中245之前, 确定AMR编码速率是否被设置为其最低可能的设置230,以及如果不 是,将AMR编码速率重设为其最低可能的设置235。
3.权利要求2所述的方法,进一步包括:
在RTP分组上遍布替代的NO DATA帧,以避免NO DATA帧群。
4.权利要求3所述的方法,进一步包括:
识别降到指定能量平以下的AMR帧320;
如果AMR帧替代变得必需,则早于具有大于阈值的能量水平的 AMR帧来替代在所述指定能量水平以下的AMR帧245。
5.一种用于对使用自适应多速率(AMR)净荷格式的基于因特网 协议(IP)的系统提高音频质量的系统,包括:
用于获得AMR帧205的装置;
用于确定实时传输协议(RTP)分组的缓冲器是否由于拥塞的网 络状况而已经达到阈值容量210的装置;
用于如果缓冲器还没有达到其容量则将AMR帧放置到RTP分组 中215的装置;
用于基于当前的网络拥塞状况来确定何时将NO DATA帧放置到 当前RTP分组中240的装置;以及
用于当网络状况表明过于拥塞时将NO DATA帧放置到当前RTP 分组中245的装置。
6.权利要求5所述的系统,进一步包括:
用于在用NO DATA帧替代AMR帧以进入当前RTP分组中之前 确定AMR编码速率是否被设置为其最低可能的设置230的装置,以及 如果不是,用于将AMR编码速率重设为其最低可能的设置235的装置。
7.权利要求6所述的系统,进一步包括:
用于在RTP分组上遍布替代的NO DATA帧以避免NO DATA帧 群的装置。
8.权利要求7所述的系统,进一步包括:
用于识别降到指定能量水平以下的AMR帧320的装置;
如果AMR帧替代变得必需,则早于具有大于阈值的能量水平的 AMR帧来替代在所述指定能量水平以下的AMR帧245的装置。

说明书全文

背景

基于IP的语音(VoIP)已经在个人计算和载波共用中不断得到普 及。随着技术的进步,在蜂窝设备中运行类似的业务变得可行。关键 的技术问题是如何使业务适于应付与台式PC相比减少的带宽和明显更 少的处理能。基于蜂窝的即按即说(PoC)定义了用于移动设备的半 双工VoIP系统。通过使用无线数据网络的分组交换能力,业务在地理 上不受限制,这不同于诸如专用移动无线电(PMR)之类的常规双向 无线电系统。

为了使PoC获得成功,手持机和网络的性能应该是最佳的。任何影 响延迟的性能都可能意味着在业务的成功与失败之间的差别。

PoC的音频质量受到蜂窝系统上可用的GPRS/EGPRS带宽的限 制。使用以在作为未确认传输协议的用户数据报协议(UDP)之上的 实时传输协议(RTP)封装的自适应多速率(AMR)编码,音频数据 被穿过PoC系统传送。结果,丢失的分组永不被重传。

PTT是实时应用,其中音频数据的缓冲被保持最小,以减少从谈 话突发开始到重放开始的等待时间。每个RTP分组被加了时间戳以允 许系统丢弃延迟的分组,这又防止谈话突发无限制地增长。

当前,通过缓冲以减少抖动,以及通过对分组进行重新排序以纠 正所接收的乱序的分组,已经得到了改进AMR RTP分组的下行链路流 的技术。然而,已经显示出上行链路(发送侧)中有限的带宽引起了 不能在下行链路中被纠正的丢失的分组。该带宽限制可以由拥塞或者 由具有最少数据资源的系统来引起。当前,仅有的减少上行链路中的 带宽的机制是改变AMR编码速率。该方法并不单独提供带宽的足够减 少来防止由于GPRS链路上的最小带宽而引起的丢失的分组。在使用最 低的4.75kb AMR编码速率时,已经观察到了由于有限的带宽而引起的 问题。

所需要的是一种在PoC或其他使用AMR净荷格式的基于会话业务 IP的应用中进一步节省上行链路带宽的系统和/或方法。

概要

对使用自适应多速率(AMR)净荷格式的基于因特网协议(IP) 的系统提高音频质量的一种系统、方法和计算机程序产品被提出。所 述方法对标准RTP AMR封装过程提供了增加的智能级别。如果指示 网络拥塞的网络缓冲器超出其阈值,则确定是否将NO DATA(无数 据)帧置于当前RTP分组中来代替所述AMR帧。如果网络状况过于拥 塞,则NO DATA帧被置于当前RTP分组中。对每个输入AMR帧重复该 过程。该过程首先确保,在用NO DATA帧替代AMR帧之前,所述AMR 编码速率被设置为其最低可能的编码速率。所述替代模式遍布在整个 RTP分组上,以避免NO DATA帧群。该过程也可以挑选出对于替代将 是好的候选者的较低能量值的AMR帧。

附图简述

图1是说明在标准PoC操作中所使用的典型上行链路侧数据流的 图。

图2是说明用于实施本发明的构思的逻辑流程的流程图

图3是进一步说明本发明的抽取(decimation)处理的流程图。

图4说明在没有AMR帧替代的情况下在源处的实例RTP分组。

图5说明在用NO DATA帧替代某些AMR帧的情况下在源处的实例 RTP分组。

图6在目的地比较了无替代的AMR帧和替代的AMR帧的RTP分 组。

详细描述

在此所述的技术适用于任何使用AMR净荷格式的基于会话业务IP 的应用或者任何绑AMR帧的协议。而且,本发明可以在移动终端中 或者在应用服务器被实施,以节省在拥塞时段期间的带宽。本讨论使 用基于蜂窝的即按即说(PoC)来作为示例性实施例,以提供用于描述 本发明的构思的基础。另外,与接收侧相对,对于基于会话业务IP的 应用的传送或发送侧,本发明解决了带宽节省。

本发明提出了通过用NO DATA帧代替RTP分组中好的数据帧来进 一步减少上行链路中的带宽。该方法提供了通过减少丢失的AMR RTP 分组的数量来适度降低音频质量的手段。

本发明使用来自移动电话中的GPRS模的反馈以减少在GPRS拥 塞期间传送的RTP分组的大小。

在PTT谈话突发期间,从移动终端中的音频子系统以固定的速率 生成RTP分组。当该速率超出可以穿过GPRS网络传送分组的速率 时,分组将被缓冲。如果未经检查,则该缓冲器将无限制地增长,最 终导致丢失分组。缓冲数据还具有延迟传送的效果。由于时间戳被置 于RTP分组中,因此任何不可忽视的延迟都可能引起分组在接收侧被 丢弃,以防止谈话突发的拉长。本发明通过用NO DATA帧代替一部分 好的AMR帧来减小所缓冲的分组的大小。该技术将在系统已经将AMR 编码速率退回至最小值4.75kb速率之后被使用。该技术压缩所缓冲的分 组,并且通过丢弃一些数据而不是整个分组来保持语音数据的完整 性。

图1是说明在标准PoC操作中所使用的典型的上行链路侧数据流的 图。如上所述,本发明可以在移动终端中或者在PoC服务器中被实行。 因此,图1中的参考数字100可以表示移动终端或者PoC服务器。本描述 的剩余部分将采用术语PoC服务器100来简化描述。

语音数据开始作为话筒110的模拟输入。数字信号处理器(DSP) 120以每20毫秒一帧的速率将模拟语音数据转换成数字化的AMR帧。然 后AMR帧被路由至即按即说(PTT)客户端130。PTT客户端130将从1 个至20个的任何地方的AMR帧捆绑成单个RTP AMR净荷分组。然后包 含AMR帧净荷的RTP分组被路由至IP栈150。这时,随着带宽变得可 用,GPRS/EGPRS栈从IP栈150取出IP分组。如果带宽是可用的,则IP 分组将经由天线170穿过GPRS/EGPRS网络160被传送。如果带宽不是 可用的,则IP分组被缓冲在GPRS网络模块160中。如果缓冲器增长过 大,则将丢失分组。

图2是说明用于实施本发明的构思的逻辑流程的流程图。AMR格式 化的RTP分组包含从1个至20个的AMR帧。移动终端在205收集来自音 频CODEC的AMR帧。在正常情况下,AMR帧将基于会话协商参数被 封装到RTP分组中并被发送。在本发明中,封装算法将确定任何帧是 否将被用NO DATA帧替代。第一步是在210检查是否已经达到GPRS缓 冲阈值。如果GPRS缓冲器仍然具有空间,则AMR帧在215被放入RTP 分组中。在220检查RTP分组以查看它是否为满。如果满了,则RTP分 组在225被发送。如果还没有满,则控制移动返回以在205获得另一个 AMR帧。

如果达到或超出GPRS缓冲器阈值,则在230进行检查以查看AMR 编解码器速率是否被设置为其最低可能的速率。如果不是,则在235将 它重设为最低的AMR编解码器速率(4.75kbps),并且在210重新检查 缓冲器阈值。然而,如果GPRS缓冲器为满的并且AMR编解码器速率 与其能够达到的一样低,则在240决定是否抽取当前AMR帧。如果该算 法决定不抽取AMR帧,则象在215一样,AMR帧被放到RTP分组中。 如果当前AMR帧将被抽取,则NO DATA帧在245替代RTP分组中好的 AMR帧,从而导致数据的压缩,这减轻了带宽上的负担。在220检查 RTP分组以查看它是否为满,并且如果为满的,则在225发送RTP分组。 否则,在205获得另一个AMR帧,并且重复该过程。

该算法监视GPRS(网络)模块,以确定IP分组是否正在以它们被 生成的速率穿过RF链路被传送。所述GPRS模块包括在传送之前存储 数据的缓冲器。该缓冲器设计将提供在缓冲器开始充满时通知PTT模 块的机制。在正常情况下缓冲器不应该充满,但是在拥塞情况下缓冲 器将充满。该PTT模块将使用所述通知来控制其如何将AMR帧封装在 RTP分组中。来自GPRS模块的通知机制将提供缓冲器状态给PTT模 块,以使PTT模块可以基于网络拥塞来增加或减少分组替代。在正常 情况下将不会发生帧替代。在最坏的情况下,整个分组将用NO DATA 帧来充满。

由于NO DATA帧不包含AMR数据,因此每个帧替代将在帧大小上 提供最低12比1的减小。封装算法将尽力分散NO DATA帧对好的AMR 帧的替代,以避免NO DATA帧群,以便减小对语音的影响。

图3是进一步说明本发明的抽取处理的一种实施方式的流程图。对 所述算法的提高将识别用于替代的具有最小音频能量的帧,以进一步 减小对语音的影响。在抽取确定过程中,将在310确定AMR帧能量 平。如果它在320在阈值水平以下,则它是用于利用NO DATA帧替代 的好的候选者。如果在320能量水平大于阈值,则在330替代AMR帧的 第二决定可以基于其他因素被做出。思想是首先抽取所有低能量的 AMR帧。

图4说明在没有AMR帧替代的情况下在源处的实例RTP分组。该实 例示出每个包含十(10)个AMR帧的三个RTP分组以及用于总数为三 十(30)个数据帧的分组报头。

图5说明在由于当前网络拥塞状况而除去某些AMR帧的情况下在 源处的实例RTP分组。与图4相比,每个RTP分组包含七个AMR帧而不 是十个。另外,丢失的或被替代的AMR帧已经被遍布在该分布上,以 试图避免丢失帧的群。

图6在目的地比较了无替代的AMR帧和替代的AMR帧的RTP分 组。左边的列表示在源处没有执行帧替代的情况下所接收的AMR帧的 RTP分组。在该实例中,源RTP分组是图4中所示的那些分组。然而, 网络是拥塞的并且IP栈是过缓冲的,从而导致在目的地丢失一个RTP 分组。这被显示为NO DATA帧,而AMR帧11-20本应该在那里。整个 RTP分组的丢失对于音频质量具有引人注意的且大大不期望的影响。

图6的右列表示在源处执行帧替代的情况下所接收的AMR帧的 RTP分组。在该实例中,源RTP分组是图5中所示的那些分组。由于网 络是拥塞的,因此该源利用NO DATA帧来替代几个AMR帧。该替代以 相对平均的分布遍布在RTP分组上。因此,虽然实际上丢失了相同数 量的AMR分组,但是没有丢失整个RTP分组。每个RTP分组稍微受到 几个帧丢失的影响,但是总的音频质量没有急剧地或突然地降低,并 且会话可以相对正常地继续。

应该注意,以各种计算机程序指令形式的计算机程序代码可以被 用于实施在实现本发明的实施例时所涉及的至少部分过程。这种计算 机程序代码可以经由包含所有或部分存储在介质上的计算机程序指令 的计算机程序产品而被提供。所述介质可以是固定的或可移动的。这 种介质可以是固定的存储介质,但是它也可以仅仅容易地是可移动的 光盘或磁盘或者磁带。计算机程序指令可以驻留在任何介质上,所述 介质能够包含、存储、传送、传播或传输计算机程序代码,以供任何 类型的计算平台、指令执行系统或者经由总线或网络互连的这种系统 的集合来执行。例如,这种计算机可读介质可以是但不限于电子的、 磁的、光的、电磁的、红外线的或半导体的系统或设备。

实施本发明的全部或部分的计算机程序指令也可以以在诸如因特 网之类的网络上进行检索的信息流来实现。注意,当代码可以经由例 如光学扫描被电子捕获、然后被编辑和解释或者以合适的方式被另外 处理时,计算机可用或计算机可读的介质甚至可以是纸张或者是在其 上打印计算机程序代码的另一种合适的介质。

在此公开了本发明的特定实施例。本领域普通技术人员将容易认 识到,本发明在其他环境中可以具有其他的应用。事实上,许多实施 例和实施方式都是可能的。后面的权利要求书决不打算将本发明的范 围限制于上述的特定实施例。另外,“用于...的装置”的任何陈述打 算引出元件和权利要求的装置加功能的解释,然而未明确使用陈述“用 于...的装置”的任何元件并不打算被当作装置加功能的元件,即使该 权利要求另外包括了词“装置”。

QQ群二维码
意见反馈