允许使用RFID标签修改出现在交互式视频中的项目的音频特性的技术专利检索-修改国际申请第I章专利合作条约专利权专利检索查询-专利查询网

允许使用RFID标签 修改出现在交互式视频中的项目的音频特性的技术

阅读：151发布：2020-12-01

专利汇可以提供允许使用RFID标签修改出现在交互式视频中的项目的音频特性的技术专利检索，专利查询，专利分析的服务。并且本解决方案可以包括一种用于允许在对包含嵌入数据的视频中的项目进行选择性音频修改的方法。在此方法中，RFID标签可以加载特定于声音产生元素的音频特性。RFID标签继而可以附加到对应于声音产生元素的项目。可以记录包括该项目的区域的视频和音频。可以通过扫描RFID标签自动地获得音频特性。音频特性继而可以嵌入至视频，以便当项目出现在视频中时音频特性是可用的。，下面是允许使用RFID标签修改出现在交互式视频中的项目的音频特性的技术专利的具体信息内容。

权利要求

1.一种用于允许对包含嵌入数据的视频中的项目进行选择性音频修改的方法，包括：
识别特定于将出现在视频中的声音产生元素的特性；
加载具有所述识别的特性的RFID标签，其中所述RFID标签附加到对应于所述声音产生元素的物理项目；
记录一个区域的视频和音频，所述区域包括所述物理项目；
扫描所述RFID标签来相对于所述区域中位置自动地追踪声音产生元素；以及
将与所述声音产生元素相关联的可配置音频嵌入至视频，其中终端用户能够通过配置与对应声音产生元素特定关联的嵌入音频，来调节每个声音产生元素的音频特性，而不以相应方式调节该视频的其它音频元素。
2.根据权利要求1所述的方法，其中所述一个或者多个音频特性包括音高、音调、音质和音量中的至少一个。
3.根据权利要求1或2所述的方法，进一步包括：
在设备的显示中视觉上呈现接口；以及
显示一个或者多个选项以响应于经由与所述设备相关联的输入机构提供的输入而修改出现在所述显示中的声音产生元素的一个或者多个音频特性。
4.根据权利要求3所述的方法，其中所述一个或者多个选项包括替换所述声音产生元素的音频输出和为所述声音产生元素调节音频特性强度级别中的至少一个。
5.根据权利要求3或4所述的方法，其中所述设备是电视机，其中所述输入机构是遥控器。
6.根据权利要求3或4所述的方法，其中所述设备是计算机，并且其中所述输入机构是鼠标、触摸板、键盘、追踪球、指示棍和触摸屏中的至少一个。
7.根据权利要求3、4或5所述的方法，其中所述视频包括多个角色，其中至少一个所述角色是声音产生元素，其中所述终端用户能够选择所述角色，并且调节所选角色的声音特性，所述声音特性包括所述角色的音量，其中改变所述角色的音量不改变出现在所述视频中的其它未选角色和其它声音产生元素的音量。
8.根据任何前述权利要求所述的方法，进一步包括：
通过确定所述区域中RFID标签的定位，自动地确定所述区域中物理项目的定位；以及
查明对应于所确定的所述物理项目的定位的所述视频的观看区中的定位，其中所述查明的定位被嵌入在具有所述一个或者多个音频特性的视频中。
9.根据权利要求8所述的方法，其中所述记录、扫描、确定、查明和嵌入步骤在所述视频持续期间自动地发生。
10.根据权利要求8或9所述的方法，其中与RFID标签相关联的多个项目在所述持续期间连续地进入和退出所述区域，其中任何前述权利要求的步骤适用于所述多个项目中的每一个，以及其中所述记录、扫描、确定、查明和嵌入步骤自动地发生。
11.根据权利要求8、9、10或11所述的方法，其中所述记录、扫描、确定、查明和嵌入步骤以实时和接近实时中的至少一种方式发生。
12.根据任何前述权利要求的方法，其中所述任何前述权利要求的步骤是根据至少一个如下计算机程序由至少一个机器自动执行的，所述计算机程序具有多个可由所述至少一个机器执行的代码段，所述至少一个计算机程序存储在机器可读介质中。
13.根据权利要求1到11中任一权利要求所述的方法，其中权利要求1到11中任一权利要求中的所述步骤由服务代理和所述服务代理操作的计算设备中的至少一个来执行，所述步骤是响应于服务请求而执行的。
14.一种用于将音频数据嵌入至提供了独立可配置音频元素的视频的系统，包括：
视频捕获系统，其配置成用于捕获一个区域并且将所述区域变成视频的观看区；
音频捕获系统，其配置成用于捕获所述区域中的声音，其中所述区域中的每个声音产生元素相互独立地进行捕获，以及其中所述区域包含对应于每个声音产生元素的物理项目；
接近该区域放置的RFID扫描系统，所述RFID扫描系统配置成用于扫描位于所述区域中的RFID标签，其中所述RFID标签与对应于出现在观看区中的每个声音产生元素的每个物理项目相关联；以及
合并服务器，其配置成用于自动地将一个或者多个音频特性与所捕获的音频和视频进行同步，以便所述一个或者多个音频特性与其中所关联元素出现在所述观看区中的视频时段相关联，其中向多个交互式视频观看设备输送所述视频和所同步的音频特性，所述交互式视频观看设备准许用户使用来自与所述视频观看设备相关联的输入机构的用户提供的输入，来选择性地修改所述视频中每个声音产生元素的音频特性。
15.根据权利要求14所述的系统，其中所述区域中物理项目的位置基于从所述RFID扫描系统获得的信息自动地确定，其中所述合并服务器基于所确定的项目在所述区域中的位置，来自动并动态地查明所述项目在所述观看区中的位置，以及其中所查明的在所述观看区中的位置被包括作为向所述交互式视频观看设备输送的同步音频和视频信息的一部分。
16.一种视频播放系统，包括：
显示器，配置成用于视觉上呈现视频，所述视频包括多个不同声音产生元素；
音频变换器，配置成用于听觉上呈现所述视频的声音；以及
输入机构，配置成用于准许用户选择所述视频的声音产生元素，所述输入机构还包括如下音频调节机构，所述音频调节机构配置成用于准许用户调节特定于所述声音产生元素的声音特性，而不调节所述视频的任何其它声音特性。
17.根据权利要求16所述的视频播放系统，其中所述可调节声音特性包括音高、音调、音质和音量中的至少一个。
18.根据权利要求16或17所述的视频播放系统，其中在所呈现视频的制作期间，每个声音产生元素都用RFID标签和声音捕获设备进行标记，其用于生成具有多个标记的音频组件的数字视频流，每个标记的音频组件包括用所述RFID标签标记的视频对象。
19.根据权利要求16、17或18所述的视频设备，其中所述视频包括多个角色，其中每个所述角色都是声音产生元素，其中所述输入机构配置成用于选择一个出现在所呈现视频中的角色，以及其中所述音频调节机构配置成用于准许用户调节所选角色的声音特性，所述声音特性包括所述角色的音量，其中改变所述角色的音量不改变出现在所述呈现视频中的其他未选角色的音量。
20.根据权利要求16、17、18或19所述的视频设备，其中所述视频包括多个声音产生音乐对象，其中每个所述声音产生音乐对象是声音产生元素，其中所述输入机构配置成用于选择出现在所呈现视频中的音乐对象中的一个，以及其中所述音频调节机构配置成用于准许用户调节所选音乐对象的声音特性，其中所述音乐对象的至少一个购买选项也呈现在所述显示器中，用户能够利用所述输入机构选择所述选项。
21.一种计算机程序，其包括当所述程序在计算机上执行时，适于执行权利要求1到11中任一权利要求所述方法的程序代码装置。
22.一种用于允许对包含嵌入数据的视频中的项目进行选择性音频修改的方法，包括：
识别特定于将出现在视频中的声音产生元素的特性；
将RFID标签附加到对应于所述声音产生元素的物理项目；
记录一个区域的视频和音频，所述区域包括所述物理项目；
扫描所述RFID标签以相对于所述区域中的位置自动地追踪所述声音产生元素；以及
将与所述声音产生元素相关联的可配置音频嵌入至所述视频，其中终端用户能够通过配置与对应声音产生元素特定相关联的嵌入音频，来调节每个声音产生元素的音频特性，而不以相应方式调节所述视频的其它音频元素。

说明书全文

技术领域

本发明涉及视频制作领域，尤其涉及允许通过使用射频识别(RFID)标签来修改出现在交互式视频中的项目的音频特性。

背景技术

视频媒体除了视觉线索之外，还包括音频信息的呈现。语音、音乐和各种声音效果增强了观看视频记录的用户体验。视频的音频部分的质量经常依赖于各种因素，诸如记录环境和后期制作处理。例如，在如下具有高级别周围噪音的环境中记录访谈，诸如在热闹的街角，可能降低所记录语音的清晰度。
当收听视频记录的音频时，消费者通常仅能够控制音频部分的总音量。就是说，提高在街角的访谈的音量来试图更好地听该语音，同样也提高了所记录的周围噪音的音量级别。因此，留给消费者的是同样不清楚的音频情况，仅是更大声了。
各种音频信道(其组成视频的音轨)的独立控制目前是为执行诸如数字重灌制(re-mastering)的制作任务的人员而保留的。执行这种修改所需要的设备不以用户友好格式定位于一般消费者。

发明内容

本发明公开了如下解决方案，其用于允许为出现在数据嵌入视频的观看区中的声音产生元素修改音频特性。例如，允许用户调节音乐会视频中钢琴的音量，而不更改任何其它乐器或者声音产生元素(诸如，歌手)的音量级别。这可以通过使用射频识别(RFID)标签将特定音频信道与特定声音产生元素的音频输出相关联，以将可配置音频特性嵌入至视频来达到。
用户可以使用一般与视频观看设备相关联的输入机构来做出这种修改。例如，当在电视上观看视频时，遥控器可以用于调节音频特性。当在计算机上观看视频时，声音产生元素可以通过用屏幕上指针指向它们来进行选择，从而可以使得将可配置选项呈现给用户。
根据第一方面，提供了一种用于允许对包含嵌入数据的视频中的项目进行选择性音频修改的方法，包括：识别特定于将出现在视频中的声音产生元素的特性；加载具有该识别特性的RFID标签，其中RFID标签附加到对应于该声音产生元素的物理项目；记录一个区域的视频和音频，所述区域包括所述物理项目；扫描RFID标签来相对于区域中位置自动地追踪声音产生元素；以及将与声音产生元素相关联的可配置音频嵌入至视频，其中终端用户能够通过配置与相应声音产生元素特定关联的嵌入音频，来调节每个声音产生元素的音频特性，而不以相应方式调节该视频的其它音频元素。
识别和加载可以通过计算机程序来完成。
根据第二方面，提供了一种用于将音频数据嵌入至提供了独立可配置音频元素的视频的系统，包括：视频捕获系统，其配置成用于捕获区域并且将该区域变成视频观看区；音频捕获系统，其配置成用于捕获区域中的声音，其中区域中的每个声音产生元素相互独立地进行捕获，以及其中该区域包含对应于每个声音产生元素的物理项目；接近该区域放置的RFID扫描系统，所述RFID扫描系统配置成用于扫描位于该区域中的RFID标签，其中RFID标签与对应于出现在观看区中的每个声音产生元素的每个物理项目相关联；以及合并服务器，其配置成用于自动地将一个或者多个音频特性与捕获的音频和视频同步，以便一个或者多个音频特性与其中关联元素出现在观看区中的视频时段相关联，其中将视频和同步的音频特性输送到多个交互式视频观看设备，该交互式视频观看设备准许用户使用来自与视频观看设备相关联的输入机构的用户提供的输入，来选择性地修改视频中每个声音产生元素的音频特性。
根据第三方面，提供了一种视频播放系统，包括：显示器，其配置成用于视觉上呈现视频，该视频包括多个不同声音产生元素；音频变换器，其配置成用于听觉上呈现该视频的声音；以及输入机构，其配置成用于准许用户选择视频的声音产生元素，所述输入机构还包括音频调节机构，其配置成用于准许用户调节特定于声音产生元素的声音特性，而不调节该视频的任何其它声音特性。
根据第四方面，提供了一种用于允许对包含嵌入数据的视频中的项目进行选择性音频修改的方法，包括：识别特定于在视频中出现的声音产生元素的特性；将RFID标签附加到对应于声音产生元素的物理项目；记录区域的视频和音频，所述区域包括所述物理项目；扫描RFID标签来相对于区域中位置自动地追踪声音产生元素；以及将与声音产生元素相关联的可配置音频嵌入至视频，其中终端用户能够通过配置与相应声音产生元素特定关联的嵌入音频，来调节每个声音产生元素的音频特性，而不以相应方式调节该视频的其它音频元素。
本发明可以根据与这里所呈现素材一致的多个方面来实现。例如，本发明可以包括用于允许选择性修改出现在视频中的项目的音频特性的方法。在此方法中，RFID标签继而可以优选地附加到对应于声音产生元素的项目。优选地，可以记录包括该项目的区域的视频和音频。例如，声音产生元素的音频特性可以使用单独麦克风进行记录，并且基于RFID标签的定位在视频中进行追踪。音频特性继而优选地可以嵌入到视频中，以便当项目出现在该视频中时，音频特性是可用的。
本发明的另一方面可以包括一种用于将音频数据嵌入至提供了独立可配置音频元素的视频的系统。这种系统优选地可以包括视频捕获系统、音频捕获系统、RFID扫描系统和合并服务器。视频捕获系统优选地可以配置成用于记录指定区域的视频。音频捕获系统优选地可以配置成用于捕获指定区域中的声音。声音优选地可以相互独立地进行捕获，并且可以由指定区域中的项目来呈现。RFID扫描系统优选地可以接近指定区域放置，并且配置成用于扫描区域中的RFID标签。合并服务器优选地可以配置成用于自动地将与标记的声音产生元素相关联的音频特性与捕获的音频和视频同步，从而制作具有嵌入可修改音频特性的视频。
本发明的另一方面可以包括一种视频播放系统。该系统优选地包括显示器、音频变换器和输入机构。显示器优选地可以视觉上呈现视频，该视频包括不同的声音产生元素。音频变换器优选地可以听觉上呈现视频的声音。输入机构优选地可以准许用户选择视频的声音产生元素。输入机构优选地包括如下音频调节装置，其准许用户调节特定于声音产生元素的声音特性，而不调节视频的任何其它声音特性。
应当注意，本发明的各种方面可以实现为用于控制计算设备来实现这里所述功能的程序，或者实现为用于支持计算设备执行对应于这里所公开步骤的过程的程序。本程序可以通过将程序存储至磁盘、光盘、半导体存储器和任何其它记录介质来提供，或者还可以作为经由载波输送的数字编码信号来提供。所述程序可以是单一程序或者可以作为多个子程序来实现，每个子程序在单一计算设备中交互，或者以跨越网络空间的分布形式交互。
这里详述的方法还可以是至少部分由服务代理和/或由服务代理响应服务请求操作的机器执行的方法。
附图说明
现将仅通过示例的方式描述本发明的优先实施方式，并且参考如下附图：
图1是示出了根据这里公开的发明性布置的实施方式的如下系统的示意图，其将与RFID标签相关联的声音元素所产生的音频特性嵌入至视频；
图2是示出了根据这里公开的发明性布置的实施方式的如下系统的示意图，其将与RFID标签相关联的声音元素产生的音频特性捕获至视频；
图3是根据这里公开的发明性布置的实施方式的如下Web页的示图，其用于用户与嵌入可修改音频特性的视频进行交互；
图4是根据这里公开的发明性布置的实施方式的如下视频监视器接口的示图，其用于用户与嵌入可修改音频特性的视频进行交互；
图5是根据这里公开的发明性布置的实施方式的如下方法的流程图，其捕获与声音产生元素相关联的可修改音频特性并且将其嵌入至视频；以及
图6是根据这里公开的发明性布置的实施方式的如下方法的流程图，其中服务代理可以配置视频系统用于制作嵌入可修改音频特性的视频。

具体实施方式

图1是示出了根据这里公开的发明性布置的实施方式的如下系统100的示意图，其将与RFID标签相关联的声音元素所产生的音频特性嵌入至视频。系统100可以包括如下客户端110，其配置成用于向用户105呈现观看应用112中的数据嵌入视频113。客户端110可以代表各种设备包括但不限于：个人计算机、电视机、媒体播放器或者或者能够呈现视频(诸如，数据嵌入视频113)的任何其它媒体观看设备或设备组。
数据嵌入视频113可以通过网络120从合并服务器125向客户端110传输。在另一预期的实施方式中，中介服务器或者中介设备(未示出)可以存在于合并服务器125与网络120之间，以便存储用于传输的数据嵌入视频113。例如，视频点播数据储存器可以存储来自合并服务器125的、用于在电视机(客户端110)上显示的视频。在另一示例中，连接到客户端110的个人视频记录器可以存储从服务器125获得的、用于在方便的时候为用户105回放的视频。
无论视频是通过网络120被流式传送给客户端110，还是在记录设备中被高速缓存，继而呈现给客户端110，用户105都可以与数据嵌入视频113中的元素交互。可以凭借与客户端110相关联的输入机构115进行交互。例如，当客户端是电视机时，输入机构115可以是遥控器或者电视机本身上的输入板。当客户端110是计算机时，输入机构115可以是鼠标、键盘或者其它这种外围设备。
视频观看应用112可以被构造为使得其能够在客户端110上运行并且从输入机构115接受输入。应用112可以以软件、硬件或者固件来实现。该应用还可以从客户端110内部执行，或者在连接到客户端110的外部设备或者模块中执行。例如，视频观看应用112可以是软件应用或者浏览器插件，其中视频113在计算设备(客户端110)上进行显示。在另一示例中，应用112可以包括在通过接口与电视机(客户端110)连接的机顶盒的固件中。而且，观看应用112可以包括本地执行指令、远程执行指令以及其组合。在一个实施方式中，视频观看应用112可以使用户105能够针对用户所选元素来执行数字信号处理操作。例如，用户105可以选择与乐器特定音频相关联的乐器，并且可以使用作为应用112的一部分所包括的编辑选项来更改乐器的声音特性。
合并服务器125可以是包括用于创建数据嵌入视频113的计算机软件和算法的计算服务器。合并服务器125的软件和算法可以将从RFID服务器130和音频捕获系统140接收到的信息嵌入至从视频捕获系统135接收到的视频，从而得到数据嵌入视频113。合并服务器125可以实时地从视频捕获系统135、音频捕获系统140和RFID服务器130接收数据，或者可以向合并服务器125提供预先记录的数据以进行经延迟的合并。在另一实施方式中，合并服务器125可以包括数据储存器(未示出)来存储接收到的数据以便稍后合并。
合并服务器125可以利用各种音频和视频处理技术中任何一种技术，来将RFID 传感器130信息、系统140的音频和系统135的视频进行同步。为此同步所利用的确切技术不是系统100解决方案的中心，并且不在这方面限制解释系统100。
视频捕获系统135可以包括多个用于视频制作的组件，诸如照相机、灯、计算设备及其软件等。视频捕获系统135的组件可以利用各种技术以及混合技术，诸如模拟和数字记录设备。另外，视频捕获系统135创建的原始视频在向合并服务器125发送之前，可以进一步进行处理。例如，电视情景喜剧的原始视频记录在向合并服务器125发送以将数据嵌入该视频记录中之前，可以进行编辑和优化。
音频捕获系统140可以包括多个用于捕获和处理音频信号的组件，诸如麦克风、放大器、混合器等。捕获系统140创建的原始音频在向合并服务器125输送之前，可以进行处理。例如，在被嵌入至相应视频之前，可以从扬声器的音轨排除背景噪音。
网络120可以包括输送载波中编码数据所需的任何硬件/软件/和固件。数据可以包含在模拟或者数字信号中，并且通过数据通道或者语音通道进行输送。网络120可以包括本地组件和用于在计算设备组件之间，以及集成设备组件与外围设备之间通信交换所需的数据路径。网络120还可以包括网络设备，诸如路由器、数据线、集线器和中介服务器，这些一起形成了数据网络，诸如因特网。网络120还可以包括基于电路的通信组件和移动通信组件，诸如电话交换机、调制解调器、蜂窝通信塔等。网络120可以包括有线通信路径和/或无线通信路径。
图2是示出了根据这里公开的发明性布置的实施方式的如下系统200的示意图，其将与RFID标签相关联的声音元素产生的音频特性捕获至视频。系统200可以是对系统100的扩展。然而，系统200不限于此方面，并且可以在任何支持RFID标签使用的系统的上下文中执行，用于捕获音频特性以便将其嵌入视频。
在系统200中，可以设置数据捕获系统230来捕获捕获区域205中的数据。数据捕获系统230可以包括视频捕获系统235和音频捕获系统240。视频捕获系统235可以利用各种组件来产生捕获区域205的视觉记录，从而得到所生成视频237的相应观看区。视频捕获系统235可以通过如下各种装置来做到这一点，包括但不限于，照相机控制软件、手动操作等。视频捕获系统235制作的视频237可以输送到合并服务器245用于数据嵌入。
音频捕获系统240可以利用各种组件来制作捕获区域205的音频记录，该音频记录对应于捕获区域205的视频记录。音频捕获系统240可以通过如下各种装置来做到这一点，包括但不限于：固定麦克风、无线麦克风、定向麦克风等。音频捕获系统240制作的音轨242可以输送到合并服务器245用于数据嵌入。
捕获区域205可以包含一个或者多个声音产生元素210和215。如这里所使用的，声音产生元素定义为一个或者多个指定为产生特定音频流的项目。例如，访谈中的每个谈话者可以指定为一个声音产生元素，以便他们对应的音频流可以独立地进行控制。备选地，所有其它噪音(诸如户外进行访谈情况下的街道噪音)可以集合在一起作为背景噪音。
声音产生元素210和215可以放置在捕获区域205中，以便可以记录下元素的外观和声音。另外，声音产生元素210和215可以包含RFID标签，该RFID标签包含属于特定声音产生元素的音频特性。在此示例中，RFID标签211包含特定于钢琴的音频特性，并且附加到该钢琴；RFID标签216包含特定于歌手的音频特性，并且附加到该歌手。应当理解，RFID标签211和RFID标签216可以以各种独立于总系统200的功能性的方法附加到声音产生元素210和声音产生元素215。另外，RFID标签可以与一组声音产生元素相关联，该组声音产生元素诸如是一起产生环绕音频的元素。因此，RFID标签可以代表用于捕获/产生环绕或者组合声音的焦点，其中焦点可以随着RFID在捕获区域205中移动而动态地改变。
RFID传感器220可以分别检测声音产生元素210和215的RFID标签211和216的信号。另外，RFID传感器220可以接收包含在RFID标签211和216中的数据。在此示例中，RFID传感器225从RFID标签211接收数据项213，以及从RFID标签216接收数据项217。数据项213和217可以包括产品信息(诸如项目细节)和音频特性(诸如，音调)。视频捕获区域205中标签的定位可以通过基于来自多个RFID传感器220的输入对RFID标签的位置进行三角测量来自动地确定。
RFID传感器220可以向RFID服务器225传送数据项213和217。RFID服务器225可以将特定时间参考处所有标签的定位与关联信息进行合并。这可以通过创建特定时间参考处的标签定位和与标签相关联的信息的网格映射227来达到。继而可以向合并服务器245传送网格映射227，用于与视频237和音频242同步。
接收到来自视频捕获系统235的视频237、来自音频捕获系统240的音轨242、RFID定位和数据网格映射227之后，合并服务器245可以开始将这些信息嵌入至视频。对于特定时间参考，接收到的网格映射227可以使相应时间参考处的视频237和音频242覆盖在该映射上，从而得到数据嵌入视频250。
图3是根据这里公开的发明性布置的实施方式的如下Web页305的示图，其用于用户与嵌入可修改音频特性的视频交互。Web页305可以是如下装置，用户通过该装置可以与诸如系统200创建的数据嵌入视频250的数据嵌入视频交互。可以由能够与远程内容交互的任何客户端应用和/或接口替换Web页305，仍然认为是在所公开解决方案的范围中。例如，代替Web页305，图3的接口可以实现为富因特网应用或者富客户端应用。
在图3中，用户可以观看包含在Web页305(或者其它交互式接口)内的视频播放器310中的数据嵌入视频311。数据嵌入视频311可以包括数据指示符312，该数据指示符用于提醒用户视频311中的声音产生元素具有可修改的音频特性。在此示例中，数据指示符312是可视的，并且通过元素周围的有色边框来表示。数据指示符312还可以以各种其它方式来实现，包括但不限于，音频提醒、弹出窗口、飞动(fly-over)窗口等。另外，数据指示符312可以包括多种方法的组合，诸如与产品项目周围颜色变化耦合的特殊音频提醒。
用户可以利用选择符313来选择所指示的声音产生元素。此选择符313可以具有视觉表示，诸如示例中给出的箭头。另外，当放在具有可修改音频特性的声音产生元素上时，选择符313可以触发数据指示符312。
对具有嵌入可修改音频特性的声音产生元素的选择可以在Web页305的一部分中显示音频控制315。备选地，显示音频控制315的Web页305部分可以出现在Web页305外部，诸如在弹出或者飞动窗口或者单独的Web页中。
音频控制315可以包括一组选项320，用户通过该选项可以选择要修改的音频特性。对特定选项320的选择可以使得呈现针对音频特性的相关控制机构325。控制装置325的呈现可以以各种方式完成，包括但不限于，利用Web页305中的空间、外部Web页、弹出窗口、飞动窗口等。如此示例中所给出的，选择了音量控制选项，因此音量控制机构325(滑动条)在Web页305中显示给用户。选择器320和控制机构325可以以与整个系统和Web站点的技术兼容的任何方式来实现。
对特定音频特性的修改可以在控制机构325中完成。这种修改产生所选元素的音频中对应的听觉上的改变。例如，用户可以选择将音量控制的滑动条325滑至零(‘0’)来静音钢琴音乐，导致用户仅听到歌唱部分。
应当注意，一个声音产生元素音频特性的修改不影响相同视频场景中另一声音产生元素的音频特性。如上述示例中，钢琴音量的改变没有改变歌唱部分播放的音量。
应当理解，音频特性的修改不限于音量，而是可以包括能够利用数字信号处理操作执行的任何音频特性修改。例如，装有钢弦的吉它可以出现在视频播放器310接口中，并且可以具有可修改的音频特性。特性之一可以替换吉它不同类型的弦，其得到不同的音频特性。例如，可以向用户提供选项以用尼龙弦来替换钢弦。继而可以重放原始音频旋律，只是吉它产生的声音是具有尼龙弦的吉它的模仿声音。此修改音频特性的概念可以延伸到其它音频领域，诸如改变乐器的拍子、音程等。
在另一示例中，音频控制315可以准予复制一个或者多个所选声音产生对象产生的音频的能力，其中复制的音频与原始音频相比，具有与所选声音产生对象相关联的不同时间滞后。例如，观看管弦乐队演出的用户可能感到复制乐器的声音并且将一些时间滞后添加到该声音，可以改进整个音乐部分的整体质量和效果，因此丰富了他的/她的观看体验。
音频修改不限于乐器。例如，所选角色的语音特性可以类似地被修改以模仿不同的音高、说话速率、口音、语言(例如，在一个实施方式中可以从原始语言动态地翻译成用户所选语言)、头部大小、音高、性别等。总体上，这里所述的解决方案准许针对离散的音频源来执行任何类型的用户可指明的数字信号处理，用于改变从上述音频源生成的音频输出。
进一步，当期望对一个音频源进行广泛修改时，可以有意地过度加载与该音频源相关联的音频信息来保证从用户选择得到清晰的音频。例如，在视频片段中做广告的吉它可以被“过度加载”以包括由吉它的不同变化(例如，钢弦对尼龙弦)产生的真实音轨。因此，为吉它选择不同音频属性320可以产生与来自吉它的模仿声音相对的真实声音。另外，针对不同语言可以包括不同角色特定的音轨，其准许观看者为出现在视频中的一个或者多个角色选择不同的语言。利用接口305改变一个角色的语言不一定改变出现在场景中的其他角色所说的语言。
图4是根据这里公开的发明性布置的实施方式的如下视频监视器接口400的示图，其用于用户与嵌入可修改音频特性的视频交互。此接口400可以是如下装置，用户通过该装置可以与数据嵌入视频交互，该数据嵌入视频诸如是系统200创建的数据嵌入视频250。
监视器405可以在如下环境中显示视频410，该环境模拟系统100的观看应用112。备选地，视频410可以以与其它节目相同的方式在监视器405上观看，诸如电视节目、有线节目、卫星节目、点播电影等。
用户可以利用遥控器450选择视频410中具有可修改的音频特性的声音产生元素。这种选择可以触发音频控制窗口415的显示。音频控制窗口415可以向用户呈现针对与所选声音产生元素相关联的可修改音频特性的选项420。此窗口415可以在设置时间内或者直到用户做出另一选择之前保持为可见的。
附加用户可选择控制425可供用户使用以提供通用功能性。音频选项420和用户可选择控制425都可以对应遥控器450上的可用按钮。在此示例中，用户可选择控制425可以允许用户浏览(navigate)视频410的声音产生元素，选择声音产生元素来修改，并且重新应用默认设置。应当理解，为了保证功能性，所列控制需要对应于与监视器405特定相关联的遥控器450上可用的按钮，或者对应于通常在各种遥控器模块上可用的按钮。
图5是根据这里公开的发明性布置的实施方式的如下方法500的流程图，其捕获与声音产生元素相关联的可修改音频特性并且将其嵌入至视频。方法500可以在系统100和/或系统200的上下文中实现。另外，方法500可以利用接口305和/或接口400。
方法500可以在步骤505开始，其中操作者设置用于音频/视频记录和RFID标签感知的区域。此步骤可以包括系统100的视频捕获系统135和音频捕获系统140，以及系统200的RFID传感器220和RFID服务器225的安装和配置。
在步骤510中，操作者可以加载具有音频特性和项目信息的RFID标签，并且可以将标签附加到其相应的项目。继而，视频制作可以在步骤515开始，其中标记的声音产生元素包括在和/或用于捕获区域中。
当记录标记的项目时，一个或者多个RFID传感器可以接收来自标签的加载信息，以及确定每个标签的定位，如步骤517所指示。在步骤520中，可以向合并服务器传送音频、视频和RFID信息。在步骤525中，合并服务器可以将RFID信息与音频和视频进行同步。应当理解，步骤525可以动态地并且关于标记项目的记录实时发生。
在步骤528中，合并服务器可以将同步的RFID信息嵌入至视频。在步骤530中，可以使数据嵌入视频对于用户可用。步骤532可以选择性发生，其中提供指示符用于提醒用户项目具有与其相关联的可修改音频特性。
在步骤535中，用户可以选择视频中的项目，该项目具有与其相关联的可修改音频特性。在步骤540中，可以向用户提供选项用于提醒所选项目的音频呈现。
图6是根据这里公开的发明性布置的实施方式的如下方法600的流程图，其中服务代理可以配置视频系统用于制作嵌入可修改音频特性的视频。方法600可以利用系统100和/或200，以及接口305和/或400。
方法600可以在步骤605中开始，这时消费者启动服务请求。服务请求可以是针对服务代理的用来建立用于将可修改的音频特性嵌入至视频的新系统的请求。服务请求还可以是利用现有系统解决问题的请求，该现有系统用于将可修改的音频特性嵌入至视频。
在步骤610中，可以选择人工代理响应服务请求。在步骤615中，人工代理可以分析消费者的当前系统，并且可以开发解决方案。该解决方案可以得到系统100和/或200，或者任何配置成用于捕获对象上RFID标签中所包含的可修改音频特性来嵌入至上述对象的视频中的系统，诸如执行方法500步骤的系统。
在步骤620中，人工代理可以将消费者的系统配置成用于捕获对象上的RFID标签中所包含的可修改音频特性来嵌入至上述对象的视频中。这可以包括视频捕获系统、音频捕获系统、RFID传感器、RFID服务器和合并服务器的安装。在步骤625中，人工代理可以选择性地使用计算机设备配置一个或者多个RFID标签来包含有关音频特性。
在步骤630中，人工代理可以选择性地为消费者维护如下现有系统，其配置成用于产生具有嵌入可修改音频特性的视频。在步骤635中，人工代理可以完成该服务活动。
本发明可以在硬件、软件或者硬件和软件的结合中实现。本发明可以在一个计算机系统中按照集中式方式来实现，或者可以按照不同的元件分散在多个互连的计算机系统上的分布式方式来实现。适于执行在此描述的方法的任意类型的计算机系统或者其它装置都是适合的。硬件和软件的典型结合可以是具有计算机程序的通用计算机系统，其中，在加载和执行所述计算机程序时，其控制计算机系统，使得计算机系统执行在此描述的方法。
本发明还可以嵌入在计算机程序产品中，所述程序产品包括支持在此描述的方法的实现的所有特征，并且当所述程序产品被加载到计算机系统中时，其能够执行这些方法。本上下文中的计算机程序表示以任何语言、代码或符号表示的指令集合的任何表达式，其意在直接或在完成以下内容的任一内容或两者之后使具有信息处理能力的系统执行特定的功能：a)转换为其他语言、代码或符号；b)以不同的素材形式重现。

标题	发布/更新时间	阅读量
一种修改纸	2020-05-11	122
声学信号修改	2020-05-12	221
修改带式胶带	2020-05-13	151
业务流修改流程	2020-05-13	285
已修改流同步	2020-05-13	727
修改液笔	2020-05-11	122
百叶修改器	2020-05-12	38
修改对话窗口	2020-05-12	618
引导过程修改	2020-05-13	555
错字修改笔	2020-05-12	958

允许使用RFID标签修改出现在交互式视频中的项目的音频特性的技术

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：