首页 / 专利库 / 专利权 / 申请 / 国际申请 / 修改 / 用于分析一个图象中的字幕的方法和设备

用于分析一个图象中的字幕的方法和设备

阅读:257发布:2021-11-30

专利汇可以提供用于分析一个图象中的字幕的方法和设备专利检索,专利查询,专利分析的服务。并且本 发明 提供了用于分析一个图象中的字幕的方法和设备。多媒体节目数据中字幕中的文本被标识以生成一组文本。对该组文本进行分析以形成一个分析。根据该分析标识需要进行 修改 的视频 片段 来形成一个标识的视频片段,并修改这个标识的片段。另外,还可进行 颜色 校正,以提高字幕中文本的清晰度。,下面是用于分析一个图象中的字幕的方法和设备专利的具体信息内容。

1.一种数据处理系统中用于处理多媒体节目数据的方法,该方 法包括:
标识多媒体节目数据中字幕中的文本,以生成一组文本;
对该组文本进行分析以形成一个分析;
基于该分析,标识应该进行修改的多媒体节目数据的部分来形成 一个标识部分;以及
修改该标识部分。
2.权利要求1的方法,其中该标识步骤包括:
针对多媒体节目数据中的字幕执行光学文字标识,以生成一组文 本。
3.权利要求1的方法,其中该多媒体节目数据部分包括视频部 分和音频部分,并且通过使视频部分或音频部分中的至少一个为空来 修改该标识部分。
4.权利要求1的方法,其中该分析步骤包括:
对该组文本执行baysean过滤。
5.权利要求1的方法,进一步包括:
在开始执行步骤前,对该多媒体节目数据进行解码;以及
在修改该标识部分后,对该多媒体节目数据进行重新编码。
6.权利要求1的方法,其中该多媒体节目数据的该部分为一 或一组帧。
7.权利要求1的方法,其中多媒体节目为电影。
8.一种数据处理系统中用来处理多媒体节目的方法,该方法包 括:
对多媒体节目解码,以形成解码的多媒体节目数据;
分析该多媒体节目数据的一部分;
确定该部分多媒体节目数据中字幕的清晰度是否需要提高;以及
响应该部分多媒体节目数据中字幕的清晰度需要提高的情况,针 对该多媒体节目数据中包含清晰度需要提高的字幕的一部分执行颜色 校正,以提高该字幕的清晰度。
9.一种用于处理多媒体节目数据的数据处理系统,该数据处理 系统包括:
标识装置,用于标识多媒体节目数据中字幕中的文本,以生成一 组文本;
分析装置,用于对该组文本进行分析以形成一个分析;
标识装置,用于根据该分析,标识应进行修改的多媒体节目数据 的一部分以形成一个标识部分;以及
修改装置,用于修改该标识部分。
10.权利要求9的数据处理系统,其中该多媒体节目数据部分包 括视频部分和音频部分,并且通过使视频部分或音频部分中的至少一 个为空来修改该标识部分。
11.权利要求9的数据处理系统,其中该分析装置包括:
执行装置,用于对该组文本进行baysean过滤。
12.权利要求9的数据处理系统进一步包括:
解码装置,用于在开始执行步骤前,对多媒体节目数据进行解码; 以及
重新编码装置,用于在修改该标识部分后,对该多媒体节目数据 进行重新编码。
13.权利要求9的数据处理系统,其中该部分多媒体节目数据为 一帧或一组帧。
14.一种用于处理多媒体节目的数据处理系统,该数据处理系统 包括:
解码装置,用于对多媒体节目解码,以形成解码的多媒体节目数 据;
分析装置,用于分析该多媒体节目数据的一部分;
测定装置,用于确定该部分多媒体节目数据中字幕的清晰度是否 需要提高;并且
执行装置,用于响应该部分多媒体节目数据中字幕的清晰度需要 提高的情况,针对该多媒体节目数据中包含清晰度需要提高的字幕的 部分执行颜色校正,以提高该字幕的清晰度。
15.一种用于处理多媒体节目数据的、计算机可读介质中的计算 机程序产品,其中计算机程序产品包括:
第一指令,用于标识多媒体节目数据中的文本,以生成一组文本;
第二指令,用于分析该组文本以形成一个分析;
第三指令,用于基于该分析,标识应进行修改的多媒体节目数据 的一部分以形成一个标识部分;并且
第四指令,用于修改该标识部分。
16.权利要求15的计算机程序产品,其中该多媒体节目数据部 分包括视频部分和音频部分,并且通过使视频部分或音频部分中的至 少一个为空来修改该标识部分。
17.权利要求15的计算机程序产品,其中第二指令包括:
用于对该组文本执行baysean过滤的子指令。
18.权利要求15的计算机程序产品,进一步包括:
用于在开始执行步骤前,解码该多媒体节目数据的第五指令;以 及
用于在修改该标识部分后,重新解码该多媒体节目数据的第六指 令。
19.权利要求15的计算机程序产品,其中该部分多媒体节目数 据为一帧或一组帧。
20.用于处理多媒体节目数据的、计算机可读介质中的计算机程 序产品,该计算机程序产品包括:
用于解码多媒体节目以形成解码的多媒体节目数据的第一指令;
用于分析该多媒体节目数据的一部分的第二指令;
用于确定该部分多媒体节目数据中字幕的清晰度是否需要提高 的第三指令;以及
响应该部分多媒体节目数据中字幕的清晰度需要提高,针对该多 媒体节目数据中包含清晰度需要提高的字幕的部分执行颜色校正,来 提高该字幕的清晰度的第四指令。
21.一种数据处理系统,包括:
一个总线系统;
一个与该总线系统连接的通信单元;
一个与该总线系统连接的存储器,其中该存储器包括一组指令;
一个与该总线系统连接的处理单元,其中该处理单元执行该组指 令以标识多媒体节目数据中字幕中的文本,以生成一组文本;对该组 文本进行分析以形成一个分析;根据该分析,标识应进行修改的多媒 体节目数据的一部分以形成一个标识部分;以及修改该标识部分。
22.一种数据处理系统,包括:
一个总线系统;
一个与该总线系统连接的通信单元;
一个与该总线系统连接的存储器,其中该存储器包括一组指令; 以及
一个与该总线系统连接的处理单元,其中该处理单元执行该组指 令以解码多媒体节目来形成解码的多媒体节目数据;分析该多媒体节 目数据的一部分;确定该部分多媒体节目数据中字幕的清晰度是否需 要提高;并且响应该部分多媒体节目数据中字幕清晰度需要提高的情 况,针对该多媒体节目数据中包含清晰度需要提高的字幕的部分执行 颜色校正,以提高字幕的清晰度。

说明书全文

技术领域

发明涉及经改进的数据处理系统,并特别涉及用于处理数据的 方法和设备。具体而言,本发明涉及用于处理视频数据的方法、设备 和计算机指令。

背景技术

个人录像机(PVR)正越来越受到消费者的青睐。该设备也被称 为数字录像机(DVR),允许用户在录制新的节目的同时,回放已经 录制的节目。在有些情况下,用户可以一边在一个频道进行收看实况 转播,一边从另一个频道录制节目。并且,用户也能在收看实况转播 的同时暂停或重放录制的节目。在通常情况下,PVR通过与有线或卫 星接收系统相连,来接收数字视频和音频内容。与盒式磁带录像机相 同,PVR也允许节目的时移,但它还拥有其他一些特点,如录制一个 节目的所有剧集。该系统包括一个用来存储节目的硬盘驱动器
PVR同时还提供了多种特性,如通过网络与其他PVR共享录制 的节目,存储数码照片,存储MP3文件。但PVR缺乏滤除不良内容 的功能。某些情况下,用户希望观看节目,同时希望滤除节目中的不 良内容,目前的PVR尚未提供该项特性。
因此,提供用于管理PVR上的节目的改良方法、设备和计算机 指令是非常有利的。

发明内容

本发明提供用于处理视频数据的方法、设备和计算机指令。多媒 体节目数据中字幕的文本被标识来生成一组文本。对该组文本进行分 析以创建一个分析。根据该分析需要进行修改的视频片段被标识来形 成一个标识的视频片段,并且这个标识的视频片段被改变。另外,还 可进行颜色校正,以提高字幕文本的清晰度。
附图说明
在附录中列出了本发明突出的创新性特点。然而,当结合附图进 行阅读时,通过参照图示实施例的详细说明能够最好地理解本发明本 身,以及最佳实施方式、目标和优势,其中:
图1是在其中可以实施本发明的数据处理系统的示意图;
图2是根据本发明的一个优选实施例的用于过滤多媒体节目的程 序流程图
图3是根据本发明的一个优选实施例的用于执行字幕颜色校正的 程序流程图。

具体实施方式

下面参照附图(特别参照附图1)对可在其中实现本发明的数据 处理系统进行描述。数据处理系统100以个人录像机(PVR)为例, 它也可被称作数字录像机(DVR)。根据图示,数据处理系统100中 的元件通过总线系统102互联。
数据处理系统100包括处理单元104、存储器106、音频单元108、 视频单元110、通信单元112、存储设备114和字幕和视频分析单元 116。存储器106包含由处理单元104执行的用来提供各种PVR功能 的指令。这些功能包括:例如,节目的录制、节目播放分析要处理的 图像、以及管理可存储在数据处理系统100中的节目等。
音频单元108包括用于从输入端口接收音频信号,并输出音频的 元件。这些元件包括:例如,一个音频模数转换器(ADC)和一个音 频数模转换器(DAC)等。视频单元110用于接收视频信号,并在数 据处理系统100中输出视频。视频单元110包括:一个视听(AV)编 码器/解码器(编码译码器)。视频单元110能够输出视频信号以在显 示器上进行显示,例如与数据处理系统100相连的显示器118上。
根据特定的实施方案,音频单元108和视频单元110中的元件可 作为硬件元件被敷设到处理单元104中。通信单元112提供一个连接, 用于接收多媒体节目。在本实例中,一个多媒体节目包括视频和音频 数据。多媒体节目亦可包含闭路标题数据,如字幕等。这些字幕根据 用户喜好可以显示,也可以不显示。多媒体节目的实例包括:电视节 目、电影和音乐视频。这些多媒体节目可以通过连接通信单元112至 各种程序设计资源(如通过因特网、电缆网或卫星)获得。
存储设备114提供了一个位置用于存储多媒体节目。字幕和视频 分析单元116提供一种用来分析多媒体节目字幕中的文本,并标识这 些程序的特定片段是否应该被静音、成为空白或被完全删除的机构。 通过这种方式,用户就能够观看到不含不良内容的多媒体节目。
字幕和视频分析单元116能够解码用于处理的多媒体节目的视频 部分。在视频流中,字幕信息一般位于一个与视频数据分离的信道中。 如果用户希望观看字幕,字幕信息就在视频适配器或显示单元的缓 存区中被叠加到视频图象上。该字幕亦被称为该视频的一个闭路标题 部分。
字幕中的文本被标识。根据具体方案不同,文本能够通过多种方 式标识。在图例中,针对进行字幕输出的视频图象的闭路标题部分执 行光学文字标识。从该处理中得到的文本将被输入到过滤器中,以标 识多媒体节目中的不良部分。
在这些实例中,过滤操作采用在字幕和视频分析单元16中实现 的baysean过滤器进行。Baysean过滤器目前被用于过滤电子邮件信 息中的垃圾邮件(SPAM)。该类过滤器适用于评定多媒体节目的不 同部分的级别。使用baysean过滤器,可采用baysean推论,即如果 在一个场景中字幕或者多媒体节目的片段中要显示的文本经常出现在 一个PG级电影中,而很少出现在一个G级电影中,则该多媒体节目 片段的文本通常被评定为PG级。如果观看喜好被设定为G级多媒体 节目,那么特定的场景将被修改或审查。该段视频图象将被刷白、静 音、或被同时刷白和静音。
在这些实例中,一个视频图象片段是指在视频图象中显示字幕的 某一部分。当显示新的字幕时,将遇到一个新的多媒体节目片段。
多媒体节目过滤用信息可以由数据处理系统100的用户配置。可 以创建用于不同电影级别(如G,PG,PG-13和R级)的默认文件设 置。这些默认文件可被存储在存储设备114中。另外,供在baysean 过滤器中使用的用户提供文件也被存储在存储设备114中。该用户文 件可有各种来源。例如:一个包含baysean过滤功能的电子邮件公共 程序可被用作一个来源。用于过滤SPAM邮件的文件可被下载到数据 处理系统100中。当然,任何外部信源可被用于该文件。
此外,字幕和视频分析单元116亦可用于对视频图象进行修改, 以提高字幕的清晰度。这些修改包括:颜色校正,以调节屏幕上显示 字幕的部分的颜色或调整字幕文本的显示。例如,如果文本颜色与背 景颜色相近,可使用不同于背景颜色的颜色来描画组成字幕的文字的 轮廓。另外,也可以改变字幕显示区域的背景颜色来提供针对更佳的 字幕清晰度的对比度
在这些实例中,字幕和视频分析单元116能够以多种形式实现。 例如,该视频单元能够实现为一个具有合适的特定用途集成电路 (ASIC)和指令的独立处理单元,以执行本发明图例中的功能。或者, 字幕和视频分析单元116可包含由处理单元104执行的指令,来提供 这些功能。
在这些实例中,数据处理系统100采用PVR形式。该图示并非 表示关于在其中可实现本发明的机构的本发明的体系结构限制。数据 处理系统100亦可采用具有软件的计算机和适当的适配器卡来实现, 以允许使用PVR中的功能对多媒体节目进行接收和处理。
采用这种方式,本发明的机构具备过滤多媒体节目各部分的能 。虽然一个多媒体节目可能整个被定为不良级别,但该节目也可在 滤除其中的不良片段后进行观看。可对其进行静音、画面刷白或同时 进行上述两种操作。
现在来看图2,根据本发明的优选实施例描述用于过滤节目的程 序流程图。图2中所示的程序能够在过滤系统,例如图1中的字幕和 视频分析单元116中实现。
该处理以对多媒体节目进行解码(步骤200)为开始。在这些实 例中,视频流以MPEG2、MPEG3或JPEG等格式被接收。在这些多 媒体文件中,音频和视频信道被分离为不同的信道。
包含字幕的闭路标题部分在不同于音频和视频的另一信道中。如 需要,闭路标题部分能够被叠加到视频上以显示字幕信息。
该数据的解码可通过使用处理单元,例如图1中处理单元104等 元件中的编码/解码处理器进行。根据具体方案不同,编码和解码可实 现为如实例或硬件所述,例如包含编码和解码功能的逻辑。
选择一个经过解码的多媒体节目数据的片段(步骤202)。在这 些示例中,多媒体节目数据中的数据片段被定义为多个帧。视频数据 通常按每个片段30帧来进行显示。
接着,对多媒体节目数据的一个片段进行光学文字标识,以从用 于那个片段数据的闭路标题部分中的字幕中获得文本(步骤204)。 该文本将被输送到baysean和滤除算法(步骤206)。然后可获得评 级(步骤208)。将该片段的评级结果与用户选定的喜好相比较(步 骤210)。该喜好可以是电影评级,例如PG-13或R级。
对照用户选定的喜好(步骤212)来判定该片段是否恰当。例如, 如果用户选定级别PG-13为恰当,并且根据对片段中文本的过滤标识 结果,该片段被评定为R级,则该片段将被判定为不恰当。如果该片 段被判定为不恰当,某些音频或视频的组合将被刷白画面或静音(步 骤214)。虽然只对某个片段进行处理,但实际上步骤214能够对该 片段中的每一个帧进行刷白画面或静音处理。经过修改的多媒体节目 数据被存储(步骤216)。
接着,将判定是否有更多未经处理的片段(步骤218)。如果存 在更多未经处理的片段,处理将返回到步骤202。否则,多媒体节目 数据被重新编码(步骤220),并且在处理结束后保存经过处理的多 媒体节目(步骤222)。
在图2的图例中,对片段进行了处理。当然,根据具体方案的不 同,处理也可以逐帧地进行。另外,如果编码和解码功能以硬件方式 实现,那么其他功能、例如baysean过滤器和帧缓冲器也可位于相同 的硬件单元中。
往下翻到图3,是根据本发明的一个优选实施例的字幕颜色校正 的程序流程图。图3中所示的处理可在过滤系统,例如图1中的字幕 和视频分析单元116中实现。
该处理以对多媒体节目进行解码(步骤300)为开始。在这些实 例中,多媒体节目中的视频部分保持不变。解码信息被存储(步骤 302)。选择多媒体节目中经解码的视频数据的一个片段进行处理(步 骤304)。判定该片段是否需要进行颜色校正,以增强所选定片段中 字幕的清晰度(步骤306)。根据方案的不同,步骤306可确定字幕 中的文本是否需要被屏蔽或变模糊。执行该步骤可以屏蔽坏的或不良 的语言。如需要校正,执行颜色校正(步骤308)。根据方案不同, 所执行的具体的颜色校正类型各异。例如,可改变文本的背景,以增 强文本相对于背景的对比度。
然后,确定在视频数据中是否有更多未经处理的片段(步骤310)。 如果存在更多未经处理的片段,则处理将返回到步骤304。否则,数 据被重新编码(步骤312),且在处理结束后保存经处理的多媒体节 目以备将来的回放(步骤314)。再次参照步骤306,如果不需要执行 颜色校正,则处理将如前所述前进到步骤310。
因此,本发明提供了用于多媒体节目过滤的改良方法、设备和计 算机指令。图例中所列的本发明的机构允许在保持其它部分不变的情 况下,根据用户的个人喜好对多媒体节目的某些部分或片段进行修改。 在示例中,这些修改包括刷白视频图象片段中的画面,消除该片段的 声音,或同时消除该片段的声音或画面。
需要重点提出的是,虽然在上下文中全部以功能性的数据处理系 统对本发明进行了描述,但本领域的普通技术人员应当理解,本发明 的过程能够以计算机可读介质指令的形式和多种形式散布,并且本发 明能够等效地应用而与实际用于执行散布的信号承载介质的特定类型 无关。计算机可读介质的实例包括可记录型介质,例如软盘、硬磁盘 驱动器、RAM、CD-ROM、DVD-ROM和传输型介质,例如使用如 无线电频率和光波传输等传输形式的数字和模拟通信链路、有线或无 线通信链路。计算机可读介质可采用这样的编码格式,即解码后可用 于特定数据处理系统的实际应用。
本发明说明书的提出目的在于给出例图和说明,并非在于详尽介 绍或限于本发明散布时的状态。对于本领域内的一般技术人员而言, 许多改进和变化将是非常明显的。选择本实施例并对其描述,其目的 在于对本发明的原理、实际应用进行最佳说明,并使其他本领域内一 般技术人员能够理解本发明可应用于施以各种改进的不同实施例,就 如适用于所期望的特殊用途。
相关专利内容
标题 发布/更新时间 阅读量
一种修改中性笔 2020-05-12 964
一种修改纸 2020-05-11 229
OCT图像修改 2020-05-11 363
业务流修改流程 2020-05-13 12
一种面型修改油 2020-05-13 128
定向声音修改 2020-05-13 700
修改液笔 2020-05-11 986
修改带 2020-05-11 618
修改设备通知 2020-05-13 408
错字修改笔 2020-05-12 370
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈