图像压缩及展开装置及其方法、图像处理系统专利检索-图形对象电脑图像专利检索查询-专利查询网

图像压缩及展开装置及其方法、图像处理系统

阅读：607发布：2024-02-01

专利汇可以提供图像压缩及展开装置及其方法、图像处理系统专利检索，专利查询，专利分析的服务。并且为了改进图像压缩率并提高展开后的图像质量，一种用于生成通过压缩图像而形成的压缩数据的图像压缩装置被提供有：边界区域检测部分，用于从包括在该图像中的多个区域中检测包括呈现在该图像中的对象的内部和外部部分的边界区域；非边界区域数据生成部分，用于通过以预定压缩模式压缩不是该图像中的边界区域的非边界区域，而生成压缩数据中对应于该非边界区域的局部压缩数据；以及边界区域数据生成部分，用于以压缩前和展开后的图像之间的差异小于以上述预定压缩模式压缩边界区域的情况下的差异的模式从该边界区域生成压缩数据中对应于该边界区域的局部压缩数据。，下面是图像压缩及展开装置及其方法、图像处理系统专利的具体信息内容。

权利要求

1.一种用于生成通过压缩图像而形成的压缩数据的图像压缩装置，该图像压缩装置包括：
边界区域检测部分，用于从包括在该图像中的多个区域中检测包括呈现在该图像中的对象的内部和外部部分的边界区域；
非边界区域数据生成部分，用于通过以预定压缩模式压缩不是该图像中的边界区域的非边界区域，而生成压缩数据中对应于该非边界区域的局部压缩数据；以及
边界区域数据生成部分，用于以压缩前和展开后的图像之间的差异小于以上述预定压缩模式压缩边界区域的情况下的差异的模式从该边界区域生成压缩数据中对应于该边界区域的局部压缩数据。
2.根据权利要求1的图像压缩装置，其中上述非边界区域数据生成部分以预定的第一压缩模式对非边界区域进行压缩；以及
边界区域数据生成部分以图像之间的差异小于以第一压缩模式对边界区域进行压缩的情况下的差异的第二压缩模式对该边界区域进行压缩。
3.根据权利要求2的图像压缩装置，其中非边界区域数据生成部分以通过展开而获得的图像不同于压缩前的图像的有损压缩模式对非边界区域进行压缩；以及
边界区域数据生成部分以通过展开获得压缩前的图像的无损压缩模式对边界区域进行压缩。
4.根据权利要求2的图像压缩装置，其中上述非边界区域数据生成部分以压缩后的局部压缩数据的大小小于以第二压缩模式对非边界区域进行压缩的情况下的大小的第一压缩模式对该非边界区域进行压缩。
5.根据权利要求1的图像压缩装置，其中
上述非边界区域数据生成部分以第一压缩模式对该图像中所有区域进行压缩；以及
上述边界区域数据生成部分以在压缩前和展开后的图像之间的差异小于第一压缩模式中的差异的第二压缩模式对边界区域进行压缩。
6.根据权利要求1的图像压缩装置，其中上述边界区域数据生成部分在不压缩边界区域的情况下生成指示该边界区域为局部压缩数据的数据。
7.根据权利要求1的图像压缩装置，其中边界区域检测部分将包括如下两种像素的区域检测为边界区域，即具有等于或大于预定基准亮度值的亮度的象素和具有小于该基准亮度值的亮度的象素。
8.根据权利要求1的图像压缩装置，其中
上述图像是要以叠加到背景图像上的方式显示的字幕图像，且上述对象是字幕图像的字幕部分；
上述图像压缩装置进一步包括透光度获取部分，用于获取背景图像透过该字幕图像显示的透光度，该透光度是对于每一个象素指定的；以及
如果包括在字幕图像中的多个区域中的每一个区域包括具有大于预定第一基准透光度的透光度的象素和具有等于或小于第一基准透光度的透光度的象素，则上述边界区域检测部分将该区域检测为边界区域。
9.根据权利要求8的图形压缩装置，其中
上述透光度获取部分获取主图像，该主图像中字幕图像的各个象素的透光度被以与字幕图像的象素被排布的相同方式排布为亮度值；以及
上述边界区域数据生成部分进一步以对字幕图像中的边界区域进行压缩的相同压缩模式对主图像中对应于字幕图像中的边界区域的区域进行压缩。
10.根据权利要求8的图像压缩装置，进一步包括：
不呈现区域确定部分，如果包括在字幕图像中的多个区域中的每一个区域中包括的所有象素的透光度大于第二基准透光度，则不呈现区域确定部分对于该区域将该区域确定为不需要呈现的区域，其中背景图像以第二基准透光度比以第一基准透光度透过更多；以及
不呈现区域处理部分，用于通过将指示确定为不需要呈现的区域的区域的图像数据从压缩数据中移除，并添加指示该区域的呈现对于该压缩数据是不需要的信息，而对该图像进行压缩。
11.根据权利要求1的图像压缩装置，进一步包括压缩指示信息生成部分，用于生成指示包括在该图像中的每一个区域的压缩模式的压缩指示信息。
12.根据权利要求11的图像压缩装置，其中压缩指示信息生成部分通过以通过展开获得压缩前的数据的无损压缩模式对指示包括在该图像中的每一个区域的压缩模式的数据进行压缩而生成压缩指示信息。
13.一种用于展开通过压缩图像而形成的压缩数据的图像展开装置，该图像展开装置包括：
边界区域指示信息获取部分，用于对于包括在该图像中的多个区域中的每一个结合该压缩数据获取指示该区域是包括呈现在该图像中的对象的内部和外部部分的边界区域还是仅包括呈现在该图像中的对象的内部和外部部分中的一个的非边界区域的边界区域指示信息；
非边界区域数据恢复部分，用于通过以对应于预定压缩模式的展开模式展开压缩数据中对应于非边界区域的局部压缩数据而恢复该非边界区域；和
边界区域数据恢复部分，用于以在压缩前和展开后的图像之间的差异小于以展开模式展开该局部压缩数据的情况下的差异的模式从压缩数据中对应于边界区域的局部压缩数据中恢复该边界区域。
14.一种用于压缩图像以生成压缩数据并展开该压缩数据以生成图像的图像处理系统，该图像处理系统包括：
图像压缩装置；以及
图像展开装置；
该图像压缩装置包括：
边界区域检测部分，用于从包括在该图像中的多个区域中检测包括呈现在该图像中的对象的内部和外部部分的边界区域；
非边界区域数据生成部分，用于通过以预定压缩模式压缩非边界
区域，而生成压缩数据中对应于该非边界区域的局部压缩数据；以及
边界区域数据生成部分，用于以压缩前和展开后的图像之间的差异小于以上述预定压缩模式压缩边界区域的情况下的差异的模式从该边界区域生成压缩数据中对应于该边界区域的局部压缩数据；
该图像展开装置包括：
边界区域指示信息获取部分，用于对于包括在该图像中的多个区域中的每一个区域，结合该压缩数据获取指示该区域是包括呈现在该图像中的对象的内部和外部部分的边界区域还是仅包括呈现在该图像中的对象的内部和外部部分中的一个的非边界区域的边界区域指示信息；
非边界区域数据恢复部分，用于通过以对应于预定压缩模式的展开模式展开压缩数据中对应于非边界区域的局部压缩数据而恢复该非边界区域；和
边界区域数据恢复部分，用于以在压缩前和展开后的图像之间的差异小于以展开模式展开以预定的压缩模式压缩的该局部压缩数据的情况下的差异的模式从压缩数据中对应于边界区域的局部压缩数据中恢复该边界区域。
15.根据权利要求14的图像处理系统，其中
上述非边界区域数据生成部分通过以压缩前和展开后的图像之间的差异较大的第一压缩模式对该图像中的所有区域进行压缩，而生成第一局部压缩数据；
边界区域数据生成部分通过以压缩前和展开后的图像之间的差异小于第一压缩模式下的差异的第二压缩模式对该边界区域进行压缩而生成第二局部压缩数据，生成其中第二局部压缩数据被附加到第一局部压缩数据的文件，并将数据附加信息记录到该文件中要存储关于图像的属性信息的报头部分，数据附加信息指示第二局部压缩数据被附加；
非边界区域数据恢复部分以对应于第一压缩模式的展开模式展开第一局部压缩数据，而不管是否在图像文件的报头部分中检测到数据附加信息；以及
如果在该图像文件的报头部分中检测到数据附加信息，则边界区域数据恢复部分以对应于第二压缩模式的展开模式展开第二局部压缩数据，并以从第二局部压缩数据展开的图像覆盖从第一压缩数据展开的图像。
16.一种用于生成通过压缩图像而形成的压缩数据的图像压缩方法，该图像压缩方法包括：
边界区域检测步骤，从包括在该图像中的多个区域中检测包括呈现在该图像中的对象的内部和外部部分的边界区域；
非边界区域数据生成步骤，通过以预定压缩模式压缩不是该图像中的边界区域的非边界区域，而生成压缩数据中对应于该非边界区域的局部压缩数据；以及
边界区域数据生成步骤，以压缩前和展开后的图像之间的差异小于以上述预定压缩模式压缩边界区域的情况下的差异的模式从该边界区域生成压缩数据中对应于该边界区域的局部压缩数据。
17.一种用于展开通过压缩图像而形成的压缩数据的图像展开方法，该图像展开方法包括：
边界区域指示信息获取步骤，对于包括在该图像中的多个区域中的每一个区域，结合该压缩数据获取指示该区域是包括呈现在该图像中的对象的内部和外部部分的边界区域还是仅包括呈现在该图像中的对象的内部和外部部分中的一个的非边界区域的边界区域指示信息；
非边界区域数据恢复步骤，通过以对应于预定压缩模式的展开模式展开压缩数据中对应于非边界区域的局部压缩数据而恢复该非边界区域；及
边界区域数据恢复步骤，以在压缩前和展开后的图像之间的差异小于以预定展开模式展开该局部压缩数据的情况下的差异的模式从压缩数据中对应于边界区域的局部压缩数据中恢复该边界区域。

说明书全文

技术领域

本发明涉及图像压缩装置、图像展开装置、图像处理系统、图像压缩方法、图像展开方法、程序和记录介质。具体地，本发明涉及其中的压缩模式根据要压缩的图像的特性而改变的图像压缩装置、图像展开装置、图像处理系统、图像压缩方法、图像展开方法、程序和记录介质。

背景技术

近来，用于显示语音字的字幕图像频繁应用于电视广播中。由于字幕图像是动画，其大的数据大小有时可能会引起问题。因此，已提出了一种用于压缩字幕图像以降低其数据大小的技术(参见专利文献1)。例如，根据该技术，当要顺序并持续地显示的多个帧相同时，这多个帧被作为一个帧存储于存储设备中。因此，在时区中压缩一个图像以减少所占用的存储区量是可能的。
作为另一种旨在改善图像质量和压缩率的技术，已提出了一种不仅可应用于字幕图像，而且可应用于静止图像的图像压缩技术(参见专利文献2)。根据该技术，对图像中的每一个对象以取决于该对象是字符、实心图像、空心图像、还是用于掩蔽的图像等的不同压缩模式进行压缩。
[专利文献1]日本公布的专利申请H9-65265号
[专利文献2]日本公布的专利申请2000-184205号

发明内容

如上所述，专利文献1的技术假定要顺序且连续显示的多个帧是相同的。因此，当要显示多个相互不同的帧时，压缩率便会降低。在专利文献2的技术中，以对于该对象指定的压缩模式对该对象进行压缩。但是，可能存在一种情况，即一个对象包括相对要求较高图像质量的部分和对其可接受较低图像质量的部分。在这种情况下，可能会引起图像质量的恶化或压缩率的降低。
由于以上问题，本发明的目的在于提供一种能够解决上述问题的图像压缩装置、图像展开装置、图像处理系统、图像压缩方法、图像展开方法、程序和记录介质。该目的可通过独立权利要求中描述的特征的组合来实现。从属权利要求描述附加有益实现。
为了解决上述问题，在本发明的第一方面，提供了一种用于生成通过压缩图像而形成的压缩数据的图像压缩装置，包括用于从包括在该图像中的多个区域中检测包括呈现在该图像中的对象的内部和外部部分的边界区域的边界区域检测部分，用于通过以预定压缩模式压缩该图像中不是边界区域的非边界区域而生成压缩数据中对应于该非边界区域的局部压缩数据的非边界区域数据生成部分，以及用于以压缩前和展开后的图像之间的差异小于以上述预定压缩模式压缩边界区域的情况下的差异的模式从该边界区域生成压缩数据中对应于该边界区域的局部压缩数据的边界区域数据生成部分；一种使用该装置的图像压缩方法。
在本发明的第二方面，提供了一种用于展开通过压缩图像而形成的压缩数据的图像展开装置，包括用于对于包括在该图像中的多个区域中的每一个结合该压缩数据获取指示该区域是包括呈现在该图像中的对象的内部和外部部分的边界区域还是仅包括呈现在该图像中的对象的内部和外部部分中的一个的非边界区域的边界区域指示信息的边界区域指示信息获取部分，用于通过以对应于预定压缩模式的展开模式展开压缩数据中对应于非边界区域的局部压缩数据而恢复该非边界区域的非边界区域数据恢复部分，用于从压缩数据中对应于边界区域的局部压缩数据、以在压缩前和展开后的图像之间的差异小于以展开模式展开该局部压缩数据的情况下的差异的模式恢复该边界区域的边界区域数据恢复部分；一种使用该装置的图像压缩方法。
在本发明的第三方面，提供了一种用于压缩图像以生成压缩数据并展开该压缩数据以生成图像的图像处理系统，该图像处理系统包括本发明第一方面中的图像压缩装置和本发明第二方面中的图像展开装置。
本发明的上述概述未列举本发明的所有必要特征，这些特征组的组合也可实现本发明。
附图说明
根据本发明，提高图像压缩率并提高展开之后的图像质量是可能的。
图1示出字幕系统10的整体配置；
图2示出背景图像20的一个示例；
图3示出字幕图像30的一个示例；
图4示出主图像40的一个示例；
图5示出合成图像50的一个示例；
图6示出图像压缩装置60的配置；
图7示出图像展开装置70的配置；
图8为局部图像800的放大视图；
图9示出图像压缩装置60执行的图像压缩处理的示例；
图10示出在S910执行的处理的详情；以及
图11示出在S920和S930执行的处理的详情；
图12示出图像展开装置70执行的图像展开处理的示例；
图13示出在S1210和S1220执行的处理的详情；
图14示出在S920执行的处理的变体；
图15示出在S1210执行的处理的变体；
图16示出作为图像压缩装置60起作用的计算机500的示例性硬件配置；
图17示出合成图像的另一个例。

具体实施方式

尽管下面将参照其实施例对本发明进行描述，但下面描述的实施例并不限制按照权利要求的本发明，这些实施例中描述的特征的所有组合对于本发明的解决手段来说未必是所需的。
图1示出字幕系统10的整体配置。字幕系统10是根据本发明的图像处理系统的一个例子，其包括图像压缩装置60、图像展开装置70、图像合成装置80。图像压缩装置60和图像展开装置70通过数据传输通道互相连接。图像压缩装置60从外部设备作为填充信号接收要显示的字幕图像30，其中字幕图像30以其被叠加到背景图像20上的方式显示。图像压缩装置60还从外部设备作为主信号接收主图像40，将主图像40中的透光度对于字幕图像30的各个象素进行排布，其中背景图像20透过字幕图像30而显示。
例如，图像压缩装置60可从用于生成字幕图像30和主图像40的字幕发生器设备、或从诸如电视摄影机或摄像机的图像采集设备接收填充信号和主信号。然后，图像压缩装置60生成通过对接收到的字幕图像30和主图像40进行压缩而形成的压缩数据。图像压缩装置60将所生成的压缩数据通过网络传送给图像展开装置70。
图像展开装置70通过展开接收到的压缩数据而恢复字幕图像30和主图像40。然后，图像展开装置70将恢复的字幕图像30作为填充信号输出到图像合成装置80。图像展开装置70将恢复的主图像40作为主信号输出到图像合成装置80。通过在背景图像20上根据主图像40叠加字幕图像30，图像合成装置80生成并输出合成图像50。
如上所述，本实施例中的字幕系统10是即使当字幕图像30的传送源和图像合成装置80互相远程提供时，也通过网络适当传送字幕图像30的系统。字幕系统10旨在通过提高压缩字幕图像30和主图像40的压缩率有效利用数据传输通道，并旨在通过减小压缩前和压缩后的图像差异而提高合成图像50的质量。
图2示出背景图像20的一个示例。背景图像20是在其中对一个要显示的图像的各个象素的象素值进行排布的数据。例如，在图2中，背景图像20包含显示在图像下部的山脉、显示在图像上部的天空和云。
图3示出字幕图像30的一个示例。字幕图像30是要以其被叠加到背景图像20上的方式显示的图像。字幕图像30具有至少一个作为要显示的对象的字幕部分。例如，在图3中，字幕图像30具有构成语句“字幕图像”的白色文字、红色圆形和蓝色正方形。
图4示出主图像40的一个示例。主图像40对于每一个象素指出背景图像20透过字幕图像30在其处显示的透光度。更具体地，在主图像40中，将透光度排布为要对其指定透光度的字幕图像30的象素的在相同排布中的亮度值。
例如，在图4中，构成“字幕图像”的白色文字、圆形区域和正方形区域的每一个亮度值具有指示背景图像20不能透过这些区域的最大值。相反，除了这些区域之外的区域的亮度值具有指示背景图像20可完全透过该区域的最小值。因此，由较低亮度值指示的背景图像20的透光度高于由较高亮度值指示的透光度。
图5示出合成图像50的一个示例。字幕系统将字幕图像30叠加到背景图像20上，并将它们显示为合成图像50。具体地，白色文字、圆形和正方形的区域被按照它们的原样显示为合成图像50的一部分，而不允许背景图像20透过它们。相反，在除白色文字、圆形和正方形之外的区域中，背景图像20按其在不显示字幕图像30的情况下的原样显示。后面将参照图8描述包括在合成图像50中的局部图像800。
图6示出图像压缩装置60的配置。图像压缩装置60包括透光度获取部分600、边界区域检测部分610、不呈现区域确定部分620、图像数据压缩部分630和压缩指示信息生成部分670。透光度获取部分600获取对每一个象素指定的、背景图像20要利用其透过字幕图像30而显示的透光度。具体地，透光度获取部分600获取主图像40，在主图像40中要对其指定透光度的字幕图像30的各个象素的透光度被排布为与字幕图像的象素排布相同方式的亮度值。
边界区域检测部分610从包括在字幕图像30中的多个区域中根据主图像40，检测包括呈现在字幕图像30中的对象的内部和外部部分的边界区域。例如，如果一个包括在字幕图像30中的区域包括具有大于预定第一基准透光度的象素和具有等于或小于第一基准透光度的象素，则边界区域检测部分610确定该区域为边界区域。
不呈现区域确定部分620对于包括在字幕图像30中的多个区域中的每一个确定如果包括在该区域中的所有象素的透光度都大于第二基准透光度，则该区域是不需要呈现的区域，其中第二基准透光度与第一基准透光度相比允许背景图像20透过更多。该区域称作不呈现区域。
图像数据压缩部分630对于包括在字幕图像30中的每一个区域根据包括在该区域中的每一个象素的透光度选择用于压缩该区域的压缩模式，并以所选择的压缩模式压缩该区域。此外，图像数据压缩部分630可压缩主图像40。然后，图像数据压缩部分630将通过压缩字幕图像30和主图像40而形成的压缩数据发送到图像扩展设备70。
更具体地，图像数据压缩部分630包括用于压缩不是边界区域的非边界区域的非边界区域数据生成部分640、用于压缩边界区域的边界区域数据生成部分650、和用于压缩不呈现区域的不呈现区域处理部分660。
通过以第一压缩模式压缩非边界区域，非边界区域数据生成部分640生成压缩数据中对应于非边界区域的局部压缩数据。边界区域数据生成部分650从边界区域以一种模式生成压缩数据中对应于边界区域的局部压缩数据，其中以该模式压缩前和展开后的图像之间的差异相对于以第一压缩模式压缩该边界区域的情况要小。
不呈现区域处理部分660从压缩数据中移除指示将不呈现的区域的图像数据。然后，不呈现区域处理部分660将指示该区域的呈现是不必要的信息附加到压缩数据中。压缩指示信息生成不能670对于包括在字幕图像30中的每一个区域生成指示用于该区域的压缩模式和该区域是否是不呈现区域的压缩指示信息。优选地，压缩指示信息生成部分670通过以无损压缩模式压缩该数据对于每一个包括在字幕图像中的区域生成指示用于该区域的压缩模式和该区域是否是将不呈现的区域的压缩指示信息。然后，压缩指示信息生成部分670将压缩指示信息发送到图像展开设备70。
图7示出图像展开设备70的配置。图像展开设备70包括边界区域指示信息获取部分700和图像数据展开部分705。边界区域指示信息获取部分700从图像压缩设备60获取与压缩数据相关的压缩指示信息。在此情况下，压缩指示信息是指示用于每一个包括在字幕图像30中的区域的压缩模式的信息。压缩模式依据该区域是边界区域还是非边界区域而不同。也就是说，压缩指示信息是指示包括在字幕图像30中的每一个区域是边界区域还是非边界区域的信息，即根据本发明的边界区域指示信息的一个例子。如果所获取的压缩指示信息以无损压缩模式压缩，则边界区域指示信息获取部分700以对应于无损压缩模式的模式展开压缩指示信息。
图像数据展开部分705根据压缩指示信息展开压缩数据，并将已展开的字幕图像30和主图像40分别作为填充信号和主信号输出到外部设备。更具体地，图像数据展开部分705包括非边界区域数据恢复部分710、边界区域数据恢复部分720和不呈现区域处理部分730。非边界区域数据恢复部分710通过以对应于第一压缩模式的第一展开模式展开压缩数据中对应于非边界区域的局部压缩来恢复该非边界区域。
边界区域数据恢复部分720以一种模式从压缩数据中对应于边界区域的局部压缩数据恢复该边界区域，其中以该模式压缩前和展开后的图像之间的差异相对于以第一展开模式展开该局部压缩数据的情况要小。不呈现区域处理部分730将压缩数据中对应于不呈现区域的局部压缩数据展开为包括例如具有亮度值0的象素的局部图像。
现在描述局部图像800即图5中示出的合成图像50的一部分的详情。
图8是局部图像800的放大视图。局部图像800包括背景图像20和以叠加到背景图像20上的方式呈现的对象。此外，局部图像800具有以矩阵排列的多个区域。这些区域由折线和实线分区。因此，根据本发明的区域是根据与对象的边界不相关的系统分区的局部图像。作为一个例子，根据本发明的区域指通过以水平和垂直方向上的八(8)点对具有八(8)点的图像进行分区而形成的多个区域中的每一个。
局部图像800包括边界区域，其包括对象的内部和外部部分。边界区域由粗实线表示。因此，边界区域是包括对象与背景图像20之间的边界线、以及对象的一部分和背景图像20的一部分的区域。
局部图像800还包括非边界区域，其每一个仅包括对象的内部和外部部分中的一个。一些非边界区域由粗折线表示。因此，非边界区域是不包括对象与背景图像20之间的边界线的区域。包括一个对象与另一个对象之间的边界线、且不包括背景图像20的区域可被看作是非边界区域或边界区域。
图9示出由图像压缩设备60执行的图像压缩处理的一个示例。透光度获取部分600获取主图像40(S900)。边界区域检测部分610检测非边界区域，而不呈现区域确定部分620检测将不呈现的区域(S910)。图像数据压缩部分630通过压缩字幕图像30而生成压缩数据(S920)。然后，图像数据压缩部分630通过压缩主图像40而生成压缩数据(S930)。压缩指示信息生成部分670生成压缩指示信息(S940)。
图10示出在S910处执行的处理详情。边界区域检测部分610对于包括在主图像40中的多个区域中的每一个执行以下处理(S1000)。首先，边界区域检测部分610将用于确定边界区域和不呈现区域的变量A、B和C初始化为0(S1010)。然后，边界区域检测部分610将该区域中具有小于预定值α的亮度值的象素数量替代为变量A(S1020)。在此情况下，亮度值α指示根据本发明的第二基准透光度。即，边界区域检测部分610将具有大于第二基准透光度的透光度的象素数量替代为变量A。在此情况下，指示第二基准透光度的亮度值α可以是最大亮度值的1/8、1/16或1/32。
然后，边界区域检测部分610将该区域中具有等于或大于α而小于β的亮度值的象素数量替代为变量B(S1030)，其中β被指定为大于α的一个值。在此情况下，亮度值β指示根据本发明的第一基准透光度。即，边界区域检测部分610将具有大于第一基准透光度而等于或小于第二基准透光度的透光度的象素数量替代为变量B。结果，变量A和B的和是具有大于第一基准透光度的透光度的象素数量。在此情况下，指示第一基准透光度的亮度值β可以是最大亮度值的1/4或1/2。
然后，边界区域检测部分610将该区域中具有等于或大于β的亮度值的象素数替代为变量C(S1040)。即，边界区域检测部分610将具有等于或小于第一基准透光度的透光度的象素数替代为变量C。如果B＝0且C＝0(S1050：是)，则不呈现区域确定部分620确定字幕图像30中对应于作为不呈现区域的区域(S1060)。即，如果一个区域中的所有象素的透光度等于或大于第二基准透光度，则不呈现区域确定部分620确定该区域为不呈现区域。不呈现区域确定部分820可确定主图像40中作为不呈现区域的相应区域。
相反，如果不满足B＝0且C＝0(S1050：否)，则边界区域检测部分610确定其是否满足A+B＞0且C＞0(S1070)。如果其满足A+B＞0且C＞0，则边界区域检测部分610检测字幕图像30中对应于作为边界区域的区域(S1080)。即，如果一个区域包括具有大于第一基准透光度的透光度的象素和具有等于或小于第一基准透光度的透光度的象素，则边界区域检测部分610确定该区域为边界区域。边界区域检测部分610可检测主图像40中作为边界区域的相应区域。
相反，如果其不满足A+B＞0且C＞0(S1070：否)，则边界区域检测部分610检测字幕图像30中对应于作为正常区域的区域(S1090)。正常区域是根据本发明的非边界区域的一个例子，且其指是非边界区域而不是不呈现区域的区域。边界区域检测部分610可检测主图像40中作为作为正常区域的相应区域。
边界区域检测部分610对于包括在主图像40中的多个区域中的每一个执行上述处理(S1095)。
如上所述和图中所示，图像压缩装置60根据主图像40确定字幕图像30中对象的边界部分。因此，由于透光度附加用于参数，所以提高相对于仅根据字幕图像30确定边界部分的情况的确定的准确性是可能的。
可选地，边界区域检测部分610可在不使用主图像40的情况下，对于包括在字幕图像30中的多个区域中的每一个执行上述处理。在此情况下，如果一个区域包括具有等于或大于预定基准亮度的亮度的象素和具有小于基准亮度的亮度的象素，则边界区域检测部分610确定该区域为边界区域。因此，即使当不能获得主图像40时，也能以某一准确性标准检测边界区域。
图11示出在S920和S930处执行的处理的详情。首先，描述S920。图像数据压缩部分630对于包括在字幕图像30中的多个区域中的每一个执行以下处理(S1100)。变量X指示要处理的区域在字幕图像30中的X轴方向上排列的顺序。变量Y指示要处理的区域在字幕图像30中的Y轴方向上排列的顺序。即，图形数据压缩部分630对于可采用变量X和变量Y的每一个可能的值对执行以下处理。
首先，如果该区域是将不呈现的区域(S1110：是)，则不呈现区域处理部分660将指示该区域的呈现是不必要的0替代为标志(X，Y)(S1120)。在此情况下，标志(X，Y)是为每一个变量对X和Y提供的数组变量。不呈现区域处理部分660将该区域从压缩数据中移除(S1125)。
相反，如果该区域不是不将呈现的区域(S1110)，则不呈现区域处理部分660确定该区域是否是边界区域(S1130)。如果该区域不是边界区域(S1130)，则非边界区域数据生成部分640将指示应以第一压缩模式对该非边界区域进行压缩的值2替代为标志(X，Y)(S1160)。然后，非边界区域数据生成部分640以第一压缩模式压缩该非边界区域(S1170)。
相反，如果该区域是边界区域(S1130：是)，则边界区域数据生成部分650将指示应以第二压缩模式对该边界区域进行压缩的值1替代为标志(X，Y)(S1140)。然后，边界区域数据生成部分650以第二压缩模式对该边界区域进行压缩，其中以第二压缩模式压缩前和展开后的图像之间的差异相对于以第一模式压缩该边界区域的情况要小(S1150)。
在此情况下，图像之间的差异是例如根据S/N(信号噪声)比的一个值，S/N比指示信号量相对于噪声量的数量级。可选地，图像之间的差异可以是通过计算在压缩前和展开后的各个象素值之间差值，并对计算出的差值求和而得到的值。
第一压缩模式是有损压缩模式，以该模式通过展开获得的图像与压缩前的图像是不同的。作为例子，第一压缩模式是JPEG压缩，其中组合了离散余弦变换、量子化和霍夫曼压缩。在此情况下，第二压缩模式是例如无损压缩模式，以该模式可在展开后获得与压缩前的相同的图像。作为例子，第二压缩模式是诸如霍夫曼压缩的GIF压缩。
在压缩后，局部压缩数据的大小在以第一压缩模式压缩图像的情况下可能相对于以第二压缩模式压缩该相同的图像的情况下要小。即，非边界区域数据生成部分640可以第一压缩模式压缩非边界区域，以相对于以第二压缩模式压缩非边界区域，降低压缩后的局部压缩数据的大小。从而，当非边界区域占据了图像的较大部分时，可更加降低压缩数据的大小。
此外，第一压缩模式可以基于连续排列的象素的象素值之间的差异的频率分量，且第二压缩模式可以是不基于该频率分量的另一种模式。从而，可以提高其象素值急剧改变的边界区域的图像质量，而同时维持整个图像的压缩率。
可选地，边界区域数据生成部分650在不压缩边界区域的情况下可生成指示该边界区域作为局部压缩数据的数据。从而，可以缩短压缩和展开所需的时间，同时维持展开后的图像质量。
图像数据压缩部分630对于包括在字幕图像30中的多个区域中的每一个执行以上处理(S1180)。最后，压缩指示信息生成部分670根据标志(X，Y)生成压缩指示信息(S1190)。例如，压缩指示信息生成部分670可通过以无损压缩模式对作为数组变量的标志(X，Y)进行压缩，而生成压缩指示信息。图像压缩装置60可将如上所述生成的压缩数据和压缩指示信息存储在诸如存储器或硬盘驱动器的记录设备中，或将它们通过网络发送给图像展开装置70。
然后，图像数据压缩部分630对于主图像40执行与对于字幕图像30执行的几乎相同的处理。更具体地，非边界区域数据生成部分640以用于字幕图像30中非边界区域的相同压缩模式对主图像40中对应于字幕图像30中的非边界区域的区域进行压缩。同样，边界区域数据生成部分650以用于字幕图像30中边界区域的相同压缩模式对主图像40中对应于字幕图像40中的边界区域的区域进行压缩。不呈现区域处理部分660从压缩数据中移除主图像40中对应于字幕图像30中的不呈现区域的区域。对于主图像40执行的其他处理几乎与上面对于字幕图像30执行的处理相同，因此，这里省略对它们的描述。
图12示出图像展开装置70执行的图像展开处理的例子。边界区域指示信息获取部分700获取与压缩数据相关的压缩指示信息(S1200)。如果所获取的压缩指示信息以无损压缩模式压缩，则边界区域指示信息获取部分700以对应于无损压缩模式的模式展开压缩指示信息。然后，图像数据展开部分705根据压缩指示信息展开表示字幕图像的压缩数据，以恢复字幕图像30(S1210)。然后，图像数据展开部分705根据压缩指示信息展开表示主图像40的压缩数据，以恢复主图像40(S1220)。
图13示出在S1210和S1220执行的处理的详情。首先，对S1210进行描述。图像展开装置70对于要展开为字幕图像30的多个区域中的每一个重复地执行以下处理(S1300)。非边界区域数据恢复部分710判断该区域是否是不呈现区域(S1310)。具体地，如果压缩指示信息中对应于该区域的标志(X，Y)的值为0，则非边界区域数据恢复部分710确定该区域为不呈现区域。
如果该区域是不呈现区域(S1310：是)，则不呈现区域处理部分730生成黑块作为该区域(S1320)。具体地，不呈现区域处理部分730可生成作为该区域的局部图像，其中具有亮度0和色差0的象素被排列。相反，如果该区域不是不呈现区域(S1310：否)，则非边界区域数据恢复部分710判断该区域是否为边界区域(S1330)。如果该区域不是边界区域(S1330：否)，则非边界区域数据恢复部分710通过以对应于第一压缩模式的第一展开模式展开对应于该区域的局部压缩数据，而恢复该非边界区域(S1340)。
相反，如果该区域是边界区域(S1330：是)，则边界区域数据恢复部分720通过以对应于第二压缩模式的第二展开模式展开对应于该区域的局部压缩数据，来恢复该边界区域(S1350)。图像展开装置70对于要展开为字幕图像30的多个区域中的每一个重复执行以上处理(S1360)。
然后，图像展开装置70对于主图像40执行与对于字幕图像30执行的几乎相同的处理(S1220)。更具体地，非边界区域数据恢复部分710以用于字幕图像30中非边界区域的相同展开模式恢复主图像40中对应于字幕图像30中的非边界区域的区域。同样，边界区域数据恢复部分720以用于字幕图像30中边界区域的相同展开模式恢复主图像40中对应于字幕图像30中的非边界区域的区域。对于主图像40执行的其他处理与对于字幕图像30执行的上述处理几乎相同，因此，这里省略对其的描述。
图14示出在S920执行的处理的变体。非边界区域数据生成部分640首先通过以第一压缩模式对包括在字幕图像30中的所有区域进行压缩，生成局部压缩数据(S1400)。然后，图像压缩装置60对于这多个区域中的每一个重复执行以下处理(S1410)。如果要处理的区域不是边界区域(S1420：否)，则非边界区域数据生成部分640将指示应以第一压缩模式对该区域进行压缩的值0替代为标志(X，Y)(S1430)。
相反，如果要处理的区域是边界区域(S1420：是)，则边界区域数据生成部分650将指示应以第二压缩模式对该区域进行压缩的值1替代为标志(X，Y)(S1440)。边界区域数据生成部分650通过以第二压缩模式对该区域进行压缩，生成第二局部压缩数据(S1450)。图像压缩装置60对于这多个区域中的每一个重复执行以上处理(S1460)。
压缩指示信息生成部分670根据标志生成压缩指示信息(S1470)。例如，压缩指示信息生成部分670通过以无损压缩模式对作为数字变量的标志进行压缩而生成压缩指示信息。可选地，压缩指示信息生成部分670可生成作为指示以第二压缩模式压缩的区域在字幕图像30中排列的顺序的压缩指示信息的坐标信息。从而，当存在很少以第二压缩模式压缩的区域时，压缩指示信息的大小可以减小。
边界区域数据生成部分650生成其中每一个第二局部压缩数据被附加到每一个第一局部压缩数据的文件(S1480)。此外，边界区域数据生成部分650将数据附加信息记录到该文件的存储图像的属性信息的报头部分，以指示第二局部压缩数据被附加。
如上所述，根据图14中示出的变体，提高与用于以第一压缩模式压缩整个图像的现有系统的亲合性是可能的。从而，不仅容易地设计和实现图像压缩装置60，而且便于现有系统的改进和修改都是可能的。在S930执行的处理还可以变为图14中示出的在S920执行的处理的变体。
图15示出在S1210执行的处理的变体。图15中的处理对应于图14中示出的处理。非边界区域数据恢复部分710读取从图像压缩装置60接收到的、存储压缩图像数据的文件的报头部分(S1500)。如果非边界区域数据恢复部分710不能从该报头部分检测到数据附加信息，则其以第一展开模式展开所有区域(S1520)。
相反，如果从该报头部分检测到数据附加信息(S1510：是)，则非边界区域数据恢复部分710以第一展开模式所有区域。这样，非边界区域数据恢复部分710以第一展开模式展开第一局部压缩数据，而不管是否在图像文件的报头部分中检测到了数据附加信息。
然后，边界区域数据恢复部分720对于字幕图像30中要展开的多个区域中的每一个重复执行以下处理(S1540)。首先，边界区域数据恢复部分720判断该区域是否是边界区域(S1550)。如果该区域是边界区域(S1550：是)，则边界区域数据恢复部分720以第二展开模式展开对应于该区域的第二局部压缩数据(S1560)。
然后，边界区域数据恢复部分720以从第二局部压缩数据展开的图像覆盖在S1530从第一局部压缩数据展开的图像(S1570)。边界区域数据恢复部分720对于包括在字幕图像30中要展开的多个区域中的每一个重复执行以上处理(S1580)。在S1220处的处理可以变为图15中示出的在S1210执行的处理的变体。
如上所述，根据该变体的图像展开装置70不仅可以正确展开附加了第二局部压缩数据的文件，而且可以正确展开以第一压缩模式压缩的一般文件。从而，提高与现有压缩装置的亲合性是可能的。
图16中示出作为图像压缩装置60起作用的计算机500的示例性硬件配置。计算机500具有通过主机控制器1082互连的含CPU 1000的CPU相关部分、RAM 1020和图形控制器1075；通过输入/输出控制器1084连接到主机控制器1082的含通信接口1030的输入/输出部分、硬盘驱动器1040和CD-ROM驱动器1060；连接到输入/输出控制器1084的含BIOS 1010的传统输入/输出部分、软盘驱动器1050和输入/输出芯片1070。
主机控制器1082将RAM 1020与以高传输速率访问RAM 1020的CPU 1000和图形控制器1075相连。CPU 1000根据BIOS 1010和存储在RAM 1020中程序进行操作，以控制每一部分。图形控制器1075在提供于RAM 1020中的帧缓冲区上获取由CPU 1000或其他设备生成的图像数据，并将其显示在显示设备1080上。可选地，图形控制器1075可包括用于存储由CPU或其他设备生成的图像数据的帧缓冲区。
输入/输出控制器1084将主机控制器1082与作为相对快速的输入/输出设备的通信接口1030、硬盘驱动器1040和CE-ROM驱动器1060相连。通信接口1030通过网络与外部设备通信。硬盘驱动器1040存储要由计算机500使用的程序和数据。CD-ROM驱动器1060从CD-ROM 1095读取程序或数据，并将其提供给RAM 1020或硬盘驱动器1040。
BIOS 1010和诸如软盘驱动器1050和输入/输出芯片1070的相对较慢的输入/输出设备连接到输入/输出控制器1084。BIOS 1010存储当计算机500启动时由CPU 1000执行的引到程序、及依赖于计算机500的硬件的程序。软盘驱动器1050从软盘1090读取程序或数据，并将其提供给RAM 1020或硬盘驱动器1040。输入/输出芯片1070通过例如并行端口、串行端口、键盘端口、鼠标端口等连接软盘1090和各种输入/输出设备。
要提供给计算机500的程序存储于诸如软盘1090、CD-ROM1095和IC卡的记录介质中，并由用户提供。这些程序通过输入/输出芯片1070和/或输入/输出控制器1084从记录介质中读出，安装在计算机500上并执行。读出的程序可通过网络提供给图像展开装置70，并在图像展开装置70上执行。在图像压缩装置60和图像展开装置70上执行的程序使得计算机500以与上面参照图1到15描述的图像压缩装置60和图像展开装置70相同的方式操作。
上面描述的程序可以存储于外部记录介质中。作为记录介质，诸如DVD或PD的光记录介质、诸如MD的磁光记录介质、磁带介质、或诸如IC卡的半导体存储器可用于附加于软盘1090或CD-ROM1095。将诸如提供在连接到专用通信网络或互联网以通过网络向计算机500提供程序的服务器系统中的硬盘或RAM的存储设备用作记录介质也是可能的。
图17示出合成图像的另一个例子。在此例中，图像数据压缩部分630以有损压缩模式压缩字幕图像中的每一个区域，而不管该区域是否是边界区域。因此，在对象边界处发生图像干扰。此图像干扰产生于由于量子化而形成的离散余弦变换或频率分量的移除中的错误。因此，在象素值急剧变化的部分，诸如对象的边界部分中，有损压缩前和展开后的图像之间的差异通常是较大的。
但是，根据本实施例的图像压缩装置60可通过以无损压缩模式压缩边界区域同时保持非边界区域的压缩率而提高展开后的图像质量。
尽管参照实施例对本发明进行了描述，但本发明的技术范围并不限于上述实施例的范围。对于本领域的技术人员显而易见的，可对上述的实施例实现各种修改或改进。根据所附权利要求明显地看出，这种修改或改进的实施例也可包括在本发明的技术范围之内。

标题	发布/更新时间	阅读量
一种基于AR的主设备检修大数据快速建模系统	2020-05-08	754
与飞行器的飞行测试有关的数据的实时管理的系统和方法	2020-05-08	500
一种电子建筑施工图的图形识别方法	2020-05-11	478
一种移动机器人单目视觉跟随系统及跟随方法	2020-05-08	717
一种基于QT的SCADA系统HMI开发方法	2020-05-08	535
电网拓扑内存数据处理方法、装置、计算机设备和存储介质	2020-05-11	873
游戏控制的方法、装置、终端、服务器及可读存储介质	2020-05-08	336
一种区域企业数据异常行为的大数据识别方法	2020-05-08	199
使用两个渲染计算装置从计算机图形渲染图像	2020-05-08	569
一种拍摄方法及电子设备	2020-05-08	554

图像压缩及展开装置及其方法、图像处理系统

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：