首页 / 专利库 / 视听技术与设备 / 运动补偿预测 / Verfahren zur bewegungskompensierten Bild-zu-Bild-Prädiktionscodierung

Verfahren zur bewegungskompensierten Bild-zu-Bild-Prädiktionscodierung

阅读:27发布:2022-08-28

专利汇可以提供Verfahren zur bewegungskompensierten Bild-zu-Bild-Prädiktionscodierung专利检索,专利查询,专利分析的服务。并且Bie diesem Verfahren zur Bild-zu-Bild-Prädiktionscodierung wird ein Bild in ein regelmäßiges Blockraster mit n x n Bildpunkten zerlegt. Sodann werden vor jeder Prädiktion bis zu vier Prädiktionsverfahren, nämlich:
Blockweise Verschiebungsvektorberechnung,
Objektbezogene Verschiebungsvektorberechnung,
Nullsetzen der Verschiebung und
Nullsetzen der Prädiktion
auf die zu übertragende Datenrate überprüft und dasjenige Verfahren zur Übertragung ausgewählt, daß zu den gering­sten Prädiktionsfehlern führt.,下面是Verfahren zur bewegungskompensierten Bild-zu-Bild-Prädiktionscodierung专利的具体信息内容。

1. Verfahren zur bewegungskompensierten Bild-zu-Bild-Prä­diktionscodierung, bei dem zunächst ein gesamtes Bild in ein regelmäßiges Blockraster mit n x n Bildpunkten zerlegt und für jeden dieser Blöcke der Verschiebungsvektor gegen­über den Blöcken des vorhergehenden Bildes durch Abstands­berechnung ermittelt wird,
dadurch gekennzeichnet, daß aneinandergrenzende Blöcke, für die eine Verschiebung ungleich Null ermittelt wurde, zu Komplexen zusammengefaßt werden und aus den gemessenen Verschiebungen der Blöcke, die zu einem Komplex gehören, durch Regressionsrechnung die Parameter eines Bewegungs­gesetzes berechnet werden und die Schätzbildberechnung mit Hilfe der sich aus dem Bewegungsgesetz ergebenden Einzel­blockverschiebungen durchgeführt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß für jeden Block durch Abstandsberechnung geprüft wird, ob die gemessene Blockverschiebung oder die sich aus den Parametern des Bewegungsgesetzes ergebende Blockverschie­bung zu einem geringeren Prädiktionsfehler führt, und die­jenige Verschiebung, die zum geringsten Prädiktionsfehler führt, zur Bewegungskompensation benutzt wird.3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß für jeden Block zusätzlich geprüft wird, ob keine Ver­schiebung oder eine Nullsetzung der Prädiktion zu gerin­geren Prädiktionsfehlern führt und zur Schätzbildberech­nung von der vier genannten Prädiktionsvorschriften die­jenige ausgesucht und verwendet wird, die den kleinsten Prädiktionsfehler ergibt.4. Verfahren nach den Ansprüchen 1 bis 3, dadurch gekenn­zeichnet, daß vor der Auswahl eine Wichtung zugunsten der Berechnung des prädizierten Bildes gemäß dem für den gesamten Komplex ermittelten Bewegungsgesetz durchgeführt wird.5. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeich­net, daß die Parameter des Bewegungsgesetztes lediglich aus ermittelten Verschiebungen von Ecken im Bildinhalt be­rechnet werden.6. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeich­net, daß unter Verwendung der ausgewählten und übertra­genen Verschiebungsvektoren vom Decoder eine bewegungs­richtige Interpolation eventuell nicht codierter und nicht übertragener Teil- und Vollbilder durchgeführt wird.
说明书全文

Die Prädiktionscodierung nutzt das Vorwissen, das beim Empfänger bereits vorhanden ist, aus, um das aktuelle Bild mit möglichst wenig Information zu beschreiben. Sie wird erheblich verbessert, wenn die Bild-zu-Bild-Änderungen infolge Bewegungen in der Szene räumlich und zeitlich erfaßt und bei der Berechnung des prädizierten Bildes miteinbezogen werden (Prädiktionscodierung mit Bewegungs­kompensation).

Zur Übertragung von Bildtelefonszenen bei Übertragungs­raten zwischen 64 kbit/s und 384 kbit/s haben sich zwei Methoden der Bewegungskompensation besonders bewährt. Die eine, z.B. aus der EP 0 123 616 bekannte Methode zur Be­wegungskompensation ist die blockweise Bewegungskompen­sation. Sie arbeitet schematisch das ganze aktuelle, zu prädizierende Bild ab (ikonische Bildverarbeitung), indem sie es in ein regelmäßiges (n x n)-Blockraster unterteilt und jedem Block diejenige Bild-zu-Bild-Verschiebung zu­ordnet, für welche ein Abstandsmaß (Ähnlichkeitsmaß) zwischen dem Grauwertgebirge des betrachteten Blockes und dem Grauwertgebirge eines entsprechend verschobenen Blockes im vorhergehenden Bild ein Minimum (Maximum) annimmt. Zur Prädiktion wird ein Block aus dem letzten rekonstruierten (beim Empfänger bereits vorhandenen) Bild genommen, welcher um die ermittelte Verschiebung gegenüber dem zu prädizierenden Block versetzt ist.

Die andere Methode ist die objektbezogene Bewegungskompen­sation. Sie ist z.B. bekannt aus der DE-OS 33 28 341. Sie arbeitet prinzipiell nicht schematisch, sondern bildin­haltsbezogen (semantische Bildverarbeitung), indem ver­sucht wird, bewegte von unbewegten Teilen der Bildfolge zu separieren, sie anhand ihres Bewegungsverhaltens zu cha­rakterisieren, auf diese Weise dann zu geschlossenen, gegeneinander abgegrenzten Objekten mit beschreibbarem Bewegungsverhalten zu gelangen, und schließlich mit Hilfe der gewonnenen Beschreibung des Bewegungsverhaltens ein bewegungskompensiertes prädiziertes Bild des aktuellen Bildes zu erstellten. Diese Methode wird auch als "Ob­jekt-Matching" bezeichnet. Zum Stand dieser Technik wird u.a. auf den Aufsatz "Coding Television Signals at 320 and 64 kbit/s (2nd Int. Tech. Symp. on Optical and Electro-Op­tical Appl. Science and Engineering, SPIE Conf. B594 Image Coding, Cannes, France, Dec. 1985) verwiesen.

Codecs zur extremen Reduktion der Übertragungsrate, die z.B. für die oben genannten Bitraten erforderlich sind, müssen auf ein eingeschränktes Szenenmaterial, das sie zu verarbeiten haben, adaptiert sein. Sie sind daher weder universell einsetzbar noch anhand beliebiger Szenen beur­teilbar. Charakteristisch für Bildtelefon- und Videokon­ferenzszenen sind Variationen in der Gesetzmäßigkeit der Bild-zu-Bild-Änderungen zwischen großflächigen Verände­rungen wie z.B. bei Zoom durch Brennweitenvergrößerung des Kameraobjektivs, und überwiegend regellosen Veränderungen, wie z.B. bei einer stark gestikulierenden bewegten Person mit heftigem Mienenspiel, welche außerdem eine stark texturierte Kleidung mit reichlichem Faltenwurf trägt.

Jedes der beiden genannten Verfahren zur Bewegungskompen­sation offenbart bei der Codierung von solchen extremen Szenenänderungen seine Schwächen vollständig. Dies soll anhand dreier Gütekriterien erläutert werden.

Ein erstes Gütemaß für die Bewegungskompensation ist das Verhältnis der jeweils über alle Bildpunkte gemittelten quadratischen Abweichung entweder des bewegungskompensier­ten prädizierten Bildes oder des letzten rekonstruierten Bildes vom aktuellen Originalbild.

Die objektbezogene Bewegungskompensation erzielt die höchsten Gewinne bei der Prädiktion von Bild-zu-Bild-Ände­rungen, welche durch Bewegungen von großen Objekten im Szenenraum hervorgerufen werden, die überwiegend den Gesetzen der Translation im Szenenraum gehorchen: Bewe­gungen der gesamten abgebildeten Partie einer sonst ruhi­gen Person seitlich, nach vorn oder hinten. Bei Schwenk oder Zoom der Kamera ist die objektbezogene Bewegungs­kompensation von Vorteil, da sämtliche bereits im vorher­gehenden Bild vorhandenen Bildpunkte nach einem einheit­lichen, einfachen Gesetz im aktuellen Bild verschoben wieder erscheinen.

Die blockweise Bewegunskompensation ist dagegen bei re­gellosen Bildveränderungen vorteilhaft.

Das zweite entscheidende Gütemaß für die Bewegungskompen­sation ist die erforderliche Datenrate zur Übertragung der Steuerdaten für den bewegungskompensierenden Prädiktor und zur Übertragung des sog. Prädiktionsfehlersignals zur Korrektur der im prädizierten Bild verbliebenen Fehler.

Während bei Objekt-Matching für jedes geschlossene bewegte Objekt ein Satz von Steuerdaten genannt charakteristi­scher Bewegungsvektor, mit der Genauigkeit von mindestens 1/10 Bildpunktabstand übertragen werden kann, um eine optimale bewegungskompensierte Schätzbildberechnung zu ermöglichen, ist dies bei Blockmatching unmöglich, denn Block-Matching erfordert die Übertragung eines Verschie­bungsvektors für jeden von Bild zu Bild veränderten Block. Damit würde der Steuerdatenstrom zu Lasten des übertrag­baren Prädiktionsfehlersignals unzulässig ansteigen. Folglich sind nur Blockverschiebungen um ganzzahlige Vielfache des Bildpunktabstands in jeder Koordinatenrich­tung realisierbar, mit der Konzequenz geringeren Gewinns durch Bewegungskompenation.

Ein drittes Gütemaß, das im Gegensatz zu den beiden vor­stehend genanten objektiven Gütemaßen ein subjektives Gütekriterium ist, sind die im rekonstruierten Bild ver­bleibenden, infolge der begrenzten Datenrate nicht kor­rigierten Fehler. Unter diesen verbleibenden Fehlern fallen als störend sichtbar diejenigen auf, welche durch Fehlanpassung der starren Blockstruktur an die natürlichen Grenzen der verschiedenen bewegten Bildbereiche künstlich in die rekonstruierten Bilder eingebracht und daher auch als Artefakte bezeichnet werden.

Bei Objekt-Matching treten diese Artefakte nur an den Grenzen der geschlossenen Objekte auf, während sie bei Block-Matching prinzipiell überall dort auftreten können, wo unterschiedlich bewegungskompensierte Blöcke aneinan­derstoßen.

Der Erfindung liegt die Aufgabe zugrunde, den Stand der Technik zu verbessern. Insbesondere soll ein Verfahren der im Oberbegriff des Patentanspruchs 1 genannten Art ange­geben werden, mit dem die Datenrate zur Übertragung von Bildsignalen, insbesondere für ein Bildtelefon (Bildfern­sehtelefon), weiter eingeschränkt und/oder die übertragene Bildqualität verbessert werden kann. Die Aufgabe wird bei einem Verfahren der im Oberbegriff des Patentanspruchs 1 genannten Art durch die im kennzeichnenden Teil des Pa­tentanspruchs 1 genannten Verfahrensschritte gelöst.

Das erfindungsgemäße Verfahren vermeidet die Schwächen der blockweisen und objektbezogenen Bewegungskompensation, die auftreten, wenn jeweils nur eine Kombination ausschließ­lich angewendet wird. Es nutzt aus, daß sich die beiden Verfahren in vorteilhafter Weise ergänzen und bestimmt den günstigsten Kompromiß zwischen ihnen. Als Resultat erhält man eine Verbesserung des mittleren Gewinns durch Bewe­gungskompensation gegenüber reinem Objekt-Matching, eine Verringerung der mittleren Steuerdatenrate zur Übertragung der Bewegungsvektoren und eine Reduzierung der Artefakte gegenüber reinem Block-Matching. Bei höherem Gewinn durch Bewegungskompensation, bei weniger Datenrate zur Übertra­gung von Bewegungsvektoren und bei weniger Artefakten im prädizierten Bild verbleibt im Mittel ein größerer Anteil der zugelassenen Datenrate für die Übertragung des Prädik­tionsfehlersignals, mit der Konsequenz einer gesteigerten objektiven und subjektiven Qualität des empfangenen Bil­des.

Vorteilhafte Weiterbildungen aus Ausgestaltungen der Erfindung sind in den Unteransprüchen angegeben. Sie dienen jeweils zur weiteren Verbesserung des übertragenen Bildes bei möglichst geringer Datenübertragungsrate.

Die Erfindung wird nun anhand von Zeichnungen und eines Ausführungsbeispiels näher erläutert. Es zeigen im ein­zelnen:

  • FIG. 1: Blockschaltbild eines Codierers zur Durchführung einer bewegungskompensierten Bild-zu-Bild-­Prädiktion;
  • FIG. 2: Bildblöcke und Block-Komplexe;
  • FIG. 3: Blockschaltbild eines Codierers zur Durchführung des erfindungsgemäßen Verfahrens.

FIG. 1 zeigt das Blockschaltbild eines DPCM (Differen­tial-Puls-Code-Modulation)-Coders mit Bewegungskompensa­tion. Innerhalb des strichliert gezeichneten Bereiches befindet sich die DPCM-Schleife.

Von den am Eingang E eintreffenden Videosignalen a des Originalbildes werden die Videosignale c des vom Prädiktor PR vorausgesagten Schätzbildes in dem Subtrahierglied G1 subtrahiert. Die Prädiktionsfehler d als Ergebnis der Subtraktion werden über einen Quantisierer Q als quanti­sierte Videosignale e dem Kanalcodierer KC und anschlie­ßend dem Ausgang A zugeführt. Ferner werden die Signale c des Schätzbildes und die quantisierten Videosignale e addiert und über einen Bildspeicher B2 als um einen Bild­abstand verzögerte Videosignale g wieder dem Prädiktor PR zugeführt und zwar als Schätzbild für das nun vorliegende aktuelle Bild.

Die DPCM-Schleife enthält in der Regel noch eine für Bildsignale besonders geeignete Transformationseinrichtung T zur Datenreduktion, die durch die zweite Transforma­tionseinrichtung IT für die Signale zur Schätzbildkorrek­tur rückläufig gemacht wird (inverse Transformation). Als Transformationscodierung hat sich z.B. die Cos-Transfor­mation besonders bewährt.

Zusätzlich zu dieser an sich bekannten DPCM-Schleife ist eine Einrichtung MA zur Ermittlung von Bildveränderungen (Bewegungsanalysator) aufeinanderfolgender Bilder vorgese­hen. Sie erhält hierzu die Signale a des Originalbildes und über einen Bildspeicher B1 die Signale b des vorherge­henden Bildes. Die Bildspeicher B1 und B2 verzögern also jeweils ein Bild um die Dauer eines Bildabstandes.

Die Erweiterung der nur für den Coder gezeigten Struktur gegenüber der üblichen Bild-zu-Bild-Prädiktion besteht in der Steuerung des Prädiktors PR durch einen im Bewegungs­analysator MA vorgesehenen Segmenter und einen Verschie­bungsschätzer. Der Segmenter liefert die Information, welche Blöcke von Bildpunkten der Prädiktor zu prädizieren hat und der Verschiebungsschätzer die Verschiebungs- oder Bewegungsinformation zur bewegungskompensierten Prädik­tion. Aus dem Vergleich des vorhergehenden Bildes (b) und des aktuellen Originalbildes (a) werden Segmentation- und Verschiebungs- bzw. Bewegungsinformation gewonnen.

FIG. 2 zeigt im Schema das Resultat eines Segmenters, der im blockgerasterten Bild erstens infolge Bewegung in der Szene geänderte Blöcke detektiert (schraffiert eingezeich­net) und zweitens aneinanderliegende geänderte Blöcke zu Kompexen zusammenfaßt (dick ausgezogene Umrandung). Solche Komplexe können geschlossene, einheitlich gesetz­mäßig bewegte Objekte repräsentieren, können aber auch durch eine Vielzahl unterschiedlich bewegter, nahe bei­einanderliegender Bildbereiche entstehen.

Das nachfolgend erläuterte Auswahlverfahren wird im ersten Fall objektbezogene Bewegungskompensation, im andern Fall blockweise Bewegungskompensation wählen. Im allgemeinen treten beide Extreme von Bewegungsarten nicht so häufig auf, die Regel sind Mischformen. Das Auswahlverfahren ermittelt einerseits die jeweils günstigste Kombination eines Anteils von einzelnen und unabhängig voneinander verschobenen Blöcken und andererseits eines Anteils von Blöcken, deren Bildpunkte nach einem gemeinsamen Bewe­gungsgesetz des in der Szene bewegten Objektes verschoben werden.

Erfindungsgemäß wird die günstigste Kombination der beiden an sich bekannten Verfahren der Bewegungskompensation - blockweise und objektbezogene Bewegungskompensation - dadurch erreicht, daß für alle, infolge Bewegung in der Szene, von Bild zu Bild verschobenen Blöcke erste ihre Verschiebung ermittelt, dann für zusammenhängende Komplexe verschobener Blöcke ein gemeinsames, die Bewegung eines geschlossenen Objektes in der Szene repräsentierendes Bewegungsgesetz abgeleitet, und drittens wieder Block für Block geprüft wird, ob eine Einzelblockverschiebung oder eine dem Objektbewegungsgesetz gemäße Verschiebung aller Bildpunkte des untersuchten Blockes die geringere Abwei­chung des prädizierten Bildes vom aktuellen zu übertra­genden originalen Bild ergibt. Die Abweichung wird durch ein geeignetes Abstandsmaß erfaßt. Bei annähernd gleicher Güte der Prädiktion wird der objektbezogenen Bewegungs­kompensation eindeutig der Vorzug gegeben, da sie in der Summe hinsichtlich des Steuerdatenaufwandes und hinsicht­lich der Artefakte günstiger ist. Die Fehler im prädizier­ten Bild können besser korrigiert werden, da mehr Daten­rate für das Prädiktionsfehlersignal zur Verfügung steht.

FIG. 3 zeigt ein Blockdiagramm eines in Fig. 1 dargestell­ten Bewegungsanalysators zur Durchführung des Auswahlver­fahrens für blockweise und objektbezogene Bewegungskom­pensation. Der Verschiebungsschätzer ist mit VS und der Segmenter mit S bezeichnet. Die Daten j der Verschiebungs­vektoren je Block und je Komplex und die Daten k der Komplexe geänderter Blöcke werden einem Rechenwerk RW zugeführt.

Aus den gemessenen Verschiebungen der Einzelblöcke und/oder aus im gesamten Komplex ermittelten Verschie­ bungsvektoren besonders hervorgehobener Punkte im Grau­wertgebirge, welche sich im vorausgehenden Bild leicht und eindeutig wiederfinden lassen, wird ein Bewegungsgesetz abgeleitet, nach welchem sich alle Bildpunkte des Kom­plexes bewegungskompensiert prädizieren lassen. Nun wird blockweise der Komplex dahingehend untersucht, ob die Prädiktion mit blockweiser oder mit objektbezogener Bewe­gungskompensation besser ist. Dazu muß jeder Block des prädizierten Bildes sowohl mit Hilfe der blockweisen Bewegungskompensation als auch mit Hilfe der objektbezo­genen Bewegungskompensation berechnet werden.

Ein Block des prädizierten Bildes wird mit Hilfe block­weiser Bewegungskompensation dadurch in einfacher Weise gewonnen, daß die Komponenten des für den Block ermittel­ten Verschiebungsvektors auf ganzzahlige Vielfache des Bildpunktabstandes gerundet werden und daß der um diese Verschiebung versetzt gelegene Block im letzten rekonstru­ierten Bild als Block des prädizierten Bildes eingesetzt wird.

Bei objektbezogener Bewegungskompensation werden alle Bildpunkte eines Blockes des prädizierten Bildes dadurch gebildet, daß mit einem Verschiebungsvektor, berechnet gemäß dem für den gesamten Komplex abgeleiteten Bewegungs­gesetz auf mindestens 1/10 Bildpunkte genau, von den Koordinaten des betrachteten Bildpunktes aus ins letzte rekonstruierte Bild gegriffen, dort aus der 2x2-Bildpunkt­umgebung ein Grauwert interpoliert und für den betrachte­ten Bildpunkt des prädizierten Bildes eingesetzt wird.

Schließlich wird für jede der beiden berechneten Versionen eines Blockes des prädizierten Bildes ein Abstandsmaß (Signale 1 und m) ihres Grauwertverlaufs zum Grauwertver­lauf des aktuellen Originalbildes berechnet und die gün­stigere Version gewählt. Die Entscheidung wird anschlie­ßend zugunsten der objektbezogenen Bewegungskompensation mittels der Einrichtung G und der beiden Multiplizierglie­der M1 und M2 gewichtet, da sie selbst bei annähernd gleicher Güte der blockweisen Bewegungskompensation den Vorteil des geringeren Steuerdatenaufwandes und der gerin­geren Artefaktbildung aufweist, wie oben bereits erläu­tert. Die Auswahl erfolgt in der Einheit AW, deren Aus­gangssignal p den Prädikator PR (FIG. 1) steuert und ihm die zur Prädiktion nach Maßgabe der getroffenen Auswahl erforderlichen Daten, z.B. j oder k, zuführt.

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈