Verfahren zur Ermittlung von Prädiktionswerten bei der DPCM-Prädiktionscodierung sowie und Anwendung

申请号 EP93118117.6 申请日 1993-11-09 公开(公告)号 EP0599124B1 公开(公告)日 1999-04-21
申请人 ROBERT BOSCH GMBH; 发明人 Mayer, Jörg, Dipl.-Ing.;
摘要
权利要求 Verfahren zur Ermittlung von Prädiktionswerten bei einer DPCM-Prädiktionscodierung für Daten, insbesondere Bilddaten, mit folgenden Schritten:- aus mindestens drei zeitlich zurückliegenden Prädiktionswerten (Pn-3, Pn-2, Pn-1) wird ein aktueller Prädiktionswert (Pn) ermittelt, indem zu einem zeitlich zurückliegenden Prädiktionswert (Pn-3) die Differenz aus dem zeitlich zurückliegenden Prädiktionswert (Pn-1) und einem zeitlich noch weiter zurückliegenden Prädiktionswert (Pn-2) addiert wird,- die Differenz aus dem zeitlich zurückliegenden Prädiktionswert (Pn-1) und dem zeitlich noch weiter zurückliegenden Prädiktionswert (Pn-2) wird mit einem vorgegebenen Schwellwert (T) als Kantenkriterium verglichen,- wenn die Differenz (Pn-1 - Pn-2) größer wird als der vorgegebene Schwellwert (T) wird als aktueller Prädiktionswert (Pn) der zeitlich zurückliegende Prädiktionswert (Pn-1) herangezogen,- zu einem so ermittelten Prädiktionswert (Pn) wird zusätzlich noch der mit einem Gewichtungsfaktor gewichtete aktuelle Schätzwert (S(n)) für die Steigung eines Datensignals addiert, insbesondere eines Luminanzsignals, welcher aus der Summe der Differenzen jeweils mehrerer zeitlich zurückliegender Prädiktionswerte (Pn-1, Pn-2; Pn-3, Pn-4) gewonnen wird.Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß ein aktueller Prädiktionswert (Pn) nach folgender Beziehung ermittelt wird:
Pn = Pn-3 + a (Pn-1 - Pn-2) + b • S(n), mit S(n) = aktueller Schätzwert für die Steigung eines Datensignals, insbesondere eines Luminanzsignals, welche aus Differenzen mehrerer zeitlich zurückliegender Prädiktionswerte gewonnen wird, n = 1,2,3, ... und a und b = Gewichtungsfaktoren.
Verfahren nach Anspruch 2, gekennzeichnet durch folgende Bedingung für den Schätzwert S(n):
für 0 ≤ | S(n) | ≤ T gilt : S(n) = s(n); S(n) = 0 sonst, wobei T als Schwellwert vorzugsweise im Bereich von 6 bis 18 liegt.
Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß der Schätzwert S(n) folgendermaßen ermittelt wird:
S(n) = c (Pn-1 - Pn-2 + Pn-3 - Pn-4) + d (Pn-2 - Pn-3) mit c und d = Gewichtungsfaktoren.
Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, daß die Gewichtungsfaktoren a und b folgendermaßen gewählt werden:
a = 0,222 und b = 2,778.
Verfahren nach Anspruch 4 oder 5, dadurch gekennzeichnet, daß die Gewichtungsfaktoren c und d folgendermaßen gewählt werden:
c = 0,36 und d = 0,28.
Anwendung des Verfahrens nach einem der Ansprüche 1 bis 6 bei einem Übertragungssystem, insbesondere einem SDH-Systems, dessen Abtastfrequenz kein ganzzahliges Vielfaches der Farbträgerfrequenz ist.
说明书全文

Die Erfindung betrifft ein Verfahren zur Ermittlung von Prädiktionswerten bei der DPCM-Prädiktionscodierung von Daten, insbesondere Bilddaten, sowie einen Prädiktor und die Anwendung des Verfahrens bzw. des Prädiktors.

Zur Datenreduktion von Signalen, insbesondere von Bildsignalen, wird häufig die Differenz-Pulscodemodulation (DPCM) verwendet. DPCM-Coder enthalten üblicherweise eingangsseitig einen Subtrahierer, dessen Minuendeneingang mit dem Eingangssignal-Bildsignal- und dessen Subtrahendeneingang mit einem Prädiktionssignal (Schätzwert) beaufschlagt ist.

Dem Subtrahierer ist ein Quantisierer nachgeschaltet, dessen Ausgang den Ausgang des DPCM-Coders bildet. Der Schätzwert wird zusammen mit dem Ausgangssignal des Quantisierers einem Addierer zugeführt, dem ein Prädiktor nachgeschaltet ist. Ein solcher Prädiktor verzögert das Additionssignal um die Länge einer Bildsequenz oder einem Vielfachen davon (DE 37 38 851 Al). Bei einem DPCM-Coder gemäß DE 36 42 394 Al wird ein aktueller Prädiktionswert durch Interpolation aus Abtastwerten gebildet, die drei Abtastintervalle vor bzw. nach diesem liegen. Bei einem eine Kante darstellenden Bildsignal wird der aktuelle Prädiktionswert durch Interpolation aus dem vorangegangenen Abtastwert und dem folgenden Abtastwert ermittelt.

Aus der US-A-4255 763 ist ein Verfahren zur Ermittlung von Prädiktionswerten bei einer DPCM-Prädiktionscodierung für Bilddaten bekannt, wobei die Prädiktion kantenadaptiv erfolgt. Dort wird aus zwei zeitlich zurückliegenden Prädiktionswerten ein aktueller Prädiktionswert ermittelt. Die dabei gebildete Differenz wird mit einem Schwellwert als Kantenkriterium verglichen. Es wird zwischen zwei verschiedenen Prädiktionsverfahren umgeschaltet und der jeweils günstigere Prädiktor gewählt.

Die DE-A-2432 399 offenbart ein ähnliches DPCM-Prädiktionsverfahren. Zur Prädiktion werden vier zeitlich aufeinanderfolgende Bildpunkte ausgewertet, wobei festgestellt wird, welcher dieser vier Bildpunkte die kleinste zeitliche Differenz zu einem aktuellen Bildpunkt hat. Im Bereich von Kanten erfolgt eine Mitteilung über mehrere Differenzen, die einen gewissen Betrag nicht überschreiten.

Aufgabe der Erfindung ist es ein Verfahren für eine verbesserte Prädiktion anzugeben, insbesondere für den Fall, daß aufeinanderfolgende Prädiktionswerte auf den gleichen Prädiktionsfehler führen. Außerdem soll eine Anwendung aufgezeigt werden. Diese Aufgabe wird hinsichtlich des Verfahrens durch die Schritte des Patentanspruchs 1 und hinsichtlich der Anwendung durch den Patentanspruch 7 gelöst. Die weiteren Patentansprüche betreffen Ausgestaltungen des Verfahrens.

Die Erfindung beruht auf folgenden Erkenntnissen: Bei der DPCM-Codierung mit nichtlinearer Kennlinie besteht das Problem, daß mittelschnelle Verläufe, wie z.B. Rampen, zu einem großen Prädiktionsfehler führen, der grob quantisiert wird, wenn der lineare Bereich der Kennlinie verlassen wird. Dabei kann es zur Oszillation des Quantisierfehlers zwischen zwei Repräsentativwerten kommen, der sich als Rauschen im dekodierten Signal niederschlägt. Darüber hinaus wird das Maximum der Häufigkeitsverteilung des Quantisierfehlers von 0 weggeschoben, was bei einer eventuellen Huffmann-Codierung von Nachteil ist. Durch die Maßnahmen nach der Erfindung läßt sich die Oszillation des Prädiktionsfehlers wirksam unterdrücken. Die Häufigkeitsverteilung des Prädiktionsfehlers hat bei Null ihren Maximalwert, was für eine Entropiecodierung, z.B. Huffmann-Codierung vorteilhaft ist. Die Erfindung ist insbesondere für "Composite"-Fernsehsignale mit beliebiger Abtastfrequenz geeignet. Der Farbträger läßt sich durch einfache Zusatzmaßnahmen bei der Aufbereitung des Prädiktionsfehlers unterdrücken. Durch die Freiheit bei der Wahl der Abtastfrequenz läßt sich das Prädiktionssignal problemlos in einem Grundcontainer der "Synchronen Digitalen Hierarchie" (SDH) unterbringen, ohne daß der Prädiktionfehler ansteigt. Die Erfindung wird nun anhand von Ausführungsbeispielen erläutert.

Es zeigen

  • Fig. 1 das Prinzip der DPCM-Codierung,
  • Fig. 2 eine Quantisierungskennlinie,
  • Fig. 3 ein Bildquellsignal in Form einer Rampe, die mit einem PAL Farbträger überlagert ist,
  • Fig. 4 der quantisierte Prädiktionsfehler ohne die Maßnahmen der Erfindung,
  • Fig. 5 die Häufigkeitsverteilung des Prädiktionsfehlers ohne die Maßnahmen der Erfindung,
  • Fig. 6 eine Realisierung eines Prädiktors nach der Erfindung,
  • Fig. 7 der quantisierte Prädiktionsfehler bei Anwendung der Maßnahmen nach der Erfindung,
  • Fig. 8 die Häufigkeitsverteilung des Prädiktionsfehlers bei Anwendung der Maßnahmen nach der Erfindung.

Wie Fig. 1 zeigt, ist für eine DPCM-Übertragung eine sendeseitige und eine empfangsseitige Signalaufbereitung vorgesehen. Bei der sendeseitigen Aufbereitung wird ein Quellsignal, z.B. eine Bild - und/oder Tonsequenz, mit einer Abtastfrequenz fT abgetastet. Das abgetastete Quellsignal wird einem Subtrahierer SUB am Minuendeneingang zugeführt. Der Subtrahendeneingang des Subtrahierers SUB wird mit einem Prädiktionssignal, welches von einem Prädiktor PR geliefert wird, beaufschlagt. Am Ausgang des Subtrahierers SUB erscheint dann ein Prädiktionsfehlersignal, welches einem Quantisierer QUA zugeführt wird.Der Quantisierer quantisiert das Prädiktionsfehlersignal gemäß der in Fig. 2 dargestellten Quantisierungskennlinie. Im Bereich kleiner Quantisierungsfehler beispielsweise zwischen 0 und 6 wird linear quantisiert. Für Quantisierungsfehler Dn mit n > 6 wird nur noch grob und nichtlinear quantisiert. Das Ausgangssignal des Quantisierers QUA wird, falls der Quantisierungsfehler übertragen werden soll, einem Kanalcoder KC, z.B. einem Entropiecoder mit Huffmann-Codierung, zugeführt, der neben der DPCM-Codierung eine weitere Datenreduktion erzielt.

Das Ausgangssignal des Quantisierers QUA wird über einen Addierer ADD dem Prädiktor PR zugeführt. Dieser Addierer ADD addiert zum Ausgangssignal des Quantisierers das durch den Prädiktor ermittelte Prädiktionssignal. Empfangsseitig muß eine zur sendeseitigen Aufbereitung entsprechende Rückwandlung erfolgen. Dazu ist, wie Fig. 1 zeigt, ein Kanaldecoder KD vorgesehen mit nachgeschaltetem Addierer ADE, der zum empfangenen Prädiktionsfehler den mit einem empfangsseitigen Prädiktor PRE ermittelten Prädiktionswert addiert. Am Ausgang der empfangsseitigen Aufbereitung ist entweder ein D/A-Wandler vorgesehen oder es erfolgt eine digitale Weiterverarbeitung des digitalen Empfangssignals.

Die Prädiktoren PR und PRE bestehen aus Verzögerungsgliedern und Verknüpfungsschaltungen, wobei die Verzögerung dieser Verzögerungsglieder gerade so gewählt ist, daß jeweils eine Verzögerung um eine Quellsequenz, z.B. Bilddauer, Halbbilddauer, oder Bildpunktabstand ermöglicht wird. Auf diese Weise können aktuelle Bilder oder Bildpunkte mit vorangehenden Bildern/Bildpunkte verglichen werden und die jeweiligen Änderungen zwischen Bild/Bildpunkt und Folgebildern/Folgebildpunkten, zu einem Prädiktionsfehlersignal aufbereitet werden. Gemäß einem ersten Schrift der Erfindung wird aus mindestens zwei zeitlich zurückliegende Prädiktionswerten Pn-2 und Pn-1,wobei n jeweils die Stelle des aktuellen Bildes/Bildpunktes angibt, ein aktueller Prädiktionswert Pn ermittelt, indem zu einem zeitlich zurückliegenden Prädiktionswert Pn-1 die Differenz aus dem zeitlich zurückliegenden Prädiktionswert Pn-1 und einem zeitlich noch weiter zurückliegenden Prädiktionswert Pn-2 addiert wird. Für den aktuellen Prädiktionswert Pn ergibt sich demnach Pn = 2Pn-1 - Pn-2. Durch diese Art der Aufbereitung des aktuellen Prädiktionswertes läßt sich, wie später noch gezeigt wird, eine Oszillation des Prädiktionsfehlers vermeiden. Falls im Bildsignal jedoch Kanten auftreten, wird diese Art der Prädiktionsfehleraufbereitung durch eine andere Aufbereitung abgelöst, da in diesem Falle große Fehler auftreten würden. Zur Kantenerkennung wird die Differenz aus einem zeitlich zurückliegenden Prädiktionswert Pn-1 und einem zeitlich noch weiter zurückliegenden Prädiktionswert Pn-2 mit einem vorgegebenen Schwellwert T als Kantenkriterium verglichen. Wenn die Differenz Pn-1 - Pn-2 größer wird als der vorgegebene Schwellwert T wird als aktueller Prädiktionswert Pn der zeitlich zurückliegende Prädiktionswert Pn-1 herangezogen.

Dieser erste Schritt der Erfindung wird nun weitergebildet insb. durch die Berücksichtigung des Farbträgers, hier des PAL-Farbträgers, einer günstigen und einfachen Kanalcodierung sowie einer vorteilhaften Realisierung der Prädiktoren PR und PRE.

Fig. 3 zeigt als Beispiel für ein zu verarbeitendes Quellsignal ein Bildsignal in Form einer Rampe mit einer Periodendauer von 3 µs, die mit einem PAL-Farbträger überlagert ist. Die Abtastfrequenz beträgt fT = 14,14 MHz. Diese Abtastfrequenz ist besonders günstig für die Unterbringung von 2 FBAS-TV Signalen in einem SDH-Grundcontainer. Die Abtastfrequenz von 14,14 MHz ist kein ganzzahliges Vielfaches der PAL Farbträgerfrequenz von 4,434 MHz. Übliche Verfahren verwenden zur Abtastung stets ein ganzzahliges Vielfaches der Farbträgerfrequenz, damit der Prädiktionsfehler gering wird (DE 3642 394 A1, US 4,137,549). Durch eine vorteilhafte Ausbildung des Prädiktors nach der Erfindung kann erreicht werden, daß die Prädiktion nicht durch ein quasi-stationäres Farbhilfsträgersignal gestört wird. Bei Einhaltung der Bedingung:Pn = Pn-3 + 0,222 (Pn-1 - Pn-2) ist der störende Einfluß des Farbhilfsträgers kompensiert, ohne daß dessen Informationsgehalt verloren geht. Der aktuelle Prädiktionswert (Schätzwert) Pn entsteht also aus dem Prädiktionswert für den vorvorletzten Bildpunkt und der mit dem Faktor 0,222 gewichteten Differenz der Prädiktionswerte des letzten und vorletzten Bildpunktes. Diese Bedingung - speziell der Gewichtungsfaktor - gilt natürlich speziell für einen PAL-Farbträger. Bei anderen Fernsehsystemen, z.B. bei NTSC, läßt sich eine solche Unterdrückung von Farbträgerstörungen ebenso ermitteln. Der quantisierte Prädiktionsfehler ist aber trotz vorgenannter Maßnahme noch nicht optimal für eine Übertragung. Wie Fig. 4 zeigt, oszilliert der Prädiktionsfehler Dn bei einer 4,5 Bit Kennlinie mit linearem Bereich von 0...6 und den Grobquantisierungswerten 12,21,34,53,78 (gefaltet und zu Null symmetrisch) nach einer Einschwingphase ab n = 410 zwischen 6 und 12. Daraus ergibt sich für den Bereich des Rampenanstiegs ein Störabstand von 38 5 dB. Die dazugehörige zu Null unsymmetrische Häufigkeitsverteilung fK zeigt Fig. 5.

Durch eine erfindungsgemäße adaptive Konturennachführung läßt sich dieses ungünstige Verhalten verbessern. Die adaptive Konturennachführung berücksichtigt zusätzlich zur Farbträgerunterdrückung nach vorgenannter Bedingung die Steigung des Luminanzsignals und kompensiert sie. Hierzu wird das FBAS - Signal mittels eines FIR - Filters mit 3 Anzapfungen und den Koeffizienten 0,36; 0,28 und 0,36 vom Farbhilfsträger befreit. Die Steigung - Schätzwert S(n) - des Luminanzsignals an der Stelle n · S(n) wird durch die Luminanzwerte L(n-2) - L(n-3) angenähert. Zur Berechnung der Steigung sind vier Verzögerungsglieder erforderlich, von denen drei bereits aus der Bedingung der Prädiktion für die Unterdrückung des störenden Einflusses des Farbhilfsträgers bekannt sind : (n - 1), (n-2), (n-3). Damit ergibt sich für den Prädiktor insgesamt folgende Beziehung :

Pn = Pn-3 + a (Pn-1 - Pn-2) + b · S(n) oder ausführlich :

Pn = Pn-3 + a (Pn-1 - Pn-2) + b [c (Pn-1 - Pn-2 + Pn-3 - Pn-4) + d (Pn-2 - Pn-3)]. Für a = 0,222; b = 2,778; c = 0,36 und d = 0,28 ist der Schätzwert für Pn optimiert. Der Klammerausdruck mit welchem der Gewichtungsfaktor b multipliziert wird stellt die geschätzte Steigung S dar. Sie ist S, wenn gilt 0 ≤ | S(n) | ≤ T.

Wie zuvor ausgeführt wird T = 6 gewählt. Dadurch werden Einschwingvorgänge bei großen Sprüngen begrenzt.

Fig. 6 zeigt eine mögliche Realisierung eines Prädiktors nach der obigen Bedingung für Pn auf. Die in Kette geschalteten Verzögerungsglieder V1, V2, V3 und V4 verzögern das Eingangssignal Pn jeweils um die Länge τ einer Bilddatensequenz beispielsweise dem Abstand eines Bildpunktes vom vorhergehenden Bildpunkt. Die Subtrahierer SU1, SU2, SU3 bilden die Differenz der Ausgangssignale jeweils benachbarter Verzögerungsglieder. Das Ausgangssignal SU1 wird im Netzwerk VK2 mit dem Faktor a gewichtet und einer ausgangsseitigen Summierstufe VK1 zugeführt. Der Verbindungspunkt zwischen den Verzögerungsgliedern V3 und V4 ist ebenfalls an diese Summierstufe VK1 angeschlossen. Zur Ermittlung des Schätzwertes für die Steigung werden die Ausgangssignale der Subtrahierer SU1 und SU3 im Summierer SV1 miteinander verknüpft. Das Ausgangssignal des Subtrahierers SU2 wird im Netzwerk SV3 mit dem Faktor 0,78 bewertet. Dieser Faktor ergibt sich durch Multiplikation des Faktors b = 2,778 mit dem Faktor d = 0,28. Die Ausgangssignale der Netzwerke SV1 und SV3 werden mittels Addierer SV2 verknüpft und einer Bewertungsschaltung BW zugeführt, die den Schätzwert für die Steigung nur innerhalb des Bereiches 0 ≤ | S(n) | ≤ T bewertet und sonst unterdrückt. Der Schwellwert T wird vorzugsweise im Bereich zwischen 6 und 18 gewählt. Der Ausgang der Bewertungsschaltung BW führt ebenfalls zur ausgangsseitigen Summierstufe VK1, die die Prädiktion für den Subtrahierer SUB gemäß Fig. 1 liefert.

Wie Fig. 7 zeigt, schwingt der quantisierte Prädiktionsfehler Dn bei Verwendung des Prädiktors nach Fig. 6 auf 0 ein. Der Störabstand für den Teil der Rampe verbessert sich um 17,2 dB auf 55,7 dB, was dem PCM-Wert entspricht.

Wie Fig. 8 zeigt, fällt das Maximum der Häufigkeitsverteilung fK des Prädiktionsfehlers auf 0. Außerdem ist die Häufigkeitsverteilung zu 0 symmetrisch. Eine sich anschließende Entropiecodierung ist so einfach möglich.

Das Verfahren nach der Erfindung ist nicht nur auf die Verarbeitung von Bildsignalen und/oder der Unterdrückung des Farbträgers beschränkt. In allen Signalen, in denen Zusatzsignale insbesondere in Frequenzverkämmung eingelagert sind, können bei der DPCM-Codierung die Maßnahmen nach der Erfindung vorteilhaft eingesetzt werden, z.B. bei der Toncodierung für Aufzeichnungszwecke.

Die Maßnahmen nach der Erfindung ermöglichen Prädiktionen sowohl in horizontaler Richtung als auch in vertikaler oder zeitlicher Richtung, d.h. beispielsweise Prädiktionen von Bildpunkten, -zeilen (intraframe prediction) oder Bildern (interframe prediction). Die Verzögerungsglieder sowie die Gewichtsfaktoren müssen dafür nur entsprechend angepaßt werden. Für horizontale Richtungen weisen sie Verzögerungszeiten vom Vielfachen des Bildpunktabstandes auf und bei vertikalen Richtungen Verzögerungszeiten von Vielfachen der Zeilendauer.

QQ群二维码
意见反馈