Verfahren zur Ermittlung von Prädiktionswerten bei der DPCM-Prädiktionscodierung sowie Prädiktor und Anwendung

申请号 EP93118117.6 申请日 1993-11-09 公开(公告)号 EP0599124A2 公开(公告)日 1994-06-01
申请人 ROBERT BOSCH GMBH; 发明人 Mayer, Jörg, Dipl.-Ing.;
摘要 Bei der DPCM-Prädiktionscodierung von Bildsequenzen wird der Prädiktionsfehler aus zurückliegenden Prädiktionswerten ermittelt.
Beim Verfahren nach der Erfindung wird im Normalfall ein aktueller Prädiktionswert (P n ) aus einem zeitlich zurückliegenden Prädiktionswert (P n-1 ) und der Differenz aus zwei zurückliegenden Prädiktionswerten (P n-1 ,P n-2 ) ermittelt. Beim Auftreten von Kanten hingegen wird nur ein zurückliegender Prädiktionswert (P n-1 ) herangezogen. Durch diese Maßnahme kann eine Oszillation des Prädiktionsfehlers unterbunden werden.
Das Verfahren nach der Erfindung gestattet darüber hinaus auch, die Abtastfrequenz unabhängig vom Farbträger zu wählen.
权利要求 Verfahren zur Ermittlung von Prädiktionswerten bei einer DPCM-Prädiktionscodierung für Daten, insbesondere Bilddaten, mit folgenden Schritten:- aus zwei zeitlich zurückliegenden Prädiktionswerten (Pn-2, Pn-1) wird ein aktueller Prädiktionswert (Pn) ermittelt, indem zu einem zeitlich zurückliegenden Prädiktionswert (Pn-1) die Differenz aus dem zeitlich zurückliegenden Prädiktionswert (Pn-1) und einem zeitlich noch weiter zurückliegenden Prädiktionswert (Pn-2) addiert wird,- die Differenz aus dem zeitlich zurückliegenden Prädiktionswert (Pn-1) und dem zeitlich noch weiter zurückliegenden Prädiktionswert (Pn-2) wird mit einem vorgegebenen Schwellwert (T) als Kantenkriterium verglichen,- wenn die Differenz (Pn-1 - Pn-2) größer wird als der vorgegebene Schwellwert (T) wird als aktueller Prädiktionswert (Pn) der zeitlich zurückliegende Prädiktionswert (Pn-1) herangezogen.Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß im Falle der Verarbeitung von Farbfernsehbildsignalen durch entsprechende Gewichtung der Differenzen zeitlich zurückliegender Prädiktionswerte (Pn-4, Pn-3, Pn-2, Pn-1) der störende Einfluß des Farbträgers unterdrückt wird.Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß ein aktueller Prädiktionswert (Pn) nach folgender Beziehung ermittelt wird:

Pn = Pn-3 + a (Pn-1 - Pn-2) + b · S(n),

mit S(n) = aktueller Schätzwert für die Steigung eines Datensignals, insbesondere eines Luminanzsignals, welche aus Differenzen zeitlich zurückliegender Prädiktionswerte gewonnen wird,
n = 1,2,3,... und a und b = Gewichtungsfaktoren.
Verfahren nach Anspruch 3, gekennzeichnet durch folgende Bedingung für den Schätzwert S(n) :

für 0 ≦ | S(n) | ≦ T gilt : S(n) = S(n); S(n) = 0 sonst,

wobei T als Schwellwert vorzugsweise im Bereich von 6 bis 18 liegt.
Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß der Schätzwert S(n) folgendermaßen ermittelt wird :

S(n) = c (Pn-1 - Pn-2 + Pn-3 - Pn-4) + d (Pn-2 - Pn-3)

mit c und d = Gewichtungsfaktoren.
Verfahren nach einem der Ansprüche 3 bis 5, dadurch gekennzeichnet, daß die Gewichtungsfaktoren a und b folgendermaßen gewählt werden :
a = 0,222 und b = 2,778.
Verfahren nach Anspruch 5 oder 6, dadurch gekennzeichnet, daß die Gewichtungsfaktoren c und d folgendermaßen gewählt werden :
c = 0,36 und d = 0,28.
Prädiktor für eine DPCM-Prädiktionscodierung, bestehend aus- mindesten vier in Kette geschalteten Verzögerungsgliedern (V1,V2,V3,V4) mit einer Verzögerung (τ) von jeweils der Länge einer Datensequenz, insbesondere Bilddatensequenz oder dem Abstand aufeinanderfolgender Bildpunkte/Bildzeilen,- Subtrahierern (SU1, SU2, SU3) zur Bildung der Differenz jeweils aus den Ausgangssignalen benachbarter Verzögerungsglieder (V1, V2, V3, V4),- einer Verknüpfungsschaltung (SV1, SV2, SV3) für die Ausgänge der Subtrahierer (SU1, SU2, SU3) zur Ermittlung eines Schätzwertes für die Steigung des Datensignals.Prädiktor nach Anspruch 8, insbesondere zur Verarbeitung von Farbfernsehbildsignalen, gekennzeichnet durch eine Verknüpfungsschaltung (VK1, VK2), welche den Schätzwert sowie die zurückliegenden Prädiktionswerte, bzw. deren Differenzen, so verknüpft und bewertet, daß der Farbträger unterdrückt wird.Anwendung des Verfahrens nach einem der Ansprüche 1 bis 7 oder der Anordnung nach einem der Ansprüche 8 und 9 bei einem Übertragungssystem, insbesondere einem SDH-System, dessen Abtastfrequenz kein ganzzahliges Vielfaches der Farbträgerfrequenz ist.
说明书全文

Die Erfindung betrifft ein Verfahren zur Ermittlung von Prädiktionswerten bei der DPCM-Prädiktionscodierung von Daten, insbesondere Bilddaten, sowie einen Prädiktor und die Anwendung des Verfahrens bzw. des Prädiktors.

Zur Datenreduktion von Signalen, insbesondere von Bildsignalen, wird häufig die Differenz-Pulscodemodulation (DPCM) verwendet. DPCM-Coder enthalten üblicherweise eingangsseitig einen Subtrahierer, dessen Minuendeneingang mit dem Eingangssignal-Bildsignal - und dessen Subtrahendeneingang mit einem Prädiktionssignal (Schätzwert) beaufschlagt ist.

Dem Subtrahierer ist ein Quantisierer nachgeschaltet, dessen Ausgang den Ausgang des DPCM-Coders bildet. Der Schätzwert wird zusammen mit dem Ausgangssignal des Quantisierers einem Addierer zugeführt, dem ein Prädiktor nachgeschaltet ist. Ein solcher Prädiktor verzögert das Additionssignal um die Länge einer Bildsequenz oder einem Vielfachen davon (DE 37 38 851 A1). Bei einem DPCM-Coder gemäß DE 36 42 394 A1 wird ein aktueller Prädiktionswert durch Interpolation aus Abtastwerten gebildet, die drei Abtastintervalle vor bzw. nach diesem liegen. Bei einem eine Kante darstellenden Bildsignal wird der aktuelle Prädiktionswert durch Interpolation aus dem vorangegangenen Abtastwert und dem folgenden Abtastwert ermittelt.

Aufgabe der Erfindung ist es ein Verfahren für eine verbesserte Prädiktion anzugeben, insbesondere für den Fall, daß aufeinanderfolgende Prädiktionswerte auf den gleichen Prädiktionsfehler führen. Außerdem soll ein Prädiktor hierzu sowie eine Anwendung aufgezeigt werden. Diese Aufgabe wird hinsichtlich des Verfahrens durch die Schritte des Patentanspruchs 1, hinsichtlich des Prädiktors durch die Merkmale des Patentanspruchs 8 und hinsichtlich der Anwendung durch den Patentanspruch 10 gelöst. Die weiteren Patentansprüche betreffen Ausgestaltungen des Verfahrens bzw. des Prädiktors.

Die Erfindung beruht auf folgenden Erkenntnissen: Bei der DPCM-Codierung mit nichtlinearer Kennlinie besteht das Problem, daß mittelschnelle Verläufe, wie z.B. Rampen, zu einem großen Prädiktionsfehler führen, der grob quantisiert wird, wenn der lineare Bereich der Kennlinie verlassen wird. Dabei kann es zur Oszillation des Quantisierfehlers zwischen zwei Repräsentativwerten kommen, der sich als Rauschen im dekodierten Signal niederschlägt. Darüber hinaus wird das Maximum der Häufigkeitsverteilung des Quantisierfehlers von 0 weggeschoben, was bei einer eventuellen Huffmann-Codierung von Nachteil ist. Durch die Maßnahmen nach der Erfindung läßt sich die Oszillation des Prädiktionsfehlers wirksam unterdrücken. Die Häufigkeitsverteilung des Prädiktionsfehlers hat bei Null ihren Maximalwert, was für eine Entropiecodierung, z.B. Huffmann-Codierung vorteilhaft ist. Die Erfindung ist insbesondere für "Composite"-Fernsehsignale mit beliebiger Abtastfrequenz geeignet. Der Farbträger läßt sich durch einfache Zusatzmaßnahmen bei der Aufbereitung des Prädiktionsfehlers unterdrücken. Durch die Freiheit bei der Wahl der Abtastfrequenz läßt sich das Prädiktionssignal problemlos in einem Grundcontainer der "Synchronen Digitalen Hierarchie" (SDH) unterbringen, ohne daß der Prädiktionsfehler ansteigt. Die Erfindung wird nun anhand von Ausführungsbeispielen erläutert.

Es zeigen

  • Fig. 1 das Prinzip der DPCM-Codierung,
  • Fig. 2 eine Quantisierungskennlinie,
  • Fig. 3 ein Bildquellsignal in Form einer Rampe, die mit einem PAL Farbträger überlagert ist,
  • Fig. 4 der quantisierte Prädiktionsfehler ohne die Maßnahmen der Erfindung,
  • Fig. 5 die Häufigkeitsverteilung des Prädiktionsfehlers ohne die Maßnahmen der Erfindung,
  • Fig. 6 eine Realisierung eines Prädiktors nach der Erfindung,
  • Fig. 7 der quantisierte Prädiktionsfehler bei Anwendung der Maßnahmen nach der Erfindung,
  • Fig. 8 die Häufigkeitsverteilung des Prädiktionsfehlers bei Anwendung der Maßnahmen nach der Erfindung.

Wie Fig. 1 zeigt, ist für eine DPCM-Übertragung eine sendeseitige und eine empfangsseitige Signalaufbereitung vorgesehen. Bei der sendeseitigen Aufbereitung wird ein Quellsignal, z.B. eine Bild - und/oder Tonsequenz, mit einer Abtastfrequenz fT abgetastet. Das abgetastete Quellsignal wird einem Subtrahierer SUB am Minuendeneingang zugeführt. Der Subtrahendeneingang des Subtrahierers SUB wird mit einem Prädiktionssignal, welches von einem Prädiktor PR geliefert wird, beaufschlagt. Am Ausgang des Subtrahierers SUB erscheint dann ein Prädiktionsfehlersignal, welches einem Quantisierer QUA zugeführt wird.Der Quantisierer quantisiert das Prädiktionsfehlersignal gemäß der in Fig. 2 dargestellten Quantisierungskennlinie. Im Bereich kleiner Quantisierungsfehler beispielsweise zwischen 0 und 6 wird linear quantisiert. Für Quantisierungsfehler Dn mit n > 6 wird nur noch grob und nichtlinear quantisiert. Das Ausgangssignal des Quantisierers QUA wird, falls der Quantisierungsfehler übertragen werden soll, einem Kanalcoder KC, z.B. einem Entropiecoder mit Huffmann-Codierung, zugeführt, der neben der DPCM-Codierung eine weitere Datenreduktion erzielt.

Das Ausgangssignal des Quantisierers QUA wird über einen Addierer ADD dem Prädiktor PR zugeführt. Dieser Addierer ADD addiert zum Ausgangssignal des Quantisierers das durch den Prädiktor ermittelte Prädiktionssignal. Empfangsseitig muß eine zur sendeseitigen Aufbereitung entsprechende Rückwandlung erfolgen. Dazu ist, wie Fig. 1 zeigt, ein Kanaldecoder KD vorgesehen mit nachgeschaltetem Addierer ADE, der zum empfangenen Prädiktionsfehler den mit einem empfangsseitigen Prädiktor PRE ermittelten Prädiktionswert addiert. Am Ausgang der empfangsseitigen Aufbereitung ist entweder ein D/A-Wandler vorgesehen oder es erfolgt eine digitale Weiterverarbeitung des digitalen Empfangssignals.

Die Prädiktoren PR und PRE bestehen aus Verzögerungsgliedern und Verknüpfungsschaltungen, wobei die Verzögerung dieser Verzögerungsglieder gerade so gewählt ist, daß jeweils eine Verzögerung um eine Quellsequenz, z.B. Bilddauer, Halbbilddauer, oder Bildpunktabstand ermöglicht wird. Auf diese Weise können aktuelle Bilder oder Bildpunkte mit vorangehenden Bildern/Bildpunkte verglichen werden und die jeweiligen Änderungen zwischen Bild/Bildpunkt und Folgebildern/Folgebildpunkten zu einem Prädiktionsfehlersignal aufbereitet werden. Gemäß der Erfindung wird aus mindestens zwei zeitlich zurückliegende Prädiktionswerten Pn-2 und Pn-1 ,wobei n jeweils die Stelle des aktuellen Bildes/Bildpunktes angibt, ein aktueller Prädiktionswert Pn ermittelt, indem zu einem zeitlich zurückliegenden Prädiktionswert Pn-1 die Differenz aus dem zeitlich zurückliegenden Prädiktionswert Pn-1 und einem zeitlich noch weiter zurückliegenden Prädiktionswert Pn-2 addiert wird. Für den aktuellen Prädiktionswert Pn ergibt sich demnach Pn = 2Pn-1 - Pn-2 . Durch diese Art der Aufbereitung des aktuellen Prädiktionswertes läßt sich, wie später noch gezeigt wird, eine Oszillation des Prädiktionsfehlers vermeiden. Falls im Bildsignal jedoch Kanten auftreten, wird diese Art der Prädiktionsfehleraufbereitung durch eine andere Aufbereitung abgelöst, da in diesem Falle große Fehler auftreten würden. Zur Kantenerkennung wird die Differenz aus einem zeitlich zurückliegenden Prädiktionswert Pn-1 und einem zeitlich noch weiter zurückliegenden Prädiktionswert Pn-2 mit einem vorgegebenen Schwellwert T als Kantenkriterium verglichen. Wenn die Differenz Pn-1 - Pn-2 größer wird als der vorgegebene Schwellwert T wird als aktueller Prädiktionswert Pn der zeitlich zurückliegende Prädiktionswert Pn-1 herangezogen.

Dieses allgemeine Prinzip der Erfindung wird nun vorteilhaft weitergebildet durch die Berücksichtigung des Farbträgers, hier des PAL-Farbträgers, einer günstigen und einfachen Kanalcodierung sowie einer vorteilhaften Realisierung der Prädiktoren PR und PRE.

Fig. 3 zeigt als Beispiel für ein zu verarbeitendes Quellsignal ein Bildsignal in Form einer Rampe mit einer Periodendauer von 3 µs, die mit einem PAL-Farbträger überlagert ist. Die Abtastfrequenz beträgt fT = 14,14 MHz. Diese Abtastfrequenz ist besonders günstig für die Unterbringung von 2 FBAS-TV Signalen in einem SDH-Grundcontainer. Die Abtastfrequenz von 14,14 MHz ist kein ganzzahliges Vielfaches der PAL Farbträgerfrequenz von 4,434 MHz. Übliche Verfahren verwenden zur Abtastung stets ein ganzzahliges Vielfaches der Farbträgerfrequenz, damit der Prädiktionsfehler gering wird (DE 3642 394 A1, US 4,137,549). Durch eine vorteilhafte Ausbildung des Prädiktors nach der Erfindung kann erreicht werden, daß die Prädiktion nicht durch ein quasi-stationäres Farbhilfsträgersignal gestört wird. Bei Einhaltung der Bedingung:



Pn = Pn-3 + 0,222 (Pn-1 - Pn-2)



ist der störende Einfluß des Farbhilfsträgers kompensiert, ohne daß dessen Informationsgehalt verloren geht. Der aktuelle Prädiktionswert (Schätzwert) Pn entsteht also aus dem Prädiktionswert für den vorvorletzten Bildpunkt und der mit dem Faktor 0,222 gewichteten Differenz der Prädiktionswerte des letzten und vorletzten Bildpunktes. Diese Bedingung - speziell der Gewichtungsfaktor - gilt natürlich speziell für einen PAL-Farbträger. Bei anderen Fernsehsystemen, z.B. bei NTSC, läßt sich eine solche Unterdrückung von Farbträgerstörungen ebenso ermitteln. Der quantisierte Prädiktionsfehler ist aber trotz vorgenannter Maßnahme noch nicht optimal für eine Übertragung. Wie Fig. 4 zeigt, oszilliert der Prädiktionsfehler Dn bei einer 4,5 Bit Kennlinie mit linearem Bereich von 0...6 und den Grobquantisierungswerten 12, 21, 34, 53, 78 (gefaltet und zu Null symmetrisch) nach einer Einschwingphase ab n = 410 zwischen 6 und 12. Daraus ergibt sich für den Bereich des Rampenanstiegs ein Störabstand von 38 5 dB. Die dazugehörige zu Null unsymmetrische Häufigkeitsverteilung fK zeigt Fig. 5.

Durch eine erfindungsgemäße adaptive Konturennachführung läßt sich dieses ungünstige Verhalten verbessern. Die adaptive Konturennachführung berücksichtigt zusätzlich zur Farbträgerunterdrückung nach vorgenannter Bedingung die Steigung des Luminanzsignals und kompensiert sie. Hierzu wird das FBAS - Signal mittels eines FIR - Filters mit 3 Anzapfungen und den Koeffizienten 0,36; 0,28 und 0,36 vom Farbhilfsträger befreit. Die Steigung - Schätzwert S(n) - des Luminanzsignals an der Stelle n · S(n) wird durch die Luminanzwerte L(n-2) - L(n-3) angenähert. Zur Berechnung der Steigung sind vier Verzögerungsglieder erforderlich, von denen drei bereits aus der Bedingung der Prädiktion für die Unterdrückung des störenden Einflusses des Farbhilfsträgers bekannt sind : (n - 1), (n-2), (n-3). Damit ergibt sich für den Prädiktor insgesamt folgende Beziehung :

Pn = Pn-3 + a (Pn-1 - Pn-2) + b · S(n) oder ausführlich :

Pn = Pn-3 + a (Pn-1 - Pn-2) + b [c (Pn-1 - Pn-2 + Pn-3 - Pn-4) + d (Pn-2 - Pn-3)] . Für a = 0,222; b = 2,778; c = 0,36 und d = 0,28 ist der Schätzwert für Pn optimiert. Der Klammerausdruck mit welchem der Gewichtungsfaktor b multipliziert wird stellt die geschätzte Steigung S dar. Sie ist S, wenn gilt 0 ≦ | S(n) | ≦ T.

Wie zuvor ausgeführt wird T = 6 gewählt. Dadurch werden Einschwingvorgänge bei großen Sprüngen begrenzt.

Fig. 6 zeigt eine mögliche Realisierung eines Prädiktors nach der obigen Bedingung für Pn auf. Die in Kette geschalteten Verzögerungsglieder V1, V2, V3 und V4 verzögern das Eingangssignal Pn jeweils um die Länge τ einer Bilddatensequenz beispielsweise dem Abstand eines Bildpunktes vom vorhergehenden Bildpunkt. Die Subtrahierer SU1, SU2, SU3 bilden die Differenz der Ausgangssignale jeweils benachbarter Verzögerungsglieder. Das Ausgangssignal SU1 wird im Netzwerk VK2 mit dem Faktor a gewichtet und einer ausgangsseitigen Summierstufe VK1 zugeführt. Der Verbindungspunkt zwischen den Verzögerungsgliedern V3 und V4 ist ebenfalls an diese Summierstufe VK1 angeschlossen. Zur Ermittlung des Schätzwertes für die Steigung werden die Ausgangssignale der Subtrahierer SU1 und SU3 im Summierer SV1 miteinander verknüpft. Das Ausgangssignal des Subtrahierers SU2 wird im Netzwerk SV3 mit dem Faktor 0,78 bewertet. Dieser Faktor ergibt sich durch Multiplikation des Faktors b = 2,778 mit dem Faktor d = 0,28. Die Ausgangssignale der Netzwerke SV1 und SV3 werden mittels Addierer SV2 verknüpft und einer Bewertungsschaltung BW zugeführt, die den Schätzwert für die Steigung nur innerhalb des Bereiches 0 ≦ | S(n) | ≦ T bewertet und sonst unterdrückt. Der Schwellwert T wird vorzugsweise im Bereich zwischen 6 und 18 gewählt. Der Ausgang der Bewertungsschaltung BW führt ebenfalls zur ausgangsseitigen Summierstufe VK1, die die Prädiktion für den Subtrahierer SUB gemäß Fig. 1 liefert.

Wie Fig. 7 zeigt, schwingt der quantisierte Prädiktionsfehler Dn bei Verwendung des Prädiktors nach Fig. 6 auf 0 ein. Der Störabstand für den Teil der Rampe verbessert sich um 17,2 dB auf 55,7 dB, was dem PCM-Wert entspricht.

Wie Fig. 8 zeigt, fällt das Maximum der Häufigkeitsverteilung fK des Prädiktionsfehlers auf 0. Außerdem ist die Häufigkeitsverteilung zu 0 symmetrisch. Eine sich anschließende Entropiecodierung ist so einfach möglich.

Das Verfahren nach der Erfindung ist nicht nur auf die Verarbeitung von Bildsignalen und/oder der Unterdrückung des Farbträgers beschränkt. In allen Signalen, in denen Zusatzsignale insbesondere in Frequenzverkämmung eingelagert sind, können bei der DPCM-Codierung die Maßnahmen nach der Erfindung vorteilhaft eingesetzt werden, z.B. bei der Ioncodierung für Aufzeichnungszwecke. Die Maßnahmen nach der Erfindung ermöglichen Prädiktionen sowohl in horizontaler Richtung als auch in vertikaler oder zeitlicher Richtung, d.h. beispielsweise Prädiktionen von Bildpunkten, -zeilen (intraframe prediction) oder Bildern (interframe prediction). Die Verzögerungsglieder sowie die Gewichtsfaktoren müssen dafür nur entsprechend angepaßt werden. Für horizontale Richtungen weisen sie Verzögerungszeiten vom Vielfachen des Bildpunktabstandes auf und bei vertikalen Richtungen Verzögerungszeiten von Vielfachen der Zeilendauer.

QQ群二维码
意见反馈