Verfahren zur Ermittlung von Prädiktionswerten bei der DPCM-Prädiktionscodierung sowie und Anwendung |
|||||||
申请号 | EP93118117.6 | 申请日 | 1993-11-09 | 公开(公告)号 | EP0599124B1 | 公开(公告)日 | 1999-04-21 |
申请人 | ROBERT BOSCH GMBH; | 发明人 | Mayer, Jörg, Dipl.-Ing.; | ||||
摘要 | |||||||
权利要求 | |||||||
说明书全文 | Die Erfindung betrifft ein Verfahren zur Ermittlung von Prädiktionswerten bei der DPCM-Prädiktionscodierung von Daten, insbesondere Bilddaten, sowie einen Prädiktor und die Anwendung des Verfahrens bzw. des Prädiktors. Zur Datenreduktion von Signalen, insbesondere von Bildsignalen, wird häufig die Differenz-Pulscodemodulation (DPCM) verwendet. DPCM-Coder enthalten üblicherweise eingangsseitig einen Subtrahierer, dessen Minuendeneingang mit dem Eingangssignal-Bildsignal- und dessen Subtrahendeneingang mit einem Prädiktionssignal (Schätzwert) beaufschlagt ist. Dem Subtrahierer ist ein Quantisierer nachgeschaltet, dessen Ausgang den Ausgang des DPCM-Coders bildet. Der Schätzwert wird zusammen mit dem Ausgangssignal des Quantisierers einem Addierer zugeführt, dem ein Prädiktor nachgeschaltet ist. Ein solcher Prädiktor verzögert das Additionssignal um die Länge einer Bildsequenz oder einem Vielfachen davon (DE 37 38 851 Al). Bei einem DPCM-Coder gemäß DE 36 42 394 Al wird ein aktueller Prädiktionswert durch Interpolation aus Abtastwerten gebildet, die drei Abtastintervalle vor bzw. nach diesem liegen. Bei einem eine Kante darstellenden Bildsignal wird der aktuelle Prädiktionswert durch Interpolation aus dem vorangegangenen Abtastwert und dem folgenden Abtastwert ermittelt. Aus der US-A-4255 763 ist ein Verfahren zur Ermittlung von Prädiktionswerten bei einer DPCM-Prädiktionscodierung für Bilddaten bekannt, wobei die Prädiktion kantenadaptiv erfolgt. Dort wird aus zwei zeitlich zurückliegenden Prädiktionswerten ein aktueller Prädiktionswert ermittelt. Die dabei gebildete Differenz wird mit einem Schwellwert als Kantenkriterium verglichen. Es wird zwischen zwei verschiedenen Prädiktionsverfahren umgeschaltet und der jeweils günstigere Prädiktor gewählt. Die DE-A-2432 399 offenbart ein ähnliches DPCM-Prädiktionsverfahren. Zur Prädiktion werden vier zeitlich aufeinanderfolgende Bildpunkte ausgewertet, wobei festgestellt wird, welcher dieser vier Bildpunkte die kleinste zeitliche Differenz zu einem aktuellen Bildpunkt hat. Im Bereich von Kanten erfolgt eine Mitteilung über mehrere Differenzen, die einen gewissen Betrag nicht überschreiten. Aufgabe der Erfindung ist es ein Verfahren für eine verbesserte Prädiktion anzugeben, insbesondere für den Fall, daß aufeinanderfolgende Prädiktionswerte auf den gleichen Prädiktionsfehler führen. Außerdem soll eine Anwendung aufgezeigt werden. Diese Aufgabe wird hinsichtlich des Verfahrens durch die Schritte des Patentanspruchs 1 und hinsichtlich der Anwendung durch den Patentanspruch 7 gelöst. Die weiteren Patentansprüche betreffen Ausgestaltungen des Verfahrens. Die Erfindung beruht auf folgenden Erkenntnissen: Bei der DPCM-Codierung mit nichtlinearer Kennlinie besteht das Problem, daß mittelschnelle Verläufe, wie z.B. Rampen, zu einem großen Prädiktionsfehler führen, der grob quantisiert wird, wenn der lineare Bereich der Kennlinie verlassen wird. Dabei kann es zur Oszillation des Quantisierfehlers zwischen zwei Repräsentativwerten kommen, der sich als Rauschen im dekodierten Signal niederschlägt. Darüber hinaus wird das Maximum der Häufigkeitsverteilung des Quantisierfehlers von 0 weggeschoben, was bei einer eventuellen Huffmann-Codierung von Nachteil ist. Durch die Maßnahmen nach der Erfindung läßt sich die Oszillation des Prädiktionsfehlers wirksam unterdrücken. Die Häufigkeitsverteilung des Prädiktionsfehlers hat bei Null ihren Maximalwert, was für eine Entropiecodierung, z.B. Huffmann-Codierung vorteilhaft ist. Die Erfindung ist insbesondere für "Composite"-Fernsehsignale mit beliebiger Abtastfrequenz geeignet. Der Farbträger läßt sich durch einfache Zusatzmaßnahmen bei der Aufbereitung des Prädiktionsfehlers unterdrücken. Durch die Freiheit bei der Wahl der Abtastfrequenz läßt sich das Prädiktionssignal problemlos in einem Grundcontainer der "Synchronen Digitalen Hierarchie" (SDH) unterbringen, ohne daß der Prädiktionfehler ansteigt. Die Erfindung wird nun anhand von Ausführungsbeispielen erläutert. Es zeigen
Wie Fig. 1 zeigt, ist für eine DPCM-Übertragung eine sendeseitige und eine empfangsseitige Signalaufbereitung vorgesehen. Bei der sendeseitigen Aufbereitung wird ein Quellsignal, z.B. eine Bild - und/oder Tonsequenz, mit einer Abtastfrequenz fT abgetastet. Das abgetastete Quellsignal wird einem Subtrahierer SUB am Minuendeneingang zugeführt. Der Subtrahendeneingang des Subtrahierers SUB wird mit einem Prädiktionssignal, welches von einem Prädiktor PR geliefert wird, beaufschlagt. Am Ausgang des Subtrahierers SUB erscheint dann ein Prädiktionsfehlersignal, welches einem Quantisierer QUA zugeführt wird.Der Quantisierer quantisiert das Prädiktionsfehlersignal gemäß der in Fig. 2 dargestellten Quantisierungskennlinie. Im Bereich kleiner Quantisierungsfehler beispielsweise zwischen 0 und 6 wird linear quantisiert. Für Quantisierungsfehler Dn mit n > 6 wird nur noch grob und nichtlinear quantisiert. Das Ausgangssignal des Quantisierers QUA wird, falls der Quantisierungsfehler übertragen werden soll, einem Kanalcoder KC, z.B. einem Entropiecoder mit Huffmann-Codierung, zugeführt, der neben der DPCM-Codierung eine weitere Datenreduktion erzielt. Das Ausgangssignal des Quantisierers QUA wird über einen Addierer ADD dem Prädiktor PR zugeführt. Dieser Addierer ADD addiert zum Ausgangssignal des Quantisierers das durch den Prädiktor ermittelte Prädiktionssignal. Empfangsseitig muß eine zur sendeseitigen Aufbereitung entsprechende Rückwandlung erfolgen. Dazu ist, wie Fig. 1 zeigt, ein Kanaldecoder KD vorgesehen mit nachgeschaltetem Addierer ADE, der zum empfangenen Prädiktionsfehler den mit einem empfangsseitigen Prädiktor PRE ermittelten Prädiktionswert addiert. Am Ausgang der empfangsseitigen Aufbereitung ist entweder ein D/A-Wandler vorgesehen oder es erfolgt eine digitale Weiterverarbeitung des digitalen Empfangssignals. Die Prädiktoren PR und PRE bestehen aus Verzögerungsgliedern und Verknüpfungsschaltungen, wobei die Verzögerung dieser Verzögerungsglieder gerade so gewählt ist, daß jeweils eine Verzögerung um eine Quellsequenz, z.B. Bilddauer, Halbbilddauer, oder Bildpunktabstand ermöglicht wird. Auf diese Weise können aktuelle Bilder oder Bildpunkte mit vorangehenden Bildern/Bildpunkte verglichen werden und die jeweiligen Änderungen zwischen Bild/Bildpunkt und Folgebildern/Folgebildpunkten, zu einem Prädiktionsfehlersignal aufbereitet werden. Gemäß einem ersten Schrift der Erfindung wird aus mindestens zwei zeitlich zurückliegende Prädiktionswerten Pn-2 und Pn-1,wobei n jeweils die Stelle des aktuellen Bildes/Bildpunktes angibt, ein aktueller Prädiktionswert Pn ermittelt, indem zu einem zeitlich zurückliegenden Prädiktionswert Pn-1 die Differenz aus dem zeitlich zurückliegenden Prädiktionswert Pn-1 und einem zeitlich noch weiter zurückliegenden Prädiktionswert Pn-2 addiert wird. Für den aktuellen Prädiktionswert Pn ergibt sich demnach Pn = 2Pn-1 - Pn-2. Durch diese Art der Aufbereitung des aktuellen Prädiktionswertes läßt sich, wie später noch gezeigt wird, eine Oszillation des Prädiktionsfehlers vermeiden. Falls im Bildsignal jedoch Kanten auftreten, wird diese Art der Prädiktionsfehleraufbereitung durch eine andere Aufbereitung abgelöst, da in diesem Falle große Fehler auftreten würden. Zur Kantenerkennung wird die Differenz aus einem zeitlich zurückliegenden Prädiktionswert Pn-1 und einem zeitlich noch weiter zurückliegenden Prädiktionswert Pn-2 mit einem vorgegebenen Schwellwert T als Kantenkriterium verglichen. Wenn die Differenz Pn-1 - Pn-2 größer wird als der vorgegebene Schwellwert T wird als aktueller Prädiktionswert Pn der zeitlich zurückliegende Prädiktionswert Pn-1 herangezogen. Dieser erste Schritt der Erfindung wird nun weitergebildet insb. durch die Berücksichtigung des Farbträgers, hier des PAL-Farbträgers, einer günstigen und einfachen Kanalcodierung sowie einer vorteilhaften Realisierung der Prädiktoren PR und PRE. Fig. 3 zeigt als Beispiel für ein zu verarbeitendes Quellsignal ein Bildsignal in Form einer Rampe mit einer Periodendauer von 3 µs, die mit einem PAL-Farbträger überlagert ist. Die Abtastfrequenz beträgt fT = 14,14 MHz. Diese Abtastfrequenz ist besonders günstig für die Unterbringung von 2 FBAS-TV Signalen in einem SDH-Grundcontainer. Die Abtastfrequenz von 14,14 MHz ist kein ganzzahliges Vielfaches der PAL Farbträgerfrequenz von 4,434 MHz. Übliche Verfahren verwenden zur Abtastung stets ein ganzzahliges Vielfaches der Farbträgerfrequenz, damit der Prädiktionsfehler gering wird (DE 3642 394 A1, US 4,137,549). Durch eine vorteilhafte Ausbildung des Prädiktors nach der Erfindung kann erreicht werden, daß die Prädiktion nicht durch ein quasi-stationäres Farbhilfsträgersignal gestört wird. Bei Einhaltung der Bedingung: Durch eine erfindungsgemäße adaptive Konturennachführung läßt sich dieses ungünstige Verhalten verbessern. Die adaptive Konturennachführung berücksichtigt zusätzlich zur Farbträgerunterdrückung nach vorgenannter Bedingung die Steigung des Luminanzsignals und kompensiert sie. Hierzu wird das FBAS - Signal mittels eines FIR - Filters mit 3 Anzapfungen und den Koeffizienten 0,36; 0,28 und 0,36 vom Farbhilfsträger befreit. Die Steigung - Schätzwert S(n) - des Luminanzsignals an der Stelle n · S(n) wird durch die Luminanzwerte L(n-2) - L(n-3) angenähert. Zur Berechnung der Steigung sind vier Verzögerungsglieder erforderlich, von denen drei bereits aus der Bedingung der Prädiktion für die Unterdrückung des störenden Einflusses des Farbhilfsträgers bekannt sind : (n - 1), (n-2), (n-3). Damit ergibt sich für den Prädiktor insgesamt folgende Beziehung : Pn = Pn-3 + a (Pn-1 - Pn-2) + b · S(n) oder ausführlich : Pn = Pn-3 + a (Pn-1 - Pn-2) + b [c (Pn-1 - Pn-2 + Pn-3 - Pn-4) + d (Pn-2 - Pn-3)]. Für a = 0,222; b = 2,778; c = 0,36 und d = 0,28 ist der Schätzwert für Pn optimiert. Der Klammerausdruck mit welchem der Gewichtungsfaktor b multipliziert wird stellt die geschätzte Steigung S dar. Sie ist S, wenn gilt 0 ≤ | S(n) | ≤ T. Wie zuvor ausgeführt wird T = 6 gewählt. Dadurch werden Einschwingvorgänge bei großen Sprüngen begrenzt. Fig. 6 zeigt eine mögliche Realisierung eines Prädiktors nach der obigen Bedingung für Pn auf. Die in Kette geschalteten Verzögerungsglieder V1, V2, V3 und V4 verzögern das Eingangssignal Pn jeweils um die Länge τ einer Bilddatensequenz beispielsweise dem Abstand eines Bildpunktes vom vorhergehenden Bildpunkt. Die Subtrahierer SU1, SU2, SU3 bilden die Differenz der Ausgangssignale jeweils benachbarter Verzögerungsglieder. Das Ausgangssignal SU1 wird im Netzwerk VK2 mit dem Faktor a gewichtet und einer ausgangsseitigen Summierstufe VK1 zugeführt. Der Verbindungspunkt zwischen den Verzögerungsgliedern V3 und V4 ist ebenfalls an diese Summierstufe VK1 angeschlossen. Zur Ermittlung des Schätzwertes für die Steigung werden die Ausgangssignale der Subtrahierer SU1 und SU3 im Summierer SV1 miteinander verknüpft. Das Ausgangssignal des Subtrahierers SU2 wird im Netzwerk SV3 mit dem Faktor 0,78 bewertet. Dieser Faktor ergibt sich durch Multiplikation des Faktors b = 2,778 mit dem Faktor d = 0,28. Die Ausgangssignale der Netzwerke SV1 und SV3 werden mittels Addierer SV2 verknüpft und einer Bewertungsschaltung BW zugeführt, die den Schätzwert für die Steigung nur innerhalb des Bereiches 0 ≤ | S(n) | ≤ T bewertet und sonst unterdrückt. Der Schwellwert T wird vorzugsweise im Bereich zwischen 6 und 18 gewählt. Der Ausgang der Bewertungsschaltung BW führt ebenfalls zur ausgangsseitigen Summierstufe VK1, die die Prädiktion für den Subtrahierer SUB gemäß Fig. 1 liefert. Wie Fig. 7 zeigt, schwingt der quantisierte Prädiktionsfehler Dn bei Verwendung des Prädiktors nach Fig. 6 auf 0 ein. Der Störabstand für den Teil der Rampe verbessert sich um 17,2 dB auf 55,7 dB, was dem PCM-Wert entspricht. Wie Fig. 8 zeigt, fällt das Maximum der Häufigkeitsverteilung fK des Prädiktionsfehlers auf 0. Außerdem ist die Häufigkeitsverteilung zu 0 symmetrisch. Eine sich anschließende Entropiecodierung ist so einfach möglich. Das Verfahren nach der Erfindung ist nicht nur auf die Verarbeitung von Bildsignalen und/oder der Unterdrückung des Farbträgers beschränkt. In allen Signalen, in denen Zusatzsignale insbesondere in Frequenzverkämmung eingelagert sind, können bei der DPCM-Codierung die Maßnahmen nach der Erfindung vorteilhaft eingesetzt werden, z.B. bei der Toncodierung für Aufzeichnungszwecke. Die Maßnahmen nach der Erfindung ermöglichen Prädiktionen sowohl in horizontaler Richtung als auch in vertikaler oder zeitlicher Richtung, d.h. beispielsweise Prädiktionen von Bildpunkten, -zeilen (intraframe prediction) oder Bildern (interframe prediction). Die Verzögerungsglieder sowie die Gewichtsfaktoren müssen dafür nur entsprechend angepaßt werden. Für horizontale Richtungen weisen sie Verzögerungszeiten vom Vielfachen des Bildpunktabstandes auf und bei vertikalen Richtungen Verzögerungszeiten von Vielfachen der Zeilendauer. |