首页 / 专利库 / 资料储存系统 / 数据压缩 / 无损压缩 / 熵编码 / Verfahren zur Codierung von Bildsignalen

Verfahren zur Codierung von Bildsignalen

阅读:890发布:2022-10-09

专利汇可以提供Verfahren zur Codierung von Bildsignalen专利检索,专利查询,专利分析的服务。并且Zur Codierung von Bildsignalen, insbesondere für die Farb­einzelbildübertragung, werden Spektralkoeffizienten mittels einer DCT gebildet. Eine Wahrnehmbarkeits-Schwellwertent­scheidung angewendet auf Blöcke dieser Spektralkoeffizienten wird in ihrer Empfindlichkeit in Abhängigkeit des Auftretens von Kantenstrukturen im Bildinhalt gesteuert. Eine Quanti­sierung und eine Entropiecodierung schließt sich an die Schwellwertentscheidung an. Zur Datenreduktion werden den Spektralkoeffizienten blockweise Klassen zugeordnet. Zur Identifizierung der Spektralkoeffizienten zu solchen Klassen genügt die Übertragung einer Klasseninformation.,下面是Verfahren zur Codierung von Bildsignalen专利的具体信息内容。

1. Verfahren zur Codierung von Bildsignalen unter Verwendung einer diskreten Transformation, beispielsweise der Dis­kreten Cosinus Transformation (DCT) zur Bildung von Spek­tralkoeffizienten, wobei Kantenstrukturen festgestellt werden und eine visuelle Wahrnehmbarkeits-Schwellwert­entscheidung vorgenommen wird, gekennzeichnet durch fol­gende Maßnahmen:
- blockweises Aufspalten der Spektralkoeffizienten in Gleich- und Wechselanteile, wobei die Gleichanteile jeweils mittlere Helligkeitswerte bezüglich der Lumi­nanzkomponente und mittlere Farbsättigungswerte be­züglich der Chromakomponenten für jeden Block von Spektralkoeffizienten darstellen und die Wechselanteile die jeweiligen örtlichen Abweichungen von diesen mitt­leren Werten innerhalb eines Blockes bilden,
- Steuern der Schwellwertentscheidung bezüglich der Wechselanteile im Sinne einer Schwellenreduzierung bei der Schwellwertentscheidung, wenn Kantenstrukturen festgestellt wurden,
- Quantisieren der durch die gesteuerte Schwellwertent­scheidung erhaltenen Signale sowie der Gleichanteile,
- Ermitteln von Prädiktionsfehlern für die quantisierten Gleichanteile,
- Aufbereiten von Übertragungsdaten durch Codieren der quantisierten Prädiktionsfehler für die Gleichanteile und Codieren der quantisierten Wechselanteile im Sinne einer Entropiecodierung.
2. Verfahren nach Anspruch 1, gekennzeichnet durch
- Aufbereiten von Zusatzübertragungsdaten, wobei diese Zusatzübertragungsdaten aus Informationen über die Zugehörigkeit der Spektralkoeffizienten eines Blockes zu vorher festgelegten Klassen bestehen,
- Ausdünnen der Übertragungsdaten anhand der Informatio­nen über die Zugehörigkeit der Spektralkoeffizienten zu Klassen derart, daß die Übertragungsdaten nur jene Spektralkoeffizienten in einem Block berücksichtigen, die zu einer festgelegten Klasse gehören.
说明书全文





Die Erfindung betrifft ein Verfahren gemäß dem Oberbegriff des Patentanspruchs 1. Ein solches Verfahren ist bekannt aus "Digital Image Processing, William K. Pratt, Wiley - Inter­science Publication, New York/Chichester/Brisbane/Toronto, Seiten 471-499". Dort werden verschiedene Verfahren zur Erkennung von Kantenstrukturen in Bildsignalen vorgestellt, die einer diskreten Transformation unterzogen wurden. Aus "IEEE Transactions on Communications, Vol.Com-32, No. 3, March 1984, Seiten 225-232" ist es bekannt, Bildsignale einer Diskreten Cosinus Transformation zu unterziehen. Um eine niedrige Codierrate zu erhalten, werden die Transformations­koeffizienten in dem Sinne adaptiv quantisiert, daß Blöcken von Koeffizienten, die große Energieanteile enthalten, mehr Quantisierungsschwellen und Codierbits zugeordnet werden als Blöcken mit geringen Energieanteilen.

Aus "Orthogonal Transforms for Digital Signal Processing, N. Ahmed, K.R. Rao, Springer Verlag, Berlin/Heidelberg/New York, Seiten 225-253", ist es bekannt, Bildsignale zur Datenre­duktion zu klassifizieren.

Aufgabe der Erfindung ist es, das Verfahren ausgehend vom Oberbegriff des Patentanspruchs 1 so auszugestalten, daß eine Einzelbildübertragung, insbesondere eine Farbeinzel­bildübertragung über einen Übertragungskanal mit begrenzter Kapazität ohne Qualitätseinbußen möglich ist. Diese Aufgabe wird durch die Maßnahmen des Patentanspruchs 1 gelöst.

Anspruch 2 zeigt eine vorteilhafte Weiterbildung auf, die die Übertragungsrate erheblich reduziert. Dies ist dadurch möglich, daß für jeden Block eines Bildes ein Satz von Spek­tralkoeffizienten, der zu einer Klasse gehört, ausgewählt wird und für diese Auswahl nur eine Klassenzugehörigkeits­information übertragen werden muß.

Das Verfahren gemäß der Erfindung hat insbesondere den Vor­teil, daß sich das übertragene Einzelbild auf der Empfänger­seite sehr schnell aufbaut (ca. 2 sec bei einer Übertra­gungsrate von 64 kbits/s). Die Datenkompression beim Ver­fahren nach der Erfindung ist so stark, daß die durch­schnittliche Bitrate, die zur Codierung der Farbbilder nötig ist, weniger als 0,7 bit per pel (picture element) beträgt.

Anhand der Zeichnungen wird ein Ausführungsbeispiel der Erfindung nun näher erläutert. Es zeigen

  • Fig. 1 die Verfahrensschritte der Erfindung in einem Ablaufdiagramm,
  • Fig. 2a,b,c Tabellen der Wahrnehmbarkeitsschwellwerte für die einzelnen Bildkomponenten,
  • Fig. 3 das Blockschaltbild eines Prädiktors,
  • Fig. 4 die Anordnung der Referenzwerte für die DC-Prä­diktion,
  • Fig. 5 die Prädiktionskoeffizienten für den DC-Anteil,
  • Fig. 6 einen Übersichtsplan der Kantenerkennung,
  • Fig. 7 die Edgepoint Entscheidung,
  • Fig. 8 den Funktionsablauf der Klassifikation,
  • Fig. 9 eine Wahrheitstabelle zur Klassenselektion be­züglich der I-Komponente,
  • Fig. 10 eine Wahrheitstabelle zur Klassenselektion be­züglich der Q-Komponente,
  • Fig. 11 aus Klassen abgeleitete Terme der Luminanzkompo­nente y,
  • Fig. 12 die Bildung der Kardinalzahlen tkd,
  • Fig. 13 aus Termen gebildete Klasseninformationen cny,
  • Fig. 14 den Ablauf der Blockquantisierung,
  • Fig. 15 den Ablauf der Transmission Coding,
  • Fig. 16 die Entropiecodierung für die Luminanzkompo­nente y,
  • Fig. 17 die Entropiecodierung für die Chromakomponente I,
  • Fig. 18 die Entropiecodierung für die Chromakomponente Q,
  • Fig. 19 die Entropiecodierung für AC-Koeffizienten,
  • Fig. 20 die Codierung der DC Koeffizienten.

Das Ablaufdiagramm gemäß Fig. 1 zeigt die einzelnen Ver­fahrensschritte der Erfindung. Das zur Verfügung stehende Bildsignal wird zuerst in Blöcke zerlegt (Block Decomposi­tion). Die bei der Blockbildung erzeugten Teilbildbereiche werden zweckmäßigerweise gleich groß und quadratisch ge­wählt. Die Teilbildbereiche können durch die Bildelement­werte xi,j vollständig beschrieben werden, wobei i und j Indexvariablen sind, die von 1 bis N laufen. Die Bildele­mente lassen sich durch die Blockfunktion BC (cc, bn, N) darstellen, wobei cc die Luminanzkomponente Y oder die Farbkomponenten I und Q, bn die Blocknummer und N die Größe des Blocks Nx N mit N beispielsweise 8 angibt. Die in Blöcke zerlegten Teilbildbereiche werden nun einer Diskreten Cosi­nus Transformation DCT(Discrete Cosine Transform) unter­zogen. Es entstehen dadurch Spektralkoeffizienten Wk,l mit k und l als Indexvariablen, die von 1 bis N laufen. Parallel zur DCT wird eine Kantenerkennung ED (Edge detection) vor­genommen, die zu Kantenblockinformationen

    eb = ED (xi,j)

führt.

Die DCT Transformation ist hinreichend bekannt, beispiels­weise aus IEEE Transactions on Communications, Vol. COM-32, No. 3, March 1984, Seiten 225 bis 232, so daß an dieser Stelle nicht näher darauf eingegangen wird.

Aus den Speichern einer solchen DCT Transformationseinheit werden Gleich- und Wechselanteile getrennt ausgelesen, d.h. die Spektralkoeffizienten stehen blockweise aufgespalten zur Weiterverarbeitung zur Verfügung. Gleichanteile, nachfolgend mit DC bezeichnet, bedeuten in diesem Zusammenhang jeweils mittlere Helligkeitswerte bezüglich der Luminanzkomponente und mittlere Farbsättigungswerte bezüglich der Chromakompo­nenten für jeden Block von Spektralkoeffizienten. Wechsel­anteile, nachfolgend mit AC bezeichnet, bilden die jeweiligen örtlichen Abweichungen von diesen mittleren Werten innerhalb eines Blockes für jeden Spektralkoeffizienten.

Bezüglich der AC-Anteile erfolgt nun ein Vergleich der Spektralkoeffizienten mit visuellen Wahrnehmbarkeitsschwel­len, die gemäß der Empfindlichkeit des menschlichen Auges gewählt sind, mittels einer Wahrnehmbarkeitsschwellwertent­scheidung (Spectral Thresholding), die sich durch die Be­ziehung

    Ssthk,l = TR(thk,l, Wk,l, cc, eb)

beschreiben läßt.

    sthk,l (supra-threshold information)

wird als Binärwort mit N x N bits als Ausgangssignal abge­geben. Die Wahrnehmbarkeitsschwellwertentscheidung wird von der Kantenerkennung ED in dem Sinne gesteuert, daß eine Schwellwertreduzierung erfolgt, wenn Kantenstrukturen fest­gestellt wurden. Die vorgegebenen Wahrnehmbarkeitsschwell­werte thk,l sind für Luminanz- und Chrominanzkomponenten Y, I, Q jeweils verschieden. Für die Luminanzkomponente muß die Auflösung der Schwellwerte im Gegensatz zu den Chromakompo­nenten relativ hoch sein.

Die Figuren 2a, b und c zeigen die Wahrnehmbarkeitsschwell­werte thk,l für die Y, I, Q-Komponenten eines 8x8 Blockes. Die gekreuzten Stellen bei den Chromakomponenten brauchen nicht berücksichtigt werden, da das menschliche Auge für Farbsignale nicht so empfindlich ist.

Für die DC-Anteile ist eine solche Schwellwertentscheidung im allgemeinen nicht erforderlich, kann jedoch nach Bedarf vorgenommen werden, insbesondere mit fest vorgegebenen Schwellwerten. Die DC-Anteile werden im Ausführungsbeispiel blockweise linear quantisiert - QDC - und anschließend einem Prädiktor zugeführt. Das Blockschaltbild für einen solchen Prädiktor ist in Fig. 3 dargestellt. Ein Prädiktionswert Sʹ wird erhalten durch eine gewichtete Summierung von 3 benach­barten DC-Koeffizienten, die zuvor für die Übertragung be­nutzt wurden. Fig. 4 zeigt schematisch die Anordnung der Referenzwerte A₁, A₂ und A₃ für eine zweidimensionale Prä­diktion der DC-Koeffizienten. Die gekreuzte Stelle ent­spricht dem Prädiktionswert. Die Prädiktionskoeffizienten für A₁, A₂ und A₃ bezüglich der Signalkomponenten Y, I, Q zeigt Fig. 5. Eine Integer(Ganzzahl-)Rundung NINT zur Redun­danzreduktion führt nur zu ganzzahligen Prädiktionsfehlern für die Übertragung. Am Ausgang des Prädiktors ist eine Subtrahierstufe angeordnet, die vom Eingangswert S für die Prädiktion das Ausgangssignal der Rundung subtrahiert.

Für den AC-Anteil wird das Ausgangssignal der Wahrnehmbar­keitsschwellwertentscheidung einer Klassifikation (Classi­fication) unterzogen. Diese Klassifikation läßt sich durch den Ausdruck

    cncc = CL (sthk,l, cc)

beschreiben. Sie ist also von der Supra-threshold-Informa­tion und der Signalkomponente cc abhängig.

cncc bedeutet die Klassennummer einer Signalkomponente. Durch die Klassifikation wird die Zugehörigkeit der Spek­tralkoeffizienten eines Blockes zu vorher festgelegten Klassen beschrieben. Eine ausführliche Behandlung der Klassifikation erfolgt noch an anderer Stelle.

Nach der Klassifikation wird für die AC-Anteile eine Block-­Quantisierung BQ (Block Quantisition) vorgenommen, die zu folgender Beziehung führt:

    Vk,l = BQ (wk,l, thk,l, eb)

Vk,l stellen quantisierte Spektralkoeffizienten dar. Diese Blockquantisierung kann gegebenenfalls auch für den DC-­Anteil vorgenommen werden, wie noch erläutert wird.

Übertragungsdaten werden bezüglich des DC-Anteils durch Codieren der quantisierten Prädiktionsfehler COD-QF aufbe­reitet und bezüglich der AC-Anteile durch Codieren der blockquantisierten Spektralkoeffizienten Vk,l - Transmission Coding. Die Transmission Coding läßt sich durch die Bezie­hung

    h = TC (Vk,l, cncc, cc)

beschreiben. Sie erfolgt im Sinne einer Entropiecodierung. Durch die Klassifikation werden Zusatzübertragungsdaten gewonnen, die die Zugehörigkeit der Spektralkoeffizienten eines Blockes zu vorher festgelegten Klassen kennzeichnen. Durch Übertragen dieser Zusatzdaten können die Übertragungs­daten anhand der Klassenzugehörigkeit ausgedünnt werden; denn für jene Spektralkoeffizienten, die zu einer Klasse gehören, reicht es aus, nur eine Klassenzugehörigkeitsinfor­mation zu übertragen.

Der in Fig. 1 vorgestellte Übersichtsablauf wird nun näher erläutert. Die DCT läßt sich durch folgende Beziehung aus­drücken:

Die Kantenerkennung ist in der DE Patentanmeldung P 35 42 484.2 ausführlich beschrieben, soll hier aber nochmals in allgemeiner Form erläutert werden. Den Übersichtsplan der Kantenerkennung (Edge Detector) zeigt Fig. 6. Zuerst wird ein Operatorfenster definiert (Operator window Definition),

    an,m = OW (xi,j) ,

wobei

    am,n = Xi1,j1

    m = 1, 2, 3

    n = 1, 2, 3

    i1 = i-2+n

    j1 = j-2+m ist,

was einer 3x3 Matrix für Spektralkoeffizienten entspricht. Dieses Operatorfenster wird auf eine "Edgepoint detection" EP abgebildet, derart daß "Edge-point"-Koeffizienten epi,j entstehen.

Die Edgepointdetection läßt sich beschreiben zu:

Anschließend erfolgt eine "Edgepoint"-Entscheidung EPD

    epi,j = EPD (Sm,n)

Diese Entscheidung ist in Fig. 7 dargestellt. Zu jedem epi,j gehört eine Matrix Sm,n (Darstellung ohne s2,2), aus deren Elementen -1 und 1 sich Kantenorientie­rungen in Vielfachen von π/8 vereinbaren lassen. Der zu­gehörige Orientierungswinkel der Kanten (angle of edge) ist in Fig. 7 ebenfalls dargestellt.

Im Ablauf wird nun untersucht, ob alle Edge points abge­arbeitet sind. Ist dies nicht der Fall, wird mit den weite­ren Variablen i,j = 2 ... 7 die Entscheidung nochmals vor­genommen.

Nach der Abarbeitung aller Edgepoints erfolgt eine "Edge­blockdetection"

    eb = EB (epi,j),

die durch folgende Vereinbarungen zu erfolgen hat:

Die Schwellwertentscheidung erfolgt nach folgenden Bezie­hungen:

Die Wahrnehmbarkeitsschwellwerte

    thk,l (eb, cc)

wurden schon in den Figuren 2 a,b,c vorgestellt.

Die Klassifikation ist in der DE P 37 08 288.4 ausführlich beschrieben. Es soll jedoch hier in allgemeiner Form darauf eingegangen werden.

Den Funktionsablauf der Klassifikation zeigt Fig. 8. Zuerst wird in einer Entscheiderstufe auf Chromakomponenten I,Q und Luminanzkomponenten Y hin untersucht. Für die Chromakompo­nenten I,Q wird eine Klassenselektion durchgeführt anhand der Supra-Threshold-Information sthk,l:

    cncc = CS (sthk,l)

Als Klasse cncc als Klassifikation für die Chromakomponenten wird jene ausgewählt, die alle Schwellwertvariablen sthk,l überdeckt. Diese Klassenselektion ist durch die Wahrheits­tabellen gemäß den Figuren 9 und 10 beschreibbar. Fig. 9 zeigt die Klassenselektion cnI für die I-Komponente in Abhängigkeit der Supra-Threshold-Informationen sthk,l und Fig. 10 die entsprechende Klassenselektion cnQ für die Q-­Komponente. Für die Luminanzwerte Y erfolgt die Klassifika­tion in einem dreistufigen Prozeß:

- einer Preprocessing Operation

    thk,l = PO (sthk,l),

die durch folgende Beziehungen beschreibbar ist:hk,l bedeutet eine modifizierte Super-Threshold-Informa­tion,

- einer Termentscheidung

    td = TE (sthk,l)

mit td wird als Termvariable bezeichnet, wobei d eine Index­variable ist, die von 1 bis ta = 18 läuft.9 ist ein Zeilen­index für sth und p ist ein entsprechender Spaltenindex. Fig. 11 zeigt die aus den Klassen abgeleiteten 18 Terme der Luminanzkomponente, wobei die Variablen sthq,p horizontal und die Termnummern td vertikal aufgetragen sind. Die Ab­hängigkeit der Kardinalzahl tkd von den Termen td bei der Entscheidung zeigt Fig. 12,

- einer "Class Approximation"

    cny = AP (td)

Diese "Class Approximation" selektiert die niedrigste Klas­senselektionsnummer cny, die alle Terme td enthält, gemäß Fig. 13.

Wie Fig. 13 zeigt, sind 16 Klassen aus 18 Termen für die Luminanzkomponente gebildet.

Der Ablauf der Blockquantisierung ist in Fig. 14 darge­stellt. Zuerst wird festgestellt, ob ein Edgeblock eb detektiert wurde. Falls dies der Falls ist, wird eine Quantisierung gemäß der Beziehung

    Vk,l = NINT (wk,l / thkl)

vorgenommen. Wenn kein Edgeblock detektiert wurde, wird jeweils der Absolutbetrag der Spektralkoeffizienten mit den Wahrnehmbarkeitsschwellwerten thk,l verglichen. Werden diese Wahrnehmbarkeitsschwellwerte überschritten, erfolgt eben­falls eine Quantisierung nach obiger Beziehung. Andernfalls wird die Quantisierung Vk,l der Spektralkoeffizienten auf 0 gesetzt. Dieser Prozeß wird so lange durchgeführt, bis alle Spektralkoeffizienten quantisiert sind.

Der Ablauf der Transmission Coding ist in Fig. 15 darge­stellt. Zuerst wird auf das Vorhandensein einer Klassen­nummer-Information cn geprüft. Ist eine solche vorhanden, wird eine Entropiecodierung hcn = HC (cny) gemäß den Codiertabellen nach Fig. 16 - Entropiecodierung für die Luminanzkomponente Y in Abhängigkeit der Klassennummer cny-, Fig. 17 - Entropiecodierung für die Chromakomponente I in Abhängigkeit der Klassennummer cnI - und Fig. 18 - Entropie­codierung für die Chromakomponente Q in Abhängigkeit der Klassennummer cnQ - vorgenommen.

Wird keine Klassennummer-Information festgestellt, wird untersucht, ob DC oder AC-Koeffizienten Vdc oder Vac vor­liegen. Beim Auftreten von AC-Koeffizienten wird nach der Beziehung

    hac = HC (Vac)

codiert. Die zugehörige Codiertabelle zeigt Fig. 19. Für die AC-Koeffizienten sind die Absolutbeträge der Ampli­tudenwerte angegeben. Es wird eine Hufmann-Codierung ver­wendet.

Beim Auftreten von DC-Koeffizienten wird eine zweidimen­sionale Prädiktion vorgenommen, wie in Fig. 4 dargestellt. Die zugehörigen Prädiktionskoeffizienten wurden bereits im Zusammenhang mit Fig. 5 erläutert. Nach der Prädiktion erfolgt eine Be­rechnung gemäß:

    Δ = NINT (vʹdc) - dc

mit dc =

Die Codierung

    hdc = HC ( Δ )

wird gemäß der Codiertabelle nach Fig. 20 vorgenommen, die die Prädiktionswertcodierung für I und Q Komponenten zeigt.

Nachdem alle Blöcke codiert sind, wird von der eigentlichen Übertragung noch eine Übertragungsaufbereitung vorgenommen, d.h. eine Zusammenfassung aller codierten Daten zu einem kontinuierlichen Datenstrom (Transmission Sequenzing). Dazu können übliche Multiplextechniken herangezogen werden.

Zur Decodierung der Bilddaten auf der Empfangsseite sind die zuvor aufgeführten Maßnahmen invers auszuführen - inverse DCT, Decodierung gemäß den angeführten Codiertabellen.

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈