Verfahren zur Codierung von Bildsignalen专利检索-熵编码无损压缩数据压缩资料储存系统专利检索查询-专利查询网

Verfahren zur Codierung von Bildsignalen

阅读：890发布：2022-10-09

专利汇可以提供Verfahren zur Codierung von Bildsignalen专利检索，专利查询，专利分析的服务。并且Zur Codierung von Bildsignalen, insbesondere für die Farbeinzelbildübertragung, werden Spektralkoeffizienten mittels einer DCT gebildet. Eine Wahrnehmbarkeits-Schwellwertentscheidung angewendet auf Blöcke dieser Spektralkoeffizienten wird in ihrer Empfindlichkeit in Abhängigkeit des Auftretens von Kantenstrukturen im Bildinhalt gesteuert. Eine Quantisierung und eine Entropiecodierung schließt sich an die Schwellwertentscheidung an. Zur Datenreduktion werden den Spektralkoeffizienten blockweise Klassen zugeordnet. Zur Identifizierung der Spektralkoeffizienten zu solchen Klassen genügt die Übertragung einer Klasseninformation.，下面是Verfahren zur Codierung von Bildsignalen专利的具体信息内容。

权利要求

1. Verfahren zur Codierung von Bildsignalen unter Verwendung einer diskreten Transformation, beispielsweise der Diskreten Cosinus Transformation (DCT) zur Bildung von Spektralkoeffizienten, wobei Kantenstrukturen festgestellt werden und eine visuelle Wahrnehmbarkeits-Schwellwertentscheidung vorgenommen wird, gekennzeichnet durch folgende Maßnahmen:
- blockweises Aufspalten der Spektralkoeffizienten in Gleich- und Wechselanteile, wobei die Gleichanteile jeweils mittlere Helligkeitswerte bezüglich der Luminanzkomponente und mittlere Farbsättigungswerte bezüglich der Chromakomponenten für jeden Block von Spektralkoeffizienten darstellen und die Wechselanteile die jeweiligen örtlichen Abweichungen von diesen mittleren Werten innerhalb eines Blockes bilden,
- Steuern der Schwellwertentscheidung bezüglich der Wechselanteile im Sinne einer Schwellenreduzierung bei der Schwellwertentscheidung, wenn Kantenstrukturen festgestellt wurden,
- Quantisieren der durch die gesteuerte Schwellwertentscheidung erhaltenen Signale sowie der Gleichanteile,
- Ermitteln von Prädiktionsfehlern für die quantisierten Gleichanteile,
- Aufbereiten von Übertragungsdaten durch Codieren der quantisierten Prädiktionsfehler für die Gleichanteile und Codieren der quantisierten Wechselanteile im Sinne einer Entropiecodierung.

2. Verfahren nach Anspruch 1, gekennzeichnet durch
- Aufbereiten von Zusatzübertragungsdaten, wobei diese Zusatzübertragungsdaten aus Informationen über die Zugehörigkeit der Spektralkoeffizienten eines Blockes zu vorher festgelegten Klassen bestehen,
- Ausdünnen der Übertragungsdaten anhand der Informationen über die Zugehörigkeit der Spektralkoeffizienten zu Klassen derart, daß die Übertragungsdaten nur jene Spektralkoeffizienten in einem Block berücksichtigen, die zu einer festgelegten Klasse gehören.

说明书全文

Die Erfindung betrifft ein Verfahren gemäß dem Oberbegriff des Patentanspruchs 1. Ein solches Verfahren ist bekannt aus "Digital Image Processing, William K. Pratt, Wiley - Interscience Publication, New York/Chichester/Brisbane/Toronto, Seiten 471-499". Dort werden verschiedene Verfahren zur Erkennung von Kantenstrukturen in Bildsignalen vorgestellt, die einer diskreten Transformation unterzogen wurden. Aus "IEEE Transactions on Communications, Vol.Com-32, No. 3, March 1984, Seiten 225-232" ist es bekannt, Bildsignale einer Diskreten Cosinus Transformation zu unterziehen. Um eine niedrige Codierrate zu erhalten, werden die Transformationskoeffizienten in dem Sinne adaptiv quantisiert, daß Blöcken von Koeffizienten, die große Energieanteile enthalten, mehr Quantisierungsschwellen und Codierbits zugeordnet werden als Blöcken mit geringen Energieanteilen.

Aus "Orthogonal Transforms for Digital Signal Processing, N. Ahmed, K.R. Rao, Springer Verlag, Berlin/Heidelberg/New York, Seiten 225-253", ist es bekannt, Bildsignale zur Datenreduktion zu klassifizieren.

Aufgabe der Erfindung ist es, das Verfahren ausgehend vom Oberbegriff des Patentanspruchs 1 so auszugestalten, daß eine Einzelbildübertragung, insbesondere eine Farbeinzelbildübertragung über einen Übertragungskanal mit begrenzter Kapazität ohne Qualitätseinbußen möglich ist. Diese Aufgabe wird durch die Maßnahmen des Patentanspruchs 1 gelöst.

Anspruch 2 zeigt eine vorteilhafte Weiterbildung auf, die die Übertragungsrate erheblich reduziert. Dies ist dadurch möglich, daß für jeden Block eines Bildes ein Satz von Spektralkoeffizienten, der zu einer Klasse gehört, ausgewählt wird und für diese Auswahl nur eine Klassenzugehörigkeitsinformation übertragen werden muß.

Das Verfahren gemäß der Erfindung hat insbesondere den Vorteil, daß sich das übertragene Einzelbild auf der Empfängerseite sehr schnell aufbaut (ca. 2 sec bei einer Übertragungsrate von 64 kbits/s). Die Datenkompression beim Verfahren nach der Erfindung ist so stark, daß die durchschnittliche Bitrate, die zur Codierung der Farbbilder nötig ist, weniger als 0,7 bit per pel (picture element) beträgt.

Anhand der Zeichnungen wird ein Ausführungsbeispiel der Erfindung nun näher erläutert. Es zeigen

Fig. 1 die Verfahrensschritte der Erfindung in einem Ablaufdiagramm,

Fig. 2a,b,c Tabellen der Wahrnehmbarkeitsschwellwerte für die einzelnen Bildkomponenten,

Fig. 3 das Blockschaltbild eines Prädiktors,

Fig. 4 die Anordnung der Referenzwerte für die DC-Prädiktion,

Fig. 5 die Prädiktionskoeffizienten für den DC-Anteil,

Fig. 6 einen Übersichtsplan der Kantenerkennung,

Fig. 7 die Edgepoint Entscheidung,

Fig. 8 den Funktionsablauf der Klassifikation,

Fig. 9 eine Wahrheitstabelle zur Klassenselektion bezüglich der I-Komponente,

Fig. 10 eine Wahrheitstabelle zur Klassenselektion bezüglich der Q-Komponente,

Fig. 11 aus Klassen abgeleitete Terme der Luminanzkomponente y,

Fig. 12 die Bildung der Kardinalzahlen tk_d,

Fig. 13 aus Termen gebildete Klasseninformationen cn_y,

Fig. 14 den Ablauf der Blockquantisierung,

Fig. 15 den Ablauf der Transmission Coding,

Fig. 16 die Entropiecodierung für die Luminanzkomponente y,

Fig. 17 die Entropiecodierung für die Chromakomponente I,

Fig. 18 die Entropiecodierung für die Chromakomponente Q,

Fig. 19 die Entropiecodierung für AC-Koeffizienten,

Fig. 20 die Codierung der DC Koeffizienten.

Das Ablaufdiagramm gemäß Fig. 1 zeigt die einzelnen Verfahrensschritte der Erfindung. Das zur Verfügung stehende Bildsignal wird zuerst in Blöcke zerlegt (Block Decomposition). Die bei der Blockbildung erzeugten Teilbildbereiche werden zweckmäßigerweise gleich groß und quadratisch gewählt. Die Teilbildbereiche können durch die Bildelementwerte x_i,j vollständig beschrieben werden, wobei i und j Indexvariablen sind, die von 1 bis N laufen. Die Bildelemente lassen sich durch die Blockfunktion BC (cc, bn, N) darstellen, wobei cc die Luminanzkomponente Y oder die Farbkomponenten I und Q, bn die Blocknummer und N die Größe des Blocks Nx N mit N beispielsweise 8 angibt. Die in Blöcke zerlegten Teilbildbereiche werden nun einer Diskreten Cosinus Transformation DCT(Discrete Cosine Transform) unterzogen. Es entstehen dadurch Spektralkoeffizienten W_k,l mit k und l als Indexvariablen, die von 1 bis N laufen. Parallel zur DCT wird eine Kantenerkennung ED (Edge detection) vorgenommen, die zu Kantenblockinformationen

eb = ED (x_i,j)

führt.

Die DCT Transformation ist hinreichend bekannt, beispielsweise aus IEEE Transactions on Communications, Vol. COM-32, No. 3, March 1984, Seiten 225 bis 232, so daß an dieser Stelle nicht näher darauf eingegangen wird.

Aus den Speichern einer solchen DCT Transformationseinheit werden Gleich- und Wechselanteile getrennt ausgelesen, d.h. die Spektralkoeffizienten stehen blockweise aufgespalten zur Weiterverarbeitung zur Verfügung. Gleichanteile, nachfolgend mit DC bezeichnet, bedeuten in diesem Zusammenhang jeweils mittlere Helligkeitswerte bezüglich der Luminanzkomponente und mittlere Farbsättigungswerte bezüglich der Chromakomponenten für jeden Block von Spektralkoeffizienten. Wechselanteile, nachfolgend mit AC bezeichnet, bilden die jeweiligen örtlichen Abweichungen von diesen mittleren Werten innerhalb eines Blockes für jeden Spektralkoeffizienten.

Bezüglich der AC-Anteile erfolgt nun ein Vergleich der Spektralkoeffizienten mit visuellen Wahrnehmbarkeitsschwellen, die gemäß der Empfindlichkeit des menschlichen Auges gewählt sind, mittels einer Wahrnehmbarkeitsschwellwertentscheidung (Spectral Thresholding), die sich durch die Beziehung

Ssth_k,l = TR(th_k,l, W_k,l, cc, eb)

beschreiben läßt.

sth_k,l (supra-threshold information)

wird als Binärwort mit N x N bits als Ausgangssignal abgegeben. Die Wahrnehmbarkeitsschwellwertentscheidung wird von der Kantenerkennung ED in dem Sinne gesteuert, daß eine Schwellwertreduzierung erfolgt, wenn Kantenstrukturen festgestellt wurden. Die vorgegebenen Wahrnehmbarkeitsschwellwerte th_k,l sind für Luminanz- und Chrominanzkomponenten Y, I, Q jeweils verschieden. Für die Luminanzkomponente muß die Auflösung der Schwellwerte im Gegensatz zu den Chromakomponenten relativ hoch sein.

Die Figuren 2a, b und c zeigen die Wahrnehmbarkeitsschwellwerte th_k,l für die Y, I, Q-Komponenten eines 8x8 Blockes. Die gekreuzten Stellen bei den Chromakomponenten brauchen nicht berücksichtigt werden, da das menschliche Auge für Farbsignale nicht so empfindlich ist.

Für die DC-Anteile ist eine solche Schwellwertentscheidung im allgemeinen nicht erforderlich, kann jedoch nach Bedarf vorgenommen werden, insbesondere mit fest vorgegebenen Schwellwerten. Die DC-Anteile werden im Ausführungsbeispiel blockweise linear quantisiert - QDC - und anschließend einem Prädiktor zugeführt. Das Blockschaltbild für einen solchen Prädiktor ist in Fig. 3 dargestellt. Ein Prädiktionswert Sʹ wird erhalten durch eine gewichtete Summierung von 3 benachbarten DC-Koeffizienten, die zuvor für die Übertragung benutzt wurden. Fig. 4 zeigt schematisch die Anordnung der Referenzwerte A₁, A₂ und A₃ für eine zweidimensionale Prädiktion der DC-Koeffizienten. Die gekreuzte Stelle entspricht dem Prädiktionswert. Die Prädiktionskoeffizienten für A₁, A₂ und A₃ bezüglich der Signalkomponenten Y, I, Q zeigt Fig. 5. Eine Integer(Ganzzahl-)Rundung NINT zur Redundanzreduktion führt nur zu ganzzahligen Prädiktionsfehlern für die Übertragung. Am Ausgang des Prädiktors ist eine Subtrahierstufe angeordnet, die vom Eingangswert S für die Prädiktion das Ausgangssignal der Rundung subtrahiert.

Für den AC-Anteil wird das Ausgangssignal der Wahrnehmbarkeitsschwellwertentscheidung einer Klassifikation (Classification) unterzogen. Diese Klassifikation läßt sich durch den Ausdruck

cn_cc = CL (sth_k,l, cc)

beschreiben. Sie ist also von der Supra-threshold-Information und der Signalkomponente cc abhängig.

cn_cc bedeutet die Klassennummer einer Signalkomponente. Durch die Klassifikation wird die Zugehörigkeit der Spektralkoeffizienten eines Blockes zu vorher festgelegten Klassen beschrieben. Eine ausführliche Behandlung der Klassifikation erfolgt noch an anderer Stelle.

Nach der Klassifikation wird für die AC-Anteile eine Block-Quantisierung BQ (Block Quantisition) vorgenommen, die zu folgender Beziehung führt:

V_k,l = BQ (w_k,l, th_k,l, eb)

V_k,l stellen quantisierte Spektralkoeffizienten dar. Diese Blockquantisierung kann gegebenenfalls auch für den DC-Anteil vorgenommen werden, wie noch erläutert wird.

Übertragungsdaten werden bezüglich des DC-Anteils durch Codieren der quantisierten Prädiktionsfehler COD-QF aufbereitet und bezüglich der AC-Anteile durch Codieren der blockquantisierten Spektralkoeffizienten V_k,l - Transmission Coding. Die Transmission Coding läßt sich durch die Beziehung

h = TC (V_k,l, cn_cc, cc)

beschreiben. Sie erfolgt im Sinne einer Entropiecodierung. Durch die Klassifikation werden Zusatzübertragungsdaten gewonnen, die die Zugehörigkeit der Spektralkoeffizienten eines Blockes zu vorher festgelegten Klassen kennzeichnen. Durch Übertragen dieser Zusatzdaten können die Übertragungsdaten anhand der Klassenzugehörigkeit ausgedünnt werden; denn für jene Spektralkoeffizienten, die zu einer Klasse gehören, reicht es aus, nur eine Klassenzugehörigkeitsinformation zu übertragen.

Der in Fig. 1 vorgestellte Übersichtsablauf wird nun näher erläutert. Die DCT läßt sich durch folgende Beziehung ausdrücken:

Die Kantenerkennung ist in der DE Patentanmeldung P 35 42 484.2 ausführlich beschrieben, soll hier aber nochmals in allgemeiner Form erläutert werden. Den Übersichtsplan der Kantenerkennung (Edge Detector) zeigt Fig. 6. Zuerst wird ein Operatorfenster definiert (Operator window Definition),

a_n,m = OW (x_i,_j) ,

wobei

a_m,n = X_i1,_j1

m = 1, 2, 3

n = 1, 2, 3

i1 = i-2+n

j1 = j-2+m ist,

was einer 3x3 Matrix für Spektralkoeffizienten entspricht. Dieses Operatorfenster wird auf eine "Edgepoint detection" EP abgebildet, derart daß "Edge-point"-Koeffizienten ep_i,j entstehen.

Die Edgepointdetection läßt sich beschreiben zu:

Anschließend erfolgt eine "Edgepoint"-Entscheidung EPD

ep_i,j = EPD (S_m,n)

Diese Entscheidung ist in Fig. 7 dargestellt. Zu jedem ep_i,j gehört eine Matrix S_m,n (Darstellung ohne s_2,2), aus deren Elementen -1 und 1 sich Kantenorientierungen in Vielfachen von π/8 vereinbaren lassen. Der zugehörige Orientierungswinkel der Kanten (angle of edge) ist in Fig. 7 ebenfalls dargestellt.

Im Ablauf wird nun untersucht, ob alle Edge points abgearbeitet sind. Ist dies nicht der Fall, wird mit den weiteren Variablen i,j = 2 ... 7 die Entscheidung nochmals vorgenommen.

Nach der Abarbeitung aller Edgepoints erfolgt eine "Edgeblockdetection"

eb = EB (ep_i,j),

die durch folgende Vereinbarungen zu erfolgen hat:

Die Schwellwertentscheidung erfolgt nach folgenden Beziehungen:

Die Wahrnehmbarkeitsschwellwerte

th_k,l (eb, cc)

wurden schon in den Figuren 2 a,b,c vorgestellt.

Die Klassifikation ist in der DE P 37 08 288.4 ausführlich beschrieben. Es soll jedoch hier in allgemeiner Form darauf eingegangen werden.

Den Funktionsablauf der Klassifikation zeigt Fig. 8. Zuerst wird in einer Entscheiderstufe auf Chromakomponenten I,Q und Luminanzkomponenten Y hin untersucht. Für die Chromakomponenten I,Q wird eine Klassenselektion durchgeführt anhand der Supra-Threshold-Information sth_k,l:

cn_cc = CS (sth_k,l)

Als Klasse cn_cc als Klassifikation für die Chromakomponenten wird jene ausgewählt, die alle Schwellwertvariablen sth_k,l überdeckt. Diese Klassenselektion ist durch die Wahrheitstabellen gemäß den Figuren 9 und 10 beschreibbar. Fig. 9 zeigt die Klassenselektion cn_I für die I-Komponente in Abhängigkeit der Supra-Threshold-Informationen sth_k,l und Fig. 10 die entsprechende Klassenselektion cn_Q für die Q-Komponente. Für die Luminanzwerte Y erfolgt die Klassifikation in einem dreistufigen Prozeß:

- einer Preprocessing Operation

th_k,l = PO (sth_k,l),

die durch folgende Beziehungen beschreibbar ist:h_k,l bedeutet eine modifizierte Super-Threshold-Information,

- einer Termentscheidung

t_d = TE (sth_k,l)

mit t_d wird als Termvariable bezeichnet, wobei d eine Indexvariable ist, die von 1 bis t_a = 18 läuft.9 ist ein Zeilenindex für sth und p ist ein entsprechender Spaltenindex. Fig. 11 zeigt die aus den Klassen abgeleiteten 18 Terme der Luminanzkomponente, wobei die Variablen sth_q,p horizontal und die Termnummern t_d vertikal aufgetragen sind. Die Abhängigkeit der Kardinalzahl t_kd von den Termen t_d bei der Entscheidung zeigt Fig. 12,

- einer "Class Approximation"

cn_y = AP (t_d)

Diese "Class Approximation" selektiert die niedrigste Klassenselektionsnummer cn_y, die alle Terme t_d enthält, gemäß Fig. 13.

Wie Fig. 13 zeigt, sind 16 Klassen aus 18 Termen für die Luminanzkomponente gebildet.

Der Ablauf der Blockquantisierung ist in Fig. 14 dargestellt. Zuerst wird festgestellt, ob ein Edgeblock eb detektiert wurde. Falls dies der Falls ist, wird eine Quantisierung gemäß der Beziehung

V_k,l = NINT (w_k,l / th_kl)

vorgenommen. Wenn kein Edgeblock detektiert wurde, wird jeweils der Absolutbetrag der Spektralkoeffizienten mit den Wahrnehmbarkeitsschwellwerten th_k,l verglichen. Werden diese Wahrnehmbarkeitsschwellwerte überschritten, erfolgt ebenfalls eine Quantisierung nach obiger Beziehung. Andernfalls wird die Quantisierung V_k,l der Spektralkoeffizienten auf 0 gesetzt. Dieser Prozeß wird so lange durchgeführt, bis alle Spektralkoeffizienten quantisiert sind.

Der Ablauf der Transmission Coding ist in Fig. 15 dargestellt. Zuerst wird auf das Vorhandensein einer Klassennummer-Information cn geprüft. Ist eine solche vorhanden, wird eine Entropiecodierung h_cn = HC (cn_y) gemäß den Codiertabellen nach Fig. 16 - Entropiecodierung für die Luminanzkomponente Y in Abhängigkeit der Klassennummer cn_y-, Fig. 17 - Entropiecodierung für die Chromakomponente I in Abhängigkeit der Klassennummer cn_I - und Fig. 18 - Entropiecodierung für die Chromakomponente Q in Abhängigkeit der Klassennummer cn_Q - vorgenommen.

Wird keine Klassennummer-Information festgestellt, wird untersucht, ob DC oder AC-Koeffizienten V_dc oder V_ac vorliegen. Beim Auftreten von AC-Koeffizienten wird nach der Beziehung

h_ac = HC (V_ac)

codiert. Die zugehörige Codiertabelle zeigt Fig. 19. Für die AC-Koeffizienten sind die Absolutbeträge der Amplitudenwerte angegeben. Es wird eine Hufmann-Codierung verwendet.

Beim Auftreten von DC-Koeffizienten wird eine zweidimensionale Prädiktion vorgenommen, wie in Fig. 4 dargestellt. Die zugehörigen Prädiktionskoeffizienten wurden bereits im Zusammenhang mit Fig. 5 erläutert. Nach der Prädiktion erfolgt eine Berechnung gemäß:

Δ = NINT (vʹ_dc) - d_c

mit d_c =

Die Codierung

h_dc = HC ( Δ )

wird gemäß der Codiertabelle nach Fig. 20 vorgenommen, die die Prädiktionswertcodierung für I und Q Komponenten zeigt.

Nachdem alle Blöcke codiert sind, wird von der eigentlichen Übertragung noch eine Übertragungsaufbereitung vorgenommen, d.h. eine Zusammenfassung aller codierten Daten zu einem kontinuierlichen Datenstrom (Transmission Sequenzing). Dazu können übliche Multiplextechniken herangezogen werden.

Zur Decodierung der Bilddaten auf der Empfangsseite sind die zuvor aufgeführten Maßnahmen invers auszuführen - inverse DCT, Decodierung gemäß den angeführten Codiertabellen.

标题	发布/更新时间	阅读量
图像编码装置	2020-05-08	212
基于网络实现注意力机制的图像压缩方法	2020-05-08	330
音频信号的频谱的频谱系数的编码	2020-05-11	449
压缩/解压缩的装置和系统、芯片、电子装置、方法	2020-05-12	463
一种高保真的H.264/AVC视频三系数可逆隐写方法	2020-05-12	561
一种基于视频流的对象识别装置	2020-05-11	916
一种光场焦点堆栈图像序列编、解码方法、装置及系统	2020-05-11	580
插值滤波器的训练方法、装置及视频图像编解码方法、编解码器	2020-05-08	392
深度图像压缩方法及其装置、设备和存储介质	2020-05-08	763
基于Attention机制的训练图片压缩网络的构建方法及系统	2020-05-08	623

Verfahren zur Codierung von Bildsignalen

该功能需要专业版企业版VIP权限，您可以：