专利汇可以提供Verfahren zur Codierung von Bildsignalen专利检索,专利查询,专利分析的服务。并且Zur Codierung von Bildsignalen, insbesondere für die Farbeinzelbildübertragung, werden Spektralkoeffizienten mittels einer DCT gebildet. Eine Wahrnehmbarkeits-Schwellwertentscheidung angewendet auf Blöcke dieser Spektralkoeffizienten wird in ihrer Empfindlichkeit in Abhängigkeit des Auftretens von Kantenstrukturen im Bildinhalt gesteuert. Eine Quantisierung und eine Entropiecodierung schließt sich an die Schwellwertentscheidung an. Zur Datenreduktion werden den Spektralkoeffizienten blockweise Klassen zugeordnet. Zur Identifizierung der Spektralkoeffizienten zu solchen Klassen genügt die Übertragung einer Klasseninformation.,下面是Verfahren zur Codierung von Bildsignalen专利的具体信息内容。
Die Erfindung betrifft ein Verfahren gemäß dem Oberbegriff des Patentanspruchs 1. Ein solches Verfahren ist bekannt aus "Digital Image Processing, William K. Pratt, Wiley - Interscience Publication, New York/Chichester/Brisbane/Toronto, Seiten 471-499". Dort werden verschiedene Verfahren zur Erkennung von Kantenstrukturen in Bildsignalen vorgestellt, die einer diskreten Transformation unterzogen wurden. Aus "IEEE Transactions on Communications, Vol.Com-32, No. 3, March 1984, Seiten 225-232" ist es bekannt, Bildsignale einer Diskreten Cosinus Transformation zu unterziehen. Um eine niedrige Codierrate zu erhalten, werden die Transformationskoeffizienten in dem Sinne adaptiv quantisiert, daß Blöcken von Koeffizienten, die große Energieanteile enthalten, mehr Quantisierungsschwellen und Codierbits zugeordnet werden als Blöcken mit geringen Energieanteilen.
Aus "Orthogonal Transforms for Digital Signal Processing, N. Ahmed, K.R. Rao, Springer Verlag, Berlin/Heidelberg/New York, Seiten 225-253", ist es bekannt, Bildsignale zur Datenreduktion zu klassifizieren.
Aufgabe der Erfindung ist es, das Verfahren ausgehend vom Oberbegriff des Patentanspruchs 1 so auszugestalten, daß eine Einzelbildübertragung, insbesondere eine Farbeinzelbildübertragung über einen Übertragungskanal mit begrenzter Kapazität ohne Qualitätseinbußen möglich ist. Diese Aufgabe wird durch die Maßnahmen des Patentanspruchs 1 gelöst.
Anspruch 2 zeigt eine vorteilhafte Weiterbildung auf, die die Übertragungsrate erheblich reduziert. Dies ist dadurch möglich, daß für jeden Block eines Bildes ein Satz von Spektralkoeffizienten, der zu einer Klasse gehört, ausgewählt wird und für diese Auswahl nur eine Klassenzugehörigkeitsinformation übertragen werden muß.
Das Verfahren gemäß der Erfindung hat insbesondere den Vorteil, daß sich das übertragene Einzelbild auf der Empfängerseite sehr schnell aufbaut (ca. 2 sec bei einer Übertragungsrate von 64 kbits/s). Die Datenkompression beim Verfahren nach der Erfindung ist so stark, daß die durchschnittliche Bitrate, die zur Codierung der Farbbilder nötig ist, weniger als 0,7 bit per pel (picture element) beträgt.
Anhand der Zeichnungen wird ein Ausführungsbeispiel der Erfindung nun näher erläutert. Es zeigen
Das Ablaufdiagramm gemäß Fig. 1 zeigt die einzelnen Verfahrensschritte der Erfindung. Das zur Verfügung stehende Bildsignal wird zuerst in Blöcke zerlegt (Block Decomposition). Die bei der Blockbildung erzeugten Teilbildbereiche werden zweckmäßigerweise gleich groß und quadratisch gewählt. Die Teilbildbereiche können durch die Bildelementwerte xi,j vollständig beschrieben werden, wobei i und j Indexvariablen sind, die von 1 bis N laufen. Die Bildelemente lassen sich durch die Blockfunktion BC (cc, bn, N) darstellen, wobei cc die Luminanzkomponente Y oder die Farbkomponenten I und Q, bn die Blocknummer und N die Größe des Blocks Nx N mit N beispielsweise 8 angibt. Die in Blöcke zerlegten Teilbildbereiche werden nun einer Diskreten Cosinus Transformation DCT(Discrete Cosine Transform) unterzogen. Es entstehen dadurch Spektralkoeffizienten Wk,l mit k und l als Indexvariablen, die von 1 bis N laufen. Parallel zur DCT wird eine Kantenerkennung ED (Edge detection) vorgenommen, die zu Kantenblockinformationen
eb = ED (xi,j)
führt.
Die DCT Transformation ist hinreichend bekannt, beispielsweise aus IEEE Transactions on Communications, Vol. COM-32, No. 3, March 1984, Seiten 225 bis 232, so daß an dieser Stelle nicht näher darauf eingegangen wird.
Aus den Speichern einer solchen DCT Transformationseinheit werden Gleich- und Wechselanteile getrennt ausgelesen, d.h. die Spektralkoeffizienten stehen blockweise aufgespalten zur Weiterverarbeitung zur Verfügung. Gleichanteile, nachfolgend mit DC bezeichnet, bedeuten in diesem Zusammenhang jeweils mittlere Helligkeitswerte bezüglich der Luminanzkomponente und mittlere Farbsättigungswerte bezüglich der Chromakomponenten für jeden Block von Spektralkoeffizienten. Wechselanteile, nachfolgend mit AC bezeichnet, bilden die jeweiligen örtlichen Abweichungen von diesen mittleren Werten innerhalb eines Blockes für jeden Spektralkoeffizienten.
Bezüglich der AC-Anteile erfolgt nun ein Vergleich der Spektralkoeffizienten mit visuellen Wahrnehmbarkeitsschwellen, die gemäß der Empfindlichkeit des menschlichen Auges gewählt sind, mittels einer Wahrnehmbarkeitsschwellwertentscheidung (Spectral Thresholding), die sich durch die Beziehung
Ssthk,l = TR(thk,l, Wk,l, cc, eb)
beschreiben läßt.
sthk,l (supra-threshold information)
wird als Binärwort mit N x N bits als Ausgangssignal abgegeben. Die Wahrnehmbarkeitsschwellwertentscheidung wird von der Kantenerkennung ED in dem Sinne gesteuert, daß eine Schwellwertreduzierung erfolgt, wenn Kantenstrukturen festgestellt wurden. Die vorgegebenen Wahrnehmbarkeitsschwellwerte thk,l sind für Luminanz- und Chrominanzkomponenten Y, I, Q jeweils verschieden. Für die Luminanzkomponente muß die Auflösung der Schwellwerte im Gegensatz zu den Chromakomponenten relativ hoch sein.
Die Figuren 2a, b und c zeigen die Wahrnehmbarkeitsschwellwerte thk,l für die Y, I, Q-Komponenten eines 8x8 Blockes. Die gekreuzten Stellen bei den Chromakomponenten brauchen nicht berücksichtigt werden, da das menschliche Auge für Farbsignale nicht so empfindlich ist.
Für die DC-Anteile ist eine solche Schwellwertentscheidung im allgemeinen nicht erforderlich, kann jedoch nach Bedarf vorgenommen werden, insbesondere mit fest vorgegebenen Schwellwerten. Die DC-Anteile werden im Ausführungsbeispiel blockweise linear quantisiert - QDC - und anschließend einem Prädiktor zugeführt. Das Blockschaltbild für einen solchen Prädiktor ist in Fig. 3 dargestellt. Ein Prädiktionswert Sʹ wird erhalten durch eine gewichtete Summierung von 3 benachbarten DC-Koeffizienten, die zuvor für die Übertragung benutzt wurden. Fig. 4 zeigt schematisch die Anordnung der Referenzwerte A₁, A₂ und A₃ für eine zweidimensionale Prädiktion der DC-Koeffizienten. Die gekreuzte Stelle entspricht dem Prädiktionswert. Die Prädiktionskoeffizienten für A₁, A₂ und A₃ bezüglich der Signalkomponenten Y, I, Q zeigt Fig. 5. Eine Integer(Ganzzahl-)Rundung NINT zur Redundanzreduktion führt nur zu ganzzahligen Prädiktionsfehlern für die Übertragung. Am Ausgang des Prädiktors ist eine Subtrahierstufe angeordnet, die vom Eingangswert S für die Prädiktion das Ausgangssignal der Rundung subtrahiert.
Für den AC-Anteil wird das Ausgangssignal der Wahrnehmbarkeitsschwellwertentscheidung einer Klassifikation (Classification) unterzogen. Diese Klassifikation läßt sich durch den Ausdruck
cncc = CL (sthk,l, cc)
beschreiben. Sie ist also von der Supra-threshold-Information und der Signalkomponente cc abhängig.
cncc bedeutet die Klassennummer einer Signalkomponente. Durch die Klassifikation wird die Zugehörigkeit der Spektralkoeffizienten eines Blockes zu vorher festgelegten Klassen beschrieben. Eine ausführliche Behandlung der Klassifikation erfolgt noch an anderer Stelle.
Nach der Klassifikation wird für die AC-Anteile eine Block-Quantisierung BQ (Block Quantisition) vorgenommen, die zu folgender Beziehung führt:
Vk,l = BQ (wk,l, thk,l, eb)
Vk,l stellen quantisierte Spektralkoeffizienten dar. Diese Blockquantisierung kann gegebenenfalls auch für den DC-Anteil vorgenommen werden, wie noch erläutert wird.
Übertragungsdaten werden bezüglich des DC-Anteils durch Codieren der quantisierten Prädiktionsfehler COD-QF aufbereitet und bezüglich der AC-Anteile durch Codieren der blockquantisierten Spektralkoeffizienten Vk,l - Transmission Coding. Die Transmission Coding läßt sich durch die Beziehung
h = TC (Vk,l, cncc, cc)
beschreiben. Sie erfolgt im Sinne einer Entropiecodierung. Durch die Klassifikation werden Zusatzübertragungsdaten gewonnen, die die Zugehörigkeit der Spektralkoeffizienten eines Blockes zu vorher festgelegten Klassen kennzeichnen. Durch Übertragen dieser Zusatzdaten können die Übertragungsdaten anhand der Klassenzugehörigkeit ausgedünnt werden; denn für jene Spektralkoeffizienten, die zu einer Klasse gehören, reicht es aus, nur eine Klassenzugehörigkeitsinformation zu übertragen.
Der in Fig. 1 vorgestellte Übersichtsablauf wird nun näher erläutert. Die DCT läßt sich durch folgende Beziehung ausdrücken:
Die Kantenerkennung ist in der DE Patentanmeldung P 35 42 484.2 ausführlich beschrieben, soll hier aber nochmals in allgemeiner Form erläutert werden. Den Übersichtsplan der Kantenerkennung (Edge Detector) zeigt Fig. 6. Zuerst wird ein Operatorfenster definiert (Operator window Definition),
an,m = OW (xi,j) ,
wobei
am,n = Xi1,j1
m = 1, 2, 3
n = 1, 2, 3
i1 = i-2+n
j1 = j-2+m ist,
was einer 3x3 Matrix für Spektralkoeffizienten entspricht. Dieses Operatorfenster wird auf eine "Edgepoint detection" EP abgebildet, derart daß "Edge-point"-Koeffizienten epi,j entstehen.
Die Edgepointdetection läßt sich beschreiben zu:
Anschließend erfolgt eine "Edgepoint"-Entscheidung EPD
epi,j = EPD (Sm,n)
Diese Entscheidung ist in Fig. 7 dargestellt. Zu jedem epi,j gehört eine Matrix Sm,n (Darstellung ohne s2,2), aus deren Elementen -1 und 1 sich Kantenorientierungen in Vielfachen von π/8 vereinbaren lassen. Der zugehörige Orientierungswinkel der Kanten (angle of edge) ist in Fig. 7 ebenfalls dargestellt.
Im Ablauf wird nun untersucht, ob alle Edge points abgearbeitet sind. Ist dies nicht der Fall, wird mit den weiteren Variablen i,j = 2 ... 7 die Entscheidung nochmals vorgenommen.
Nach der Abarbeitung aller Edgepoints erfolgt eine "Edgeblockdetection"
eb = EB (epi,j),
die durch folgende Vereinbarungen zu erfolgen hat:
Die Schwellwertentscheidung erfolgt nach folgenden Beziehungen:
Die Wahrnehmbarkeitsschwellwerte
thk,l (eb, cc)
wurden schon in den Figuren 2 a,b,c vorgestellt.
Die Klassifikation ist in der DE P 37 08 288.4 ausführlich beschrieben. Es soll jedoch hier in allgemeiner Form darauf eingegangen werden.
Den Funktionsablauf der Klassifikation zeigt Fig. 8. Zuerst wird in einer Entscheiderstufe auf Chromakomponenten I,Q und Luminanzkomponenten Y hin untersucht. Für die Chromakomponenten I,Q wird eine Klassenselektion durchgeführt anhand der Supra-Threshold-Information sthk,l:
cncc = CS (sthk,l)
Als Klasse cncc als Klassifikation für die Chromakomponenten wird jene ausgewählt, die alle Schwellwertvariablen sthk,l überdeckt. Diese Klassenselektion ist durch die Wahrheitstabellen gemäß den Figuren 9 und 10 beschreibbar. Fig. 9 zeigt die Klassenselektion cnI für die I-Komponente in Abhängigkeit der Supra-Threshold-Informationen sthk,l und Fig. 10 die entsprechende Klassenselektion cnQ für die Q-Komponente. Für die Luminanzwerte Y erfolgt die Klassifikation in einem dreistufigen Prozeß:
- einer Preprocessing Operation
thk,l = PO (sthk,l),
die durch folgende Beziehungen beschreibbar ist:
- einer Termentscheidung
td = TE (sthk,l)
mit
- einer "Class Approximation"
cny = AP (td)
Diese "Class Approximation" selektiert die niedrigste Klassenselektionsnummer cny, die alle Terme td enthält, gemäß Fig. 13.
Wie Fig. 13 zeigt, sind 16 Klassen aus 18 Termen für die Luminanzkomponente gebildet.
Der Ablauf der Blockquantisierung ist in Fig. 14 dargestellt. Zuerst wird festgestellt, ob ein Edgeblock eb detektiert wurde. Falls dies der Falls ist, wird eine Quantisierung gemäß der Beziehung
Vk,l = NINT (wk,l / thkl)
vorgenommen. Wenn kein Edgeblock detektiert wurde, wird jeweils der Absolutbetrag der Spektralkoeffizienten mit den Wahrnehmbarkeitsschwellwerten thk,l verglichen. Werden diese Wahrnehmbarkeitsschwellwerte überschritten, erfolgt ebenfalls eine Quantisierung nach obiger Beziehung. Andernfalls wird die Quantisierung Vk,l der Spektralkoeffizienten auf 0 gesetzt. Dieser Prozeß wird so lange durchgeführt, bis alle Spektralkoeffizienten quantisiert sind.
Der Ablauf der Transmission Coding ist in Fig. 15 dargestellt. Zuerst wird auf das Vorhandensein einer Klassennummer-Information cn geprüft. Ist eine solche vorhanden, wird eine Entropiecodierung hcn = HC (cny) gemäß den Codiertabellen nach Fig. 16 - Entropiecodierung für die Luminanzkomponente Y in Abhängigkeit der Klassennummer cny-, Fig. 17 - Entropiecodierung für die Chromakomponente I in Abhängigkeit der Klassennummer cnI - und Fig. 18 - Entropiecodierung für die Chromakomponente Q in Abhängigkeit der Klassennummer cnQ - vorgenommen.
Wird keine Klassennummer-Information festgestellt, wird untersucht, ob DC oder AC-Koeffizienten Vdc oder Vac vorliegen. Beim Auftreten von AC-Koeffizienten wird nach der Beziehung
hac = HC (Vac)
codiert. Die zugehörige Codiertabelle zeigt Fig. 19. Für die AC-Koeffizienten sind die Absolutbeträge der Amplitudenwerte angegeben. Es wird eine Hufmann-Codierung verwendet.
Beim Auftreten von DC-Koeffizienten wird eine zweidimensionale Prädiktion
Δ = NINT (vʹdc) - dc
mit dc =
Die Codierung
hdc = HC ( Δ )
wird gemäß der Codiertabelle nach Fig. 20 vorgenommen, die die Prädiktionswertcodierung für I und Q Komponenten zeigt.
Nachdem alle Blöcke codiert sind, wird von der eigentlichen Übertragung noch eine Übertragungsaufbereitung vorgenommen, d.h. eine Zusammenfassung aller codierten Daten zu einem kontinuierlichen Datenstrom (Transmission Sequenzing). Dazu können übliche Multiplextechniken herangezogen werden.
Zur Decodierung der Bilddaten auf der Empfangsseite sind die zuvor aufgeführten Maßnahmen invers auszuführen - inverse DCT, Decodierung gemäß den angeführten Codiertabellen.
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
图像编码装置 | 2020-05-08 | 212 |
基于网络实现注意力机制的图像压缩方法 | 2020-05-08 | 330 |
音频信号的频谱的频谱系数的编码 | 2020-05-11 | 449 |
压缩/解压缩的装置和系统、芯片、电子装置、方法 | 2020-05-12 | 463 |
一种高保真的H.264/AVC视频三系数可逆隐写方法 | 2020-05-12 | 561 |
一种基于视频流的对象识别装置 | 2020-05-11 | 916 |
一种光场焦点堆栈图像序列编、解码方法、装置及系统 | 2020-05-11 | 580 |
插值滤波器的训练方法、装置及视频图像编解码方法、编解码器 | 2020-05-08 | 392 |
深度图像压缩方法及其装置、设备和存储介质 | 2020-05-08 | 763 |
基于Attention机制的训练图片压缩网络的构建方法及系统 | 2020-05-08 | 623 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。