Codage/décodage perfectionnés de signaux numériques, en particulier en quantification vectorielle avec codes à permutation |
|||||||
申请号 | EP08165511.0 | 申请日 | 2007-02-13 | 公开(公告)号 | EP2009801A2 | 公开(公告)日 | 2008-12-31 |
申请人 | France Télécom; | 发明人 | Ragot, Stéphane; Lamblin, Claude; | ||||
摘要 | L'invention concerne le codage/décodage de signaux numériques, utilisant en particulier des codes à permutation faisant intervenir un calcul d'expressions combinatoires. Selon l'invention, ces expressions combinatoires sont représentées par des décompositions en puissances de facteurs premiers, et déterminées par une lecture mémoire de représentations préenregistrées de décompositions de nombres entiers choisis. | ||||||
权利要求 | |||||||
说明书全文 | La présente invention concerne le codage/décodage de signaux numériques tels que des signaux audio, vidéo, et plus généralement les signaux multimédia pour leur stockage ou leur transmission. Elle propose en particulier une solution aux problèmes que posent le codage et le décodage de codes à permutations. Typiquement, la présente invention s'applique aussi au dual du codage de source : le codage canal ou "modulation". Le codage/décodage en compression de signaux numériques au sens de l'invention peut être très utile pour la quantification des coefficients de transformée des codeurs fréquentiels des signaux de parole et/ou audio. Une solution très répandue en compression des signaux numériques est la quantification vectorielle. La quantification vectorielle représente un vecteur d'entrée par un vecteur de même dimension choisi dans un ensemble fini. Un quantificateur à M niveaux (ou "vecteurs-codes") est une application non bijective de l'ensemble des vecteurs d'entrée, généralement l'espace réel euclidien à n dimensions R n ou un sous-ensemble de R n dans un sous-ensemble fini Y de R n à M éléments distincts: Y= {y0, y1,... yM-1}. Y est appelé alphabet de reproduction ou "dictionnaire" ou encore "répertoire", et ses éléments des vecteurs-codes, des "mots de code" (ou "points de sortie" ou encore "représentants"). Le débit par dimension r du quantificateur (ou sa "résolution") est défini par la relation : En quantification vectorielle, un bloc de n échantillons est traité comme un vecteur de dimension n. Selon la théorie du codage de source, quand la dimension devient très grande, la performance de la quantification vectorielle approche la borne de débit-distorsion de la source. Les dictionnaires de quantificateurs vectoriels peuvent être conçus à partir de méthodes statistiques telles que l'algorithme de Lloyd généralisé (ou "GLA" pour "Generalized Lloyd Algorithm"), basé sur les conditions nécessaires d'optimalité d'un quantificateur vectoriel. Les quantificateurs vectoriels statistiques ainsi obtenus ne possèdent aucune structure, ce qui rend leur exploration coûteuse en ressources de calculs et de stockage, car la complexité tant du codage que du stockage est proportionnelle à n2nr. En référence à la En modulation, on retrouve les trois opérations OP1, OP2 et OP3 de la La croissance exponentielle de la complexité, en fonction de la dimension des vecteurs et du débit, limite l'emploi des quantificateurs vectoriels non structurés à de faibles dimensions et/ou des bas débits pour pouvoir les mettre en oeuvre en temps réel. Pour un quantificateur vectoriel non structuré, la recherche du plus proche voisin (opération OP1) requiert une recherche exhaustive parmi tous les éléments du dictionnaire pour sélectionner l'élément du dictionnaire qui minimise une mesure de distance entre lui et le vecteur d'entrée. Les deux dernières opérations (indexation OP2 et opération inverse OP3) s'effectuent en général par de simples lectures de tables mais sont néanmoins coûteuses en espace mémoire. Pour s'affranchir des contraintes de taille et de dimension, plusieurs variantes de la quantification vectorielle de base ont été étudiées. Elles tentent de remédier à l'absence de structure du dictionnaire et parviennent ainsi à réduire la complexité, mais au détriment de la qualité. Cependant, le compromis performance/complexité est amélioré, ce qui permet d'accroître la plage des résolutions et/ou des dimensions sur laquelle la quantification vectorielle peut être appliquée efficacement en coût. Beaucoup de schémas de quantificateurs vectoriels structurés ont été proposés et, en particulier, le quantificateur vectoriel mettant en oeuvre un "code à permutation" présenté ci-après. Dans le quantificateur vectoriel "code à permutation", les vecteurs-codes sont obtenus par permutations des composantes du premier vecteur-code (au sens de l'ordre lexicographique) appelé "leader" (ou encore "vecteur-directeur"). Ces composantes prennent leurs valeurs dans un alphabet A = {a0, a1, ..., aq-1} de taille q (alphabet A q-aire tel que ai ≠ aj pour i ≠ j). Les composantes ai sont des réels (ou entiers). Le poids wi (où i est un indice allant de 0 à q-1) est le nombre de répétitions de la lettre ai de l'alphabet. Les poids wi sont des entiers positifs tels que On comprend qu'un ordre différent des composantes pourrait être choisi, par exemple a0 < a1 <... < aq-1. Le vecteur leader est appelé "leader signé" et le code à permutation est dit "de type I". Les autres vecteurs-codes sont obtenus par permutations des composantes de y0. Le nombre total M de permutations est : Il existe un autre type de code à permutation (type II). Le vecteur leader a encore la même forme que précédemment mais ses composantes doivent être positives (a0 > a1 >...> aq-1 ≥ 0). Les autres vecteurs-codes sont aussi obtenus par permutations des composantes de y0 en leur assignant toutes les combinaisons de signes possibles. Le nombre total M de permutations est : avec h=n si aq-1>0 et h = n-wq-1 sinon. Dans ce cas, le vecteur-leader est aussi appelé leader absolu. Le quantificateur vectoriel "code à permutation" a été étendu à la composée (ou l'union) de codes à permutation et récemment, cette structure en union de codes à permutation a été généralisée à la quantification vectorielle à dimension et résolution variables (dans le document L'exploitation de la structure à code permutation permet le développement d'algorithmes de recherche du plus proche voisin (opération OP1 sur la Il existe plusieurs façons d'énumérer les permutations. L'algorithme de Schalkwijk constitue l'une de ces façons:
Utilisant l'analyse combinatoire, ces techniques permettent d'indexer un vecteur-code d'un code à permutation (opération OP2) et aussi d'effectuer l'opération inverse-décodage de l'indice (opération OP3). Parmi les algorithmes d'indexation des permutations, on rappelle ci-dessous l'algorithme de Schalkwijk communément utilisé, par exemple dans les normes :
On cherche à ordonner et indexer toutes les permutations possibles des composantes du vecteur y = (y0,y1···,yn-1). L'ordre est lexicographique et l'indice est appelé ici "rang". Calculer le rang du vecteur y revient à calculer le rang du vecteur D =(d0,d1···,dn-1) associé à y, et tel que dk vaut une valeur d'indice d si et seulement si yk = ad. Par exemple, un vecteur y, de dimension n=8, a les composantes suivantes : L'alphabet à q = 3 lettres (composantes de valeurs différentes) est donné par A = {4, 2, 0} avec a0 = 4, a1 = 2 et a2 = 0. On associe alors au vecteur y le vecteur D = (0, 1, 0, 2, 2, 0, 0, 1) dont les composantes sont simplement les indices des q lettres de l'alphabet A. Les rangs de y et D sont identiques, mais la définition du vecteur D permet de se ramener au calcul du rang d'une séquence D ayant ses valeurs dans un ensemble {0, 1, ..., q-1} (comportant le même nombre d'éléments que l'alphabet {a0, a1, ..., aq-1}). Les poids des vecteurs y et D sont identiques puisque les occurrences de leurs composantes respectives sont identiques. On définit également le poids intermédiaire où δ(x,y) est l'opérateur de Kronecker (δ(x,y)=1 si x=y et 0 sinon). On a : Le rang t du vecteur y peut être calculé, en analyse combinatoire, par la formule : Cette formule peut être simplifiée ainsi : C'est cette dernière formulation qui est souvent utilisée et que l'on adoptera donc ici. Dans la suite, Le décodage du rang t consiste à retrouver le vecteur D = (d0, d1, ..., dn-1) associé à y. Une méthode de recherche séquentielle des dk est décrite ci-après. On détermine d'abord la composante d0, puis la composante d1, ... jusqu'à la composante dn-1. Pour trouver d0 on exploite la formule comportant les inégalités : Les termes (n-1)!, t, Pour trouver la valeur de d0, on part de d0 = 0, on incrémente successivement d0 de 1 jusqu'à ce que la formule (8) soit vérifiée. En écrivant la formule (8) avec les rangs partiels, la valeur d0 est telle que : Pour trouver d1, on exploite la relation : Les valeurs de
On se ramène au même problème que la détermination de la composante d0. Pour trouver la valeur de d1, on part de d1 = 0 et on incrémente successivement d1 de 1 jusqu'à ce que l'inégalité (9) soit vérifiée Le calcul des dk suivants se déduit des cas traités ci-dessus. Pour trouver la valeur de dk, on part de dk = 0 et on incrémente successivement dk de 1 jusqu'à ce que l'inégalité Une fois le vecteur D = (d0, ..., dn-1) décodé, on en déduit le vecteur y par simple transposition d'alphabet. L'indexation d'un code à permutation et l'opération inverse sont des opérations complexes. Les algorithmes utilisés exploitent l'analyse combinatoire. L'indexation des combinaisons et l'opération inverse requièrent des divisions de produits de factorielles. En dépit des progrès en circuits intégrés et des processeurs de traitement de signal, la division reste une opération complexe. Typiquement, la division d'un nombre entier représenté sur 16 bits par un nombre entier représenté sur 16 bits coûte 18 fois plus que leur multiplication. Le poids de la division d'un nombre entier de 32 bits par un nombre entier de 16 bits est de 32 alors que le poids de leur multiplication est de 5. Le coût de la division n'est pas le seul problème. Le cadrage des variables en est un autre comme l'illustre la table 1 ci-après. Seules les factorielles des nombres entiers inférieurs ou égaux à 8 peuvent être représentées sur des mots entiers de 16 bits. Pour des nombres plus grands que 12, la représentation des factorielles sur des mots entiers de 32 bits n'est plus possible. De plus, la complexité des opérations augmente aussi avec le nombre de bits utilisé pour représenter les variables. Ainsi, la division par un entier de 16 bits d'un entier de 32 bits est presque deux fois plus complexe (poids 32) que la division d'un entier de 16 bits (poids 18). Des solutions pour réduire la complexité de l'opération OP1 ont été proposées. Le problème de la complexité des opérations OP2 et OP3 est peu traité. Cependant, notamment dans le codeur/décodeur TDAC de la Demanderesse ou dans le codeur 3GPP-AMR-WB+, des simplifications ont été apportées aux algorithmes de codage et de décodage par la formule de Schalkwijk. Le calcul du rang t d'une permutation et l'opération inverse ont été accélérés grâce à des simplifications décrites ci-après du calcul des n termes Les deux premières servent à réduire la complexité tant du codage que du décodage. La troisième est utilisée au codage et les deux dernières au décodage. La technique de codage est illustrée sur les En référence à la
L'étape préliminaire générale suivante EP-3 est un calcul du vecteur D = (d0, ..., dn-1) comme suit :
En référence à la L'étape CA-1 est une initialisation du rang t à 0, de la variable P à 1 (dénominateur intervenant dans le calcul du rang à l'étape CA-13) et des q poids w0, ..., wq-1 à 0. Ici, on décrémente la valeur de k de n-1 à 0 (étape CA-2 d'initialisation de k à n-1, test de fin CA-14 et décrémentation CA-15 sinon). L'intérêt d'un tel choix est décrit plus loin. On utilise ensuite les composantes dk du vecteur D obtenu à l'étape préliminaire EP-3 et on fixe, pour un k courant, d= dk (étape CA-3). On met à jour le poids associé wd (wd=wd+1 à l'étape CA-4) pour estimer le terme P (P=Px wd à l'étape CA-5). On initialise à 0 (étape CA-6) la somme S intervenant au numérateur dans le calcul du rang correspondant à l'étape CA-13 et l'on fait courir ensuite une boucle sur l'indice i des poids wi (test de fin CA-9 et incrémentation CA-10 sinon, jusqu'à d-1) pour mettre à jour la somme S (S=S+wi à l'étape CA-8). Avant de calculer le rang t à l'étape CA-13, on vérifie que la somme S est non nulle (test CA-11). L'intérêt de cette réalisation est décrit plus loin. Le calcul du rang t (étape CA-13) fait intervenir le terme factoriel (n-k-1)! comme suit : Au lieu de calculer le terme (n-k-1)! à chaque mise à jour du rang t, on préfère pré-enregistrer en mémoire ces valeurs et avoir recours à un simple accès mémoire (étape CA-12) pour obtenir la valeur courante de (n-k-1)! Ainsi, certains des avantages du traitement illustré sur la Pour éviter de calculer les termes (n-1-k)! et Il ne sert à rien de calculer Les poids avec seulement une incrémentation et une multiplication par itération, soit : On peut, de plus, traiter les deux dernières positions à part (k = n-1 et k = n-2). En effet,
D'autres détails de réalisation avantageux, décrits ci-après, peuvent aussi être prévus. Afin d'éviter des divisions au décodage lors de la recherche de d0, l'inégalité (8) peut être reformulée sous la forme : De même, on supprime les divisions lors de la recherche de d1 en reformulant l'inégalité (9) sous la forme : ou encore : Il faut noter que s'il est ainsi possible de supprimer les divisions lors de la recherche des dk (0≤k≤n-1), il faut toujours effectuer (n-1) divisions pour calculer les Dans les dernières positions, pour certaines valeurs de d, Le problème du cadrage des variables a été abordé dans le codeur TDAC de la Demanderesse. Une première solution a consisté à distinguer les traitements des dimensions supérieures à 12 de ceux des plus petites dimensions. Pour les petites dimensions (n<12), les calculs sont effectués sur des entiers non signés sur 32 bits. Pour les plus grandes dimensions, des variables flottantes en double précision sont utilisées au prix d'un accroissement de la complexité de calcul (les opérations en double précision flottante coûtent plus cher que leurs équivalents en précision entière) et de la capacité mémoire requise. De plus, si la précision maximale est limitée à des entiers 32 bits non signés (mise en oeuvre par un processeur en virgule fixe), les factorielles d'entiers supérieurs à 12 ne peuvent pas être pré-stockées directement et les vecteurs de dimension supérieure à 12 doivent être codés à part. Pour résoudre ce problème, une solution plus élaborée utilise une représentation à virgule pseudo flottante par mantisse et exposant des factorielles n! sous la forme 2j×r. Cette décomposition est détaillée dans la table 2 ci-après. Le stockage de n! (pour n inférieur ou égal à 16) se réduit à stocker r avec une précision de 30 bits au maximum ainsi que l'exposant j qui correspond à un simple décalage de bits. Ainsi, les techniques de l'art antérieur, pour la plupart, ne résolvent pas le problème du cadrage des variables en précision limitée, en particulier en virgule fixe. La mise en oeuvre dans le codeur TDAC, même si elle permet de régler le problème de cadrage, n'évite pas de coûteuses divisions de deux entiers. De plus, pour des dimensions élevées, les calculs intermédiaires (par exemple le numérateur et le dénominateur des rangs partiels Les techniques d'énumération autres que celle de Schalkwijk souffrent des mêmes problèmes. Dès lors qu'elles utilisent aussi l'analyse combinatoire, elles nécessitent le calcul de produits de factorielles ainsi que leurs divisions. La présente invention vient améliorer la situation. Elle propose tout d'abord à cet effet un procédé de codage/décodage de signaux numériques, utilisant des codes à permutation faisant intervenir un calcul d'expressions combinatoires, dans lequel ces expressions combinatoires sont représentées par des décompositions en puissances de facteurs premiers, et déterminées par une lecture mémoire de représentations préenregistrées de décompositions de nombres entiers choisis. La présente invention fournit alors une solution efficace aux problèmes liés aussi bien à l'indexation d'un code à permutation qu'à l'opération inverse. Elle résout, conjointement, les deux problèmes de cadrage des variables et de divisions. En effet, dans une réalisation avantageuse, les représentations préenregistrées comportent des valeurs représentatives d'exposants, stockées respectivement en correspondance de valeurs représentatives de nombres premiers successifs, pour chacun desdits entiers choisis. On résout déjà ainsi le problème lié au cadrage des variables de l'art antérieur. Ce problème de cadrage des variables est d'autant accru lorsqu'il s'agit de manipuler des termes factoriels. Dans une réalisation avantageuse, pour manipuler les expressions combinatoires lorsqu'elles comportent des valeurs factorielles d'entiers, les représentations préenregistrées comportent au moins des représentations de décompositions de valeurs factorielles. Cette réalisation permet alors de lever la contrainte de cadrage des variables et, de là, repousser les limites habituellement fixées quant à la dimension n des codes à permutation considérés. Selon une autre caractéristique avantageuse, l'une au moins desdites expressions combinatoires comporte un quotient d'un numérateur entier par un dénominateur entier, et ce quotient est représenté par une décomposition de puissances de facteurs premiers, dont chaque puissance est une différence d'exposants respectivement associés au numérateur et au dénominateur et affectés à un même nombre premier. On résout ainsi le problème lié au calcul de divisions de l'art antérieur, en remplaçant ce calcul par un simple calcul de soustractions. Dans un premier mode de réalisation, on prévoit un adressage mémoire pour retrouver une décomposition préenregistrée de l'un des entiers choisis précités. A cet effet, la représentation préenregistrée d'un nombre entier choisi est stockée dans une mémoire adressable, un adressage de ladite mémoire donnant une succession d'exposants à affecter à des nombres premiers respectifs pour recomposer l'entier choisi. Préférentiellement, la représentation préenregistrée d'un nombre entier choisi sera stockée sous la forme d'une succession d'adresses donnant chacune, pour un nombre premier, un exposant à affecter à ce nombre premier pour recomposer l'entier choisi. On dénommera ci-après cette réalisation selon le premier mode par les termes "représentation éclatée des décompositions". En variante, dans un second mode de réalisation, les représentations préenregistrées sont stockées sous la forme de mots comportant une succession de groupes de bits, chaque groupe ayant :
Préférentiellement, la détermination des puissances de facteurs premiers s'effectue alors par applications successives d'au moins un masque partiel au mot de bits, avec décalages successifs en fonction des poids des bits et lectures des bits restants. On dénommera ci-après cette réalisation selon le second mode par les termes "représentation compacte des décompositions". Le déroulement même du procédé, pour le calcul d'une expression combinatoire, peut de façon générale être mené selon les étapes :
Pour ce qui concerne le calcul d'un produit à effectuer de façon récurrente et faisant intervenir à chaque récurrence un nouveau terme, il peut être avantageux de stocker temporairement la décomposition d'un calcul de produit effectué pour une récurrence antérieure. Ainsi, si le procédé comporte une étape récurrente de calcul d'un produit faisant intervenir à chaque récurrence un terme se multipliant à un produit déterminé à une récurrence antérieure :
De même, si le procédé comporte une étape récurrente de calcul d'une division faisant intervenir à chaque récurrence un terme divisant un quotient déterminé à une récurrence antérieure :
Ce stockage temporaire des décompositions intermédiaires des produits et/ou des quotients calculés de façon récurrente s'avèrera particulièrement avantageux pour la détermination de rangs partiels récurrents dont le cumul est représentatif d'un rang d'une permutation. Ainsi, dans une réalisation avantageuse de l'invention, les codes à permutation font intervenir le calcul d'une quantité représentative d'un rang d'une permutation comportant un cumul de rangs partiels, chaque rang partiel correspondant alors à l'une desdites expressions combinatoires. Le calcul du rang d'une permutation peut alors intervenir, au codage de signaux numériques en quantification vectorielle, pour indexer les permutations des composantes d'un vecteur directeur (opération OP2 de la De même, au décodage de signaux numériques en quantification vectorielle, l'estimation d'un rang d'une permutation intervient dès lors qu'à partir d'une valeur donnée d'un rang de permutation :
Dans un exemple de réalisation, cette condition de proximité est vérifiée si la valeur donnée du rang peut être encadrée par des cumuls de rangs partiels jusqu'au rang partiel associé à la composante présumée, d'une part, et jusqu'au rang partiel associé à une composante correspondant à une incrémentation de la composante présumée, d'autre part. Cette condition de proximité peut donc correspondre à une formulation générale des inégalités (8) décrites ci-avant dans le cas d'une énumération de Schalkwijk. Ainsi, la présente invention peut s'appliquer avantageusement au codage/décodage de source avec quantification vectorielle au sens de la Toutefois, le codage/décodage peut aussi être de type codage/décodage de canal, en modulation, au sens de la
Le calcul d'un rang partiel fait intervenir des termes (dans un produit ou un quotient) qui, en règle générale comme on le verra plus loin, restent inférieurs ou égaux à la dimension maximale n des codes à permutation. Ainsi, dans une réalisation avantageuse, les nombres entiers choisis dont les décompositions sont préenregistrées comportent au moins :
Dans une réalisation particulière facultative, les nombres entiers choisis peuvent comporter en outre la valeur de 0. Ainsi, si le code de permutation utilise une énumération de Schalkwijk, un rang partiel où:
Dans ce cas, les nombres entiers choisis dont les décompositions sont préenregistrées et que l'on cherchera alors à identifier dans l'expression du rang partiel
Toujours dans le cas particulier de l'énumération de Schalkwijk, le stockage temporaire des décompositions intermédiaires s'applique avantageusement comme suit : la somme des exposants dans la décomposition du terme D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels, outre les
Il convient d'insister pour rappeler (en particulier en référence aux
Ces opérations seront ainsi nommées en référence au codage/décodage de source avec quantification vectorielle. On rappelle que ces opérations peuvent être menées aussi en codage/décodage de canal, en modulation. Pour illustrer d'emblée le principe de l'invention, on décrit ci-après la factorisation en puissances de nombres premiers. La décomposition d'un nombre entier positif K non nul, en puissances de nombres premiers, s'écrit ainsi : pi étant un iéme nombre premier (p0 = 1, p1 = 2, p2 = 3, p3 = 5, p4 = 7, p5 = 11, p6 = 13, p7 =17, etc.). On note eiK l'exposant de pi dans la décomposition du nombre entier K et mK l'indice du plus grand facteur premier intervenant dans la décomposition de K d'exposant non nul. Par exemple, le nombre K=120 (soit 5!) s'écrit : 120 = 1.23.31.51 et mk=3 ici puisque le plus grand facteur "5" est d'indice 3 (p3 = 5). On a donc : En pratique, le nombre "1" étant l'élément neutre de la multiplication, on peut supprimer p0 de la décomposition, soit : Bien entendu, K=0 n'est pas décomposable en puissances de facteurs premiers. La décomposition en produits de puissances de nombres premiers des entiers positifs inférieurs ou égaux à 16 est donnée dans la table 3a, la décomposition de leurs factorielles dans la table 3b. Cette décomposition fait intervenir 6 nombres premiers (2, 3, 5, 7, 11 et 13). Les colonnes étant indexées par le nombre premier pi et les lignes par n, l'élément de la table 3a (respectivement 3b) à l'intersection de la colonne pi et de la ligne n est l'exposant Pour tout nombre entier positif n>1, le nombre mn! de facteurs premiers de n! est tel que : pmn! ≤ n ≤ pmn!+1. On a indiqué le nombre mn! (respectivement le nombre mn) dans la dernière (respectivement avant-dernière) colonne de la table 3b (respectivement 3a). On note l'inégalité suivante : mn ≤ mn! Comme le montre la table 3a, de nombreux exposants de la décomposition d'un nombre n sont nuls. Dans la dernière colonne de la table 3a, on a noté le nombre m'n d'exposants non nuls dans la décomposition de n. L'absence de décomposition (et donc d'exposants) pour n=0 est indiquée dans la ligne n=0 de la table 3a par le signe "-". On décrit ci-après l'application d'une telle décomposition pour le calcul d'un rang partiel d'un code de permutation, dans le cas de la formule de Schalkwijk dans un premier temps, puis dans le cas général. On rappelle que le rang partiel, noté de sorte que trois termes peuvent être décomposés en puissances de nombres premiers. Il s'agit des termes : A partir des exposants des décompositions de (n-1-k)!, de Pk et de Sk , on calcule par de simples additions et soustractions, les exposants de la décomposition de En effet, l'exposant On a représenté sur la Ainsi, en référence à la
Finalement, on obtient le rang t de la permutation, en codage à l'étape G-7, ou, en décodage (traits pointillés de la Dans le cas général et indépendamment de l'énumération de Schalkwijk, si un rang partiel t' (t' >0) d'une permutation est sous la forme d'un numérateur de Nt' termes ν j (1 ≤ j ≤ Nt') et d'un dénominateur de Dt' termes ρj (1 ≤ j ≤ Dt') , de sorte que : alors les exposants On utilisera aussi par la suite la décomposition en facteurs de nombres premiers pour une formulation en produits de quotients de nombres entiers d'un rang partiel t'. De manière générale encore, si En revenant au cas particulier de l'énumération de Schalkwijk, pour calculer alors un rang partiel En gardant à l'esprit la relation On indique ici que les termes (n-1-k)! et Pk sont des entiers strictement positifs mais le terme Sk peut être nul et donc non décomposable. Dans ce cas, le rang partiel Plus généralement, si et si On retiendra alors que la factorisation en facteurs premiers des termes composant un rang partiel permet de supprimer les divisions en les remplaçant par des multiplications de puissances de facteurs premiers, avec, en particulier, de simples additions et soustractions des exposants associés à ces nombres premiers. Ainsi, au sens de la présente invention, on prévoit les étapes suivantes, à partir d'un nombre restreint de décompositions en facteurs premiers de nombres entiers, stockées en mémoire (dites ci-après "décompositions de base") :
Bien entendu, les décompositions de base à stocker font préférentiellement l'objet d'une sélection avantageuse. Dans une réalisation préférée mais non limitative, les décompositions de base à stocker seront choisies en fonction de la dimension maximale des codes à permutation considérés (cette dimension maximale étant notée n). Ainsi, les décompositions de base sont préférentiellement :
où on rappelle que n est la dimension maximale des codes à permutation considérés. On peut alors identifier une décomposition de base par un nombre m donnant :
Des exemples de cette mise en oeuvre seront décrits plus loin en référence aux tables 4a à 4d, dans le cadre d'une représentation dite "éclatée" des décompositions. On indique qu'une représentation dite "compacte", décrite en détail plus loin, consiste à stocker un simple mot dont les bits donnent tous les exposants intervenant dans une décomposition. On peut définir alors différents jeux de décompositions de base, ainsi que des procédures de représentation et de stockage de ces décompositions de base. Par ailleurs, la sélection des termes dont on détermine les décompositions intermédiaires, ainsi que la détermination proprement dite de ces décompositions intermédiaires, font l'objet de réalisations avantageuses qui seront décrites plus loin. La décomposition d'un rang partiel et le calcul d'un rang partiel à partir de sa décomposition font aussi l'objet de réalisations avantageuses décrites plus loin. On décrit maintenant le choix des décompositions de base à stocker. De manière générale et indépendamment de la technique d'énumération d'un code à permutation de dimension n, le calcul du rang d'une permutation utilise les nombres entiers l (0≤l≤n) et surtout leurs factorielles l! (0≤l≤n). Dans une réalisation préférée, les décompositions de base sont les décompositions des factorielles de l! (0≤l≤n) et de l (1≤l≤n) où n est la dimension maximale des codes à permutation considérés, comme indiqué ci-avant. On prévoit donc dans cette réalisation préférée, (2n+1) décompositions de base. Néanmoins, d'autres réalisations sont possibles. Par exemple, il peut n'être prévu que (n+1) décompositions de base, à savoir celles de l (1≤l≤n) et de 0! . Ainsi, si une décomposition de l! (l >0) est nécessaire au calcul d'un rang partiel, elle est calculée à l'étape de détermination des décompositions intermédiaires à partir des / décompositions de base de j (1≤j≤l) avec Inversement, on peut ne prévoir que les (n+1) décompositions de l! (0≤l≤n). Si une décomposition de l (l >0) est nécessaire au calcul d'un rang partiel, elle est calculée à l'étape de détermination des décompositions intermédiaires à partir des deux décompositions de base de l! et (l-1)! et à partir de la relation : On comprend donc que le choix du jeu de décompositions de base peut avantageusement résulter d'un compromis entre la minimisation de la mémoire nécessaire au stockage des représentations de ces décompositions de base et à la minimisation de la complexité de l'étape de détermination des décompositions intermédiaires. On décrit ci-après une représentation des décompositions au sens de l'invention. Comme indiqué plus haut, une décomposition (qu'elle soit de rang partiel, intermédiaire ou de base) est définie par un nombre m donnant le nombre de facteurs premiers à considérer, ces m facteurs premiers et leurs exposants respectifs. On propose ci-après différentes solutions pour représenter les décompositions et stocker les données pour les décompositions de base. Le nombre ml! de facteurs premiers intervenant dans la décomposition de la valeur l! croît avec le nombre l. Une première solution pour représenter la décomposition de l! (0≤l≤n) consiste à stocker pour chaque valeur de l (0≤l≤n) le nombre ml! et les ml! exposants des puissances de pi (1≤i≤ml!). On notera que les ml! exposants de l! sont non nuls. Dans une variante plus avantageuse, le jeu des décompositions de base partage le même nombre mn! de facteurs premiers et on stocke mn! exposants pour chaque décomposition de base, les exposants de la décomposition de base de l! d'indice supérieur à ml! étant nuls. Cette solution permet d'avoir recours à un tableau des exposants en prévoyant un adressage régulier de ce tableau. Toutefois, une telle réalisation nécessite une taille mémoire conséquente. Ce tableau comporte ml!×(n+1) valeurs et l'exposant Il peut être prévu, en complément, de stocker les (n+1) valeurs de ml! pour pouvoir réduire les calculs des décompositions intermédiaires utilisant la décomposition de base de l! . Pour représenter la décomposition de base l (1≤l≤n), plusieurs solutions peuvent aussi être prévues. Une première solution consiste à stocker pour chaque valeur l le nombre ml et les ml exposants des puissances de pi (1≤i≤ml) de l. Dans une variante, on peut préférer stocker autant d'exposants que pour l! (ml!, ou mn!) exposants. Les décompositions de base de l et l! partagent alors le même nombre m. Dans une autre variante, on peut exploiter le fait que le nombre m'l d'exposants non nuls de la décomposition de l soit faible. Par exemple, il apparaissait sur la table 3a que ce nombre m'l était au maximum de 2 (pour l≤16). Ainsi, il est possible de ne stocker que ce nombre et les valeurs correspondantes pi ou les indices i. Toutefois, il faut prévoir aussi de stocker les indices i de ces facteurs premiers de puissance non nulle car ils ne sont plus implicitement reconnus par l'adresse de l'exposant correspondant dans le tableau. La représentation d'une décomposition intermédiaire dépend de la représentation des décompositions de base à partir desquelles elle est déterminée. De même, la représentation d'une décomposition d'un rang partiel dépend de la représentation des décompositions intermédiaires à partir desquelles elle est déterminée. Typiquement, quatre solutions possibles de stockage peuvent être illustrées à titre d'exemple par les tables 4a à 4d ci-après pour un code à permutation de dimension 8 (n=8) où quatre (m8! = 4) nombres premiers (2, 3, 5 et 7) sont considérés. Ces exemples peuvent être appliqués au codeur 3GPP AMR-WB+ (normes [3GPPTS26.273] et [3GPPTS26.304]). Ce codeur utilise une quantification vectorielle algébrique dont le dictionnaire est une union des codes à permutation du réseau de Gosset RE8 de dimension 8. Les trois premières solutions (tables 4a-4c) représentent et stockent les décompositions de base de l! de la même manière. On prévoit en effet un stockage de ml! et des ml! exposants des puissances de pi (1≤i≤ml!) de l!. Elles diffèrent dans la représentation et le stockage des décompositions de base de l. La table 4a montre une première solution visant le stockage de ml et des ml exposants des puissances de pi (1≤i≤ml!) de l. La table 4b montre une deuxième solution visant le stockage des ml! exposants des puissances de pi (1≤i≤ml!) de l. La table 4c ci-après montre une troisième solution visant le stockage du nombre m'l d'exposants non nuls des puissances de pi de l, des indices i correspondants, ainsi que leurs exposants. Dans la table représentée, pour plus de clarté, ce sont les facteurs premiers pi qui sont indiqués. Dans une quatrième solution (illustrée par la table 4d ci-après), on représente le jeu des décompositions de base par le nombre mn! et, pour chaque décomposition de base (l ou l!), on stocke mn! exposants. La table 4d est extraite des quatre colonnes (pi=2, 3, 5 et 7) et des 9 lignes (n=0 à 8) des tables 3a et 3b données précédemment. Dans le codeur TDAC qui utilise une quantification vectorielle statistique à dimension et résolution variables de dimension maximale 15, six (m15! = 6) nombres premiers sont considérés: 2, 3, 5, 7, 11 et 13. Les 6 colonnes (pi=2, 3, 5, 7, 11 et 13) et les 16 lignes (n=0 à 15) des tables 3a et 3b peuvent alors illustrer le stockage du jeu des représentations de base pour la quatrième solution. On décrit ci-après une autre solution avantageuse minimisant le stockage et qui consiste à représenter de manière compacte les exposants d'une décomposition de base sur un nombre limité de mots. Dans cette variante de représentation des décompositions de base, les décompositions intermédiaires et celles des rangs partiels sont aussi représentées de façon compacte. Avantageusement, cette solution minimise aussi la complexité de la détermination de ces décompositions, comme on le verra. On cherche à déterminer, pour chaque facteur premier pi, une borne supérieure βi de la valeur maximale de son exposant dans le numérateur des rangs partiels. Cette borne donne le nombre maximum de valeurs possibles de l'exposant de pi, soit βi+1. En notant où ┌x┐ dénote l'entier immédiatement supérieur ou égal à x (┌x┐-1<x≤┌x┐). Les exposants de la décomposition en facteurs premiers d'un terme K intervenant dans un rang partiel t' peuvent être représentés de façon compacte par un mot eK de Bn bits La notation "<<B" représente un décalage à gauche de B bits. Il est à noter que si le nombre n est grand, il se peut que Bn soit supérieur au nombre de bits B0 utilisés pour représenter des entiers (16, 32 ou 40 bits). Dans ce cas, les exposants de la décomposition en facteurs premiers d'un entier K intervenant dans t' sont représentés sous la forme de M mots entiers eK(m), 0≤m<M (avec, bien entendu, M>1). Avantageusement, les M mots peuvent être formés de la façon suivante :
Bien entendu, d'autres variantes peuvent être prévues. Par exemple, une variante consiste à stocker à part l'exposant de p1, et appliquer le traitement ci-dessus à partir de l'exposant de p2. Les bornes βi peuvent être déterminées de plusieurs façons. En exploitant les informations sur le code à permutation (taille q de l'alphabet, poids wi 0≤i<q), la valeur maximale de chaque exposant du numérateur d'un rang partiel peut être explicitement déterminée. Si plusieurs codes à permutation (éventuellement de dimensions différentes) sont utilisés, on choisit préférentiellement, pour chaque exposant, la plus grande des valeurs maximales. La présente invention propose avantageusement un traitement général pour la détermination de la borne supérieure dans le cadre de l'énumération de Schalkwijk. Le traitement n'exploite aucune information a priori sur les codes à permutation utilisés autre que la dimension maximale. Il exploite simplement la relation : pour choisir alors Ce traitement très général est particulièrement bien adapté lorsqu'une grande variété de codes à permutation est utilisée. La table 5a donne les bornes supérieures des valeurs maximales des exposants dans les numérateurs de La table 6a (respectivement 6b) donne la représentation compacte des exposants de l et l! pour la dimension n égale à 8 (respectivement 15). A titre d'exemple purement illustratif, on cherche à déterminer la décomposition de l'entier l=12 à l'aide de la table 6b. Préférentiellement, dans la table 6b, comme la dimension maximale des codes est n=15, l'exposant de "2" est représenté sur 4 bits, celui de "3" sur 3 bits, et les autres facteurs premiers 5, 7, 11, 13 sur 2 bits. Dans la table, à la colonne l =12, on lit son exposant compact e12 = 18. En s'appuyant sur la lecture du tableau ci-après, la représentation binaire de 18 (=16+2) sur B15 =15 bits est :
Les 4 bits de poids faibles (poids i=0 à 3) sont l'exposant du facteur premier 2, soit: 0010 = 2, ce qui signifie que 2 est l'exposant à affecter au nombre premier 2. Les 3 bits suivants (poids i=4 à 6) sont l'exposant du facteur premier 3, soit :
La procédure d'extraction consiste à masquer les bits de poids forts pour récupérer l'exposant du facteur premier contenu dans les bits de poids faible, puis à décaler l'exposant compact du nombre de bits récupérés pour passer à l'exposant du facteur premier suivant. Ainsi en dimension 15, il y a 6 exposants à extraire en commençant par l'exposant de 2. La représentation binaire de l'exposant de 2 correspond aux 4 bits de poids faible de 18, soit 0 0 1 0 qui correspond à 2. Pour les récupérer, on masque les bits de poids fort de 18 avec 15 (noté 18 & 15), ce qui équivaut à :
On obtient e12 = 18 & (2<<4 - 1) = 2, ce qui signifie que 2 est l'exposant à affecter au nombre premier 2. Puis on décale 18 de 4 bits vers la droite, on obtient : 000 0000 0001 = 1 La représentation binaire de l'exposant de 3 correspond aux 3 bits de poids faible de 1, soit 0 0 1 (=1). Pour les récupérer, on masque les bits de poids fort de 1 avec 7 (noté 1 & 7 et valant 23 - 1 = 1 1 1). On obtient e112 = 1 & (2<<3 - 1) = 1, ce qui signifie que 1 est l'exposant à affecter au nombre premier 3. Puis on décale 1 de 2 bits vers la droite, on obtient ensuite : 0000 0000 = 0 pour tous les autres bits de poids fort. On retient donc que les puissances de l=12 sont :
soit l=12 = 22x31 On suppose ici que, pour chaque facteur premier, son exposant dans le dénominateur d'un rang partiel t' est inférieur ou égal à son exposant dans le numérateur de t'. Tel est le cas si t' est strictement positif car on a bien En pratique, avec la formule de Schalkwijk et si q>1, la valeur Il suffit donc de vérifier l'inégalité Dans les autres cas, on pourra rechercher explicitement β'i et calculer Dans le cas où q=1, on comprendra qu'un seul mot de code de rang connu (t=0) intervient dans le code à permutation et il est donc inutile a priori d'effectuer les calculs de rang et les opérations inverses correspondantes. Cependant, s'il n'est pas souhaité de traiter à part ce cas particulier, il peut toujours être prévu de calculer la valeur On décrit brièvement maintenant les capacités mémoires requises pour le stockage des décompositions de base. Indépendamment de la solution choisie pour la représentation des décompositions de base, le stockage des décompositions de base s'effectue dans des tableaux et l'on a alors recours à un adressage de ces tableaux lors des opérations de codage et de décodage du rang. Bien que la décomposition de 0 ne soit pas possible (et, d'ailleurs, pas utilisée), il peut être préférable de stocker des exposants "factices" pour la décomposition de 0 (par exemple des 0 ou des 1), et ce, pour simplifier le calcul d'adresse. La table 8 ci-après résume la taille mémoire nécessaire pour le stockage des données relatives aux décompositions de base pour les cinq solutions présentées pour ces deux cas (stockage ou non de la décomposition factice de 0). Dans la cinquième solution, on a tenu compte du stockage (+mn!) des nombres de bits La table 9 donne la mémoire nécessaire pour le stockage des données relatives aux exposants de la décomposition de ces cinq solutions pour nmax = 8 et 15 (avec stockage factice de 0). On décrit maintenant le stockage des puissances de facteurs premiers. En dehors des décompositions de base, la présente invention utilise les puissances des facteurs premiers pour calculer le rang partiel à partir de sa décomposition. On peut, à partir d'une table de ces facteurs premiers, calculer leurs puissances en temps réel ("en ligne"). Préférentiellement, les puissances des nombres premiers autres que 2 sont pré-calculées et stockées et seules les puissances de 2 sont calculées en temps réel. La table 10a ci-après donne les puissances de 3, 5 et 7 nécessaires pour un code à permutation de dimension 8 (comme ceux utilisés dans le codeur AMR-WB+). La table 10b donne les puissances de 3, 5, 7, 11 et 13 nécessaires pour les codes à permutation de dimension maximale 15 (comme ceux utilisés dans le codeur TDAC). Là, encore, on pourra ne stocker que le nombre nécessaire de puissances pour chaque facteur premier. En variante, s'il est préféré de ne disposer que d'un seul tableau de puissances adressable régulièrement, il peut être prévu de stocker, pour chaque facteur premier, autant de valeurs que le nombre de puissances de p2 nécessaires (p2=3). Pour les puissances non utilisées, on peut, bien entendu, utiliser un stockage de valeurs factices telles que des 1 ou des 0. On décrit maintenant le calcul du rang d'une permutation pour réaliser un codage en exploitant l'invention. Il existe plusieurs variantes selon le jeu des décompositions de base choisi et leur représentation. Par souci de concision, l'exposé des réalisations possibles ci-après est limité au cas du mode de réalisation préféré pour le jeu des décompositions de base, avec décompositions des factorielles de l! et de l. Ci-après, la solution de représentation éclatée des exposants avec mn! exposants par décomposition de base, qui est le cas le plus général, est d'abord exposée. Des variantes de représentation éclatée des exposants sont ensuite décrites. Enfin, la solution de représentation compacte des exposants des décompositions de base est exposée, ainsi que quelques unes de ses variantes. Il apparaîtra alors que l'invention s'applique parfaitement à un traitement de codage du rang d'une permutation. L'algorithme de Schalkwijk est repris ci-après, comme exemple de traitement d'énumération. Soit n la dimension maximale des codes à permutation utilisés, et mn! le nombre de facteurs premiers intervenant dans la décomposition de la grandeur n! On décrit ci-après un premier mode de réalisation d'un codage utilisant une représentation éclatée des exposants de la décomposition. Ici, les exposants des décompositions de base de l et l! sont stockés préférentiellement selon la "quatrième" solution de la table 4d ci-avant, avec stockage factice pour l=0 dans deux tableaux monodimensionnels notés respectivement Dl et Dl! ayant mn! ×(n+1) éléments. Comme mentionné ci-avant, on pourrait considérer aussi des tableaux bidimensionnels ayant mn! colonnes et (n+1) lignes. Les exposants de l (respectivement l!) étant stockés régulièrement (chacun sur mn! valeurs), les opérations de lecture des exposants d'une décomposition de base nécessitent un calcul d'adresse dans le tableau Dl (respectivement Dl!). Pour lire les exposants de la décomposition de l! (respectivement l), il faut pointer à l'adresse (l×mn!) du tableau Dl! (respectivement Dl), et viser ainsi l'adresse de l'exposant Il est à noter que s'il n'est pas prévu de stockage factice pour l=0, le calcul d'adresse dans le tableau Dl des n décompositions de base de l (l >0) est: (l-1)×mn!.
On se réfère à la A l'étape C-1, on lit la variable dk . L'étape C-2 consiste en une mise à jour de l'élément dk du tableau w : w[dk] = w[dk]+1. L'étape C-3 est une mise à jour des exposants de la décomposition de Pk (tableau P), avec, en particulier :
Ainsi, pour la mise en oeuvre de l'étape C-31, le premier exposant de la décomposition de base w[dk] dans le tableau Dl, noté Parallèlement, à l'étape C-4, on calcule Sk à partir de la relation habituelle L'étape C-5 est un test sur la valeur de Sk. Si Sk est nulle (flèche O), ce qui implique que le rang partiel Parallèlement, l'étape C-7 consiste à lire les mn! exposants A l'étape C-8, les résultats des différentes lectures des tables peuvent être regroupés pour calculer d'abord les mn! exposants de la décomposition du rang partiel Enfin, à l'étape C-9, on calcule le rang partiel On rappelle que le terme w[dk] est un poids nécessairement inférieur ou égal à la dimension maximale n du code à permutation considéré. De même, la somme Sk de tels poids reste inférieure à la dimension maximale n et il en est de même, bien entendu, pour (n-1-k). Les décompositions de w[dk], Sk et (n-1-k)! sont bien répertoriées dans les tables de décompositions des entiers ou des factorielles d'entiers allant jusqu'à la dimension maximale n, telles que la table 4d. A partir de la décomposition w[dk] répertoriée dans une table et de la décomposition de Pk-1 déterminée à la boucle précédente (k-1) et gardée en mémoire, la décomposition de Pk est déterminée. A titre d'exemple purement illustratif des étapes de calcul de rang partiel de la Dans cet exemple, on suppose qu'à une position précédente k=3, le tableau des poids w est {1, 1, 0, 3} et donc P3= 1! 1 0! 3! = 6. Le tableau P des exposants de la décomposition de P3 (=21×31×50x70) est donc {1, 1, 0, 0}. A la position k=2, pour l'étape C-1, on suppose qu'on a lu d2= 2. Dans cet exemple, à l'étape C-2, on met à jour l'élément w[2] en l'incrémentant de 1 ( w[2] = 0 + 1 = 1). A l'étape C-31, on lit les quatre exposants de la décomposition de 1 (=w[2]), soit 0, 0, 0, 0 (voir dans la table 4d, 6ème à 9ème colonnes et 3ème ligne l=1). Puis (étape C-32), on met à jour le tableau P, on obtient donc P= {1, 1, 0, 0}. A l'étape C-4, on calcule Sk : Sk = w[0] + w[1] = 1 + 1 = 2. Sk n'est donc pas nul (test C-5).
A l'étape C-9, le rang partiel En référence à nouveau à la L'étape C-11 vise ensuite la décrémentation de la variable k (k=k-1) et l'étape C-12 est un test sur la valeur de k pour poursuivre ou non le traitement. Ainsi, si k ≥ 0 (flèche O en sortie du test C-12), on réitère les étapes du traitement à partir de la première étape C-1, avec une valeur de k décrémentée d'une unité. Sinon (flèche N en sortie du test C-12), le traitement est terminé à l'étape C-13 de fin ("END"). Ainsi, on comprendra que l'étape C-9 ci-avant calcule un rang partiel à partir de sa décomposition déterminée à l'étape C-8, elle-même déterminée à partir de trois décompositions intermédiaires :
La détermination de deux d'entre elles, (n-1-k)! et Sk, effectuée aux étapes C-6 et C-7, consiste en une simple lecture dans les tableaux respectifs des décompositions de base Dl et Dl!. La détermination de la troisième décomposition intermédiaire (celle de Pk) peut aussi être effectuée simplement à partir des q décompositions de base de w[d]! lues dans le tableau Dl! selon une relation du type L'étape C-3 présente une variante plutôt avantageuse de détermination de cette décomposition intermédiaire. La décomposition intermédiaire de Pk peut en effet être déterminée à partir d'une décomposition de base lue dans le tableau Dl et d'une autre décomposition intermédiaire (celle de Pk+1) calculée pour un autre rang partiel Ci-avant, on a effectué le calcul du rang par une boucle de la dernière position (k=n-1) à la première position (k=0). Toutefois, l'invention s'applique aussi, bien entendu, à une boucle de la première à la dernière position. Il suffit de changer la phase d'initialisation et d'adapter les étapes C-2 et C-3 et leur ordre. A cet effet, le tableau des poids w peut être initialisé avec les q poids L'étape C-3 intervient alors après l'étape C-10 et avant l'étape C-2. La décomposition intermédiaire de P est mise à jour par soustraction à P[i] de l'exposant On indique brièvement que, pour les codes à permutation de dimension n variable, plutôt que d'effectuer mn Plus généralement, la mise en oeuvre représentée sur la Ainsi, dans une première variante, chaque décomposition de base (de l ou l!) contient aussi le nombre ml!. La lecture du nombre ml! (0≤l≤n) présente des avantages. En effet, les étapes C-3 et C-6 à C-10 ne sont plus effectuées mn! fois chacune, mais seulement :
Si, en outre, on a stocké aussi les valeurs ml , il n'y a plus qu'à effectuer :
Dans une autre variante du codage, si on utilise en plus le stockage des exposants de la décomposition de base de l selon la troisième solution (table 4c ci-avant), l'étape C-3 peut être effectuée pour m'w[d
Dans une troisième variante, au lieu de décomposer un rang partiel en trois termes (deux au numérateur et un au dénominateur), on le décompose en deux termes dont l'un est un quotient. Ainsi, le rang partiel
Ce quotient peut être mis à jour par la relation suivante : Ainsi, plutôt que déterminer la décomposition de Rk à partir des q+1 décompositions de base (celles de (n-1-k)! et des q w[dk]! lues dans le tableau Dl!), une décomposition intermédiaire de Rk est déterminée à partir de la décomposition intermédiaire de Rk+1 et des décompositions de base de (n-1-k) et de w[dk] (ces deux décompositions de base étant lues dans le tableau Dl), ce qui s'écrit : Par rapport aux variantes précédentes, au lieu de déterminer et de stocker la décomposition intermédiaire du dénominateur de Selon l'option de stockage, cette mise à jour peut être faite avec mn! additions et soustractions ou m(n-1-k)! additions (respectivement mw[dk]! soustractions), ou encore m(n-1-k) additions (respectivement mw[dk] soustractions), ou seulement pour les exposants non nuls de w[dk] et (n-1-k) : m'(n-1-k) additions et m'w[dk] soustractions. L'étape C-8 ne comporte plus que des additions du type : Selon l'option de stockage, on compte alors mn! additions ou msk! additions, ou encore ms On notera que ce rapport Rk n'est pas forcément entier, ce qui signifie que les exposants R[i] peuvent être négatifs. Dans cette variante, la décomposition des factorielles au codage (donc le tableau Dl!) n'est plus utile, de sorte qu'un simple jeu de (n+1) décompositions de base des entiers l (l ≤ n) peut être utilisé en ne stockant que le tableau Dl. On décrit maintenant un second mode de réalisation d'un codage, basé sur une représentation compacte des exposants de la décomposition. Les exposants des décompositions de base sont représentés de façon compacte et non plus sous forme éclatée comme décrit ci-avant en référence au premier mode de réalisation. Par souci de concision, on n'expose que le cas où la représentation compacte des exposants tient sur un seul mot. Ces mots sont donc stockés comme décrit ci-avant, avec stockage d'un mot factice pour l=0 dans deux tableaux notés respectivement D'l et D'l! à (n+1) éléments. Le calcul de l'adresse dans ces deux tableaux d'un mot contenant les exposants d'une décomposition de base est direct car, pour lire le mot de la décomposition de l! (respectivement l), il suffit de pointer à l'adresse l du tableau D'l! (respectivement D'l). On remarquera que sans stockage d'un mot factice pour l=0, le mot correspondant à une décomposition de base l (avec l>0) est à l'adresse (l-1) dans le tableau D'l.
On se réfère maintenant à la A l'étape CC-1, on lit la variable dk. L'étape CC-2 consiste en une mise à jour de la variable w : w[dk]=w[dk]+1. L'étape CC-3 est une mise à jour du mot eP avec, en particulier :
Parallèlement, à l'étape CC-4, on calcule la somme Parallèlement (et avantageusement selon le résultat du test CC-5), on lit le mot e(n-1-k)! contenant la représentation compacte des exposants de (n-1-k)! dans le tableau D'l!, à l'étape CC-7. A l'étape CC-8, Les résultats issus des différentes étapes CC-3, CC-6, CC-7 sont regroupés pour calculer le mot L'étape CC-9 vise l'extraction des mn! exposants On rappelle que les notations "<<b" et ">>b" désignent respectivement un décalage à gauche et un décalage à droite de b bits. Par ailleurs, la notation "&" désigne l'opérateur logique bit à bit "ET". L'instruction i'1) consiste à récupérer les En d'autres termes, on applique au départ (pour l'indice de boucle i égal à 1) un masque Puis :
et ainsi de suite jusqu'à i=mn!. L'étape suivante CC-10 consiste à calculer le rang partiel Puis, on additionne le rang partiel La valeur de l'indice k est décrémentée à l'étape suivante CC-12 (k=k-1) et, avant de recommencer les étapes CC-4, CC-1, CC-7 et suivantes avec cette valeur décrémentée, on vérifie au test CC-13 si la valeur de k n'a pas atteint -1 (k<0), auquel cas le traitement est terminé (étape CC-14). Ainsi, indépendamment de la représentation des décompositions, la présente invention permet de calculer efficacement des rangs partiels. L'étape CC-10 vise le calcul d'un rang partiel à partir de sa décomposition déterminée aux étapes précédentes CC-8 et CC-9. Trois décompositions intermédiaires (des termes (n-1-k)!, Sk et Pk) sont utilisées. La détermination de deux d'entre elles ((n-1-k)! et Sk) effectuées aux étapes CC-6 et CC-7 consiste en une simple lecture de leur représentation compacte dans les tableaux D'l! et D'l. La détermination de la troisième décomposition intermédiaire (Pk) effectuée à l'étape CC-3 nécessite aussi une lecture du tableau D'l suivie d'une mise à jour de la représentation compacte de cette décomposition intermédiaire par addition de la représentation compacte de la décomposition de base qui a été lue. Comme indiqué précédemment en référence au premier mode de réalisation, le stockage des valeurs ml! (0≤l≤n) permet de réduire la complexité des étapes CC-9 et CC-10. La boucle d'extraction des exposants de la décomposition d'un rang partiel On décrit maintenant le décodage du rang d'une permutation en exploitant l'invention. Il existe, là encore, plusieurs variantes selon la solution de représentation des décompositions de base (éclatée ou compacte). On décrit ci-après un premier mode de réalisation du décodage, homologue du premier mode de réalisation décrit ci-avant pour le codage utilisant la représentation éclatée des décompositions et leur stockage selon la quatrième solution relative à la table 4d donnée plus haut. Il apparaîtra que l'invention s'applique parfaitement à un décodage du rang d'une permutation en prenant comme exemple l'algorithme de Schalkwijk. Le décodage utilisant une représentation éclatée des exposants de la décomposition commence préférentiellement par une initialisation des données comme suit.
On se réfère maintenant à la La première étape D-1 consiste en une lecture des mn! exposants L'étape suivante D-2 fixe les valeurs dk= 0 et On procède ensuite à la recherche de la première valeur dk de l'alphabet telle que w[dk]≠0. On prévoit à cet effet un test D-3 vérifiant si w[dk]=0, auquel cas (flèche O) on incrémente la valeur de dk (dk= dk+1) et on réitère le test D-3 jusqu'à trouver une valeur w[dk] non nulle. Si une telle valeur a été trouvée (flèche N pour w[dk]≠0), l'étape suivante est un test D-5 sur la valeur du rang t. Si le rang est nul (flèche O en sortie du test D-5), la mise en oeuvre des étapes suivantes est inutile jusqu'à la mise à jour des exposants de Pk (étape D-18). Si le rang n'est pas nul (flèche N en sortie du test D-5), le traitement se poursuit par les étapes suivantes D-6 et D-7 auxquelles on fixe respectivement Sk = 0 et une valeur intermédiaire Ik à L'étape suivante D-8 est un calcul de mise à jour de la somme Sk = Sk + w[dk]. Elle est suivie par la lecture du tableau Dl (étape D-9) des mn! exposants L'étape D-10 vise le calcul des mn! exposants L'étape D-11 vise le calcul du rang partiel : Les trois étapes suivantes visent un test sur la valeur du rang total t, en le comparant à la valeur du rang partiel. Pour ce faire, à l'étape D-12, on incrémente la valeur de dk (dk= dk+1) et le test D-13 est le suivant : Si l'inégalité est vérifiée (flèche O), on réitère les étapes D-7 à D-13 avec la nouvelle valeur de dk incrémentée. Sinon (flèche N), le traitement se poursuit par l'étape D-14 de décrémentation de la valeur de dk (dk= dk-1) pour revenir à la valeur de dk avant l'étape D-12. Pour cette valeur de dk, le rang partiel étape D-19) et on incrémente celle de l'indice k (k=k+1 : étape D-20) pour préparer la boucle suivante. Avant de reboucler sur la première étape D-1, on vérifie que les n composantes n'ont pas toutes été traitées. Pour ce faire, on prévoit le test D-21 sur la valeur de k, en la comparant à n (k < n). Tant que l'indice k n'a pas atteint la valeur n (flèche O en sortie du test D-21), on recommence le traitement à l'étape D-1 pour une valeur suivante de k. Sinon (flèche N en sortie du test D-21), le traitement est terminé à l'étape de fin D-22. On retiendra que l'étape D-11 vise le calcul d'un rang partiel en utilisant sa décomposition déterminée à l'étape D-10 à partir de trois décompositions intermédiaires des termes respectifs (n-1-k)!, Sk et Pk. Les déterminations de deux d'entre elles ((n-1-k)! et Sk) effectuées aux étapes D-1 et D-9 consistent en une simple lecture dans les tableaux respectifs Dl! et Dl. La détermination de la troisième décomposition intermédiaire (Pk) effectuée à l'étape D-18 s'effectue aussi par une lecture du tableau Dl (étape D-17) suivie d'une mise à jour par des exposants de cette décomposition intermédiaire par soustraction des exposants de la décomposition de base lue (étape D-18). L'initialisation décrite ci-avant de cette décomposition intermédiaire nécessite q lectures du tableau Dl! suivie d'une mise à jour par des exposants de cette décomposition intermédiaire par addition des exposants des q décompositions de base lues. Comme pour le codage décrit ci-avant, le traitement de la Une variante consistant à utiliser les exposants du rapport Rk (comme décrit précédemment) est particulièrement intéressante. En effet, dans le traitement de décodage décrit ci-avant en référence à la Cependant, la variante utilisant les exposants du rapport Rk ne requiert qu'une addition On décrit ci-après, en référence maintenant à la Au préalable, on prévoit une initialisation des données comme suit.
Les lettres "DC" dans les notations des étapes DC-n de la L'étape DC-1 consiste à lire le mot e(n-1-k)! contenant la représentation compacte des mn! exposants du terme (n-1-k)! dans le tableau D'l! Les étapes DC-2 à DC-8 sont similaires aux étapes D-2 à D-8 décrites ci-avant en référence à la En revanche, à l'étape DC-9, on lit le mot eS L'étape générale DC-11 consiste globalement en une extraction des exposants du rang partiel
Cette étape générale DC-11 est similaire à l'étape générale CC-9 de la Les étapes DC-12 à DC-17 sont, quant à elles, similaires aux étapes D-11 à D-16 décrites ci-avant en référence à la La mise à jour des exposants de Pk (tableau P) à l'étape générale DC-18 se fait, en revanche, à l'étape DC-181, en lisant le mot ew[dk] contenant la représentation compacte des mn! exposants de w[dk] dans le tableau D'l et la mise à jour proprement dite des exposants de Pk (eP = eP - ew[dk]) s'effectue ensuite à l'étape DC-182. Ensuite, les étapes DC-19 à DC-22 sont similaires aux étapes D-19 à D-22 de la On décrit maintenant les différents avantages qu'offrent les variantes exposées ci-avant. Les variantes du premier mode de réalisation avec représentation éclatée, utilisant les tables de ml! (et/ou ml ou m'l), comportent moins d'opérations d'additions/soustractions que le mode de réalisation principal qui n'utilise que la table des valeurs mn! . Dans ce cas, le gain en complexité est important surtout pour les dernières positions (c'est-à-dire lorsque m(n-k)!, m'l ou ml sont bien inférieurs à mn!). Néanmoins, ce gain en complexité s'accompagne d'un accroissement de la complexité des étapes de lecture en mémoire (étapes C-31, C-6 et C-7). Si le nombre de valeurs à lire est moindre, le calcul d'adresse est en revanche plus compliqué. Un compromis intéressant consiste alors à stocker régulièrement les décompositions de base (avec mn! exposants) pour faciliter l'adressage des tableaux Dl et Dl! et de stocker alors les valeurs ml! dans un tableau Dm à (n+1) éléments. Il convient alors de stocker aussi les valeurs ml pour réduire efficacement le nombre d'additions/soustractions. Toutefois, cette mesure s'accompagne nécessairement d'une lecture des valeurs mS Par ailleurs, les avantages apportés par la représentation compacte par rapport à la représentation éclatée sont les suivants :
Par contre, la représentation compacte nécessite une extraction des exposants du rang partiel On décrit ci-après les avantages de telles variantes pour le calcul du rang partiel à partir de sa décomposition en facteurs premiers. La complexité de l'étape de calcul du produit des puissances des facteurs premiers, au sens des étapes C-9 et CC-10 (respectivement D-11 et DC-12) au codage (respectivement au décodage) croît de façon importante avec le nombre de facteurs, même si elle reste bien inférieure à la complexité de la division au sens de l'art antérieur. Or, en pratique, beaucoup des exposants de la décomposition d'un rang partiel sont nuls et donc les puissances correspondantes sont égales à 1. Souvent, tous les exposants sont nuls ou les premiers exposants seulement ne sont pas nuls. Il est donc utile de pouvoir détecter et ne garder que les puissances d'exposants non nuls. Dans la représentation détaillée, cette détection ne peut s'effectuer que par mn! tests ou m(n-1-k)! tests (un par facteur premier). Avantageusement, la représentation compacte permet de tester avec un seul test si tous les exposants sont nuls (si En outre, la détection du bit de poids fort de et' permet d'obtenir l'indice du plus grand facteur premier d'exposant non nul dans le rang t' et de réduire le nombre de répétitions de la boucle de l'étape CC-9 (respectivement DC-11) au codage (respectivement au décodage). Il est à noter néanmoins que la détection des exposants non nuls, en représentation détaillée comme en représentation compacte, augmente la complexité. Si tous les exposants sont non nuls, la complexité de la multiplication des puissances des facteurs premiers reste la même et s'ajoute alors à cette complexité celle de la procédure de détection des exposants non nuls. Ainsi, dans une autre variante, la détection des exposants nuls peut être menée uniquement si le nombre possible de facteurs premiers devient grand (k bien inférieur à n) et que la complexité de la multiplication de leurs puissances est supérieure à la complexité de la procédure de détection. Pour ce faire, des boucles différentes selon les positions peuvent être prévues, même si cette implémentation s'effectue au détriment d'un accroissement des lignes d'instruction. Il est aussi possible de combiner les représentations éclatée et compacte. Pour les dernières positions (la valeur ml! étant faible), le calcul des décompositions intermédiaires nécessite peu d'opérations. On favorisera alors l'utilisation d'une représentation éclatée qui ne nécessite pas d'extraction des exposants d'un rang partiel. En revanche, pour les premières positions, on favorisera plutôt l'utilisation d'une représentation compacte. On décrit maintenant quelques exemples de réalisation dans des codeurs/décodeurs existants. Le codeur 3GPP AMR-WB+ (norme [3GPPTS26.304]) utilise une quantification vectorielle algébrique dont le dictionnaire est une union des codes à permutation du réseau de Gosset RE8 de dimension 8. La technique TCX correspond à un codage prédictif par transformée. Plus précisément, il s'agit d'une méthode de codage par transformée FFT appliquée après filtrage de pondération perceptuelle. Dans la norme [3GPPTS26.304], le spectre FFT obtenu est découpé en sous-bandes (ou sous-vecteurs) de dimension n=8 et ces sous-vecteurs sont codés séparément. La quantification des sous-vecteurs utilise le réseau régulier de points RE8. Les dictionnaires de quantification en dimension 8 sont composés d'une union de codes à permutations de type I issus du réseau de points RE8. Dans le codeur TCX selon la norme [3GPPTS26.304], chaque code à permutation correspond à un vecteur leader signé donné en dimension n=8. L'indice de quantification d'un point du réseau RE8 est calculé par une formule du type : Le rang est calculé par la formule de Schalkwijk tandis que l'offset de cardinalité est tabulé. Néanmoins, ces leaders signés sont représentés par l'intermédiaire de leurs leaders absolus afin d'optimiser le stockage et la recherche dans les codes à permutations. On trouve la liste des leaders absolus associés dans la référence :
Pour illustrer les différentes variantes de l'invention, trois exemples de réalisation sont présentés ci-après. Les deux premiers exemples de réalisation concernent le calcul du rang d'une permutation (codage), l'un utilisant une représentation éclatée des décompositions et l'autre une représentation compacte. Dans ces exemples de réalisation ci-après et les annexes correspondantes, les tableaux R et P sont indexés de R[0] à R[mn!-1] et de P[0] à P[mn!-1] (et non de 1 à mn! comme décrit à titre d'exemple ci-avant), et ce, sans aucune incidence particulière sur le traitement pour le calcul du rang. Dans ce mode de réalisation, on utilise une représentation éclatée des décompositions de base. On stocke leurs exposants dans deux tableaux à 36 éléments (=(8+1)x4). Il s'agit des tableaux donnés en annexe A-11 et notés Dl [36] (contenant les exposants des décompositions des entiers l (0≤l≤8) donc avec stockage d'une décomposition factice pour 0) et Dl! [36] (contenant les exposants des décompositions de leurs factorielles). On stocke aussi les trois tableaux des puissances de 3, 5 et 7 : Dans ce mode de réalisation, la décomposition d'un rang partiel est déterminée à partir de deux décompositions intermédiaires, l'une étant la décomposition de base de l'entier Sk et l'autre étant la décomposition intermédiaire du quotient : Comme indiqué plus haut, plutôt que de déterminer la décomposition intermédiaire de Rk à partir de décompositions de base correspondant aux (q+1) décompositions de base de (7-k)! et L'invention exploite la connaissance de m(7-k)! et des maxima de Le traitement correspondant est donné en annexe A-12. On note que la boucle sur les positions est éclatée. On note aussi que l'exposant du facteur premier pi du quotient est stocké dans l'élément R[i-1] du tableau R à 4 éléments. Dans une variante avec le codeur 3GPP AMR-WB+, les décompositions de base sont représentées de façon compacte. On stocke les mots contenant leurs exposants dans deux tableaux à 9 éléments (=(8+1)). En se référant à l'annexe A-21, le tableau D'l contient les mots pour les décompositions des entiers l (0 ≤ l ≤ 8 ) (donc avec stockage factice de la décomposition pour l=0) et le tableau D'l! contient les mots pour les décompositions de leurs factorielles. On stocke aussi les puissances de 3, 5 et 7 dans un tableau Pow[12] à 12 éléments (avec stockage factice de 0 pour les puissances non utilisées). La décomposition d'un rang partiel est déterminée à partir de trois décompositions intermédiaires, deux étant les décompositions de base de l'entier Sk et de la factorielle (7-k)! et la troisième étant une décomposition intermédiaire du dénominateur du rang partiel : Comme indiqué précédemment, plutôt que de déterminer la décomposition intermédiaire de Pk à partir des q décompositions de base de Ici encore, on exploite la connaissance de m(7-k)! pour n'extraire que m(7-k)! exposants du mot compact représentant la décomposition d'un rang partiel. Le traitement correspondant fait l'objet de l'annexe A-22. Là encore, la boucle sur les positions est éclatée. Le troisième exemple de réalisation traite du décodage du rang d'une permutation, en codage 3GPP AMR-WB+. On utilise préférentiellement une représentation éclatée des décompositions de base comme dans le premier exemple de réalisation et une décomposition du rang partiel en trois termes comme dans le second exemple de réalisation. La boucle sur les positions n'est pas éclatée toutefois. Comme indiqué précédemment, plutôt que de déterminer la décomposition intermédiaire de Pk à partir de décompositions de base, on la détermine à partir d'une décomposition intermédiaire de Pk-1 et de la décomposition de base de Le traitement correspondant fait l'objet de l'annexe A-3. On note que l'exposant du facteur premier pi du quotient (respectivement du produit) est stocké dans l'élément R[i-1] (resp. P[i-1]) du tableau R (resp. P) à quatre éléments. Ainsi, le premier exemple ci-avant utilise une décomposition du rang partiel en deux termes (dont un quotient), les deux autres exemples utilisent une décomposition en trois termes (deux pour le numérateur et un pour le dénominateur). Le mode pour le décodage n'utilise que m8!(=4) termes tandis que les deux modes pour le codage utilisent un traitement séparé des positions pour exploiter les ml! ou ml termes qui ne sont pas lus mais inscrits "en dur" dans l'algorithme en éclatant la boucle sur les 8 positions d'un point du réseau de Gosset. Un dernier exemple de réalisation concerne le codeur fréquentiel perceptuel TDAC de la Demanderesse utilisé pour coder des signaux audio numériques échantillonnés à 16 kHz (bande élargie), dont le principe est décrit ci-après. Le codeur TDAC utilise une quantification vectorielle statistique à dimension et résolution variables de dimension maximale 15. Dans le cas des codes à permutation du réseau régulier de points RE8 de dimension 8, l'invention permet essentiellement de réduire la complexité. Par contre, dans le cas du codeur TDAC, qui utilise des codes à permutations de dimension supérieure à 12, l'invention s'avère très avantageuse car elle permet non seulement une réduction de complexité mais aussi une réalisation du codeur sur des processeurs en virgule fixe dont la précision maximale est limitée à des entiers de 32 bits non signés. Sans l'invention, une telle réalisation serait extrêmement complexe. Le principe de ce codeur est le suivant. Un signal audio limité en bande à 7 kHz et échantillonné à 16 kHz est découpé en trames de 320 échantillons (20 ms). Une transformée en cosinus discrète modifiée (ou "MDCT") est appliquée sur des blocs du signal d'entrée de 640 échantillons avec un recouvrement de 50 % (ce qui correspond à un rafraîchissement de l'analyse MDCT toutes les 20 ms). On limite le spectre à 7225 Hz en fixant à zéro les 31 derniers coefficients (seuls alors les 289 premiers coefficients étant différents de 0). Une courbe de masquage est déterminée à partir de ce spectre et tous les coefficients masqués sont mis à zéro. Le spectre est divisé en 32 bandes de largeurs inégales. Les éventuelles bandes masquées sont déterminées en fonction des coefficients transformés des signaux. Pour chaque bande du spectre, l'énergie des coefficients MDCT est calculée (pour évaluer des facteurs d'échelle). Les 32 facteurs d'échelle constituent l'enveloppe spectrale du signal qui est ensuite quantifiée, codée et transmise dans la trame. L'allocation dynamique des bits se base sur une courbe de masquage par bande calculée à partir de la version déquantifiée de l'enveloppe spectrale, de manière à obtenir une compatibilité entre l'allocation binaire du codeur et du décodeur. Les coefficients MDCT normalisés dans chaque bande sont ensuite quantifiés par des quantificateurs vectoriels utilisant des dictionnaires imbriqués en taille, les dictionnaires étant composés d'une union de codes à permutation de type Il. Finalement, les informations sur la tonalité et le voisement ainsi que l'enveloppe spectrale et les coefficients codés sont multiplexés et transmis en trame. L'exemple de réalisation pour le calcul du rang d'une permutation (codage) utilise ici une représentation compacte des décompositions. La dimension des codes à permutation utilisée étant variable, la boucle sur les positions n'est pas éclatée. Ce mode de réalisation illustre une procédure de détection des exposants non nuls de la décomposition d'un rang partiel. Ici, les décompositions de base sont représentées de façon compacte. On stocke les mots contenant leurs exposants dans deux tableaux à seize éléments (=(15+1)). Dans l'annexe B-1, Le tableau D'l contient les mots pour les décompositions des entiers l ( 0 ≤ l ≤ 15 ) et le tableau D'l! contient les mots pour les décompositions de leurs factorielles. On stocke aussi les puissances de 3 dans un tableau à huit éléments (noté Pow3) et les puissances de 5, 7, 11 et 13 dans un tableau (noté Pow) à vingt éléments (avec stockage factice de 0 pour les puissances non utilisées). Le traitement correspondant est retranscrit en annexe B-2. Bien entendu, la présente invention ne se limite pas aux formes de réalisation décrites ci-avant à titre d'exemple ; elle s'étend à d'autres variantes. A la connaissance de la Demanderesse, la présente invention consiste en la première utilisation des décompositions en puissances de facteurs premiers dans les codes à permutation. Cette utilisation est pourtant particulièrement avantageuse dès lors que des calculs d'expressions combinatoires sont prévus, comme dans la quantification vectorielle avec codes à permutation. Ainsi, de manière générale, la présente invention vise cette utilisation des décompositions en puissances de facteurs premiers pour toute expression combinatoire, même différente d'un rang d'une permutation, en codage/décodage par un ou des codes à permutation. La présente invention trouve une application avantageuse en codage/décodage de signaux de parole, par exemple dans des terminaux de téléphonie notamment cellulaire. Toutefois, elle s'applique au codage/décodage de signaux de tout autre type, notamment de signaux d'image ou vidéo ainsi qu'en modulation codée. La présente invention vise aussi un programme informatique destiné à être stocké en mémoire d'un dispositif de codage/décodage de signaux numériques, utilisant des codes à permutations. Ce programme comporte alors des instructions pour la mise en oeuvre des étapes du procédé au sens de l'invention. Typiquement, les La présente invention vise aussi un dispositif de codage/décodage de signaux numériques, utilisant des codes à permutations, et comprenant, en référence à la
Ces moyens MEM, PROC peuvent être prévus :
Bien entendu, les représentations préenregistrées dans la mémoire MEM peuvent être sous forme de contenus d'adresses (représentation éclatée) ou sous la forme de mots de bits (représentation compacte).
|