Code cyclique

En mathématiques et en informatique, un code cyclique est un code correcteur linéaire. Ce type de code possède non seulement la capacité de détecter les erreurs, mais aussi de les corriger sous réserve d'altérations modérées. Les mathématiques sous-jacentes se fondent sur la théorie des corps finis, et en particulier les extensions de Galois ainsi que les polynômes. Les codes cycliques, encore appelés contrôles de redondance cyclique (CRC), correspondent à une large famille de codes, on peut citer par exemple le code de Hamming, les codes BCH ou le code de Reed-Solomon.

Contexte

Généralités

L'objectif du code cyclique est la correction automatique de certaines altérations de message. La technique utilisée consiste à plonger le message dans un espace plus vaste pour disposer d'une redondance.

Illustration d'un code non correcteur et d'un code correcteur

La figure de droite illustre cette approche. Le code de la partie gauche ne dispose pas de redondance (un mot de code est un message codé, c'est une chaîne de lettre d'un alphabet ici égal aux éléments d'un corps fini. Un code est l'ensemble des mots de code n'ayant pas subi d'altération durant la transmission. La longueur du code, une constante, est le nombre de lettres contenu dans un mot de code.) Le code de la figure correspond aux intersections du quadrillage, le mot de code à transmettre est symbolisé par le point vert. Une altération pendant la transmission déplace le message vers un autre mot de code en rouge. Pour le récepteur, le code reçu est licite, il n'existe aucune information permettant de corriger l'erreur.

Si un code correcteur est utilisé, la figure de droite illustre le mécanisme. L'émetteur plonge son message dans un espace plus vaste, le mot de code correspond à un point vert. L'espace dispose maintenant du quadrillage supplémentaire orange. Si la transmission engendre une unique erreur, alors le message reçu devient un point rouge, si l'altération n'est pas plus grande que le déplacement sur un segment du quadrillage. Le récepteur reçoit alors un message rouge, qui n'est pas un mot de code (car le code correspond aux points verts). Sachant qu'un mot de code a été envoyé et sachant que la transmission ne produit qu'une erreur (c’est-à-dire un unique déplacement sur le quadrillage) il existe un moyen de corriger la transmission.

La mesure de la gravité de l'altération est donnée par la distance de Hamming. Elle correspond au nombre de lettres ayant été modifiées. Les points noirs correspondent aux redondances inutiles. Le code de la figure est capable de corriger les altérations uniques. Un point noir, à une distance de deux du code entre dans la zone non interprétable assurément, il représente une redondance inutile. L'objectif d'un bon code correcteur est d'emplir l'espace avec des boules de même rayon qui ne s'intersectent jamais, ici illustrées par les losanges verts. Si une telle configuration est atteinte, le code est dit parfait.

Code linéaire

Un code linéaire dispose d'une structure algébrique plus riche que celle du cadre général des codes correcteurs.

Les alphabets A et A' sont identifiés et munis d'une structure de corps fini. Le cas le plus fréquent consiste à choisir le corps F₂ ou l'une de ses extensions finies, on parle alors d'alphabet binaire.

Les ensembles E et F sont naturellement munis d'une structure d'espace vectoriel de dimension respectives k et n. Si F_d désigne le corps fini (cf l'article corps fini) de cardinal d où d est une puissance d'un nombre premier p, alors l'espace vectoriel F est généralement identifié à F_dⁿ.

F est muni d'une distance qui dérive du poids de Hamming. La distance entre deux points de F correspond au nombre de coordonnées non nulles de la différence entre les deux points, dans la base canonique. Un code se décrit par trois paramètres, noté [n, k, δ], n est la dimension du code, k la longueur du code et δ la distance minimale entre deux mots du code. Ces notations sont utilisées dans le reste de l'article.

Enfin, l'application d'encodage φ est choisie linéaire, le code est donc un sous-espace vectoriel.

Corps fini

Si la théorie des codes linéaires apporte une solution élégante avec des exemples parfaits, on peut néanmoins remarquer deux manques. D'une part, elle ne propose pas de méthode pour trouver des codes optimaux, et d'autre part, elle propose un cadre algorithmique faible. Il existe bien une addition naturelle. En revanche le produit externe est souvent pauvre. Le corps le plus usité est F₂ ne contenant que deux éléments, 0 qui annule tous les vecteurs et 1 qui les laisse à l'identique. Il ne reste donc que le calcul matriciel.

L'enrichissement algébrique le plus naturel associe à F_d, le corps de l'espace vectoriel, l'extension de dimension m. Ce corps de cardinal d ^m est une extension de Galois, donc disposant de tout l'arsenal de théorèmes de la théorie associée. Une autre structure naturelle est F_d[X] l'ensemble des polynômes à coefficients dans F_d. Cet anneau est de dimension infinie, en revanche, tout élément non nul de l'extension est racine du polynôme suivant :

\forall x\in \mathbb {F} _{d^{m}}^{*}\quad P[x]=0\quad si\;P[X]=X^{d^{m}-1}-1

Une division euclidienne d'un polynôme quelconque par P[X] possède donc pour reste un polynôme de degré strictement inférieur à d ^m - 1 et ayant même image pour tout élément de l'extension. Sous réserve de choisir comme longueur du code une puissance du cardinal du corps, la structure F_d[X]/P[X], quotient de l'anneau commutatif des polynômes par l'idéal engendré par P[X], hérite donc de toutes propriétés nécessaires à l'application de la théorie de Galois.

Dans l'anneau F_d[X]/P[X], la multiplication possède une implémentation logicielle d'exécution particulièrement rapide. Elle correspond à la multiplication des entiers, mais sans retenue et avec la règle X^n-1.X = 1. L'univers algébrique utilisé pour les codes cycliques est celui-là.

Les sous-structures compatibles avec les anneaux sont les idéaux. Ce sont, dans le cas de F_d[X]/P[X], des sous-espaces vectoriels. Pour bénéficier de la structure, il est intéressant de se focaliser sur ces idéaux. Ils correspondent aux sous-espaces vectoriels stables par multiplication par le monôme unitaire X. Un idéal I de l'anneau vérifie donc la propriété:

\forall Q[X]\in \mathbb {I} \quad X.Q[X]\in \mathbb {I}

Remarque: par souci de simplicité, X est identifié avec sa classe dans le quotient F_d[X]/P[X]. Cette identification est utilisée dans tout l'article.

Si une notation plus classique est utilisée, Q[X] est noté x comme un mot de code avec les coordonnées (x_i) et I est noté C pour code, la propriété devient:

\forall (x_{n-1},x_{n-2},\cdots ,x_{1},x_{0})\in C\quad (x_{n-2},x_{n-3},\cdots ,x_{0},x_{n-1})\in C

Le terme code cyclique provient de cette condition nécessaire et suffisante pour qu'un espace vectoriel soit un idéal.

Un résultat de la théorie des anneaux affirme que, dans ce contexte, les idéaux sont engendrés par les diviseurs du polynôme P[X]. Or, la théorie des corps finis montre que les diviseurs de P[X] sont exactement la liste des polynômes irréductibles avec un ordre de multiplicité 1 et possédant toutes ses racines dans l'extension de dimension m (à l'exception du polynôme X non représenté). Un idéal est donc engendré par un produit de polynômes irréductibles, scindés dans l'extension, tous différents entre eux et différents de X.

Définition

Un code linéaire sur F_d et de paramètres [n, k, δ] est dit cyclique si l'espace vectoriel est muni de la structure d'anneau commutatif F_d[X]/P[X], avec P(X) = Xⁿ - 1, et si le code C est un idéal de dimension k de distance minimale δ.

Dire que le code est un idéal revient à dire qu'il est cyclique, c’est-à-dire qu'il vérifie la propriété suivante :

\forall (x_{n-1},x_{n-2},\cdots ,x_{1},x_{0})\in C\quad (x_{n-2},x_{n-3},\cdots ,x_{0},x_{n-1})\in C

Dans ce cas, la longueur du code est toujours une puissance du cardinal du corps de base moins un. Dans la pratique, la longueur du code est une puissance du cardinal du corps, souvent égale à deux et le dernier bit est un bit de parité.

On suppose dorénavant que C est un code cyclique de paramètres [n, k, δ] sur le corps F_d et qu'il existe m tel que d ^m - 1 est égal à n, α désigne une racine primitive de l'extension F_{n + 1} de F_d.

Code cyclique et code parfait

Distance minimale et code binaire

Le Minitel 1, sorti en 1982

Dans le cas des codes binaires, les polynômes cyclotomiques d'indice n à coefficients dans F₂ engendrent des codes cycliques parfaits, de distance minimale égale à trois. Ce type de code est adapté pour les petites perturbations relativement fréquentes. Chaque mot peut comporter une unique erreur, elle sera corrigée. Un code de cette nature est, par exemple utilisé pour le minitel[1], c'est un code BCH sur 17 octets.

La théorie de Galois assure que l'extension F_n de F₂ possède un élément primitif α, et donc F_n est égal à F₂[α]. L'élément α est générateur du groupe multiplicatif, son polynôme minimal est donc un diviseur du polynôme cyclotomique Φ_n d'indice n sur F_d. Son degré est égal à m car α est un élément primitif.

Ce polynôme remplit les conditions d'optimalité.

L'idéal C engendré par Φ_n[X] est un code cyclique.

De plus :

L'idéal C engendré par Φ_n[X] possède les paramètres suivant [2^m - 1, 2^m - m - 1, 3].

Le code associé est donc un code binaire de Hamming. Ce résultat est vrai uniquement parce que le code est binaire. Considérons par exemple F₂₇ = F₃[α] où α est un générateur primitif de l'extension. L'ordre de α est égal à 26, donc α¹³ est une racine carrée de l'unité, différente de 1. α¹³ est donc égal à -1. Le polynôme X¹³ - 1 admet α pour racine, c'est donc un multiple de son polynôme cyclotomique et il est élément du code. Pourtant son poids est égal à deux.

Ce sont donc les spécificités de la caractéristique 2 qui assurent la véracité de la proposition.

L'idéal C engendré par Φ_n[X] est un code parfait.

Dans le cas général, la borne de Singleton n'est pas atteinte. Considérons en effet le cas où m est égal à 7. La longueur n du code est égale à 127, la dimension k du code à 120 et la distance minimale δ à trois. On en déduit:

n-k=7\neq \delta +1=4\;

Démonstration

L'idéal C engendré par Φ_n[X] est un code cyclique.

Les polynômes irréductibles, pour les corps de caractéristique non nulle, peuvent être des diviseurs stricts de polynômes cyclotomiques sur les nombres rationnels. Par exemple, pour sur F₂, chaque facteur irréductible du polynôme cyclotomique d'indice 127 possède comme corps de décomposition le corps F₁₂₈ de dimension 7 sur F₂. Il est donc de degré sept. Sur les nombres rationnels, comme 127 est premier, le polynôme cyclotomique est de degré 126. Sur F₂ ce polynôme a 18 facteurs irréductibles, tous de degré 7.

Montrer que C est un code cyclique revient à montrer que Φ_n[X] est un diviseur de Xⁿ - 1. Si (α_i) est un représentant de chaque classe de conjugaison (cf le paragraphe Polynôme minimal et corps fini de l'article Endomorphisme de Frobenius) à m éléments, l'égalité suivante montre la relation de divisibilité recherchée:

X^{n}-1=(X-1).\prod _{\alpha _{i}}\phi _{\alpha _{i}}[X]

Ce qui achève la démonstration.

La distance minimale δ de l'idéal C engendré par Φ_n[X] est au moins égale à 3, si le code est binaire.

Considérons un polynôme Q[X] de F_d[X] ayant exactement deux monômes à coefficients non nuls et ayant α pour racine:

Q[X]=X^{h+k}+X^{k}=X^{h}.(X^{k}+1)\quad h\in \mathbb {N} \;k\in \mathbb {N} ^{*}

Comme α est racine du polynôme Q[X], l'égalité α^k = 1 est vérifiée. Comme α est un élément primitif du groupe cyclique F_n^* k est un multiple de d ^m - 1. En conséquence, l'image du polynôme Q[X] dans l'espace vectoriel est nulle. Cela signifie que l'espace vectoriel ne contient aucun mot de code ayant un poids égal à deux.

De plus, les seuls monômes ayant α pour racine sont ceux ayant une puissance multiple de son ordre multiplicatif égal à n - 1, leurs images dans l'espace vectoriel sont donc encore nulles.

L'idéal C engendré par Φ_n[X] est un code parfait si le code est binaire.

Soit P le supplémentaire du code composé par tous les polynômes de degré strictement inférieur à m, S la boule de centre le vecteur nul et de rayon 1 et φ l'application de S dans P qui à un polynôme associe son reste par la division euclidienne par le polynôme Φ_n[X]. L'application est linéaire, elle est injective car si deux polynômes ont même image par φ leur différence est un mot de code ayant un poids égal à deux ou à 0. Comme aucun mot de code n'a de poids égal à deux d'après le paragraphe précédent, leur différence est nécessairement nulle. P et S ont même cardinaux, égal à n + 1 c’est-à-dire 2^m. En effet S contient n monômes et le polynôme nul, et P est un espace vectoriel de dimension m. L'application φ est donc une bijection.

Considérons l'ensemble des boules de rayon 1 pour la distance de Hamming. Le paragraphe précédent montre qu'elles sont toutes disjointes. Il suffit alors de démontrer que tout polynôme est élément d'une de ces boules. Soit Q[X] un polynôme quelconque et R[X] le reste de sa division euclidienne par Φ_n[X]. R[X] est élément de P, il existe un élément M[X] de S, c’est-à-dire un polynôme de poids égal à 0 où à 1, tel que φ(R[X]) = M[X]. En effet, φ est une bijection de S dans P. Le polynôme Q[X] - M[X] est un mot de code, car ses deux facteurs ont même reste par la division euclidienne par Φ_n[X]. Comme le poids de M[X] est inférieur ou égal à un, on a montré que Q[X] est à une distance inférieure ou égale à 1 d'un mot de code. Q[X] est donc dans une boule de centre un élément du code et de rayon 1. Ce qui achève la démonstration.

La distance minimale δ de l'idéal C engendré par Φ_n[X] est au plus égal à 3, si le code est binaire.

Si le paramètre δ est plus grand que trois, alors il existe au moins un élément qui n'est dans aucune boule de centre un mot du code et de rayon 1. Or la proposition précédente démontre que l'ensemble de ces boules forme une partition de l'espace vectoriel. Ce qui prouve l'impossibilité et achève la démonstration.

Code BCH

Si le contexte précédent possède de nombreuses applications industrielles, il présente néanmoins des limitations justifiant l'utilisation d'autres méthodes.

La solution précédente s'appuie sur les propriétés de la caractéristique 2. Il peut être utile d'utiliser d'autres corps finis que ceux multiple de deux. Cette contrainte est d'importance relativement faible dans l'industrie, les codes binaires sont en effet largement répandus.

En revanche, une telle approche ne permet que la résolution d'une unique erreur dans un mot. Cette limitation n'est pas compatible avec, par exemple, le cahier des charges des disques compacts. Un disque compact peut subir des rayures ou être localement recouvert d'une poussière. Une suite de lettres erronées peut posséder une longueur égale à 4.096.

La théorie des corps finis permet néanmoins de proposer une solution MSD c’est-à-dire qui atteint la borne de Singleton. Elle se fonde sur un calcul réalisé la première fois par le mathématicien Vandermonde (1735 - 1796) pour résoudre l'équation cyclotomique[2] dans le cas de la caractéristique zéro. Ce calcul reste d'actualité pour les corps finis.

Dans la suite du paragraphe Δ désigne un entier tel que 1 < Δ < n + 1 et β désigne un élément de F_n+1 tel que ses Δ premières puissances soit toutes distinctes

Un polynôme à coefficients dans F_d dont Δ puissances successives et distinctes de β sont racines et sans racine multiple, engendre un code cyclique C dont la distance minimale δ est supérieure ou égale à Δ + 1.

Remarque :La propriété du paragraphe précédent est une conséquence de cette proposition. En effet, les propriétés de l'automorphisme de Frobenius démontrent que si α est racine du polynôme cyclotomique, alors α² l'est aussi dans le cas des corps binaires.

Cette proposition est à la base d'une famille de codes dits code BCH (pour Bose, Ray-Chaudhuri, Hocquenghem)

Un code BCH de longueur prescrite Δ est un code cyclique à coefficients dans F_d et de longueur n tel qu'il existe un entier b et dont le polynôme générateur G vérifie l'égalité suivante. Si b est égal à un 1 le code est dit BCH au sens strict.

G[X]=ppcm(\Phi _{b}[X],\Phi _{b+1}[X],\cdots ,\Phi _{b+\Delta -2}[X])\;

Ici Φ_i[X] désigne le polynôme cyclotomique ayant αⁱ pour racine.

Un code BCH ne permet pas, en général, la génération de codes parfaits. Considérons l'extension binaire de dimension 7 et le code BCH au sens strict de longueur prescrite 5. Son polynôme générateur est le produit de deux polynômes de degré 7, celui ayant α comme racine (et donc aussi α² et α⁴) et celui ayant α³. Il corrige effectivement deux erreurs, mais la boule de centre 0 et de rayon 2 contient 1 + 127 + (127*126)/2 soit 8 129 points, alors qu'un supplémentaire du code est isomorphe à l'espace des polynômes de degré strictement inférieur à 14 soit 16 384. Les redondances sont plus de deux fois plus vastes que la boule de rayon deux.

Certains codes BCH sont néanmoins parfaits. Considérons par exemple l'extension quadratique de F₃. Sa boule unité contient 1 + 26 éléments soit 27. Le polynôme cyclotomique de racine α contient α³ comme deuxième racine, celui contenant α² contient α⁶ comme deuxième racine et le produit des deux polynômes engendre un code de distance minimale 4 et peut donc corriger une unique erreur. Un supplémentaire est isomorphe à l'espace des polynômes de degré inférieur ou égal à 3, et contient donc 27 éléments, autant que la boule unité, le code est donc parfait.

Démonstration

Un polynôme à coefficients dans F_d dont Δ puissances successives distinctes de β sont racines et sans racine multiple, engendre un code cyclique C dont la distance minimale δ est supérieure ou égale à Δ + 1.

Considérons un polynôme P[X] de poids de Hamming inférieur ou égal à Δ et élément du code.

P[X]=a_{\Delta -1}.X^{p_{\Delta -1}}+a_{\Delta -2}.X^{p_{\Delta -2}}+\cdots +a_{1}.X^{p_{1}}+a_{0}.X^{p_{0}}

Soit β^b, β^b+1, ..., β^b+Δ-1 la suite des Δ racines successives du polynôme générateurs. Puisque P[X] est un mot de code, il possède les éléments de la suite comme racine. Si l'on utilise les notations suivantes :

\forall i\in [0,\Delta -1]\quad \alpha _{i}=a_{i}.\beta ^{bp_{i}}\quad et\quad \zeta _{i}=\beta ^{p_{i}}

Les égalités P[β^b+i] = 0 deviennent:

\forall i\in [0,\Delta -1]\quad \sum _{j=0}^{\Delta -1}\alpha _{j}.\zeta _{j}^{i}=0

Si A est le vecteur colonne de coefficients α_i et si B est la matrice de coefficients ζ_jⁱ. Les égalités précédentes s'écrivent sous forme matricielles: B.A = 0. Or B est la transposée d'une matrice de Vandermonde. Comme tous les ζ_j sont distincts, la matrice est inversible. Ceci démontre que A et le vecteur colonne nul, et donc les coefficients a _i sont tous nuls.

En conclusion, l'unique mot du code P[X] de poids inférieur ou égal à Δ est le polynôme nul. La proposition est donc démontrée.

Code de Reed-Solomon

Les CD utilisent un code de Reed-Solomon capable de corriger jusqu'à 4096 bits erronés consécutifs

Si la propriété précédente ne permet pas d'obtenir assurément des codes MDS, l'approche BCH peut être enrichie pour pallier cette difficulté. Considérons par exemple le corps F₆₄. Il peut être vu comme l'extension quadratique de F₈. Alors d est égal à 8 et m à 2. L'espace vectoriel associé est un espace de dimension d ^m égal 63 sur F₈, soit une longueur de 189 en code binaire. Si α désigne un élément primitif du corps F₈, alors le polynôme G[X], défini par :

{\begin{aligned}G[X]&=X^{8}-1\\&=(X-\alpha )\cdot (X-\alpha ^{2})\cdot (X-\alpha ^{3})\cdot (X-\alpha ^{4})\\&\quad \cdot (X-\alpha ^{5})\cdot (X-\alpha ^{6})\cdot (X-\alpha ^{7})\cdot (X-1)\end{aligned}}

est un diviseur de X⁶³ − 1. L'idéal associé est donc un code cyclique C. Le théorème précédent montre que ce code possède une distance minimale de 9. Il admet comme paramètres [63, 55, 9]. C'est un code satisfaisant l'égalité de la borne de Singleton. Considéré comme un code binaire, il corrige jusqu'à 12 erreurs consécutives sur un code de dimension 189 et de longueur 175. Cette idée est à la base du code de Reed-Solomon.

Un Code de Reed-Solomon de distance construite Δ avec 1 < Δ < n est un code BCH sur un corps F_n+1 de dimension n généré par un polynôme G[X] défini par :

G[X]=(X-\alpha ^{b})\cdot (X-\alpha ^{b+1})\cdot \ldots \cdot (X-\alpha ^{b+\Delta -2})\quad {\text{avec}}\;b\in \mathbb {N} ^{*}\;

La proposition du paragraphe précédent montre que :

Un Code de Reed-Solomon de distance construite Δ sur F_n+1 possède pour paramètres [n, n − Δ + 1, Δ]. Un tel code est MDS.

Pour permettre de larges redondances avec une bonne optimalité, trois autres méthodes peuvent être ajoutées, le code raccourci, le code démultiplié et l'entrelacement. Le Code CIRC[3] utilisé pour le disque compact est un code de Reed-Solomon sur le corps F₂₅₆ utilisant ces trois outils.

Implémentation

Notes et références

P. Arnoult Minitel, codage de l'information et corps finis Pour la science N°125 mars 1988
Vandermonde Mémoire sur la résolution des équations (1771)
J.P. Zanotti Codage d'un signal audionumérique sur un support à lecture optique, erreurs au décodage et codes M.S.D Mémoire de D.E.A. Université d'Aix Marseille, 1992

Voir aussi

Liens externes

Code correcteur C.I.R.C par J.P. Zanotti, université de Toulon
L'algèbre et la correction des erreurs par Dany-Jack Mercier, université Antilles-Guyane
Code Linéaire par G. Zemor, université de Bordeaux
Code correcteur par M. Coste, A. Paugam, R. Quarez, université de Rennes 1

Bibliographie

(en) Jessie MacWilliams et Neil Sloane, The Theory of Error-Correcting Codes, North-Holland, 1977 (ISBN 978-0-44485009-6)
A. Spătaru, Fondements de la théorie de la transmission de l'information, PPUR, 1987 (ISBN 978-2-88074133-4)
Michel Demazure, Cours d'algèbre : primalité, divisibilité, codes [détail des éditions]

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.