Accueil🇫🇷Chercher

Notation caret

La notation caret, de l'anglais caret notation que l'on pourrait traduire par notation circonflexe, ou encore notation à accent circonflexe, est une des notations utilisée pour représenter les caractères de contrôle non affichables d'un terminal informatique, c'est-à-dire les caractères ASCII de 0 à 31 et le 127 (soit 33 caractères). Elle consiste en l'écriture d'un accent circonflexe (aussi appelé caret, du latin « il manque ») suivi d'une lettre en capitale dont la position dans l'alphabet latin équivaut à la position du caractère de contrôle dans la table ASCII. Ainsi, le caractère SOH (premier caractère de contrôle ASCII) est représenté par la notation ^A; le caractère EOT par la notation ^D; et ainsi de suite.

Origine

Le mot caret viendrait du verbe latin carere qui signifie manquer[1].

Notation

La notation caret attribue aux lettres de l'alphabet latin (dans sa forme simplifiée) la position des caractères de contrôle dans la table ASCII: ^A fait référence au premier caractère de contrôle (SOH), car A est la première lettre de l'alphabet. Pour représenter le zéroième caractère de contrôle (NUL), ainsi que ceux qui succèdent au 26e caractère de contrôle (SUB), on s'appuie sur la table ASCII en associant aux lettres en capitale leur position dans l'alphabet, autrement dit on assigne au caractère A de la table ASCII la première position. On utilise alors les caractères qui occupent la même position que les caractères de contrôle dans la table ASCII d'origine. Ainsi, le caractère @, qui occupe désormais la zéroième position, représente le zéroième caractère de contrôle (NUL) de la table ASCII d'origine.

Attribution des positions de l’alphabet à la table ASCII
Caractère ASCII ?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_
Position dans la table ASCII 636465666768697071727374757677787980818283848586878889909192939495
Position dans l'alphabet 1234567891011121314151617181920212223242526
Position par rapport Ă  l'alphabet -1012345678910111213141516171819202122232425262728293031

Pour des raisons techniques, le 127e caractère de contrôle (DEL) est représenté par le caractère ? qui, après décalage, occupe la position -1 (ce qui équivaut à la position 127 dans un codage à 7 bits). En effet, après avoir attribué la position 1 au caractère A, c'est-à-dire après avoir décalé les positions de 64 rangs vers la droite, il n'y a plus assez de caractères dans la table ASCII (qui en comprend 128 dans sa forme non étendue) pour représenter le caractère de contrôle (DEL) qui devrait se situer à la 191e position.

Table de correspondance
Notation caretCaractère ASCIINotation caretCaractère ASCII
^@NUL (Null) ^QDC1 (Device Control One)
^ASOH (Start of Header) ^RDC2 (Device Control Two)
^BSTX (Start of text) ^SDC3 (Device Control Three)
^CETX (End of Text) ^TDC4 (Device Control Four)
^DEOT (End of Transmission) ^UNAK (Negative Acknowledge)
^EENQ (Enquiry) ^VSYN (Synchronous Idle)
^FACK (Acknowledge) ^WETB (End of Transmission Block)
^GBEL (Bell) ^XCAN (Cancel)
^HBS (Backspace) ^YEM (End of medium)
^IHT (Horizontal Tabulation) ^ZSUB (Substitute)
^JLF (Line Feed) ^[ESC (Escape)
^KVT (Vertical Tabulation) ^\FS (File Separator)
^LFF (Form Feed) ^]GS (Group separator)
^MCR (Carriage Return) ^^RS (Record Separator)
^NSO (Shift Out) ^_US (Unit separator)
^OSI (Shift In) ^?DEL (Delete)
^PDLE (Data Link Escape)

Utilisation

Certains logiciels, tels que les éditeurs de texte GNU Emacs et Vi utilisent la notation caret. Ils permettent ainsi de distinguer rapidement les caractères de contrôle du reste du contenu.

À titre d'exemple, la description technique du format PNG nous indique que la signature d'un fichier PNG se fait avec les 8 premiers octets dont les valeurs décimales sont les suivantes : 137 80 78 71 13 10 26 10[2]. La lecture d'un tel fichier avec un éditeur de texte utilisant la notation caret nous indique la signature sous cette forme:

Signature d'un fichier PNG en notation caret
notation octale, caret et ASCII
(avec GNU Emacs)
\211PNG^M
^Z
notation hexadécimale, caret et ASCII
(avec Vim)
<89>PNG^M
^Z
On remarque que le caractère de retour à la ligne (LF)
de valeur décimale 10 est affiché normalement.
notation hexadécimale, caret et ASCII
<89>PNG^M^J^Z^J
Le retour à la ligne est affiché en notation caret

Risques de confusion

La notation caret connaît quelques variantes. Certains manuels d'utilisation de logiciel utilisent la notation ^A pour indiquer qu'il s'agit de la combinaison des touches Ctrl + a ou Ctrl + A (Sélectionner tout), ce qui ne correspond absolument plus au caractère de contrôle SOH. Aussi, le logiciel GNU Screen admet la notation ^Ac pour exécuter une commande similaire à la combinaison des touches Ctrl + a + c, telle que dans la commande screen -e^Ac pour ouvrir un nouveau terminal[3]. Enfin, le caret étant très utilisé dans les expressions régulières, on pourrait supposer la présence d'un caractère de contrôle dans la commande grep ^A dictionnaire.txt.

Bibliographie

Note : les documents ci-dessous ne traitent pas directement du sujet mais en parlent brièvement.

Sources

Notes et références

  1. (en)caret sur Vocabulary.com Dictionary
  2. Description du format PNG, section « Signature du PNG », sur le site du W3C
  3. Le manuel d'utilisation de screen

Articles connexes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.