Bush hid the facts
Bush hid the facts est le nom courant dâun bug prĂ©sent dans certaines applications Windows. Il sâagit dâun mojibake oĂč un texte codĂ© en ASCII est incorrectement interprĂ©tĂ© et affichĂ© en UTF-16LE.
Description
Quand on Ă©crit le texte prĂ©cis «Bush hid the facts» (sans guillemet ni retour Ă la ligne) dans un fichier, quâon lâenregistre avec le codage ASCII (ou son surâensemble le codage CP1252, dit «âŻANSIâŻÂ», par dĂ©faut sur Windows) et quâon lâouvre Ă lâaide du logiciel «âŻBloc-NotesâŻÂ» de Windows, les caractĂšres chinois «çæĄłæ æ©ç æšæ æĄçŽÂ» apparaissent Ă la place du texte dâorigine[1].
Bien que «Bush hid the facts» soit le texte le plus connu qui provoque lâerreur, celleâci peut ĂȘtre causĂ©e par une multitude de textes possĂ©dant des lettres latines et des espaces Ă ces mĂȘmes positions, par exemple «this app can break» et «aaaa aaa aaa aaaaa». Le texte «a » suffit mĂȘme[1].
Origine
Le bug est provoquĂ© par la fonction de dĂ©tection de codage IsTextUnicode. Elle remarque que les octets forment un codage UTF-16LE valide de caractĂšres chinois (bien que leur succession soit dĂ©nuĂ©e de sens en chinois) et en dĂ©duit Ă tort que câest le cas[2].
DĂ©couverte
Le bug existe depuis l'introduction de la fonction en question en 1994, mais n'a pas été découvert avant [3].
Correctif
Windows Vista SP1 et les nouvelles versions du Bloc-Notes possĂšdent maintenant un correctif pour ce bogue.
On peut Ă©viter le problĂšme en enregistrant le texte en UTF-8 ou en UTF-16 plutĂŽt quâen «âŻANSIâŻÂ».
Références
- « Bush Hid The Facts - Notepad Conspiracy Claim », sur www.hoax-slayer.com (consulté le )
- « Some files come up strange in Notepad », sur The Old New Thing (consulté le )
- « David Cumps - Notepad bug? Encoding issue? », sur weblogs.asp.net (consulté le )