AccueilđŸ‡«đŸ‡·Chercher

GIGO

En informatique, GIGO (garbage in, garbage out) est l'idée selon laquelle des données d'entrée défectueuses ou absurdes produisent des sorties absurdes ou « déchets ». Au Royaume-Uni, le terme parfois utilisé est « rubbish in, rubbish out » (RIRO)[1] - [2].

Le principe s'applique également de maniÚre plus générale à toute analyse et logique, en ce sens que les arguments ne sont pas valables si leurs prémisses sont erronées.

Historique

L'expression est populaire dĂšs la naissance de l'informatique, et s'applique encore plus aujourd'hui puisque les ordinateurs rĂ©cents peuvent produire de plus grandes quantitĂ©s de donnĂ©es ou d'informations erronĂ©es en peu de temps. La premiĂšre utilisation de ce terme remonte Ă  un article du de l'agence de presse The Times of Northwest Indiana portant sur les mathĂ©maticiens de l'armĂ©e amĂ©ricaine et leur travail avec les premiers ordinateurs[3]. William D. Mellin y dĂ©crit que les ordinateurs ne peuvent pas penser par eux-mĂȘmes et que des entrĂ©es « mal programmĂ©es » conduisent inĂ©vitablement Ă  des rĂ©sultats incorrects. Une remarque similaire est notĂ©e par un des prĂ©curseurs de l'informatique :

« On two occasions I have been asked, “Pray, Mr. Babbage, if you put into the machine wrong figures, will the right answers come out?” ... I am not able rightly to apprehend the kind of confusion of ideas that could provoke such a question. »

— Charles Babbage, Passages from the Life of a Philosopher[4]

« À deux reprises on m'a demandĂ©, “Dites-nous, Mr. Babbage, si vous mettez dans la machine des chiffres erronĂ©s, est-ce que des bonnes rĂ©ponses en sortiront ?”... Je ne suis pas en mesure d'apprĂ©hender correctement le type de confusion d'idĂ©es qui pourrait provoquer une telle question. »

— Passages from the Life of a Philosopher[5]

Plus récemment, la Marine Accident Investigation Branch parvient à une conclusion similaire :

« A loading computer is an effective and useful tool for the safe running of a ship. However, its output can only be as accurate as the information entered into it. »

— MAIB, DĂ©pliant sur la sĂ©curitĂ© Hoegh Osaka : Listing, flooding and grounding on 3 January 2015[6]

« Un ordinateur est un outil efficace et utile pour le bon fonctionnement d'un navire. Toutefois, ses rĂ©sultats ne peuvent ĂȘtre qu'aussi justes que les informations qui y sont entrĂ©es. »

— DĂ©pliant sur la sĂ©curitĂ© Hoegh Osaka : Listing, flooding and grounding on 3 January 2015[7]

Le terme pourrait ĂȘtre dĂ©rivĂ© de Last in, first out (LIFO) ou first in, first out (FIFO)[8].

« Decision-makers increasingly face computer-generated information and analyses that could be collected and analyzed in no other way. Precisely for that reason, going behind that output is out of the question, even if one has good cause to be suspicious. In short, the computer analysis becomes a credible references point although based on poor data. »

— Daniel Brooks, Jerry Marlatt, Computer Applications in Particular Industries: Securities[9]

« Les dĂ©cideurs sont de plus en plus confrontĂ©s Ă  des informations et des analyses gĂ©nĂ©rĂ©es par ordinateur qui ne pourraient ĂȘtre ni collectĂ©es ni analysĂ©es autrement. C'est prĂ©cisĂ©ment pour cette raison qu'il est hors de question d'aller au-delĂ  de ces rĂ©sultats, mĂȘme si l'on a de bonnes raisons d'ĂȘtre mĂ©fiant. En bref, l'analyse informatique devient un point de rĂ©fĂ©rence crĂ©dible bien qu'elle soit basĂ©e sur des donnĂ©es mĂ©diocres. »

— Computer Applications in Particular Industries: Securities[10]

Usage

Ce terme peut Ă©galement ĂȘtre utilisĂ© pour dĂ©crire un fichier audio ou vidĂ©o numĂ©rique de mauvaise qualitĂ© . Bien que la numĂ©risation puisse ĂȘtre la premiĂšre Ă©tape du nettoyage d'un signal analogique, elle n'amĂ©liore pas la qualitĂ© du fichier: les dĂ©fauts originels seront toujours enregistrĂ©s, mais pourront ĂȘtre identifiĂ©s et Ă©liminĂ©s lors d'une Ă©tape ultĂ©rieure par le traitement numĂ©rique du signal.

GIGO est couramment utilisĂ© pour dĂ©crire des erreurs dans la prise de dĂ©cision, dues Ă  des donnĂ©es erronĂ©es, incomplĂštes ou imprĂ©cises. Cet usage est antĂ©rieur Ă  l'Ăšre informatique, mais le terme peut encore ĂȘtre appliquĂ©.

GIGO Ă©tait aussi le nom d'un programme passerelle de Usenet vers FidoNet, MAUSnet, entre autres[11].

En statistique

Une analyse statistique est toujours possible avec des donnĂ©es incorrectes. MĂȘme si elles peuvent empĂȘcher une analyse correcte[12], les donnĂ©es peuvent toujours ĂȘtre traitĂ©es. D'oĂč l'importance de connaĂźtre les conditions de rĂ©cupĂ©ration de l'Ă©chantillon.

Le proverbe « une horloge cassĂ©e a raison deux fois par jour » en est un exemple : ce « rĂ©sultat » peut ĂȘtre dĂ©fini comme partiellement correct, en notant que certains rĂ©glages de l'heure ne sont corrects que deux fois par jour, lorsque l'observation coĂŻncide avec le rĂ©sultat attendu par accident.

En outre, les donnĂ©es qui reprĂ©sentent un dĂ©compte, mĂȘme incorrect, n'affecte pas la prĂ©cision de celles-ci[13].

Voir aussi

Références

  1. (en-GB) « Machine learning collaborations accelerate materials discovery », sur Physics World, (consulté le )
  2. (en) John Adair, The Art of Creative Thinking: How to be Innovative and Develop Great Ideas, Kogan Page Publishers, (ISBN 978-0-7494-6008-2, lire en ligne)
  3. « Clipped From The Times », The Times,‎ , p. 65 (lire en ligne, consultĂ© le )
  4. (en) Charles Babbage et Green, Longman, Roberts and Green Longman, Passages from the life of a philosopher, (OCLC 258982, lire en ligne)
  5. (en) Charles Babbage et Green, Longman, Roberts and Green Longman, Passages from the life of a philosopher, (OCLC 258982, lire en ligne)
  6. (en) MAIB, « Hoegh Osaka: Listing, flooding and grounding on 3 January 2015 », sur https://gov.uk,
  7. (en) MAIB, « Hoegh Osaka: Listing, flooding and grounding on 3 January 2015 », sur https://gov.uk,
  8. (en-GB) « World Wide Words: Garbage in, garbage out », sur World Wide Words (consulté le )
  9. (en) Daniel T. Brooks, Computer Applications in Particular Industries: Securities, Computers & The Law, American Bar Association, Section of Science and Technology, , 3e Ă©d., p. 250, 253
  10. (en) Daniel T. Brooks, Computer Applications in Particular Industries: Securities, Computers & The Law, American Bar Association, Section of Science and Technology, , 3e Ă©d., p. 250, 253
  11. (en) jfesler, « GIGO History · GIGO », sur gigo.com, (consulté le )
  12. (en-US) « How Anomalies Can Wreck Your Data (Garbage In, Garbage Out) », sur Heap, (consulté le )
  13. (en) Jim Fowler, Phil Jarvis et Mel Chevannes, Practical Statistics for Nursing and Health Care., :
    « A hospital bed, in general, does not usually have half a person, unless one person is sprawled across more than one bed, or ... something else found in battlefield situations. »
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplĂ©mentaires peuvent s’appliquer aux fichiers multimĂ©dias.