Faux positif
Un faux positif est le rĂ©sultat d'une prise de dĂ©cision dans un choix Ă deux possibilitĂ©s (positif et nĂ©gatif), dĂ©clarĂ© positif, lĂ oĂč il est en rĂ©alitĂ© nĂ©gatif. Le rĂ©sultat peut ĂȘtre issu d'un test d'hypothĂšse, d'un algorithme de classification automatique, ou tout simplement d'un choix arbitraire.
Statut supposĂ© rĂ©el de lâobjet topique | Statut par rapport au critĂšre dâanalyse | ||
---|---|---|---|
Qualité du constat | Qualité du sujet | Jugement affirmatif
(cas symptomatique) |
Jugement réfutatif
(cas asymptomatique) |
absence | exempt | faux positif | vrai négatif |
présence | concerné | vrai positif | faux négatif |
Dans la pratique, dans les cas oĂč le rĂ©sultat est utilisĂ© pour avertir (alarme, dĂ©tection de virus, etc), un faux positif est une fausse alarme.
Cependant, dans les domaines oĂč le rĂ©sultat espĂ©rĂ© est positif, il convient de distinguer le faux positif et la fausse alarme. La fausse alarme Ă©tant alors le cas faux nĂ©gatif.
Quand ce que l'on recherche est rare, et que le test utilisé n'est pas parfaitement spécifique, il est généralement beaucoup plus probable qu'un cas déclaré positif soit en réalité un faux positif.
La notion de faux positif est utilisée dans de nombreux domaines :
- en biologie et en médecine ;
- en informatique, en particulier
- - en informatique documentaire / documentation automatique, sous le nom de bruit (ensemble des réponses non pertinentes) et
- - en algorithmique quand l'exécution et le résultat sont randomisés ;
- - en sécurité informatique, pour les logiciels anti-virus, les filtres anti-spam (un message ou programme valable injustement considéré comme nuisible par le filtre) ;
- - dans la vérification et la validation logicielles comme en vérification formelle, ou vérification fonctionnelle des systÚmes électronique ou en test logiciel
- en vidéo surveillance, pour la détection d'événements ;
- dans les radars, pour la détection de cibles ;
- dans les domaines du diagnostic, notamment médical
- plus généralement dans tout domaine demandant de prendre une décision binaire, fondée sur des données imprécises.
Signification d'un taux de faux positifs
Par exemple, le dĂ©pistage de la trisomie 21 tel qu'il est couramment pratiquĂ© en France conduit Ă un taux de dĂ©tection de 90 % (câest-Ă -dire un taux de faux nĂ©gatifs de 10 %), pour un taux de faux positifs de 5 %[1].
- Le taux de dĂ©tection de 90 % signifie que si cent femmes enceintes d'un fĆtus trisomique passent ce test, en moyenne 90 grossesses anormales seront correctement identifiĂ©es, et 10 ne seront pas dĂ©tectĂ©es.
- SymĂ©triquement, le taux de faux positifs de 5 % signifie que si cent femmes enceintes d'un fĆtus normal passent ce test, en moyenne 5 seront identifiĂ©es Ă tort comme des grossesses anormales.
Seuil de détection et dépistage
Le rĂ©sultat d'un test a une certaine distribution pour la population « normale », et une autre pour la population « anormale ». Le test est d'autant plus discriminant que ces rĂ©sultats sont nettement diffĂ©rents, mais en gĂ©nĂ©ral les deux distributions se recouvrent Ă la marge. Dans les zones oĂč les rĂ©sultats peuvent se recouvrir, il faut fixer un seuil Ă partir duquel on dĂ©cidera que le test est « positif » ou « nĂ©gatif ».
Un test est d'autant meilleur que le taux de dĂ©tection est Ă©levĂ© (câest-Ă -dire que le taux de faux nĂ©gatifs est faible) et que le taux de faux positifs est faible. Le taux de faux positifs et le taux de dĂ©tection dĂ©pendent tous les deux du seuil choisi et varient dans le mĂȘme sens, ce qui signifie quâil est impossible de simultanĂ©ment augmenter le taux de dĂ©tection et diminuer le taux de faux positif : tout ce que lâon peut faire est de trouver un compromis acceptable entre sensibilitĂ© et spĂ©cificitĂ©[2] - [3] - [4].
- Si l'on fixe un seuil « alarmiste » se déclenchant facilement, on augmente la sensibilité du test : le taux de détection augmentera (puisque plus d'anomalies seront correctement détectées), avec l'inconvénient que le taux de faux positifs augmentera également (puisque plus de cas normaux, précédemment à la limite, seront considérés comme anormaux).
- Inversement, si l'on fixe un seuil plus « prudent », on augmente la spécificité du test : le taux de faux positifs baissera puisque moins de cas normaux seront considérés comme positifs, mais avec l'inconvénient que le taux de détection baissera également (puisque moins de cas anormaux seront pris en compte).
Le choix du seuil dépend de ce que l'on veut faire du test, et de l'arbitrage entre le risque que représente un faux positif et celui d'une faible détection.
Risque de surdiagnostic
En mĂ©decine, plus une maladie est rare, plus le risque de surdiagnostic est Ă©levĂ©. Ainsi, si l'on teste 1 000 personnes au hasard avec un test produisant 5 % de faux positifs, on annonce Ă 50 personnes que le test est positif. Si la maladie ne touche que 1 personne sur 1 000 dans la population gĂ©nĂ©rale, on peut montrer par le thĂ©orĂšme de Bayes que la personne n'a (environ) que 2 % de risque d'ĂȘtre effectivement atteinte (intuitivement, on l'annonce Ă 50 personnes dont une seule est atteinte).
Le test permet, certes, de cerner une population Ă©ventuellement concernĂ©e sur laquelle on peut effectuer des tests plus prĂ©cis (et plus coĂ»teux). Il va cependant gĂ©nĂ©rer de l'angoisse et le risque de traiter une maladie inexistante (basĂ© sur l'opinion erronĂ©e que le test Ă©tant « sĂ»r Ă 95 % », la probabilitĂ© d'ĂȘtre rĂ©ellement atteint est trĂšs Ă©levĂ©e alors qu'elle est d'autant plus faible que la maladie est rare).
Pour cette raison, le dépistage systématique des maladies rares n'est généralement pas envisagé ; on préfÚre cibler des populations à risque.
Notes et références
L'analyse théorique des faux positifs et des faux négatifs fait appel au théorÚme de Bayes.
Bibliographie
- Gilbert Saporta, ProbabilitĂ©s, Analyse des donnĂ©es et Statistiques, Paris, Ăditions Technip, , 622 p. [dĂ©tail des Ă©ditions] (ISBN 978-2-7108-0814-5, prĂ©sentation en ligne)
Références
- D'aprĂšs http://www.gyneweb.fr/sources/obstetrique/depist-triso-prat.htm.
- Evaluation des stratĂ©gies de dĂ©pistage de la trisomie 21 : « SensibilitĂ© et spĂ©cificitĂ© Ă©voluent en sens inverse : toute augmentation de la sensibilitĂ© se fait au dĂ©triment de la spĂ©cificitĂ© dâun test ».
- Qu'est-ce que la dĂ©mence ? , Psychologie & NeuroPsychiatrie du vieillissement. Volume 1, NumĂ©ro 4, 229-35, DĂ©cembre 2003, Revue thĂ©matique : « Le dĂ©placement dâun seuil vers une plus grande sensibilitĂ©, dans la perspective de nâoublier aucun cas, est mĂ©caniquement payĂ© dâune baisse de la spĂ©cificitĂ©, qui conduit Ă augmenter la proportion des faux positifs »
- Les mĂ©thodes de dĂ©tection de fasciola hepatica dans les troupeaux bovins en France, Bull. Acad. VĂ©t. France â 2007 - Tome 160 - N°5 (www.academie-veterinaire-defrance.org)