Rapport de vraisemblance
En médecine fondée sur les faits, les rapports de vraisemblance sont des outils numériques permettant d'évaluer l'efficacité d'un test médical pour discriminer les individus sains des individus malades. Ils s'appuient sur les deux caractéristiques informationnelles intrinsèques d'un test qui sont sa sensibilité et sa spécificité.
Pour un test de spécificité Sp et sensitivité Se, les outils fréquemment utilisés sont[1]:
- Le rapport de vraisemblance positif :
- Le rapport de vraisemblance négatif :
L'usage de rapports de vraisemblance en analyse séquentielle (donc hors du champ médical) date de 1945[2]. Les communications au sujet des rapports de vraisemblance positif et négatif en médecine datent de la fin des années 1970[3] - [4] - [5].
Contexte et mise en place
Un test médical est destiné à déterminer si une personne est malade (M) ou saine (S) en pratiquant un test (observation d'un symptôme ou analyse de laboratoire) qui se révèle positif (T+) pour les personnes malades et négatifs (T-) pour les personnes saines.
Dans l'idéal, il serait souhaitable que le test soit parfait, c'est-à-dire que 100% des malades aient un test positif et que 100% des personnes saines aient un test négatif. Mais c'est rarement le cas. La population se partage en 4 familles :
Malade | Non malade | |
---|---|---|
Test positif | VP | FP |
Test négatif | FN | VN |
- les vrai positifs (VP) : les malades ayant un test positif ;
- les vrai négatifs (VN) : les personnes saines ayant un test négatif ;
- les faux négatifs (FN) : les malades ayant un test négatif ;
- les faux positifs (FP) : les personnes saines ayant un test positif.
On appelle sensibilité du test la proportion parmi les malades de ceux ayant un test positif : En statistique, une valeur comme s'appelle la vraisemblance de T+ pour M.
On appelle spécificité du test la proportion parmi les personnes saines de celles ayant un test négatif :
Si on connait (ou si on est capable d'estimer) le taux de prévalence de la maladie, c'est-à-dire la proportion de malades dans la population on est capable, grâce au théorème de Bayes d'évaluer, après le résultat du test, la probabilité a posteriori que la personne soit malade, cette quantité s'appelle aussi la valeur prédictive du test[6]:
- pour un test positif :
- pour un test négatif :
Une autre idée à l'origine des rapports de vraisemblance est de travailler sur la cote (odds en anglais) de la maladie, c'est-à-dire un rapport de chance entre être malade et ne pas l'être :
- pour un test positif
- pour un test négatif
Les rapports
sont des quotients de vraisemblances d'où leur nom de rapport de vraisemblance. Ce sont des facteurs correctifs permettant d'augmenter (dans le cas positif) ou diminuer (dans le cas négatif) la cote de la maladie. Ils sont indépendants de la prévalence, on parle de caractéristique intrinsèque du test[7].
Utilisation
Efficacité du test
On estime en général qu'un test est efficace s'il augmente suffisamment la cote d'être malade pour un test positif et la diminue suffisamment pour un test négatif.
- un test de RV+ supérieur à 10 est considéré comme efficace car il multiplie par plus de 10 la cote de la maladie pour une personne positive. La probabilité d'être malade, elle, n'est pas multipliée par 10. Son augmentation dépend de la prévalence initiale de la maladie. Pour une prévalence supérieure à 0,1, et un RV+ de 10, la probabilité d'être malade augmente de 0,45 environ[8];
- un test de RV- inférieur à 0,1 est considéré comme efficace car il divise par 10 la cote de la maladie pour une personne testée négative ;
- un test de RV égal à 1 est inutile car il ne modifie en rien l'estimation de départ.
On s'accorde habituellement sur les critères suivants[9] :
RV+ | RV- | Apport pour le diagnostic |
---|---|---|
> 10 | < 0,1 | Très bon - Diagnostic fiable |
de 5 à 10 | de 0,1 à 0,2 | Assez bon - Diagnostic à confirmer avec d'autres tests |
de 2 à 5 | de 0,2 à 0,5 | Faible - Autres tests nécessaires |
de 1 à 2 | de 0,5 à 1 | Sans utilité pour le diagnostic |
Estimation de la probabilité a posteriori
La connaissance de la prévalence et des deux rapports de vraisemblance permet d'évaluer le risque d'être malade après le résultat du test.
Cela peut se faire par un calcul, ou plus simplement à l'aide d'un nomogramme de Fagan[6].
Le calcul s'appuie sur le fait que probabilité (p) et cote (c) sont reliées par les égalités suivantes :
- et
Pour un test positif, la cote de la maladie (c+) et la probabilité (p+) se calculent par :
- et
Pour un test négatif, la cote de la maladie (c-) et la probabilité (p-) se calculent par :
- et
Le nomogramme de Fagan est un abaque permettant de retrouver ces probabilités à l'aide de simples traits[1].
Rôle de la prévalence et de la fonction Logit
La prévalence de la maladie ne peut souvent qu'être estimée, soit à partir d'études antérieures, soit estimée par le médecin, qui prend en compte des tests précédents effectués, et les indices de son examen médical.
À la formule «Cote a posteriori=RV × cote à priori», on peut appliquer une fonction logarithmique :
Or le logarithme d'une cote est le logit de la probabilité donc
La courbe de logit permet de passer du taux de prévalence à la probabilité a posteriori. Du point d'abscisse Pr sur la courbe, on se déplace en ordonnée de log(RV), on regarde le point correspondant sur la courbe, son abscisse correspond à la probabilité a posteriori.
Ici, le logarithme utilisé est le logarithme népérien. Si on se limite à des probabilités comprises entre 0,1 et 0,9, la courbe est presque confondue avec une droite de pente 2,1/0,4. Un déplacement en ordonnée de log(RV) correspond à un déplacement en abscisse de log(RV) × 0,4/2,1. La probabilité se déplace donc d'environ[8] 0,19 × log(RV). Pour un RV de 10, le déplacement est de 0,45.
En dehors de cette fourchette, en particulier pour une faible prévalence, même un fort rapport de vraisemblance ne permet pas de faire augmenter significativement la probabilité a posteriori. En revanche, pour une prévalence faible, la cote est voisine de la prévalence et le RV peut être utilisé comme un facteur multiplicatif permettant de passer du taux de prévalence à la probabilité a posteriori. Un taux de prévalence de 0,01 et un RV de 10 conduit à une probabilité a posteriori voisine de 0,1.
Illustration sur un exemple
Dans le cadre de la détection du cancer colorectal, un test est élaboré visant à détecter la présence de saignement occulte et testé sur échantillon de 2030 personnes se partageant en 4 groupes.
Cancer confirmé par endoscopie | Pas de cancer | Effectif maginal | |
---|---|---|---|
Test positif | 20 | 180 | 200 |
Test négatif | 10 | 1820 | 1830 |
Effectif marginal | 30 | 2000 | 2030 |
Ce tableau permet d'évaluer
- la prévalence : ;
- la sensibilité : ;
- la spécificité : ;
- le rapport de vraisemblance positif : ;
- le rapport de vraisemblance négatif :
Les rapports de vraisemblance ont une efficacité moyenne.
L'impact ici de la faible prévalence est important : pour un test positif, la probabilité a posteriori d'être malade augmente fortement - on passe de 30 malades sur 2030 en population pré-test à 20 malades sur 200 parmi les testés positifs - mais on a aussi une forte proportion de faux positif puisque 90% des positifs demeurent des personnes saines.
Intervalles de confiance
Pour le calcul des intervalles de confiance les rapports de vraisemblance peuvent être traités comme des proportions de risques.
Cas des tests à plus de deux issues
Il est fréquent qu'un test ne donne pas une réponse par «oui» ou «non» mais une quantité chiffrée. Il s'agit alors de choisir la valeur à partir de laquelle le test est considéré comme positif. Un calcul de rapport de vraisemblance en faisant varier le barre de diagnostic permet d'affiner la prédiction.
Le rapport de vraisemblance est alors une fonction de θ où θ est la valeur à partir de laquelle on estime que le test est positif. Chaque rapport de vraisemblance conduit à une probabilité a posteriori (ou valeur prédictive du test) différente et permet au praticien, en fonction du score obtenu par le patient d'évaluer son risque d'être malade[8] - [10].
Autres rapports de vraisemblance
Les rapports de vraisemblance existent au delà du domaine médicale, en inférence bayésienne, comme rapport de deux fonctions de vraisemblance et servent à déterminer, à l'aide d'un test du rapport de vraisemblance, le meilleur paramètre pour une loi de probabilité.
En médecine, on trouve parfois le terme de rapport de vraisemblance (likelihood ratio) pour la quantité . Ce rapport est le facteur multiplicatif qui permet de passer de la prévalence à la probabilité a posteriori[11]:
- .
Notes et références
- Adrian O. Goeldlin et Martin Perrig, « Examen clinique basé sur l'évidence », Primary and hospital care - Médecine interne général, vol. 16, no 6, , p. 109-112 (lire en ligne)
- (en) Tze Leung Lai, « Martingales in Sequential Analysis and Time Series, 1945–1985 », Electronique Journal for History of probability and Statistics, vol. 5, no 1, (lire en ligne), p. 2-3
- SG Pauker et JP Kassirer, « Therapeutic Decision Making: A Cost-Benefit Analysis », NEJM, vol. 293, no 5, , p. 229–34 (PMID 1143303, DOI 10.1056/NEJM197507312930505)
- JR Thornbury, DG Fryback et W Edwards, « Likelihood ratios as a measure of the diagnostic usefulness of excretory urogram information. », Radiology, vol. 114, no 3, , p. 561–5 (PMID 1118556, DOI 10.1148/114.3.561)
- HJ van der Helm et EA Hische, « Application of Bayes's theorem to results of quantitative clinical chemical determinations. », Clin Chem, vol. 25, no 6, , p. 985–8 (PMID 445835, lire en ligne)
- « Médecine et mathématiques, je t’aime moi non plus. Des faux-positifs largement sous-estimés », Minerva - Evidence based Practice, vol. 14, no 1, , p. 12-13 (lire en ligne)
- « Analyse bivariée », sur LEPCAM site d'e-learning dans le domaine de la santé
- McGee 2002.
- « Comprendre les données statistiques », sur Piriforme Ressources éducatives en ligne en kinésithérapie / physiothérapie
- Voir par exemple (en) David G. Buchsbaum, « Screening for Alcohol Abuse Using CAGE Scores and Likelihood Ratios », Annals of Internal Medecine, vol. 115, no 10, , p. 774-777 (présentation en ligne)
- (en) Judea Pearl; Dana Mackenzie, The Book of Why : The New Science of Cause and Effect, New York, Penguin, , 432 p. (ISBN 978-0-14-198241-0), Suppose a forty-year-old woman gets a mammogram to check for breast cancer, and it comes back positive. The hypothesis, D (for “disease”), is that she has cancer. The evidence, T (for “test”), is the result of the mammogram. How strongly should she believe the hypothesis? Should she have surgery?We can answer these questions by rewriting Bayes’s rule as follows:(Updated probability of D) = P(D|T) = (likelihood ratio) × (prior probability of D) (3.2)where the new term “likelihood ratio” is given by P(T|D)/P(T). It measures how much more likely the positive test is in people with the disease than in the general population.
Bibliographie
- Attia, J (2003). Moving beyond sensitivity and specificity: using likelihood ratios to help interpret diagnostic tests. Austr Presc 26:111-113.
- Davidson, M (2002). The interpretation of diagnostic tests: a primer for physiotherapists. Australian Journal of Physiotherapy 48, 227-232.
- Deeks, J and Altman, D (2004). Diagnostic tests 4: likelihood ratios. BMJ 229:168-169.
- Pewsner, D, Battaglia, M, Minder, C, Marx, A, Bucher, H, Egger, M. (2004). Ruling a diagnosis in and out with “SpPIn” and “SnNOut”: a note of caution. BMJ 329:209-213.
- (en) Steven McGee, « Simplifying Likelihood Ratios », Journal of internal Medecine, vol. 17, no 8, , p. 647-650 (lire en ligne)