AccueilđŸ‡«đŸ‡·Chercher

Racine de l'erreur quadratique moyenne

La racine de l'erreur quadratique moyenne (REQM) ou racine de l'écart quadratique moyen (en anglais, root-mean-square error ou RMSE, et root-mean-square deviation ou RMSD) est une mesure fréquemment utilisée des différences entre les valeurs (valeurs d'échantillon ou de population) prédites par un modÚle ou estimateur et les valeurs observées (ou vraies valeurs). La REQM représente la racine carrée du deuxiÚme moment d'échantillonnage des différences entre les valeurs prédites et les valeurs observées. Ces écarts sont appelés résidus lorsque les calculs sont effectués sur l'échantillon de données qui a été utilisé pour l'estimation ou ils sont appelés erreurs (ou erreurs de prédiction) lorsqu'ils sont calculés sur des données hors de l'échantillon d'estimation. La REQM agrÚge les erreurs de prédiction de différents points de données en une seule mesure de puissance prédictive accrue. La REQM est une mesure de précision, qui sert à comparer les erreurs de différents modÚles prédictifs pour un ensemble de données particulier et non entre différents ensembles de données, car elle dépend de l'échelle[1].

La REQM est toujours positive et une valeur de 0 (presque jamais atteinte en pratique) indiquerait un ajustement parfait aux données. En général, une valeur de REQM plus petite indique une meilleure précision qu'une valeur de REQM plus élevée. Cependant, les comparaisons entre différents jeux de données ne seraient pas valides car la mesure dépend de l'échelle relative des nombres utilisés.

La REQM est la racine carrée de la moyenne des erreurs quadratiques. L'effet de chacune des erreurs sur la REQM est proportionnel à la taille de l'erreur quadratique; ainsi, des erreurs plus importantes ont un effet disproportionné sur la REQM. Par conséquent, la REQM est sensible aux valeurs aberrantes ou anomalies[2] - [3].

Formule

La REQM d'un estimateur par rapport à un paramÚtre estimé est définie comme la racine carrée de l'erreur quadratique moyenne :

Pour un estimateur sans biais, la REQM est la racine carrée de la variance, aussi appelée l'écart type.

La REQM des valeurs prédites pour les instants t de la variable dépendante d'une régression, avec des variables observées T fois, est calculée pour T différentes prédictions comme la racine carrée de la moyenne des carrés des écarts:

(Pour les régressions sur des données transversales, l'indice t est remplacé par i et T est remplacé par n . )

Dans certaines disciplines, la REQM est utilisée pour comparer les différences entre deux quantités qui peuvent varier, dont aucune n'est acceptée comme "norme". Par exemple, lors de la mesure de la différence moyenne entre deux séries chronologiques et , la formule devient

Normalisation

La normalisation de la REQM facilite la comparaison entre des ensembles de données ou des modÚles à différentes échelles. Bien qu'il n'y ait pas de moyen consistant de normalisation dans la littérature, les choix courants sont la moyenne ou l'étendue (définie comme la valeur maximale moins la valeur minimale) des données mesurées[4]:

ou .

Cette valeur est communĂ©ment appelĂ©e racine de l'Ă©cart quadratique moyen normalisĂ©e ou racine de l'erreur quadratique moyenne normalisĂ©e (REQMN), et souvent exprimĂ©e en pourcentage, oĂč des valeurs plus petites indiquent une variance rĂ©siduelle moindre. Dans de nombreux cas, en particulier pour les Ă©chantillons plus petits, la plage d'Ă©chantillonnage est susceptible d'ĂȘtre affectĂ©e par la taille de l'Ă©chantillon, ce qui nuirait aux comparaisons.

Une autre mĂ©thode possible pour faire de la REQM une mesure de comparaison plus utile consiste Ă  diviser la REQM par l’écart interquartile (aussi appelĂ© Ă©tendue interquartile). Lors de la division du REQM par l'EI, la valeur normalisĂ©e devient moins sensible aux valeurs extrĂȘmes de la variable cible.

oĂč

avec et oĂč Q est la fonction quantile.

Lors de la normalisation par la valeur moyenne des mesures, le terme coefficient de variation du REQM, CV(REQM) peut ĂȘtre utilisĂ© pour Ă©viter toute ambiguĂŻtĂ©[5]. Ceci est analogue au coefficient de variation, le REQM prenant la place de l'Ă©cart type.

Mesures connexes

Certains chercheurs ont recommandé l'utilisation de l'erreur absolue moyenne (EAM) au lieu de la racine de l'erreur quadratique moyenne. L'EAM possÚde des avantages d'interprétabilité par rapport à REQM. L'EAM est la moyenne des valeurs absolues des erreurs. L'EAM est fondamentalement plus facile à comprendre que la racine carrée de la moyenne des erreurs quadratiques. De plus, chaque erreur influence l'EAM directement proportionnellement à la valeur absolue de l'erreur, ce qui n'est pas le cas pour REQM[2].

Applications

  • En mĂ©tĂ©orologie, pour mesurer avec quelle efficacitĂ© un modĂšle mathĂ©matique prĂ©dit le comportement de l'atmosphĂšre.
  • En bioinformatique, la dĂ©viation quadratique moyenne des positions atomiques est la mesure de la distance moyenne entre les atomes de protĂ©ines superposĂ©es.
  • Dans la conception de mĂ©dicaments basĂ©e sur la structure, la REQM est une mesure de la diffĂ©rence entre une conformation de cristal du ligand de conformation et d' un amarrage prĂ©dictif.
  • En Ă©conomie, la REQM est utilisĂ© pour dĂ©terminer si un modĂšle Ă©conomique correspond aux indicateurs Ă©conomiques. Certains experts ont fait valoir que REQM est moins fiable que l'erreur absolue relative[6].
  • En psychologie expĂ©rimentale, la REQM est utilisĂ© pour Ă©valuer dans quelle mesure les modĂšles mathĂ©matiques ou informatiques de comportement expliquent le comportement observĂ© empiriquement.
  • Dans le SIG, la REQM est une mesure utilisĂ©e pour Ă©valuer la prĂ©cision de l'analyse gĂ©ospatiale et de la tĂ©lĂ©dĂ©tection.
  • En hydrogĂ©ologie, la REQM et la REQMN sont utilisĂ©s pour Ă©valuer l'Ă©talonnage d'un modĂšle d'eau souterraine[7].
  • Dans la science de l'imagerie, la REQM fait partie du rapport signal / bruit de crĂȘte, une mesure utilisĂ©e pour Ă©valuer les performances d'une mĂ©thode de reconstruction d'une image par rapport Ă  l'image d'origine.
  • En neuroscience computationnelle, la REQM est utilisĂ©e pour Ă©valuer dans quelle mesure un systĂšme apprend un modĂšle donnĂ©[8].
  • Dans la spectroscopie par rĂ©sonance magnĂ©tique nuclĂ©aire des protĂ©ines, la REQM est utilisĂ©e comme mesure pour estimer la qualitĂ© de l'ensemble de structures obtenu.
  • Les soumissions pour le prix Netflix ont Ă©tĂ© Ă©valuĂ©es en utilisant la REQM et les valeurs "vraies" non divulguĂ©es de l'ensemble de donnĂ©es de test.
  • Dans la simulation de la consommation d'Ă©nergie des bĂątiments, la REQM et le CV(REQM) sont utilisĂ©s pour calibrer les modĂšles en fonction des performances mesurĂ©es du bĂątiment[9].
  • En cristallographie aux rayons X, la REQM est utilisĂ©e pour mesurer l'Ă©cart entre les coordonnĂ©es internes molĂ©culaires et des valeurs de rĂ©fĂ©rences.

Voir Ă©galement

Notes et références

  1. Hyndman et Koehler, « Another look at measures of forecast accuracy », International Journal of Forecasting, vol. 22, no 4,‎ , p. 679–688 (DOI 10.1016/j.ijforecast.2006.03.001).
  2. Pontius, Thontteh et Chen, « Components of information for multiple resolution comparison between maps that share a real variable », Environmental Ecological Statistics, vol. 15, no 2,‎ , p. 111–142 (DOI 10.1007/s10651-007-0043-y).
  3. Willmott et Matsuura, « On the use of dimensioned measures of error to evaluate the performance of spatial interpolators », International Journal of Geographical Information Science, vol. 20,‎ , p. 89–102 (DOI 10.1080/13658810500286976).
  4. « Coastal Inlets Research Program (CIRP) Wiki - Statistics » (consulté le ).
  5. « FAQ: What is the coefficient of variation? » (consulté le ).
  6. Armstrong et Collopy, « Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons », International Journal of Forecasting, vol. 8, no 1,‎ , p. 69–80 (DOI 10.1016/0169-2070(92)90008-w, lire en ligne).
  7. M.P. Anderson et Woessner, W.W., Applied Groundwater Modeling: Simulation of Flow and Advective Transport, 2nd, .
  8. Ensemble Neural Network Model.
  9. ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History.
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplĂ©mentaires peuvent s’appliquer aux fichiers multimĂ©dias.