Racine de l'erreur quadratique moyenne
La racine de l'erreur quadratique moyenne (REQM) ou racine de l'écart quadratique moyen (en anglais, root-mean-square error ou RMSE, et root-mean-square deviation ou RMSD) est une mesure fréquemment utilisée des différences entre les valeurs (valeurs d'échantillon ou de population) prédites par un modÚle ou estimateur et les valeurs observées (ou vraies valeurs). La REQM représente la racine carrée du deuxiÚme moment d'échantillonnage des différences entre les valeurs prédites et les valeurs observées. Ces écarts sont appelés résidus lorsque les calculs sont effectués sur l'échantillon de données qui a été utilisé pour l'estimation ou ils sont appelés erreurs (ou erreurs de prédiction) lorsqu'ils sont calculés sur des données hors de l'échantillon d'estimation. La REQM agrÚge les erreurs de prédiction de différents points de données en une seule mesure de puissance prédictive accrue. La REQM est une mesure de précision, qui sert à comparer les erreurs de différents modÚles prédictifs pour un ensemble de données particulier et non entre différents ensembles de données, car elle dépend de l'échelle[1].
La REQM est toujours positive et une valeur de 0 (presque jamais atteinte en pratique) indiquerait un ajustement parfait aux données. En général, une valeur de REQM plus petite indique une meilleure précision qu'une valeur de REQM plus élevée. Cependant, les comparaisons entre différents jeux de données ne seraient pas valides car la mesure dépend de l'échelle relative des nombres utilisés.
La REQM est la racine carrée de la moyenne des erreurs quadratiques. L'effet de chacune des erreurs sur la REQM est proportionnel à la taille de l'erreur quadratique; ainsi, des erreurs plus importantes ont un effet disproportionné sur la REQM. Par conséquent, la REQM est sensible aux valeurs aberrantes ou anomalies[2] - [3].
Formule
La REQM d'un estimateur par rapport à un paramÚtre estimé est définie comme la racine carrée de l'erreur quadratique moyenne :
Pour un estimateur sans biais, la REQM est la racine carrée de la variance, aussi appelée l'écart type.
La REQM des valeurs prédites pour les instants t de la variable dépendante d'une régression, avec des variables observées T fois, est calculée pour T différentes prédictions comme la racine carrée de la moyenne des carrés des écarts:
(Pour les régressions sur des données transversales, l'indice t est remplacé par i et T est remplacé par n . )
Dans certaines disciplines, la REQM est utilisée pour comparer les différences entre deux quantités qui peuvent varier, dont aucune n'est acceptée comme "norme". Par exemple, lors de la mesure de la différence moyenne entre deux séries chronologiques et , la formule devient
Normalisation
La normalisation de la REQM facilite la comparaison entre des ensembles de données ou des modÚles à différentes échelles. Bien qu'il n'y ait pas de moyen consistant de normalisation dans la littérature, les choix courants sont la moyenne ou l'étendue (définie comme la valeur maximale moins la valeur minimale) des données mesurées[4]:
- ou .
Cette valeur est communĂ©ment appelĂ©e racine de l'Ă©cart quadratique moyen normalisĂ©e ou racine de l'erreur quadratique moyenne normalisĂ©e (REQMN), et souvent exprimĂ©e en pourcentage, oĂč des valeurs plus petites indiquent une variance rĂ©siduelle moindre. Dans de nombreux cas, en particulier pour les Ă©chantillons plus petits, la plage d'Ă©chantillonnage est susceptible d'ĂȘtre affectĂ©e par la taille de l'Ă©chantillon, ce qui nuirait aux comparaisons.
Une autre mĂ©thode possible pour faire de la REQM une mesure de comparaison plus utile consiste Ă diviser la REQM par lâĂ©cart interquartile (aussi appelĂ© Ă©tendue interquartile). Lors de la division du REQM par l'EI, la valeur normalisĂ©e devient moins sensible aux valeurs extrĂȘmes de la variable cible.
- oĂč
avec et oĂč Q est la fonction quantile.
Lors de la normalisation par la valeur moyenne des mesures, le terme coefficient de variation du REQM, CV(REQM) peut ĂȘtre utilisĂ© pour Ă©viter toute ambiguĂŻtĂ©[5]. Ceci est analogue au coefficient de variation, le REQM prenant la place de l'Ă©cart type.
Mesures connexes
Certains chercheurs ont recommandé l'utilisation de l'erreur absolue moyenne (EAM) au lieu de la racine de l'erreur quadratique moyenne. L'EAM possÚde des avantages d'interprétabilité par rapport à REQM. L'EAM est la moyenne des valeurs absolues des erreurs. L'EAM est fondamentalement plus facile à comprendre que la racine carrée de la moyenne des erreurs quadratiques. De plus, chaque erreur influence l'EAM directement proportionnellement à la valeur absolue de l'erreur, ce qui n'est pas le cas pour REQM[2].
Applications
- En météorologie, pour mesurer avec quelle efficacité un modÚle mathématique prédit le comportement de l'atmosphÚre.
- En bioinformatique, la déviation quadratique moyenne des positions atomiques est la mesure de la distance moyenne entre les atomes de protéines superposées.
- Dans la conception de médicaments basée sur la structure, la REQM est une mesure de la différence entre une conformation de cristal du ligand de conformation et d' un amarrage prédictif.
- En économie, la REQM est utilisé pour déterminer si un modÚle économique correspond aux indicateurs économiques. Certains experts ont fait valoir que REQM est moins fiable que l'erreur absolue relative[6].
- En psychologie expérimentale, la REQM est utilisé pour évaluer dans quelle mesure les modÚles mathématiques ou informatiques de comportement expliquent le comportement observé empiriquement.
- Dans le SIG, la REQM est une mesure utilisée pour évaluer la précision de l'analyse géospatiale et de la télédétection.
- En hydrogéologie, la REQM et la REQMN sont utilisés pour évaluer l'étalonnage d'un modÚle d'eau souterraine[7].
- Dans la science de l'imagerie, la REQM fait partie du rapport signal / bruit de crĂȘte, une mesure utilisĂ©e pour Ă©valuer les performances d'une mĂ©thode de reconstruction d'une image par rapport Ă l'image d'origine.
- En neuroscience computationnelle, la REQM est utilisée pour évaluer dans quelle mesure un systÚme apprend un modÚle donné[8].
- Dans la spectroscopie par résonance magnétique nucléaire des protéines, la REQM est utilisée comme mesure pour estimer la qualité de l'ensemble de structures obtenu.
- Les soumissions pour le prix Netflix ont été évaluées en utilisant la REQM et les valeurs "vraies" non divulguées de l'ensemble de données de test.
- Dans la simulation de la consommation d'énergie des bùtiments, la REQM et le CV(REQM) sont utilisés pour calibrer les modÚles en fonction des performances mesurées du bùtiment[9].
- En cristallographie aux rayons X, la REQM est utilisée pour mesurer l'écart entre les coordonnées internes moléculaires et des valeurs de références.
Voir Ă©galement
- Carré moyen racine
- Erreur absolue moyenne
- Ăcart absolu moyen
- Ăcart moyen signĂ©
- Ăcart quadratique moyen
- Ăcarts carrĂ©s
- Erreurs et résidus dans les statistiques
Notes et références
- Hyndman et Koehler, « Another look at measures of forecast accuracy », International Journal of Forecasting, vol. 22, no 4,â , p. 679â688 (DOI 10.1016/j.ijforecast.2006.03.001).
- Pontius, Thontteh et Chen, « Components of information for multiple resolution comparison between maps that share a real variable », Environmental Ecological Statistics, vol. 15, no 2,â , p. 111â142 (DOI 10.1007/s10651-007-0043-y).
- Willmott et Matsuura, « On the use of dimensioned measures of error to evaluate the performance of spatial interpolators », International Journal of Geographical Information Science, vol. 20,â , p. 89â102 (DOI 10.1080/13658810500286976).
- « Coastal Inlets Research Program (CIRP) Wiki - Statistics » (consulté le ).
- « FAQ: What is the coefficient of variation? » (consulté le ).
- Armstrong et Collopy, « Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons », International Journal of Forecasting, vol. 8, no 1,â , p. 69â80 (DOI 10.1016/0169-2070(92)90008-w, lire en ligne).
- M.P. Anderson et Woessner, W.W., Applied Groundwater Modeling: Simulation of Flow and Advective Transport, 2nd, .
- Ensemble Neural Network Model.
- ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History.