Moyenne mobile
La moyenne mobile, ou moyenne glissante, est un type de moyenne statistique utilisée pour analyser des séries ordonnées de données, le plus souvent des séries temporelles, en supprimant les fluctuations transitoires de façon à en souligner les tendances à plus long terme. Cette moyenne est dite mobile parce qu'elle est recalculée de façon continue, en utilisant à chaque calcul un sous-ensemble d'éléments dans lequel un nouvel élément remplace le plus ancien ou s'ajoute au sous-ensemble.
Ce type de moyenne est utilisĂ© gĂ©nĂ©ralement comme mĂ©thode de lissage de valeurs, en particulier dans le domaine industriel, commercial et plusieurs autres secteurs de l'Ă©conomie, par exemple pour Ă©tablir des prĂ©visions de la demande dâun produit ou service, pour dĂ©terminer les prĂ©visions de ventes[1], pour examiner des sĂ©ries chronologiques macroĂ©conomiques (produit intĂ©rieur brut, emploi ou d'autres).
Mathématiquement, toute moyenne mobile est un exemple de convolution. Physiquement, une moyenne mobile est un filtre passe-bas et possÚde ainsi un lien profond avec le traitement du signal. En particulier, la moyenne mobile exponentielle, que nous allons aborder plus loin, est un filtre linéaire passe-bas du premier ordre tout à fait classique.
Moyenne mobile arithmétique
Point de vue classique
C'est une moyenne qui au lieu d'ĂȘtre calculĂ©e sur l'ensemble des n valeurs d'un Ă©chantillonnage, est calculĂ©e tour Ă tour sur chaque sous-ensemble de N valeurs consĂ©cutives (N †n). Le sous-ensemble utilisĂ© pour calculer chaque moyenne, parfois appelĂ© « fenĂȘtre », « glisse » sur l'ensemble des donnĂ©es.
Par exemple, le tableau suivant montre les moyennes mobiles simples sur 3 valeurs, pour une série de 9 mesures.
Mesures | 2 | 3 | 5 | 8 | 8 | 7 | 8 | 5 | 2 |
---|---|---|---|---|---|---|---|---|---|
Moyenne glissante |
néant | (2 + 3 + 5)/3
3,3333 |
(3 + 5 + 8)/3
5,3333 |
(5 + 8 + 8)/3
7 |
(8 + 8 + 7)/3
7,6666 |
(8 +7 + 8)/3
7,6666 |
(7 + 8 + 5)/3
6,6666 |
(8 + 5 + 2)/3
5 |
néant |
Autre exemple : dans le cas particulier du domaine de la pollution atmosphĂ©rique, est utilisĂ©e une « moyenne glissante sur 8 heures » de la concentration d'un polluant (c'est en l'occurrence le cas de l'ozone, en objectif de qualitĂ© pour la protection de la santĂ© humaine) ; cette moyenne pourra ĂȘtre calculĂ©e de 0h00 Ă 8h00, de 1h00 Ă 9h00, de 2h00 Ă 10h00, etc. On recherchera, sur une journĂ©e, la valeur maximale de la moyenne glissante, qui devra ĂȘtre infĂ©rieure Ă une concentration donnĂ©e. L'intĂ©rĂȘt d'une moyenne glissante est de lisser les Ă©ventuels Ă©carts accidentels.
Le calcul successif de moyennes mobiles pour une mĂȘme suite de nombres exige de conserver toutes les valeurs utilisĂ©es par les moyennes prĂ©cĂ©dentes, afin de remplacer le terme le plus ancien par le plus rĂ©cent.
Une formule permettant de calculer une moyenne mobile simple est
Nature du filtre constitué par la moyenne mobile arithmétique
L'expression de gauche, ci-dessus, n'est autre qu'un produit de convolution discret entre un signal et une fonction porte de hauteur . La transformĂ©e de Fourier de cette fonction est un sinus cardinal. Par consĂ©quent, cette moyenne possĂšde une rĂ©ponse en frĂ©quence potentiellement dĂ©rangeante, certaines variations de Ă©tant reportĂ©es nĂ©gativement dans et d'autres positivement. Cela est interprĂ©table comme un dĂ©phasage passant brusquement d'un extrĂȘme Ă l'autre en fonction de la vitesse de variation des donnĂ©es.
Moyenne mobile pondérée
Une moyenne mobile pondérée est une moyenne mobile qui utilise des coefficients pour donner un poids distinct à chaque valeur utilisée dans le calcul. Dans le cas d'une moyenne mobile pondérée, les poids de chaque terme décroissent linéairement, le plus récent ayant un poids de et le plus ancien (le ne en partant de la fin, soit ) ayant un poids unitaire.
Le dĂ©nominateur est un nombre triangulaire, et peut ĂȘtre directement calculĂ© comme
Comme la moyenne mobile simple, le calcul successif de moyennes mobiles pondĂ©rĂ©es pour une mĂȘme suite exige de conserver toutes les valeurs utilisĂ©es par les moyennes prĂ©cĂ©dentes.
Moyenne mobile exponentielle
Point de vue classique
Une moyenne mobile exponentielle utilise une pondération des termes qui décroßt exponentiellement. Le poids de chaque valeur participant à la moyenne (souvent désignée par le terme observation en statistiques) est d'un facteur plus grand que la valeur qui le précÚde dans la série, ce qui donne plus d'importance aux observations les plus récentes, sans toutefois jamais supprimer complÚtement l'effet des valeurs les plus anciennes.
Une constante de lissage contrĂŽle le degrĂ© de dĂ©croissance des poids applicables Ă chaque observation participant Ă la moyenne. Cette constante, α, est un nombre compris entre 0 et 1 ; elle peut ĂȘtre exprimĂ©e :
- par sa valeur numérique : α = 0,1 ;
- en pourcentage : α = 10 % équivaut à α = 0,1 ;
- en nombre de pĂ©riodes : N = 19, oĂč approximativement, Ă©quivaut Ă©galement à α = 0,1.
Contrairement aux autres types de moyennes glissantes, le nombre de périodes N ne représente pas le nombre de valeurs participant à la moyenne ; il ne sert qu'à spécifier la constante de lissage α. En effet, chaque nouveau calcul de la moyenne mobile exponentielle ajoute l'effet de la plus récente observation sans en abandonner une plus ancienne. Le poids total des N plus récentes observations utilisées par une moyenne mobile exponentielle constitue environ 86 % du poids total avec la formule (la précision de cette formule augmente avec N). Pour que N périodes pÚsent précisément 86 % dans la moyenne (surtout requis lorsque N est petit), la formule exacte est α = 1 - (1 - 0,86)1/N.
Dans sa forme la plus simple, la moyenne pondĂ©rĂ©e exponentielle s'exprime en fonction de cette mĂȘme moyenne calculĂ©e lors de la prĂ©cĂ©dente pĂ©riode. Il en existe deux formulations:
On peut écrire différemment ces expressions pour souligner que la moyenne mobile exponentielle tend à conserver sa valeur précédente, n'en différant que par une fraction de sa différence avec la plus récente observation:
- Roberts (1959) : ââ Hunter (1986) :
Une moyenne mobile exponentielle doit ĂȘtre initialisĂ©e; le plus souvent, on impose mais on peut Ă©galement, par exemple, lui assigner une moyenne simple des 4 ou 5 premiĂšres observations. L'effet de l'initialisation de sur les moyennes mobiles ultĂ©rieures dĂ©pend de α ; de plus grandes valeurs de la constante de lissage tendent Ă attĂ©nuer plus rapidement l'impact des observations plus anciennes. En effet, l'expansion de la forme de Roberts en y substituant rĂ©cursivement les moyennes mobiles exponentielles des calculs prĂ©cĂ©dents donne une somme infinie, mais puisque l'expression est infĂ©rieure Ă 1, les termes anciens sont de plus en plus petits et peuvent Ă©ventuellement ĂȘtre ignorĂ©s.
En posant ÎČ = (1 - α), ÎČ â [0, 1] et en remarquant que , on a :
L'expression ci-dessus est pratique lorsque l'on veut trouver n coefficients d'un FIR approximant un filtre passe bas du premier ordre de constante de temps oĂč est la pĂ©riode d'Ă©chantillonnage.
Nature du filtre constitué par la moyenne mobile exponentielle
L'expression , ci-avant, n'est autre qu'un produit de convolution discret entre un signal et un filtre passe-bas du premier ordre. En effet, en écrivant sous la forme , on identifie la réponse impulsionnelle d'un filtre passe bas du premier ordre d'amplification et dont la pulsation de coupure est , exprimée en radians/échantillon. est négatif, les paramÚtres du filtre sont donc bien positifs.
Pour considérer des formes plus adaptées au contexte, notons que la fréquence de coupure est de cycles/échantillon, soit une période de coupure de échantillons. ConcrÚtement, lorsque varie assez rapidement, lorsque fluctue en moins de échantillons, la fluctuation se retrouve dans mais est d'autant plus affaiblie qu'elle est rapide. Plus précisément, l'atténuation est de 20 dB/décade.
Par conséquent, la moyenne mobile exponentielle souffre du principal défaut des filtres passe bas classiques, à savoir un déphasage des données. Cela se traduit par un retard entre l'évolution de et l'évolution des données , et ce retard dépend de la rapidité de l'évolution.
Autres types de moyennes
Tout comme il existe une infinité de filtres dans le domaine du traitement du signal, il existe une infinité de moyennes glissantes. Dans cet article, seules les plus courantes ont été évoquées avec leurs particularités dans l'espace de Fourier, et il apparait qu'elles entraßnent des déphasages qui nuisent à la qualité des résultats, ou posent des problÚmes spectraux soulevées par l'échantillonnage sous-jacent aux produits de convolution discrets.
Une moyenne moins commune possÚde de meilleures caractéristiques. Elle se réalise par un filtre gaussien récursif. Bien qu'un filtre gaussien récursif parfait n'existe pas, il existe d'excellentes approximations d'ordre 4 grùce auxquelles seuls les défauts liés à l'échantillonnage subsistent (voir, par exemple, Deriche 1993). En effet, la transformée de Fourier d'une gaussienne est une gaussienne. Par conséquent, elle ne présente aucun déphasage, au contraire de la moyenne mobile exponentielle, et aucune oscillation, au contraire de la moyenne mobile arithmétique. Mais les calculs sont plus lourds (un filtre quasi-gaussien d'ordre 4 nécessite environ 16 opérations par valeur) et ces caractéristiques idéales ne sont rencontrées que si la moyenne est réalisée sur des données connues d'avance (un déphasage apparaßt si seule la partie causale du filtre est utilisée).
Enfin, au lieu d'utiliser une moyenne, on peut utiliser un autre critÚre de position, typiquement la médiane.
Généralisation
On peut voir la moyenne comme une rĂ©gression par une droite horizontale. On peut Ă la place utiliser une rĂ©gression polynomiale : sur la fenĂȘtre glissante, on effectue une rĂ©gression polynomiale, et la valeur au centre de la fenĂȘtre est remplacĂ©e par la valeur du polynĂŽme trouvĂ© (valeur lissĂ©e). Ce type de filtre est « moins brutal » et permet Ă©galement de dĂ©terminer la dĂ©rivĂ©e de la courbe lissĂ©e. Si l'espacement entre les Ă©chantillons est constant, la valeur lissĂ©e est simplement une combinaison linĂ©aire des valeurs contenues dans la fenĂȘtre, c'est-Ă -dire finalement une moyenne pondĂ©rĂ©e, les coefficients de pondĂ©ration n'Ă©tant ni linĂ©aires, ni exponentiels mais formant une « courbe en cloche » symĂ©trique par rapport au centre de la fenĂȘtre.
RĂ©ponses impulsionnelles
On peut voir sur le graphique ci-contre la réponse impulsionnelle pour deux types de moyennes. On peut y lire les valeurs de la pondération utilisée, à une symétrie prÚs (résultat Metastock v10).
Notes et références
- (en) Cet article est partiellement ou en totalitĂ© issu de lâarticle de WikipĂ©dia en anglais intitulĂ© « Moving average » (voir la liste des auteurs).
- https://www.faq-logistique.com/Methodes-Previsions.htm.
- (en) « NIST/SEMATECH e-Handbook of Statistical Methods: EWMA Control Charts », sur National Institute of Standards and Technology (consulté le ).
- (en) « NIST/SEMATECH e-Handbook of Statistical Methods: Single Exponential Smoothing », sur National Institute of Standards and Technology (consulté le ).
Annexes
Articles connexes
Liens externes
- (en) Café Math : Moving Averages : Article de blog sur le calcul des moyennes mobiles