Variogramme
Le variogramme est une fonction mathĂ©matique utilisĂ©e en gĂ©ostatistique, en particulier pour le krigeage. On parle Ă©galement de semivariogramme, de par le facteur Âœ de sa dĂ©finition.
L'analyse variographique, variographie, ou analyse structurale est l'estimation et l'étude d'un variogramme sur une variable aléatoire.
Variogramme d'une fonction aléatoire
Considérons une variable aléatoire, Z de la variable d'espace x, et supposons-la stationnaire, c'est-à -dire que la moyenne et la variance de Z(x) sont indépendantes de x. On pose la grandeur: Comme Z est stationnaire, le membre de droite dépend uniquement de la distance entre les points x et y. Le variogramme à une distance h est alors la demi moyenne des carrés des différences des réalisations de Z sur les points espacés de h.
Variogramme borné
ThĂ©orĂšme â Si Z est une fonction alĂ©atoire stationnaire de covariance C, alors son variogramme est bornĂ© et s'Ă©crit :
La réciproque est fausse : si Z est intrinsÚque et de variogramme borné, alors Z est la somme d'une fonction aléatoire stationnaire de L2 et d'une variable aléatoire réelle.
IntĂ©rĂȘt du variogramme
Le variogramme est défini pour toute fonction aléatoire intrinsÚque et dépendant uniquement de l'interdistance h, alors que la fonction de covariance ne l'est que pour le cas d'une fonction aléatoire stationnaire d'ordre 2. De plus, l'estimation du variogramme n'est pas biaisée par la moyenne, au contraire de la covariance.
Paliers et portée
Si la covariance de Z tend vers 0 Ă l'infini, le variogramme prĂ©sente un palier Îł(â)â=âVar[Z]. On nomme portĂ©e la distance Ă partir de laquelle le variogramme atteint, respectivement, son palier ; la portĂ©e pratique (parfois facteur d'Ă©chelle) est la distance Ă partir de laquelle le variogramme reste dans un intervalle de 5 % autour de son palier. La norme est le rapport de la portĂ©e sur la portĂ©e pratique.
Variogramme expérimental
Le variogramme expérimental ou variogramme empirique est un estimateur du variogramme théorique à partir des données.
Soit un ensemble de points oĂč sont connus les valeurs d'une variable rĂ©gionalisĂ©e z. Pour ĂȘtre exploitable, la somme doit se faire avec une certaine tolĂ©rance, c'est-Ă -dire que l'on rĂ©alisera la somme sur les couples interdistants de h±Ύh, oĂč souvent on dĂ©finit un pas d pour h=nĂd, nââ et la tolĂ©rance ÎŽh=Âœd. Alors on peut estimer le variogramme par la formule : oĂč n(h) est le nombre de paires de points dont l'interdistance est comprise entre h-ÎŽh et h+ÎŽh.
Dans un cas plus gĂ©nĂ©ral, h pourra ĂȘtre un vecteur, et la somme se fera sur tous les points x, y tels que y=x+h. Cela permet de traiter les anisotropies.
Variogramme empirique d'un processus gaussien
Si X est un processus gaussien, on peut estimer une loi du variogramme empirique.
Modélisation (ajustement)
Le variogramme estimé n'est pas prédictif et ne respecte le plus souvent pas les contraintes de krigeage. C'est pourquoi les méthodes géostatistiques modélisent le variogramme estimé par une fonction continue soumise à certaines contraintes (fonction conditionnellement définie négative). Cette étape s'appelle la modélisation ou l'ajustement du variogramme. La modélisation est la partie essentielle du krigeage.
ModĂšle gigogne
Le modĂšle est une fonction continue reproduisant au mieux l'allure gĂ©nĂ©rale du variogramme thĂ©orique. Toutes les fonctions ne sont pas possibles : elle doivent permettre la combinaison linĂ©aire autorisĂ©e. Une combinaison linĂ©aire âi λiZi est dite autorisĂ©e si son espĂ©rance et sa variance sont toujours dĂ©finies (dans le modĂšle en question). On utilise gĂ©nĂ©ralement un modĂšle gigogne de variogramme sous la forme Îł(h)=âi Îłi(h). L'approche en modĂšle gigogne peut conduire Ă considĂ©rer le phĂ©nomĂšne Ă©tudiĂ© comme une somme de fonctions alĂ©atoires indĂ©pendantes, que l'on peut Ă©tudier sĂ©parĂ©ment dans le cadre de l'analyse krigeante ; cependant, ces composantes n'ont gĂ©nĂ©ralement pas de signification physique propre.
Les composantes sont définies par un palier C et éventuellement une portée a et des paramÚtres de formes. Les composantes γi les plus fréquemment utilisées sont :
Comportement | Nom | Norme ÎŽ | Formule de la composanteÎł(h) |
---|---|---|---|
composantes Ă palier C, sans portĂ©e | pĂ©pite pure (correspondant Ă un bruit blanc faible) | â | |
composantes classiques à palier C et portée a | gaussien | 1,731 | |
cubique | 1 | ||
exponentiel | â 2,996 | ||
sphérique en dimension au plus 3[1] | 1 | ||
sinus cardinal[2] | â 20,371 | ||
composantes classiques non-stationnaires | linéaire | 1 | |
puissance[3] | 1 | ||
composantes plus rarement utilisĂ©es | stable ou exponentiel gĂ©nĂ©ralisĂ© | αâ3 | |
gamma | αâ20-1 | , α>0 | |
J de Bessel | 1 | , α>dâ2-1 | |
K de Bessel ou MatĂ©rn oĂč Kα est la fonction de Bessel modifiĂ©e de deuxiĂšme espĂšce de paramĂštre α | 1 | , α>0 | |
cosinus exponentiel, ou modĂšle Ă effet de trou | |||
Cauchy gĂ©nĂ©ralisĂ© | â(αâ20-1) | , α>0 | |
Anisotropie
Le variogramme directionnel dans la direction d'un vecteur unitaire u est dĂ©fini par Îłu(h)â=âÂœVar[Z(x+hu)âZ(x)]. On parle d'anisotropie s'il existe deux vecteurs unitaires tels que les variogrammes directionnels sont diffĂ©rents. On distingue deux cas de figures principaux :
- anisotropie gĂ©omĂ©trique : portĂ©es diffĂ©rentes, mĂȘme palier selon la direction ; le variogramme est une dĂ©formation linĂ©aire A d'un variogramme isotrope Îł0 ; Îł(h)â=âÎł0(âAhâ).
- anisotropie zonale ou stratifiĂ©e : mĂȘme portĂ©e, paliers diffĂ©rents selon la direction ; le variogramme est somme de composantes prĂ©sentant des anisotropies de supports : dans une certaine base, elles ne dĂ©pendent que de certaines coordonnĂ©es. Il est dĂ©conseillĂ© d'utiliser des modĂšles oĂč les anisotropies sont sĂ©parables selon les coordonnĂ©es (par exemple Îł(h)â=âÎł1(h1,h2)â+âÎł2(h3))
Propriétés
Le variogramme est une fonction paire, Ă valeurs positives.
Lorsque la covariance C est définie, elle est liée au variogramme par la relation :
oĂč C(η) est la covariance Ă une distance η (dĂ©pendante uniquement de η pour une fonction alĂ©atoire stationnaire)
Le variogramme est souvent une fonction croissante bornĂ©e. Dans ce cas, on nomme palier la limite du variogramme Ă l'infini et portĂ©e la distance oĂč le palier est quasiment atteint (gĂ©nĂ©ralement, Ă 95 %). Lorsqu'elle existe, la variance C(0) est ce palier. En pratique, Ă cause en particulier des effets de bords, le variogramme calculĂ© est croissant jusqu'Ă un maximum, puis globalement lĂ©gĂšrement dĂ©croissant ou stable.
Convolution : soit Z la convolution p d'une fonction alĂ©atoire Y : Z=Yâp. Alors la relation entre leurs variogrammes vĂ©rifie ÎłY=ÎłZâ(pâp).
Propriétés du variogramme stationnaire
- symétrie :
- -Îł est de type positif conditionnel : soit une mesure λ vĂ©rifiant â«Î»(dt)=0, alors
- Pour tout t>0, e-tÎł est une covariance
- le rapport Îł(h)â|h|2 est bornĂ© pour hâ¶â
- en l'absence de dérive, c'est-à -dire dans le cas intrinsÚque, , autrement dit :
- si le variogramme est borné à l'infini, la fonction aléatoire est stationnaire d'ordre 2 ; il existe alors une covariance stationnaire C(h) telle que γ(h)=C(0)-C(h)
- Le variogramme Îł(h) est Ă©gal Ă la demie variance d'extension d'un point {x} quelconque au point {x+h}
Le comportement à l'origine du variogramme traduit la régularité de la fonction aléatoire.
Autre présentation du variogramme
On peut définir également le variogramme comme la fonction γ telle que
Cette formule fournit une définition du variogramme à une constante additive prÚs.
Substitution entre variogramme et covariance
Les formules dĂ©finies dans l'hypothĂšse stationnaire peuvent ĂȘtre rĂ©Ă©crites dans l'hypothĂšse intrinsĂšque, Ă condition qu'elles fassent intervenir des CLA, en remplaçant la covariance C par l'opposĂ© du variogramme âÎł
Effet pépite
La formule fournit immédiatement γ(0)=0. Or l'on observe généralement que le variogramme ne tend pas vers 0 pour des petites distances. On appellera pépite la limite du variogramme en zéro. Elle représente la variation entre deux mesures effectuées à des emplacements infiniment proches, et peut donc provenir de trois effets :
- une variabilité naturelle du paramÚtre mesuré : il pourra par exemple prendre deux valeurs différentes si mesuré à deux instants différents ;
- une variabilité de l'instrument de mesure : la pépite mesure donc en partie l'erreur statistique de l'instrument de mesure ;
- un réel effet pépite : une variation brutale du paramÚtre mesuré ; le cas historique est le passage sans transition d'une pépite d'or à un sol ne contenant quasiment pas d'or.
Si le variogramme d'un champ est continu partout sauf à l'origine, ce champ se décompose en somme de deux champs, non-corrélés, de variogrammes respectifs une pépite pure et une fonction continue partout.
Cas multivariable
En gĂ©ostatistique multivariable est dĂ©fini le variogramme croisĂ© Îł d'une fonction alĂ©atoire multivariable intrinsĂšque Zâ=â(Z(x,1); Z(x,2) ; ⊠; Z(x,n)) sur ses variables i et j au pas h : On pose sa gĂ©nĂ©ralisation ÎłÌ aux points x et y aux distances a et b : En toute gĂ©nĂ©ralitĂ©, Îł n'est pas suffisant pour traiter le problĂšme multivariable. Cette fonction est paire, donc ne rend pas compte des dĂ©calages entre variables. PrĂ©cisĂ©ment: Cela a conduit Ă introduire le pseudovariogramme croisĂ©, qui a l'inconvĂ©nient de sommer selon des composantes diffĂ©rentes (donc potentiellement selon des unitĂ©s diffĂ©rentes):
Articles connexes
Bibliographie
Références
- nommé ainsi car il s'applique décompte de points d'un processus ponctuel de Poisson dans une sphÚre
- autorisĂ© au plus Ă 3 dimensions ; atteint son palier la premiĂšre fois Ă Ïa
- c'est le seul modĂšle autosimilaire, c'est-Ă -dire invariant par changement d'Ă©chelle : Îł(kâh)â=âkbÎł(h) ; le phĂ©nomĂšne spatial associĂ© est sans Ă©chelle