Distance de Bray-Curtis
La distance de Bray-Curtis, ou indice de dissimilarité de Bray-Curtis, est utilisé en écologie et biologie pour évaluer la dissimilarité entre deux échantillons donnés, en termes d'abondance de taxons (phyla, espèces, OTUs...) présents dans chacun de ces échantillons[1]. Il porte le nom de ses auteurs, J. Roger Bray et John T. Curtis.
L'indice de Bray-Curtis est souvent appelé à tort une distance (« Une fonction de distance bien définie obéit à l'inégalité triangulaire, mais il existe plusieurs mesures justifiables de la différence entre des échantillons qui n'ont pas cette propriété : pour les distinguer des distances réelles, on les appelle souvent des dissemblances. »[2]). C'est donc parce que l'indice de dissimilarité de Bray-Curtis ne satisfait pas l'inégalité triangulaire qu'on l'appelle dissemblance pour éviter toute confusion. On trouve une implémentation logicielle pour les échantillons de grande taille dans le progiciel mothur[3].
L'indice de dissimilarité de Bray-Curtis est compris entre 0 (les deux échantillons ont la même composition) et 1 (les échantillons sont totalement dissemblables) [4]. Sur des échantillons où la distance est intermédiaire (par exemple 0,5), cet indice se différencie des autres indices communément utilisés[5].
Les indices de Bray-Curtis et de Jaccard sont similaires de par l'ordination de rang qu'ils donnent, mais l'indice de Jaccard est métrique et devrait donc être préféré à l'indice de Bray-Curtis par défaut qui est semi-métrique[6].
Conditions d'application de l'indice
Il est nécessaire pour pouvoir calculer la distance de Bray-Curtis de ne considérer que les échantillons ayant la même taille (aire ou volume), car la distance de Bray-Curtis se base sur les abondances brutes et non pas relatives des différentes espèces présentes dans l'échantillon[1].
Équation
Voici l'équation permettant le calcul de la distance de Bray-Curtis : ici, deux échantillons j et k sont comparés
Où est l'abondance d'une espèce i dans l'échantillon j et l'abondance de la même espèce i dans l'échantillon k. Le terme min(.,.) correspond au minimum obtenu pour deux comptes sur les mêmes échantillons. Les sommes situés au numérateurs et dénominateur sont réalisées sur l'ensemble des espèces présentes dans les échantillons[1].
Notes et références
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Bray–Curtis dissimilarity » (voir la liste des auteurs).
- Bray, J. R. and J. T. Curtis. 1957. An ordination of upland forest communities of southern Wisconsin. Ecological Monographs 27:325-349.
- (en) Michael Greenacre et Raul Primicerio, Multivariate Analysis of Ecological Data, Fundación BBVA, , 336 p. (ISBN 978-84-92937-50-9, lire en ligne), chap. 5 (« Measures of distance between samples: non-Euclidean »)
- (en) « Braycurtis - mothur », sur www.mothur.org, (consulté le )
- Bloom, S.A. 1981. Similarity indices in community studies: Potential Pitfalls. Marine Ecology--Progress Series 5: 125-128
- (en) S. A. Bloom, « Similarity indices in community studies: Potential Pitfalls. », Marine Ecology Progress Series, vol. 5, , p. 125-128 (lire en ligne)
- (en) Jari Oksanen, « Dissimilarity Indices for Community Ecologists », Package vegan version 2.5-7, sur R Documentation (consulté le )
Lectures complémentaires
- Pierre Legendre & Louis Legendre. 1998. Numerical ecology, 2nd English edition. Elsevier Science BV, Amsterdam.
- Yoshioka PM (2008) Misidentification of the Bray-Curtis similarity index. Mar Ecol Prog Ser 368:309–310
- Somerfield, PJ (2008) Identification of Bray-Curtis similarity index: comment on Yoshioka (2008). Mar Ecol Prog Ser 372:303–306