Variable catégorielle
En statistique, une variable qualitative, une variable catégorielle, ou bien un facteur est une variable qui prend pour valeur des modalités, des catégories ou bien des niveaux, par opposition aux variables quantitatives qui mesurent sur chaque individu une quantité.
Les modalitĂ©s (ou les valeurs) quâelle prend peuvent ĂȘtre dĂ©signĂ©s en toutes lettre par des noms [1], comme par exemple:
- les modalités du sexe sont : Masculin et Féminin
- les modalités de la couleurs des yeux sont : Bleu, Marron, Noir et Vert ;
- les modalités de la variable mention au Bac sont : TB, B, AB et P.
Il existe deux types de variables qualitatives : les variables qualitatives ordinales et les variables qualitatives nominales. Une variable qualitative est dite ordinale, lorsque ses modalitĂ©s peuvent ĂȘtre classĂ©es dans un certain ordre naturel permettant une comparaison comme câest le cas de la variable Mention au Bac. Une variable qualitative est dite nominale, lorsque ses modalitĂ©s ne peuvent ĂȘtre classĂ©es de façon naturelle comme par exemple le cas de la variable Couleur des Yeux.
Une confusion habituelle entre les deux types de variables peut venir de l'encodage des variables qualitatives qui peut ĂȘtre parfois numĂ©rique comme les numĂ©ros de tĂ©lĂ©phone ou bien les codes postaux.
Un critĂšre trivial de distinction avec les variables quantitatives est le calcul de la moyenne : mĂȘme encodĂ©e numĂ©riquement, la moyenne d'une variable qualitative n'a pas de sens (par exemple, la moyenne de numĂ©ros de tĂ©lĂ©phone).
Notes et références
- Fabrice Mazerolle, Statistique Descriptive (lire en ligne)