Statistiques élémentaires discrètes
Les statistiques élémentaires discrètes est un domaine des mathématiques élémentaires qui traite le cas où, dans une enquête statistique, le caractère statistique prend un nombre fini raisonnable de valeurs (note, nombre d’enfants, nombre de pièces, secteur d’activité…).
Le caractère statistique étudié est alors appelé caractère discret.
Traitement des données
Les résultats d’une enquête consistent en une liste désordonnée d’informations.
Exemple1 - note de la classe X : 10, 9, 12, 11, 10, 8, 14, 11, 9, 16, 5, 12, 10, 11, 10, 13
Exemple 2 - couleur préférée : bleu, rouge, bleu, bleu, jaune, bleu, rouge, bleu, bleu, jaune, jaune, bleu, jaune.
Il faut alors les trier, par ordre croissant, pour le caractère quantitatif, par genre, pour le caractère qualitatif.
Notes triées : 5, 8, 9, 9, 10, 10, 10, 10, 11, 11, 11, 12, 12, 13, 14, 16
Couleurs préférées triées : bleu, bleu, bleu, bleu, bleu, bleu, bleu, rouge, rouge, jaune, jaune, jaune, jaune.
Cette présentation sous forme de liste est peu exploitable, on décide alors de présenter les résultats de l’enquête sous forme d’un tableau d’effectifs. L’effectif d’une valeur est le nombre de fois où cette valeur apparaît.
Exemple 1: note des élèves
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 | Total |
effectifs | 1 | 1 | 2 | 4 | 3 | 2 | 1 | 1 | 1 | 16 |
Exemple 2: couleur préférée
Couleurs | Effectifs |
Bleu | 7 |
Rouge | 2 |
Jaune | 4 |
Total | 13 |
Lorsque la population étudiée est trop grande, ou bien lorsque l’on cherche à faire la comparaison entre deux populations de tailles différentes, on préfère se ramener à une population de 100, donc travailler en pourcentages, appelés ici fréquences.
Exemple 1: note des élèves
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 | Total |
fréquences en % | 6,25 | 6,25 | 12,50 | 25,00 | 18,75 | 12,50 | 6,25 | 6,25 | 6,25 | 100 |
Exemple 2: couleur préférée
Couleurs | Fréquences en % |
Bleu | 53,85 |
Rouge | 15,38 |
Jaune | 30,77 |
Total | 100 |
Notion de moyenne
Imaginons que nous ayons une classe d'élèves de différentes tailles et que nous désirions faire représenter la classe par un élève idéal ni trop grand ni trop petit.Y a-t-il un élève qui ait la taille « représentative » de la classe et quelle est cette taille?
Exemple de classe (1) avec les mesures observées
Tailles en cm | 178 | 180 | 182 | 181 | 179 |
En additionnant tous les résultats et en divisant par le nombre d'individus dans la classe, nous obtiendrons ce que l'on appelle la moyenne.
178+180+182+181+179=900
900/5 = 180
La moyenne est donc 180 cm.
Autre exemple de classe
Classe (2) plus importante avec différents élèves ayant la même taille. Nous allons compter le nombre d'élèves ayant une taille donnée et placer les résultats dans un tableau.
178 | 179 | 180 | 181 | 182 | Nombre d'élèves | |
5 | 2 | 3 | 1 | 4 | =5+2+3+1+4=15= | |
1785 | 1792 | 1803 | 1811 | 1824 | Somme des tailles | |
890 | 358 | 540 | 181 | 728 | =890+358+540+181+728=2697= |
La moyenne est ici le total des tailles à diviser par le nombre d'élèves: soit 2697/15 = 179,8 cm.
On calcule d'abord la somme des produits des mesures par le nombre de fois où l'on a observé ces mesures.
Ensuite on divise par le nombre total de mesures :
La formule générale est donc :
La moyenne est un des critères de position.
Présentation des résultats
Les résultats obtenus se présentent, outre le tableau de mesures ci-dessus, par un diagramme en bâtons ou encore par un diagramme en camembert.
Diagramme en bâtons
Reprenons la classe (2) et élevons pour chaque mesure un trait vertical proportionnel au nombre d'élèves. Nous obtenons un diagramme en bâtons.
Répartition des 15 élèves selon leur taille en cm.
Si nous regroupons maintenant chaque personne ayant une taille comprise entre 179 et 180 cm dans une même classe: la classe des 179 cm -180 cm (c'est ce que nous faisons dans la vie de tous les jours), il est préférable de traiter le caractère comme continu et de tracer un histogramme.
Diagramme circulaire
Pour un caractère qualitatif, on préfère le diagramme circulaire, dit en camembert: on découpe un cercle en « morceaux de tartes » dont la surface est proportionnelle à l'effectif ou la fréquence. Reprenons l'exemple des couleurs et complétons le tableau par le calcul des angles au centre.
Couleurs | Fréquences en % | Angle en degré |
Bleu | 53,85 | 194 |
Rouge | 15,38 | 55 |
Jaune | 30,77 | 111 |
Total | 100 | 360 |
Il ne reste plus qu'à dessiner les « parts de tarte ».
Variance et écart-type
Pour voir si les résultats s’agglomèrent autour de la moyenne (courbe en forme de pic) ou au contraire s'étalent en prenant de nombreuses valeurs distinctes (courbe aplatie), on peut utiliser ce qu'on appelle un indice de dispersion. Le plus connu a pour nom variance et est défini comme suit :
où les sont les valeurs du caractère statistique, les leurs fréquences d'apparition et la moyenne.
On définit aussi l'écart-type comme étant la racine carrée de la variance
écart-type =
Exemple : Si la série comporte 3 mesures et que les nombres 3, 4 et 2 apparaissent une seule fois, la moyenne est 3 et la variance 0,667.
- Comme le calcul de la variance se fait à partir des carrés des écarts, les unités de mesure ne sont pas les mêmes que celles des observations originales. Par exemple, les longueurs mesurées en mètres (m) auront une variance mesurée en mètres carrés (m²).
- L'écart-type, correspondant à la racine carrée de la variance nous donnera par contre l'unité utilisée dans l'échelle originale.