Échantillonner, c’est étudier un fragment aléatoire, appelé échantillon, d’une population afin d’avoir une estimation des caractéristiques de la population totale. On définit les variables suivantes:
NOM
SYMBOLE
SIGNIFICATION
Proportion
p
Proportion de la caractéristique étudiée au sein de la population totale
Fréquence
f
Fréquence à laquelle la caractéristique étudiée apparaît dans l’échantillon considéré
Taille
n
Nombre d’individus dans l’échantillon considéré
Loi des grands nombres
Plusnest grand, plus la fréquencefobservée dans l’échantillon est proche de la véritable proportionpqui existe au sein de la population totale.
Exemple
Un institut de sondage souhaite savoir la proportionpde supporters du PSG parmi tous les supporters présents dans le stade un soir de match. Pour cela, ils se placent à la sortie du stade et interrogent le plus de supporters possibles. La loi des grands nombres dit que plus ils réussiront à interroger de supporters (plusnsera grand) plus la fréquencefobservée sur l’échantillon sera fidèle à la réelle proportionpde supporters du PSG présent dans le stade ce soir-là.
Fluctuation d’échantillonnage
Suivant quel échantillon est pris aléatoirement, la fréquencefd’apparition de la caractéristique étudiée peut varier. On appelle ce principe la «fluctuation d’échantillonnage».
Plus la taillende l’échantillon est grande, plus cette fluctuation des résultats est faible.
Exemple
On s’intéresse à la proportion d’élèves positifs au COVID-19 dans une école. Sachant qu’une des classes a fait une fête la semaine dernière, le taux de contamination dans cette classe sera donc particulièrement élevé comparé aux autres classes. Il y aura une forte fluctuation d’échantillonnage entre cette classe et les autres.
Intervalle de fluctuation
On étudie un échantillon de taillend’une expérience aléatoire à deux issues. Il est très probableque la fréquence de l’échantillonfse trouve dans l’intervalle suivant, qu’on appelle intervalle de fluctuation:
I.F.=[p−n1;p+n1]
Cela permet de comparer la fréquence étudiée dans l’échantillon (f) avec la véritable proportion de la population (p).
Exemple
Sur la population des 300 meilleurs joueurs de tennis on sait que 115 sont gauchers. On cherche l’intervalle de fluctuation pour des échantillons de 15 joueurs.
Déterminer n:
n=15
Calculer la proportion de gauchers:
p=300115
Calculer l’intervalle de fluctuation avec[p−n1;p+n1]:
I.F.=[300115−151;300115+151]=[0,13;0,64]
La majorité des échantillons de 15 joueurs sélectionnés au hasard contiendront doncentre 13% et 64% de gauchers.
Note : Dans cet exemple,est très petit comparé à la population totale, la fluctuation d’échantillonnage sera donc très grande, ce qui explique cet intervalle de fluctuation très large.