Échantillonnage : fluctuation et intervalle

Définition

Échantillonner, c’est étudier un fragment aléatoire, appelé échantillon, d’une population afin d’avoir une estimation des caractéristiques de la population totale. On définit les variables suivantes :

NOM	SYMBOLE	SIGNIFICATION
Proportion	$p$	Proportion de la caractéristique étudiée au sein de la population totale
Fréquence	$f$	Fréquence à laquelle la caractéristique étudiée apparaît dans l’échantillon considéré
Taille	$n$	Nombre d’individus dans l’échantillon considéré

Loi des grands nombres

Plus $n$ est grand, plus la fréquence $f$ observée dans l’échantillon est proche de la véritable proportion $p$ qui existe au sein de la population totale.

Exemple

Un institut de sondage souhaite savoir la proportion $p$ de supporters du PSG parmi tous les supporters présents dans le stade un soir de match. Pour cela, ils se placent à la sortie du stade et interrogent le plus de supporters possibles. La loi des grands nombres dit que plus ils réussiront à interroger de supporters (plus $n$ sera grand) plus la fréquence $f$ observée sur l’échantillon sera fidèle à la réelle proportion $p$  de supporters du PSG présent dans le stade ce soir-là.

Fluctuation d’échantillonnage

Suivant quel échantillon est pris aléatoirement, la fréquence $f$ d’apparition de la caractéristique étudiée peut varier. On appelle ce principe la « fluctuation d’échantillonnage ».

Plus la taille $n$ de l’échantillon est grande, plus cette fluctuation des résultats est faible.

Exemple

On s’intéresse à la proportion d’élèves positifs au COVID-19 dans une école. Sachant qu’une des classes a fait une fête la semaine dernière, le taux de contamination dans cette classe sera donc particulièrement élevé comparé aux autres classes. Il y aura une forte fluctuation d’échantillonnage entre cette classe et les autres.

Intervalle de fluctuation

On étudie un échantillon de taille $n$ d’une expérience aléatoire à deux issues. Il est très probable que la fréquence de l’échantillon $f$ se trouve dans l’intervalle suivant, qu’on appelle intervalle de fluctuation :

$I.F.=\left[p-\frac{1}{\sqrt n};p+\frac{1}{\sqrt n}\right]$

Cela permet de comparer la fréquence étudiée dans l’échantillon ( $f$ ) avec la véritable proportion de la population ( $p$ ).

Mathématiques; Probabilités; 2de générale; Échantillonnage : fluctuation et intervalle

Exemple

Sur la population des 300 meilleurs joueurs de tennis on sait que 115 sont gauchers. On cherche l’intervalle de fluctuation pour des échantillons de 15 joueurs.

Déterminer $n$  :

$n=15$

Calculer la proportion de gauchers :

$p=\frac{115}{300}$

Calculer l’intervalle de fluctuation avec $\left[p-\frac{1}{\sqrt n};p+\frac{1}{\sqrt n}\right]$  :

$I.F.=\left[\frac{115}{300}-\frac{1}{\sqrt{15}};\frac{115}{300}+\frac{1}{\sqrt{15}}\right]=\left[0,13;0,64\right]$

La majorité des échantillons de 15 joueurs sélectionnés au hasard contiendront donc entre 13% et 64% de gauchers.

Note : Dans cet exemple, est très petit comparé à la population totale, la fluctuation d’échantillonnage sera donc très grande, ce qui explique cet intervalle de fluctuation très large.