Graphiques et distributions
Types de graphiques
Il existe différentes manières de représenter graphiquement des données. Le graphique choisi dépend du type de données à représenter (cas qualitatif, discret ou continu).
Qualitatif | Un nombre limité d’observations est possible. On ne peut pas calculer avec les valeurs obtenues. Exemple : couleur des yeux, pays d’origine |
Discret | Les valeurs sont quantitatives (nombres) et sont dénombrables (habituellement nombre entier ou relatif). Exemple : nombre de pièces d’un appartement |
Continu | Les valeurs sont quantitatives et indénombrables. Elles forment un spectre plutôt que des points isolés. Exemple : taille d’une personne |
Représentation de données qualitatives et discrètes
Histogramme ou graphique à barres
L’histogramme et le graphique à barres peuvent être utilisés pour représenter la fréquence d’un attribut par la taille de la barre.
CARACTÉRISTIQUES
-
Graphique à barres (ou bâtons) : « barres » horizontales
-
Histogramme : « colonnes » verticales
-
Une barre ou colonne par attribut
-
Barres/colonnes de même largeur
Exemple 1
Léa, Nina, Jean et Félix jouent au pingpong toute l’après-midi. À la fin de chaque partie, le vainqueur marque un point.
On représente la fréquence à laquelle chaque joueur a gagné :
Histogramme | Graphique à barres |
| |
Graphique circulaire
Un graphique circulaire montre le rapport des parts au tout. Les données sont représentées sous forme de secteurs (« parts de gâteau ») dont la taille est proportionnelle à la valeur.
Exemple
Répartition des voix pendant une élection :
Représentation de données continues
Histogramme
On peut regrouper les données en classes pour obtenir un graphique semblable à la représentation de valeurs discrètes.
CARACTÉRISTIQUES
- Les « colonnes » sont verticales.
-
Elles sont de même largeur et n’ont pas d’espace entre elles.
Exemple
Les données ont été regroupées en trois classes :
Ou en six classes :
Distributions
On peut décrire la répartition des données à l’aide de caractéristiques comme les points d’accumulation ou les asymétries.
Points d’accumulation
Les points d’accumulation sont les sommets des « bosses ». Une distribution peut avoir un ou plusieurs points d’accumulation.
DISTRIBUTION UNIMODALE | DISTRIBUTION BIMODALE | DISTRIBTION MULTIMODALE |
Un point d’accumulation | Deux points d’accumulation | Plus de deux points d’accumulation |
| | |
Asymétries
Dans une distribution unimodale, il est possible d’observer la façon dont les données sont réparties autour du point d’accumulation.
-
Symétrique : La répartition est la même des deux côtés du point d’accumulation.
-
Asymétrique : La répartition n’est pas la même des deux côtés du point d’accumulation.
DISTRIBUTION SYMÉTRIQUE | ASYMÉTRIE POSITIVE | ASYMÉTRIE NÉGATIVE |
Le point d’accumulation se trouve proche du centre des données et le reste des données est réparti symétriquement. | Le point d’accumulation se trouve plutôt à gauche et la pente à sa gauche est plus raide que celle à sa droite. | Le point d’accumulation se trouve plutôt à droite et la pente à sa gauche est plus raide que celle à sa droite. |
| | |