Population
Ensemble de personnes ou d’objets équivalents étudié
Individu / Unité statistique
Objet d’une population
Variables
Caractéristiques mesurées.
Série statistique
Série d’observations recueillies. Elle est retranscrite dans un tableau de données.
Recensement
Étude de tous les individus d’une population.
Sondage
Recueil d’une partie de la population. La partie des individus étudiés s’appelle l’échantillon. Le recueil d’un échantillon à partir de la population initiale se fait par des techniques statistiques, appelées méthodes d’échantillonnage.
Variables quantitatives
Caractéristiques numériques. Elles s’expriment par des nombres réels sur lesquels les opérations arithmétiques de base ont un sens. Elles peuvent être discrètes (nombre fini ou dénombrable de valeurs, ex. : âge) ou continues (toute les valeurs réelles sont susceptibles d’être prises. Ex : taille, etc.)
Variables qualitatives
Caractéristiques non numériques dans le sens où les opérations de base n’ont pas de sens. Elles peuvent être nominales (sexe, etc.) ou ordinales lorsque l’ensemble des catégories est muni d’un ordre total (très résistant, assez résistant, peu résistant, etc.). les différents niveaux d’une variable qualitative s’appellent des modalités, ou catégories.
Source : cours de statistique, http://iml.univ-mrs.fr/~reboul/cours1.pdf. Site consulté le 7 avril.
Indicateurs statistiques
Mode
Le mode d’une série statistique est sa valeur la plus fréquente.
Moyenne
La moyenne est égale à la somme de ces données divisée par leur nombre. Elle peut donc être calculée en ne connaissant que ces deux éléments, sans connaître toute la distribution. La moyenne d’une distribution n’est pas toujours le meilleur indicateur : la médiane est souvent plus pertinente. Mais son calcul exige de connaître toute la distribution, ou en tout cas sa partie centrale, note l’Institut national de la statistique et des études économiques
Médiane
Si on ordonne une distribution de salaires, de revenus, de chiffre d’affaires ou, dans le domaine de l’imagerie, de doses délivrés par un examen, la médiane est la valeur qui partage cette distribution en deux parties égales. Ainsi, pour une distribution de doses recueillies pour indication d’examen, la médiane est la dose en-dessous de laquelle se situent 50 % des doses recueillies. C’est de manière équivalente, la dose au-dessus de laquelle se situent 50 % des doses recueillies. Contrairement à la moyenne, la médiane a l’avantage de ne pas être influencée par l’incertitude qui affecte les valeurs extrêmes. Elle est de ce point de vue un indicateur plus fiable, explique l’Institut national de la statistique et des études économiques [1].
Pour déterminer une médiane d’un ensemble de valeurs, il faut ordonner les valeurs en une liste croissante et choisir la valeur au centre de cette liste. Pour une liste ordonnée de 2N+1 éléments, la médiane est la valeur du (N+1)-ième élément. Pour une liste ordonnée de 2N éléments, toute valeur comprise entre l’élément N et l’élément N+1 est une médiane.
Indicateurs de dispersion
Étendue
L’étendue d’une série statistique est la différence entre la plus petite et la plus grand valeur de la série.
Quartiles
Si on ordonne une distribution, les quartiles sont les valeurs qui partagent cette distribution en quatre parties égales. Ainsi, pour une distribution de doses délivrées lors d’un examen d’imagerie :
- le premier quartile (noté généralement Q1) est la dose en-dessous de laquelle se situent 25 % des doses collectées ;
- le deuxième quartile est la dose en-dessous de laquelle se situent 50 % des doses collectées. C’est la médiane.
- le troisième quartile (noté généralement Q3) est la dose au-dessous de laquelle se situent 75 % des doses collectées.
Les quartiles se calculent de la même façon que la médiane, en ordonnant les résultats. L’écart entre les valeurs du premier et du troisième quartile est appelé « l’écart intercartiles ». C’est un indicateur de dispersion associée à la médiane. Plus il est grand, plus la dispersion est importante.
Centiles
Les centiles d’une variable sont les valeurs de cette variable qui, lorsque l’on ordonne la population selon les valeurs de la variable, la partitionnent en 100 sous-populations de taille égale. Ainsi, dans le cadre du recueil des doses associées à un examen d’imagerie, le 75e centile représente la valeur en-dessous de la quelle se situent 75% des doses recueillies.
Variance
La variance, notée S² est une mesure du degré de dispersion d’un ensemble de données. On la calcule en prenant la moyenne de l’écart au carré de chaque nombre par rapport à la moyenne d’un ensemble de données. Pour les nombres 1, 2 et 3, par exemple, la moyenne est 2 et la variance, 0,667.
[(1 – 2)2 + (2 – 2)2 + (3 – 2)2] ÷ 3 = 0,667 [somme de l’écart au carré] ÷ nombre d’observations = varianceÉcart-type
De la même façon que la variance, l’écart-type sert à mesurer la dispersion, ou l’étalement, d’un ensemble de valeurs autour de leur moyenne. Plus l’écart-type est faible, plus la population est homogène. L’écart-type est la racine carrée de la variance.
Discussion
Aucun commentaire
Commenter cet article