Rappel

Les notions de la statistique

Cet article définit quelques notions statistiques utilisées dans le cadre de la recherche médicale, et rappelle comment calculer les principaux indicateurs.

Le 10/04/17 à 15:00, mise à jour aujourd'hui à 14:17 Lecture 4 min.

Dans le cadre du recueil des doses associées à un examen d’imagerie, le 75e centile représente la valeur en-dessous de la quelle se situent 75% des doses recueillies. CC0 domaine public sur pixabay.com

Population

Ensemble de personnes ou d’objets équivalents étudié

Individu / Unité statistique

Objet d’une population

Variables

Caractéristiques mesurées.

Série statistique

Série d’observations recueillies. Elle est retranscrite dans un tableau de données.

Recensement

Étude de tous les individus d’une population.

Sondage

Recueil d’une partie de la population. La partie des individus étudiés s’appelle l’échantillon. Le recueil d’un échantillon à partir de la population initiale se fait par des techniques statistiques, appelées méthodes d’échantillonnage.

Variables quantitatives

Caractéristiques numériques. Elles s’expriment par des nombres réels sur lesquels les opérations arithmétiques de base ont un sens. Elles peuvent être discrètes (nombre fini ou dénombrable de valeurs, ex. : âge) ou continues (toute les valeurs réelles sont susceptibles d’être prises. Ex : taille, etc.)

Variables qualitatives

Caractéristiques non numériques dans le sens où les opérations de base n’ont pas de sens. Elles peuvent être nominales (sexe, etc.) ou ordinales lorsque l’ensemble des catégories est muni d’un ordre total (très résistant, assez résistant, peu résistant, etc.). les différents niveaux d’une variable qualitative s’appellent des modalités, ou catégories.

Source : cours de statistique, http://iml.univ-mrs.fr/~reboul/cours1.pdf. Site consulté le 7 avril.

Indicateurs statistiques

Mode

Le mode d’une série statistique est sa valeur la plus fréquente.

Moyenne

La moyenne est égale à la somme de ces données divisée par leur nombre. Elle peut donc être calculée en ne connaissant que ces deux éléments, sans connaître toute la distribution. La moyenne d’une distribution n’est pas toujours le meilleur indicateur : la médiane est souvent plus pertinente. Mais son calcul exige de connaître toute la distribution, ou en tout cas sa partie centrale, note l’Institut national de la statistique et des études économiques

Médiane

Si on ordonne une distribution de salaires, de revenus, de chiffre d’affaires ou, dans le domaine de l’imagerie, de doses délivrés par un examen, la médiane est la valeur qui partage cette distribution en deux parties égales. Ainsi, pour une distribution de doses recueillies pour indication d’examen, la médiane est la dose en-dessous de laquelle se situent 50 % des doses recueillies. C’est de manière équivalente, la dose au-dessus de laquelle se situent 50 % des doses recueillies. Contrairement à la moyenne, la médiane a l’avantage de ne pas être influencée par l’incertitude qui affecte les valeurs extrêmes. Elle est de ce point de vue un indicateur plus fiable, explique l’Institut national de la statistique et des études économiques [1].
Pour déterminer une médiane d’un ensemble de valeurs, il faut ordonner les valeurs en une liste croissante et choisir la valeur au centre de cette liste. Pour une liste ordonnée de 2N+1 éléments, la médiane est la valeur du (N+1)-ième élément. Pour une liste ordonnée de 2N éléments, toute valeur comprise entre l’élément N et l’élément N+1 est une médiane.

Indicateurs de dispersion

Étendue

L’étendue d’une série statistique est la différence entre la plus petite et la plus grand valeur de la série.

Quartiles

Si on ordonne une distribution, les quartiles sont les valeurs qui partagent cette distribution en quatre parties égales. Ainsi, pour une distribution de doses délivrées lors d’un examen d’imagerie :

  • le premier quartile (noté généralement Q1) est la dose en-dessous de laquelle se situent 25 % des doses collectées ;
  • le deuxième quartile est la dose en-dessous de laquelle se situent 50 % des doses collectées. C’est la médiane.
  • le troisième quartile (noté généralement Q3) est la dose au-dessous de laquelle se situent 75 % des doses collectées.

Les quartiles se calculent de la même façon que la médiane, en ordonnant les résultats. L’écart entre les valeurs du premier et du troisième quartile est appelé « l’écart intercartiles ». C’est un indicateur de dispersion associée à la médiane. Plus il est grand, plus la dispersion est importante.

Centiles

Les centiles d’une variable sont les valeurs de cette variable qui, lorsque l’on ordonne la population selon les valeurs de la variable, la partitionnent en 100 sous-populations de taille égale. Ainsi, dans le cadre du recueil des doses associées à un examen d’imagerie, le 75e centile représente la valeur en-dessous de la quelle se situent 75% des doses recueillies.  

Variance

La variance, notée S² est une mesure du degré de dispersion d’un ensemble de données. On la calcule en prenant la moyenne de l’écart au carré de chaque nombre par rapport à la moyenne d’un ensemble de données. Pour les nombres 1, 2 et 3, par exemple, la moyenne est 2 et la variance, 0,667.

[(1 – 2)2 + (2 – 2)2 + (3 – 2)2] ÷ 3 = 0,667

[somme de l’écart au carré] ÷ nombre d’observations = variance

Écart-type

De la même façon que la variance, l’écart-type sert à mesurer la dispersion, ou l’étalement, d’un ensemble de valeurs autour de leur moyenne. Plus l’écart-type est faible, plus la population est homogène. L’écart-type est la racine carrée de la variance.

Auteurs

Jérome Hoff

Rédacteur en chef adjoint

Voir la fiche de l’auteur

Bibliographie

  1. Site de l’Institut national de la statistique et des études économiques, https://www.insee.fr/fr/metadonnees/definitions#lettre-I. Site consulté le 7 avril 2017.
  2. Fiche indicateurs statistiques,  http://www.decitre.fr/media/pdf/feuilletage/9/7/8/2/2/1/6/1/9782216116669.pdf. Site consulté le 7 avril 2017.
  3. Site Statistique Canada, http://www.statcan.gc.ca/edu/power-pouvoir/ch12/5214891-fra.htm. Site consulté le 7 avril 2017.

Discussion

Aucun commentaire

Laisser un commentaire

Sur le même thème

Le fil Docteur Imago

26 Nov

16:00

Les images IRM de la séquence VIBE reconstruites par deep learning de la partie supérieure de l'abdomen offriraient une qualité d'image supérieure, une meilleure visibilité et une meilleure détection des lésions sans perte de temps par rapport aux images VIBE conventionnelles (étude).

14:57

Un amendement gouvernemental au PLFSS 2025, en débat au Sénat, intègre le transport sanitaire à l'article 15 du projet de loi, qui concernait jusqu'ici les biologistes médicaux et les radiologues, et donne la possibilité aux autorités de baisser les tarifs de manière unilatérale. La FNMR et des syndicats de biologistes et d'ambulanciers s'insurgent dans un communiqué commun.

7:30

Une revue systématique et une méta-analyse confirment l'efficacité et l'innocuité de l'embolisation de l'artère splénique dans la prise en charge des saignements variqueux dus à l'hypertension portale (étude).  
Docteur Imago

GRATUIT
VOIR