Nouvelles technologies

Les études en intelligence artificielle n’emploient pas les bonnes méthodes de validation pour un usage clinique

94 % des études sur l’intelligence artificielle en imagerie diagnostique ne sont pas conçues pour valider correctement leurs résultats pour une utilisation en situation clinique, selon une méta-anayse coréenne.

icon réservé aux abonnésArticle réservé aux abonnés
Le 03/05/19 à 15:00, mise à jour hier à 14:20 Lecture 1 min.

La plupart des algorithmes d’intelligence artificielle en imagerie diagnostique ne seraient pas validés de façon correcte pour une utilisation en clinique, selon une méta-analyse coréenne décrite dans la revue Korean Journal of Radiology [1]. Sur 516 études recensées pour l’année 2018 dans les bases PubMed MEDLINE et Embase, seules 31, soit 6 % auraient en effet recours à la validation externe pour tester leurs algorithmes.

Aucune cohorte de test ne présente les critères requis

De plus, aucune n’utiliserait des données de validation collectées à la façon d’une étude de cohorte, au sein de plusieurs centres et de manière prospective. Ces trois caractéristiques de conception sont pourtant recommandées « pour une validation robuste des performances cliniques des algorithmes d’IA », écrivent Kim Dong Wook, du centre de santé et hôpital du comté de Taean-gun, et ses confrères de l’école de médecine de l’université d’Ulsan, à Séoul.

Des données difficiles à collecter

« De façon typique, les déve

Il vous reste 61% de l’article à lire

Docteur Imago réserve cet article à ses abonnés

S'abonner à l'édition
  • Tous les contenus « abonnés » en illimité
  • Le journal numérique en avant-première
  • Newsletters exclusives, club abonnés

Abonnez-vous !

Docteur Imago en illimité sur desktop, tablette, smartphone, une offre 100% numérique

Offre mensuelle 100 % numérique

23 €

par mois

S’abonner à Docteur Imago

Auteurs

Jérome Hoff

Rédacteur en chef adjoint BOM Presse Clichy

Voir la fiche de l’auteur

Bibliographie

  1. Kim Dong Wook, Jang Hye Young, Kim Kyung Won et coll., « Design Characteristics of Studies Reporting the Performance of Artificial Algorithms for Diagnostic Analysis of Medical Images : Results from Recently Published Papers », Korean Journal of Radiology, mars 2009, vol. 20, n° 3, p. 405 – 410. DOI : 10.3348/kjr.2019.0025.
  2. Park S. H., Kressel H. Y., « Connecting technological innovation in artificial intelligence to real-world medical practice through rigorous clinical validation: what peer-reviewed medical journals could do », J Korean Med Sci, 2018, vol. 33, e152.
  3. Park S. H., Han K., « Methodologic guide for evaluating clinical performance and effect of artificial intelligence technology for medical diagnosis and prediction », Radiology, 2018, vol. 286, p. 800–809.
  4. England J. R., Cheng P. M., « Artificial intelligence for medical image analysis: a guide for authors and reviewers », AJR Am J Roentgenol, décembre 2018. DOI : 10.2214/AJR.18.20490. Epub anticipée.

Discussion

Aucun commentaire

Laisser un commentaire

Sur le même thème

Le fil Docteur Imago

11 Fév

13:30

Un rapport conjoint publié en janvier 2026, de la joint commission, organisme de certification aux Etats-Unis et du National Quality Forum (NQF), mentionne le « Préjudice au patient associé à une lésion thermique liée à l'IRM », comme un domaine d’inquiétude important. Les deux organismes américains ont aligné leurs listes des événements Sentinel et « événements graves à signaler », afin de simplifier le signalement des événements de sécurité des patients. (Source)

7:16

L’obésité réduit la performance de la radiographie thoracique pour le diagnostic de pneumonie, avec une concordance et une sensibilité nettement inférieures à celles observées chez les patients non obèses. Dans ce contexte, le scanner thoracique démontre une précision diagnostique supérieure pour la pneumonie, chez les patients obèses. (Étude)
10 Fév

16:00

L'arrêté du 4 février 2026 fixe le contenu et les modalités des appels à candidature pour l'expérimentation du retraitement de certains dispositifs médicaux à usage unique, notamment certains types de cathéters.

14:11

Les modèles de comptes rendus structurés IRM spécifiques à l'endométriose amélioreraient considérablement l'exhaustivité de la documentation par rapport aux modèles généraux et au texte libre (étude).

7:12

Des chercheurs ont développé et validé un modèle pronostique combinant des caractéristiques IRM préthérapeutiques et des données cliniques chez des patients atteints de carcinome hépatocellulaire traités par une chimioembolisation transartérielle, chimiothérapie par perfusion artérielle hépatique et immunothérapie ciblée. Le modèle de synergie imagerie fonctionnelle-fonction hépatique démontre une précision pronostique supérieure à celle des paramètres conventionnels de charge tumorale chez les patients atteints de carcinome hépatocellulaire recevant une thérapie quadruple. De plus, le système de notation à 10 points dérivé permet une stratification des risques cliniquement exploitables. (Étude)  
Docteur Imago

GRATUIT
VOIR