Nouvelles technologies

Les études en intelligence artificielle n’emploient pas les bonnes méthodes de validation pour un usage clinique

94 % des études sur l’intelligence artificielle en imagerie diagnostique ne sont pas conçues pour valider correctement leurs résultats pour une utilisation en situation clinique, selon une méta-anayse coréenne.

icon réservé aux abonnésArticle réservé aux abonnés
Le 03/05/19 à 15:00, mise à jour aujourd'hui à 15:18 Lecture 1 min.

La plupart des algorithmes d’intelligence artificielle en imagerie diagnostique ne seraient pas validés de façon correcte pour une utilisation en clinique, selon une méta-analyse coréenne décrite dans la revue Korean Journal of Radiology [1]. Sur 516 études recensées pour l’année 2018 dans les bases PubMed MEDLINE et Embase, seules 31, soit 6 % auraient en effet recours à la validation externe pour tester leurs algorithmes.

Aucune cohorte de test ne présente les critères requis

De plus, aucune n’utiliserait des données de validation collectées à la façon d’une étude de cohorte, au sein de plusieurs centres et de manière prospective. Ces trois caractéristiques de conception sont pourtant recommandées « pour une validation robuste des performances cliniques des algorithmes d’IA », écrivent Kim Dong Wook, du centre de santé et hôpital du comté de Taean-gun, et ses confrères de l’école de médecine de l’université d’Ulsan, à Séoul.

Des données difficiles à collecter

« De façon typique, les déve

Il vous reste 61% de l’article à lire

Docteur Imago réserve cet article à ses abonnés

S'abonner à l'édition
  • Tous les contenus « abonnés » en illimité
  • Le journal numérique en avant-première
  • Newsletters exclusives, club abonnés

Abonnez-vous !

Docteur Imago en illimité sur desktop, tablette, smartphone, une offre 100% numérique

Offre mensuelle 100 % numérique

23 €

par mois

S’abonner à Docteur Imago

Auteurs

Jérome Hoff

Rédacteur en chef adjoint BOM Presse Clichy

Voir la fiche de l’auteur

Bibliographie

  1. Kim Dong Wook, Jang Hye Young, Kim Kyung Won et coll., « Design Characteristics of Studies Reporting the Performance of Artificial Algorithms for Diagnostic Analysis of Medical Images : Results from Recently Published Papers », Korean Journal of Radiology, mars 2009, vol. 20, n° 3, p. 405 – 410. DOI : 10.3348/kjr.2019.0025.
  2. Park S. H., Kressel H. Y., « Connecting technological innovation in artificial intelligence to real-world medical practice through rigorous clinical validation: what peer-reviewed medical journals could do », J Korean Med Sci, 2018, vol. 33, e152.
  3. Park S. H., Han K., « Methodologic guide for evaluating clinical performance and effect of artificial intelligence technology for medical diagnosis and prediction », Radiology, 2018, vol. 286, p. 800–809.
  4. England J. R., Cheng P. M., « Artificial intelligence for medical image analysis: a guide for authors and reviewers », AJR Am J Roentgenol, décembre 2018. DOI : 10.2214/AJR.18.20490. Epub anticipée.

Discussion

Aucun commentaire

Laisser un commentaire

Sur le même thème

Le fil Docteur Imago

7:30

Une étude montre que la TEP-IRM ciblant la protéine d'activation des fibroblastes (FAP) détecte davantage de lésions suspectes d’endométriose que l’IRM conventionnelle, soutenant son intérêt comme outil complémentaire pour l’évaluation préopératoire.
11 Juin

16:00

L’ASNR a été informée d’une erreur de radiothérapie, classée au niveau 2 de l’échelle ASN-SFRO, survenue en mars 2026 au CHU de Saint-Étienne (42). Une dose de 9 Gy destinée à une vertèbre atteinte d’une métastase a été administrée par erreur à la vertèbre voisine saine en raison d’un mauvais positionnement du patient.

13:00

Des modèles d’intelligence artificielle évalués pour la classification de la malignité des nodules pulmonaires au scanner thoracique ont montré une sensibilité élevée (88 %) mais une spécificité modérée (75 %), soutenant un rôle potentiel dans les stratégies d’exclusion d'un cancer pulmonaire étude).

9:30

Selon une étude publiée dans The Journal of Nuclear Medicine, un nouveau système de TEP-TDM à champ de vision à long axe (LAFOV), utilisant des détecteurs de 30 mm au germanate de bismuth (BGO) avec des photomultiplicateurs au silicium offre une qualité d’image supérieure à la TEP-TDM à champ de vision court-axial (SAFOV) malgré des réductions marquées du temps d’acquisition, avec des caractéristiques de bruit comparables sur plusieurs radiopharmaceutiques.
Docteur Imago

GRATUIT
VOIR