Intelligence artificielle

Une méta-analyse critique les études qui comparent les performances diagnostiques des algorithmes à celles des médecins

La majorité des études qui concluent à l’équivalence, voire à la supériorité des modèles basés sur l’apprentissage profond pour l’analyse des examens d’imagerie médicale sont truffées de biais, préviennent les auteurs d’une méta-analyse parue dans BMJ, qui incitent leurs confrères à davantage de méthode et de prudence.

icon réservé aux abonnésArticle réservé aux abonnés
Le 29/04/20 à 7:00, mise à jour hier à 15:12 Lecture 3 min.

Peu d'études qui comparent les preformances de modèles d'apprentissage profond et de médecins ont testé les algorithmes en situation réelle, constate une équipe britannique (photo d'illustration). © Carla Ferrand

L’affirmation a fait plusieurs fois les gros titres ces dernières semaines : les algorithmes basés sur l’apprentissage profond seraient meilleurs que les médecins pour diagnostiquer certaines pathologies sur les examens d’imagerie médicale. Est-elle vraiment fondée ? Des médecins et chercheurs britanniques ont voulu en avoir le cœur net et ont mené une méta-analyse des études parues sur le sujet. « Il ne faudrait pas que l’appétit du public et de l’industrie pour l’intelligence artificielle en imagerie médicale n’occulte la nécessité de bâtir un socle de preuves rigoureuses pour ce champ technologique encore jeune », écrivent-ils dans BMJ [1].

Des check-lists pour évaluer la qualité des études

Mtura Nagendran et ses confrères ont épluché plusieurs bases de données et bibliographie à la recherche des comptes rendus d’essais randomisés et d’études non randomisées publiées entre 2010 et l’été 2019, qui ont comparé les performances d’algorithmes d’apprentissage profond à celles d’humains fac

Il vous reste 77% de l’article à lire

Docteur Imago réserve cet article à ses abonnés

S'abonner à l'édition
  • Tous les contenus « abonnés » en illimité
  • Le journal numérique en avant-première
  • Newsletters exclusives, club abonnés

Abonnez-vous !

Docteur Imago en illimité sur desktop, tablette, smartphone, une offre 100% numérique

Offre mensuelle 100 % numérique

23 €

par mois

S’abonner à Docteur Imago

Auteurs

Jérome Hoff

Rédacteur en chef adjoint BOM Presse Clichy

Voir la fiche de l’auteur

Bibliographie

  1. Nagendran M., Chen Y., Lovejoy C. A. et coll., « Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies », BMJ, 25 mars 2020, vol. 368, m689. DOI : 10.1136/bmj.m689.
  2. Collins G. S., Reitsma J. B., Altman D. G. et coll., « Transparent reporting of a multivariable prediction model for individual prognosis or diagnosis (TRIPOD): the TRIPOD statement », BMJ, 2015, vol. 350, g7594. DOI : 10.1136/bmj.g7594 pmid:25569120.
  3. Wolff R. F., Moons K. G. M., Riley R. D., et coll., « PROBAST: a tool to assess the risk of bias and applicability of prediction model studies », Ann Intern Med, 2019, vol. 170, n° 51-58. DOI : 10.7326/M18-1376 pmid:30596875.
  4. Higgins JP, Altman DG, Gøtzsche PC, et al., « Cochrane Statistical Methods Group, The Cochrane Collaboration’s tool for assessing risk of bias in randomised trials », BMJ, 2011, vol. 343, d5928. DOI : 10.1136/bmj.d5928 pmid:22008217.
  5. Vollmer S., Mateen B. A., Bohner G. et coll., « Machine Learning and AI research for Patients Benefit: 20 Critical Questions on Transparency, Replicability, Ethics and Effectiveness », arXiv, 2018. arXiv:1812.10404.

Discussion

Aucun commentaire

Laisser un commentaire

Sur le même thème

Le fil Docteur Imago

13 Oct

7:30

La reconstruction par apprentissage profond est capable de maintenir une qualité d'image élevée lors d'un angioscanner ultra basse dose pour la recherche d'embolie pulmonaire, conclut une étude chinoise.
10 Oct

7:47

Les grands modèles de langage (LLM) et les modèles de langage de vision (VLM) accessibles au public incluent désormais rarement des avertissements médicaux en réponse aux questions médicales des patients sur les examens d’imagerie, indique une étude parue dans Nature.
09 Oct

16:28

Le congrès de la Société d’imagerie de la femme (SIFEM) 2026 aura lieu à Montpellier du 4 au 6 juin, présidé par Emma Pagès-Bouic et Patrice Taourel.

15:46

La sensibilité du scanner à faible dose pour la détection des nodules pulmonaires ne diffère pas significativement en fonction de l'IMC du patient, que le lecteur soit une IA ou un humain, selon une étude.
Docteur Imago

GRATUIT
VOIR