Intelligence artificielle

Une méta-analyse critique les études qui comparent les performances diagnostiques des algorithmes à celles des médecins

La majorité des études qui concluent à l’équivalence, voire à la supériorité des modèles basés sur l’apprentissage profond pour l’analyse des examens d’imagerie médicale sont truffées de biais, préviennent les auteurs d’une méta-analyse parue dans BMJ, qui incitent leurs confrères à davantage de méthode et de prudence.

icon réservé aux abonnésArticle réservé aux abonnés
Le 29/04/20 à 7:00, mise à jour hier à 14:16 Lecture 3 min.

Peu d'études qui comparent les preformances de modèles d'apprentissage profond et de médecins ont testé les algorithmes en situation réelle, constate une équipe britannique (photo d'illustration). © Carla Ferrand

L’affirmation a fait plusieurs fois les gros titres ces dernières semaines : les algorithmes basés sur l’apprentissage profond seraient meilleurs que les médecins pour diagnostiquer certaines pathologies sur les examens d’imagerie médicale. Est-elle vraiment fondée ? Des médecins et chercheurs britanniques ont voulu en avoir le cœur net et ont mené une méta-analyse des études parues sur le sujet. « Il ne faudrait pas que l’appétit du public et de l’industrie pour l’intelligence artificielle en imagerie médicale n’occulte la nécessité de bâtir un socle de preuves rigoureuses pour ce champ technologique encore jeune », écrivent-ils dans BMJ [1].

Des check-lists pour évaluer la qualité des études

Mtura Nagendran et ses confrères ont épluché plusieurs bases de données et bibliographie à la recherche des comptes rendus d’essais randomisés et d’études non randomisées publiées entre 2010 et l’été 2019, qui ont comparé les performances d’algorithmes d’apprentissage profond à celles d’humains fac

Il vous reste 77% de l’article à lire

Docteur Imago réserve cet article à ses abonnés

S'abonner à l'édition
  • Tous les contenus « abonnés » en illimité
  • Le journal numérique en avant-première
  • Newsletters exclusives, club abonnés

Abonnez-vous !

Docteur Imago en illimité sur desktop, tablette, smartphone, une offre 100% numérique

Offre mensuelle 100 % numérique

23 €

par mois

S’abonner à Docteur Imago

Auteurs

Jérome Hoff

Rédacteur en chef adjoint BOM Presse Clichy

Voir la fiche de l’auteur

Bibliographie

  1. Nagendran M., Chen Y., Lovejoy C. A. et coll., « Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies », BMJ, 25 mars 2020, vol. 368, m689. DOI : 10.1136/bmj.m689.
  2. Collins G. S., Reitsma J. B., Altman D. G. et coll., « Transparent reporting of a multivariable prediction model for individual prognosis or diagnosis (TRIPOD): the TRIPOD statement », BMJ, 2015, vol. 350, g7594. DOI : 10.1136/bmj.g7594 pmid:25569120.
  3. Wolff R. F., Moons K. G. M., Riley R. D., et coll., « PROBAST: a tool to assess the risk of bias and applicability of prediction model studies », Ann Intern Med, 2019, vol. 170, n° 51-58. DOI : 10.7326/M18-1376 pmid:30596875.
  4. Higgins JP, Altman DG, Gøtzsche PC, et al., « Cochrane Statistical Methods Group, The Cochrane Collaboration’s tool for assessing risk of bias in randomised trials », BMJ, 2011, vol. 343, d5928. DOI : 10.1136/bmj.d5928 pmid:22008217.
  5. Vollmer S., Mateen B. A., Bohner G. et coll., « Machine Learning and AI research for Patients Benefit: 20 Critical Questions on Transparency, Replicability, Ethics and Effectiveness », arXiv, 2018. arXiv:1812.10404.

Discussion

Aucun commentaire

Laisser un commentaire

Sur le même thème

Le fil Docteur Imago

20 Mar

7:11

Une enquête menée par la société européenne d'imagerie mammaire (EUSOBI) démontre que, malgré des aspects procéduraux très variés dans la biopsie mammaire à aiguille centrale guidée par échographie, des niveaux de stérilité perçus plus élevés ne sont pas associés à une diminution des infections. L'étude met en lumière l'importance de réduire en toute sécurité l’utilisation des ressources et l’impact environnemental.
19 Mar

16:00

La réponse de perfusion à l’adénosine semble être spécifique à chaque organe, conclut une étude parue dans JNM. L’adénosine augmente la perfusion au niveau du cœur, du foie, du côlon et du duodénum, tandis que la perfusion est réduite par l’adénosine dans le cerveau, la rate, les reins, le muscle squelettique et l’os, écrivent les chercheurs.

13:25

La présentation est la clé d'une bonne compréhension des comptes rendus d'imagerie « patient-friendly », conclut une étude présentée dans JACR. Les formats « traduction complète » et « basé sur les phrases », associant des sources pour vérifier les informations sont plus efficaces qu'une simple définition des termes techniques.

7:10

Dans une étude évaluant les niveaux de référence en doses de radiation et les indicateurs de qualité d’image dans les protocoles d’imagerie thorax-abdomen en unité de soins intensifs néonatals,  des chercheurs relève que les nouveau-nés pesant entre 1000 et 1 499 g et 1 500 à 2499 g avaient des doses cutanées inférieures à celles des nouveau-nés pesant moins de 1 000 g.

Docteur Imago

GRATUIT
VOIR