Analyse de cas cliniques

Des LLM plus précis qu’un étudiant en médecine mais moins que des radiologues juniors

icon réservé aux abonnésArticle réservé aux abonnés
Le 03/02/25 à 7:00

Les auteurs de l’étude ont par conséquent constaté que GPT-4o était le plus précis des LLM, avec une précision de 59,6, surpassant un étudiant en médecine, mais n'a pas surpassé les professeurs juniors ou le radiologue en formation. (Photo d'illustration).

Les grands modèles de langage multimodaux (LLM), capables de traiter des données textuelles et visuelles, sont de plus en plus expérimentés dans le domaine de la radiologie. Dans une étude parue dans la revue Radiology, des chercheurs de l’Université Yonsei de Séoul, en Corée du Sud, ont évalué la précision de plusieurs d'entre eux face à celle de lecteurs humains, ayant différents niveaux d’expérience, dans des cas cliniques issus d'articles de la revue New England Journal of Medicine (NEJM), publiés de 2005 à 2024.

272 cas test avec des données textuelles et visuelles

Les LLM, dont GPT-4V, GPT-4 Omni (GPT-4o), DeepMind Gemini 1.5 Pro et Claude 3, ont été mis à l'épreuve sur 272 cas, avec des données textuelles et visuelles. Le groupe de lecteurs humains incluait sept radiologues juniors, deux cliniciens, un radiologue en formation et un étudiant en médecine, en aveugle face aux réponses publiées.

GPT-4o plus précis qu’un étudiant en médecine

Premier constat : GPT-4o était le plus

Il vous reste 49% de l’article à lire

Docteur Imago réserve cet article à ses abonnés

S'abonner à l'édition
  • Tous les contenus « abonnés » en illimité
  • Le journal numérique en avant-première
  • Newsletters exclusives, club abonnés

Abonnez-vous !

Docteur Imago en illimité sur desktop, tablette, smartphone, une offre 100% numérique

Offre mensuelle 100 % numérique

23 €

par mois

S’abonner à Docteur Imago

Auteurs

Solenn Duplessy

Voir la fiche de l’auteur

Bibliographie

    Suh PS, Shim WH, Suh CH, et al (2024) Comparing Large Language Model and Human Reader Accuracy with New England Journal of Medicine Image Challenge Case Image Inputs. Radiology 313:e241668. https://doi.org/10.1148/radiol.241668

Discussion

Aucun commentaire

Laisser un commentaire

Sur le même thème

Le fil Docteur Imago

24 Fév

16:00

De mauvaises explications des examens IRM avec contraste contribuent à l’anxiété des patients, rapporte une étude parue dans le Journal of Magnetic Resonance Imaging.  Les résultats soulignent l’importance d’améliorer la communication centrée sur le patient et de fournir des ressources éducatives simples pour réduire l’anxiété, améliorer le confort et soutenir des expériences positives, écrivent les chercheurs.

14:25

La FDA a approuvé une mise à jour de l’étiquetage d’Elucirem™ (gadopiclenol) de Guerbet, étendant son indication aux enfants de 0 à 2 ans, y compris les nouveau-nés à terme. Cet agent de contraste à base de gadolinium déjà approuvé en 2022, est le premier agent de contraste à base de gadolinium approuvé à une demi-dose de gadolinium, et avec la plus grande relaxivité, pour les examens IRM du système nerveux central et du corps, nécessitant la moitié de la dose conventionnelle, indique un communiqué fourni par Guerbet.

7:12

Une étude rétrospective a évalué un modèle d’apprentissage profond basé sur le scanner en phase veineuse porte pour distinguer les métastases hépatiques du cancer colorectal des hémangiomes, montrant de bonnes performances globales. L’assistance par DL améliore significativement le diagnostic des lésions de 10 à 30 mm, mais son apport reste limité pour les lésions subcentimétriques, pouvant nécessiter une IRM complémentaire.
23 Fév

15:51

Des scores de risques fournis par un outil commercial de diagnostic et prédiction automatique ont obtenu une performance « pas significativement différente » à celle des modèles cliniques pour prédire la récidive ipsilatérale après un traitement par chirurgie conservatoire d'un carcinome canalaire in situ (DCIS). Étude.
Docteur Imago

GRATUIT
VOIR