Analyse de cas cliniques

Des LLM plus précis qu’un étudiant en médecine mais moins que des radiologues juniors

Article réservé aux abonnés

Le 03/02/25 à 7:00

Les auteurs de l’étude ont par conséquent constaté que GPT-4o était le plus précis des LLM, avec une précision de 59,6, surpassant un étudiant en médecine, mais n'a pas surpassé les professeurs juniors ou le radiologue en formation. (Photo d'illustration).

Les grands modèles de langage multimodaux (LLM), capables de traiter des données textuelles et visuelles, sont de plus en plus expérimentés dans le domaine de la radiologie. Dans une étude parue dans la revue Radiology, des chercheurs de l’Université Yonsei de Séoul, en Corée du Sud, ont évalué la précision de plusieurs d'entre eux face à celle de lecteurs humains, ayant différents niveaux d’expérience, dans des cas cliniques issus d'articles de la revue New England Journal of Medicine (NEJM), publiés de 2005 à 2024.

272 cas test avec des données textuelles et visuelles

Les LLM, dont GPT-4V, GPT-4 Omni (GPT-4o), DeepMind Gemini 1.5 Pro et Claude 3, ont été mis à l'épreuve sur 272 cas, avec des données textuelles et visuelles. Le groupe de lecteurs humains incluait sept radiologues juniors, deux cliniciens, un radiologue en formation et un étudiant en médecine, en aveugle face aux réponses publiées.

GPT-4o plus précis qu’un étudiant en médecine

Premier constat : GPT-4o était le plus

Il vous reste 49% de l’article à lire

Docteur Imago réserve cet article à ses abonnés

Vous avez déjà un compte ? Se connecter

Tous les contenus « abonnés » en illimité
Le journal numérique en avant-première
Newsletters exclusives, club abonnés

Abonnez-vous !

Docteur Imago en illimité sur desktop, tablette, smartphone, une offre 100% numérique

Offre mensuelle 100 % numérique

23 €

par mois

S’abonner à Docteur Imago

Auteurs

Solenn Duplessy

Voir la fiche de l’auteur

Bibliographie

Suh PS, Shim WH, Suh CH, et al (2024) Comparing Large Language Model and Human Reader Accuracy with New England Journal of Medicine Image Challenge Case Image Inputs. Radiology 313:e241668. https://doi.org/10.1148/radiol.241668

Discussion

Aucun commentaire

Commenter cet article

Laisser un commentaire Annuler la réponse

You must be logged in to post a comment.

Dans le dossier

L’intelligence artificielle en langage naturel

Voir le dossier

Le fil Docteur Imago

31 Juil

16:28

Une étude parue dans la revue phiRO conclut qu'une architecture PocketNet offre une segmentation automatisée fiable des organes gynécologiques et des tumeurs cervicales sur IRM pondérée en T2, avec des performances comparables à celles d’un nnUNet de taille réelle tout en nécessitant beaucoup moins de mémoire et de temps d’entraînement.

8:00

Le CHU de Montpellier annonce avoir mené la prise en charge d'un AVC en 16 minutes, de l'admission du patient à la recanalisation, grâce à une organisation adaptée, qui nous avions présentée en 2023.

7:00

Première mondiale

Une cryoablation des nerfs intercostaux permet une reconstruction d’oreille sans douleur postopératoire

Socioprofessionnel

30 Juil

17:38

Des chercheurs ont développé un nouveau détecteur de rayons X qu’ils disent capable de produire des images plus nettes à des doses de radiation plus faibles. Les résultats de leur étude ont été publié dans National Science Review.

13:52

Selon la DREES, le déficit des hôpitaux publics est estimé à 2,3 milliards d'euros en 2025, soit « le troisième niveau le plus élevé » de ces vingt dernières années.

7:30

Selon une étude, les examens de TEP-TDM devraient être envisagés comme examen de première intention pour diagnostiquer les patients atteints de fièvre d'origine inconnue. Les chercheurs mettent en avant la performance diagnostique et l'impact vertueux sur la prise en charge des patients

272 cas test avec des données textuelles et visuelles

GPT-4o plus précis qu’un étudiant en médecine

Laisser un commentaire Annuler la réponse

Les LLM en radiologie rencontrent leurs premiers succès et des défis

Un modèle de langage géré localement peut extraire des données des comptes rendus en préservant l’anonymat des patients

L’intelligence artificielle en langage naturel

Une cryoablation des nerfs intercostaux permet une reconstruction d’oreille sans douleur postopératoire