Modèle de langage

ChatGPT et Gemini démontrent leur potentiel face aux neuroradiologues

Une étude menée par Bastien Le Guellec a comparé les performances des grands modèles de langage comme ChatGPT et Gemini, capables désormais d’établir des diagnostics médicaux à partir d’images, avec celles des neuroradiologues. Les résultats ont été présentés lors du congrès de la SFNR à Paris le 12 mars dernier.

icon réservé aux abonnésArticle réservé aux abonnés
Le 09/05/25 à 7:00, mise à jour le 13/05/25 à 12:14 Lecture 3 min.

Dans le cadre de cette étude, deux modèles multimodaux : ChatGPT de OpenAI et Gemini de Google, qui intègrent à la fois des images et des textes, ont été mis à l’épreuve face à six experts en neuroradiologie, issus de quatre centres hospitaliers différents, détaille Bastien Le Guellec lors de sa présentation. © Solenn Duplessy

Lors d’une session au congrès de la Société française de neuroradiologie (SFNR) le 12 mars 2025 à Paris, Bastien Le Guellec, radiologue au service de neuroradiologie au CHU de Lille (59) a présenté les résultats d’une étude, dont il est l’auteur principal, analysant les capacités diagnostiques des grands modèles de langage en neuroradiologie face aux experts humains. L’objectif était ainsi de comparer la performance de modèles d’IA multimodaux, tels que ChatGPT et Gemini, à celle de neuroradiologues face à des cas cliniques réels.

Des limites au diagnostic

Désormais testé et étudié pour générer des diagnostics à partir d’images médicales intégrées, Chat GPT est capable de répondre à certaines questions, mais reste toutefois limité pour établir des diagnostics, constate Bastien Le Guellec. Un constat pourtant en contradiction avec des études menées ultérieurement mettant en avant des performances de Chat GPT similaires à celles de neuroradiologues experts pour générer des suggestions diag

Il vous reste 80% de l’article à lire

Docteur Imago réserve cet article à ses abonnés

S'abonner à l'édition
  • Tous les contenus « abonnés » en illimité
  • Le journal numérique en avant-première
  • Newsletters exclusives, club abonnés

Abonnez-vous !

Docteur Imago en illimité sur desktop, tablette, smartphone, une offre 100% numérique

Offre mensuelle 100 % numérique

23 €

par mois

S’abonner à Docteur Imago

Auteurs

Solenn Duplessy

Voir la fiche de l’auteur

Bibliographie

  1. Le Guellec B, Bruge C, Vannod-Michel Q, et al (2025) Chat GPT vs experts : Comment pensent les robots et les neuroradiologues face à des textes et des images ? Journal of Neuroradiology 52(2):101252. https://doi.org/10.1016/j.neurad.2025.101252.

Discussion

Aucun commentaire

Laisser un commentaire

Le fil Docteur Imago

19 Mar

16:00

La réponse de perfusion à l’adénosine semble être spécifique à chaque organe, conclut une étude parue dans JNM. L’adénosine augmente la perfusion au niveau du cœur, du foie, du côlon et du duodénum, tandis que la perfusion est réduite par l’adénosine dans le cerveau, la rate, les reins, le muscle squelettique et l’os, écrivent les chercheurs.

13:25

La présentation est la clé d'une bonne compréhension des comptes rendus d'imagerie « patient-friendly », conclut une étude présentée dans JACR. Les formats « traduction complète » et « basé sur les phrases », associant des sources pour vérifier les informations sont plus efficaces qu'une simple définition des termes techniques.

7:10

Dans une étude évaluant les niveaux de référence en doses de radiation et les indicateurs de qualité d’image dans les protocoles d’imagerie thorax-abdomen en unité de soins intensifs néonatals,  des chercheurs relève que les nouveau-nés pesant entre 1000 et 1 499 g et 1 500 à 2499 g avaient des doses cutanées inférieures à celles des nouveau-nés pesant moins de 1 000 g.

18 Mar

16:54

Des chercheurs ont étudié les performances d’une méthode d’intelligence artificielle pour la segmentation automatisée du volume tumoral métabolique total (TMTV) sur des images TEP-TDM sur des patients atteints de lymphome. Il s'avère que l'IA a obtenu des résultats similaires que des experts humains. (étude)

16:50

Une étude a évalué la précision diagnostique d'un outil d'IA pour la détection des fractures de la hanche et du bassin. Il ressort que l'IA est d'une précision élevée pour les radiographies de la hanche mais moindre quand cela concerne les fractures du bassin.
Docteur Imago

GRATUIT
VOIR