PuSH - Publikationsserver des Helmholtz Zentrums München

Kurz, C.* ; Merzhevich, T.* ; Eskofier, B.M. ; Kather, J.N.* ; Gmeiner, B.*

Benchmarking vision-language models for diagnostics in emergency and critical care settings.

NPJ Digit. Med. 8:423 (2025)
Verlagsversion DOI PMC
Open Access Gold
Creative Commons Lizenzvertrag
The applicability of vision-language models (VLMs) for acute care in emergency and intensive care units remains underexplored. Using a multimodal dataset of diagnostic questions involving medical images and clinical context, we benchmarked several small open-source VLMs against GPT-4o. While open models demonstrated limited diagnostic accuracy (up to 40.4%), GPT-4o significantly outperformed them (68.1%). Findings highlight the need for specialized training and optimization to improve open-source VLMs for acute care applications.
Impact Factor
Scopus SNIP
Altmetric
15.100
0.000
Tags
Anmerkungen
Besondere Publikation
Auf Hompepage verbergern

Zusatzinfos bearbeiten
Eigene Tags bearbeiten
Privat
Eigene Anmerkung bearbeiten
Privat
Auf Publikationslisten für
Homepage nicht anzeigen
Als besondere Publikation
markieren
Publikationstyp Artikel: Journalartikel
Dokumenttyp Wissenschaftlicher Artikel
Sprache englisch
Veröffentlichungsjahr 2025
HGF-Berichtsjahr 2025
ISSN (print) / ISBN 2398-6352
e-ISSN 2398-6352
Zeitschrift NPJ digital medicine
Quellenangaben Band: 8, Heft: 1, Seiten: , Artikelnummer: 423 Supplement: ,
Verlag Nature Publishing Group
Verlagsort Heidelberger Platz 3, Berlin, 14197, Germany
Begutachtungsstatus Peer reviewed
Institut(e) Institute of AI for Health (AIH)
POF Topic(s) 30205 - Bioengineering and Digital Health
Forschungsfeld(er) Enabling and Novel Technologies
PSP-Element(e) G-540008-001
Förderungen Novartis Pharma
Scopus ID 105010500238
PubMed ID 40640347
Erfassungsdatum 2025-07-14