Kurz, C.* ; Merzhevich, T.* ; Eskofier, B.M. ; Kather, J.N.* ; Gmeiner, B.*
Benchmarking vision-language models for diagnostics in emergency and critical care settings.
NPJ Digit. Med. 8:423 (2025)
The applicability of vision-language models (VLMs) for acute care in emergency and intensive care units remains underexplored. Using a multimodal dataset of diagnostic questions involving medical images and clinical context, we benchmarked several small open-source VLMs against GPT-4o. While open models demonstrated limited diagnostic accuracy (up to 40.4%), GPT-4o significantly outperformed them (68.1%). Findings highlight the need for specialized training and optimization to improve open-source VLMs for acute care applications.
Impact Factor
Scopus SNIP
Web of Science
Times Cited
Scopus
Cited By
Altmetric
Publikationstyp
Artikel: Journalartikel
Dokumenttyp
Wissenschaftlicher Artikel
Typ der Hochschulschrift
Herausgeber
Schlagwörter
Keywords plus
Sprache
englisch
Veröffentlichungsjahr
2025
Prepublished im Jahr
0
HGF-Berichtsjahr
2025
ISSN (print) / ISBN
2398-6352
e-ISSN
2398-6352
ISBN
Bandtitel
Konferenztitel
Konferzenzdatum
Konferenzort
Konferenzband
Quellenangaben
Band: 8,
Heft: 1,
Seiten: ,
Artikelnummer: 423
Supplement: ,
Reihe
Verlag
Nature Publishing Group
Verlagsort
Heidelberger Platz 3, Berlin, 14197, Germany
Tag d. mündl. Prüfung
0000-00-00
Betreuer
Gutachter
Prüfer
Topic
Hochschule
Hochschulort
Fakultät
Veröffentlichungsdatum
0000-00-00
Anmeldedatum
0000-00-00
Anmelder/Inhaber
weitere Inhaber
Anmeldeland
Priorität
Begutachtungsstatus
Peer reviewed
Institut(e)
Institute of AI for Health (AIH)
POF Topic(s)
30205 - Bioengineering and Digital Health
Forschungsfeld(er)
Enabling and Novel Technologies
PSP-Element(e)
G-540008-001
Förderungen
Novartis Pharma
Copyright
Erfassungsdatum
2025-07-14