GMS | 106. Jahrestagung der Vereinigung Südwestdeutscher Hals-Nasen-Ohrenärzte | Risikostratifizierung von Schilddrüsenknoten: Bewertung der Eignung von ChatGPT für text- und bildbasierte Analysen

106. Jahrestagung der Vereinigung Südwestdeutscher Hals-Nasen-Ohrenärzte

20.09. - 21.09.2024, Regensburg

Artikel

XML Version

Artikel empfehlen

Risikostratifizierung von Schilddrüsenknoten: Bewertung der Eignung von ChatGPT für text- und bildbasierte Analysen

Risk stratification of thyroid nodules: Evaluation of the applicability of ChatGPT for text- and image-based analyses

Meeting Abstract

Suche in Medline nach

Olaf Conrad - Uniklinik Erlangen, Erlangen, Deutschland
Heinrich Iro - Uniklinik Erlangen, Erlangen, Deutschland
Michael Koch - Uniklinik Erlangen, Erlangen, Deutschland
Matti Sievert - Uniklinik Erlangen, Erlangen, Deutschland

Vereinigung Südwestdeutscher Hals-Nasen-Ohrenärzte. 106. Jahrestagung der Vereinigung Südwestdeutscher Hals-Nasen-Ohrenärzte. Regensburg, 20.-21.09.2024. Düsseldorf: German Medical Science GMS Publishing House; 2024. Doc24hnosw18

doi: 10.3205/24hnosw18, urn:nbn:de:0183-24hnosw186

Veröffentlicht:	16. September 2024

© 2024 Conrad et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.

Gliederung

Text

Hintergrund: Eine genaue Risikostratifizierung von Schilddrüsenknoten ist für die Behandlung von Patienten unerlässlich. Ziel dieser Studie war es, die Fähigkeit von ChatGPT zur Risikostratifizierung von Schilddrüsenknoten anhand von text- und bildbasierten Auswertungen zu bewerten und miteinander zu vergleichen.

Material und Methoden: Es wurde ein Datensatz bestehend aus 50 anonymisierten sonographischen Bildern, klinischen Befunden und histologischen Befunden zusammengestellt. Die sonographischen Merkmale wurden gemäß dem Thyroid Imaging Reporting and Data System (TI-RADS) unter Verwendung des Chat Generative Pre-trained Transformer (ChatGPT) klassifiziert – einmal nur anhand des Textberichts und einmal nur anhand des Bildes selbst. Mehrere Kriterien wie Sensitivität, Spezifität und Genauigkeit wurden zur Bewertung der Leistung des Modells herangezogen. Es wurde auch eine vergleichende Analyse durchgeführt, um das Modell mit der Risikostratifizierung durch den Untersucher und der Histologie zu vergleichen.

Ergebnisse: Die textbasierte Bewertung zeigte eine Gesamtübereinstimmungsrate von 42 % im Vergleich zur Bewertung durch den Untersucher. Diese Methode erreichte eine Sensitivität von 86,7 %, eine Spezifität von 10,7 % und eine Gesamtgenauigkeit von 68 % bei der Unterscheidung zwischen Niedrigrisiko- (TI-RADS 2 und 3) und Hochrisikokategorien (TI-RADS 4 und 5). Der bildbasierte Teil der Studie erreichte eine Sensitivität von 21,9 % und eine Spezifität von 100 %. Die Interrater-Zuverlässigkeit erzielt ein Cohen's Kappa von 0,686.

Schlussfolgerung: Diese Studie unterstreicht das Potenzial von ChatGPT zur Unterstützung von Klinikern bei der Risikostratifizierung von Schilddrüsenknoten. Die Ergebnisse deuten darauf hin, dass ChatGPT personalisierte Behandlungsentscheidungen erleichtern kann, obwohl die Übereinstimmungsrate noch gering ist. Der Vergleich der beiden Eingabemethoden zeigt, dass die großen Unterschiede in der Sensitivität und Spezifität darauf hindeuten, dass der klinische Einsatz zum jetzigen Zeitpunkt nicht empfohlen werden sollte. Weitere Forschungs- und Validierungsstudien sind erforderlich, um die klinische Anwendbarkeit und Verallgemeinerbarkeit von ChatGPT in der Routinepraxis zu verbessern. Die Integration von ChatGPT in klinische Arbeitsabläufe hat das Potenzial, die Risikobewertung von Schilddrüsenknoten und die Patientenversorgung zu verbessern.

Gliederung

Literatur

1.: Lauria Pantano A, Maddaloni E, Briganti SI, Beretta Anguissola G, Perrella E, Taffon C, Palermo A, Pozzilli P, Manfrini S, Crescenzi A. Differences between ATA, AACE/ACE/AME and ACR TI-RADS ultrasound classifications performance in identifying cytological high-risk thyroid nodules. Eur J Endocrinol. 2018 Jun;178(6):595-603. DOI: 10.1530/EJE-18-0083
2.: Trimboli P, Durante C. Ultrasound risk stratification systems for thyroid nodule: between lights and shadows, we are moving towards a new era. Endocrine. 2020 Jul;69(1):1-4. DOI: 10.1007/s12020-020-02196-6
3.: Tessler FN, Middleton WD, Grant EG, Hoang JK, Berland LL, Teefey SA, Cronan JJ, Beland MD, Desser TS, Frates MC, Hammers LW, Hamper UM, Langer JE, Reading CC, Scoutt LM, Stavros AT. ACR Thyroid Imaging, Reporting and Data System (TI-RADS): White Paper of the ACR TI-RADS Committee. J Am Coll Radiol. 2017 May;14(5):587-595. DOI: 10.1016/j.jacr.2017.01.046

gms | German Medical Science

106. Jahrestagung der Vereinigung Südwestdeutscher Hals-Nasen-Ohrenärzte

Artikel

Risikostratifizierung von Schilddrüsenknoten: Bewertung der Eignung von ChatGPT für text- und bildbasierte Analysen

Risk stratification of thyroid nodules: Evaluation of the applicability of ChatGPT for text- and image-based analyses

Suche in Medline nach

Autoren

Gliederung

Text

Literatur

gms | German Medical Science

106. Jahrestagung der Vereinigung Südwestdeutscher Hals-Nasen-Ohrenärzte

Artikel

Risikostratifizierung von Schilddrüsenknoten: Bewertung der Eignung von ChatGPT für text- und bildbasierte Analysen Risk stratification of thyroid nodules: Evaluation of the applicability of ChatGPT for text- and image-based analyses

Suche in Medline nach

Autoren

Gliederung

Text

Literatur

Risikostratifizierung von Schilddrüsenknoten: Bewertung der Eignung von ChatGPT für text- und bildbasierte Analysen

Risk stratification of thyroid nodules: Evaluation of the applicability of ChatGPT for text- and image-based analyses