Artikel
Risikostratifizierung von Schilddrüsenknoten: Bewertung der Eignung von ChatGPT für text- und bildbasierte Analysen
Risk stratification of thyroid nodules: Evaluation of the applicability of ChatGPT for text- and image-based analyses
Suche in Medline nach
Autoren
Veröffentlicht: | 16. September 2024 |
---|
Gliederung
Text
Hintergrund: Eine genaue Risikostratifizierung von Schilddrüsenknoten ist für die Behandlung von Patienten unerlässlich. Ziel dieser Studie war es, die Fähigkeit von ChatGPT zur Risikostratifizierung von Schilddrüsenknoten anhand von text- und bildbasierten Auswertungen zu bewerten und miteinander zu vergleichen.
Material und Methoden: Es wurde ein Datensatz bestehend aus 50 anonymisierten sonographischen Bildern, klinischen Befunden und histologischen Befunden zusammengestellt. Die sonographischen Merkmale wurden gemäß dem Thyroid Imaging Reporting and Data System (TI-RADS) unter Verwendung des Chat Generative Pre-trained Transformer (ChatGPT) klassifiziert – einmal nur anhand des Textberichts und einmal nur anhand des Bildes selbst. Mehrere Kriterien wie Sensitivität, Spezifität und Genauigkeit wurden zur Bewertung der Leistung des Modells herangezogen. Es wurde auch eine vergleichende Analyse durchgeführt, um das Modell mit der Risikostratifizierung durch den Untersucher und der Histologie zu vergleichen.
Ergebnisse: Die textbasierte Bewertung zeigte eine Gesamtübereinstimmungsrate von 42 % im Vergleich zur Bewertung durch den Untersucher. Diese Methode erreichte eine Sensitivität von 86,7 %, eine Spezifität von 10,7 % und eine Gesamtgenauigkeit von 68 % bei der Unterscheidung zwischen Niedrigrisiko- (TI-RADS 2 und 3) und Hochrisikokategorien (TI-RADS 4 und 5). Der bildbasierte Teil der Studie erreichte eine Sensitivität von 21,9 % und eine Spezifität von 100 %. Die Interrater-Zuverlässigkeit erzielt ein Cohen's Kappa von 0,686.
Schlussfolgerung: Diese Studie unterstreicht das Potenzial von ChatGPT zur Unterstützung von Klinikern bei der Risikostratifizierung von Schilddrüsenknoten. Die Ergebnisse deuten darauf hin, dass ChatGPT personalisierte Behandlungsentscheidungen erleichtern kann, obwohl die Übereinstimmungsrate noch gering ist. Der Vergleich der beiden Eingabemethoden zeigt, dass die großen Unterschiede in der Sensitivität und Spezifität darauf hindeuten, dass der klinische Einsatz zum jetzigen Zeitpunkt nicht empfohlen werden sollte. Weitere Forschungs- und Validierungsstudien sind erforderlich, um die klinische Anwendbarkeit und Verallgemeinerbarkeit von ChatGPT in der Routinepraxis zu verbessern. Die Integration von ChatGPT in klinische Arbeitsabläufe hat das Potenzial, die Risikobewertung von Schilddrüsenknoten und die Patientenversorgung zu verbessern.
Literatur
- 1.
- Lauria Pantano A, Maddaloni E, Briganti SI, Beretta Anguissola G, Perrella E, Taffon C, Palermo A, Pozzilli P, Manfrini S, Crescenzi A. Differences between ATA, AACE/ACE/AME and ACR TI-RADS ultrasound classifications performance in identifying cytological high-risk thyroid nodules. Eur J Endocrinol. 2018 Jun;178(6):595-603. DOI: 10.1530/EJE-18-0083
- 2.
- Trimboli P, Durante C. Ultrasound risk stratification systems for thyroid nodule: between lights and shadows, we are moving towards a new era. Endocrine. 2020 Jul;69(1):1-4. DOI: 10.1007/s12020-020-02196-6
- 3.
- Tessler FN, Middleton WD, Grant EG, Hoang JK, Berland LL, Teefey SA, Cronan JJ, Beland MD, Desser TS, Frates MC, Hammers LW, Hamper UM, Langer JE, Reading CC, Scoutt LM, Stavros AT. ACR Thyroid Imaging, Reporting and Data System (TI-RADS): White Paper of the ACR TI-RADS Committee. J Am Coll Radiol. 2017 May;14(5):587-595. DOI: 10.1016/j.jacr.2017.01.046