gms | German Medical Science

HEC 2016: Health — Exploring Complexity
2016 Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

28.08. - 02.09.2016, München

Translation at your fingertips? – Bewertung der Übersetzungsqualität medizinischer Fachtermini bei der Übersetzung mittels Web-Apps

Meeting Abstract

Search Medline for

  • Cord Spreckelsen - Institut für Medizinische Informatik, RWTH Aachen, Aachen, Deutschland
  • Markus Bauer - Institut für Medizinische Informatik, RWTH Aachen University, Aachen, Deutschland

HEC 2016: Health – Exploring Complexity. Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI. München, 28.08.-02.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocAbstr. 684

doi: 10.3205/16gmds135, urn:nbn:de:0183-16gmds1359

Published: August 8, 2016

© 2016 Spreckelsen et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Hintergrund: Biomedizinische Forschung ist multilingual mit Englisch als vorherrschender Wissenschaftssprache. Auch in der klinischen Arbeit ist Mehrsprachigkeit angesichts entsprechender Patientenkollektive oder Versorgungsteams relevant. Die leichte Verfügbarkeit von Web-Apps zur Übersetzung lädt dazu ein, Fachbegriffe ad hoc zu minimalen Kosten zu übersetzen [1]. Daher stellt sich die Frage nach Qualität und Nutzen solcher Übersetzungen. Schulz et al. zeigten in einer Bilingual Evaluation Understudy (BLEU) für 500 zufällig gewählte SNOMED CT-Einträge (fully specified names), dass Web-Apps wie Google Translate aus Sicht der Autoren überraschend gute Ergebnissen erzielten [2]. Pecina et al. konnten zeigen, dass speziell trainierte Maschinenübersetzer die Retrieval Rate biomedizinischer Fachinformationen drastisch erhöhen [3], [4]. Es liegt deshalb nahe, zu überprüfen, bis zu welchem (Abdeckungs-)Grad Web-Apps biomedizinische Fachterminologie in z.B. für das Informationsretrival ausreichender Qualität übersetzen. Medizinische Terminologiesysteme mit offiziellen Übersetzungen lassen sich als Goldstandard nutzen. Ziel des Projekts war es, Qualität und Abdeckungsgrad von Übersetzung der Medical Subject Headings (MeSH) durch Web-Apps zu bewerten.

Methoden: Das Projekt nutzte die Übersetzung der MeSH des Deutschen Instituts für Medizinische Dokumentation und Information (DIMDI). Mittels der Application Programming Interfaces (APIs) von Google Translate, Bing Translator und Wikipedia wurden für sämtliche 27.456 MeSH Main Headings (Tabelle MH) Übersetzungen abgefragt und tabelliert. Zur Prüfung der Übereinstimmung zwischen der offiziellen DIMDI-Übersetzung und den maschinell generierten Übersetzungen wurde 1) die Wortähnlichkeit durch die Levenshtein-Distanz (LD, jeweils absolut und normiert bzgl. Wortlänge) quantifiziert [5] und 2) eine qualitative Bewertung von randomisiert ausgewählten Stichproben durch medizinterminologisch geschulte Bewerter vorgenommen. Für diese Bewertung wurden je 100 Main Headings niedriger, mittlerer und hoher LD selektiert und beurteilt.

Ergebnisse: Bing Translator übersetzte ca. 70% der MeSH Headings durch identische Wörter. Die Übereinstimmung zusammengesetzter Ausdrücke in Kasus, Numerus und Genus (KNG-Kongruenz) war im Bing Translator höher als in Google Translate, was dessen geringeren Wert für die identische Übersetzung (knapp 50%) erklärt. Bei Toleranz einer absoluten LD <=3 verschwindet der Unterschied weitgehend. Die Levenshtein-Distanzen sind charakteristisch verteilt: Gehäuft treten kleine Distanzen (abs. LD: 1-3) auf, während höhere Distanzen recht gleichmäßig und deutlich seltener anzutreffen sind. Kleinere LD-Werte sind meist auf Flexion sonst übereinstimmender Wörter, hohe LD-Werte auf Umstellungen (z.B. Vor-/Nachstellung des Adjektivs) und synonyme Bezeichnungen zurückzuführen. Sinnentstellende Übersetzungen traten in den Stichproben nicht auf, selten erscheinen umgangs- statt fachsprachliche Terme. In der Gruppe mittlerer LD treten Prä- und Suffixe auf, die teilweise bedeutungsrelevant sind. Die Abdeckung der MeSH Main Headings durch englischsprachige Wikipedia Artikel liegt bei fast 43% (vgl. deutschsprachig 37%); für ca. 30% aller MeSH Headings liegen die Artikel in beiden Sprachen vor.

Zusammenfassung: Das vorliegende Projekt stützt die durch Schulz et al. [2] getroffene Einschätzung auf Basis eines umfassenden Vergleichs (27.456 Terme): Die Übersetzungsqualität ist überraschend hoch. Sie nimmt allerdings für zusammengesetzte Ausdrücke etwas ab. Auch sind Bedeutungsabweichungen (meist durch abweichende Prä-/Suffixe) möglich und sollten grundsätzlich als qualitätslimitierender Faktor einkalkuliert werden. Die sehr hohe Abdeckung durch sinnerhaltende Übersetzungen legt nahe, dass die Übersetzungs-Apps (mittels API) die Bewältigung von Mehrsprachigkeit in der Medizin effektiv unterstützen können.


Literatur

1.
Aiken M, Balan S. An analysis of Google Translate accuracy. Translation journal. 2011 Apr;16(2):1-3.
2.
Schulz S, Bernhardt-Melischnig J, Kreuzthaler M, Daumke P, Boeker M. Machine vs. human translation of SNOMED CT terms. Stud Health Technol Inform. 2013;192:581–4.
3.
Uresová Z, Hajic J, Pecina P, Dusek O. Multilingual Test Sets for Machine Translation of Search Queries for Cross-Lingual Information Retrieval in the Medical Domain. In: LREC 2014. p. 3244-3247.
4.
Pecina P, Dušek O, Goeuriot L, Hajič J, Hlaváčová J, Jones GJF, et al. Adaptation of machine translation for multilingual information retrieval in the medical domain. Artif Intell Med. Juli 2014;61(3):165–85.
5.
Levenshtein VI. Binary codes capable of correcting deletions, insertions, and reversals. Soviet physics doklady. 1966;10(8):707-710.