gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Bürgerorientierte Präsentation von Informationen über Krankenhäuser im Internet mittels automatisierter Textgenerierung

Meeting Abstract

  • Christa Weßel - Institut für Medizinische Informatik, RWTH Aachen, Aachen
  • Lutz Ißler - Institut für Medizinische Informatik, RWTH Aachen, Aachen
  • Cord Spreckelsen - Institut für Medizinische Informatik, RWTH Aachen, Aachen
  • Gökhan Karakas - Institut für Medizinische Informatik, RWTH Aachen, Aachen

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds225

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2005/05gmds443.shtml

Veröffentlicht: 8. September 2005

© 2005 Weßel et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung

Zahllose Plattformen, Homepages und Ratgeber bieten im Internet Informationen über Krankenhäuser an. Angesichts dieser Informationsvielfalt fragt sich der Bürger, z.B. als potentieller Patient: „Welches ist das beste Krankenhaus für mich?“ Diese Frage zielt beispielsweise auf das Krankenhaus mit den besten Ergebnissen bei bestimmten Operationen; das Krankenhaus, das sich auf seltene Erkrankungen spezialisiert hat; oder einfach das Krankenhaus, das in der Nähe liegt. Das Informationsangebot sollte ihre einfache Beantwortung ermöglichen.

Der Bürger ist mündig und ein Laie. Daraus ergibt sich als zentrale Anforderung an entsprechende Informationsplattformen im Internet, die Informationen über Krankenhäuser in klarer, aktueller und allgemein verständlicher Form darzustellen. Der Bürger muss leicht Vergleiche anstellen können. Er muss eine Suche nach den von ihm gewünschten Informationen durchführen können. Vor allem muss er ein einheitliches, leicht verständliches Layout mit prägnant aufbereiteten Informationen in Texten, Tabellen oder Bildern vorfinden, das er seinen Bedürfnissen entsprechend anpassen kann [1]. Es ist umständlich, Texte immer wieder neu und anwenderspezifisch zu verfassen oder mittels Kopieren und Einfügen sowie Anpassungen des Inhalts und der Grammatik Schritt für Schritt zu überarbeiten. Wir vereinfachen diesen Prozess durch eine automatisierte Textgenerierung aus strukturierten Datenobjekten, die in die webbasierte Informationsplattform über Krankenhäuser CERES integriert ist.

Ansatz

Die existierenden Informationsplattformen im Internet bieten in der Regel eine Sammlung von Links zu Internetauftritten verschiedener Krankenhäuser oder Adressverzeichnisse mit einigen Zusatzinformationen an. Um jedoch die genannten Anforderungen zu erfüllen, haben wir folgenden Ansatz gewählt. In einer zentralen Objektdatenbank sind Informationen über Krankenhäuser hinterlegt. Diese Informationen werden in textueller, tabellarischer und grafischer Form aufbereitet auf Webseiten im Internet angeboten. Außerdem ist eine Landkarte angebunden, die die Lokalisation der Krankenhäuser anzeigt. All diese Webanwendungen greifen zur Laufzeit auf die Objektdatenbank zu und präsentieren ihre Informationen in einer gemeinsamen Oberfläche. Der Anwender kann bequem von einer Darstellungsart in die andere wechseln [2].

Das Schema der Objektdatenbank gibt die Struktur der Inhalte vor, die mittels der Webseiten dem Anwender angeboten werden. Dieses Schema ist ein Krankenhaus-Meta-Modell, das allgemeine Vorgaben für die konkrete Beschreibung der Struktur und des Leistungsspektrums einzelner Häuser formuliert. Die Daten zu einem oder mehreren Krankenhäusern (möglichst vielen!) werden aus anderen Datenbanken in die zentrale Objektdatenbank importiert und können von Hand ergänzt werden.

Das Meta-Modell und der Inhalt der Objektdatenbank sind redundanzfrei. Jede Information liegt damit nur einmal vor. Dies betrifft z.B. auch ökonomische Kennzahlen. Für diese interessiert sich unsere gegenwärtige Anwendergruppe potentieller Patienten mit ihren eingangs genannten Fragen nicht. Die anwenderspezifische Umstrukturierung des Meta-Modells erfolgt über die Modellierung von Sichten [3]. Die Webanwendungen benutzen die jeweilige anwenderspezifische Sicht zur Darstellung der abgefragten Informationen.

Mittels automatisierter Textgenerierung werden verständliche und aussagekräftige Texte erstellt [4].

Methode

Im Redaktionsinstrument verfasst der Webseitenredakteur Mustertexte, z.B. „Das Krankenhaus ... hat ... Fachabteilungen und ... Stationen. Die Abteilung für ... hat sich spezialisiert auf ...“. Er teilt die Mustertexte in Absätze auf und bestimmt deren Priorität.

Die Textgenerierungskomponente verarbeitet die Krankenhausdaten und die Mustertexte zu grammatisch korrekten Ausgabetexten. Sie ist Teil der Anwendung FABULINUS [4], die die Informationsbausteine („nuggets“) einer Webseite (Tabellen, Grafiken und Texte) mit den Krankenhausdaten aus der Objektdatenbank zusammenführt.

Als Grundlage der Textgenerierung dient – neben den Krankenhausinformationen und den vom Redakteur vorbereiteten Mustertexten – eine morphologische Datenbank. Diese enthält die notwendigen linguistischen Informationen zur Anpassung der Mustertexte an die ermittelten Krankenhausinformationen, z.B. bei der Herstellung von Kasus-Numerus-Genus-Kongruenz im Text. Für die Erzeugung der Texte werden Methoden der natürlichsprachlichen Textgenerierung angewendet. Es werden parametrisierbare Mustertexte mit fortgeschrittenen Generierungstechniken gekoppelt. Letztere benutzen Methoden aus der Computerlinguistik und der künstlichen Intelligenz. XML ist das Dateiformat. Die Generierung erfolgt mittels XSL-Transformationen. Sechs parametrisierbare Generierungsanweisungen – beispielsweise zur Deklination der Substantive – wurden definiert und operationalisiert.

Eine weitere Komponente übernimmt die prioritätenbasierte Auswahl der zu präsentierenden Informationsbausteine und den Export in das HTML-Format. Der Anwender kann die dargestellte Informationsmenge regulieren. Je nach gewünschtem Prioritätsniveau werden weniger wichtige Informationen und Textabsätze nicht angezeigt. Somit können Texte unterschiedlicher Länge produziert werden.

Ergebnis

Es wurde eine Webanwendung implementiert, die dem Anwender, dem potentiellen Patienten, Texte über Krankenhäuser in übersichtlicher und klarer Form anbietet. Die Anwendung ist in CERES, der webbasierten Informationsplattform über Krankenhäuser, integriert. Ein Redakteur kann Mustertexte erstellen und über die Vergabe von Prioritätswerten die Anordnung der Texte steuern. Durch die automatische Textgenerierung werden die Krankenhausdaten in Form angenehm lesbarer, grammatisch korrekter Texte vermittelt. Der Anwender kann die Art der Präsentation, z.B. Farben, Größe und Hintergrund durch Einstellungen in der Anwendung selbst festlegen. Die Funktionen Suche, Vergleich und Sortierung sind konzipiert. Die Evaluation erfolgte mittels eines Kognitiven Durchlaufs [5] und fortlaufender Prüfungen im CERES-Projekt.

Diskussion und Fazit

Die automatisierte Erstellung webbasierter Anwenderschnittstellen aus objektorientierten Modellen und Datenbanken wird auch in anderen Konzepten bereits verfolgt [6]. Neu am hier vorgestellten Ansatz ist die Integration der automatisierten Textgenerierung, welche dem Anbieter die manuelle Erstellung und Wartung der Texte erspart. Es gibt zahlreiche implementierte Textgenerierungssysteme, deren Spektrum von sehr einfachen bis zu sehr komplexen Ansätzen reicht [1], [7]. Die komplexeren Systeme sind in der Regel wissenschaftliche Forschungsprotoypen. Ihre Einrichtung und Wartung ist aufwändig. Einfache Systeme können ausreichend sein. Busemann und Horacek [8] plädieren für die Entwicklung einer Mischform, z.B. wie in unserem Fall aus fortgeschrittenen Generierungstechniken und Mustertexten. Diese ist einfach zu implementieren und zu warten. Damit ist es möglich, Ausgaben von hoher Textqualität zu produzieren.. Der nächste Schritt ist die detaillierte Evaluation der Textvorbereitung und –redaktion durch den Redakteur einerseits sowie der Nutzung der Webseiten durch Vertreter der Anwendergruppe potentieller Patient andererseits.


Literatur

1.
Cawsey AJ, Webber BL, Jones RB. Natural Language Generation in Health Care. In: J Am Med Inform Assoc. 1997;6: 473-82.
2.
Weßel C, Karakas G, Ißler L, Weymann F, Palm S, Spreckelsen C, Spitzer K. CERES - ein Instrument zur webbasierten Darstellung, Pflege und Visualisierung von Krankenhausinformationen. In: Köpcke W , Hrsg. Informatik, Biometrie und Epidemiologie in Medizin und Biologie. Abstracts der 48. Jahrestagung der GMDS. Jena: Urban und Fischer, 2003: 361-362.
3.
Ißler L. Implementierung und grafische Deklaration objektorientierter Sichten. Diplomarbeit. Aachen: RWTH Aachen, 2005.
4.
Karakas G. Automatisches Generieren von webbasierten und benutzungsfreundlichen Informationsseiten über Krankenhäuser aus einer objektorientierten Datenbank. Diplomarbeit. Aachen: RWTH Aachen, 2005.
5.
Lewis C, Wharton C. Cognitive walkthroughs. In: Helander M, Landauer TK , Prabhu P.(Hrsg.). Handbook of Human-Computer Interaction. New York: Elsevier Press, 1997: 717-732.
6.
Balzert H. From OOA to GUI - The JANUS-System. In: Proc HCI INTERACT 95, Lillhammer, Norway, 1995.
7.
Reiter E, Dale R. Building Natural Language Generation Systems. Cambridge, U.K : Cambridge University Press, 2000.
8.
Busemann S, Horacek H. A flexible shallow approach to text generation. In: Proceedings of the Ninth International Workhop on Natural Language Generation (INLG-98). Niagara-On-The-Lake, Ontario, Canada,:1998, 238-247.