gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Zur Relevanz von Twitternachrichten für die Unterstützung epidemiologischer Surveillance

Meeting Abstract

Suche in Medline nach

  • Kerstin Denecke - Universität Hannover, Hannover
  • Mustafa Sofean - Universität Hannover, Hannover

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds318

doi: 10.3205/11gmds318, urn:nbn:de:0183-11gmds3183

Veröffentlicht: 20. September 2011

© 2011 Denecke et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Motivation: Verschiedene Faktoren wie die gesteigerte Mobilität von Menschen durch Reisen oder die Globalisierung erleichtern die schnelle Verbreitung von gefährlichen Krankheiten. Für einige Krankheiten besteht eine Meldepflicht (z.B. Masern). Lange Meldewege und einzuhaltende Fristen sorgen jedoch dafür, dass die Gesundheitsämter erst nach einigen Tagen einen Krankheitsausbruch feststellen können. Entsprechende Maßnahmen können somit erst verspätet ergriffen werden. Dies lässt vermuten, dass Informationen aus erster Hand, z.B. von Personen, die bestimmte Symptome erfahren, die traditionelle Surveillance unterstützen könnten. Um dies zu herauszufinden, untersuchen wir Twitternachrichten, insbesondere (1) die Inhalte, die bereit gestellt werden, (2) die Sprache, mit der über medizinische Probleme berichtet wird und (3) wir ermitteln die Besonderheiten und Anforderungen, die dadurch an eine automatische Verarbeitung gestellt werden.

Methode: Die Datenkollektion besteht aus deutsch- und englischsprachigen Tweets. Sie wurden mittels der Twitter-API [1] und den folgenden Suchbegriffen ermittelt: „Fieber“, „Husten“, „Grippe“, „Infekt“, „Masern“ und „Schmerz“ (bzw. den englischen Entsprechungen). Insgesamt umfasst die Datenkollektion 7.338 Tweets in Englisch und 1.517 Tweets in Deutsch. Die Kollektion wurde stichprobenartig (ca. 200 Tweets pro Suchbegriff) manuell hinsichtlich Sprache, Inhalt und Relevanz für epidemiologische Surveillance analysiert.

Ergebnisse: Ein Ergebnis der Analyse ist, dass in Abhängigkeit vom Schlüsselwort die Anzahl der relevanten und irrelevanten Tweets variiert. 80-85% der Tweets, die „Grippe“ oder „Husten“ enthalten, sind in der analysierten Stichprobe als relevant zu bewerten. Dagegen sind nur zwischen 15 und 20% der untersuchten Tweets mit den Wörtern „Schmerz“ und „Fieber“ relevant. Tweets mit einer konkreten Krankheitsbezeichnung wie „Masern“ sind oftmals Auszüge aus Nachrichten, enthalten Informationen zu aktuellen Ausbrüchen oder Hinweise zu Impfungen oder Medikationen. Relevante Tweets lassen sich inhaltlich unterscheiden in Informationen zum Gesundheitszustand (1) der eigenen Person, (2) eines Freundes oder Bekannten, (3) einer Person des öffentlichen Lebens, oder in seltenen Fällen (4) eines Tieres. Weiterhin finden wir Tweets zu Gesundheitsinformationen und zur Gesundheitsaufklärung, offizielle Informationen sowie reisemedizinische Hinweise. Charakteristisch sind kurze Sätze („Ich habe Fieber“), Stichworte („Fieber, Halsschmerzen, Kopfschmerzen“) oder Aneinanderreihungen von Phrasen („Freitag Dauerniesen, Samstag Halsschmerz, Sonntag matt“).

Schlussfolgerung: Die Analyse zeigte, dass in Twitter durchaus für die epidemiologische Surveillance relevante Nachrichten identifiziert werden können. Die sprachlichen Besonderheiten stellen technologische Herausforderungen. Parallel zu der vorgestellten Analyse werden im Rahmen des M-Eco Projektes [2], [3] zu bekannten Krankheitsausbrüchen Tweets identifiziert. Damit wird geprüft, ob dieses Medium tatsächlich eher Hinweise auf Krankheitsausbrüche liefert. Weiterhin muss noch erforscht werden, in welchem Umfang relevante Tweets auftreten und wie Falschmeldungen herausgefiltert werden können.


Literatur

1.
Twitter API. http://apiwiki.twitter.com [letzter Zugriff: 11.04.2011] Externer Link
2.
Webseite des M-Eco Projektes. http://www.meco-project.eu [letzer Zugriff: 22.04.2011] Externer Link
3.
Denecke K, Diaz-Aviles E, Dolog P, Eckmanns T, Fisichella M, Gomez-Lage R, Linge J, Smrz P, Stewart A. The Medical Ecosystem (M-Eco) Project: Personalized Event-based Surveillance. In: International Meeting on Emerging Diseases and Surveillance (IMED 2011), Vienna, Austria, February 4-7; 2011.