Medizinische Texte für die Forschung automatisiert erschließen
Im klinischen Alltag entstehen täglich große Mengen an Texten wie Arztbriefe oder Befunde, die wertvolle und komplexe Informationen wie die Krankheitsgeschichte und Behandlungsinformationen enthalten. Ziel der Methodenplattform GeMTeX ist es, diese Texte für die Forschung zugänglich zu machen.
Mit dem Einverständnis der Patient:innen werden an sechs universitätsmedizinischen Standorten Dokumente aus der Patientenversorgung gesammelt und für die automatische Verarbeitung natürlicher Sprache (NLP) aufbereitet. Hierfür ist es notwendig, diese Texte zu annotieren, d. h. nach Struktur und Inhalt zu markieren. Die Annotationen werden von angehenden Ärzt:innen überprüft und dienen als Referenz zur Verbesserung der automatischen Verarbeitung.
Die aufgebaute Infrastruktur der
Medizininformatik-Initiative (MII) ermöglicht es, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Zudem schafft GeMTeX eine zentrale Struktur zur Sammlung und Anreicherung von Texten, um KI-Modelle zu trainieren und ihre Nützlichkeit im klinischen Alltag zu überprüfen.
Das Projekt ist am 01.06.023 gestartet und wird bis zum 31.08.2026 mit rund sieben Millionen Euro vom Bundesministerium für Bildung und Forschung (BMBF) gefördert.
Informationsmaterialien zum Download: