MEDICO – intelligente Bildsuche in Medizindatenbanken
Das Forschungsprogramm THESEUS leistet einen Beitrag für eine neue internetbasierte Wissensinfrastruktur, in der das Wissen im Internet künftig besser aufbereitet und genutzt werden kann. Unter dem Dach von THESEUS entwickeln hierzu öffentliche und industrielle Forschungspartner gemeinsam innovative Basistechnologien und technische Standards.
THESEUS-Anwendungsszenario MEDICO
Das MEDICO-Anwendungsszenario beruht auf folgender Vision: Schaffung einer Bildsyntax und semantikbasierter Bildvokabularien, die den Aufbau einer intelligenten, skalierbaren und robusten Suchmaschine für den medizinischen Bereich ermöglichen. Dies beinhaltet insbesondere auch Anwendungen in den Bereichen Clinical Decision Support und Computer Aided Diagnosis.
Innerhalb von MEDICO soll eine universell einsetzbare Suchmaschine für medizinische Bilder entstehen. Sie soll einen direkten, semantischen Zugang zu medizinischen Bilddatenbanken ermöglichen, um so individualisierte Diagnosen und Therapieplanungen sowie biomedizinische und epidemiologische Forschungen zu unterstützen. Zielgruppe sind vor allem Ärzte, Forscher sowie Applikationsentwickler in den Bereichen Medizininformatik und Healthcare-IT.
Die Gesundheitsindustrie sieht sich heute einer Vielzahl neuer Herausforderungen gegenübergestellt, so zum Beispiel einer alternden Bevölkerung in der westlichen Welt, einer ständig zunehmenden und heterogen verteilten Datenflut medizinischer Informationen sowie einer dezentralen Speicherung solcher Informationen bei den verschiedensten Gesundheitsorganisationen – und zwar auf IT-Systemen, die oftmals nicht miteinander kompatibel sind. Daraus ergeben sich aus Daten-/Informationssicht in naher Zukunft vor allem folgende Fragen und Herausforderungen:
- Wie können wir die explodierende Datenflut gerade im Bereich der medizinischen Bildgebung möglichst effizient bewältigen?
- Wie agieren wir in einem sehr heterogenen und verteilten Datenumfeld?
- Wie können wir wichtige Informationen aus den Bilddaten extrahieren?
- Wie können wir aus den verfügbaren Daten und Informationen neues Wissen erzeugen?
- Wie können wir die neu gewonnenen Informationen möglichst optimal nutzbar präsentieren?
Trotz der in den vergangenen zehn Jahren erreichten Fortschritte bei Bildinterpretation und -verständnis, semantischer Modellierung und Suchtechnologie steckt die intelligente Bildsuche heute immer noch in den Kinderschuhen und bleibt damit mehr oder weniger ein akademisches Thema mit nur geringen bzw. gar keinen kommerziell nutzbaren Auswirkungen. Aktuelle Bilddatenbanken (wie das webbasierte, medizinische PACS (Picture Archiving and Communications System) oder RIS (Radiology Information System) arbeiten immer noch mit einem Indexsystem auf der Grundlage von Schlüsselwörtern, die durch den Menschen vergeben und eben nicht durch den jeweiligen Inhalt des dargestellten Bildes automatisiert erzeugt werden.
Die intelligenten Bildsuchmaschinen von MEDICO bieten im Gegensatz dazu folgende Vorteile: * Entwicklung und Anwendung von innovativen, formalen Konzepten zur Erzeugung von generischen Bildvokabularien, Bildsyntax und Bildsemantiken, * Erforschung neuer, skalierbarer und hierarchisch aufgebauter Informationsdarstellungen mit allgemeingültiger Anwendbarkeit für unterschiedliche Applikationen und * Entwicklung neuer Architekturen zur Unterstützung von semantikbezogenen Bildsuchen und skalierbaren Suchlösungen.
Die medizinische Imaging-Domäne beschreibt einen relativ kleinen, eingeengten Bereich; die verschiedenen Bildmodalitäten zeigen Messungen des menschlichen Körpers sowie entsprechende Krankheitsassoziationen. Aus diesem Grund wollen wir eine Lösung anbieten, die eine Überbrückung der existierenden „Semantiklücke“ ermöglicht.
- Intelligente Bildsuchmaschinen für den medizinischen Bereich bieten ein enorm hohes Potenzial.
- Kliniker und Ärzte verfügen damit in Zukunft über eine leistungsfähige Lösung zur Nutzung und Durchsuchung von PACS-Datenbanken auf Basis von Inhalten und Semantikmerkmalen und erhalten damit eine wertvolle Entscheidungsunterstützung am Ort der Behandlung.
- CAD(Computer-Aided-Detection)-Technologien profitieren damit durch die Berücksichtigung der Semantikkomponente und ermöglichen in Folge wesentlich kürzere TTM(Time-to-Market)-Zeiten.
- Einfachere und direkte Rekrutierung von Patienten zur Durchführung klinischer Studien durch Suchen nach den gewünschten Bildinhalten.
- Einfachere Durchführung von epidemiologischen Studien durch Durchsuchen von geografisch verteilten Bilddatenbanken.
Ziel von MEDICO ist die Bereitstellung von medizinischen Bildern für die verschiedensten Gesundheitsinstitutionen, in einer Art und Weise, die intelligente Anfragen und Schlussfolgerungen in Klinikalltag und Forschung ermöglichen.
Medizinische Imaging-Verfahren sind und bleiben der wichtigste Treiber zur Entwicklung neuer Bildverarbeitungstechniken. Mit der Erzeugung von immer mehr patientenspezifischen Daten sowie deren Digitalisierung und Speicherung lassen sich in Zukunft auch Informationen generieren, die eine Analyse individueller Daten auf Basis von Populationsdatenbanken ermöglichen. Lösungen zur textbasierten Suche und Informationsgewinnung auf Basis strukturierter, textueller Daten sind vorhanden und in der Medizin heute State of the Art. Der Zugang zu gespeicherten medizinischen Bildern erfolgt heute im Allgemeinen immer noch ausschließlich über manuell hinzugefügte (annotierte) Metadaten-Informationen, die zusammen mit den Bildern abgespeichert werden. Leider ist der tatsächliche Bildinhalt dabei oftmals nicht Teil der Suche, so dass die erzielten Suchergebnisse sehr stark von der Qualität der mit dem Bild annotierten Informationen abhängen. Die Bereitstellung einer Suchtechnologie auf Basis von tatsächlichen Bildinhalten würde daher eine lückenlose Nutzung aller in den Bilddaten enthaltenen Informationen ermöglichen.
Das Anwendungsszenario MEDICO stellt ein dauerhaft erweiterbares System der klinischen Evaluation zur Verfügung, das eine Vielzahl semantischer Aspekte wie z.B. anatomische Beziehungen zwischen Organen, funktionale Eigenschaften, Genomdaten und Krankheitsmodelle mit der Bildrepräsentation verknüpft.
Hierzu werden Methoden zur Extrahierung von Informationen aus Bilddaten erarbeitet und darauf basierend die Erkennung möglicher Anfragemuster bezüglich der Strukturen des menschlichen Körpers erforscht. Konzepte zur Automatisierung dieser Vorgänge bilden einen zusätzlichen Schwerpunkt, so dass im Ergebnis auch Prozesse für ein lernendes, sich automatisch erweiterndes System der Anfragemustererkennung entstehen können.
Im Rahmen von MEDICO werden zahlreiche Verfahren der Muster-erkennung, hierarchische Indexstrukturen, Ontologiemodellierung, Systemarchitekturen sowie CAD(Computer-Aided-Detection)-Systeme und klinische DSS (Decision Support Systems) entwickelt und angewendet. Ein Ziel ist dabei unter anderem die Definition und Repräsentation einer hierarchischen Organisation der menschlichen Anatomie, die auf dem äußert detaillierten Foundation Model of Anatomy (FMA) in Kombination mit anderen bestehenden Methoden der Wissensdarstellung basiert. Es soll eine semantische Hierarchie konzipiert werden, die Anfragestrategien vorhersehbar macht und die Bildanalysen zur Laufzeit der Anfrage innerhalb akzeptabler Antwortzeiten ermöglicht.
Sowohl die Aussagen medizinischer Bilddaten als auch die fachspezifischen Semantiken sind temporärer Natur. Neue Krankheiten und Therapien, die zunehmende Veralterung der Bevölkerung und sonstige Änderungen im sozialen Kontext sind nur einige der Gründe, warum die semantischen Repräsentationen medizinischer Bilddaten nicht statisch sein können. Ziel von MEDICO ist die Erforschung von Lernmethoden und der Entwurf von dynamischen Modellen, die in der Lage sind, semantische Repräsentationen an neue Daten und Erkenntnisse der medizinischen Forschung anzupassen. Hierzu werden Verfahren des kontinuierlichen maschinellen Lernens untersucht und weiterentwickelt.
Im Rahmen von MEDICO werden klinische Anwendungen in den Bereichen der Kardiologie, Neurologie und Onkologie erarbeitet und durchgeführt, mit deren Hilfe die THESEUS-MEDICO-Technologien validiert werden sollen. Diese Bereiche eignen sich für die Validierung von Qualität und Performance der MEDICO-Suchtechnologien am besten, da ihre Semantik- und Repräsentationskonzepte besonders anspruchsvoll und mehrdimensional sind.
Den Richtlinien der sich an MEDICO beteiligenden Universitätskliniken und ihrer ethischen Komitees entsprechend werden ausschließlich anonymisierte Daten verwendet, wobei die Zugriffsprinzipien der Authentifizierung und Autorisierung für eine uneingeschränkte Sicherheit der Patientendaten strikt eingehalten werden.
Die Leistungsvorteile für die Nutzer von MEDICO ergeben sich aus der Tatsache, dass die Mechanismen der Repräsentation medizinischer Bildinhalte zwar generisch sind, ihre Anwendung sich jedoch auf die medizinische Bildgebungsdomäne beschränkt. In diesem Punkt unterscheidet sich MEDICO von anderen aktuellen Ansätzen, die ein allgemeines Bildverstehen auf Kosten der Umsetzbarkeit und der Skalierbarkeit der Systeme anstreben.
Downloads