Zum Inhalt springen

ORDO – Ordnung für die digitale Welt

Das Wissen der Menschheit liegt in vielen Formen vor. Informationen werden als Texte, Bilder, Video- oder Tonaufnahmen auf verschiedenen Datenträgern in unterschiedlichen Datei-formaten gespeichert. Im Rahmen des Anwendungsszenarios ORDO entwickeln Forscher ein System, das diese Vielfalt besser beherrschbar machen wird.

Die moderne Informationstechnologie macht das Leben der Menschen einfacher, aber manchmal auch unübersichtlicher. So zum Beispiel bei der Entwicklung von neuen Medikamenten. Sucht ein Arzneimittelforscher heute nach Informationen zu einem bestimmten Wirkstoff, dann ist die Recherche oft kompliziert und langwierig: Die chemische Formel findet er in speziellen Datenbanken, Informationen zur Wirkungsweise liegen in Arzneimittel-archiven und für eine vollständige Auflistung von Medikamenten mit Bildern der konkreten Produkte muss er sogar die Marketingunterlagen der Hersteller prüfen.

Wissen besser ordnen

Um die Suche nach Informationen künftig einfacher und effizienter zu gestalten, werden im Rahmen von ORDO neue Dienste und Softwarewerkzeuge entwickelt, die es dem Nutzer erleichtern, Inhalte und Suchergebnisse zu ordnen und zu priorisieren. Der Nutzer soll alle relevanten Daten zur Verfügung gestellt bekommen und schnell zwischen wichtigen und unwichtigen Informationen unterscheiden sowie Zusammenhänge erkennen können. Die neuen Technologien werden es dem Arzneimittelforscher erlauben, die Suche in unterschiedlichen Datenbanken und Quellen mit einer zentralen Anfrage zu bündeln und zu koordinieren. Der Computer sucht dann beispielsweise selbstständig die chemische Formel in einer Datenbank und ermittelt die dazu passende Moleküldarstellung aus einer anderen Quelle. Aus dem Bild einer Medikamentenpackung, auf der der Wirkstoff erwähnt wird, zieht der Rechner automatisch den Schluss, dass dieses Arzneimittel in diesem Zusammenhang wichtig ist – und erkennt auch, wofür der Wirkstoff eingesetzt wird. All diese Informationen werden dem Wissenschaftler in einer übersichtlichen Darstellung präsentiert, die es dem Forscher erlaubt, die Rechercheergebnisse nach seinen Bedürfnissen zu ordnen und individuell auszuwählen, worüber er noch mehr erfahren möchte.

Dieser Überblick über die verfügbaren Informationen wird automatisch generiert. Darüber hinaus werden Verfahren entwickelt, um große Datenmengen aufzubereiten und grafisch darstellen zu können. So entsteht ein umfassendes und individuelles Wissensmanagement, das es dem Nutzer ermöglicht, stets die richtigen Informationen zu finden.

Praxistest in der Forschung und Entwicklung

Die Forschungsergebnisse von ORDO werden speziell für die Bedürfnisse von Forschungs- und Entwicklungsabteilungen, z.B. in der Chemie- und Pharmabranche, und die dort notwendige Verarbeitung von großen Datenbeständen erprobt. Neben den primären Daten wie z.B. Patenten müssen in diesem Bereich auch umfangreiche Sekundärinformationen wie Forschungsberichte, Marktanalysen und andere wissenschaftliche Veröffentlichungen ausgewertet werden. Dazu kommen E-Mails, Archive, firmeninterne Wikis und Blogs. Forschungsziel von ORDO ist es, Methoden und Technologien zu entwickeln, die alle diese Datenbestände effizienter nutzbar machen und ihre Verknüpfung mit Inhalten aus dem Internet erlauben.

Informationsmanagement durch semantische Technologien

Mit ORDO werden Computer bald in der Lage sein, in Textdokumenten Konzepte und Zusammenhänge zu erkennen, Fakten zu extrahieren und Zusammenfassungen automatisch zu erstellen. Diese Fähigkeiten sind gegenüber existierenden Erkennungsverfahren ein großer Fortschritt auf dem Weg zu einem effizienteren Informationsmanagement. Auch für die Analyse und Ordnung von multimedialen Inhalten sollen diese Technologien in Zukunft genutzt werden.

Grundlage für dieses ambitionierte Vorhaben ist die Weiterentwicklung von semantischen Technologien, mit denen ein Computer Inhalt und Bedeutungen von Daten automatisch erkennen und in einen Kontext setzen kann. Das ist besonders bei der Ordnung und Auswertung von unstrukturierten Daten wichtig. Ein weiterer Arbeitsschwerpunkt von ORDO ist die Entwicklung effizienter Verfahren zum Aufbau von Ordnungssystemen (bspw. Ontologien), mit denen Daten modelliert, verwaltet und organisiert werden können. Durch innovative linguistische und statistische Methoden sollen diese Ontologien noch effektiver eingesetzt und zum Teil automatisiert erstellt werden.

Personalisierung ist der Schlüssel

Um ein wirklich individuelles Wissensmanagement zu ermöglichen, sollen darüber hinaus auch persönliche Informationen und Perspektiven miteinbezogen werden – beispielsweise individuelle Arbeitsbereiche und lokal genutzte Computer. Denn für den Leiter eines Projekts sind beispielsweise andere Informationen zu einer bestimmten Anfrage relevant als für einen Projektmitarbeiter. Durch eine personalisierte Aufbereitung und Ordnung von Daten kann damit künftig den individuellen Anforderungen und Präferenzen der Nutzer noch besser Rechnung getragen werden.

Ziele von ORDO

– Informationen semantisch ordnen und priorisieren
– Konzepte und Zusammenhänge in Texten erkennen, Fakten extrahieren, Zusammenfassungen automatisch erstellen
– Zusammenhänge von Informationen visualisieren