Zum Inhalt springen

CONTENTUS – Technologien für die Mediathek der Zukunft

Millionen von Büchern, Bildern, Tonbändern und Filmen lagern in Deutschlands rund 30.000 Bibliotheken, Museen und Archiven – ein unermesslicher Wissensschatz. Den Fragen, wie dieses kulturelle Erbe einer möglichst großen Zahl von Menschen zugänglich gemacht und wie es für nachfolgende Generationen bewahrt werden kann, gehen die an CONTENTUS beteiligten Forscher nach.

Es gilt als eine der großen Aufgaben der Wissensgesellschaft, den Bürgern einen einfachen und medienübergreifenden Zugriff auf Wissens- und Kulturgüter zu ermöglichen. Im Rahmen von CONTENTUS werden Konzepte und Technologien für eine Infrastruktur entwickelt, die es Kultureinrichtungen und Informationsanbietern erlaubt, diesem Ziel näherzukommen. Diese neuen Technologien ermöglichen die automatische Aufbereitung und semantische Vernetzung großer Datenmengen, sei es in der Form von Texten, Bildern oder Video- und Tonaufnahmen. Die Arbeiten von CONTENTUS sind eng abgestimmt und verknüpft mit der Initiative „Deutsche Digitale Bibliothek“ der Bundesregierung. Hierbei ist eine weitreichende Beschreibung der Inhalte durch sogenannte Metadaten wichtig – vergleichbar mit Katalog oder Inhaltsverzeichnis zum leichten Auffinden der digitalen Medien. Die Vernetzung der verschiedenen digitalen Wissensbestände im Internet und die Einbindung von nutzergenerierten Inhalten stellen eine weitere Herausforderung dar. Hierfür entwickeln die Forscher intelligente Algorithmen, die alle notwendigen Prozesse automatisieren und den Nutzern die Möglichkeit eröffnen, digitale Inhalte mit eigenen Informationen anzureichern. Das Ergebnis: untereinander vernetzte virtuelle Mediatheken der nächsten Generation.

Multimediale Bibliotheken der nächsten Generation

Diese „Multimediatheken“ vernetzen die Sammlungen von klassischen Bibliotheken, Medienarchiven und Sendeanstalten zu einer neuen Informationsstruktur, die Anbieter und Nutzer über das Internet zusammenführt. Dabei werden neue Möglichkeiten geschaffen, damit die bestehenden multimedialen Bestände um das Wissen der Nutzer ergänzt werden können. Zugleich werden die Daten semantisch, also nach ihrem inhaltlichen Zusammenhang, zu einem neuartigen Wissensnetz verbunden. Auf diese Weise können Anbieter ihre multimedialen Sammlungen in optimaler Struktur und Qualität bereitstellen.

Ein Beispiel verdeutlicht den Nutzen dieser Multimediathek der nächsten Generation: Eine Recherche zum Thema „Lukullus“ liefert zahlreiche medienübergreifende Suchergebnisse, wie Texte, Bilder, Filme oder Hörbeispiele. Dank der Verwendung semantischer Technologien erscheinen auch Inhalte, die in einem Sinnzusammenhang zu dem Thema stehen. Daher können Partituren oder Aufnahmen zur „Verurteilung des Lukullus“ ebenso angezeigt werden wie andere Stücke des Autors Bertolt Brecht und des Komponisten Paul Dessau, beispielsweise „Der gute Mensch von Sezuan“. Es werden auf Wunsch auch Informationen und Musiktitel der großen Brechtinterpreten angezeigt oder Verweise auf kommerzielle Musikanbieter, bei denen man Brecht’sche Lieder online kaufen kann. Während der Nutzer klassischer Archive meist erst nach langer Suche auf einzelne Werke oder Sammlungsstücke stößt, profitiert der Nutzer der geplanten Multimediathek von einer schnellen Suche und von sinnvollen medienübergreifenden Ergebnissen.

Vorteile für Nutzer und Anbieter

Mit CONTENTUS können Nutzer künftig einfacher im digitalisierten Kulturerbe recherchieren und navigieren. Sie können auf einfache Weise Ergebnisse und Erkenntnisse mit anderen Nutzern und Anbietern teilen und Inhalte selbstständig durch Verknüpfungen anreichern. Mit den Technologien für die qualitative Aufbereitung und semantische Vernetzung von multimedialen Beständen können auch kleinere Bibliotheken und Archive Teil der geplanten Informationsstruktur werden und ihre multimedialen Sammlungen einem breiteren Nutzerkreis zugänglich machen.

Forschung und Entwicklung im Dienst des Wissens

In sechs Arbeitsschritten werden analoge Datenträger für den Einsatz in multimedialen Bibliotheken und Archiven in einem hochgradig automatisierten Prozess digital aufbereitet. Zunächst helfen Hochdurchsatzverfahren dabei, große Mengen analoger Inhalte schnell und effizient zu digitalisieren. Im zweiten Schritt wird die Qualität des eingelesenen Materials mit eigens entwickelten Technologien gemessen und optimiert. Im Anschluss daran werden auf Basis der Inhalte durch Verfahren der Text-, Stichwort-, Stimm- oder Spracherkennung Metadaten zur Beschreibung der Inhalte erzeugt – ohne diese Art von Erschließung wären digitalisierte Bücher, Filme oder Tonaufnahmen in großen Beständen nur noch schwer auffindbar. . Auf der Grundlage dieser Metadaten lassen sich Inhalte im Rahmen der semantischen Vernetzung in einem vierten Schritt miteinander verknüpfen. Wie im Recherchebeispiel zum „Lukullus“ werden dem Nutzer über einzelne gefundene Inhalte hinaus weitere sinnverwandte Informationen vorgeschlagen – und führen ihn, wenn gewünscht, auf eine thematische Erkundungsreise. Neben einer klassischen Volltextsuche werden so auch Recherchen ermöglicht wie „Welche der Kinder von Thomas Mann waren ebenfalls Schriftsteller und welches sind ihre Werke?“. Der fünfte Schritt bezieht Benutzer und Experten mit ein, die Inhalte ergänzen können. Am Ende des CONTENTUS-Prozessablaufs steht der vernetzte und medienübergreifende Zugriff auf Informationen – ein Meilenstein in der Weiterentwicklung der internetbasierten Wissensinfrastruktur.

Ziele der CONTENTUS-Anwendungen

– Einfachen Zugang zu kulturellem Erbe ermöglichen
– Konzepte und Technologien für multimediale Bibliotheken entwickeln
– Neue semantische und medienübergreifende Recherchemöglichkeiten schaffen
– Nutzergenerierte Inhalte einbinden