Logo HU Berlin
Logo FU Berlin Logo Xinnovations

Impulse

zur Übersicht

Sören Räuchle

3pc GmbH Neue Kommunikation

Kulturgüter online - ein smartes Autorensystem zur Aufbereitung von Archivalien für die Präsentation im Netz

Vortrag zur Fachtagung vom 11. Oktober 2016

(gemeinsam mit Armin Berger)

Längst ist in Deutschland die Digitalisierung von Archivalien zur alltäglichen Praxis in den unterschiedlichsten Kultureinrichtungen geworden. In der Vergangenheit drehte sich die Fachdiskussion vor allen Dingen um Fragen zur effizienten Erzeugung und korrekten Archivierung von Digitalisaten. Heute geht es verstärkt um deren sinnvolle Aufbereitung für die Präsentation im Netz. Hier reicht das Spektrum von digitalen Zeitungsbeständen des 19. und 20. Jahrhunderts, über digitale Briefeditionen bis hin zu eher populärwissenschaftlichen Angeboten wie beispielsweise die Online-Mediathek der Stasi-Unterlagenbehörde ("Stasi-Mediathek"). Allen Projekten gemein ist ein hoher manueller Aufwand sowohl im Hinblick auf klassische Aufgaben des Editierens wie die Indexierung (Verschlagwortung), als auch redaktionelle Aufgabenstellungen wie die Erstellung von Themendossiers, Storytelling etc.

Im Rahmen des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekts Digitale Kuratierungstechnologien entwickelt 3pc ein prototypisches Autorensystem für digitales Storytelling. Das System soll seine Anwender dazu befähigen, über eine intuitiv bedienbare Benutzeroberfläche digitale Archivbestände für eine ansprechende Online-Präsentation aufzubereiten. Dazu wurden aktuellste Technologien zur digitalen Kuratierung des Forschungspartners DFKI in einen redaktionellen Workflow integriert, der folgende Funktionalitäten umfasst:

  • Informationsextraktion durch Named-Entity Recognition
  • Clustering und Klassifikation der extrahierten Informationen für ein redaktionelles Empfehlungssystem
  • Disambiguierung für automatische Verlinkungen
  • Generierung von Erzählpfaden
  • Story Templates


Im Vortrag wird der aktuelle Stand der Arbeiten gezeigt. Insbesondere soll demonstriert werden, wie ein durch (semi-)automatische Verfahren unterstützter Redaktionsworkflow zur Datenaufbereitung den Editionsprozess erheblich beschleunigt. Gleichzeitig wird am Beispiel einer prototypischen Benutzeroberfläche gezeigt, welche redaktionellen Möglichkeiten sich durch eine semantische Anreicherung von Archivalien für das Storytelling ergeben. Die Datenaufbereitung in einem maschinenlesbaren Format ist die Basis dafür. Neben diesen anwendungsbezogen Aspekten werden auch technische Einblicke in die Systemarchitektur und den zugrundeliegenden Kuratierungstechnologien gegeben.

In den Demo Sessions im Anschluss an die Fachvorträge (siehe Screenast unten) besteht zu dem die Möglichkeit, das prototypische System und die bisher implementierten Funktionalitäten zu testen. Wir freuen uns auf Ihren Besuch und sind gespannt auf das Feedback.

Präsentation ansehen (PDF)

 

Demo Session

Im Rahmen des Forschungsprojekts Digitale Kuratierungstechnologien (DKT) entwickelt 3pc ein smartes Autorensystem für Semantic Story Telling. Der Screencast zeigt beispielhaft erste Funktionalitäten des entwickelten Prototypen im Hinblick auf die semantische Anreicherung und Aufbereitung von Archivalien (digitale Briefedition). Wissensarbeiter erhalten damit ein Werkzeug zur Pflege einer digitalen Briefsammlung (Auswahl und Anzeige nach Zeit, Autor und Ort), ein User Interface für das Anzeigen von digitalisierten Briefen (Document Viewer) sowie einen semantischen Text-Editor für die vorhandenen Transkriptionen. Der Editor umfasst zwei Modi für Named Entity Recognition (NER), um entweder einen gesamten Brief oder Einzelblätter automatisch mit semantischen Attributen anreichern zu lassen. Erkannte Entitäten werden je nach Typ über ein farbliches Highlighting kenntlich gemacht. Wissensarbeitern steht nach der automatisierten NER eine Detailansicht von Entity-Attributen zur Verfügung, um die Erkennungsqualität überprüfen und ggf. fehlerhafte Annotationen löschen zu können.

Prototyp Autorentool Archivaufbereitung (Screencast) - Forschungsprojekt DKT - Teilprojekt 3pc from Xinnovations e. V. on Vimeo.

---

Kurzbiographie

Sören Räuchle ist Softwareentwickler und seit April 2015 bei der 3pc GmbH Neue Kommunikation tätig. Dort ist er insbesondere in den Bereichen Mobile Development und in Forschungsprojekten tätig. Nach seinem Einstieg als C#-Programmierer verantwortet er nun im Unternehmen die Android-Programmierung in Java und leitet die technische Entwicklung im DKT-Projekt. Sein Studium der Medieninformatik absolvierte er an der Universität Ulm mit den Schwerpunkten Verteilte Systeme, Web und Künstliche Intelligenz. Am Institut für Künstliche Intelligenz reichte er erfolgreich seine Abschlussarbeit mit dem Titel "Von Open Data zu Linked Open Data" ein. Seine Expertise im Bereich der KI / semantischer Technologien trägt wesentlich zum Erfolg im DKT-Teilprojekt von 3pc bei.