Logo HU Berlin
Logo FU Berlin Logo Xinnovations

Impulse

zur Übersicht

Dr. Georg Rehm

Deutsches Forschungszentrum für Künstliche Intelligenz GmbH

Keynote: Kuratieren im Zeitalter der KI

Das World Wide Web hat sich in den vergangenen Jahren einer grundlegenden Wandlung unterzogen – aus dem ehemals Dokument-zentrierten digitalen Archiv der 1990er Jahre ist eine hochgradig dynamische, mittels diverser Typen von Endgeräten von Milliarden Menschen zur Kommunikation, zum Kauf von Produkten und zur Beschaffung von Informationen genutzte Maschine geworden. Ein wesentlicher Treibstoff dieser Maschine sind digitale Inhalte. Zugleich findet eine immer breitere und tiefere Diversifizierung des World Wide Web statt, d.h. immer mehr Branchen sind online vertreten. Der effiziente Umgang mit digitalem Content, d.h. die Beschaffung, Konvertierung, Anreicherung, Analyse, Veredelung, Übersetzung, Verknüpfung, Zusammenfassung und Publikation von Inhalten auf diversen Kanälen ist folglich für immer mehr Branchen eine wichtige Aufgabe. Der Vortrag geht zunächst auf die technologische Herausforderung der Kuratierung digitaler Inhalte ein und gibt anschließend einen kurzen Überblick über das vom BMBF unterstützte Forschungsprojekt “Digitale Kuratierungstechnologien” (DKT, 2015-2017), in dem vier Berliner Unternehmen gemeinsam mit dem Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) an Kuratierungsszenarien in vier verschiedenen Branchen arbeiten, wobei insbesondere einige der wissenschaftlichen Ergebnisse dargestellt werden. Neben den Ergebnissen aus dem Projekt DKT geht der Vortrag auch auf Kuratierungsszenarien in anderen Branchen und Bereichen ein, wozu u.a. die Filmbranche und Customer-Relationship-Management gehören. Auch das Thema “Fake News”, das seit Ende 2016 kontrovers diskutiert wird, kann durch eine Verbindung aus Kuratierungstechnologien, World Wide Web-Standards und KI-Technologien erfolgreich adressiert werden.

Präsentation ansehen (auf slideshare.net)

--

Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergründe, Beispiele, Prototypen

Vortrag zur Fachtagung vom 11. Oktober 2016

Das DFKI hat in den ersten 12 Monaten des zweijährigen Projekts “Digitale Kuratierungstechnologien” insbesondere in drei verschiedenen Bereichen Forschungs- und Entwicklungsarbeit geleistet: semantische Analyse von Dokumenten, semantische Generierung und Mehrsprachigkeit. Der Vortrag beschreibt zunächst die Motivation für Kuratierungstechnologien in diesen Bereichen sowie spezielle Anforderungen der vier Industriepartner und deren individuelle Anwendungsfälle. Der Fokus der Präsentation liegt auf verschiedenen Funktionalitäten, für die bereits erste prototypische Implementierungen vorliegen:

  • Generierung semantischer Netze zur Annotation und Exploration von Dokumentsammlungen
  • Analyse generischer Zeitausdrücke als Basis von Timelining-Funktionen
  • Integration domänenspezifischer Wissensquellen in die semantische Analyse sowie in die semantische Generierung
  • Automatische Übersetzung als Teil von Kuratierungsworkflows
  • Standardisierte Schnittstellen und Formate für die Nutzung in industriellen Kuratierungsszenarien
  • Zusammenführung der Prototypen in einem Kuratierungs-Dashboard


Der Vortrag schließt mit einem Ausblick auf die für das zweite Jahr geplanten Arbeiten in DKT und geht auf potentielle zukünftige Forschungsthemen ein.

Präsentation ansehen (PDF)

 

Demo Session

Im Rahmen der Demo Sessions zeigt das DFKI erste prototypische Implementierung digitaler Kuratierungswerkzeuge, die nachfolgender Screencast exemplarisch darstellt.

 

--

Keynote: Digitale Kuratierung – Semantische Technologien halten Einzug in unterschiedliche Branchen

Vortrag zum Statusmeeting vom 6. Oktober 2015

[Gemeinsam mit Dr. Felix Sasaki]

In zahlreichen Branchen wird der Arbeitsalltag von Referenten, Redakteuren, Produzenten, Autoren, Journalisten und sonstige Wissensarbeitern maßgeblich bestimmt durch das Auswählen, Sichten, Evaluieren, Einordnen, Verarbeiten, Verdichten, Visualisieren, Zusammenfassen, Übersetzen, Sortieren und Schreiben von Dokumenten und Informationen aller Art. Ziel ist dabei die Erstellung neuer Dokumente und Informationen – abhängig von der Wertschöpfungskette und den Gegebenheiten der jeweiligen Branche. Dieses Kuratieren digitaler Informationen, Daten, Meldungen und Medieninhalte hat sich in den vergangenen Jahren als eine grundlegende Tätigkeit mit neuen Anforderungen herauskristallisiert, die von handelsüblicher Software schon längst nicht mehr abgedeckt wird, zumal die Anforderungen hinsichtlich Geschwindigkeit, Volumen und Anzahl der zu verarbeitenden Informationen stetig steigen. Das am 1. September 2015 gestartete, vom BMBF geförderte Verbundprojekt Digitale Kuratierungstechnologien (DKT) untersucht, inwieweit semantische Technologien zur Unterstützung derartiger Kuratierungsprozesse eingesetzt werden können. Speziell geht es um eine bessere Unterstützung menschlicher Wissensarbeiter in branchenspezifischen Kuratierungs-Workflows. Dazu kooperiert das Deutsche Forschungszentrum für Künstliche Intelligenz GmbH (DFKI), Forschungsbereich Sprachtechnologie, mit den vier Berliner Unternehmen ART+COM AG, Condat AG, 3pc Neue Kommunikation GmbH und kreuzwerker GmbH. Der Vortrag gibt einen Überblick über die Ziele des Verbundprojekts.

---

Digitale Kuratierungstechnologien - Intelligente Software für den Arbeitsplatz von morgen

Keynote zum Statusmeeting vom 6. Oktober 2014

[Gemeinsam mit Dr. Felix Sasaki]

Das Kuratieren digitaler Informationen und Medieninhalte hat sich in den vergangenen Jahren als eine grundlegende Tätigkeit herauskristallisiert, die an zahlreichen Arbeitsplätzen, in den verschiedensten Branchen und unterschiedlichsten Unternehmen eine entscheidende Rolle einnimmt. Dabei werden Unternehmen mit immer höheren Anforderungen konfrontiert, da in allen Kuratierungsphasen wie Akquirieren, Prozessieren und Distribuieren eine immer höhere Qualität für stetig steigende Datenmengen mit verschiedenen Materialien in möglichst kurzer Zeit erwartet wird, die von regulären Content-Management- oder Redaktionssystemen schon längst nicht mehr abgedeckt werden. Eine (semi-)automatisierte Unterstützung dieser Prozesse durch semantische Technologien hätte für die Unternehmen eine starke kostenmindernde Wirkung. Derzeit planen wir ein Vorhaben, um aktuelle semantische Technologien in die Wirtschaft zu transferieren, um Unternehmen in die Lage zu versetzen, multimediale Inhalte in unterschiedlicher Weise für zahlreiche Märkte und in unterschiedlichen Schritten der Datenwertschöpfungskette digital anreichern und kuratieren zu können.

Der Vortrag erläutert zunächst, was wir unter “digitaler Kuratierung” verstehen und gibt anschließend verschiedene Beispiele für digitale Kuratierungstechnologien.

Präsentation ansehen (PDF)

---

Mehrsprachigkeit und semantische Technologien

Vortrag zum Statusmeeting vom 6. Oktober 2014

[Gemeinsam mit Dr. Felix Sasaki]

Linked Data und Mehrsprachigkeit haben ein fruchtbares Verhältnis. Linked Data kann zum einen helfen mehrsprachige Anwendungen zu verbessern, zum Beispiel im Bereich automatische Übersetzung oder sprachübergreifende Suche. Zum anderen können sprachverarbeitende Methoden helfen semantische und verlinkte Ressourcen zu generieren. Der Vortrag stellt aktuelle Forschungsergebnisse zur Thematik vor und praxisnahe Anwendungsszenarien aus den Bereichen: automatisierte Übersetzungsworkflows, Aggregation sprachübergreifender Informationen, Übersetzerunterstützung sowie lokalisierungsspezifische Inhaltsgenerierung. Im letzten Fall sind auch nicht sprachlich Aspekte wie adäquates Layout im jeweiligen Ausgabemedium relevant.

---

Lösungen für linguistische Ressourcen im Web – META-NET und META-SHARE

Vortrag zur Fachtagung vom 26. September 2013

[in Zusammenarbeit mit John H. Weitzmann]

Die Präsentation gibt zunächst einen Überblick über die EU-geförderte Initiative META-NET, die es sich zum Ziel gesetzt hat, die technologischen Grundlagen der mehrsprachigen europäischen Informationsgesellschaft zu legen. Ein Teilprojekt von META-NET beschäftigt sich mit der Entwicklung einer verteilten Infrastruktur für linguistische, computerlinguistische und sprachtechnologische Datensammlungen. Aktuelle Verfahren zur Be- und Verarbeitung natürlicher Sprache benötigen derartige sehr große Datenmengen u.a. für maschinelle Lernverfahren. Ziel dieser Infrastruktur namens META-SHARE ist es, eine zentrale Plattform für derartige Datensammlungen aufzubauen, so dass Doktoranden, Forschungseinrichtungen und spezialisierte Unternehmen diese finden und einsetzen können. Die Präsentation erläutert META-SHARE und geht insbesondere auf die zahlreichen rechtlichen Schwierigkeiten, Herausforderungen und die von uns erarbeiteten Lösungen ein.

Präsentation ansehen (PDF)

Kurzbiografie

Dr. Georg Rehm ist Wissenschaftler am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Berlin, Generalsekretär des EU-geförderten Exzellenznetzwerks META-NET, Koordinator des EU-Projekts CRACKER sowie des BMBF-Projekts “Digitale Kuratierungstechnologien” und Leiter des deutsch-österreichischen Büros des World Wide Web Consortiums (W3C). Wissenschaftlicher Hintergrund: Abschluss in Computerlinguistik und künstlicher Intelligenz, Informatik und Sprachwissenschaft; Promotion in Computerlinguistik.