Inhalte semantisch anreichern

Last modified by Helmut Nagy on 2010/05/06 18:10

Ein wesentlicher Punkt oder eine wesentliche Hürde im Zugang zum Semantic Web ist die Frage, wie kommt die Semantik ins Web, d.h. wie soll der „normale” Benutzer in der Lage sein, die von ihm generierten Inhalte mit semantischen Annotationen anzureichern. Bei der Reflexion über diese Aufgabenstellung, treten rasch zwei wesentliche Aspekte in den Vordergrund: Es muss einfach gehen und es darf keinen zusätzlichen Aufwand bedeuten. Im Folgenden sollen zwei Anwendungen vorgestellt werden, die Ansätze zeigen, wie dies gelöst werden kann.

Zemanta ist eine Anwendung, die z.B. als Plugin in den Browser (z.B. Firefox) integriert werden kann und dann die Möglichkeit bietet, beim Schreiben in verschiedenen Systemen (z.B. Blogs, Content Management Systemen (CMS) oder Plattformen wie Myspace) zum Inhalt passende Information aus anderen Quellen (z.B. Wikipedia, Amazon, You-Tube, Facebook usw.) anzubieten, die in den Text integriert werden können (siehe unten). Außerdem werden Tags vorgeschlagen, mit denen der Text ausgezeichnet werden kann. Dadurch ist einerseits die semantische Anreicherung des Inhalts über Tags möglich, andererseits kann der Text mit ähnlichen bzw. passenden Informationen aus anderen Quellen zu verlinkt werden.

EnrichZemanta.pngBeispiel 1: Zemanta

Für die Analyse der Texte werden Methoden zur automatischen Textextraktion und semantische Algorithmen eingesetzt, aber auch der Input der Benutzer wird zur laufenden Verbesserung des Systems verwendet. Zemanta unterstützt semantische Standards und erlaubt den Zugriff auf die durch das Linking Open Data Projekt verfügbaren Daten und damit verbundene Projekte Freebase ermöglicht.1

Eine weitere Anwendung mit einer ähnlichen Ausrichtung ist fundblog (Fundiertes Bloggen), das von der Semantic Web Company in Kooperation mit derstandard.at entwickelt wird. Hier wird der Benutzer bei der Erstellung von Inhalten unterstützt, indem ihm einerseits relevante Artikel zu dem von ihm verfassten Inhalt angeboten und andererseits zum Inhalt passende Tags vorgeschlagen werden (siehe unten). In mehreren Schritten kann durch Auswahl von passenden Artikeln und Tags das Ergebnis der „Fundierung” des Inhalts (d.h. die angebotenen Artikel und Tags) laufend verbessert werden. Beim Speichern des Inhalts werden die Tags und die verbundenen Artikel mit gespeichert und der Inhalt so semantisch angereichert.2

EnrichFundblog.pngBeispiel 2: fundblog

Auch fundblog setzt Technologien zur Textextraktion und semantische Technologien zur Suche nach ähnlichen Inhalten und relevanten Tags ein und unterstützt semantische Standards. Bei beiden Anwendungen ist erkennbar, dass das semantische Anreichern der Inhalte nur ein Teil der Möglichkeiten ist, die sie bieten. Andreas Blumauer fasst die Vorteile von fundblog wie folgt zusammen:

  • Bessere Qualitätssicherung: User kann Beiträge auf Basis bestehender Artikel-Sammlungen erstellen
  • Kürzere Bearbeitungszeiten: Häufige Medienbrüche zwischen Textverarbeitung & Recherche- und Suchumgebung fallen weg
  • Bessere Lesbarkeit: Leser der Beiträge und Artikel finden vernetztere Inhalte vor, durch „Querlesen” können komplexe Themen besser erfasst werden
  • Lernen und Schreiben verschmelzen: Schon während der Erstellung eines Beitrags lernt der User laufend dazu. Das Schreiben macht so auch mehr Spaß!”3
  1. ^ Zemanta 2009, Stand 13.5.2009
  2. ^ Blumauer 2008, Stand 12.5.09
  3. ^ Blumauer 2008, Stand 12.5.09