Home |  ENGLISH |  Kontakt |  Impressum |  Anmelden |  KIT

Prüfung/Seminare/WS2015/SMW

Aus Aifbportal

Wechseln zu: Navigation, Suche

Seminar Anwendungen von Semantic MediaWiki



Details zur Lehrveranstaltung
Dozent(en) Rudi Studer
Übungsleiter Patrick Philipp
Fach (Gebiet)
Leistungspunkte
Erfolgskontrolle
Semester WS


Aktuelle und ergänzende Informationen, sowie Zeiten und Räume der Lehrveranstaltung finden Sie im Vorlesungsverzeichnis der Universität.
Link zum Vorlesungsverzeichnis
Link zum Studierendenportal


Forschungsgruppe


Inhalt

Im Seminar können innovative Anwendungen von Semantic MediaWiki (https://semantic-mediawiki.org/) entworfen und entwickelt werden. Semantic MediaWiki (kurz SMW) ist eine viel genutzte Erweiterung zur MediaWiki-Software, der Basis für Wikipedia. Diese Erweiterung ermöglicht Bearbeitern, bestimmte Fakten für Maschinen (Programme) zugänglich zu machen, was es wiederum einfacher für Menschen macht, in den Informationen zu suchen oder sie weiter zu verwenden. Im Rahmen des Seminars werden die Möglichkeiten von SMW als Plattform für Anwendungen im Semantic Web untersucht.

Die Art der Anwendung und die Zielgruppe können entweder selbst vorgeschlagen werden oder aus einem der vielen Projekte hergenommen werden, in denen SMW eingesetzt wird: Wikidata zur Erstellung einer freien Wissensdatenbank, SyncTech zur Produktinnovationssuche, SFB/Transregio 125 zur Wissens- und modellbasierten Chirurgie, SMW-CorA für eine Virtuelle Forschungsumgebung in der Historischen Bildungsforschung etc.

Ziel des Seminars ist es innovative Anwendung zu realisieren und zu präsentieren.


Ablauf

Einzeln oder in kleinen Teams - jedem Studenten bzw. jedem Team wird dabei ein fester Betreuer zugeordnet - sind innovative Anwendungen von SMW zu konzipieren, realisieren und präsentieren. Hierzu kann es notwendig sein Erweiterungen in PHP zu entwickeln. Vorkenntnisse in PHP-Programmierung, Semantische Web-Technologien und Wissensmanagement sind hier von Vorteil aber nicht zwingend Voraussetzung.

  • Eine Gruppenbildung kann während des Kick-Offs (22.10.2015 08:00 - 09:30) und bis zum 29.10.2015 stattfinden.
  • Zu Beginn des Semesters präsentieren die Gruppen ihre Ideen.
  • In einer Zwischenpräsentation werden Ideen und erste Resultate präsentiert und Erfahrungen können ausgetauscht werden.
  • Das Seminar schließt mit den Abschlusspräsentationen der realisierten Anwendungen.


Termine und Anmeldung
  • Das erste Seminartreffen findet am 22.10.2015 um 08:00 bis 09:30 Uhr am Institut AIFB (Raum 253, Gebäude 11.40, Dachgeschoss) statt. Die anderen Termine finden als Blockseminar statt. Die Anwesenheit beim Kick-Off Termin ist Pflicht; falls Sie nicht teilnehmen können, müssen Sie sich per Email an patrick.philipp@kit.edu mit einem Grund abmelden.
  • Die Wahl der Themen erfolgt bis zum 29.10.2015 und wird dann mit dem jeweiligen Betreuer besprochen.
  • Die Zwischenpräsentation findet am 17.12.2015 von 08:00-10:00 Uhr in Raum 1C-03 (Geb. 05.20) statt.
  • Die Abschlusspräsentation findet am TBA Uhr statt.

Bei Fragen oder Problemen, wenden Sie sich bitte an Patrick Philipp.


Literatur
Vorkenntnisse in Semantische Technologien sind nützlich, aber nicht notwendig. Bei Interesse: Foundations of Semantic Web Technologies.


Anmerkungen

none


Themen

Inhaltsverzeichnis

SMW & Machine Learning (ML)

Twitter bietet als vielgenutzte Microblogging Plattform sehr gute Voraussetzungen, um aktuelle Informationen zu finden. Es ist demnach sehr interessant den dort generierten Inhalt zu untersuchen. Maschinelle Lernverfahren eignen sich, um unter anderem Texte zu analysieren und könnten hier zum Einsatz kommen. Da Tweets jedoch stark von gängigen Texten, wie beispielsweise Artikeln, abweichen, treten hier neue Problemstellungen auf. Tweets sind sehr kurz und weisen eine sehr umgangssprachliche Sprachgestaltung auf.

  • T1: Setze ein SMW auf und füttere es mit aktuellen Themen, die du auf Twitter durch ein passendes ML-Verfahren findest. Benutze hierfür Linked Data Fu zur Ausführung eines Algorithmus. (Betreuer: Patrick Philipp)
  • T2: Baue ein Crowdsourcing-ähnliches SMW auf, indem du ermöglichst einfach Daten zu annotieren. Ein ML-Verfahren greift auf die annotierten Daten zu und verwendet sie als Training. Visualisiere abschließend die Erfolgsrate. (Betreuer: Patrick Philipp)


Interaktive Oberfläche für Interpretationsverfahren

Interpretationslagorithmen, die bspw. in Texten Entitäten finden oder Spam filtern, können semantisch beschrieben werden, sodass ein Internetagent sie dann ausführen kann, wenn sie von Nöten sind. Wenn diese Algorithmen noch als Web Services angeboten werden, können sie einfach ausgeführt werden. Im Sonderforschungsbereich 125 Cognition Guided Surgery werden medizinische Interpretationsalgorithmen genau so bearbeitet. Für die Techniker wäre es sehr schön, wenn sie eine GUI hätten, in der sie Daten auswählen könnten und dann automatisch die Algorithmen sehen würden. Das ganze sollte mit Drag und Drop funktionieren.

  • T3: Erstelle eine interaktive GUI mit der man Aufgaben basierend auf vorhandenen semantisch annotierten Algorithmen ausführen kann. (Betreuer: Patrick Philipp)


Labels für die SMW Suche

Wenn man die Suchfunktion in SMW verwendet, sieht man schnell, dass man auch die Namespaces angeben muss. Hier wäre es - vor allem für nicht-Informatiker - schön, wenn man nach Labels suchen könnte. Zusätzlich sollen andere Wissensbasen integrierbar sein, sodass auch über diese gesucht wird.

  • T4: Implementiere eine Extension für die neue Suchfunktion und denke dir hierzu eine passende Heuristik aus. (Betreuer: Patrick Philipp)


SPARQL Ergebnisse visualisieren

SPARQL ist eine Abfragesprache für RDF, ähnlich wie SQL für relationale Datenbanken. Benutzer eines Semantic Media Wikis können bereits SPARQL Abfragen an externe Quellen stellen und die Antworten in Tabellenform auf einer Wiki Seite darstellen. In manchen Fällen bietet sich eine grafische Darstellung der Ergebnisse der SPARQL Query jedoch mehr an, da sie es den Lesern ermöglicht einen Sachverhalt schneller erfassen zu lassen. Es gibt bereits Erweiterungen welche die Ergebnisse von SPARQL Queries visuell darstellt, jedoch benutzen diese teilweise die Google API. In manchen Fällen, wie z.B. im medizinischen Bereich, ist man daran interessiert das Informationen nicht über eine drittanbieter API verarbeitet werden.

  • T5: Erstelle eine Erweiterung für SMW welche die Ergebnisse einer SPARQL Abfrage visuell repräsentiert. Die Verarbeitung der Daten für die visuelle Repräsentation soll dabei lokal erfolgen (Betreuer: Maria Maleshkova und Tobias Weller)


Klinische Pfade visualisieren

Modelle sind Abbildungen der realen Welt welche dem Verständnis, der Kommunikation und der Analyse dienen. In Krankenhäusern werden klinische Prozesse häufig mit der Modellierungssprache BPMN dargestellt. Dies ermöglicht die Analyse der Prozesse um diese zu optimieren. Im Rahmen des Forschungsprojekt Cognition-guided Surgery wurde eine Erweiterung für das SMW erstellt welche es ermöglicht Prozesse in SMW abzubilden und diese mit Metainformationen anzureichern. Diese Metainformationen ermöglichen zusätzliche Analysen über diese Merkmalen. Die Aufnahme der Prozesse werden dabei grafisch vorgenommen, wobei jedes Element einer SMW Seite entspricht. Bisher gibt es aber keine Möglichkeit erstellte Diagramme zu laden.

  • T6: Ergänze die bisher erstellte Erweiterung um die zusätzliche Funktion des Ladens von in SMW abgebildeten BPMN Prozessen. (Betreuer: Maria Maleshkova und Tobias Weller)


Faceted Browsing

Annotationen von Dateien sind strukturierte Beschreibungen von Informationen dieser Dateien. So kann der Datentyp, Inhalt sowie eine für die Datei verantwortliche Person festgehalten werden. Im Rahmen des Forschungsprojekt Cognition-guided Surgery wurden Vorlagen für solche Annotationen für Radiologische Bilddateien mithilfe des SMWs erstellt. Die Vielzahl an Annotationsvorlagen erschweren die Übersicht für Benutzer, welche Vorlagen es bereits gibt und für welche er verantwortlich ist. Faceted Browsing und Filterfunktionen sind Lösungen um auf einfache Weise Benutzern es zu ermöglichen Annotationsvorlagen schnell zu selektieren.

  • T7: Implementiert sinnvolle Faceted Browsing und Filterfunktionen um Benutzern den Zugang zu den Annotationsvorlagen zu erleichtern. (Betreuer: Maria Maleshkova und Tobias Weller)


SMW Business Analytics

Dashboards werden verwendet um betriebliche Informationen verdichtet und visuell darzustellen. Üblicherweise werden diese von der Unternehmensleitung benutzt um schnell die wichtigsten Informationen zu erfassen. Im Controlling Bereich werden oftmals Pivot-Tabellen verwendet um schnell benutzerdefinierte Abfragen an die Daten zu stellen.

  • T8: Innerhalb dieser Arbeit soll ein fiktives Unternehmen in ein SMW eingepflegt werden. Es sollen bestehende Extensions verwendet werden um die eingepflegten Informationen sinnvoll darzustellen um sowohl der Unternehmensleitung die Möglichkeit zu geben in kurzer Zeit einen Überblick über den aktuellen Stand des Unternehmens zu erlauben, als auch der Controlling Abteilung zu erlauben detaillierte und Informationen ad-hoc abzufragen. (Betreuer: Maria Maleshkova und Tobias Weller)


Dokumentengenerieung mit SMW

T9: Es sollen Templates für bspw. Berichte oder Anträge, die im Qualitätsmanagement, im Projektmanagement, für Dienstreisen oder Bücherbestellungen erstellt werden mit Daten aus einem SMW gefüllt werden. Diese gefüllten Templaten werden live als schön formatierte PDF Dokumente generiert und ausgegeben. Ähnliche Arbeiten sind: Extension:Pdf_Export, Extension:PDF_Writer, DocBook_XML_export. (Betreuer: Nadia Ahmed und Matthias Frank)


Leichtgewichtige Web Services

T10: Mit Semantic MediaWiki (https://semantic-mediawiki.org/wiki/Semantic_MediaWiki) beschreiben viele Organisationen und Privatpersonen Dinge wie Orte, Personen, Geräte uvm. Dabei stellen diese Beschreibungen immer eine statische Sicht der Dinge dar. Solange keine neuen Informationen manuell eingegeben werden, können keine neuen Informationen generiert werden. Bisher ist es nicht möglich dynamische Aspekte wie Algorithmen mit wohl-definiertem Input und Output zu beschreiben. Ein Beispiel ist ein Algorithmus, der von einem String alle Wörter zählt oder den String trimmt. Daher ist es aktuell nicht möglich, einen Algorithmus zu beschreiben, der aus einem Geburtsdatum das aktuelle Alter berechnet. Wenn man nun nach dem Alter einer Person fragt, könnte automatisch der korrekte Algorithmus ausgewählt, ausgeführt und das aktuelle Alter ausgegeben werden. In dieser Arbeit sollen folgende Fragen untersucht werden

  • Ist es möglich, Algorithmen in SMW zu beschreiben und durch REST-Befehle auszuführen?
  • Ist es möglich, den Input und Output von Algorithmen wohl-definiert zu beschreiben, so dass automatisch aus gegebenen, neue Informationen abgeleitet werden können?
  • Optional: Möglichkeit, verschiedene Programmiersprachen für die Beschreibung eines Algorithmus verwenden zu können.
  • Optional: Komposition mehrer Services hintereinander, um Informationen abzuleiten.
  • Optional: Beschreibung von Test-Cases auf Wikiseiten zum regelmäßigen Testen von Algorithmen.
  • Optional: Komplexere Algorithmen durch Einbinden von Bibliotheken oder externen Programmen (z.B. R, Matlab, R).
  • Optional: Durchspielen von Simulationen oder Algorithmen des Maschinellen Lernens zur Vorhersage und Wissensentdeckung auf dynamische Gegebenheiten.

Die Evaluation kann anhand einer beliebigen Domäne durchgeführt werden. (Betreuer Benedikt Kämpgen)