Stage-oe-small.jpg

Thema3866

Aus Aifbportal
Wechseln zu:Navigation, Suche



Maschinelles Lernen zur Erkennung von neuen Produkten in Texten (wie Nachrichten oder Webseiten)




Informationen zur Arbeit

Abschlussarbeitstyp: Master, Diplom
Betreuer: Michael Färber
Forschungsgruppe: Wissensmanagement

Archivierungsnummer: 3866
Abschlussarbeitsstatus: unbekannt
Beginn: unbekannt
Abgabe: unbekannt

Weitere Informationen

Ziel ist es, Dinge wie Produkte, die noch nicht in Wikipedia sind, aber für das Textdokument zentral sind, in einem gegebenen Text erstmalig zu erkennen. Als zentral werden dabei diejenigen Entitäten (Dinge) betrachtet, die als Nachfolger von bekannten Entitäten stehen (Entitätenreihe), etwa bei Produkten das Windows 10 in der Reihe der Windows-Betriebssysteme (z.B. Windows 95,…, Windows 8.1).

Der Fokus der Arbeit liegt darin, zunächst die „Entitätenketten“ automatisch zu erlernen und/oder aus einer Wissensbasis zu extrahieren. In einem zweiten Schritt kann dann ein Ansatz entwickelt werden, der die Nachfolger in diesen „Entitätenketten“ in einem gegebenen Text findet, ohne den Namen bzw. das Label der Entität vorher zu kennen (z.B. „Windows 10“). Die Erkennung soll dabei nicht auf Versionszahlen beschränkt sein, sondern es soll ein generischer Ansatz entwickelt werden. Hierzu können zwei Ansätze verglichen werden: Das Ausnutzen gleicher oder ähnlicher Attribute (also einer Wissensbasis) und das Ausnutzen des gleichen historischen Hintergrundes (also des Kontextes in den Dokumenten mittels Annotationen). Details des Ansatzes werden im persönlichen Gespräch erläutert. Als Wissensbasis kann Wikipedia bzw. DBpedia verwendet werden. Zur Textannotation werden adaptierte Varianten des Wikipedia Miner zur Verfügung gestellt.

English description


Ausschreibung: Download (pdf)