Home |  ENGLISH |  Kontakt |  Impressum |  Datenschutz |  Anmelden |  KIT

Thema3656

Aus Aifbportal

Wechseln zu: Navigation, Suche



Erkennung von neuartigen Entitäten in Textdokumenten





Informationen zur Arbeit

Abschlussarbeitstyp: Bachelor, Master, Diplom, Studienarbeit
Betreuer: Michael Färber
Forschungsgruppe: Wissensmanagement

Archivierungsnummer: 3656
Abschlussarbeitsstatus: Abgeschlossen
Beginn: unbekannt
Abgabe: unbekannt

Weitere Informationen

Unter der Voraussetzung, dass eine Wissensbasis wie Wikipedia gegeben sei, sollen bisher unbekannte Entitäten in einem Text erkannt werden. Unbekannt bedeutet dabei bspw., dass die Entität noch nicht durch einen Wikipedia-Eintrag in Wikipedia repräsentiert ist. Dies ist beispielsweise bei neuartigen Erfindungen wie dem „iPhone 6“ der Fall. Für die Erkennung von Entitäten in einem Fließtext existieren bereits unzählige Tools (sog. NERC-Tools). Bisherige Verfahren schaffen es jedoch nur sehr begrenzt, „Neuheiten“ zu entdecken. Im konkreten Beispiel wird bspw. „iPhone“ als Entität und existierender Wikipedia-Eintrag erkannt, jedoch nicht, dass „iPhone 6“ gemeint ist, dies ein Nachfolger der iPhone-Serie ist (d.h. vom Entitätstyp „Smartphone“ oder „Produkt“) und der Text relevant für den noch fehlenden Eintrag „iPhone 6“ relevant sein könnte. Die Erkennung kann auf Versionszahlen basieren, soll aber nicht darauf beschränkt sein. In der Abschlussarbeit soll zum einen ein (kurzer) Überblick über bestehende Verfahren/Tools geschaffen werden, die das beschriebene Problem bereits angehen. Ferner sollen geeignete Algorithmen zur Erkennung erdacht und implementiert werden. Dies kann in Form einer Erweiterung eines existierenden etablierten NERC-Tools wie dem Wikipedia Miner geschehen.


Ausschreibung: Download (pdf)