Home |  ENGLISH |  Kontakt |  Impressum |  Datenschutz |  Anmelden |  KIT

Thema3239

Aus Aifbportal

Wechseln zu: Navigation, Suche



Multilingual Expert Search using Linked Open Data


Hristina Taneva



Informationen zur Arbeit

Abschlussarbeitstyp: Diplom
Betreuer: Rudi StuderDaniel M. Herzig
Forschungsgruppe: Wissensmanagement

Archivierungsnummer: 3239
Abschlussarbeitsstatus: Abgeschlossen
Beginn: 01. April 2010
Abgabe: 30. September 2010

Weitere Informationen

Die Bag-of-Words Darstellung ist die am häufigsten eingesetzte Form der Dokumenten- Repräsentation im Information Retrieval. Dabei wird ein Dokument als Menge der in diesem Dokument vorkommender Terme repräsentiert. Dadurch geht Information über das Dokument verloren und die IR-Systeme bringen für verschiedene Spracheneinstellungen auch verschiedene Resultate. Das Ziel dieser Diplomarbeit ist es Linked Open Data Ansatz zu entwickeln. Somit werden Uniform Resource Identifier(URIs) als interlinguale Dokumenten-Repräsentation verwendet. Die Anfragen und die Dokumente sind durch die Ressourcen, die sie en- thalten, zusammengefasst. Wikipedia dient als Quelle der Ressourcen. Zuerst wird ein Mixture Language Model, welches die Ressourcen und deren Namen in unterschiedlichen Sprachen verwendet, vorgestellt. Im zweiten Teil der Diplomarbeit wird dieses Modell erweitert, wobei die typisierten Verbindungen zwischen den Ressourcen genutzt werden. Das neue Modell verwendet RDF: type Eigenschaft, die angibt, dass die Ressource die Instanz einer Klasse (hier Kategorie genannt) ist. Das heißt, die Dokumente werden durch die Kategorien der Ressourcen repräsentiert. Die Anwendbarkeit der beiden Verfahren für mehrsprachige Retrievals mit einer Fall- studie für Expertensuche wird bewiesen. Die Experimente zeigen, dass die beiden Mod- elle BM25 + Z-Score(43) Baseline übertreffen und der Ansatz für cross-linguale Expertensuche geeignet ist.