Stage-oe-small.jpg

Thema4577

Aus Aifbportal
Version vom 11. November 2020, 12:12 Uhr von Cq9199 (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu:Navigation, Suche



Wikipedia List Extraction


Le Yang



Informationen zur Arbeit

Abschlussarbeitstyp: Bachelor
Betreuer: Fabian Hoppe, Harald Sack
Forschungsgruppe: Information Service Engineering
Partner: FIZ Karlsruhe
Archivierungsnummer: 4577
Abschlussarbeitsstatus: Abgeschlossen
Beginn: 01. Juni 2020
Abgabe: 30. September 2020

Weitere Informationen

Wikipedia ist die beliebteste Online-Enzyklopädie und hat sich zu einem wichtigen Bestandteil des Internets entwickelt. Neben den Hauptinhalten, den Artikelseiten zu Themen oder Entitäten, enthält Wikipedia auch aggregierte "List Pages", d.h. Seiten, welche Listen von Entitäten enthalten, die eine Gemeinsamkeit aufweisen, wie z.B. DBpedia ist ein Wissensgraph, welcher regelmäßig aus Wikipedia-Inhalten extrahiert wird. Aktuell sind Informationen von deutschen List Pages jedoch eher oberflächlich in DBpedia repräsentiert und müssen erweitert werden. Gegenstand dieser Arbeit ist die Analyse deutscher Wikipedia-List Pages sowie die Erweiterung des DBpedia Wissensgraphs durch das extrahierte Wissen dieser List Pages. Die Arbeit beinhaltet: 1. Extrahierung deutscher Wikipedia-List Pages aus Wikipedia-Dumps 2. Zuordnung der Wikipedia-Listen mit den zugrunde liegenden DBpedia-Entitäten 3. Extrahierung der (Roh-)Informationen aus einzelnen Wikipedia-List Pages 4. Konvertierung der Wikipedia-Listen mit Hilfe des Ontologieschemas zu RDF für die Verwendung in DBpedia Für eine Masterarbeit sollten bestehende Ansätze zur Informationsextraktion von Wikipedia-Listen angewendet und erweitert werden, wobei der Schwerpunkt auf Vollständigkeit und Qualität der Daten liegt.


Ausschreibung: Download (pdf)