Stage-oe-small.jpg

Thema4577

Aus Aifbportal
Wechseln zu:Navigation, Suche



Wikipedia List Extraction




Informationen zur Arbeit

Abschlussarbeitstyp: Bachelor
Betreuer: Fabian Hoppe, Harald Sack
Forschungsgruppe: Information Service Engineering
Partner: FIZ Karlsruhe
Archivierungsnummer: 4577
Abschlussarbeitsstatus: Vergeben
Beginn: 01. Mai 2020
Abgabe: unbekannt

Weitere Informationen

Wikipedia ist die beliebteste Online-Enzyklopädie und hat sich zu einem wichtigen Bestandteil des Internets entwickelt. Neben den Hauptinhalten, den Artikelseiten zu Themen oder Entitäten, enthält Wikipedia auch aggregierte "List Pages", d.h. Seiten, welche Listen von Entitäten enthalten, die eine Gemeinsamkeit aufweisen, wie z.B. DBpedia ist ein Wissensgraph, welcher regelmäßig aus Wikipedia-Inhalten extrahiert wird. Aktuell sind Informationen von deutschen List Pages jedoch eher oberflächlich in DBpedia repräsentiert und müssen erweitert werden. Gegenstand dieser Arbeit ist die Analyse deutscher Wikipedia-List Pages sowie die Erweiterung des DBpedia Wissensgraphs durch das extrahierte Wissen dieser List Pages. Die Arbeit beinhaltet: 1. Extrahierung deutscher Wikipedia-List Pages aus Wikipedia-Dumps 2. Zuordnung der Wikipedia-Listen mit den zugrunde liegenden DBpedia-Entitäten 3. Extrahierung der (Roh-)Informationen aus einzelnen Wikipedia-List Pages 4. Konvertierung der Wikipedia-Listen mit Hilfe des Ontologieschemas zu RDF für die Verwendung in DBpedia Für eine Masterarbeit sollten bestehende Ansätze zur Informationsextraktion von Wikipedia-Listen angewendet und erweitert werden, wobei der Schwerpunkt auf Vollständigkeit und Qualität der Daten liegt.


Ausschreibung: Download (pdf)