Home |  ENGLISH |  Kontakt |  Impressum |  Datenschutz |  Anmelden |  KIT

Thema4577: Unterschied zwischen den Versionen

Aus Aifbportal

Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „{{Abschlussarbeit |Titel=Wikipedia List Extraction |Abschlussarbeitstyp=Bachelor, Master |Betreuer=Fabian Hoppe, Harald Sack |Partner=FIZ Karlsruhe |Forschungs…“)
(kein Unterschied)

Version vom 24. März 2020, 14:25 Uhr



Wikipedia List Extraction




Informationen zur Arbeit

Abschlussarbeitstyp: Bachelor, Master
Betreuer: Fabian Hoppe, Harald Sack
Forschungsgruppe: Information Service Engineering
Partner: FIZ Karlsruhe
Archivierungsnummer: 4577
Abschlussarbeitsstatus: Offen
Beginn: 01. April 2020
Abgabe: unbekannt

Weitere Informationen

Wikipedia ist die beliebteste Online-Enzyklopädie und hat sich zu einem wichtigen Bestandteil des Internets entwickelt. Neben den Hauptinhalten, den Artikelseiten zu Themen oder Entitäten, enthält Wikipedia auch aggregierte "List Pages", d.h. Seiten, welche Listen von Entitäten enthalten, die eine Gemeinsamkeit aufweisen, wie z.B. DBpedia ist ein Wissensgraph, welcher regelmäßig aus Wikipedia-Inhalten extrahiert wird. Aktuell sind Informationen von deutschen List Pages jedoch eher oberflächlich in DBpedia repräsentiert und müssen erweitert werden. Gegenstand dieser Arbeit ist die Analyse deutscher Wikipedia-List Pages sowie die Erweiterung des DBpedia Wissensgraphs durch das extrahierte Wissen dieser List Pages. Die Arbeit beinhaltet: 1. Extrahierung deutscher Wikipedia-List Pages aus Wikipedia-Dumps 2. Zuordnung der Wikipedia-Listen mit den zugrunde liegenden DBpedia-Entitäten 3. Extrahierung der (Roh-)Informationen aus einzelnen Wikipedia-List Pages 4. Konvertierung der Wikipedia-Listen mit Hilfe des Ontologieschemas zu RDF für die Verwendung in DBpedia Für eine Masterarbeit sollten bestehende Ansätze zur Informationsextraktion von Wikipedia-Listen angewendet und erweitert werden, wobei der Schwerpunkt auf Vollständigkeit und Qualität der Daten liegt.


Ausschreibung: Download (pdf)