Stage-oe-small.jpg

Neuigkeit91: Unterschied zwischen den Versionen

Aus Aifbportal
Wechseln zu:Navigation, Suche
Zeile 13: Zeile 13:
 
The master thesis deals with the factorisation of over 4 million entites in the English Wikipedia. To this end, the relations between Wikipedia articles, surface forms and categories were examined. Based on this information huge matrices were built which capture the information of the relations between entities, categories and surface forms. These matrices were decomposed into latent factor matrices viagradient descent. The resulting knowledge representation can be understood as compact representation about all entities and their relations in the English Wikipedia. This latent representation can e.g. be used to annotate any text or to deduce previously unknown relations between entities and categories.
 
The master thesis deals with the factorisation of over 4 million entites in the English Wikipedia. To this end, the relations between Wikipedia articles, surface forms and categories were examined. Based on this information huge matrices were built which capture the information of the relations between entities, categories and surface forms. These matrices were decomposed into latent factor matrices viagradient descent. The resulting knowledge representation can be understood as compact representation about all entities and their relations in the English Wikipedia. This latent representation can e.g. be used to annotate any text or to deduce previously unknown relations between entities and categories.
 
|Datum=2015/07/11
 
|Datum=2015/07/11
|Bild=FacultyAwardThoma.JPG
+
|Bild=Datei:FacultyAwardThoma2.png
 
|Forschungsgruppe=Wissensmanagement
 
|Forschungsgruppe=Wissensmanagement
 
}}
 
}}

Version vom 6. Oktober 2015, 07:17 Uhr

Neuigkeit vom 11. Juli 2015


Steffen Thoma erhält Fakultätspreis 2015



Steffen Thoma aus der Forschungsgruppe Wissensmanagement wurde für seine Masterarbeit "Entitätserkennung in Textdokumenten durch Faktorisierung der Wikipedia" mit dem Fakultätspreis der Fakultät für Wirtschaftswissenschaften des Karlsruher Instituts für Technologie ausgezeichnet.


Hiermit erhält die Masterarbeit nach Auszeichnung zur besten Masterarbeit in der Forschungsgruppe Wissensmanagement durch den Verein für Angewandte Informatik (AIK) e.V. die zweite Prämierung.


Die Masterarbeit befasst sich mit der Faktorisierung der über 4 Millionen Entitäten in der englischen Wikipedia. Hierfür wurden die Beziehungen von Wikipedia-Artikeln, Textphrasen und Kategorien untersucht. Basierend auf diesen Daten wurden große Matrizen gebildet, welche die Beziehungen der einzelnen Entitäten untereinander und zu Kategorien und Textphrasen beschreiben. Diese Matrizen wurden mittels Gradientenabstiegsverfahren in latente Faktormatrizen zerlegt. Die daraus resultierende latente Wissensrepräsentation lässt sich als kompakte Darstellung aller in der Wikipedia beschriebenen Entitäten und deren Abhängigkeiten untereinander verstehen. Das gewonnene Wissen lässt sich unter anderem zum Annotieren von Textphrasen in beliebigen Textdokumenten verwenden oder um vorher nicht bekannte Beziehungen zwischen Entitäten, Kategorien und Textphrasen abzuleiten.



Aus der Forschungsgruppe Wissensmanagement