Human Centered Computing

Analysis of Tagging Behavior in Online Learning

Betreuer: Prof. Cl. Müller-Birn
Fach: Data/Community Analytics
Abschluss: Master of Science (M.Sc.)

Voraussetzungen:

  • Gute Kenntnisse im Bereich Webtechnologien insbesodere Django, Bootstrap, AngularJS
  • Sehr gute Englischkenntnisse für die Literaturanalyse

Inhalt

Eine Besonderheit stellt das Annotieren von Textdokumenten in der Korpuslinguistik dar. Die korpuslinguistische Arbeitsweise ist mit einer Reihe von softwaretechnischen Herausforderungen verbunden. So werden Token- und Spannenannotationen (Annotation, die sich entweder auf ein die kleine technische Einheit – Token - oder eine Gruppe von aufeinanderfolgenden Token beziehen) in Mehrebenenkorpora verwendet. In solchen Mehrebenenkorpora können basierend auf festen oder freien Tagsets virtuell unendlich viele Annotationsebenen definiert werden. Ein wichtiger Bestandteil der literaturwissenschaftlichen Ausbildung besteht in der Vermittlung dieser korpuslinguistischen Arbeitsweise. Häufig kann erst nach einigen Jahren der Erfahrung in der Korpuslinguistik eine Qualität bei den Annotationen erreicht werden, die es anderen Wissenschaftlern erlaubt, auch mit den erstellten annotieren Korpus zu arbeiten. Ein wichtiges Ziel der Ausbildung ist es daher, die Probleme, die bei der Annotationsarbeit von Studierenden auftreten, zu kennen. In dieser Abschlussarbeit soll aus dieser Motivation heraus vor allem die folgende Fragestellung beantwortet werden: 

  • Welche Arten von Annotationen/Tagsets werden häufiger korrigiert, schneller zugewiesen oder häufig richtig gemacht?

Zur Beantwortung der Frage soll das bestehende Annotationswerkzeug neonion, um die benötigten Funktionen für die korpuslinguistischen Arbeitstechniken im Rahmen eines User-Centered-Design Prozesses erweitert werden. Der Schwerpunkt der Arbeit soll ein Annotationsaufzeichnungsmodul bilden, welches den Dozenten erlaubt, Annotationsarbeiten zuzuweisen, den Annotationsvorgang aufzuzeichnen und bestehende Annotationen zu löschen. Ausgewählte Daten aus den Annotationsarbeiten sollen dabei dem Dozenten visualisiert (Häufigkeiten, Korrelationen mit Annotationstypen) und als CSV Export für weitere Analysen zur Verfügung gestellt werden.

Kooperationspartner

  • Carolin Odebrecht von Korpuslinguistik und Morphologie der Humboldt-Universität zu Berlin


Referenzen

  • Marshall, C. C. (1998). Toward an Ecology of Hypertext Annotation (pp. 40–49). Presented at the Proceedings of the Ninth ACM Conference on Hypertext and Hypermedia : Links, Objects, Time and Space---structure in Hypermedia Systems: Links, Objects, Time and Space---structure in Hypermedia Systems, New York, NY, USA: ACM. http://doi.org/10.1145/276627.276632
  • Macmullen, W. J. (2005). Annotation as process, thing, and knowledge: Multi-domain studies of structured data annotation. Chapel Hill: University of North Carolina, School of Information and Library Science.