Human Centered Computing

Tool zur Data Extraction aus Online Community

Tool Grafik new
Tool Grafik new
Betreuer: Dipl.-Inf. Jamal Al Qundus
Fach: Data/Community Analytics
Abschluss: Bachelor of Science (B.Sc.)

Voraussetzungen:

  • State of the Art, Analyse und Abgrenzung gegenüber anderer und ggf. ungeeigneter Tools

  • Entwicklung eines neuen Tools für die Datengewinnung

  • Inbetriebnahme und Evaluation

Inhalt

Die Arbeitsgruppe "Human Centered Computing" (HCC) erforscht und entwickelt Software zur kollaborativen Mensch-Mensch und Mensch-Maschine Interaktion. Von besonderen Interesse sind dabei die sozio- technischen Parameter von Kollaborationsumgebungen.

Um das Beteiligungsverhalten von Nutzern anhand deren Aktivitäten zu beschreiben, müssen in einem ersten Schritt solche Parameter erhoben werden.

Mit dieser Bachelorarbeit soll geprüft werden, In welcher Form solche Systeme benutzt werden und was ist der Antrieb zu deren Benutzung? Das Ziel ist es, ein Modell zu erstellen, welches eine verbesserte kollaborative Arbeitsumgebung definiert, in der der Benutzer im Mittelpunkt steht.

Der Gegenstand unserer Forschung beschränkt sich derzeit auf Online Communities; einen ersten fundierten Schritt in Richtung der kollaborativen Zusammenarbeit haben wir etabliert. Im Rahmen der ausgeschriebenen Abschlussarbeit soll ein Tool zur Datengewinnung aus einer web-basierten Online Community entwickelt und in Betrieb genommen werden.

Genius.com ist eine neue und stetig wachsende Gemeinschaft, auf der hauptsächtlich Songtexte annotiert und interpretiert werden.

Ein Ansatz zur Informationsgewinnung ist vorhanden und kann als Ausgangspunkt für die Arbeit genutzt werden. Dabei existieren mehrere Herangehensweisen, welche dann in den Vorgesprächen präsentiert werden.

Das online community bietet einen Dienst an, der alle Nutzeraktivitäten in Echtzeit ausgibt. Diese sollen gesammelt werden (1). Mit einem Bündel von Schlüsselwörtern werden die Aktivitäten identifiziert (2). Aktivitäten beinhalten URLs und IDs zu den Autoren und weitere Informationen, die extrahiert (3) und aus der Webseite (4a) oder, falls es einen Dienst für die gewünschten Daten anbietet, von der API Schnittstelle (4b) abgefragt werden. Anschliessend werden die Aktivitäten und die dazugehörigen Autoren und Variablen wie voting score, time stamp, content, context etc. in eine Datenbank gespeichert.

Über den Einsatz von Lambda Architektur für die Datenverarbeitung kann gesprochen werden.

Lambda Architektur Kenntnis wird nicht Vorausgesetzt.

Von Vorteil sind dabei Kenntnisse in Datenbank-Systemen und Sprachen wie beispielsweise PostgreSQL. Ferner werden Kenntnisse einer höheren Programmiersprache wie Java erwartet. Die Arbeit soll selbständig als auch in Absprache mit dem Team erstellt werden. Eine umfassende Betreuung der Abschlussarbeit und gute Kommunikation sind für uns selbstverständlich.