Springe direkt zu Inhalt

Sebastian Sontberg:

Tool Grafik new

Tool Grafik new

Ereignisbasierte Datenextraktion aus einem sozialen Netzwerk

Requirements

  • State of the Art, Analyse und Abgrenzung gegenüber anderer und ggf. ungeeigneter Tools

  • Entwicklung eines neuen Tools für die Datengewinnung

  • Inbetriebnahme und Evaluation

Discipline
Data/Community Analytics
Degree
Bachelor of Science (B.Sc.)

Contents

Die Arbeitsgruppe "Human Centered Computing" (HCC) erforscht und entwickelt Software zur kollaborativen Mensch-Mensch und Mensch-Maschine Interaktion. Von besonderen Interesse sind dabei die sozio- technischen Parameter von Kollaborationsumgebungen.

Um das Beteiligungsverhalten von Nutzern anhand deren Aktivitäten zu beschreiben, müssen in einem ersten Schritt solche Parameter erhoben werden.

Mit dieser Bachelorarbeit soll geprüft werden, In welcher Form solche Systeme benutzt werden und was ist der Antrieb zu deren Benutzung? Das Ziel ist es, ein Modell zu erstellen, welches eine verbesserte kollaborative Arbeitsumgebung definiert, in der der Benutzer im Mittelpunkt steht.

Der Gegenstand unserer Forschung beschränkt sich derzeit auf Online Communities; einen ersten fundierten Schritt in Richtung der kollaborativen Zusammenarbeit haben wir etabliert. Im Rahmen der ausgeschriebenen Abschlussarbeit soll ein Tool zur Datengewinnung aus einer web-basierten Online Community entwickelt und in Betrieb genommen werden.

Genius.com ist eine neue und stetig wachsende Gemeinschaft, auf der hauptsächtlich Songtexte annotiert und interpretiert werden.

Ein Ansatz zur Informationsgewinnung ist vorhanden und kann als Ausgangspunkt für die Arbeit genutzt werden. Dabei existieren mehrere Herangehensweisen, welche dann in den Vorgesprächen präsentiert werden.

Das online community bietet einen Dienst an, der alle Nutzeraktivitäten in Echtzeit ausgibt. Diese sollen gesammelt werden (1). Mit einem Bündel von Schlüsselwörtern werden die Aktivitäten identifiziert (2). Aktivitäten beinhalten URLs und IDs zu den Autoren und weitere Informationen, die extrahiert (3) und aus der Webseite (4a) oder, falls es einen Dienst für die gewünschten Daten anbietet, von der API Schnittstelle (4b) abgefragt werden. Anschliessend werden die Aktivitäten und die dazugehörigen Autoren und Variablen wie voting score, time stamp, content, context etc. in eine Datenbank gespeichert.

Über den Einsatz von Lambda Architektur für die Datenverarbeitung kann gesprochen werden.

Lambda Architektur Kenntnis wird nicht Vorausgesetzt.

Von Vorteil sind dabei Kenntnisse in Datenbank-Systemen und Sprachen wie beispielsweise PostgreSQL. Ferner werden Kenntnisse einer höheren Programmiersprache wie Java erwartet. Die Arbeit soll selbständig als auch in Absprache mit dem Team erstellt werden. Eine umfassende Betreuung der Abschlussarbeit und gute Kommunikation sind für uns selbstverständlich.