Springe direkt zu Inhalt

Johannes Mihan:

Entwicklung eines RSS-Aggregators mit kaskadierten Empfehlungssystems unter Verwendung von implizitem und explizitem Feedback

Requirements

  • Webtechnologien, HTML 5, Javascript und Kenntnisse in verteilter Programmierung und Datenbanken wünschenswert
Discipline
Recommender Systeme
Degree
Bachelor

Contents

Im World Wide Web existieren vielfältige Möglichkeiten (z.B. Blogs, Webseiten, Twitter), sich über bestehende thematische Entwicklungen zu informieren. Häufig sind inhaltlich ähnliche Informationen auf unterschiedlichen Webseiten verteilt und daher werden beispielsweise im Blogbereich unter anderem Aggregatoren verwendet, um das Auffinden von relevanten Informationen zu erleichtern. Mit einer zunehmenden Anzahl von genutzten Aggregatoren oder durch das vielfältige Abonnieren von RSS-Feeds kann die Anzahl der bereitgestellten Artikel aber so groß werden, dass eine weitere Selektion der Inhalte erforderlich ist, damit der Informationssuchende wichtiges von unwichtigen unterscheiden kann. Diese Arbeit basiert auf der These, dass die Konsumption der Inhalte in Schritten erfolgt – zunächst werden alle Inhalte kurz überflogen, damit wichtiges von unwichtigen getrennt wird und danach werden als wichtig eingeschätzte Informationen unmittelbar gelesen. Das Lesen von Informationen, die weniger zentral erscheinen, wird auf einen späteren Zeitpunkt verlegt.

Der Nutzer soll bei der Identifikation wichtiger Themen so unterstützt werden, dass unwichtige Inhalte nicht herausgefiltert, sondern nur geringer gewichtet werden. Diese geringere Gewichtung bewirkt, dass die Informationen nicht mehr zeitlich sondern nach ihrer Relevanz geordnet werden. Technisch kann dies mit einem Recommender System realisiert werden. Recommender basieren auf der Analyse, Inferenz und Vorhersage von Nutzer-Artefakt-Beziehungen. Es werden zwei übergeordnete Ansätze unterschieden: der Content-based Approach und das Collaborative Filtering. Ersterer soll im Rahmen dieser Arbeit genutzt werden, um Informationsbasierte Nutzerprofile zu erstellen. Solche Profile basieren auf einem gewichteten Vektor der Artefakt-Features (z.B. Autor, Terms). Die Gewichte stellen die Bedeutung jedes einzelnen Features für den Nutzer dar [1].

Die erforderlichen Daten zum Aufbau eines solchen Systems können durch direkte oder indirekte Rückmeldungen des Nutzers gesammelt werden. In dieser Arbeit sollen nur indirekte Rückmeldungen (= Signale) des Nutzers [2] für den Recommender-Algorithmus verwendet werden. Zu diesen impliziten Daten zählen z.B. Anzahl der Klicks, Dauer der Session, Merken oder Weiterleiten des Eintrags. Auf Basis der RSS Feed API von Google soll zunächst ein einfacher Feed Reader erstellt werden. Auf Basis dessen sollen ausgewählte indirekte Nutzerrückmeldungen unter Nutzung der in [3] erstellten Matrix erhoben und evaluiert werden.

Referenzen/Literatur
[1] Peter Brusilovsky, Alfred Kobsa, Wolfgang Nejdl: The Adaptive Web: Methods and Strategies of Web Personalization. Springer Berlin Heidelberg, 2008. Für diese Arbeit vor allem relevant sind die Kapitel 1,2,5,10.
[2] Douglas  W.  Oard  and  Jinmook  Kim: Implicit  Feedback  for  Recommender Systems. AAAI Technical Report WS-98-08. 1998.
[3] Diane Kelly and Jaime Teevan. 2003. Implicit feedback for inferring user preference: a bibliography. SIGIR Forum 37, 2 (September 2003), 18-28.