Springe direkt zu Inhalt

07.06.2022: Prof. Dr. Helena Mihaljević (Hochschule für Technik und Wirtschaft Berlin)

Mathematik für Sprachanalyse – Oder was Hassrede im Netz mit Vektoren zu tun hat

Im Kontext der COVID-19 Pandemie haben Hassreden im Internet stark zugenommen. Verschwörungstheorien sowie antisemitische und rassistische Inhalte werden über verschiedene Social Media Plattformen und Messenger Dienste verbreitet. Algorithmische Methoden des Natural Language Processing und des Machine Learning helfen uns, große Mengen an Textdaten inhaltlich zu analysieren. Sie können beispielsweise genutzt werden, um Themen in Online-Diskussionen zu entdecken oder Programme zu schreiben, um Hassreden automatisch zu erkennen. Derartige Verfahren sind im Grunde mathematische Modelle, welche Vektoren verarbeiten, die wiederum natürliche Sprache repräsentieren. Wie diese Vektoren zustande kommen und wie sie für das „Training“ solcher Modelle genutzt werden, wird in meinem Vortrag beleuchtet. Darüber hinaus werden wir sehen, dass es noch einiges mehr als Mathematik und Informatik braucht, um die genannten Problemstellungen anzugehen – von Konzepten und Definitionen über geeignete Datensätze, um Modelle zu trainieren.

Mein persönlicher Weg zu Algorithmen dieser Art war eher ein nichtlinearer. Ich werde neben dem fachlichen Einblick zeigen, dass es viele Wege gibt, als Forscherin zu arbeiten und dass Mathematik ein wertvoller und enorm bereichernder Grundstein für eine Vielzahl von Anwendungen und Fragestellungen sein kann.