Studien- und Abschlussarbeiten / Jobs

Offene Themen

Die folgende Liste ist nur ein Ausschnitt der aktuell offenen Themen. Bitte kontaktieren sie Prof. Adrian Paschke für weitere Themen oder auch wenn sie selbst einen Themenvorschlag haben.


Title: "Provalets - Rule-based Analytics and Inference Microservices"

Bachelor/Master/Diploma Thesis (bereits vergeben, aber aufbauende Themen sind per Anfrage möglich )
Supervisor: Adrian Paschke

Beschreibung: Provalets sind regel-basierte Inferenz und Analytics Komponenten, deren interne Agentenlogik und Schnittstellenbeschreibung (inkl. funktional und nicht-funktionale wie Policies/SLAs) regel-basiert ist.  Dazu nutzen Provalets intern die OSGi-fähige Prova Regelmaschine. Zielstellung der Arbeit ist das Redesign und die Umsetzung des Provalets Konzept als sogenannte Microservices. Microservices sind Anwendungsbausteine, die jeweils für sich genommen funktionieren und entsprechend einzeln angesprochen und deployed werden können. Als Microservice Container Infrastruktur komm MANTL zum Einsatz.


Title: Semantic Role Discovery

Master Thesis
Supervisor:Ahmad Hasan

Beschreibung:

The aim of Role Discovery is to find users who show similar behaviour in their local communities. Current methods analyze interactions that occur among users and compute a set of behavioural features to be used for clustering users into roles.

In collaborative content management systems, such as the Wikipedia, the content added by users can provide deeper insight about their actual roles.

In this master thesis, a new approach to Role Discovery is to be developed to benefit from the rich set of semantic technologies to open new horizons in this field.




Title: Semantic Annotation Tool

Art: Bachelor/Master/Diplomarbeit

Betreuer: Alexandru Todor

Beschreibung:

What the topic is about:

Semantic technologies, and in the first place linked data, promise further automation by turning the Web of information into a Web of interconnected and machine processable data sources. Although these technologies have reached an acceptable mature state, they are not broadly used in commercial and public Web applications. In our opinion this is mainly caused by the lack of user-tailored and easy-to-use tool support for creating and publishing semantic contents.

In this thesis you will extend an existing tool called Loomp that has been developed by the Corporate-Semantic-Web workgroup at the FU-Berlin.

Possible Topics are:

  • Extending Loomp for Video Annotation
    • You will combine and extend Loomp and another tool developed by the AG-CSW calld SAF4M .  This topic requires knowledge or interest in technologies such as Grails/Groovy or another Java/Scala based framework such as the Play or Scalantra. Knowledge or interest in Computer Vision and technologies such as OpenCV/JavaCV , OpenImaj or MatlabCV.
  • Complex or Composed Annotations in Text
    • The complexity of annotating concepts in text groes exponentially when considering multimedia content such as images or videos embedded into a text document. For example, in a document with charts, an annotation in the text document is closely related to that in the chart, and one whithout the other makes no sense.  Further complexity comes from annotating composed concepts, definitions or relations between concepts.


Why should I go for this topic?

This topic gives you the chance to deepen your knowledge in Web Development, The Semantic Web, Natural Language Processing and/or Computer Vision

For further information about this topic please contact Alexandru Todor (todor[@]zedat).


Title: Data Fusion and Inference of Implicit Data

Art: Bachelor/Master/Diplomarbeit

Betreuer: Alexandru Todor

Beschreibung:

What the topic is about:

The main task of Information Extraction is to extract structured data from multiple source of unstructured and structured data and to integrate this data into a single, coherent KB (knowledge base). The resulting knowledge base however, has a series of missing knowledge that can be extracted by closer analysis of the KB. For example, in our KB we have 2 statements:  "John is the father of Marry", and "Marry is the brother of Tom", from such statements we can infer a third fact, namely that "John is the father of Tom" .

Possible topics for Bachelor/Master theses are:

  • State of the art analysis and comparison of fact-inference approaches from karge KBs
  • Implementation of a scalable approach for fact-inference fron large KBs


For further information about this topic please contact Alexandru Todor (todor[@]zedat).


Title: Event Detection and Analysis

Art: Bachelor/Master/Diplomarbeit

Betreuer: Alexandru Todor

Beschreibung:

What the topic is about?

In Event Detection and Analysis we try to idenfity mentions of events in text documents and classify them acording to a series of predefined classes. The state of the art defines a series of approaches for adressing this task, from rule-based approaches to a variety of machine-learning based approaches. However, most approaches usually require the use of backgroung-knowledge soruces and hand-crafted rules, or trainings-data.

In your thesis you will research the State-of-The-Art in Event Detection, Analysis and Tracking and implement a flexible, scalable system for detecting events in news streams.

Why should I go for this topic?

Information Extraction and Data Science are currently some of the most hyped topics in Computer Science, where companies such as IBM and Google are investing heavily. It gives you the chance to delve into an interesting science field and experiment with technologies such as Apache Hadoop/Spark and Knowledge-Bases such as DBpedia, Wikidata and Freebase. It gives you the chance to work on a meaningfull project, learn new technologies and imrprove your CV with some of the latest technologies in Machine Learning and Data Science.

For further information about this topic please contact Alexandru Todor (todor[@]zedat).


Title: Sentiment Analysis: from simple polarity sentiment into emotional senitment analysis

Art: Bachelor/Master/Diplomarbeit

Betreuer: Mohammed Almashraee

Beschreibung:

What the topic is about?

The advent of the Web has brought the evolution of the sentiment analysis to analyze subjective text into a higher level of granularity. Opinion mining or sentiment analysis is a task of text classification. It mines subjective expressions written in text and automatically summarizes opinions concerning an object of interest or concerning one or more of its related features or aspects.

Why should I go for this topic?

Inspite of the importance of facts, opinions and emotions as well are also play fundamental rules. Politicians need to know what people are thinking about their new rules and policies which are important for their next elections. Individuals need to have clear understanding about a particular object or parts of its aspects in order to be able to take right decision whether to buy that object or to go for a better choice. Manufacturers need to know why the sales of one of their product lines is low so they can decide an improvement or produce a new line of product.


Title: Smart Wiki-Archivierung System

Art: Bachelor/Master/Diplomarbeit

Betreuer: Ahmad Hasan

Beschreibung:

"In den vergangenen Jahren haben Wiki-Systeme Einzug in sehr viele Unternehmen und andere Organisationsformen wie Vereine und Verbände gefunden. Nach einer gelungenen Einführung eines solchen Systems ändern sich in der Regel nicht nur die Arbeitsprozesse in einem Unternehmen sondern auch die Kommunikationskultur. Sehr häufig geht damit auch eine grundsätzliche Veränderung der Unternehmenskultur einher. Über die Zeit wachsen die Inhalte so stark an und die Struktur wird häufig nicht an die neuen Bedürfnisse angepasst, so dass relevante Informationen in der großen Menge von Inhalten immer schwieriger zu finden sind und die Administration der Inhalte zunehmend schwerer wird.

Eine wichtige Aufgabe in diesem Zusammenhang ist die Archivierung von Inhalten durch Wiki-Moderatoren, die z.B. notwendig ist um die Wikis für die Nutzer übersichtlich zu halten und die Treffgenauigkeit bei der Suche zu optimieren. Diese ist sehr zeitintensiv und anspruchsvoll je umfangreicher das Wiki-System wird. Zur Unterstützung der Wiki-Moderatoren sollen unter Berücksichtigung der Aktualität und Relevanz der Inhalte sinnvolle Archivierungsvorschläge erzeugt werden können.

Hierfür sollen im Rahmen der wissenschaftlichen Arbeit bestehende Werkzeuge zur Archivierung von Inhalten analysiert werden. Weiterhin sollen Archivierungskriterien definiert und priorisiert werden.

Anschließend soll eine prototypische Umsetzung eines Werkzeugs für die Erzeugung von Archivierungsvorschlägen anhand ausgewählter Kriterien erfolgen, welches anschließend anhand von Testinhalten evaluiert werden kann."


Topic: "Aspect-Oriented Onologies"

Art: Bachelor/Master/Diplomarbeit
Betreuer: Ralph Schäfermeier

Beschreibung: In software development, cross-cutting concerns (such as authentication or logging) interfere with the actual business logic of a software product. For the sake of ease of development and re-use, it is desirable to keep these concerns separated and aim for a high degree of system decomposition. Aspect-oriented software development provides techniques and formal models that help achieve this aim. Likewise, ontologies contain cross-cutting concerns. As in software products, ontology modularization is a highly relevant issue and an intensively studied field. The CSW group at FU Berlin studies the applicabilty of the aspect-oriented approach to ontology development.

We offer Master and Bachelor topics. Possible topics include, but are not limited to:

  • Case studies
  • Implementation of development tools, such as
    • Plugins for the ontology editor Protégé
    • Extension of common development tools, such as Maven, Git, etc
  • Implementation/extension of APIs with aspect-oriented techniques
  • ...

Please contact Ralph Schäfermeier to arrange an appointment where we can discuss the details.


Titel: "Diffing and Versioning of Complex Ontologies"

Art: Bachelor/Master/Diplomarbeit
Betreuer: Ralph Schäfermeier

Beschreibung: Just as with software development, building ontologies means teamwork. Software developer teams rely on version control systems, such as the popular Subversion [1] or Git [2] system. One of the many strengths of versioning systems is their ability to provide a developer with a quick overview of what changes a file has undergone since the last time it was saved. While for software code, these changes are counted in terms of code lines, ontology developers are more interested in the question of which axioms have changed and what the logical consequences of these changes are. OWLdiff [3] is a semantic diff library for OWL ontologies which is able to answer these questions. OWldiff's semantic diff works very well for ontologies belonging to the OWL 2 EL profile [4], a subset of the much more powerful OWL 2 language. A possible way to circumvent this restriction and to extend the diff algorithm to work with ontologies with more expressive power than OWL EL is to partition a given ontology into its El compliant axioms and its non-EL compliant axioms, run the semantic diff algorithm on the EL compliant partition and a simpler algorithm on the more complex axioms. The subject and the objective of this thesis are to implement the solution suggested above in the form of an efficient algorithm and to implement a complete versioning workflow for ontology developer teams into the ontology editor Protégé [5], following the example of modern programming IDEs and to integrate the algorithm into this workflow.
[1] http://subversion.apache.org/
[2] http://git-scm.com/
[3] http://doi.ieeecomputersociety.org/10.1109/DEXA.2011.62 
[4] http://www.w3.org/TR/2008/WD-owl2-profiles-20081202/#OWL_2_EL 
[5] http://protege.stanford.edu/


Titel: "Semantic-enabled Complex Event Processing (SCEP)"

Art: Bachelor/Master/Diplomarbeit
Betreuer: Adrian Paschke

Beschreibung: Complex Event Processing (CEP) is one of current hot topics in computer science. CEP is about all of the computation on streams of event notifications for detection of meaningful complex events from the mass of incoming simple raw events. Many business organization are interested to know what exactly is happening now in their organization in terms of events, to be able to react the potential problems or chances at the right time. CEP can be seen as all of the computing that performs operations on complex events, including reading, creating,transforming or abstracting of events. One of our research subjects is the event query languages for semantic extension of complex event processing.


Title: "Entwicklung eine OMG Decision Modelling Notation (DMN) fähigen Regelmaschine für Geschäftsprozess und Geschäftsregeln"

Several Bachelor/Master/Diploma Theses
Supervisor: Adrian Paschke

Beschreibung:  Entscheidungsmodelle werden entwickelt, um die Entscheidungen im Unternehmen zu definieren, in der Regel als Teil eines Geschäftsprozessmodells in Form von Geschäftsregeln. Die Decision Modelling Notation (OMG DMN) ist ein neuer Standard der Object Management Group (OMG) zur modellierung von Entscheidungen, so dass organisatorische Entscheidungfindung leicht in Diagrammen dargestellt und dabei genau durch Unternehmensanalysten definiert, sowie (optional) automatisiert werden kann. Endziel der Arbeit ist die Entwicklung einer deklarativen DMN-fähigen Regelmaschine, welche DMN Modelle in eine ausführbare deklarative Regelsprache übersetzt und in einer Regelmaschine zu Ausführung bring.

Die Arbeiten finden in Zusammenarbeit mit einer Firma im Bereich Geschäftprozessmanagement statt. Das Thema kann in mehreren Bachelor und Masterarbeiten aufgeborchen werden.

* Konzeption und Umsetzung einer DMN-basierten Rules Engine mit Partial Inputs

* Performance-Betrachtung in der Backward-Chaining-Abwicklung von DMN-Modellen

* Übersetzung von DMN in Production Rules & Generierung von RuleML und  Drools-Code

* Reverse Engineering von Production Rules: Übersetzung von Drools -> RuleML nach DMN

Literatur: OMG DMN http://www.omg.org/spec/DMN/


Title: "Reaction RuleML Translatorframework"

Several Bachelor/Master Theses
Supervisor: Adrian Paschke

Beschreibung:  Die Rule Markup Language (RuleML http://ruleml.org) ist eine Sprachfamilien zum Austausch und Repräsentation von Web Regelsprachen auf der platform-Unabhängigen Schicht. Reaction RuleML (http://reaction.ruleml.org) ist eine Subsprachfamilie von RuleML welche Reaktive Regeln (Reaction Rules) addressiert. Im Rahmen der Arbeit sollen verschiedene Translatoren in platform-spezifische Sprachen wie Prova / Prolog (http://www.prova.ws) und Drools (http://www.drools.org) geschrieben werden und das ganze als generisches Translatorenframework als Rest-basiertes Webservice Framework umgesetzt werden.Dabei kann auf einer existieren Implementierung und existierended XSLTs aufgebaut werden.

Kenntnisse in XML Technologien (XML Schema, RelaxNG, XSLT, Jaxb) sind wünschenswert.


Title: "RuleMaven Erweiterungen  zur Verwaltung von RuleML Wissensbasen"

Several Bachelor/Master/Diploma Theses
Supervisor: Adrian Paschke

Beschreibung:  OntoMaven (http://www.corporate-semantic-web.de/ontomaven.html) ist ein Maven-basiertes Build und Life Cycle Management Werkzeug zur Verwaltung von Ontologieartefakten in Repositories (Github, Subversion, etc.). Über Plug-ins werden verschiedene Funktionalitäten zur semantischen Versionierung, Dokumentation, Abhängigskeitanalyse, Imports etc. in OntoMaven integriert. Zielstellung der Arbeit ist das OntoMaven Konzept als RuleMaven umzusetzen. RuleMaven erlaubt die verwaltung von RuleML Wissensartifakten.

Eine Vielzahl an Themen für Bachelorarbeiten und Masterarbeiten können im RuleMaven Projekt umgesetzt werden, z.B.:

* Anpassung von OntoMaven zur Verwaltung von RuleML Regelbasen in Github Repositorien

* ...


Title: "Erweiterung der Prova Regelamschine um einen typisierte Unifizierungsalgorithmus"

Several Bachelor/Master/Diploma Theses
Supervisor: Adrian Paschke

Beschreibung:  Prova (http://www.prova.ws) ist eine Java-basierte deklarative Regelmaschine, welche (verteilte) Objekt-orientierte Programmierung mit deklarativer Programmierung (Prolog) mischt. Basierend auf einer existierenden Lösung soll der Unifizierungalgorithmus zur Regelausführung dynamisch typisiert werden.