Softwarepraktikum Bioinformatik: Projekte 2018

Alles ausblendenAlles einblenden

DozentIn(en): S. Andreotti, Ch. Bielow

Maximale Teilnehmerzahl: 6

Zeitraum/Vorbesprechungstermin:

Ort: Institut für Informatik

Kurze inhaltliche Beschreibung:

In diesem Praktikum werden Algorithmen zur Analyse von Massenspektrometrie Daten implementiert, und zwar im Rahmen der Software-Bibliothek OpenMS, die zur Zeit in unserer Arbeitsgruppe entwickelt wird. Mithilfe der zu implementierenden Module werden komplexe Analyse-Pipelines für Proteom/Metabolom Daten in KNIME realisiert.

Quantitative Aufteilung (in %):

Praktische Programmierarbeit: 60%
Soft Skills: 40%

Verwendete Programmiersprache(n): C++

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren: 4*
B Biologie/Chemie: 1*
C Projektmanagement: 3*

Erforderliche Vorkenntnisse: gute Kenntnisse in C/C++

Kontaktadresse, Webseite/Link:

http://www.bsc.fu-berlin.de/TeachingAndWorkshops/SoSe18/Software_Praktikum_OpenMS/index.html


Direktlink

Titel: Algorithmen zur Analyse von von genomischen Sequenz-Daten (SeqAn)

Dozent(en): K. Reinert, H. Hauswedell

Maximale Teilnehmerzahl: 4

Zeitraum/Vorbesprechungstermin:

Ort: Institut für Informatik

Kurze inhaltliche Beschreibung:

Implementierung von Algorithmen für die Sequenzanalyse genomischer (Massen)daten & Erstellen kleinerer Analysepipelines mit Hilfe einer bestehenden C++-Bibliothek. Dabei sollen neben dem Programmieren auch Elemente des Software-Engineering eingeübt werden (Erstellen eines Zeitplanes, Benutzung von Programmierwerkzeugen, Erstellen von Tests,  Arbeiten im Team, etc.)

Quantitative Aufteilung:

Praktische Programmierarbeit: 60%
Soft Skills: 40%

Verwendete Programmiersprache(n): C++

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren:  *****
B Biologie/Chemie:  *
C Projektmanagement:  **

Unbedingt erforderliche Vorkenntnisse: C++

Kontaktadresse, Webseite:

Hannes Hauswedell

https://www.mi.fu-berlin.de/w/ABI/PMSB_Seqan_2017

Direktlink

Titel: Integrative analysis of next generation sequencing (NGS) data

Dozenten: Alena van Bömmel

Maximale Teilnehmerzahl: 9

Zeitraum/Vorbesprechungstermin: voraussichtlich 12.03.-23.04.2018 (kann noch um +- 1 Woche geändert werden)   

Ort: Max Planck Institute for Molecular Genetics, Ihnestr. 63-73, PC-Pool

Kurze inhaltliche Beschreibung:

One of the research questions in bioinformatics and regulatory genomics is to understand the principles of transcriptional regulation. Transcription factors are the main players of gene regulation. Another aspect accounts for the open chromatin which enables the binding of the transcription factors and the RNA Polymerase II. There are several experimental techniques which can determine the interaction of the regulatory proteins and the DNA, such as ChIP-seq. Combinatorical analysis of several experiments help us to understand the interplay of all these factors on regulatory elements in the genome. We will analyze ChIP-seq and RNA-seq data in various cell lines to model the TF binding and histone modifications across the genome with respect to gene expression of the neighbouring genes. Afterwards, we develop a statistical method to combine these data in an appropriate way. We will use both implemented tools and our own scripts to obtain suitable results. Students will work in groups of 3 and present their work at the end of the seminar.

Quantitative Aufteilung:

Praktische Programmierarbeit:  60 %
Soft Skills: 40 %

Verwendete Programmiersprache(n): R, Python, Shell scripts

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

Programmieren ****
Biologie/Chemie **
Projektmanagement **

Unbedingt erforderliche Vorkenntnisse: Statistische Grundlagen

Kontaktadresse, Webseite:

https://www.molgen.mpg.de/3717844/FunctionalGenomics2017
alena.vanboemmel@molgen.mpg.de

Direktlink

Titel: Entwicklung einer Webapplikation zur Analyse von Genexpressionsprofilen

Dozenten: Marc Bonin, Sascha Johannes, Pascal Schendel, PD Dr. med. Thomas Häupl

Maximale Teilnehmerzahl: 8

Zeitraum/Vorbesprechungstermin: 1. Märzwoche

Ort: Charité - Universitätsmedizin Berlin, AG Häupl / AG Bioinformatik, Virchowweg 11, 10117 Berlin

Kurze inhaltliche Beschreibung:

  • Einarbeitung in die theoretischen Grundlagen über DNA-Microarrays (Herstellung, Hybridisierung & Auswertung)
  • Einführung in das Software-Paket "R" zur Analyse von Microarraydaten (Affymetrix & Illumina)
  • Entwicklung / Optimierung eines "R"-Skripts zur automatischen Qualitätsanalyse von Microarraydaten (Chipinformationen, Scanbild, Histogramme, Intensitäten, Qualitätskontrolle, Normalisierung, ...)
  • Entwicklung einer Webapplikation zur Qualitätsanalyse von Microarraydaten (PHP, JavaScript)
  • Github, SVN (Eclipse) 

Quantitative Aufteilung:

Praktische Programmierarbeit:  60 %
Soft Skills: 40 %

Verwendete Programmiersprache(n): PHP, Java, JavaScript, R

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

Programmieren ****
Biologie/Chemie **
Projektmanagement **

Unbedingt erforderliche Vorkenntnisse: Kenntnisse in PHP, Java & R

Kontaktadresse, Webseite:

marc.bonin@charite.de

http://www.charite-bioinformatik.de

Direktlink

Themen (Titel):

  • Modelling Pharmacokinetics of approved drugs
  • Big data approach to predict chemical toxicity
  • Combined similarity landscape approach to reveal new functions and/or off-target effects

DozentIn(en): Preißner, Banerjee

Maximale Teilnehmerzahl: 12

Zeitraum/Vorbesprechungstermin:

Ort:

Kurze inhaltliche Beschreibung:

Webseite, s.u.

Quantitative Aufteilung: (in %)

Praktische Programmierarbeit:
Soft Skills:

Verwendete Programmiersprache(n):

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren
B Biologie/Chemie
C Projektmanagement

Erforderliche Vorkenntnisse:

Kontaktadresse, Webseite/Link:

Priyanka Banerjee

http://bioinf-apache.charite.de/main/content/software.php



Direktlink

Titel: Plattform für Ligand-basierte Toxizitätsvorhersagen

DozentIn(en): A. Volkamer

Maximale Teilnehmerzahl: 4

Zeitraum/Vorbesprechungstermin:

Ort: Charité Mitte

Kurze inhaltliche Beschreibung:

Die Computergestützte Vorhersage des Risikopotentials von neuen Molekülen ist eine wichtige Aufgabe, u.a. im Zusammenhang mit der Reduzierung von Tierversuchen (http://www.bb3r.de/). Im Vorjahr haben wir mit einer Gruppe bereits Python Skripte erstellt, die Toxizitätsvorhersagen mit Hilfe von Machine Learning und Ähnlichkeitssuche erlauben und einen Prototyp eines Webservers erstellt.

Im diesjährigen Projekt wollen wir die Skripte erweitern und neue maschinelle Lernverfahren, mehr molekulare Deskriptoren, sowie weitere Datensätze einbinden. Neben der Auswertung der neuen Methoden, soll besonders auch die Funktionalität des Webservers erweitert werden, sowie die Usability.

Ziel ist es diesen Webserver online zur Verfügung zu stellen, um damit anderen Wissenschaftlern zu erlauben, die Toxizität ihrer Moleküle abzuschätzen. Eine anschließende Veröffentlichung der Methoden ist wünschenswert.

Quantitative Aufteilung: (in %)

Praktische Programmierarbeit: 60%
Soft Skills: 40%

Verwendete Programmiersprache(n): Python (scikit-learn, RDKit), Webserver (django, json, jquery, …)

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren ****
B Biologie/Chemie *
C Projektmanagement **

Erforderliche Vorkenntnisse: Grundkenntnisse in Python Programmierung, wünschenswert wäre wenn ein Gruppenmitglieder Vorkenntnisse in Webprogrammierung hätte

Kontaktadresse, Webseite/Link:

Mehr Informationen zur wissenschaftlichen Ausrichtung der Gruppe finden Sie unter
https://physiologie-ccm.charite.de/forschung_am_institut/ag_volkamer/

Direktlink

DozentIn(en): Sandro Andreotti

Maximale Teilnehmerzahl: 6

Zeitraum/Vorbesprechungstermin:

Ort:

Kurze inhaltliche Beschreibung:

In diesem Praktikum werden Workflows für die Analyse von biologischen Daten konzeptioniert und implementiert. Die Teilnehmer werden dabei verschiedene Workflowsysteme (KNIME, Galaxy, Snakemake) kennenlernen und verwenden. Die Teilnehmer werden dabei anhand aktueller Literatur ihre Workflows eigenständig erarbeiten, testen und verfeinern. Dabei werden sowohl Kenntnisse im Rahmen der Workflow Programmierung als auch ein umfangreiches Wissen über existierende Bioinformatik-Software erlangt.

Quantitative Aufteilung: (in %)

Praktische Programmierarbeit: 50%
Soft Skills: 50%

Verwendete Programmiersprache(n):

R, Python oder andere Skriptsprache

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren ****
B Biologie/Chemie *
C Projektmanagement ***

Erforderliche Vorkenntnisse: R

Kontaktadresse, Webseite/Link:

http://www.bsc.fu-berlin.de/TeachingAndWorkshops/SoSe18/Software_Praktikum_Workflows/index.html

Direktlink

Allgemeine Infos zum Softwarepraktikum (Projektmanagement im Softwarebereich)