Softwarepraktikum Bioinformatik: Projekte 2017

Alles ausblendenAlles einblenden

DozentIn(en): S. Andreotti, Ch. Bielow

Maximale Teilnehmerzahl: 6

Zeitraum/Vorbesprechungstermin:

Ort: Institut für Informatik

Kurze inhaltliche Beschreibung:

In diesem Praktikum werden Algorithmen zur Analyse von Massenspektrometrie Daten implementiert, und zwar im Rahmen der Software-Bibliothek OpenMS, die zur Zeit in unserer Arbeitsgruppe entwickelt wird. Mithilfe der zu implementierenden Module werden komplexe Analyse-Pipelines für Proteom/Metabolom Daten in KNIME realisiert.

Quantitative Aufteilung (in %):

Praktische Programmierarbeit: 60%
Soft Skills: 40%

Verwendete Programmiersprache(n): C++

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren: 4*
B Biologie/Chemie: 1*
C Projektmanagement: 3*

Erforderliche Vorkenntnisse: gute Kenntnisse in C/C++

Kontaktadresse, evtl. Webseite/Link:

http://www.mi.fu-berlin.de/en/inf/groups/bsc/teaching/SoSe17/Software_Praktikum_OpenMS/index.html

Direktlink

Titel: Algorithmen zur Analyse von von genomischen Sequenz-Daten (SeqAn)

Dozent(en): K. Reinert, H. Hauswedell

Maximale Teilnehmerzahl: 4

Zeitraum/Vorbesprechungstermin:

Ort: Institut für Informatik

Kurze inhaltliche Beschreibung:

Implementierung von Algorithmen für die Sequenzanalyse genomischer (Massen)daten & Erstellen kleinerer Analysepipelines mit Hilfe einer bestehenden C++-Bibliothek. Dabei sollen neben dem Programmieren auch Elemente des Software-Engineering eingeübt werden (Erstellen eines Zeitplanes, Benutzung von Programmierwerkzeugen, Erstellen von Tests,  Arbeiten im Team, etc.)

Quantitative Aufteilung:

Praktische Programmierarbeit: 60%
Soft Skills: 40%

Verwendete Programmiersprache(n): C++

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren:  *****
B Biologie/Chemie:  *
C Projektmanagement:  **

Unbedingt erforderliche Vorkenntnisse: C++

Kontaktadresse, evtl. Webseite:

Hannes Hauswedell

https://www.mi.fu-berlin.de/w/ABI/PMSB_Seqan_2017

Direktlink

Titel: Analyse genregulatorischer Netzwerke

DozentInn(en): A. Bockmayr, L. Sun

Maximale Teilnehmerzahl: 8

Zeitraum/Vorbesprechungstermin: n.V. ab Februar 2017

Ort: n.V.

Kurze inhaltliche Beschreibung:

In der Systembiologie wird unter anderem betrachtet, wie die bei der Genexpression gebildeten Proteine wieder auf die Gene zurückwirken und deren Expression unterdrücken oder aktivieren können. Um diese Gen-Protein-Interaktionen zu beschreiben, werden regulatorische Netzwerke benutzt. Eine rechnergestützte Analyse solcher Netzwerke kann dabei helfen, die Auswirkung dieser gegenseitigen Beeinflussungen besser zu verstehen.

Mit einer geeigneten Diskretisierung kann man endliche Graphen konstruieren, die die Struktur und Dynamik des Systems qualitativ beschreiben. Ziel dieses Projekts ist es, verschiedene Tools zur Visualisierung und Analyse dieser Graphen zu entwickeln. Die Basis hierfür bilden Algorithmen aus der Graphentheorie.

Quantitative Aufteilung:

Praktische Programmierarbeit:  60%
Soft Skills: 40%

Verwendete Programmiersprache(n): MATLAB, evtl. Python

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren: 3-5*
B Biologie/Chemie: 2*
C Projektmanagement: 2*

Unbedingt erforderliche Vorkenntnisse: gute Programmierkenntnisse, Grundbegriffe der Graphentheorie, Englischkenntnisse

Kontaktadresse, evtl. Webseite:

http://www.mi.fu-berlin.de/w/AgMathLife/SoftWareProjectSS17

Präsentation am 27.01.2017

Direktlink

Titel: Verteiltes Rechnen und Parallelprogrammierung

Dozenten: Tim Conrad

Maximale Teilnehmerzahl: 5

Zeitraum/Vorbesprechungstermin: noch nicht bekannt

Ort: Bioinformatik PC-Pool (Arnimallee 6 (Pi-Gebäude), Raum 017)

Kurze inhaltliche Beschreibung:

In diesem Praktikum werden die Techniken des verteilten Rechnens im GRID und der Parallelprogrammierung eingeführt und in Projekten angewandt.

In vielen Bereichen der Bioinformatik (und auch anderen angewandten Lebenswissenschaften) stoßen herkömmliche Algorithmen an Ihre Grenzen, wenn die zu verarbeitende Datenmenge eine gewisse Größe erreicht. Dies ist sehr oft der Fall, wenn die Daten moderner biologischer Experimente analysiert werden sollen, deren Größe sich über die letzten Jahre vervielfacht haben.

Ein oft benutzter Ausweg ist das Aufteilen der Datensätze in mehrere kleine Pakete, die dann auf verschiedenen Rechnern getrennt berechnet werden - solche Rechnernetze werden oft als Cluster oder Grid bezeichnet. Die Ergebnisse fügt man dann in einem abschließenden Schritt wieder zu einem Gesamtergebnis zusammen. Lässt sich das Ursprungsproblem nicht in unabhängige Teilprobleme aufteilen, kommen meisten Multiprozessorsysteme zum Einsatz, bei denen Techniken der Parallelprogrammierung zum Einsatz kommen.

Anhand vorhandener (open-source) Softwareframeworks und vorhandener Hardware (PC-Cluster mit 30x8 Kernen + weitere ca. 50 Grid Knoten, Sonys Playstation 3 mit Cell/BE Prozessor, Grafikkarte mit 128 Kernen) sollen Algorithmen aus der BioInformatik ausgesucht und für das Zielsystem (Grid oder Multiprozessorsystem) programmiert werden.

Das Praktikum ist so gestaltet, dass es bis Ende Mai abgeschlossen werden kann, damit die Teilnehmer noch ausreichend Zeit für die Anfertigung ihrer Bachelorarbeit haben.

Das Begleitseminar findet als Blockkurs statt und muss von allen Teilnehmern des Praktikums belegt werden.

Diese Veranstaltung richtet sich an Bachelor oder Master Studierende der Bioinformatik.

Die Projekte können als Bachelor- oder Masterarbeiten weitergeführt werden.

Quantitative Aufteilung:

Praktische Programmierarbeit:  70 %
Soft Skills: 30 %

Verwendete Programmiersprache(n): Im ersten Teil (Übungszettel) Java und C/C++, im zweiten Teil frei wählbar.

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

Programmieren ****
Biologie/Chemie *
Projektmanagement ***

Unbedingt erforderliche Vorkenntnisse: Gute Kenntnisse in Java oder C/C++

Kontaktadresse, evtl. Webseite:

Tim Conrad

http://www.msproteomics.net

Direktlink

Titel: Functional Genomics with R

Dozenten: Alena van Bömmel

Maximale Teilnehmerzahl: 9

Zeitraum/Vorbesprechungstermin: voraussichtlich 14.3.-28.4.2017

Ort: Max Planck Institute for Molecular Genetics, Ihnestr. 63-73, PC-Pool

Kurze inhaltliche Beschreibung:

One of the research questions in bioinformatics and regulatory genomics is to determine the target genes which are regulated by a specific transcription factor(TF) in studied cell line or tissue. There are number of genome-wide experiments such as ChIP-seq, RNA-seq, expression microarray or in silico TF binding prediction combined with DNase-seq that can be conducted to answer this question. In this course we will analyze these types of data and develop a statistical method to combine them in an appropriate way. We will use both implemented tools and our own scripts to obtain suitable results. Students will work in groups of 3 and present their work at the end of the seminar.

Quantitative Aufteilung:

Praktische Programmierarbeit:  60 %
Soft Skills: 40 %

Verwendete Programmiersprache(n): R, Python, Shell scripts

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

Programmieren ****
Biologie/Chemie **
Projektmanagement **

Unbedingt erforderliche Vorkenntnisse: Statistische Grundlagen

Kontaktadresse, evtl. Webseite:

https://www.molgen.mpg.de/3717844/FunctionalGenomics2017
alena.vanboemmel@molgen.mpg.de

Direktlink

Titel: Entwicklung einer Webapplikation zur Analyse von Genexpressionsprofilen

Dozenten: Marc Bonin, Sascha Johannes, PD Dr. med. Thomas Häupl

Maximale Teilnehmerzahl: 8

Zeitraum/Vorbesprechungstermin: 1. Märzwoche

Ort: Charité - Universitätsmedizin Berlin, AG Häupl / AG Bioinformatik, Virchowweg 11, 10117 Berlin

Kurze inhaltliche Beschreibung:

  • Einarbeitung in die theoretischen Grundlagen über DNA-Microarrays (Herstellung, Hybridisierung & Auswertung)
  • Einführung in das Software-Paket "R" zur Analyse von Microarraydaten (Affymetrix & Illumina)
  • Entwicklung / Optimierung eines "R"-Skripts zur automatischen Qualitätsanalyse von Microarraydaten (Chipinformationen, Scanbild, Histogramme, Intensitäten, Qualitätskontrolle, Normalisierung, ...)
  • Entwicklung einer Webapplikation zur Qualitätsanalyse von Microarraydaten (PHP, JavaScript)
  • Github, SVN (Eclipse) 

Quantitative Aufteilung:

Praktische Programmierarbeit:  60 %
Soft Skills: 40 %

Verwendete Programmiersprache(n): Java, Java Script, R

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

Programmieren ****
Biologie/Chemie **
Projektmanagement **

Unbedingt erforderliche Vorkenntnisse: Kenntnisse in PHP, Java & R

Kontaktadresse, evtl. Webseite:

marc.bonin@charite.de

Präsentation: (konnte krankheitsbedingt nicht gehalten werden)

http://www.charite-bioinformatik.de/downloads/softwarepraktikum_2017.pdf

Direktlink

Themen (Titel):

  • Modelling Pharmacokinetics of approved drugs
  • Big data approach to predict chemical toxicity
  • Combined similarity landscape approach to reveal new functions and/or off-target effects

DozentIn(en): Preißner, Banerjee

Maximale Teilnehmerzahl: 12

Zeitraum/Vorbesprechungstermin:

Ort:

Kurze inhaltliche Beschreibung:

Webseite, s.u.

Quantitative Aufteilung: (in %)

Praktische Programmierarbeit:
Soft Skills:

Verwendete Programmiersprache(n):

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren
B Biologie/Chemie
C Projektmanagement

Erforderliche Vorkenntnisse:

Kontaktadresse, evtl. Webseite/Link:

Priyanka Banerjee

http://bioinf-apache.charite.de/main/content/software.php



Direktlink

Titel: Plattform für Ligand-basierte Toxizitätsvorhersagen

DozentIn(en): A. Volkamer

Maximale Teilnehmerzahl: 4

Zeitraum/Vorbesprechungstermin:

Ort:

Kurze inhaltliche Beschreibung:

Die Computergestützte Vorhersage des Risikopotentials von neuen Molekülen ist eine wichtige Aufgabe, u.a. im Zusammenhang mit der Reduzierung von Tierversuchen (http://www.bb3r.de/). Daher werden wir mit Hilfe von Python Skripten Machine Learning Modelle aufbauen um Toxizitätsvorhersagen zu machen. Dazu werden Toxizitätsdaten von frei verfügbaren Quellen gesammelt. Diese Test- und Trainingsdaten zusammen mit verschiedenen molekularen Deskriptoren stellen die Basis für unsere Toxizitätsvorhersage dar. Neben genauer Evaluierung der Modelle, wird an einer neuen Methode gearbeitet um molekulare Eigenschaften zu extrahieren, die für toxische Effekte verantwortlich sind.

Die Ergebnisse sollen als Webserver zur Verfügung gestellt werden, um damit anderen Wissenschaftlern zu erlauben, die Toxizität ihrer Moleküle abzuschätzen. Eine anschließende Veröffentlichung der Methoden ist wünschenswert.

Quantitative Aufteilung: (in %)

Praktische Programmierarbeit:
Soft Skills:

Verwendete Programmiersprache(n): Python (scikit-learn, RDKit), Webserver (django, json, jquery, …)

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren
B Biologie/Chemie
C Projektmanagement

Erforderliche Vorkenntnisse:

Kontaktadresse, evtl. Webseite/Link:

Mehr Informationen zur wissenschaftlichen Ausrichtung der Gruppe finden Sie unter
https://physiologie-cbf.charite.de/institut/arbeitsgruppen/ag_volkamer/

Präsentation am 27.01.2017:
https://physiologie-cbf.charite.de/en/institute/workgroups/team_volkamer/teaching/

Direktlink

Allgemeine Infos zum Softwarepraktikum (Projektmanagement im Softwarebereich)