Springe direkt zu Inhalt

Softwarepraktikum Bioinformatik: Projekte 2022

DozentIn(en): Ch. Bielow

Maximale Teilnehmerzahl: 10

Zeitraum/Vorbesprechungstermin: s. Link unten

Vorstellung des Projekts: 21.01.2022 um 9:30 Uhr (Webexmeeting)
https://fu-berlin.webex.com/fu-berlin-en/j.php?MTID=md4b3cf1887a7d28e4e2bb8c50a5b9f2d

Ort: Institut für Informatik

Kurze inhaltliche Beschreibung:

In diesem Praktikum werden wir am Beispiel unserer open-source Bibliothek OpenMS (www.openms.de) realitaetsnah ein C++ Programmierprojekt bearbeiten und dabei Algorithmen, Datenstrukturen und evtl. grafische Benutzerinterfaces reimplementieren oder neu entwicklen.

Dabei werden wir Tools zur Entwicklung, Debugging, Performance-Profiling, Source-Code Management im Team und Continuous-Integration kennen lernen.

OpenMS ist eine der meistverwendeten Softwarebibliotheken zur Analyse von Massenspektrometriedaten und besitzt eine sehr umfaengliche Sammlung an schnellen und effizienten Algorithmen. OpenMS wird staendig weiterentwicklet und auch kommerziell genutzt.

Quantitative Aufteilung (in %):

Praktische Programmierarbeit: 60%
Soft Skills: 40%

Verwendete Programmiersprache(n): C++

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren: 4*
B Biologie/Chemie: 1*
C Projektmanagement: 3*

Erforderliche Vorkenntnisse: gute Kenntnisse in C++

Kontaktadresse, Webseite/Link:

https://www.bsc.fu-berlin.de/TeachingAndWorkshops/SoSe22/Software_Praktikum_OpenMS/index.html

Präsentation:

s. Link oben


DozentIn(en): Sandro Andreotti

Maximale Teilnehmerzahl: 8

Zeitraum/Vorbesprechungstermin: Nach Absprache

Vorstellung des Projekts: 21.01.2022 um 9:30 Uhr (Webexmeeting)
https://fu-berlin.webex.com/fu-berlin-en/j.php?MTID=md4b3cf1887a7d28e4e2bb8c50a5b9f2d

Ort: tba

Kurze inhaltliche Beschreibung:

In diesem Praktikum werden Workflows für die Analyse von Next Generation Sequencing (NGS) Daten konzeptioniert und implementiert. Die Teilnehmer werden komplexe professionelle Datenanalysepipelines für aktuelle Forschungsprojekte in unserer Gruppe entwickeln. Dabei werden sie verschiedene Workflowsysteme (z.B. KNIME, Snakemake) kennenlernen und verwenden. Die Teilnehmer werden anhand aktueller Literatur ihre Workflows eigenständig erarbeiten, testen und verfeinern. Neben der Workflow-Programmierung erlangen die Teilnehmer ein umfangreiches Wissen über existierende Bioinformatik-Software im Bereich NGS.

Quantitative Aufteilung: (in %)

Praktische Programmierarbeit: 50%
Soft Skills: 50%

Verwendete Programmiersprache(n):

R, Python oder andere Skriptsprache

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren ****
B Biologie/Chemie *
C Projektmanagement ***

Erforderliche Vorkenntnisse: R, Python

Kontaktadresse, Webseite/Link:

https://www.bsc.fu-berlin.de/TeachingAndWorkshops/SoSe22/Software_Praktikum_Workflows/index.html

Sandro Andreotti

Titel: Analysis of single-cell RNA sequencing data

Dozenten: Florian Klimm, Robert Schöpflin

Maximale Teilnehmerzahl: 9

Zeitraum/Vorbesprechungstermin: tba

Ort: Max Planck Institute for Molecular Genetics, Ihnestr. 63-73, PC-Pool

Kurze inhaltliche Beschreibung:

Gene expression is the process by which a cell produces proteins from the genetic information of the DNA. While all cells in a body have (almost) identical DNA, the gene expression varies between cells. One of the research aims in bioinformatics is to understand this heterogeneity of cells inside the tissue of an organism. Single-cell transcriptomics is a novel technique that allows the measurement of gene expression for individual cells. These measurements allow us to identify novel cell types or developmental trajectories which describe how cells of one type become another.
In our course, we will cover the whole bioinformatical pipeline for single-cell transcriptomics, including, data retrieval, quality control, read processing, and gene-expression matrix construction and analysis. For this, we will use state-of-the-art tools, such as STAR, Seurat, and scanpy. Proficiency in programming languages, such as shell scripts, R and Python is advantageous.  For the advanced data analysis, the students will work with a wide range of data-analysis techniques, for example, modularity-based clustering algorithms, dimensionality-reduction techniques (PCA, t-SNE, and UMAP), differential expression identification, gene-ontology enrichment, trajectory analysis, and network inference. Students will work in groups of 3 and present their work at the end of the seminar.

Quantitative Aufteilung:

Praktische Programmierarbeit:  ca. x %
Soft Skills: ca. x %

Verwendete Programmiersprache(n):

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

Programmieren ****
Biologie/Chemie **
Projektmanagement **

Unbedingt erforderliche Vorkenntnisse: Statistische Grundlagen, Modul "Algorithmische Bioinformatik"

Kontaktadresse, Webseite:

klimm@molgen.mpg.de

schoepfl@molgen.mpg.de

Präsentation:

Thema: AI for Health

DozentIn(en): Prof. Roland Eils, Julius Upmeier zu Belzen, Thore Buergel

Maximale Teilnehmerzahl: 4

Zeitraum/Vorbesprechungstermin: nach Absprache

Ort: Digital (A), BIH, Kapelle-Ufer 2 (B)

Kurze inhaltliche Beschreibung:

Project: Machine Learning in Medicine: from idea to tool

  • Learn the fundamentals of developing, training and testing deep learning models in the medical domain
  • Learn about relevant metrics for evaluation and benchmarking and potential biases to watch out for
  • Work on integrating the developed and evaluated models into usable (web) tool

Quantitative Aufteilung: (in %)

Praktische Programmierarbeit: 75%
Soft Skills: 25%

Verwendete Programmiersprache(n): Python (>90%), maybe some javascript for web app

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren ****
B Biologie/Chemie *
C Projektmanagement ***

Erforderliche Vorkenntnisse:

  • Experience with the Python programming language
  • Fundamental understanding of “What is machine learning"
  • Preferably prior experience with PyTorch or other DL-Libraries
  • Understanding of neural networks and preferably experience with deep learning

Kontaktadresse, Webseite/Link:

Thore Buergel
Julius Upmeier zu Belzen
https://www.hidih.org/research/ailslab 

Titel: Bioinformatische Aufklärung monogener Krankheiten

Themen:

1. Recurrent Convolutional Neural Network in Genetics

2. Weiterentwicklung einer Anwendung zur Analyse von DNA-Bindungsstellen

DozentIn(en): Dominik Seelow, Robin Steinhaus, Sebastian Proft

Maximale Teilnehmerzahl: 5

Informationstermin (online):

Mittwoch, 26.01.2022 um 17:00 Uhr (Link: https://join.skype.com/Ky5sQ0xLfEmX).

Ort: Charité/BIH - Bioinformatics & Translational Genetics, Invalidenstr. 97

Themen und weitere Infos:

https://www.genecascade.org/SWP_2022.html


Zusätzlich zu den hier aufgelisteten Softwareprojekten gibt es die Möglichkeit, das Softwareprojekt Datenverwaltung aus der Informatik der Arbeitsgruppe Datenbanken und Informationssysteme zu wählen und sich anerkennen zu lassen.
LV.-Nr.: 19308412, Anrechnung zum Wintersemester 2021/2022. Bei Fragen wenden Sie sich an Muhammed-Ugur Karagülle.

Bitte beachten: Bitte geben Sie trotzdem Ihre Präferenzen in Whiteboard an, die Verteilung der Plätze wird zentral geregelt.

DozentIn(en): Muhammed-Ugur Karagülle

Maximale Teilnehmerzahl: nicht festgelegt

Zeitraum/Vorbesprechungstermin: 28.02. - 01.04.2022 (Erhebungszeitraum), Umsetzung bis 02.05.2022

Kurze inhaltliche Beschreibung:

Im Rahmen des Softwareprojekts Datenverwaltung wird die Plattform „SearchCite“ entwickelt, die für wissenschaftliches Personal Arbeitsprozesse vereinfachen soll. Ein erster Prototyp wurde bereits im Laufe des aktuellen Semesters entwickelt und soll für die Bereiche Bioinformatik, Biologie und Chemie verbessert werden. Entwickelt werden die Prototypen als Mockups mit Hilfe eines benutzerzentrierten Designansatzes (UCD).

Die Veranstaltung beginnt mit einer Einführungsveranstaltung zu benutzerzentriertem Design und geht danach in die Projektarbeit der Studierenden mit regelmäßigen Feedbackrunden über. Der Projektzeitraum ist vom 28.02.2022 bis zum 01.04.2022. Wir freuen uns auf eure Teilnahme und Expertise.

Quantitative Aufteilung: (in %)

Praktische Programmierarbeit: 50%
Soft Skills: 50%

Verwendete Programmiersprache(n): Mockup-Tool Figma

Schwierigkeitsgrad (Acht Sterne verteilt auf drei Bereiche):

A Programmieren **
B Biologie/Chemie **
C Projektmanagement ****

Erforderliche Vorkenntnisse: keine

Kontaktadresse, Webseite/Link:

m.u.k@fu-berlin.de (Betreff-Präfix: SWP)
KVV/Whiteboard https://mycampus.imp.fu-berlin.de/x/KXXmhK

Allgemeine Infos zum Softwarepraktikum (Projektmanagement im Softwarebereich)

eVV