Algorithmic Bioinformatics

P Projektmanagement im Softwarebereich - SeqAn

(19588)

Type

Softwarepraktikum

Instructor

David Weese, Knut Reinert

Registration Mode

Die Praktikumsplätze werden über ein besonderes Anmeldeverfahren vergeben. Beachten Sie dazu die Hinweise auf der Webseite des Studienbüros zum Softwarepraktikum.

Time

Block 1:
01.04.
14-16
Arnimallee 6
R 017
Block 2:
12.-16.04.
10-16
Arnimallee 6
R 017

Block 3:

26.04.
1230-16
Arnimallee 6
R 017
SeqAn
Support
Mo.
1230-14
Arnimallee 6
R 017
Vorführung
14.06.
14-16
Arnimallee 6
R 017

(alle Zeiten sind s.t.)

Start

Apr 01, 2010 — Jun 14, 2010

Student Profile

In diesem Praktikum werden Algorithmen zur Sequenzanalyse implementiert, und zwar im Rahmen der Software-Bibliothek SeqAn, die zur Zeit in unserer Arbeitsgruppe entwickelt wird.

Diese Veranstaltung richtet sich an Studierende der Bioinformatik. Gute Kenntnisse in C/C++ werden vorausgesetzt.

 

Inhalt

In diesem Praktikum werden Algorithmen zur Sequenzanalyse implementiert, und zwar im Rahmen der Software-Bibliothek SeqAn, die zur Zeit in unserer Arbeitsgruppe entwickelt wird. Das Thema des diesjährigen Projektes bildet Second Generation Sequencing und die damit verbundenen algorithmischen Probleme. Benotet werden die Beiträge anhand eines schriftlichen Projektberichtes. Zum gleichen Modul gehört ein Begleitseminar, das von den Teilnehmern des Praktikums ebenfalls belegt werden muss.

 

Voraussetzungen: Gute Kennnisse in C/C++. Der Blockkurs "C++ für Fortgeschrittene" sei allen Teilnehmern dieses Softwarepraktikums dringend ans Herz gelegt.

 

Das Begleitseminar zum Projektmanagement im Softwarebereich Seqan ist wie folgt aufgebaut: Die Termine sind vorläufig und werden nach Raumreservierung auf der Veranstaltungswebseite aktualisiert.

  • Do. 01.04.2010: Block 1 vermittelt:
    • 14:00 - 14:30 Einführung in Second-Generation Sequencing und Anwendungen
    • 14:30 - 15:30 q-gram Lemma, q-gram basierte Filter, multishape Filter
    • 15:30 - 16:00 Kurzen Überblick über Seqan
  • Di. 06.04. - Fr. 09.04.2010: C++ Blockkurs (nicht vorgeschrieben aber sehr zu empfehlen für Teilnehmer die nicht in C++ bewandert sind).
  • Mo. 12.04. - Fr. 16.04.2010: Block 2 behandelt das SeqAn-Tutorial. Geplant sind Einheit 1 (sequences, files, searching), Einheit 2 (alignments, multiple alignments), Einheit 3 (indices), Einheit 4 (graphs), Einheit 5 (Aufgabenverteilung zum Praktikum).
  • Fr. 16.04. - Mo. 26.04.2010: Block 3 - Ausarbeitung und Präsentation (26.04.) des Projektplans (zählt für alte Studienordnung als Benotung für das Begleitseminar).
  • Mi. 26.04. - Mo. 08.06.2010: Block 4 - Programmieren und Dokumentieren der Module, Erstellen eines Abschlussberichtes. ACHTUNG: in der neuen Studienordnung ist diese Veranstaltung nicht gesondert zu betrachten. Die Prüfungsleistung wird durch den Abschlussbericht geleistet.
  • Mo. 07.06.2010, 12 Uhr: Ende der Programmierphase (SVN wird read-only) und Abgabe des Berichts (per Mail/SVN).
  • Mo. 14.06.2010: Präsentation der fertigen Teilprojekte. In einem kurzen Vortrag (10-20min) sollen die Ergebnisse der Teilprojekte einzeln vorgestellt werden. Bei stark zusammengehörenden Teilprojekten dürfen die Teilnehmer zusammen auch einen Vortrag halten.

 

Aufgabenverteilung (vorläufig):

  1. Threshold-Berechnung für beliebige Q-gram shapes | Anne-Marie Tumescheit
  2. Filter basierend auf dem Schubfachprinzip | Swantje Tielemann
  3. Filter basierend auf dem Zählen von Q-grammen | Anke Penzlin
  4. Match Verifikation und Ausgabe | Michal Krivan

 

Detailierte Informationen zu den Teilprojekten gibt es auf unserer Wiki-Seite PMSB_Seqan_2010.

 

Excercises:

  • Lesen Sie bis zum 12.04. die Abschnitte die unter PMSB_Seqan_2010->Grundlagen angegeben sind.

 

Files

 

Links

  • Vorlesung Fast Filtering Algorithms, P4 SS09
  • www.seqan.de: Homepage von SeqAn. Hier gibt es alle Informationen sowie aktuelle Snapshots der Bibliothek zum herunterladen.
  • SeqAn Dokumentation: Die Doku des letzten SeqAn Releases.
  • SeqAn Trac: System für Fehlerreports in SeqAn und direkter Einblick in den aktuellen Entwicklungsstand des Projekts. Hier könnt ihr Fehler melden, wenn ihr welche gefunden habt.
  • Fortgeschrittenes C++: Homepage zum Blockkurs vom 06.04 - 09.04.2009.
  • dddoc Doku: Dokumentation zum in SeqAn verwendeten Dokumentationssystem dddoc für generisches C++ Programmieren.