Algorithmic Bioinformatics

Kerstin Neubert

Detektion von Copy Number Variationen in Sequenzierdaten

Academic Advisor: Anne-Katrin Emde , Knut Reinert
Discipline: Bioinformatik
Degree: Master of Science (M.Sc.)
Degree: Oct 09, 2010
Project:
Status: finished

Abstract

In der Masterarbeit soll eine Methode zur Detektion von Copy number variations (CNVs) in Second Generation Sequencing Daten implementiert werden. Der entwickelte Algorithmus wird anschließend auf simulierte und reale Sequenzierdaten von einem Tumorgenom und Daten aus dem 1000 Genomes Projekt angewendet.

Contents

 

Beschreibung:

Second-generation sequencing Technologien ermöglichen es, die Positionen von single nucleotide polymorphisms (SNPs) und strukturellen Variationen wie z.B. copy number variations (CNVs) im Genom mit einer größeren Genauigkeit im Vergleich zu arraybasierten Methoden wie z.B. SNP-Microarrays und der whole-genome array comparative genome hybridization (aCGH) zu bestimmen. Jedoch erfordert die Analyse der dabei anfallenden großen Datenmengen neue effiziente Algorithmen. In dieser Arbeit soll ein Algorithmus für die Analyse von CNVs in second-generation sequencing Daten entwickelt und in C++ implementiert werden. Dabei werden folgende Teilaufgaben bearbeitet:
  1. Entwicklung und Implementierung eines Algorithmus zur Detektion von CNVs in 2nd-generation sequencing Daten. Fragestellungen tun sich auf bezüglich der Wahl der Fensterbreite (dynamisch/statisch) und hinsichtlich der unterschiedlich guten "Sequenzierbarkeit" sowie "Mappbarkeit" von bestimmten Sequenzen.
  2. Bestimmung der Spezifität und Sensitivität des entwickelten Algorithmus anhand simulierter Daten, bei denen die Position von CNVs bekannt ist
  3. Anwendung des Algorithmus zur Detektion von CNVs in verschiedenen 2nd-generation sequencing Daten (ein Tumorgenom und Daten aus dem 1000 Genomes Projekt)
  4. Bewertung des Algorithmus (Laufzeit, Vergleich mit anderen Algorithmen)

 

Literatur:

[1] Paul Medvedev, Monica Stanciu, and Michael Brudno: Computational methods for discovering structural variation with next-generation sequencing. Nature Methods 2009

[2] Seungtai Yoon, Zhenyu Xuan, Vladimir Makarov, Kenny Ye, and Jonathan Sebat: Sensitive and accurate detection of copy number variants using read depth of coverage. Genome Research 2009

[3] Korbel et. al.: Paired-end Mapping Reveals Extensive Structural Variation in the Human Genome. Science 2007

 

 Arbeitsplan:

 Wöchentliche Berichte:

Downloads