You are here: ABI » LectureWiki » PMSB_Seqan_2012 » RnaSeqMSplazers

PISB SeqAn - Projekt RNA-Seq: Mapping von RNA reads mit MSplazer

Hintergrund: Mapping von RNA reads

Im Gegensatz zum Whole Genome Sequencing, wo ein kompletter DNA-Datensatz sequenziert wird, werden bei RNA-Seq Experimenten nur Transkriptomdaten betrachtet. Das Transkriptom enthält hauptsächlich Sequenzinformationen aus den Genbereichen, also den Exons, der DNA. Read mapping von RNA reads gestaltet sich daher schwieriger: Mapped man RNA reads gegen ein bekanntes Transkriptom, kann man die Daten nur gegen diesen bestimmten Zustand testen. Abweichungen von diesem Transkriptom und insbesondere neue Transkripte sind so schwer oder gar nicht detektierbar. Mapped man RNA reads gegen das Genom, muss man die fehlenden Intronbereiche beachten. Insbesondere reads, die mehrere Exons enhalten und damit über Exon-Intron-Grenzen hinweggehen, sind mit den Standard Read Mappern schwer zu mappen. Eine Möglichkeit dieses Problem zu lösen, ist nach lokalen Matches der reads zu suchen. Die richtigen Treffer müssen dann gefunden und kombiniert werden.

Aufgaben

Ziel dieses Projektes ist es, RNA-Seq reads mit Hilfe von MSplazer aus der C++-Bibliothek SeqAn korrekt zu mappen. MSplazer findet strukturelle Variationen wie Deletions, Insertions etc. in DNA-Daten. Es benutzt dafür SeqAns Stellar um lokale Matches zu finden, und baut dann einen Graphen über die Matches auf. Kompatible Matches werden in dem Graphen verbunden und die beste Kombination mit Hilfe von Shortest-Path Algorithmen gefunden. Aufgabe ist es, MSplazer auf RNA reads anzuwenden bzw. anzupassen. Der Code sollte folgende Funktionalitäten haben:
  1. Einlesen von Genomsequenzen und echten oder simulierten RNA reads in FASTA Format
  2. Aufruf der entsprechenden Funktionen aus MSplazer
  3. Ausgabe des besten Chains und Vergleich mit korrekten Ergebnissen (z.B. von euren simulierten Sequenzen)

Inhaltlich sollen dabei MSplazers Parameter für RNA reads getestet und angepasst werden (optional: Funktionsaufrufe auf RNA reads spezialisieren und erweitern).

Referenzen

[1] Kehr, B. and Weese, D. and Reinert, K., STELLAR: fast and exact local alignments, BMC Bioinformatics, 2011
[2] Cole Trapnell, Lior Pachter and Steven L. Salzberg, TopHat: discovering splice junctions with RNA-Seq, BMC Bioinformatics, 2009
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback