You are here: ABI » ThesesHome » Flexbar

Flexbar

Flexbar (flexible barcode and adapter removal) ist eine Software für das Postprocessing von Next-Generation Sequencing Reads. Sie Umfasst die Funktionen Barcode Demultiplexing, Adapter Removal, sowie low-quality Trimming. Im Rahmen dieses Themas wird ein in SeqAn vorliegendes Tool in Anlehnung an die original Software erweitert und modifiziert, um die Funktionalität von Flexbar zu erreichen. Des Weiteren wird eine Integration in KNIME vorgenommen und eine statistische Auswertung diverser Pipeline Läufe vorgenommen.

Zeitplan

- Integration in KNIME und Erstellung einer Mini-Pipeline inkl. Auswertung (1 Woche)

- Parallelisierung des Barcode Demultiplexings (1 Woche)

- Änderung des approximativen Barcode Matchings für indexbasierte Suche (1 Woche)

- Ergänzung weiterer Flexbar Funktionalitäten, Code Review, Dokumentation (1-2 Wochen)

- Aufschrieb (2-3 Wochen)

References

Flexbar: http://sourceforge.net/projects/flexbar/

KNIME: http://www.knime.org/

Fortschritt

Woche 1:

- Integration in KNIME noch nicht abschließbar, da Unterstützung Seitens KNIME noch in Arbeit. Notwendige Einstellungen im Parser jedoch abgeschlossen und Programm somit integrierbar, sobal KNIME dazu bereit ist.

- Parallelisierung in größten Teilen abgeschlossen, Verwaltungsoverhead jedoch noch bei weitem zu groß. Weitere Änderungen notwendig.

- Alle Änderungen für Approximative Suche vorgenommen und getestet: Laufzeit verbessert.

- Kleinere Änderungen Vorgenommen, um Laufzeit noch etwas zu verbessern.

- Zu erstellen Statistiken geplant.

- Flexbarfunktionalitäten, welche evtl. ergänzt werden können, ermittelt.

Woche 2:

- Parallelisierung auf tatsächliche Suchfunktion erweitert. Zeitgewinn bei Einsatz mehrerer Threads vorhanden, jedoch weniger Laufzeitgewinn als erwartet

- Alle Funktionen und Tetst für spätere Kompatibilität mit CUDA auf seqan::String anstelle von std::vector umgestsellt.

- Beginn der Umstellung der Kommentierung/Dokumentation von DoxyGen auf dddoc.

Woche 3:

- Dokumentation komplett auf dddoc umgestellt.

- Alle Dateien an Sequan Style Guide Angepasst

Woche 4:

- Funktion für Umgang mit N's in Sequenzen hinzugefügt (inkl. Tests)

Woche 5:

- Funktion für Umgang mit N's in Sequenzen in Hauptprogramm integriert

- Statistische Unterstützung obiger Funktion gewährleistet

- Funktion für Trimming der Sequenzen vor Prozessierung implementiert, integriert

- Funktion für Trimming der Sequenzen nach Prozessierung implementiert, integriert

- Funktion für Tagging von Sequenzen, welche getrimmt wurden und/oder deren Adapter entfernt wurde, implementiert, integriert

- Funktion für das Ausschließen unidentifizierter Sequenzen von der weitern Prozessierung implementiert, integriert

- Tests zu obigen Funktionen geschrieben

- Obige Funktionen im Rahmen des Parsers getestet.

- Kleinere Änderungen im Parser, 2 kleinere Bugs behoben.

Woche 6:

- Funktion zur Kontrolle der Mindestlänge nach Prozessierung implementiert, integriert

- Funktion für das Auschließen der unidentifizierten Sequenzen optimiert.

- Erzwingen von .fasta als Ausgabeformat ermöglicht.

- Tagging der IDs von Reads mit entfernten Adaptern ermöglicht.

- Tagging von Reads ermöglicht, welche dem QualityTrimming unterzogen wurden.

- Funktion für das ausschließen der unidentifizierten Reads erstellt.

- Funktion zur Kontrolle der Mindestlänge nach Prozessierung implementiert, integriert

- Alle Löschoperationen von reads etc. wesentlich effizienter gestaltet.

- Ausgabe der Parameterübersicht im Konsolenfester ermöglich

- Laufenden Zähler für Zahl der bearbeiteten reads hinzugefügt.

- Funktionen so angepasst, dass keine StringSets o.ä. mehr zurückgegeben werden, um überflüssigen Aufwand zu vermeiden.

- Fehler behoben, der bei nicht ausgeführten Demultiplexing zum Programmabsturz führt.

- Div. Fehler in Statistik behoben.

Woche 7:

- Testläufe zum Demultiplexing

- Aufschrieb: Methoden

- Aufschrieb: Einleitung (Kontext)

Woche 8:

- Ergänzung von AdapterStat um Berechung des Positiv-Prädiktiven-Wertes

- Alle Testläufe und Vergleiche durchgeführt

- Aufschrieb komplett

Woche 9:

- Korrekturen und Ergänzungen im Aufschrieb

- Kosmetische Korrekturen im Code

- Zusammenstellung des Anhangs

=> Die Abgabe erfolgte am 16.09.2013

-- Main.serosko - 19 Jul 2013
 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback