Next Generation Sequencing (NGS) Daten werden heute für unterschiedlichste Aufgaben verwendet. So unter anderem zur Untersuchung von Bodenproben, Geweben und Mageninhalten - oder kurz: In der Metagenomic. Besonders interessant ist dabei zu erfahren, WER WAS macht.
Um dies zu Studieren kann man die Information der NGS Daten mit bestehenden Proteindatenbanken vergleichen. Hierbei ist jedoch die Größe der NGS Daten ein Problem, sodass die Entwicklung einer BlastX Variante für NGS Daten von großem Interesse ist.
Ziel dieser Aufgabe ist es, einen Variante von BlastX zu realisieren.
Dazu soll das 20 Zeichen umfassende Proteinalphabet auf wenige Zeichen reduziert werden und mit Hilfe spezialisierten Mapping-Algorithmen (Masai) eine Proteinsuche umgesetzt werden. Hierzu müssen folgende Fragen geklärt werden: Beschreibung![]() |
Bearbeitungszeitraum | Programmierung |
---|---|---|
Alphabet erstellen | 01.05.13-07.05.13 | Marjan |
Ergebnisse in txt-Datei ausgeben | 15.05.13-20.05.13 | Annkatrin & Marjan |
Evtl. Fehler im Programm beheben anschließend verschiedene Alphabete testen | 21.05.13-25.05.13 | Annkatrin & Marjan |
Matches verifiizieren | 08.05.13-14.05.13 | Annkatrin & Marjan |
Reads in Datenbank suchen und matches finden | 01.05.13-07.05.13 | Annkatrin |
Reads und Proteindatenbank übersetzen | 25.04.13-30.04.13 | Annkatrin |
Testdatensatz erstellen und einlesen | 25.04.13-30.04.13 | Marjan |
Die Aufgabe ist in einer kleinen Gruppe zu bearbeiten.