You are here: ABI » ThesesHome » BlastX

BlastX

Diese Seite stellt das Wiki zur BlastX Implementierung von Hannes Hauswedel dar.

Zusammenfassung

BLASTX ist ein Programm zum Finden von Nucleotid Sequenzen in einer Proteindatenbank. Die existierenden Tools sind in erster Linie zum Finden einzelner Sequenzen geeignet, für Next Generation Sequencing Datensätze jedoch zu langsam. Daher soll in dieser Arbeit eine BLASTX Variante implementiert werden, die auf große Datenmengen optimiert ist.

Dazu soll in einem ersten Schritt die bestehende Literatur gesichtet und ein Benchmark der bekannten Tools aufgesetzt werden. Hierbei muss genau beachtet werden, was die Autoren der einzelnen Tools mit ihrem Tool erreichen (any best/all best/ …). Außerdem könnte man Masai (4 Buchstabenalphabet) in den Benchmark integrieren.

Der weitere Verlauf der Arbeit ist relativ offen. Es gibt mehrere Möglichkeiten die hier exemplarisch aufgelistet werden:

• Benutzung von Masai auf einem reduzierten Alphabet. o Hierbei kommt es auf die Details an. Benutzt man das reduzierte Alphabet nur für die Seeds? Benutzt man überlappende Seeds? Wie groß ist das reduzierte Alphabet.

• Mit oder ohne Reduzierung des Alphabets könnte man zwei Suffix Bäume vergleichen (Datenbank und Suchwörter). Diese Arbeit ist sehr ähnlich zu der BA von Florian Siemer und es ist insbesondere darauf zu achten, dass man sich im Vorfeld Gedanken um die Umsetzung der Nachbarschaft (pre-computed/on demand) und die initiale Suche der Seeds macht. Außerdem ist zu untersuchen, ob nur Seeds gesucht werden und eine Verifizierung erfolgt, oder die Verifizierung schon im Suchbaum stattfindet. • …

Auf den ersten Blick erscheint die Benutzung von Masai auf einem reduzierten Alphabet die sinnvollste Variante für den Begin zu sein.

Die Arbeit kann auch mehr als eine wissenschaftliche Untersuchung der einzelnen Methoden mit angefertigt werden, Details müssten hier aber von Prof. Reinert angegeben/diskutiert werden.
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback