Auswertugn von Binning directories mit Hilfe von Interleaved Bloom filters

Hintergrund: Filtern von NGS reads in bins

In dem projekt soll (zufällig generierte) genomische Sequenz in b Teile (Bins) aufgeteilt werden. Danach werden wir von den Teilen Illumina reads simulieren und mit Hilfe von Binning directories auf die Bins verteilen. Dafür zählen wir für jeden Read, ob welche seiner k-mere den Bin vorkommen. Wenn genügend viele k-mere vorkommen, liegt ein hit vor. Dies ist bereits in SeqAn implementiert.

Für große k (k>15) kann man keine k-mer Tabelle verwenden, sondern stattdessen eine neu Datenstruktur, den Interleaved Bloom Filter. Diese kann mit großem k umgehen, kann allerdings falsch positive Antworten geben.

Details in [1].

Aufgaben

Ziel dieser Aufgabe ist es, für verschiedene Werte von k und verschiedene Größen des IBF zu untersuchen, wie sich Anzahl der Hits in den Bins ändert.

References

]

I Attachment Action Size Date Who Comment
countingfilter-eps-converted-to.pdfpdf countingfilter-eps-converted-to.pdf manage 64 K 02 Feb 2018 - 09:29 ReinertUserTopic  
ibf-eps-converted-to.pdfpdf ibf-eps-converted-to.pdf manage 20 K 01 Feb 2018 - 09:34 ReinertUserTopic  
This topic: ABI > WebHome > WebPreferences > PMSB_Seqan_2018 > PSMB_Seqan_IBF
Topic revision: 02 Feb 2018, ReinertUserTopic
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback