You are here: Foswiki>ABI Web>WebPreferences>PMSB_Seqan_2018>PSMB_Seqan_IBF (02 Feb 2018, ReinertUserTopic)Edit Attach

Auswertugn von Binning directories mit Hilfe von Interleaved Bloom filters

Hintergrund: Filtern von NGS reads in bins
Aufgaben
References

Hintergrund: Filtern von NGS reads in bins

In dem projekt soll (zufällig generierte) genomische Sequenz in b Teile (Bins) aufgeteilt werden. Danach werden wir von den Teilen Illumina reads simulieren und mit Hilfe von Binning directories auf die Bins verteilen. Dafür zählen wir für jeden Read, ob welche seiner k-mere den Bin vorkommen. Wenn genügend viele k-mere vorkommen, liegt ein hit vor. Dies ist bereits in SeqAn implementiert.

Für große k (k>15) kann man keine k-mer Tabelle verwenden, sondern stattdessen eine neu Datenstruktur, den Interleaved Bloom Filter. Diese kann mit großem k umgehen, kann allerdings falsch positive Antworten geben.

Details in [1].

Aufgaben

Ziel dieser Aufgabe ist es, für verschiedene Werte von k und verschiedene Größen des IBF zu untersuchen, wie sich Anzahl der Hits in den Bins ändert.

References

[1] https://doi.org/10.1101/256354

]

I	Attachment	Action	Size	Date	Who	Comment
pdf	countingfilter-eps-converted-to.pdf	manage	64 K	02 Feb 2018 - 09:29	ReinertUserTopic
pdf	ibf-eps-converted-to.pdf	manage	20 K	01 Feb 2018 - 09:34	ReinertUserTopic

Topic revision: r2 - 02 Feb 2018, ReinertUserTopic

ABI

Copyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback