Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-41693
Titel: MetaProFi: an ultrafast chunked Bloom filter for storing and querying protein and nucleotide sequence data for accurate identification of functionally relevant genetic variants
VerfasserIn: Srikakulam, Sanjay K.
Keller, Sebastian
Dabbaghie, Fawaz
Bals, Robert
Kalinina, Olga V.
Sprache: Englisch
Titel: Bioinformatics
Bandnummer: 39
Heft: 3
Verlag/Plattform: Oxford University Press
Erscheinungsjahr: 2023
DDC-Sachgruppe: 610 Medizin, Gesundheit
Dokumenttyp: Journalartikel / Zeitschriftenartikel
Abstract: Motivation: Bloom filters are a popular data structure that allows rapid searches in large sequence datasets. So far, all tools work with nucleotide sequences; however, protein sequences are conserved over longer evolutionary distances, and only mutations on the protein level may have any functional significance. Results: We present MetaProFi, a Bloom filter-based tool that, for the first time, offers the functionality to build indexes of amino acid sequences and query them with both amino acid and nucleotide sequences, thus bringing sequence comparison to the biologically relevant protein level. MetaProFi implements additional efficient engineering solutions, such as a shared memory system, chunked data storage and efficient compression. In addition to its conceptual novelty, MetaProFi demonstrates state-of-the-art performance and excellent memory consumption-to-speed ratio when applied to various large datasets. Availability and implementation: Source code in Python is available at https://github.com/kalininalab/metaprofi. Contact: olga.kalinina@helmholtz-hips.de
DOI der Erstveröffentlichung: 10.1093/bioinformatics/btad101
URL der Erstveröffentlichung: https://doi.org/10.1093/bioinformatics/btad101
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-416933
hdl:20.500.11880/37321
http://dx.doi.org/10.22028/D291-41693
ISSN: 1367-4811
Datum des Eintrags: 1-Mär-2024
Fakultät: M - Medizinische Fakultät
Fachrichtung: M - Innere Medizin
M - Medizinische Biometrie, Epidemiologie und medizinische Informatik
Professur: M - Prof. Dr. Robert Bals
M - Prof. Dr. Olga Kalinina
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
btad101.pdf1,42 MBAdobe PDFÖffnen/Anzeigen


Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons Creative Commons