Krátke tandemové opakovania (STR) sú úseky opakujúcej sa DNA, v ktorej sú krátke sekvencie, typicky tvorené 2-6 nukleotidmi, opakované niekoľkokrát po sebe. STR sú veľmi relevantné v molekulárno-genetických aplikáciách – niektoré STR priamo spôsobujú rôzne genetické poruchy.

Dante je algoritmus pre genotypizáciu a charakterizáciu aliel STR, založený na sekvenčných čítaniach pochádzajúcich z miest okolo daných STR. Táto metóda koriguje prirodzené odchýlky od očakávanej sekvencie, ako je odchýlky v počte opakovaní, sekvenčné chyby, nejednoznačné základy a tzv. „stutter“ efekt. Pomocou Dante je možné genotypizovať aj komplexné lokusy obsahujúce niekoľko rôznych motívov, dokonca aj expanzie STR, ktoré podľa bežného pohľadu nemôžu byť úplne zachytené krátkymi masívne paralelnými sekvenčnými čítaniami.

Vo všetkých našich testoch Dante prekonal najnovšie nástroje na určovanie genotypov, HipSTR (Li, 2009) a GATK (McKenna, 2010). Ďalej Dante dokázal predpovedať expanzie alel vo všetkých testovaných klinických prípadoch.

Dante generuje užívateľsky prívetivú správu s konkrétnymi charakteristikami genotypizovaných aleil spolu s informáciami o expanziách. Všetky tieto vlatnosti robia Dante špecificky vhodným na hodnotenie klinicky relevantných STR miest v molekulárnych diagnostických aplikáciách.

 

Viac informácií v publikácii: https://doi.org/10.1093/bioinformatics/bty791

Dante je možné stiahnuť zo stránky GitHub: https://github.com/jbudis/dante