Opis

Trinity predstavlja novu metodu za učinkovitu i robusnu de novo rekonstrukciju transkriptoma iz RNA-seq podataka. Trinity kombinira tri nezavisna softverska modula: Inchworm, Chrysalis i Butterfly, koji se primjenjuju sekvencijalno za obradu velikih količina RNA-seq čitanja. Trinity dijeli podatke o sekvencama u mnogo pojedinačnih de Bruijnovih grafova, od kojih svaki predstavlja složenost transkripcije na danom genu ili lokusu, a zatim neovisno obrađuje svaki graf kako bi izdvojio izoforme spajanja pune duljine i razdvojio transkripte izvedene iz paralognih gena. Ukratko, proces funkcionira ovako:

  • Inchworm sastavlja RNA-seq podatke u jedinstvene sekvence transkripata, često generirajući transkripte pune duljine za dominantnu izoformu, ali zatim izvještava samo o jedinstvenim dijelovima alternativno spojenih transkripata.
  • Chrysalis grupira Inchworm contigove u klastere i konstruira kompletne de Bruinove grafove za svaki klaster. Svaki klaster predstavlja punu transkripcionu složenost za određeni gen (ili skupove gena koji dijele zajedničke sekvence). Chrysalis zatim dijeli puni skup za čitanje između ovih disjunktnih grafova.
  • Butterfly zatim paralelno obrađuje pojedinačne grafove, prateći staze kojima se čitanja i parovi čitanja odvijaju unutar grafa, u konačnici izvještavajući o transkriptima pune duljine za alternativno spojene izoforme i razdvajajući transkripte koji odgovaraju paralognim genima.

Verzije

VerzijaModulSupekPadobran
2.15.1scientific/Trinity/2.15.1(error) 
 
(tick) 

Službena dokumentacija

https://github.com/trinityrnaseq/trinityrnaseq/wiki

Primjer: https://github.com/trinityrnaseq/trinityrnaseq/tree/master/sample_data/test_Trinity_Assembly

Primjer:


PADOBRAN
#PBS -N trinity_test_run
#PBS -q cpu
#PBS -l select=1:ncpus=60:mem=100GB

cd ${PBS_O_WORKDIR}

module load scientific/trinity/2.15.1

trinity.sh Trinity --seqType fq --max_memory 100G --left reads2.left.fq.gz --right reads2.right.fq.gz --SS_lib_type RF --CPU $NCPUS


  • No labels