Opis
Genome Analysis Toolkit (GATK) softverski je paket razvijen na Institutu Broad za analizu podataka sekvenciranja visoke propusnosti.
Skup alata uključuje širok izbor alata, s fokusom na otkrivanje varijanti i genotipizaciju, kao i naglasak na osiguranje kvalitete podataka.
Verzije
Verzija | Modul |
---|---|
4.4.0.0 | gatk4/4.4.0.0 |
Službena dokumentacija
- Dostupni alati: gatk-alati
- Git: https://github.com/broadinstitute/gatk
- Službena stranica: https://gatk.broadinstitute.org/hc/en-us
Primjer korištenja
Code Block | ||||
---|---|---|---|---|
| ||||
#!/bin/bash
#PBS -N gatk4-HTcaller
#PBS -q cpu
#PBS -l select=1:ncpus=2:mem=10GB
cd $PBS_O_WORKDIR
module load gatk4/4.4.0.0
gatk --java-options "-Xmx8G" HaplotypeCaller -R reference.fasta -I input.bam -O output.vcf |
Tip |
---|
S obzirom da veliki broj alata nema mogućnost kontrole broja jezgara koji se koristi, poslovi se šalju kao serijski. Kod korištenja alata koji imaju mogućnost korištenja više dretvi ili više jezgara obavezno je korištenje mpisingle okoline s obzirom da gatk4 nema mogućnost širenja van jednog radnog čvora. Također, bitno je navoditi da se koristi jednak broj jezgara koji je i tražen u skripti za podnošenje poslova. |