You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 5 Next »

Opis


Dostupne verzije i moduli

VerzijaModul
1.1.2bioinfo/TOGA/1.1.2

Korištenje

TOGA je program koji ovisno o opsegu posla i veličini gena, može biti dosta zahtjevan.

Primjer je napravljen po uzoru na : https://github.com/hillerlab/TOGA

Podaci skinuti za ovaj primjer:  - Human 2bit:  https://hgdownload.cse.ucsc.edu/goldenpath/hg38/bigZips/hg38.2bit

                                                       - Mouse 2bit:   https://hgdownload.cse.ucsc.edu/goldenpath/mm10/bigZips/mm10.2bit

Detaljnije objašnjenje same komande i drugih argumenata : https://github.com/hillerlab/TOGA

TOGA.sge
#!/bin/sh
#$ -N toga_example
#$ -pe p28-mpisingle 28
#$ -R y 
#$ -cwd

module load bioinfo/TOGA/1.1.2

toga.py test_input/hg38.mm10.chr11.chain test_input/hg38.genCode27.chr11.bed hg38.2bit mm10.2bit --pn test -i supply/hg38.wgEncodeGencodeCompV34.isoforms.txt --chn 100 --cjn 10 --u12 supply/hg38.U12sites.tsv --ms --nc nextflow_config

Objasnjenje primjera

Preporučljivo je izvoditi TOGA na cijelom čvoru. Ovisno o broju poslova koje se da sa flagovima --chn i --cjn. U primjeru je sa --chn ili --chain_jobs_num dato 100 poslova, koji se relativno brzo izvode. Ovisno o tome koliko smo resursa dali u datoteci extract_chain_features_config.nf u direktoriju nextflow_config on će toliko koristiti. Isto se tako odnosi na --cjn ili --cesar_jobs_num koji koriste veliku količinu RAM memorije, ovisno o veličini genoma, tako da se treba paziti koliko se daje RAM-a po poslu kako ne bi prešlo dostupnu količinu memorije(inače poslovi se zruše i dobivaju se JAVA greške). Niže su objašnjeni detalji nextflow konfiguracije koju TOGA koristi kako bi se izvršavali poslovi.

Sadržaj nextflow_config direktorija
[mhrzenja@teran nextflow_config]$ ls -l
total 2
-rw-r--r-- 1 mhrzenja grid 366 Svi  3 16:09 call_cesar_config_template.nf
-rw-r--r-- 1 mhrzenja grid 198 Svi  3 16:10 cesar_bigmem_config.nf
-rw-r--r-- 1 mhrzenja grid  71 Svi  3 16:09 extract_chain_features_config.nf


call_cesar_config_template.nf
process.executor = "local"
process.penv = "p28"
process.time = "24h"
procesor.cpus = 2 
process.memory = "4GB"
extract_chain_features_config.nf
process.executor = "local"
process.penv = "p28"
process.cpus = 2 #dajemo 2 dretve po poslu, brzo se izvode stoga je u redu dati po 2 threada na 100 poslova


cesar_bigmem_config.nf
#Dajemo 2 dretve po poslu i 4GB memorije
process.executor = "local"
process.penv = "p28"
process.memory = "4GB"
executor.cpus = 2


Vrijeme trajanja ovog primjera posla: 

start_time   Wed May  3 16:10:31 2023
end_time     Wed May  3 18:48:48 2023


Primjer posla bez --nc(bez nextflowa):

Ovaj primjer se odnosi bez konfiguracijskih datoteka, tj bez korištenja nextflow flag-a u komandi. Bez korištenja parametara posao se svojevoljno širi po čvoru i zauzima koliko može resursa, stoga kada dođu na red veliki memorijski procesi oko 20-30% poslova faila jer ostanu bez dostupne memorije. Stoga je potrebno ograničiti broj poslova --chn i --cjn.

Pošto u primjeru zahtjevamo manje resursa brže se dođe na red. Treba pripaziti sa ovom opcijom da ne zadamo previše poslova jer će program ometati druge korisnike. U ovom primjeru 2 big mem posla su zauzela po 8-10 GB radne memorije stoga dajemo 2x15=30GB da se zauzme.


TOGA_no_nextflow.sge
#!/bin/sh
#$ -N tg
#$ -pe p28-mpisingle 2
#$ -cwd
#$ -R y
#$ -l memory=15

module load bioinfo/TOGA/1.1.2


toga.py test_input/hg38.mm10.chr11.chain test_input/hg38.genCode27.chr11.bed hg38.2bit mm10.2bit --kt --pn test -i supply/hg38.wgEncodeGencodeCompV34.isoforms.txt --chn $NSLOTS --cjn $NSLOTS --u12 supply/hg38.U12sites.tsv --ms 


Vrijeme trajanja ovog primjera posla:



Instalacija:


#Stvaranje conda env za TOGA deps
conda create -p /apps/virtenv/TOGA/cenv
conda activate /apps/virtenv/TOGA/cenv
conda install -c bioconda nextflow

#Instaliravanje TOGA programa
git clone https://github.com/hillerlab/TOGA.git
mv TOGA/ 1.1.2/
cd 1.1.2
pip install -r requirements.txt
module load gcc/9
./configure.sh










  • No labels