Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Opis

Dostupne verzije i moduli

VerzijaModul
1.1.2bioinfo/TOGA/1.1.2


Korištenje

Info

TOGA je program koji ovisno o opsegu posla i veličini gena, može biti dosta zahtjevan.

...

                                                       - Mouse 2bit:   https://hgdownload.cse.ucsc.edu/goldenpath/mm10/bigZips/mm10.2bit

Detaljnije objašnjenje same komande i drugih argumenata : https://github.com/hillerlab/TOGA

Code Block
languagebash
themeEmacs
titleTOGA.sge
#!/bin/sh
#$ -N toga_example
#$ -pe p28-mpisingle 28
#$ -R y 
#$ -cwd

module load bioinfo/TOGA/1.1.2

toga.py test_input/hg38.mm10.chr11.chain test_input/hg38.genCode27.chr11.bed hg38.2bit mm10.2bit --pn test -i supply/hg38.wgEncodeGencodeCompV34.isoforms.txt --chn 100 --cjn 10 --u12 supply/hg38.U12sites.tsv --ms --nc nextflow_config

...

Info
titleObjasnjenje primjera

Preporučljivo je izvoditi TOGA na cijelom čvoru. Ovisno o broju poslova koje se da sa flagovima --chn i --cjn. U primjeru je sa --chn ili --chain_jobs_num dato 100 poslova, koji se relativno brzo izvode. Ovisno o tome koliko smo resursa dali u datoteci extract_chain_features_config.nf u direktoriju nextflow_config on će toliko koristiti. Isto se tako odnosi na --cjn ili --cesar_jobs_num koji koriste veliku količinu RAM memorije, ovisno o veličini genoma, tako da se treba paziti koliko se daje RAM-a po poslu kako ne bi prešlo dostupnu količinu memorije(inače poslovi se zruše i dobivaju se JAVA greške). Niže su objašnjeni detalji nextflow konfiguracije koju TOGA koristi kako bi se izvršavali poslovi.


Code Block
languagebash
themeEmacs
titleSadržaj nextflow_config direktorija
[mhrzenja@teran nextflow_config]$ ls -l
total 2
-rw-r--r-- 1 mhrzenja grid 366 Svi  3 16:09 call_cesar_config_template.nf
-rw-r--r-- 1 mhrzenja grid 198 Svi  3 16:10 cesar_bigmem_config.nf
-rw-r--r-- 1 mhrzenja grid  71 Svi  3 16:09 extract_chain_features_config.nf


Code Block
languagebash
themeEmacs
titlecall_cesar_config_template.nf
process.executor = "local"
process.penv = "p28"
process.time = "24h"
procesor.cpus = 2 
process.memory = "6GB4GB"


Code Block
languagebash
themeEmacs
titleextract_chain_features_config.nf
process.executor = "local"
process.penv = "p28"
process.cpus = 2 #dajemo 2 dretve po poslu, brzo se izvode stoga je u redu dati po 2 threada na 100 poslova


Code Block
languagebash
themeEmacs
titlecesar_bigmem_config.nf
#Dajemo 2 dretve po poslu i 6GB4GB memorije
process.executor = "local"
process.penv = "p28"
process.memory = "4GB"
executor.cpus = 2


Vrijeme trajanja ovog primjera posla: 

Code Block
languagetext
themeEmacs
titlePrimjer sa nextflow
start_time   Wed May  3 16:10:31 2023
end_time     Wed May  3 18:48:48 2023


Primjer posla bez --nc(bez nextflowa):

Info

Ovaj primjer se odnosi bez konfiguracijskih datoteka, tj bez korištenja nextflow flag-a u komandi. Bez korištenja parametara posao se svojevoljno širi po čvoru i zauzima koliko može resursa, stoga kada dođu na red veliki memorijski procesi oko 20-30% poslova faila jer ostanu bez dostupne memorije. Stoga je potrebno ograničiti broj poslova --chn i --cjn.

Pošto u primjeru zahtjevamo manje resursa tj. ne cijeli čvor brže se dođe na red za izvođenje. Treba pripaziti sa ovom opcijom da ne zadamo previše poslova jer će program ometati druge korisnike. U ovom primjeru 2 big mem posla su zauzela po 8-10 GB radne memorije stoga dajemo 2x15=30GB da se zauzme.


Code Block
languagebash
themeEmacs
titleTOGA_no_nextflow.sge
#!/bin/sh
#$ -N tg
#$ -pe p28-mpisingle 2
#$ -cwd
#$ -R y
#$ -l memory=15

module load bioinfo/TOGA/1.1.2


toga.py test_input/hg38.mm10.chr11.chain test_input/hg38.genCode27.chr11.bed hg38.2bit mm10.2bit --pn test -i supply/hg38.wgEncodeGencodeCompV34.isoforms.txt --chn $NSLOTS --cjn $NSLOTS --u12 supply/hg38.U12sites.tsv --ms 


Vrijeme trajanja ovog primjera posla:

Code Block
languagetext
themeEmacs
titlePrimjer bez nextflow-a
start_time   Thu May  4 09:08:06 2023
end_time     Thu May  4 20:10:18 2023



Instalacija:


Code Block
languagebash
themeEmacs
#Stvaranje conda env za TOGA deps
conda create -p /apps/virtenv/TOGA/cenv
conda activate /apps/virtenv/TOGA/cenv
conda install -c bioconda nextflow

#Instaliravanje TOGA programa
git clone https://github.com/hillerlab/TOGA.git
mv TOGA/ 1.1.2/
cd 1.1.2
pip install -r requirements.txt
module load gcc/9
./configure.sh