Opis
Dostupne verzije i moduli
Verzija | Modul |
---|
1.1.2 | bioinfo/TOGA/1.1.2 |
Korištenje
Info |
---|
TOGA je program koji ovisno o opsegu posla i veličini gena, može biti dosta zahtjevan. |
...
- Mouse 2bit: https://hgdownload.cse.ucsc.edu/goldenpath/mm10/bigZips/mm10.2bit
Detaljnije objašnjenje same komande i drugih argumenata : https://github.com/hillerlab/TOGA
Code Block |
---|
language | bash |
---|
theme | Emacs |
---|
title | TOGA.sge |
---|
|
#!/bin/sh
#$ -N toga_example
#$ -pe p28-mpisingle 28
#$ -R y
#$ -cwd
module load bioinfo/TOGA/1.1.2
toga.py test_input/hg38.mm10.chr11.chain test_input/hg38.genCode27.chr11.bed hg38.2bit mm10.2bit --pn test -i supply/hg38.wgEncodeGencodeCompV34.isoforms.txt --chn 100 --cjn 10 --u12 supply/hg38.U12sites.tsv --ms --nc nextflow_config
|
...
Info |
---|
title | Objasnjenje primjera |
---|
|
Preporučljivo je izvoditi TOGA na cijelom čvoru. Ovisno o broju poslova koje se da sa flagovima --chn i --cjn. U primjeru je sa --chn ili --chain_jobs_num dato 100 poslova, koji se relativno brzo izvode. Ovisno o tome koliko smo resursa dali u datoteci extract_chain_features_config.nf u direktoriju nextflow_config on će toliko koristiti. Isto se tako odnosi na --cjn ili --cesar_jobs_num koji koriste veliku količinu RAM memorije, ovisno o veličini genoma, tako da se treba paziti koliko se daje RAM-a po poslu kako ne bi prešlo dostupnu količinu memorije(inače poslovi se zruše i dobivaju se JAVA greške). Niže su objašnjeni detalji nextflow konfiguracije koju TOGA koristi kako bi se izvršavali poslovi. |
Code Block |
---|
language | bash |
---|
theme | Emacs |
---|
title | Sadržaj nextflow_config direktorija |
---|
|
[mhrzenja@teran nextflow_config]$ ls -l
total 2
-rw-r--r-- 1 mhrzenja grid 366 Svi 3 16:09 call_cesar_config_template.nf
-rw-r--r-- 1 mhrzenja grid 198 Svi 3 16:10 cesar_bigmem_config.nf
-rw-r--r-- 1 mhrzenja grid 71 Svi 3 16:09 extract_chain_features_config.nf |
Code Block |
---|
language | bash |
---|
theme | Emacs |
---|
title | call_cesar_config_template.nf |
---|
|
process.executor = "local"
process.penv = "p28"
process.time = "24h"
procesor.cpus = 2
process.memory = "6GB4GB" |
Code Block |
---|
language | bash |
---|
theme | Emacs |
---|
title | extract_chain_features_config.nf |
---|
|
process.executor = "local"
process.penv = "p28"
process.cpus = 2 #dajemo 2 dretve po poslu, brzo se izvode stoga je u redu dati po 2 threada na 100 poslova |
Code Block |
---|
language | bash |
---|
theme | Emacs |
---|
title | cesar_bigmem_config.nf |
---|
|
#Dajemo 2 dretve po poslu i 6GB4GB memorije
process.executor = "local"
process.penv = "p28"
process.memory = "4GB"
executor.cpus = 2 |
Vrijeme trajanja ovog primjera posla:
Code Block |
---|
language | text |
---|
theme | Emacs |
---|
title | Primjer sa nextflow |
---|
|
start_time Wed May 3 16:10:31 2023
end_time Wed May 3 18:48:48 2023 |
Primjer posla bez --nc(bez nextflowa):
Info |
---|
Ovaj primjer se odnosi bez konfiguracijskih datoteka, tj bez korištenja nextflow flag-a u komandi. Bez korištenja parametara posao se svojevoljno širi po čvoru i zauzima koliko može resursa, stoga kada dođu na red veliki memorijski procesi oko 20-30% poslova faila jer ostanu bez dostupne memorije. Stoga je potrebno ograničiti broj poslova --chn i --cjn. Pošto u primjeru zahtjevamo manje resursa tj. ne cijeli čvor brže se dođe na red za izvođenje. Treba pripaziti sa ovom opcijom da ne zadamo previše poslova jer će program ometati druge korisnike. U ovom primjeru 2 big mem posla su zauzela po 8-10 GB radne memorije stoga dajemo 2x15=30GB da se zauzme. |
Code Block |
---|
language | bash |
---|
theme | Emacs |
---|
title | TOGA_no_nextflow.sge |
---|
|
#!/bin/sh
#$ -N tg
#$ -pe p28-mpisingle 2
#$ -cwd
#$ -R y
#$ -l memory=15
module load bioinfo/TOGA/1.1.2
toga.py test_input/hg38.mm10.chr11.chain test_input/hg38.genCode27.chr11.bed hg38.2bit mm10.2bit --pn test -i supply/hg38.wgEncodeGencodeCompV34.isoforms.txt --chn $NSLOTS --cjn $NSLOTS --u12 supply/hg38.U12sites.tsv --ms |
Vrijeme trajanja ovog primjera posla:
Code Block |
---|
language | text |
---|
theme | Emacs |
---|
title | Primjer bez nextflow-a |
---|
|
start_time Thu May 4 09:08:06 2023
end_time Thu May 4 20:10:18 2023 |
Instalacija:
Code Block |
---|
|
#Stvaranje conda env za TOGA deps
conda create -p /apps/virtenv/TOGA/cenv
conda activate /apps/virtenv/TOGA/cenv
conda install -c bioconda nextflow
#Instaliravanje TOGA programa
git clone https://github.com/hillerlab/TOGA.git
mv TOGA/ 1.1.2/
cd 1.1.2
pip install -r requirements.txt
module load gcc/9
./configure.sh |