...
Code Block |
---|
#$ -cwd #$ -pe gpu 1 module load tensorflow/1-12-0gpu source $TMPDIR/gpu echo $CUDA_VISIBLE_DEVICES python3.5 moj_program.py |
Primjer opisa paralelnog posla koji zahtijeva 4 GPU-a:
Code Block |
---|
#$ -cwd #$ -pe gpu 4 module load tensorflow/1-12-0gpu source $TMPDIR/gpu echo $CUDA_VISIBLE_DEVICES /usr/lib64/openmpi3/bin/mpirun -np $NSLOTS -bind-to none -map-by slot -mca pml ob1 -mca btl ^openib python3.5 moj_program.py |
SGE pretpostavljeno svakom poslu dodjeljuje jednu CPU jezgru. Ukoliko je potrebno, moguće je tražiti više jezgri:
Code Block |
---|
#$ -nprocs <broj_jezgri> |
Više informacija o pokretanju poslova možete pronaći na stranici Pokretanje i upravljanje poslovima.Paralelne okoline
...
Paralelne okoline se odabiru SGE parametrom:
Code Block |
---|
#$ -pe <paralelna okolina> |
Dostupne paralelne okoline za korištenje grafičkih procesora:
...
Više informacija o paralelnim okolinama dostupnim na Isabelli možete pronaći na stranici Redovi poslova i paralelne okoline.
SGE pretpostavljeno svakom poslu dodjeljuje jednu CPU jezgru. Ukoliko je potrebno, moguće je tražiti više jezgri:
Code Block |
---|
#$ -nprocs <broj_jezgri> |
Više informacija o pokretanju poslova možete pronaći na stranici Pokretanje i upravljanje poslovima.
Performanse
Performanse paralelnog izvođenja TensorFlow aplikacija korištenjem Horovod biblioteke mjerene su standarnim resnet101 benchmarkom iz službenog TensorFlow benchmark repozitorija.
...