...
Korištenje jednog grafičkog procesora:
Code Block |
---|
|
#$ -cwd
#$ -pe gpu 1
module load tensorflow/1-12-0-gpu
cuda-wrapper.sh python3.5 moj_program.py |
...
Za pokretanje poslova koji zahtijevaju više grafičkih procesora na jednom čvoru potrebno je koristiti paralelnu okolinu gpusingle te željeni broj grafičkih procesora (maksimalno 4):
Code Block |
---|
|
#$ -cwd
#$ -pe gpusingle 4
module load tensorflow/1-12-0-gpu
mpirun -np $NSLOTS -bind-to none cuda-wrapper.sh python3.5 moj_program.py |
Korištenje više grafičkih procesora na više čvorova:
Code Block |
---|
|
#$ -cwd
#$ -pe gpu 6
module load tensorflow/1-12-0-gpu
mpirun -np $NSLOTS -bind-to none cuda-wrapper.sh python3.5 moj_program.py |
...
Za pokretanje poslova koji zahtijevaju cijele čvorove potrebno je koristiti paralelnu okolinu gpufull te željeni broj grafičkih procesora (mora biti djelitelj broja 4). Primjer skripte za zauzimanje dva čvora:
Code Block |
---|
|
#$ -cwd
#$ -pe gpufull 8
module load tensorflow/1-12-0-gpu
mpirun -np $NSLOTS -bind-to none cuda-wrapper.sh python3.5 moj_program.py |
Podnošenje posla
Posao se podnosi s pristupnog čvora naredbom:
Performanse
Performanse paralelnog izvođenja TensorFlow aplikacija korištenjem Horovod biblioteke mjerene su standarnim resnet101 benchmarkom iz službenog TensorFlow benchmark repozitorija.
...