Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Korištenje jednog grafičkog procesora:

Code Block
titletf.sge
#$ -cwd
#$ -pe gpu 1

module load tensorflow/1-12-0-gpu

cuda-wrapper.sh python3.5 moj_program.py

...

Za pokretanje poslova koji zahtijevaju više grafičkih procesora na jednom čvoru potrebno je koristiti paralelnu okolinu gpusingle te željeni broj grafičkih procesora (maksimalno 4):

Code Block
titletf.sge
#$ -cwd
#$ -pe gpusingle 4

module load tensorflow/1-12-0-gpu

mpirun -np $NSLOTS -bind-to none cuda-wrapper.sh python3.5 moj_program.py

Korištenje više grafičkih procesora na više čvorova:

Code Block
titletf.sge
#$ -cwd
#$ -pe gpu 6

module load tensorflow/1-12-0-gpu

mpirun -np $NSLOTS -bind-to none cuda-wrapper.sh python3.5 moj_program.py

...

Za pokretanje poslova koji zahtijevaju cijele čvorove potrebno je koristiti paralelnu okolinu gpufull te željeni broj grafičkih procesora (mora biti djelitelj broja 4). Primjer skripte za zauzimanje dva čvora:

Code Block
titletf.sge
#$ -cwd
#$ -pe gpufull 8

module load tensorflow/1-12-0-gpu

mpirun -np $NSLOTS -bind-to none cuda-wrapper.sh python3.5 moj_program.py

Podnošenje posla

Posao se podnosi s pristupnog čvora naredbom:

Code Block
qsub tf.sge

Performanse

Performanse paralelnog izvođenja TensorFlow aplikacija korištenjem Horovod biblioteke mjerene su standarnim resnet101 benchmarkom iz službenog TensorFlow benchmark repozitorija.

...