Sadržaj

Dostupne verzije

Na računalnom klasteru Isabella, na čvorovima s grafičkim procesorima NVIDIA Tesla V100-SXM2-16GB, instalirana je Pythonova biblioteka za strojno učenje TensorFlow, optimizirana za izvođenje na grafičkim procesorima.

Dostupne verzije i odgovarajući moduli, kao i NVIDIA knjižnice korištene pri kompilaciji su navedene ispod:

VerzijaModulCUDAcuDNNNCCL
1.12.0tensorflow/1-12-0-gpu10.07.3.12.3.5
1.15.0tensorflow/1-15-0-gpu
2.0.0tensorflow/2-0-0-gpu
2.6.2tensorflow/2-6-2-gpu11.08.3.02.11.4
2.12.0tensorflow/2-12-011.88.6.02.13.4

Izvođenje poslova

U nastavku je opisano podnošenje tipičnih Python poslova. Više informacija o pokretanju poslova možete pronaći na stranicama Korištenje grafičkih procesora te Pokretanje i upravljanje poslovima.

Korištenje jednog grafičkog procesora

Važno

U opisima poslova koji koriste jedan grafički procesor, obavezno treba koristiti cuda-wrapper.sh, kao u sljedećem primjeru:

tf112.sge
#$ -cwd
#$ -pe gpu 1

module load tensorflow/1-12-0-gpu

cuda-wrapper.sh python3.5 moj_program.py
t115.sge
#$ -cwd
#$ -pe gpu 1

module load tensorflow/1-15-0-gpu

cuda-wrapper.sh python moj_program.py

Korištenje više grafičkih procesora

Korištenje više grafičkih procesora nije dopušteno bez korištenja biblioteke Horovod.

U opisima poslova koji koriste više grafičkih procesora, obavezno treba koristiti openmpi-wrapper.sh, kao u primjerima u nastavku.

Korištenje više grafičkih procesora na jednom čvoru

Za pokretanje poslova koji zahtijevaju više grafičkih procesora na jednom čvoru potrebno je koristiti paralelnu okolinu gpusingle te željeni broj grafičkih procesora (maksimalno 4):

tf.sge
#$ -cwd
#$ -pe gpusingle 4

module load tensorflow/1-12-0-gpu

openmpi-wrapper.sh python3.5 moj_program.py

Korištenje više grafičkih procesora na više čvorova

tf.sge
#$ -cwd
#$ -pe gpu 6

module load tensorflow/1-12-0-gpu

openmpi-wrapper.sh python3.5 moj_program.py

Korištenje cijelih čvorova s grafičkim procesorima

Za pokretanje poslova koji zahtijevaju cijele čvorove potrebno je koristiti paralelnu okolinu gpufull te željeni broj grafičkih procesora (mora biti višekratnik broja 4). Primjer skripte za zauzimanje dva čvora:

tf.sge
#$ -cwd
#$ -pe gpufull 8

module load tensorflow/1-12-0-gpu

openmpi-wrapper.sh python3.5 moj_program.py

Podnošenje posla

Posao se podnosi s pristupnog čvora naredbom:

qsub tf.sge
  • No labels