Panel | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||
|
Dostupne verzije
Na računalnom klasteru Isabella, na čvorovima s grafičkim procesorima NVIDIA Tesla V100-SXM2-16GB, instalirana je Pythonova biblioteka za strojno učenje TensorFlow, optimizirana za izvođenje na grafičkim procesorima.
TensorFlow je preveden za sljedeće verzije NVIDIA alata i biblioteka za strojno učenje:
...
Dostupne verzije i odgovarajući moduli, kao i NVIDIA knjižnice korištene pri kompilaciji su navedene ispod:
Verzija | Modul | CUDA | cuDNN | NCCL |
---|---|---|---|---|
1.12.0 | tensorflow/1-12-0-gpu | 10.0 |
...
7.3.1 |
...
2.3.5 |
...
Pripremljeni su moduli koji postavljaju sve potrebne varijable okoline:
Modul | ||||||||
---|---|---|---|---|---|---|---|---|
1.1215.0 | tensorflow/1-1215-0-gpu | 1|||||||
2. | 150.0 | tensorflow/ | 12- | 150-0-gpu | ||||
2. | 06. | 02 | tensorflow/2- | 06- | 02-gpu | 11.0 | 8.3.0 | 2.11.4 |
Izvođenje poslova
U nastavku je opisano podnošenje tipičnih Python poslova. Više informacija o pokretanju poslova možete pronaći na stranicama Korištenje grafičkih procesora te Pokretanje i upravljanje poslovima.
Korištenje jednog grafičkog procesora
...
Warning | ||
---|---|---|
| ||
U opisima poslova koji koriste jedan grafički procesor, obavezno treba koristiti cuda-wrapper.sh, kao u sljedećem primjeru: |
...
Code Block | ||
---|---|---|
| ||
#$ -cwd #$ -pe gpu 1 module load tensorflow/1-15-0-gpu cuda-wrapper.sh python moj_program.py |
Korištenje više grafičkih procesora
...
Warning |
---|
Korištenje više grafičkih procesora nije dopušteno bez korištenja biblioteke Horovod. |
...
Warning |
---|
U opisima poslova koji koriste više grafičkih procesora, obavezno treba koristiti openmpi-wrapper.sh, kao u primjerima u nastavku. |
Korištenje više grafičkih procesora na jednom čvoru
...
Za pokretanje poslova koji zahtijevaju više grafičkih procesora na jednom čvoru potrebno je koristiti paralelnu okolinu gpusingle te željeni broj grafičkih procesora (maksimalno 4):
Code Block | ||
---|---|---|
| ||
#$ -cwd #$ -pe gpusingle 4 module load tensorflow/1-12-0-gpu openmpi-wrapper.sh python3.5 moj_program.py |
Korištenje više grafičkih procesora na više čvorova
...
Code Block | ||
---|---|---|
| ||
#$ -cwd #$ -pe gpu 6 module load tensorflow/1-12-0-gpu openmpi-wrapper.sh python3.5 moj_program.py |
...