You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 3 Next »

PyTorch 1.0.0

Na računalnom klasteru Isabella, na čvorovima s grafičkim procesorima NVIDIA Tesla V100-SXM2-16GB, instalirana je Pythonova biblioteka za strojno učenje PyTorch, verzija 1.0.0.

PyTorch je instaliran za Python 3.5, uz sljedeće verzije NVIDIA alata i biblioteka za strojno učenje:

  • CUDA 10.0
  • cuDNN 7.3.1
  • NCCL 2.3.5

Pripremljen je modul koji postavlja sve potrebne varijable okoline:

VerzijaModul
1.0.0pytorch/1-0-0-gpu

Izvođenje poslova

U nastavku je opisano podnošenje tipičnih Python poslova. Više informacija o pokretanju poslova možete pronaći na stranicama Korištenje grafičkih procesora te Pokretanje i upravljanje poslovima.

Korištenje jednog grafičkog procesora:

Važno

U opisima poslova koji koriste jedan grafički procesor, obavezno treba koristiti cuda-wrapper.sh, kao u sljedećem primjeru:

pytorch.sge
#$ -cwd
#$ -pe gpu 1
 
module load pytorch/1-0-0-gpu
 
cuda-wrapper.sh python3.5 moj_program.py

Korištenje više grafičkih procesora:

Važno

Korištenje više grafičkih procesora nije dopušteno bez korištenja biblioteke Horovod.

Važno

U opisima poslova koji koriste više grafičkih procesora, obavezno treba koristiti openmpi-wrapper.sh, kao u primjerima u nastavku.

Korištenje više grafičkih procesora na jednom čvoru:

Za pokretanje poslova koji zahtijevaju više grafičkih procesora na jednom čvoru potrebno je koristiti paralelnu okolinu gpusingle te željeni broj grafičkih procesora (maksimalno 4):

pytorch.sge
#$ -cwd
#$ -pe gpusingle 4
 
module load pytorch/1-0-0-gpu
 
openmpi-wrapper.sh python3.5 moj_program.py

Korištenje više grafičkih procesora na više čvorova:

pytorch.sge
#$ -cwd
#$ -pe gpu 6
 
module load pytorch/1-0-0-gpu
 
openmpi-wrapper.sh python3.5 moj_program.py

Korištenje cijelih čvorova s grafičkim procesorima

Za pokretanje poslova koji zahtijevaju cijele čvorove potrebno je koristiti paralelnu okolinu gpufull te željeni broj grafičkih procesora (mora biti djelitelj broja 4). Primjer skripte za zauzimanje dva čvora:

pytorch.sge
#$ -cwd
#$ -pe gpufull 8
 
module load pytorch/1-0-0-gpu
 
openmpi-wrapper.sh python3.5 moj_program.py

Podnošenje posla

Posao se podnosi s pristupnog čvora naredbom:

qsub pytorch.sge
  • No labels