PyTorch
Na računalnom klasteru Isabella, na čvorovima s grafičkim procesorima NVIDIA Tesla V100-SXM2-16GB, instalirana je Pythonova biblioteka za strojno učenje PyTorch.
PyTorch je instaliran za Python 3.5+, uz sljedeće verzije NVIDIA alata i biblioteka za strojno učenje:
- CUDA
- cuDNN 7.3.1
- NCCL 2.3.5
Pripremljen je modul koji postavlja sve potrebne varijable okoline:
Verzija | CUDA | Modul |
---|---|---|
1.0.0 | 10.0 | pytorch/1-0-0-gpu |
1.3.0 | 10.0 | pytorch/1.3.0-gpu |
1.5.0 | 10.1 | pytorch/1.5.0-gpu |
Izvođenje poslova
U nastavku je opisano podnošenje tipičnih Python poslova. Više informacija o pokretanju poslova možete pronaći na stranicama Korištenje grafičkih procesora te Pokretanje i upravljanje poslovima.
Korištenje jednog grafičkog procesora:
Važno
U opisima poslova koji koriste jedan grafički procesor, obavezno treba koristiti cuda-wrapper.sh, kao u sljedećem primjeru:
#$ -cwd #$ -pe gpu 1 module load pytorch/1-0-0-gpu cuda-wrapper.sh python3.5 moj_program.py
Korištenje više grafičkih procesora:
Važno
Korištenje više grafičkih procesora s bibliotekom PyTorch trenutno nije moguće.
Podnošenje posla
Posao se podnosi s pristupnog čvora naredbom:
qsub pytorch.sge