Panel

borderColor	lightgray
borderWidth	1
titleBGColor	mediumgray
borderStyle	solid
title	Sadržaj

Table of Contents

Dostupne verzije

...

Na računalnom klasteru Isabella, na čvorovima s grafičkim procesorima NVIDIA Tesla V100-SXM2-16GB, instalirana je Python Pythonova biblioteka za strojno učenje , TensorFlow, verzija 1.12.0, optimizirana za izvođenje na grafičkim procesorima.
TensorFlow je preveden za Python 3.5, uz sljedeće verzije NVIDIA alata i biblioteka za strojno učenje:
Dostupne verzije i odgovarajući moduli, kao i NVIDIA knjižnice korištene pri kompilaciji su navedene ispod:
...
Verzija Modul CUDA cuDNN NCCL
1.12.0 tensorflow/1-12-0-gpu
10.0
...
7.3.1
...
2.3.5
...
Verzija Modul
1.1215.0 tensorflow/1-1215-0-gpu
...
2.0.0
Na radnim čvorovim s grafičkim procesorima Tesla V100 instaliran je PyTorch 1.0.0 za Python 3.5 s podrškom za CUDA 10.
Pripremljen je modul koji priprema sve potrebne varijable okoline:
Verzija Modul
1.0.0 pytorch/1-0-0-gpu

Horovod

Za paralelno izvođenje Python poslova na Isabelli, dostupna je Python biblioteka Horovod, verzija 0.15.2. Horovod je odabran radi minimalnih potrebnih izmjena Python skripti kako bi se mogle izvoditi na više GPU-ova, po potrebi preko više čvorova.

Upute o potrebnim izmjenama u korisničkim Python skriptama mogu se naći na Horovod GitHub repozitoriju.

...

tensorflow/2-0-0-gpu
2.6.2	tensorflow/2-6-2-gpu	11.0	8.3.0	2.11.4
2.12.0	tensorflow/2-12-0	11.8	8.6.0	2.13.4

Izvođenje poslova

U nastavku je opisano podnošenje tipičnih Python poslova. Više informacija o pokretanju poslova možete pronaći na stranicama Korištenje grafičkih procesora te Pokretanje i upravljanje poslovima.

Korištenje jednog grafičkog procesora

...

Warning

title	Važno

U opisima poslova koji koriste jedan grafički procesor, obavezno treba koristiti cuda-wrapper.sh, kao u sljedećem primjeru:

Code Block

title	gpujobtf112.sge

#$ -cwd
#$ -pe gpu 1

module load <ime modula>tensorflow/1-12-0-gpu

cuda-wrapper.sh python3.5 moj_program.py

Code Block

title	t115.sge

#$ -cwd
#$ -pe gpu 1

module load tensorflow/1-15-0-gpu

cuda-wrapper.sh python moj_program.py

Korištenje više grafičkih procesora

...

Warning
Korištenje više grafičkih procesora nije dopušteno bez korištenja TensorFlow, PyTorch biblioteke Horovod.

Warning
U opisima poslova koji koriste više grafičkih procesora, obavezno treba koristiti openmpi-wrapper.sh, kao u primjerima u nastavku.

Korištenje više grafičkih procesora na jednom čvoru

...

Za pokretanje poslova koji zahtijevaju više grafičkih procesora na jednom čvoru potrebno je koristiti paralelnu okolinu gpusingle te željeni broj grafičkih procesora (maksimalno 4):

Code Block

title	gpujobtf.sge

#$ -cwd
#$ -pe gpusingle 4

module load <ime modula>tensorflow/1-12-0-gpu

openmpi-wrapper.sh python3.5 moj_program.py

Korištenje više grafičkih procesora na više čvorova

...

Code Block

title	gpujobtf.sge

#$ -cwd
#$ -pe gpu 6

module load <ime modula>tensorflow/1-12-0-gpu

openmpi-wrapper.sh python3.5 moj_program.py

Korištenje cijelih čvorova s grafičkim procesorima

Za pokretanje poslova koji zahtijevaju cijele čvorove potrebno je koristiti paralelnu okolinu gpufull te željeni broj grafičkih procesora (mora biti djelitelj višekratnik broja 4). Primjer skripte za zauzimanje dva čvora:

Code Block

title	gpujobtf.sge

#$ -cwd
#$ -pe gpufull 8

module load <ime modula>tensorflow/1-12-0-gpu

openmpi-wrapper.sh python3.5 moj_program.py

Podnošenje posla

Posao se podnosi s pristupnog čvora naredbom:

Code Block
qsub tf.sge

Performanse

Performanse paralelnog izvođenja TensorFlow aplikacija korištenjem Horovod biblioteke mjerene su standarnim resnet101 benchmarkom iz službenog TensorFlow benchmark repozitorija.

Slika 1 prikazuje performanse na resnet101 testu u odnosu na broj GPU-ova. Vidljivo je da se s povećanjem broja GPU-ova povećava gubitak u odnosu na maksimalne teoretske performanse, što je i za očekivati. Međutim, čak i za 12 GPU-ova, sustav daje oko 85% idealnog slučaja. Idealne performanse procijenjene su iz rezultata istog benchmarka na jednom grafičkom procesoru, bez korištenja Horovod biblioteke.

Image Removed

Slika 2 prikazuje performanse na istom benchmarku, korištenjem 4 GPU-a u različitim raspodjelama po čvorovima. Vidljivo je da raspored GPU-ova po čvorovima ne utječe bitno na performanse na ovom benchmarku.

...

Space shortcuts

Page tree

Versions Compared

Old Version 36

New Version Current

Key

Dostupne verzije

Horovod

Izvođenje poslova

Korištenje jednog grafičkog procesora

Korištenje više grafičkih procesora

Warning
Korištenje više grafičkih procesora nije dopušteno bez korištenja TensorFlow, PyTorch biblioteke Horovod.

Warning
U opisima poslova koji koriste više grafičkih procesora, obavezno treba koristiti openmpi-wrapper.sh, kao u primjerima u nastavku.

Korištenje više grafičkih procesora na jednom čvoru

Korištenje više grafičkih procesora na više čvorova

Code Block
title gpujobtf.sge
#$ -cwd #$ -pe gpu 6 module load <ime modula>tensorflow/1-12-0-gpu openmpi-wrapper.sh python3.5 moj_program.py

Korištenje cijelih čvorova s grafičkim procesorima

Podnošenje posla

Performanse

Space shortcuts

Page tree

Page History

Versions Compared

Old Version 36

New Version Current

Key

Dostupne verzije

Horovod

Izvođenje poslova

Korištenje jednog grafičkog procesora

Korištenje više grafičkih procesora

WarningKorištenje više grafičkih procesora nije dopušteno bez korištenja TensorFlow, PyTorch biblioteke Horovod. WarningU opisima poslova koji koriste više grafičkih procesora, obavezno treba koristiti openmpi-wrapper.sh, kao u primjerima u nastavku.

Korištenje više grafičkih procesora na jednom čvoru

Korištenje više grafičkih procesora na više čvorova

Code Blocktitlegpujobtf.sge#$ -cwd #$ -pe gpu 6 module load <ime modula>tensorflow/1-12-0-gpu openmpi-wrapper.sh python3.5 moj_program.py

Korištenje cijelih čvorova s grafičkim procesorima

Podnošenje posla

Performanse

Warning
Korištenje više grafičkih procesora nije dopušteno bez korištenja TensorFlow, PyTorch biblioteke Horovod.

Warning
U opisima poslova koji koriste više grafičkih procesora, obavezno treba koristiti openmpi-wrapper.sh, kao u primjerima u nastavku.

Code Block
title gpujobtf.sge
#$ -cwd #$ -pe gpu 6 module load <ime modula>tensorflow/1-12-0-gpu openmpi-wrapper.sh python3.5 moj_program.py