Na Isabelli su dostupna tri poslužitelja Dell EMC PowerEdge C4140 s po:
- 4 grafička procesora NVIDIA Tesla V100-SXM2-16GB
2 procesora Intel Xeon Silver 4114 s ukupno 20 procesorskih jezgri
- 384 GB radne memorije
Lokalnog spremišta od 3.2 TB NVMe SSD diska
Instalirani su NVIDIA alati i biblioteke: CUDA (verzije 9.0 i 10.0), cuDNN 7.3.1 i NCCL 2.3.5.
Pripremljeni su moduli za dostupne verzije CUDA Toolkita koji postavljaju sve CUDA varijable okoline:
Verzija | Modul |
---|---|
9.0 | cuda/9-0 |
10.0 | cuda/10-0 |
Pokretanje poslova
Paralelne okoline za korištenje grafičkih procesora definirane su unutar redova poslova gpu.X.q:
- gpu – općeniti poslovi koji zahtijevaju grafičke procesore
- gpusingle – svi grafički procesori se dodjeljuju na jednom radnom čvoru
- gpufull - grafički procesori se dodijeljuju 4 po radnom čvoru (broj grafičkih procesora mora biti djelitelj od 4)
Paralelna okolina odabire se unutar opisa posla SGE parametrom:
#$ -pe <paralelna okolina>
Za pokretanje poslova na jednom čvoru potrebno je odabrati paralelnu okolinu gpusingle te željeni broj grafičkih procesora (maksimalno 4):
#$ -pe gpusingle 4 source $TMPDIR/gpu ...
Raspoređivač poslova pretpostavljeno svakom poslu na grafičkim procesorima pridjeljuje jednu CPU jezgru. Ukoliko je potrebno, moguće je tražiti veći broj jezgara:
#$ -nprocs <broj_jezgri>
MPI poslovi
Dostupni MPI moduli prevedeni s podrškom za CUDA drivere:
Verzija | Prevodilac | CUDA verzija | Modul |
---|---|---|---|
MVAPICH2.2 | Intel 2017 | 9.0 | mpi/mvapich2-intel2017-cuda90-2.2-x86_64 |
Primjer opisa MPI posla:
#$ -cwd #$ -pe gpu 4 source $TMPDIR/gpu module load <mpi modul> mpirun -np $NSLOTS -hostfile $TMPDIR/machines ...
Više informacija o pokretanju poslova možete pronaći na stranici Pokretanje i upravljanje poslovima.