Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: distributed-*.sh added

...

...

Code Block
languagebash
titletest.sh
linenumberstrue
collapsetrue
[korisnik@x3000c0s25b0n0] $ module load scientific/pytorch/1.14.0-ngc
[korisnik@x3000c0s25b0n0] $ run-command.sh pip3 list
INFO:    underlay of /etc/localtime required more than 50 (95) bind mounts
INFO:    underlay of /usr/bin/nvidia-smi required more than 50 (474) bind mounts
13:4: not a valid test operator: (
13:4: not a valid test operator: 510.47.03
Package                 Version
----------------------- -------------------------------
absl-py                 1.3.0
accelerate              0.19.0
apex                    0.1
appdirs                 1.4.4
argon2-cffi             21.3.0
argon2-cffi-bindings    21.2.0
asttokens               2.2.1
...

torchrun/distributed

Note
titleTorchrun & distributed

Korištenje wrappera torchun-*.sh ili distributed-*.sh je zamjenjivo u slučaju da je pytorch kod distribuiran torch.distributed modulom.

Aplikacija na jednom grafičkom procesoru

...

Tip
titleApptainer i run-singlenode.sh

Ova knjižnica je dostavljena u obliku kontejnera, zbog opterećenja koje pip/conda virtualna okruženja stvaraju na Lustre dijeljenim datotečnim sustavima.

Za ispravno izvršavanje python aplikacija ili naredbi koje se u njemu nalaze, potrebno je koristiti wrappere u skriptama sustava PBS:

  • Za izvršavanje naredbi u kontejneru na samo jednom čvoru:
    • run-command.sh
  • Za izvršavanje skripti python na jednom grafičkom procesoru
    • run-singlegpu.sh
  • Za izvršavanje skripti python na više grafičkih procesora (dostupno za PyTorch v1.10+)
    • torchrun/distributed
      • torchrun-singlenode.sh, distributed-singlenode.sh  - jedan čvor
      • torchrun-multinode.sh, distributed-multinode.sh  - više čvorova
    • accelerate
      • accelerate-singlenode.sh  - jedan čvor
      • accelerate-multinode.sh - više čvorova

Načini pozivanja wrappera opisani su u primjerima iznad.

...