...
- Službena stranica - https://pytorch.org/
- Priručnik - https://pytorch.org/docs/stable/index.html
- distributed - https://pytorch.org/docs/stable/distributed.html
- torchrun
- accelerate
...
Code Block | ||||||||
---|---|---|---|---|---|---|---|---|
| ||||||||
[korisnik@x3000c0s25b0n0] $ module load scientific/pytorch/1.14.0-ngc [korisnik@x3000c0s25b0n0] $ run-command.sh pip3 list INFO: underlay of /etc/localtime required more than 50 (95) bind mounts INFO: underlay of /usr/bin/nvidia-smi required more than 50 (474) bind mounts 13:4: not a valid test operator: ( 13:4: not a valid test operator: 510.47.03 Package Version ----------------------- ------------------------------- absl-py 1.3.0 accelerate 0.19.0 apex 0.1 appdirs 1.4.4 argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0 asttokens 2.2.1 ... |
torchrun/distributed
Note | ||
---|---|---|
| ||
Korištenje wrappera |
Aplikacija na jednom grafičkom procesoru
...
Tip | ||
---|---|---|
| ||
Ova knjižnica je dostavljena u obliku kontejnera, zbog opterećenja koje pip/conda virtualna okruženja stvaraju na Lustre dijeljenim datotečnim sustavima. Za ispravno izvršavanje python aplikacija ili naredbi koje se u njemu nalaze, potrebno je koristiti wrappere u skriptama sustava PBS:
Načini pozivanja wrappera opisani su u primjerima iznad. |
...