Računalni klaster Padobran sadrži dva reda za izvođenje poslova. Razlika između redova je u vremenu izvođenja poslova. Svakom redu određeno je minimalno i maksimalno vrijeme izvođenja. Vrijeme računanja odnosi se na parametar "walltime", i ne ovisi o broju traženih jezgara.
Posao se istekom traženog ili dodijeljenog vremena prekida.
Redovi poslova
Na Padobranu postoje dva korisnička reda, cpu s maksimalnim trajanjem poslova od 7 dana, te cpu_30 s maksimalnim trajanjem poslova od 30 dana. Cpu_30 ima pet eksluzivnih čvorova, te se preklapa s cpu redom na još šest. Na tih šest čvorova cpu_30 ima viši prioritet nego cpu red.
Napomena
PBS za sve memorijske parametre koristi notacije (kb, mb, gb, tb ...), ali se radi o MiB, GiB, TiB, te je odnos između veličina 1024, ne 1000!
Red | Broj čvorova | Broj jezgara po čvoru | Radna memorija po čvoru (GiB) | Vrijeme izvođenja poslova (h) | TMPDIR |
---|---|---|---|---|---|
cpu | 45 | 128 | 475 | 00:00:00 - 168:00:00 | /beegfs-fast/scratch |
cpu_30 | 11 - 5 eksluzivno | 128 | 475 | 168:00:01 - 720:00:00 | /beegfs-fast/scratch |
Korištenje redova
Sustav je postavljen tako da iznad svih redova postoji red za usmjeravanje RouteQ koji brine da poslovi bez definiranog reda upadnu u pravi red poslova, temeljem traženog vremena računanja. Ako poslovi ne traže računsko vrijeme u opisu poslova, automatski im se dodjeljuje 48 sati i šalju se u red cpu.
Korisnicima se savjetuje da traže vrijeme izvođenja kako bi se povećala efikasnost korištenja klastera, ali i kako bi što manje vremena provodili u redu za čekanje.
Ako korisnik pošalje posao u kojem traži red, ali ne definira vrijeme izvođenja, poslu će biti dodijeljeno maksimalno vrijeme u tom redu.
Ako posao traži red, ali i vrijeme koje ne odgovara limitima reda, na ekranu će mu se prikazati poruka:
qsub: Job violates queue and/or server resource limits
Primjeri izvođenja poslova s definiranim vremenom izvođenja
U primjerima je kao parametar izvođenja prikazan jedino zahtjev bitan za primjer.
Primjer izvođenja poslova bez definiranja vremena izvođenja, ali s definiranim redom
Backfilling
Kako bi se korisnike dodatno potaknulo definiranje vremena izvođenja, na sustavu je omogućena opcija Backfilling, tj. dozvoljava se poslovima s kraćim vremenom izvođenja da preskaču poslove s duljim vremenom izvođenja, ako je zadovoljen uvijek da izvođenje kraćeg posla neće utjecati na početak onog s duljim izvođenjem.
Primjer
Posao 101 traži 128 procesorskih jezgara i 10 sati računskog vremena. Temeljem projekta vlasnika posla 101, njegov prioritet je 1000 i kao takav je prvi na listi za izvođenje. Na klasteru je trenutačno dostupno 60 jezgara, dok će se preostalih 68 koje potražuje posao 101 osloboditi za 5 sati. Odnosno posao 101 krenut će s izvođenjem za 5 sati. Korisnik s drugog projekta s manjim prioritetom, šalje posao 105. Posao 105 traži 40 jezgara i 4 sata računskog vremena, prioritet posla je 750. Zbog opcije backfilling posao 105 kreće s izvođenjem. Sustav zna da posao 101 ne može krenuti s izvođenjem prije proteka 5 sati, te dozvoljava korištenje slobodnih jezgara na vrijeme kraće od toga.
Da je posao 105 tražio 5 ili više sati, ne bi krenuo s izvođenjem, iako je resurs koji potražuje slobodan.
Kako sustav ne bi bio previše opterećen dozvoljeno je preskakanje 5 poslova.