Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Panel
titleSadržaj

Table of Contents
outlinetrue
stylenone

Paralelno računarstvo

...

U današnje vrijeme teško je zamisliti život bez računala, koji su kroz godine postajali sve “jači” i “brži”. Budući da se kroz godine razvoja računala došlo do fizičkih limita tehnologije poluvodiča sve je teže pronaći nove načine za ubrzavanje procesa i zadovoljavanje sve većih potreba naprednijih korisnika. Mnoge grane znanosti i ljudske djelatnosti (fizika, farmacija, inžinjerski problemi, ekonomija, vojne primjene...) imaju potrebu za ogromnom računarskom snagom koju ne mogu zadovoljiti ni najjače radne stanice. Iz tog razloga pribjegava se paralelizaciji procesa.

Paralelizacijom omogućavamo da se problem podjeli na više manjih radnji, operacija ili proračuna koji se izvode istovremeno. Imajući na umu da u današnje vrijeme i najslabija stolna računala imaju najmanje dvije CPU jezgre, možemo zaključiti da su sva današnja računala zapravo mali paralelni sustavi. Naravno, da bi paralelizacija uopće bila moguća, aplikacije moraju podržavati takav način rada, što razvoj aplikacija čini znatno složenijim nego prije. Ukoliko naši algoritmi nisu optimizirani za ovakav način rada, paralelizacijom procesa vrijeme izvođenja paralelne varijante biti će jednako ili čak i duže, nego u serijskoj varijanti.

Paralelno sklopovlje

...

Superračunala su računala koja u trenutku svog nastanka spadaju među najmoćnija dostupna računala za zahtjevne računalne probleme. Procesorska snaga superračunala često se koristi za rješavanje samo jednog specifičnog problema, te su takva superračunala obično hardverski i softverski prilagođena vrsti zadataka koje će morati obavljati.

...

  • vektorska superračunala - Cray SV, NEC SX;

  • velika paralelna računala (MPP – eng. Massively parallel processorsParallel Processors) - IBM BlueGene/Q, Cray XC40;

  • računalni klasteri – sastoje se od više međusobno povezanih računala koja pomoću softwarea funkcioniraju poput jednog superračunala.

Računalni klasteri

...

Uopćeno gledajući, klaster je skupina nezavisno djelujućih elemenata povezanih nekim medijem u cilju koordiniranog i kooperativnog ponašanja. Računalni klaster nije precizno definiran pojam pa se čak i skup nezavisnih računala može smatrati klasterom ukoliko postoji neki minimalan vid i stupanj integracije.

...

  • klastere s visokom učinkovitošću – HPC – eng. High Performance Computing,

  • klastere s visokom propusnošću – HT – eng– eng. High Throughput,

  • klastere s visokom dostupnošću – HA – eng– eng. High Availability,

  • klastere za ravnomjerno opterećenje – LB – eng. Load Balancing,

  • hibridne klastere (sadrže specifične uređaje – matematičke uređaje, Graphics Processing Unit...)

Računalni klaster Isabella spada u HPC skupinu klastera, odnosno Beowulf HPC klastere. Računalni klasteri su široko rasprostranjeni u paralelnom računarstvu i čine više od 80% Top500 liste najmoćnijih računala.

BEOWULF

...

Beowulf je naziv za koncept HPC klastera koji je 1994. godinerazvijen u NASA Goddard Space Flight centru. Tada je korištenjem 16 komercijalno dobavljivih računala baziranih na Intel 100MHz 486 procesorima, povezanim dvostrukim 10 Mbps Ethernet LAN-om te pogonjenih Linux operativnim sustavom i PVM (Paralel Virtual Machine) bibliotekama izgrađen klaster kojim su demonstrirane primjenjivost, performanse i financijska isplativost Beowulf sustava u znanstvenim računalnim aplikacijama.

...

S obzirom da je besplatan, prilagodljiv i ima otvoreni kod, Linux je ubrzo postao najprihvatljiviji operativni sustav za izgradnju klastera. Na osnovi najraširenijih distribucija Linuxa – Red Hat i Debian izgrađeni su gotovi paketi za izgradnju klastera od kojih je jedan - NPACI Rocks Clustering Toolkit - korišten i u izvedbi računalnog klastera Isabella.

Rocks

Distribucija klastera NPACI Rocks sadrži sve bitne programske komponenete za ostvarenje klasterskog sustava. Pored operacijskog sustava (RedHat Enterprise Linux 3.0) Rocks distribucija sadrži i ostale elemente koji omogućavaju izvedbu klastera:

...

biblioteke za prijenos poruka koje omogućavaju distribuirano/paralelno izvođenje aplikacija- MPI, PVM, LAM

...

.

...

...

paralelni datotečni sustav, koji je namjenjen brzoj pohrani velike količine podataka - PVFS

...

sustav za nadzor klastera - Ganglia

...

sustav za brzu instalaciju i izvedbu - Anaconda

...

bazu podataka u kojoj se smještaju svi podaci nužni za rad i konfiguraciju klastera

...

mrežne servise nužne za funkcioniranje klastera (NTP, 411, NFS, i druge).

RedHat Linux na kojem je bazirana Rocks distribucija zasnovan je na RPM (Redhat Package Manager) paketnom sustavu.

Većina znanstvenih aplikacija distribuira se u RPM formi, a druge programske pakete moguće je (relativno jednostavno) pretvoriti u RPM paket. Za pakete koji traže dodatnu prilagodbu našim potrebama, sustav ROCKS omogućuje definiranje parametara za instalaciju pojedinih paketa,te dodavanje skripti koje se izršavaju prije i poslije instalacije pojedinog paketa (npr. podešavanje konfiguracijskih fileova tog paketa našim potrebama).

Sustavi za upravljanje poslovima

...

Sustavi za upravljanje poslovima (JMS) upravljaju izvođenjem korisničkih aplikacija na klasterima (vidi članak "Sustavi za Pokretanje i upravljanje poslovima"). Slika prikazuje arhitektura tipičnog JMS-a. JMS-ovi su centralizirani sustavi čiji su središnje komponente smještene na zasebnom računalu. Kod Beowulf klastera je to frontend.

Sustav za upravljanje poslovima se sastoji tri komponente:

  • Reda reda poslova (engleng. Queue Manager),R

  • aspoređivača raspoređivača poslova (engleng. Scheduler),

  • Upravitelja upravitelja resursima (engleng. Resource Manager).

Arhitektura tipičnog JMS-a. Image Modified

Korisnik pomoću naredbi JMS-a (npr. qsub, condor_submit, itd.) pokreće aplikacije. Zahtjevi se spremaju u nizove poslova u kojima čekajupočetak čekaju početak izvođenja. Primjer stanja u redu poslova na produkcijskom klasteru Isabella koji koristi sustav za upravljanje poslovima SGE:

Prva četiri posla su aktivna, a 5. čeka na izvođenje.

Code Block
languagetext
job-ID    name         user     state submit/start
-------------------------------------------------------------
3504    f2b14f2.ru   gkovacev     r     11/19/2004 01:41:01
3426    s2312-153.   Mpavicic     r     11/12/2004 22:35:22
3531    run.scr      zglasova     r     11/22/2004 11:25:06
3420    racun3       rvianell     r     11/14/2004 20:38:51
3532    submit2      bkovacev     qw    11/22/2004 11:32:57

Komponenta Red red poslova prima zahtjeve za izvršavanjem poslova od korisnika, sprema poslove u redove i upravlja redovima poslova. Red poslova kontaktira komponentu Raspoređivač raspoređivač poslova i šalje podatke o poslovima koji čekaju u redovima. Korisnik pomoću Reda reda poslova dohvaća sve informacije o svojim poslovima. Dodatno, Red red poslova sprema podatke o izvršenim poslovima (npr. količina memorije, trajanje posla) te različitih statistika o poslovima.

Komponenta Raspoređivač raspoređivač poslova odgovorna je za određivanje načina izvođenja poslova, tj. definiranje kada i gdje će se pojedini poslovi izvoditi. Pri tome Raspoređivač raspoređivač koristi tri skupa podataka: podatke o poslu (npr. zahtijevani broj procesora, količina memorije i HD), podatke o čvorovima klastera (npr. opterećenost čvorova, količina slobodne memorije i HD) i utvrđenih pravila, policy raspoređivanja. Podatke o poslovima dobiva od Reds reda poslova, a podatke o stanju i opterećenosti resursa od Upravitelja upravitelja resursima. Politike raspoređivanje definira administrator klastera i na osnovu njih se definira politika korištenja klastera, tj. definira se koja vrsta poslova (npr. duži, kraći, usporedni, interaktivni) ima prednost. Raspoređivač poslova zadužen je da, u skladu s politikom raspoređivanja, optimira korištenje klastera.

Upravitelj resursima zadužen je za prikupljanje podataka o stanju čvorova te pokretanje i praćenje izvršavanja poslova. Upravitelj Resursima resursima se sastoji od dvije komponente: poslužitelja i klijenata. Klijenti su servisi koji se izvršavaju na svim čvorovima klastera i zaduženi su za pripremanje okoline za izvršavanje poslova, praćenje stanja čvorova tepokretanje te pokretanje i praćenje izvođenjakorisničkih izvođenja korisničkih aplikacija.Poslužitelj je servis smješten na frontendu koji prikuplja informacije od klijenata, šalje poslove na izvođenje klijentima te pruža informacije komponentama Raspoređivač raspoređivač i Red red poslova.

Osim SGE sustava za upravljanje poslovima, ovdje možete pronaći nešto više i o Torque i Maui sustavu.

Datotečni sustavi

...

Datotečni sustav je tip pohranjivanja i organiziranja podataka u spremnik podataka kojim se koristi operativni sustav. To je zapravo skup pravila I i metoda pohrane podataka tako da operativni sustav u svakom trenutku jasno raspoznaje gdje se nalazi početak, a gdje kraj pohranjene informacije.

Na SRCU Srcu je u uporabi BeeGFS paralelni datotečni sustav. Takav sustav omogućava paralelno spremanje datoteka na više podatkovnih elemenata i učinkovit je za spremanje velikih datoteka.

Računalni klaster Isabella

...

Računalni klaster Isabella je nastao 2002. godine s ciljem da omogući svim zainteresiranim hrvatskim znanstvenicima pristup računalnom klasteru i rad na europskom projektu DataGrid kojeg vodi CERN.

Danas se Isabella sastoji od 40 135 računalnih čvorova koji ukupno sadržavaju 704 procesorske jezgrei 3100 procesorskih jezgri i 12 grafičkih procesora kao zajednički resurs svih znanstvenika u Hrvatskoj omogućava korištenje značajnih računalnih resursa pri zahtjevnim obradama podataka u sklopu znanstveno-istraživačkih projekata.

Dio čvorova povezan je u jedinstveni virtualni računalni sustav (Single System Image, SSI) pomoću sustava ScaleMP - ukupno 160 procesorskih jezgri i 2 TB radne memorije.

Svim suradnicima projekata prijavljenih pri Ministarstvu znanosti obrazovanja i športa omogućena je uporaba klastera,a detalje o uvjetima i njegova korištenja potražite na ovim stranicama.

Tehničke specifikacije

...

40 računalnih čvorova

...

704 CPU procesorskih jezgri

...

5 TB radne memorije

...

110 TB trajnog podatkovnog prostora (/home)

...

90 TB privremenog dijeljenog podatkovnog prostora (/shared)

...

Infiniband QDR (40 Gb/s) i FDR (56 Gb/s)

Na službenim stranicama računalnog klastera Isabella možete pronaći sve novosti, tehničke karakteristike klastera te nadzor klastera.

Kontakt službe pomoći: isabella@srce.hr.

ScaleMP vSMP

...