Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Table of Contents

Uvod

Slično kao i superračunalo Supek, računalni klaster Vrančić namijenjen naprednom računanju u oblaku sastoji se od više poslužitelja različite namjene:

NamjenaBrojCPUGPURAM (GB)
CPU poslužitelji862 x AMD EPYC 7713-512
Mem poslužitelji22 X AMD EPYC 7713-

2048

GPU poslužitelji41 X AMD EPYC 77134 X NVIDIA A100512

Izvor: Prijedlog izvedbenog rješenja_Grupa 2_Storm_Computers_2.pdf

Sadržaj:

...

Poslužitelji s procesorskim resursima

Unutar poslužitelja s procesorskim resursima nalaze se dvije grupe poslužitelja koje čine jednu zajedničju zajedničku cjelinu. Ta podjela je zbog zahtjeva koja nalaže da deset poslužitelja mora imati lokalni NVMe SSD disk kapaciteta od minimalno 3.8 TB.

...

10 x (2 x 64 core AMD EPYC 7713 @ 2.0 GHz) + 76 x (2 x 64 core AMD EPYC 7713 @ 2.0 GHz) = 11 , 008 CPU procesorskih jezgrijezgi

Specifikacije procesora AMD EPYC 7763 7713 su sljedeće:

  • Broj jezgara: 64
  • Broj dretvi: 128
  • Osnovni takt: 2,45 00 GHz
  • Maksimalni takt: 3,5 2 GHz
  • Cache memorija: L3 - 256 MB, L2 - 512 kB, L1 - 32 64 kB
  • TDP: 280 255 W
  • Podržava DDR4 memorijske module do 3200 MHz
  • Podržava do osam kanala DDR4 memorije
  • PCIe verzija: PCIe 4.0

Poslužitelji  s memorijskim resursima

Unutar poslužitelja s memorijskim resursima nalaze se 2 poslužitelja, svaki sa 2 AMD EPYC 7713 @ 2.0 GHz procesora i 16 GB radne memorije po jezgri.

...

  • 2 x poslužitelj (2 x 64 core AMD EPYC 7713 @ 2.0 GHz) = 256 CPU jezgri
  • 256 CPU jezgri x 16 GB RAM = 4096 GB RAM
  • Svaki poslužitelj ima 128 CPU core-a i 2048 GB RAM-a

Poslužitelji s grafičkim procesorima

Unutar poslužitelja s grafičkim resursima nalaze se 4 poslužitelja s 4 x NVIDIA A100 GPU po poslužitelju.

...

  • 4 x 96 GB RAM = 384 GB RAM - ugrađeno 512 GB RAM-a po poslužitelju
  • 32 x 64 GB RAM modul = 2048 GB RAM-a / 4 poslužitelja = 512 GB RAM

Nvidia A100 specifikacije:


NVIDIA A100 40GB je grafička kartica koja je posebno dizajnirana za izvođenje zahtjevnih računalnih operacija, kao što su znanstveno računanje, strojno učenje i visoko učinkovito računanje. Zahvaljujući svojoj arhitekturi Ampere, NVIDIA A100 40GB omogućava poboljšanu obradu podataka i performanse u usporedbi s prethodnim NVIDIA grafičkim karticama. Njena specifikacija uključuje:

  • Arhitektura: Ampere
  • Procesor: NVIDIA A100 Tensor Core GPU
  • Broj CUDA jezgara: 6.912; razne veličine instanci do 7 MIG-a @ 5GB
  • Broj Tensor jezgara: 432
  • Memorija: 40 GB
  • Tip memorije:
  • Arhitektura: Amper
  • Broj tranzistora: 54,200 milijuna
  • Veličina memorije: 40GB
  • Tip memorije:  HBM2
  • Sabirnica: 5120 bit
  • Propusnost: 1555 GB/s
  • Jezgre: razne veličine instanci do 7 MIG-a @ 5GB
  • TDP: 500W (2000W)

Procesor NVIDIA A100 Tensor Core GPU sastoji se od 6.912 CUDA jezgara i 432 Tensor jezgara. Razlika između CUDA i Tensor jezgri može se vidjeti u njihovoj primarnoj funkciji. CUDA jezgre se koriste za paralelno izvođenje širokog raspona algoritama za obradu slika, znanstveno računanje i mnoge druge aplikacije koje se mogu paralelizirati. Tensor jezgre su posebne jezgre koje se koriste za obradu tenzora. Ove jezgre pomažu u brzom izvođenju složenih matematičkih operacija, što je ključno za izvođenje zahtjevnih operacija strojnog učenja.

Ukupni kapacitet memorije grafičke kartice je 40GB. Ova količina memorije omogućava brzo pohranjivanje velikih količina podataka koje se koriste u zahtjevnim računalnim aplikacijama. To znači da korisnici mogu obraditi velike količine podataka i smanjiti vrijeme potrebno za izvođenje računalnih operacija.

Spremišni resursi

Poslužitelji za brzo spremište

U konfiguraciji ovih spremišnih resursa nalaze se 3 poslužitelja od ukupnog kapaciteta od 400 415 TB NVMe SSD ravnomjereno raspoređenog po svim poslužiteljima.

...

  • 10 GB RAM x 9 (broj diskova) = 90 + 16 (dodatnih GB RAM-a) = 106 -> Svaki poslužitelj ima 256 GB RAM-a

Poslužitelji za standardno spremište

U konfiguraciji ovih spremišnih resursa nalazi se 6 poslužitelja od ukupno 3 PB HDD i 120 TB NVMe SSD ravnomjerno raspoređenih po svim poslužiteljima.

...

  • 28 HDD x 0,5 CPU core = 14 core + 4 = 18 CPU jezgri -> AMD EPYC 7543P 32 core @ 2.8GHz
  • 28 HDD x 5 GB RAM = 140 GB RAM + 16 GB RAM = 156 GB RAM -> Svaki poslužitelj ima 192 GB RAM

Servisni poslužitelji:

U ovoj konfiguraciji nalazi se 3 poslužitelja.

Konfiguracija jednog poslužitelja:

  • 64 CPU jezgri x 4 GB RAM = 256 GB RAM

Scality RING8 tehnologija

Scality RING Scalable Storage je potpuno distribuirani sustav implementiran na standardnim X64 poslužiteljima (minimalno tri poslužitelja). Sustav skalira na tisuće poslužitelja i stotine Petabajt-a kapaciteta spremišta. Scality RING sustav nema SPOF (Single Point Of Failure) i ne zahtjeva prekid rada za proširenja, dodavanje novih poslužitelja, planirano i neplanirano održavanje.

Glavne su programske komponente RING sustava:

  • ­ RING konektori,
  • ­ distribuirana interna NoSQL baza podataka (MESA),
  • ­ RING Storage čvorovi i IO procesi i
  • ­ RING Supervisor web bazirani portal za upravljanje i nadzor.

Osnovni su principi na kojima je dizajniran Scality RING:

  • ­ 100% paralelni dizajn za podatke i metapodatke – omogućuje povećanje kapaciteta i performanse bez SPOF-a i prekida rada
  • ­ Multiprotokolni pristup podacima – omogućuje široki spektar primjena
  • ­ Fleksibilni mehanizmi zaštite podataka - efikasna zaštita za razne tipove i veličine podataka
  • ­ Samooporavak od kvara komponenti – visoka tolerancija na višestruke ispade komponenti i automatski oporavak osiguravaju izdržljivost podataka i performansi tokom ispada komponenti
  • ­ Sloboda izbora hardware-a – omogućuje fleksibilne konfiguracije prema potrebama, izbor hardware vendora, smanjuje TCO

RING konektori su pristupne točke preko kojih aplikacije i korisnici barataju s podacima, korištenjem raznih objektnih i datotečnih protokola:

  • ­ AWS S3 API – implementacija AWS S3 REST API, s podrškom za Bucket i Object model podataka, AWS Signature v4/v2 autentikaciju, i AWS varijantu Identity and Access Management (IAM)
  • ­ http/REST (sproxyd) – nativni RING key/value REST API
  • ­ NFS v4 – SOFS volumeni prikazani kao NFS pristupne točke
  • ­ SMB 3.0 – SOFS volumeni prikazani kao SMB pristupne točke Microsoft Windows klijentima
  • ­ FUSE – SOFS volumeni prikazani kao lokalni Linux file system
  • ­ CDMI/REST – SNIA CDMI REST protokol