Wpis z mikrobloga

sytuacja jest taka: dwa serwery, każdy z nich ma 8x GPU od Nvidii (dwa nvlink, po jednym na serwer), każdy serwer na debianie. Da się to zwritualizować by 16 GPU było widoczne jako jeden zasób? Wiem że są rzeczy typu Bright Cluster Manager, chociaż to jest raczej scheduler, a ja chciałbym mieć skrypty używające wielu GPU w tym samym czasie. Ktoś działał w tym temacie? Sprzęty są do #machinelearning NIE są do kopania krypto.
#pytaniedoexperta #informatyka #sztucznainteligencja #linux
  • 3
http://www.rocksclusters.org/ ?


@PiesLat2230: używam rocks cluster os od chyba 2015 lub wcześniej do wirtualizacji klastra obliczeniowego (bazującego na CPU)), gdzie można przekierunkować procesy na różne maszyny. Ale to nie znaczy że zasoby sprzętowe z wielu maszyn są widoczne z jednego miejsca. Z mojego doświadczenia Rocks jest do czegoś innego, bo bazując na HPC wymaga dedykowanych skryptów i nie pozwala z maszyny A sięgać bezpośrednio do sprzętu maszyny B (poza CPU, czyli