Wpis z mikrobloga

Mam cztery dyski, chcę na nich przetrzymywać bardzo ważne dane, ale też jest ich bardzo dużo, dlatego mirror z wszystkich czterech odpada. więc opcje są takie: raid10 albo raid6/raid-z2. Wydaje się że raid6/raid-z2 będzie lepszy, bo dwa dowolne dyski mogą paść i dane nadal bezpieczne, w przeciwieństwie to raid10 - gdzie jeśli padną dwa dyski to mamy 50/50 czy oba były z tej samej pary lustra czy nie... z drugiej strony raid10 jest prostrzy, mniej obciąża procesor, zarówno w czasie pracy jaki i przy ew. naprawie macierzy, szybkość odczyt/zapis to sprawa drugorzędna byle nie zwolniło jakoś drastycznie...

Pozostaje sobie odpowiedzieć na jedno zajebiście matematyczne pytanie:

Jakie jest prawdopodobieństwo że dwa dyski padną w krótkim odstępie czasu (5dni, które potencjalnie potrzebuję na zastąpienie pierwszego wadliwego dysku). Zakładając że prawdopodobieństwo padnięcia dysku w ciągu roku to 5%, to:

1. jakie jest prawdopodobieństwo tego że w ciągu roku padną dwa dyski?
2. jakie jest prawdopodobieństwo tego że w ciągu roku padną dwa dyski w odstępie 5 dni?

Pytanie bonusowe, czy ilość dysków na znaczenie, czy jeśli będę miał osiem dysków, to czy prawdopodobieństwo padnięcia dwóch dysków w ciągu roku się zmienia?

#linux #raid #statystyka #matematyka
keny-keczuloki-anuloki - Mam cztery dyski, chcę na nich przetrzymywać bardzo ważne da...

źródło: comment_1666296684g291tq3JYXc9dUuL1p5vSp.gif

Pobierz
  • 12
@keny-keczuloki-anuloki:
Pierwsze:
(4) * (4-1) * 5% * 5%
Czyli 3'%.
Drugie:
(4) * (4-1) * 5% * 5% * 5/365
Czyli około 1 do 2400.

Myślałem że 5% to dużo, ale po przemyśleniu w firmie gdzie pracowałem przy dwudziestu dyskach co roku jeden padał, więc realna wartość. Komputery bardzo stare, więc to 5% to górne oszacowanie. Ale takie właśnie trzeba brać.
@TX2022: no już nie wiem na co się zdecydować, bo z tego kalkulatora https://www.servethehome.com/raid-calculator/raid-reliability-calculator-simple-mttdl-model/ wynika że raid10 daje średni czas do utraty danych na poziomie 100tyś lat, w końcu nie pracuję dla CERN'u więc chyba mi to wystarczy, (mam dodatkowo kopie zapasowe), więc uszkodzenie macierzy to jeszcze nie katastrofa - utrata dnia pracy. No ale z drugiej strony raid6 daje średni czas do utraty danych na poziomie 80 milinów lat, ~800x
@rysiekryszard: cały ten raid o którym mówimy to jest tylko raid na którym będzie postawiony system (w tym dane usera itd), do tego w kompie jest raid1 z dysków hdd który przechowuje kopie tego podstawowego systemu plików, wraz z historią - snapszotów nie usuwam. Niektóre datasety snapshotują się 4x dziennie, mniej ważne 1x dziennie, dodatkowo partycja z OS przy każdym starcie, każdy snapshot jest od razu wysyłany na macierz hdd. Te