Wpis z mikrobloga

Hmm taka sytuacja.. #linux #sysadmin #admin
poprawiając monitoring na #zabbix zauważyłem że na jednej z maszyn wypadł dysk w RAID1. Zleciłem wymianę w DC. 30min i dysk SSD dodany.
Na kontrolerze #lsi znajdują się jeszcze dwa dodatkowe RAIDy, 10 jak i 1
W poziomu MegaCLI dodałem dysk i rozpoczęła się odbudowa. ( MegaCli -LDRecon -Start -r1 -Add -PhysDrv[252:5] -l1 -a0 )
Na drugi dzień, powitała mnie informacja z debug logu że RAID nadal jest degraded a z RADIu 1 zrobił się 5 (sic!)
Aktualnie wygląda to tak:

Wszystkie dyski:

----------------------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
----------------------------------------------------------------------------------------
252:0 11 Onln 0 475.905 GB SATA SSD Y N 512B Samsung SSD 850 PRO 512GB U -
252:1 15 Onln 0 475.905 GB SATA SSD Y N 512B Samsung SSD 850 PRO 512GB U -
252:2 8 Onln 0 475.905 GB SATA SSD N N 512B Samsung SSD 840 PRO Series U -
252:3 14 Onln 0 475.905 GB SATA SSD N N 512B Samsung SSD 840 PRO Series U -
252:4 10 Onln 1 475.905 GB SATA SSD N N 512B Samsung SSD 840 PRO Series U -
252:5 13 Onln 1 475.905 GB SATA SSD N N 512B Samsung SSD 840 PRO Series U -
252:6 9 Onln 2 475.905 GB SATA SSD N N 512B Samsung SSD 840 PRO Series U -
252:7 12 Onln 2 475.905 GB SATA SSD N N 512B Samsung SSD 840 PRO Series U -
----------------------------------------------------------------------------------------

Wszystkie RAIDy na kontrolerze

----------------------------------------------------------------
DG/VD TYPE State Access Consist Cache Cac sCC Size Name
----------------------------------------------------------------
0/0 RAID10 Optl RW Yes NRWTC - ON 951.810 GB
1/1 RAID5 Dgrd RW No NRWTC - ON 951.810 GB
2/2 RAID1 Optl RW Yes NRWTC - ON 475.905 GB
----------------------------------------------------------------

Dyski dla RAIDu 5:

----------------------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
----------------------------------------------------------------------------------------
252:4 10 Onln 1 475.905 GB SATA SSD N N 512B Samsung SSD 840 PRO Series U -
252:5 13 Onln 1 475.905 GB SATA SSD N N 512B Samsung SSD 840 PRO Series U -
----------------------------------------------------------------------------------------

Pierwsze co mi przychodzi do głowy, to że dali mi jakiś dysk używany, który miał w sobie juz konfigurację RAID5

Niemniej jednak trzeba to naprawić. I tu pytanie do Was Mireczki IT, wypadałoby usunąć ten dysk z RAID5 i przebudować go na RAID0, wyczyścić dysk wcześniej dodany (nastepnie usunięty) i na nowo odbudować RAID1 ?

Mam to w LVM i nie mam możliwości wykonania pvmove, brak przestrzeni. Jak to się wykrzaczy podczas tego procesu, wypadnie mi replikacja bazodanowa, niby nie problem (bo to slave) ale czasu troszkę mi zabierze przez weekend, a zaczynam od Soboty urlop.

Co robić, jak żyć? Przeczekać i wróćić do tego po urlopie? ( ͡° ͜ʖ ͡°)
Nie nie, trzeba to naprawić jak najszybciej... pytanie jak to zrobić bezpiecznie...?
  • 5
@linuksozerca: > W poziomu MegaCLI dodałem dysk i rozpoczęła się odbudowa. ( MegaCli -LDRecon -Start -r1 -Add -PhysDrv[252:5] -l1 -a0 )

@linuksozerca: i tu chyba byl twoj blad. Dysk zostal dodany a nie wymieniony. Odbudowa po wymianie dysku (wyjecie starego dodanie w to samo miejsce nowego) zaczyna sie automatycznie. Jezeli tak zostalo zrobiobe a nie zaczela sie odbudowa to mozliwe ze faktycznie na dysku byly pozostalosci innego raid a Ty
@maniac777 wg. Dokumentacji mogę zejść z 5 do 0 usuwając poprzednio dodany dysk, następnie go wyzerować i dodać na nowo w R1. W teorii oczywiście.
Jako że jedna replika się poskładała, uda mi sie jednak zrobić pvmove i usnę ten RAID i dodam na nowo.
Zakładałem że dadzą dysk nowy a nie używany.. niestety czasami trzeba pytać o wszystko.
@linuksozerca: Zmiając 5 na zero będziesz miał nadal ten sam rozmiar LUN i brak redundancji więc jest to możliwe. Z zera jedynki bez dodawania dysków nie zrobisz, bo skutkować to musiałoby zmniejszeniem LUN. Co najwyżej migracja do 10 po dodaniu dwóch kolejnych dysków.

Nie pamiętam jak jest w LSI przy obcym dysku. Pamiętam, że RAID HP nie pozwoli aż mu jasno nie karzesz usunąć starej konfiguracji.