Hoewel geschikte harde schijven in een NAS vele jaren kunnen meegaan, komt er een moment waarop ze er de brui aan geven. Idealiter vervang je de drive voor die er finaal de geest geeft, maar hoe herken je een terminale HDD?
Leeft de harde schijf in je NAS nog zes maanden na het eerste gebruik? Dan is de kans groot dat je er vele jaren intensief plezier aan zal beleven. De meeste drives falen ofwel redelijk snel, indien er sprake is van een fabricagefout, ofwel na een lang en dienstbaar leven.
HDD’s in een NAS (of een klassieke opslagserver) krijgen het nogal te verduren. Ze zitten dicht op hun buren, waar ze elkaar storen met trillingen. Eén of meerdere gebruikers schrijven en lezen vaak simultaan data naar de HDD’s, die dat maar vlot moeten slikken. Dat Western Digital en Seagate harde schijven als NAS-drives markeren, met WD Red en Seagate Ironwolf, is meer dan marketing. De schrijven zijn intern geoptimaliseerd om aan die uitdagingen het hoofd te bieden.
Mechaniek met kleine toleranties
Hoe dan ook blijven harde schijven complexe mechanische toestellen. Binnen een 3,5 inch-behuizing roteren tot wel tien fysieke schijven aan duizenden toeren per minuut. Daarboven, op een afstand uitgedrukt in nanometers, zweeft de lees-en schrijfkop die over de schijven heen beweegt, ze magnetiseert en uitleest.

De kleinste afwijking kan voor lees- en schijfproblemen zorgen. Wanneer de schrijfkop in contact komt met de schijven, en dus letterlijk crasht, is het helemaal gedaan met de drive. Toch gebeurt dat niet, ondanks alle trillingen in de NAS. Totdat het wel zover is: een mechanisch toestel met dergelijke kleine toleranties, dat niet onderhouden of opnieuw afgesteld wordt sinds de aanschaf, zal er vroeg of laat de brui aan geven.
RAID biedt bescherming
In een NAS is dat hopelijk geen ramp. HDD’s in een NAS zijn traditioneel gekoppeld in een RAID-configuratie. Die zorgt voor redundantie. Wanneer één drive faalt, zijn alle data niet verloren. Let wel: dDe meest gangbare RAID-configuraties schrijven bits en bytes niet dubbel weg. In de plek daarvan wordt er gewerkt met een pariteits-bit.
Neem bij wijze van voorbeeld een NAS met drie drives, geschakeld in RAID-5. Dat betekent dat één drive mag uitvallen, zonder dataverlies. Dat gebeurt op bit-niveau, met de pariteitsbit. Is de som van een bit op drive één en drive twee even, dan heeft de pariteitsbit op drive drie een waarde van 1 (0+0 of 1+1). Is de som oneven, dan is heeft de bit een waarde van 0 (0+1 of 1+0).

Valt één drive uit, dan kan het RAID-systeem aan de hand van de pariteitsbit en de waarde op de andere drive uitrekenen wat de waarde van de verloren gegane bit was (0+?=1, dan had verloren bit ? de waarde 0).
Lange reconstructietijd
Valt een schijf uit, dan is het dus niet zo dat de verloren data nog beschikbaar zijn. Je moet binnen de RAID-configuratie de uitgevallen drive vervangen, waarna de verloren bits gereconstrueerd worden. Dat kan bij grotere drives verschillende dagen duren.
RAID-5 is trouwens niet de veiligste optie bij HDD’s met een capaciteit van verschillende terabytes, aangezien de overgebleven drives dagenlang hard moeten zwoegen. Doorgaans koop je drives van eenzelfde fabricagebatch op hetzelfde moment, en hebben ze dezelfde levensduur. Faalt één drive, dan is de kans dat een tweede er de brui aan geeft tijdens de reconstructie niet onbestaande.
De reconstructie van een groot RAID-systeem duurt in ieder geval een tijdje. Gedurende die tijd is het getroffen volume op je NAS niet beschikbaar. Valt een drive uit op maandagochtend, dan kan dat een heel voelbare impact hebben binnen je onderneming of team.
Proactief onderhoud
Als je een drive dan toch vervangen dient te worden, en de RAID heropgebouwd, dan doe je dat best op een opportuun moment. Daarom is het belangrijk om signalen van een verouderende HDD te herkennen. Zo kan je vervanging inplannen voor de HDD het echt finaal opgeeft.
Bespeur je signalen dat één van de HDD’s het moeilijk begint te krijgen, dan kan je bijvoorbeeld een vervanging plannen voor het weekend. Zo is de RAID-reconstructie misschien wel klaar tegen maandag. Of je kan werknemers vragen om belangrijke data even lokaal of op een ander volume te bewaren, terwijl je het nodige onderhoud uitvoert.
Herken een terminale HDD
Vier parameters helpen je om de vervanging van een HDD tijdig in te plannen.
1. Slim zijn met S.M.A.R.T
De belangrijkste en meest objectieve manier om de gezondheid van je HDD’s in het oog te houden, is S.M.A.R.T. Die afkorting staat voor Self-Monitoring, Analysis and Reporting Technology.
Harde schijven bewaren een telemetrie waaronder gegevens over leesproblemen, de doorvoersnelheid, de tijd dat het kost om de schijven op het juiste tempo te laten draaien, de tijd dat het kost om data te zoeken, en de foutwaarden die daarbij komen kijken en meer.
S.M.A.R.T. houdt die parameters bij, en kan je waarschuwen wanneer er problemen opduiken. Aangezien HDD’s veel mechanische componenten hebben, zijn er vaak tekenen van slijtage voor een component echt stuk gaat. Duurt het plots langer voor de HDD om van stilstand naar de nodige 7.200 rpm te geraken, dan illustreert dat bijvoorbeeld dat er binnenin slijtage is.

S.M.A.R.T. in detail analyseren vereist wat expertise en is gelukkig niet nodig. In het besturingssysteem van je NAS kan je periodieke uitgebreide S.M.A.R.T.-zelftests plannen. Zodra een parameter aandacht vereist, zal je daar een melding van krijgen.
Bovengemiddeld veel slechte sectoren, problemen met het draaien van de drives en fouten bij lezen en schrijven zijn allemaal tekenen aan de wand dat de degradatie van de HDD begonnen is. Krijg je daar melding van, dan is het een goed idee om de vervanging van de drive te plannen.
2. Vertraging en bestandscorruptie
S.M.A.R.T. is niet feilloos. Je kan ook zelf vaststellen dat HDD’s niet naar behoren functioneren. Slechte sectoren en blokken leiden tot de corruptie van data. Wanneer bestanden plots beschadigd lijken of niet meer willen openen, kan er iets mis zijn met de HDD.
In dat geval is het een goed idee om zelf een S.M.A.R.T-test te starten, en eens na te kijken in de logs of er zaken de problemen kunnen verklaren. Een stroomstoring of verbindingsprobleem kan eveneens verantwoordelijk zijn voor een corrupt bestand, dus misschien is er niets aan de hand. Vind je geen verklaring, zou het wel eens aan de HDD zelf kunnen liggen.
Ook lagere prestaties kunnen een nakend defect signaleren. Wanneer de lees- en schrijfsnelheid er plots op achteruit gaan, terwijl netwerk en andere omgevingsfactoren wel stabiel zijn, mag je dat niet negeren. Opnieuw zou een zelftest zoiets moeten signaleren, maar gebeurt dat niet altijd.
3. Vreemde geluiden
Gebruik tot slot je oren. HDD’s zijn nooit stil. Ze klikken, tikken en kraken op de meest onverwachte momenten, en soms met een passie. Hoor je plots geluidjes die er voordien niet waren, zoals een hoger gepiep, dan kan dat het gevolg zijn van een mechanisch probleem.
Het Griekse data-herstelbedrijf Northwind heeft op zijn website een compilatie geplaatst van geluiden en de defecten die ze signaleren. Bij dramatische geluiden is het doorgaans te laat, maar een motor die niet meer goed draait, kan je soms wel op tijd opmerken.
4. Pensioengerechtigd
Je kan een perfect gezonde HDD ook vervangen, wanneer die pensioengerechtigd is. Een harde schijf voor een server of NAS is typisch gebouwd om een vijftal jaar actief mee te gaan. In het besturingssysteem van je NAS kan je terugvinden hoelang de drive al gewerkt heeft, uitgedrukt in uren.
Nemen we vijf jaar als maatstaaf, dan is 43.800 uur het moment waarop je HDD in overtime gaat. Op dat moment is een geplande vervanging zeker te verantwoorden, al hangt het van de context af of de investering de moeite waard is. Niet iedere omgeving is immers even belastend. HDD’s in NAS voor opslag van bestanden van een zelfstandige krijgen het minder zwaar te verduren dan schijven in een NAS van een team grafische designers, die dagelijks met z’n allen tegelijk grote bestanden heen en weer kopiëren en bewerken.
Bij lichtere belasting kan een harde schijf zeker een stuk langer functioneren. Zelfs het dubbele is niet ongehoord. Sta je niet te springen om geld te investeren, dan kan overwegen het risico te nemen en te wachten tot de S.M.A.R.T.-test de alarmbellen doet afgaan, of je andere vreemde zaken tegenkomt.
Back-ups
Vergeet niet dat een NAS met RAID geen vervanging is voor een back-up. Een goede back-up-strategie volgens het 3-2-1-principe blijft essentieel, ook wanneer je de gezondheid van je schijven goed in het oog houdt. De tijdige vervanging van een oude HDD is handig om ongeplande downtime te voorkomen, maar is geen alternatief voor een correcte back-up.
