torsten73
Goto Top

Intel Onbard Raid ICH9R erkennt defekte Festplatte nicht zuverlässig (Serverboard Intel S3210SH)

So viel Arbeit kann es kosten wenn man auf dedizierte Raid Kontroller verzichtet...

Hallo,
Leider mußte ich feststellen, dass es mit der Funktionalität und vor allem Zuverlässigkeit nicht weit her ist.

Mein Erfahrungsbericht beruht sich auf unseren Server, bestehend aus einem 2 Jahre altem Intel Serverboard S3210SH welches mit der Ich9R bestückt ist. Daran angeschlossen sind 4 Server Class WD1500ADFD Raptor 150GB im Raid 10.

Nun plötzlich heute morgen hing der Rechner. Erster Reset brachte es nur bis zum Maus Zeiger, zweiter Reset startete das System normal durch stürzte aber innerhalb weniger Minuten wieder mit Bluescreen ab, während Acronis seine Sicherung erstellen wollte, die es nachts nicht geschafft hat.
Vom vorherigen Bluescrenn kam der Hinweis den Raid Treiber zu aktualisieren (alt V8.8). Gesagt getan Treiber Update durchgeführt (V8.9), vorher natürlich chkdsk durchgeführt und wieder Bluescreen beim Treibersetup. Trotz mehrfacher Resets meldete bisher der Raid Kontroller immer noch, dass alles in Ordnung wäre. Leider stürzte jetzt das System nun schon bereits beim Startversuch mit Bluescreen ab.

Dann kamen das üblichen Fehlersuchprozedere, Memtest, Primtest und mit Hilfe der UBCD Windows ein CHKDSK von allen Laufwerken. Lediglich der Checkdisk von Laufwerk C dauerte sehr lange, was schon ungewöhnlich war. Danach weil nichts zu finden war wieder ein Neustart und dieses Mal konnte ich wieder den SBS Hochfahren. Nun sah man auf einmal ein "Verify" vom Kontroller und auch auf der Intel Matrix Console wurde bereits Laufwerk 3+4 +überprüft. Hier würden auf einmal Fehler gefunden, und dabei fing das System an wieder hängen zu bleiben, zwar noch ohne Bluescreen, aber es war zeitweilig wie eingefroren bis es dann wieder einen Bluescreen gab.

Der nächste Start offenbarte dann auf einmal ein degraded Raid, im Menü war endlich die HD4 rausgeflogen. Also habe ich die Platte ausgebaut und in einem anderen System mit den WDC Diagnostic Tools geprüft. Nach rund 1/3 beendete sich der Intensiv Test mit Fehler zu viele Read Errors! Zur Sicherheit hatte ich die 2. Spiegelplatte auch noch getestet, diese war aber unauffällig.

Übrigens sind alle VolumenRückSchreibcaches auf dem Raidcontrollers bereits seit Monaten deaktiviert und auch dar Festplatten DatenCache ist deaktiviert, da es in den Anfängen immer mal wieder zum Ausfall der einen oder anderen Platte geführt hat. Auch dass führte zum Absturz des Rechners. Dies war nur in den ersten 2 Monaten aufgetreten, danach war endlich Ruhe.

Fazit:
- Viel Arbeit und mehrere Stunden Ausfall des Servers bis der nicht eindeutige Fehler gefunden wurde.
- Die SMART Funktion des Ich9r ist nicht zu gebrauchen
- Mediendefekte führen zum Absturz des Systems, ein absolutes Unding bei einem Raid10. Die Adaptec Controller melden schon die kleinsten Lese/Schreibfehler/Timeouts und nehmen die Platte raus, sobald die Fehler zu oft aufgetreten sind. Der eigentliche Sinn, ein System weiterlaufen zu lassen wenn während des Betriebs eine Platte ausfällt ist damit nicht möglich!
- Eine defekte Platte wird viel zu spät erkannt
- verschenkte Leistung und Geschwindigkeit, da die Caches nicht genutzt werden können.

Ein recht trauriges Fazit und die Lehre daraus, auch bei preiswerten Systemen nicht auf echte Raidcontroller zu verzichten.

Ich hoffe das wird dem einen oder anderem bei der Entscheidungsfindung bezüglich der Controllerwahl helfen oder die nächste Fehlersuche beim Onboard Raid auf die Platte direkt zu lenken.

Content-Key: 137446

Url: https://administrator.de/contentid/137446

Ausgedruckt am: 29.03.2024 um 06:03 Uhr

Mitglied: StefanKittel
StefanKittel 07.03.2010, aktualisiert am 18.10.2012 um 18:41:22 Uhr
Goto Top
Hallo,

schau mal hier: Ein ganz aktuelles persönliches Erlebniss warum man RAID nicht verwenden sollte (schon gar nichts anderes als Raid 1)
Lieber einen richtigen RAID Controller verwenden...

Stefan
Mitglied: Torsten73
Torsten73 08.03.2010 um 08:31:32 Uhr
Goto Top
Ist ja auch mein Fazit.
Ich finde es nur äußerst beschämend, dass dies auch bei den Intel Server Boards der Fall ist. Ich spreche hier nicht von Desktop Platinen die noch nicht mal die Hälfte kosten!
Zumindest die Redundanz hätte ich erwartet, aber da hat auch Intel seine Hausaufgaben nicht gemacht.

Man darf nicht vergessen, dass bei einem SBS2003 nicht so ohne weiteres die 400-500€ für einen guten HardwareRaid Controller drin ist.
Mitglied: 41064
41064 12.03.2010 um 05:23:08 Uhr
Goto Top
Hi, da kann ich nur zustimmen, der ICH9R ist für die Tonne, doch leider nicht nur dieser. Man kann sagen das die meisten Onboardcontroller (Software Raid-Controller) nix nützen. Die Fehlererkennung wird durch die Software durchgeführt, die wiederum mit dem Betriebssystem läuft. Wenn Windows also nen Fehler Registriert kommt der Bluescreen. Anders ist es bei den richtigen Controllern (Hardware Raid), Da erkennt der Controller den Fehler und schaltet dann um auf die funktionsfähigen platten. Windows bekommt davon nix mit.

PS: Ein vier Kanal Sata2 Raid Controller gibts von Adaptec ab ca 264 Euro.
Mitglied: StefanKittel
StefanKittel 12.03.2010 um 08:11:17 Uhr
Goto Top
Moin,

ich habe hier einen 2420sa und einen 2820sa bei ebay. Kaum gelaufen da aus einem Reserveserver. Vieleicht ist was für Dich bei
http://cgi.ebay.de/ws/eBayISAPI.dll?ViewItem&item=320498866631
http://cgi.ebay.de/ws/eBayISAPI.dll?ViewItem&item=320498866713

Stefan