LSI 9750-8i RAID 5 mit IronWolf Pro 4TB merkwürdiges Verhalten
Hallo zusammen,
da ich schon seit Tagen versuche mein Raid 5 wieder stabil ans Laufen zu bekommen und jetzt mit meinem Latein am Ende bin, könnt Ihr mir vielleicht helfen?
Und zwar habe ich einen LSI 9750-8I auf einem Asus P9X79WS seit einigen Jahren im Einsatz.
Die letzte Konfiguration die schon seit Jahren läuft sind 5xSATA HDDs im Raid5.
Ab und an mal ist eine Disk ausgefallen, dann habe ich eine neue eingebaut rebuild angestoßen und gut war.
Diesmal hatte ich 2 Disk die Probleme verursacht haben.
Die Erste wurde mit einem Fehler angezeigt der jedes mal bei einem Neustart zu sehen war:
Primary DCB read error occurred: phy=5, error=0x202 und ERROR - Drive ECC error reported: phy=5, unit=-1
Paar Tage später kam noch eine Disk mit ECC Fehlern dazu die allerdings auch in der WEB-GUI auch mit einem Warning versehen war.
Ich hatte mir dann 2 IronWolf Pro 4TB HDDs dazu geholt und hatte diese nacheinander ausgetauscht.
Da fingen dann die Probleme richtig an.
Beim Neustart wurden die HDDs teilweise nicht erkannt. Teilweise nur eine davon und teilweise standen beide in "incomplete" Zustand.
Nachdem ich durch Zufall gesehen habe das meine Backplane von ICY-BOX gar keine 6gbits unterstützt, dachte ich mir ok könnte mit der Backplane zusammen hängen, da die IronWolfpro 7200er sind und die Restlichen nur 5400er.
Naja neue ICY-BOX565SSK gekauft und ausgetauscht.
Hat leider nichts gebracht.
Da die anderen HDDs auch schon älter waren habe ich dann noch 3 gleiche IronWolf Pro dazu geholt und einzeln nacheinander getauscht und jeweils ein rebuild durchgeführt.
Allerdings hat das auch nichts gebracht.
Die HDDs wurden mal willkürlich erkannt und mal nicht.
Nach langem hin und her, testen usw. musste ich feststellen das die Deleay Spinup Funktion zum Teil der Übeltäter war.
Spinup deaktiviert brachte den Erfolg.
Allerdings nicht vollständig.
- Wenn ich den PC vom Stromnetztrenne und ihn dann wieder anschließe und starte findet er jedes mal alle HDDs und alles ist gut.
- Wenn ich den PC reboote dann zeigt er mir beim Boot meist den Fehler Incomplete Drives and Others bei allen HDDs. Allerdings nicht immer. Manchmal erkennt er zumindest eine HDD oder zwei oder drei. Aber in keinem Fall findet er alle HDDs nach einem Reboot. Ich muss tatsächlich den PC komplett herunterfahren und den Stromstecker ziehen.
Das ist 100% reproduzierbar.
Heute habe ich noch weitere Tests versucht. Im Mainboard diverse Einstellungen durchprobiert. Auch im Controllerbios diverse Einstellungen probiert.
Ich hab auch mal die Stromversorgung auf andere Leitungen gelegt. Auch den Controller mal in einen anderen PCI-E Slot gesteckt.
Alles hat nichts gebracht aber mir ist dabei aufgefallen, dass bei einem komplett frischen Start alle HDDs durch den Controller angestartet werden und kurze Zeit später anfangen zu "Rattern". Wenn ich allerdings einen Reboot durchführe verhält es sich anders. Die HDDs laufen ja noch. Zu dem Zeitpunkt wo die normalerweise anfangen zu Starten und kurze Zeit später "Rattern" hört man ganz gut ein kurzes Anlaufen und Stoppen Anlaufen und Stoppen. Ca 5 oder 6 mal bis dann der Controller die Fehler anzeigt.
Die Disks hatte ich auch untereinander schon durchgetauscht und auch mit Crystaldisk und HDDTune und einem WD Tool separat getestet.
Auch habe ich mal andere Controllerports durchgetestet(also die übergeblieben Kabel mal durchgetauscht). Das Verhalten bleibt.
Das was noch sein kann ist, dass mein Netzteil Bequiet Straght Power 480w nicht genug Power hat. Aber dann verstehe ich nicht warum aus einem Kaltstart alles super ist aber bei einem Reboot solche Probleme auftreten.
Oder meint ihr der Controller hat schon einen Schaden?
Die HDDs stehen halt nicht in der Kompatibilitätsliste. Das wäre halt auch noch ein Ansatz aber das erklärt irgendwie nicht das Verhalten.
Hat vielleicht jemand eine Idee was dahinter stecken könnte?
Was ist bei einem Reboot anders als bei einen Kaltstart?
Naja und dann habe ich noch ein Anliegen.
Da der Controller auch schon in die Jahre (hab ihn seit Release glaube 2012) gekommen ist, habe ich mir jetzt zähneknirschend einen Adaptec Microsemi 3154-8i bestellt.
Naja ich hoffe mir schnellere Rebuilds, mehr Power, SSDCaching, und wie gesagt ist die LSI schon recht alt. Ewig wird die sicherlich auch nicht mehr machen.
Leider war ich so schlau und hab natürlich nicht vorher in die Kompatibilitätsliste geschaut. Die IronWolf Pro wird da in 4TB nicht gelistet. Nur 2TB und 10TB sind aufgeführt.
Ich wurde gerne die Ironwolf Pro behalten. Meint ihr das könnte zu Problemen führen oder haben die die einfach nur nicht gelistet weil Sie die nicht getestet haben?
Ich bin für jeden Tipp wie immer sehr sehr dankbar.
Auch wenn die neue Karte bald eintreffen sollte würde ich gerne rausfinden/wissen was da los ist.
Viele Grüße
Christof
PS: Firmware / Bios ist aktuell sowohl vom Board sowie dem Controller.
da ich schon seit Tagen versuche mein Raid 5 wieder stabil ans Laufen zu bekommen und jetzt mit meinem Latein am Ende bin, könnt Ihr mir vielleicht helfen?
Und zwar habe ich einen LSI 9750-8I auf einem Asus P9X79WS seit einigen Jahren im Einsatz.
Die letzte Konfiguration die schon seit Jahren läuft sind 5xSATA HDDs im Raid5.
Ab und an mal ist eine Disk ausgefallen, dann habe ich eine neue eingebaut rebuild angestoßen und gut war.
Diesmal hatte ich 2 Disk die Probleme verursacht haben.
Die Erste wurde mit einem Fehler angezeigt der jedes mal bei einem Neustart zu sehen war:
Primary DCB read error occurred: phy=5, error=0x202 und ERROR - Drive ECC error reported: phy=5, unit=-1
Paar Tage später kam noch eine Disk mit ECC Fehlern dazu die allerdings auch in der WEB-GUI auch mit einem Warning versehen war.
Ich hatte mir dann 2 IronWolf Pro 4TB HDDs dazu geholt und hatte diese nacheinander ausgetauscht.
Da fingen dann die Probleme richtig an.
Beim Neustart wurden die HDDs teilweise nicht erkannt. Teilweise nur eine davon und teilweise standen beide in "incomplete" Zustand.
Nachdem ich durch Zufall gesehen habe das meine Backplane von ICY-BOX gar keine 6gbits unterstützt, dachte ich mir ok könnte mit der Backplane zusammen hängen, da die IronWolfpro 7200er sind und die Restlichen nur 5400er.
Naja neue ICY-BOX565SSK gekauft und ausgetauscht.
Hat leider nichts gebracht.
Da die anderen HDDs auch schon älter waren habe ich dann noch 3 gleiche IronWolf Pro dazu geholt und einzeln nacheinander getauscht und jeweils ein rebuild durchgeführt.
Allerdings hat das auch nichts gebracht.
Die HDDs wurden mal willkürlich erkannt und mal nicht.
Nach langem hin und her, testen usw. musste ich feststellen das die Deleay Spinup Funktion zum Teil der Übeltäter war.
Spinup deaktiviert brachte den Erfolg.
Allerdings nicht vollständig.
- Wenn ich den PC vom Stromnetztrenne und ihn dann wieder anschließe und starte findet er jedes mal alle HDDs und alles ist gut.
- Wenn ich den PC reboote dann zeigt er mir beim Boot meist den Fehler Incomplete Drives and Others bei allen HDDs. Allerdings nicht immer. Manchmal erkennt er zumindest eine HDD oder zwei oder drei. Aber in keinem Fall findet er alle HDDs nach einem Reboot. Ich muss tatsächlich den PC komplett herunterfahren und den Stromstecker ziehen.
Das ist 100% reproduzierbar.
Heute habe ich noch weitere Tests versucht. Im Mainboard diverse Einstellungen durchprobiert. Auch im Controllerbios diverse Einstellungen probiert.
Ich hab auch mal die Stromversorgung auf andere Leitungen gelegt. Auch den Controller mal in einen anderen PCI-E Slot gesteckt.
Alles hat nichts gebracht aber mir ist dabei aufgefallen, dass bei einem komplett frischen Start alle HDDs durch den Controller angestartet werden und kurze Zeit später anfangen zu "Rattern". Wenn ich allerdings einen Reboot durchführe verhält es sich anders. Die HDDs laufen ja noch. Zu dem Zeitpunkt wo die normalerweise anfangen zu Starten und kurze Zeit später "Rattern" hört man ganz gut ein kurzes Anlaufen und Stoppen Anlaufen und Stoppen. Ca 5 oder 6 mal bis dann der Controller die Fehler anzeigt.
Die Disks hatte ich auch untereinander schon durchgetauscht und auch mit Crystaldisk und HDDTune und einem WD Tool separat getestet.
Auch habe ich mal andere Controllerports durchgetestet(also die übergeblieben Kabel mal durchgetauscht). Das Verhalten bleibt.
Das was noch sein kann ist, dass mein Netzteil Bequiet Straght Power 480w nicht genug Power hat. Aber dann verstehe ich nicht warum aus einem Kaltstart alles super ist aber bei einem Reboot solche Probleme auftreten.
Oder meint ihr der Controller hat schon einen Schaden?
Die HDDs stehen halt nicht in der Kompatibilitätsliste. Das wäre halt auch noch ein Ansatz aber das erklärt irgendwie nicht das Verhalten.
Hat vielleicht jemand eine Idee was dahinter stecken könnte?
Was ist bei einem Reboot anders als bei einen Kaltstart?
Naja und dann habe ich noch ein Anliegen.
Da der Controller auch schon in die Jahre (hab ihn seit Release glaube 2012) gekommen ist, habe ich mir jetzt zähneknirschend einen Adaptec Microsemi 3154-8i bestellt.
Naja ich hoffe mir schnellere Rebuilds, mehr Power, SSDCaching, und wie gesagt ist die LSI schon recht alt. Ewig wird die sicherlich auch nicht mehr machen.
Leider war ich so schlau und hab natürlich nicht vorher in die Kompatibilitätsliste geschaut. Die IronWolf Pro wird da in 4TB nicht gelistet. Nur 2TB und 10TB sind aufgeführt.
Ich wurde gerne die Ironwolf Pro behalten. Meint ihr das könnte zu Problemen führen oder haben die die einfach nur nicht gelistet weil Sie die nicht getestet haben?
Ich bin für jeden Tipp wie immer sehr sehr dankbar.
Auch wenn die neue Karte bald eintreffen sollte würde ich gerne rausfinden/wissen was da los ist.
Viele Grüße
Christof
PS: Firmware / Bios ist aktuell sowohl vom Board sowie dem Controller.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 620778
Url: https://administrator.de/contentid/620778
Ausgedruckt am: 22.11.2024 um 12:11 Uhr
10 Kommentare
Neuester Kommentar
Moin,,
Läßt Du die Platten alle gleichzeitig anfahren (default) oder hast Du im BIOS eingestellt, daß die nacheinander hochgefahren werden.
Wenn alle Spindeln gleichzeitig anlaufen, zieht das soviel Strom, daß einige Komponenten "zu kurz" kommen. Deswegen haben die meisten RAID-Controller eine dementsprechende Option.
Kann sein, daß Du an der kritischen Grenze bist und daher einige Platten "nicht genug Saft" bekommen, um sich rechtzeitig beim Controller zu melden.
lks
Läßt Du die Platten alle gleichzeitig anfahren (default) oder hast Du im BIOS eingestellt, daß die nacheinander hochgefahren werden.
Wenn alle Spindeln gleichzeitig anlaufen, zieht das soviel Strom, daß einige Komponenten "zu kurz" kommen. Deswegen haben die meisten RAID-Controller eine dementsprechende Option.
Kann sein, daß Du an der kritischen Grenze bist und daher einige Platten "nicht genug Saft" bekommen, um sich rechtzeitig beim Controller zu melden.
lks
Moin,
O.k. habe ich anscheinend überlesen.
Dann würde ich mal systematisch vorgehen und erstmal mit einer Platte anfangen zu testen, ob die immer zuverlässig erkannt wird. wenn das nach mehreren reboots der fall ist, würde ich die zwite dazupacken u.s.w. Dann weißt Du zumindest, ob es anden Platten selbst liegt, oder nur an der Anzahlt der Platten.
Alternativ würde icheinfach alle Platten mal in einen PC mit genügend SATA-Ports packen und dort mal schauen, ob sich imerm alle Platten melden.
Zu dem andern "Problem" mit der Kompatibilitätsliste:
Diese wachsen meistens dynamisch mit der Anzahl der getesteten Konfigurationen, so daß es oft so ist, daß andere Modelle zwar funktionieren, aber nicht in der Liste auftauchen, weil sie eben nicht getestet wurden. Leider geben die wenigsten Hersteller auch eine "negative" Kompatibilitätsliste heraus, in der sie die gesteten Komponenten aufführen, die Probleme bereiten. Da ist man dann auf sich selbst gestellt, weil dann nicht klar ist, ob das Modell nciht auf der Liste steht, weil es noch nicht getestet wurde oder weil es mit negativem Ergebnis getestet wurde.
lks
O.k. habe ich anscheinend überlesen.
Dann würde ich mal systematisch vorgehen und erstmal mit einer Platte anfangen zu testen, ob die immer zuverlässig erkannt wird. wenn das nach mehreren reboots der fall ist, würde ich die zwite dazupacken u.s.w. Dann weißt Du zumindest, ob es anden Platten selbst liegt, oder nur an der Anzahlt der Platten.
Alternativ würde icheinfach alle Platten mal in einen PC mit genügend SATA-Ports packen und dort mal schauen, ob sich imerm alle Platten melden.
Zu dem andern "Problem" mit der Kompatibilitätsliste:
Diese wachsen meistens dynamisch mit der Anzahl der getesteten Konfigurationen, so daß es oft so ist, daß andere Modelle zwar funktionieren, aber nicht in der Liste auftauchen, weil sie eben nicht getestet wurden. Leider geben die wenigsten Hersteller auch eine "negative" Kompatibilitätsliste heraus, in der sie die gesteten Komponenten aufführen, die Probleme bereiten. Da ist man dann auf sich selbst gestellt, weil dann nicht klar ist, ob das Modell nciht auf der Liste steht, weil es noch nicht getestet wurde oder weil es mit negativem Ergebnis getestet wurde.
lks
Und hoffentlich keine SMR Platten:
https://www.heise.de/newsticker/meldung/Manche-WD-Red-Festplatten-fuer-N ...
https://www.heise.de/newsticker/meldung/Manche-WD-Red-Festplatten-fuer-N ...
Zitat von @aqui:
Und hoffentlich keine SMR Platten:
https://www.heise.de/newsticker/meldung/Manche-WD-Red-Festplatten-fuer-N ...
Und hoffentlich keine SMR Platten:
https://www.heise.de/newsticker/meldung/Manche-WD-Red-Festplatten-fuer-N ...
Die Ironwolfves sind laut Seagate CMR-Platten.
SMR war auch mein erster Verdacht, aber wenn er tatsächlich Ironwolfves hat, sollte es nicht daran liegen.
lks