Hardware-RAID-Controller erkennt Fetplatten nicht richtig
Moin Moin,
wir haben uns zwei Server mit ICP-Vortex RAID-Controllern zugelegt.
Es handelt sich um ICP 9014RO Hardware-SCSI-RAIDS verbunden mit je 3 Fujitsu Festplatten mit 73GB.
Auf beiden Controllern ist ein RAID1 mit Hotspare konfiguriert. Auf beiden Server läuft Ubuntu Server.
Nun tritt bei beiden Servern das selbe Problem auf unabhängig davon ob das Betriebssystem schon geladen wurde oder nicht:
- Es beginnt damit das nachdem zuerst alle 3 Festplatten einwandfrei erkannt wurden, eine Festplatte aus der Konfiguration verschwindet und auch vom Controller nicht mehr gefunden wird.
- Nach einiger Zeit oder einem Reboot wird die zweite Festplatte in der RAID-Konfiguration als fehlerhaft erkannt.
- Die letzte Festplatte bleibt aber funktionsfähig und das Betriebssystem lässt sich auch vom unvollständigen RAID weiterhin starten.
- Beim Neustart braucht der RAID-Controller bei 3 angeschlossenen Festplatten ca 5Min zum Booten. Sind nur 2 Festplatten angeschlossen so dauert es nur ca 15 Sekunden.
Nun haben wir folgendes probiert:
1. Tauschen des SCSI-Kabels und des Terminators.
2. Tauschen der Anschlüsse der Festplatten Stromversorgung
3. Tauschen der RAID-Controller untereinanader
4. Tauschen einzelner Festplatten
Ergebnis: keine Änderung
5. Anschließen des Kabels an die Festplatten in umgekehrter Reihenfolge
Ergebnis: Es wird immer die am weitesten von Controller entfernte Festplatte nicht erkannt und die in der Mitte hat nach einer Weile Fehler, unabhängig von der ID.
Ich würde ja normalerweise auf das Kabel oder den Terminator tippen aber die haben wir bereits 4 mal getauscht.
Zur Hardwarekonfiguration:
Die Festplatten haben die IDs 0 bis 2 der Controller die 7.
Die Terminierung des Controllers steht auf 'Auto'. (Ansonsten gibt es nur noch 'Off')
Die gesamte übrige Hardware (Mainboard,CPU,Stromversorgung) benutzen wir auch in einem dritten Server allerdings mit einem 3Ware SATA-RAID dieser funktioniert einwandfrei.
Mir ist das Ganze ein ziemliches Rätsel oder wir haben einfach nur Tomaten auf den Augen.
wir haben uns zwei Server mit ICP-Vortex RAID-Controllern zugelegt.
Es handelt sich um ICP 9014RO Hardware-SCSI-RAIDS verbunden mit je 3 Fujitsu Festplatten mit 73GB.
Auf beiden Controllern ist ein RAID1 mit Hotspare konfiguriert. Auf beiden Server läuft Ubuntu Server.
Nun tritt bei beiden Servern das selbe Problem auf unabhängig davon ob das Betriebssystem schon geladen wurde oder nicht:
- Es beginnt damit das nachdem zuerst alle 3 Festplatten einwandfrei erkannt wurden, eine Festplatte aus der Konfiguration verschwindet und auch vom Controller nicht mehr gefunden wird.
- Nach einiger Zeit oder einem Reboot wird die zweite Festplatte in der RAID-Konfiguration als fehlerhaft erkannt.
- Die letzte Festplatte bleibt aber funktionsfähig und das Betriebssystem lässt sich auch vom unvollständigen RAID weiterhin starten.
- Beim Neustart braucht der RAID-Controller bei 3 angeschlossenen Festplatten ca 5Min zum Booten. Sind nur 2 Festplatten angeschlossen so dauert es nur ca 15 Sekunden.
Nun haben wir folgendes probiert:
1. Tauschen des SCSI-Kabels und des Terminators.
2. Tauschen der Anschlüsse der Festplatten Stromversorgung
3. Tauschen der RAID-Controller untereinanader
4. Tauschen einzelner Festplatten
Ergebnis: keine Änderung
5. Anschließen des Kabels an die Festplatten in umgekehrter Reihenfolge
Ergebnis: Es wird immer die am weitesten von Controller entfernte Festplatte nicht erkannt und die in der Mitte hat nach einer Weile Fehler, unabhängig von der ID.
Ich würde ja normalerweise auf das Kabel oder den Terminator tippen aber die haben wir bereits 4 mal getauscht.
Zur Hardwarekonfiguration:
Die Festplatten haben die IDs 0 bis 2 der Controller die 7.
Die Terminierung des Controllers steht auf 'Auto'. (Ansonsten gibt es nur noch 'Off')
Die gesamte übrige Hardware (Mainboard,CPU,Stromversorgung) benutzen wir auch in einem dritten Server allerdings mit einem 3Ware SATA-RAID dieser funktioniert einwandfrei.
Mir ist das Ganze ein ziemliches Rätsel oder wir haben einfach nur Tomaten auf den Augen.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 56953
Url: https://administrator.de/contentid/56953
Ausgedruckt am: 22.11.2024 um 15:11 Uhr
8 Kommentare
Neuester Kommentar
Hallo,
ich bitte um nähere Angaben zu den verwendeten Fuji-Festplatten: Typ, FW-Version, write-cache ein oder ausgeschaltet, 68- oder 80-polig (SCA), wenn letzteres: im HotSwap-Rahmen an einer Backplane oder an SCA zu 68polig-Adapter ?
Allgemein:
Steckt auf dem Kabel ein aktiver LVD-Terminator oder wird etwa passiv terminiert ?
Wenn es 68polige Platten sind hilft es manchmal, auf der letzten (am weitesten entfernten) Platte TermPower einzuschalten.
Qualtät der SCSI-Kabel (meines Wissens steckt ICP/Adaptec keine Kabel dazu), wirklich U320 zertifiziert ?
Letzte verfügbare FW (Nov. 2006) auf dem Controller ?
Welcher Treiber wird verwendet ?
Ist der StorageManager installiert ?
freundliche Grüße
SteffenF
ich bitte um nähere Angaben zu den verwendeten Fuji-Festplatten: Typ, FW-Version, write-cache ein oder ausgeschaltet, 68- oder 80-polig (SCA), wenn letzteres: im HotSwap-Rahmen an einer Backplane oder an SCA zu 68polig-Adapter ?
Allgemein:
Steckt auf dem Kabel ein aktiver LVD-Terminator oder wird etwa passiv terminiert ?
Wenn es 68polige Platten sind hilft es manchmal, auf der letzten (am weitesten entfernten) Platte TermPower einzuschalten.
Qualtät der SCSI-Kabel (meines Wissens steckt ICP/Adaptec keine Kabel dazu), wirklich U320 zertifiziert ?
Letzte verfügbare FW (Nov. 2006) auf dem Controller ?
Welcher Treiber wird verwendet ?
Ist der StorageManager installiert ?
freundliche Grüße
SteffenF
Hallo,
der verwendete ICP ist ein sogenannter CacheController (256MB ECC onBoard). Deshalb ist auf serverspezifizierten Festplatten der WriteCache factorydefault aus - kann da nämlich durchaus zu Fehlern kommen. Der von Ihnen verwendete Typ MAW3073NP ist aber eher eine Workstationplatte (schon daran zu erkennen, daß sie einen 68poligen Anschluß hat, neuere Serverplatten kommen allgemeinhin mit 80polig SCA), und bei denen ist der WriteCache eingeschaltet.
Mit der Qualität der Kabel (siehe hier http://www.adaptec.com/en-US/_whitepapers/tech/scsi/cables_u320.htm ) und Terminatoren steht und fällt jede SCSI-Konfig. ! Früher gab Adaptec (ICP ist nach leidvollem Intermezzo bei Intel jetzt bei Adaptec) auch schon mal konkrete Hinweise, welche Kabel welchen Herstellers bevorzugt werden. Kleiner Tip: in vielen von mir betreuten Servern steckt Foxconn.
Meine Frage zum verwendeten Treiber haben Sie leider unbeantwortet gelassen: Ubuntu basiert auf Debian und dafür bietet ICP/Adaptec keine Treiber an, allerdings die LinuxSourceCodes für Kernel 2.4 und 2.6 --> auf zum fröhlichen Kompilieren
Auch die Antwort auf die Frage, ob der Storage Manager installiert ist sind Sie mir leider schuldig geblieben - anhand der Fehlerlogs hätten wir möglicherweise das Problem eingrenzen können.
Die lange Bootzeit mit drei Platten führe ich darauf zurück, daß der Controller unter Einbeziehung des Spare ein Rebuild versucht, aber wegen zu vieler Fehler aufgibt.
Viel Erfolg und freundliche Grüße
SteffenF
der verwendete ICP ist ein sogenannter CacheController (256MB ECC onBoard). Deshalb ist auf serverspezifizierten Festplatten der WriteCache factorydefault aus - kann da nämlich durchaus zu Fehlern kommen. Der von Ihnen verwendete Typ MAW3073NP ist aber eher eine Workstationplatte (schon daran zu erkennen, daß sie einen 68poligen Anschluß hat, neuere Serverplatten kommen allgemeinhin mit 80polig SCA), und bei denen ist der WriteCache eingeschaltet.
Mit der Qualität der Kabel (siehe hier http://www.adaptec.com/en-US/_whitepapers/tech/scsi/cables_u320.htm ) und Terminatoren steht und fällt jede SCSI-Konfig. ! Früher gab Adaptec (ICP ist nach leidvollem Intermezzo bei Intel jetzt bei Adaptec) auch schon mal konkrete Hinweise, welche Kabel welchen Herstellers bevorzugt werden. Kleiner Tip: in vielen von mir betreuten Servern steckt Foxconn.
Meine Frage zum verwendeten Treiber haben Sie leider unbeantwortet gelassen: Ubuntu basiert auf Debian und dafür bietet ICP/Adaptec keine Treiber an, allerdings die LinuxSourceCodes für Kernel 2.4 und 2.6 --> auf zum fröhlichen Kompilieren
Auch die Antwort auf die Frage, ob der Storage Manager installiert ist sind Sie mir leider schuldig geblieben - anhand der Fehlerlogs hätten wir möglicherweise das Problem eingrenzen können.
Die lange Bootzeit mit drei Platten führe ich darauf zurück, daß der Controller unter Einbeziehung des Spare ein Rebuild versucht, aber wegen zu vieler Fehler aufgibt.
Viel Erfolg und freundliche Grüße
SteffenF
Hallo,
meine Empfehlung für Kabel /Terminator wäre z.B. http://www.lindy.com/de/productfolder/03/33/33177/index.php und http://www.lindy.com/de/productfolder/07/70381/index.php .
Das Fallback ist ein ziemlich eineindeutiger Hinweis auf schlechte Kabel / Terminator-Qualität, spätestens dann, wenn er auf asynchron zurückfällt (kann Sie beruhigen, der Controller meldet das Teil viel eher ab) ist Feierabend mit dem RAID.
Viel Erfolg
würde mich über positives feedback freuen (dann könnte das Thema auch mit einem grünen Haken versehen werden )
freundliche Grüße
SteffenF
meine Empfehlung für Kabel /Terminator wäre z.B. http://www.lindy.com/de/productfolder/03/33/33177/index.php und http://www.lindy.com/de/productfolder/07/70381/index.php .
Das Fallback ist ein ziemlich eineindeutiger Hinweis auf schlechte Kabel / Terminator-Qualität, spätestens dann, wenn er auf asynchron zurückfällt (kann Sie beruhigen, der Controller meldet das Teil viel eher ab) ist Feierabend mit dem RAID.
Viel Erfolg
würde mich über positives feedback freuen (dann könnte das Thema auch mit einem grünen Haken versehen werden )
freundliche Grüße
SteffenF