RAID Fehler Windows Server 2012 R2
Hallo,
ohne zu sehr ins Detail zu gehen, mal eine allgemeine Frage.
Ich habe einen Server, bei dem schon seit Beginn immer wieder das RAID 1 Probleme macht.
Zuerst war das RAID onboard auf dem Board Supermicro X9dai mit SATA Platten. Es handelt sich dabei nicht um Systemplatten, sondern eine Partition auf der 7 virtuelle Maschinen laufen, ein Server 2012 R2 und 6 Windows 8, Domain Controller und Clients vdi-in-a-box. Es findet also einiges an IO auf den Disks statt.
Der Fehler äusserte sich immer so dass erst eine Platte Fehler brachte, nach dem Motto "Unrecovered Read Error" und irgendwann schloss sich die 2. Disk dem Fehler an. Dann war zwar das RAID noch immer sichtbar aber man konnte nicht mehr darauf schreiben und der ganze Server schmierte ab, sobald ein paar VMs online waren.
Wir wechselten die Disks gegen 1 TB SSD 850 Pro, machten einen Controller rein, LSI MegaRaid SAS 9240-8i und bauten alle VMs neu auf um nicht wieder den gleichen Fehler zu haben.
Sinnlos, es kam wieder das gleiche vorletztes Wochenende. Als ich die SSD aber in einen anderen PC hängte, um zu prüfen welche welche ist, stellte ich fest dass man wunderbar darauf schreiben und auch lesen konnte. Daher löschte ich das RAID, formatierte die SSD und baute das RAID neu auf. Diesmal holte ich die VMs von einem Acronis Backup zurück und es lief erst mal wieder fehlerfrei.
Nun sind wir wieder an dem Punkt "Unrecovered Read Error" und das RAID ist degradet.
Was ich noch vergessen hatte, bei den ersten Fehlern dieser Art wurden die Disk sogar alle ersetzt.
Disks wurden ersetzt, der Raid Controller wurde ersetzt, die Daten wurden neu erstellt...
Was kann noch der gemeinsame Nenner sein, dass ein RAID immer wieder auf die Nase fällt. Wir wissen bald nicht mehr was wir machen sollen.
Kann mir irgendjemand einen Tip geben in welche Richtung ich am besten suche, bzw. wir würdet ihr vorgehen, um diesen Fehler ein für allemal aus der Welt zu schaffen, möglichst ohne die ganze Hardware zu ersetzen.
Vielen Dank im voraus
Andy
ohne zu sehr ins Detail zu gehen, mal eine allgemeine Frage.
Ich habe einen Server, bei dem schon seit Beginn immer wieder das RAID 1 Probleme macht.
Zuerst war das RAID onboard auf dem Board Supermicro X9dai mit SATA Platten. Es handelt sich dabei nicht um Systemplatten, sondern eine Partition auf der 7 virtuelle Maschinen laufen, ein Server 2012 R2 und 6 Windows 8, Domain Controller und Clients vdi-in-a-box. Es findet also einiges an IO auf den Disks statt.
Der Fehler äusserte sich immer so dass erst eine Platte Fehler brachte, nach dem Motto "Unrecovered Read Error" und irgendwann schloss sich die 2. Disk dem Fehler an. Dann war zwar das RAID noch immer sichtbar aber man konnte nicht mehr darauf schreiben und der ganze Server schmierte ab, sobald ein paar VMs online waren.
Wir wechselten die Disks gegen 1 TB SSD 850 Pro, machten einen Controller rein, LSI MegaRaid SAS 9240-8i und bauten alle VMs neu auf um nicht wieder den gleichen Fehler zu haben.
Sinnlos, es kam wieder das gleiche vorletztes Wochenende. Als ich die SSD aber in einen anderen PC hängte, um zu prüfen welche welche ist, stellte ich fest dass man wunderbar darauf schreiben und auch lesen konnte. Daher löschte ich das RAID, formatierte die SSD und baute das RAID neu auf. Diesmal holte ich die VMs von einem Acronis Backup zurück und es lief erst mal wieder fehlerfrei.
Nun sind wir wieder an dem Punkt "Unrecovered Read Error" und das RAID ist degradet.
Was ich noch vergessen hatte, bei den ersten Fehlern dieser Art wurden die Disk sogar alle ersetzt.
Disks wurden ersetzt, der Raid Controller wurde ersetzt, die Daten wurden neu erstellt...
Was kann noch der gemeinsame Nenner sein, dass ein RAID immer wieder auf die Nase fällt. Wir wissen bald nicht mehr was wir machen sollen.
Kann mir irgendjemand einen Tip geben in welche Richtung ich am besten suche, bzw. wir würdet ihr vorgehen, um diesen Fehler ein für allemal aus der Welt zu schaffen, möglichst ohne die ganze Hardware zu ersetzen.
Vielen Dank im voraus
Andy
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 305789
Url: https://administrator.de/contentid/305789
Ausgedruckt am: 22.11.2024 um 13:11 Uhr
14 Kommentare
Neuester Kommentar
Guten Morgen,
also erst einmal möchte ich dir sagen das die Samsung 850 Pro, nix in einem Server zu suchen hat-
sondern im deinem falle die Samsung Server-SSD SM863 960GB MLC SATA...
welche Firmware hat der 9240- hast du die mal auf den neusten stand gebracht ?
... abgesehen davon ist der 9240 nich nur günstig, sonder auch das schlechteste was ihr kaufen konntet! wer hat euch beraten ?
und für SSD Raid´s ist er nicht vorgesehen!
besser wäre ein LSI 9361-4i mit BBU etc...
wenn ich deine Server config so lese, denke ich nur- kleiner server- 7 VM´s 1 Hdd- 2 SSD´s - das wird nie was werden...
ich frage erst gar nicht nach den NETZTEIL ... ICH VERMUTE 400W 30,- euro EK.
Frank
also erst einmal möchte ich dir sagen das die Samsung 850 Pro, nix in einem Server zu suchen hat-
sondern im deinem falle die Samsung Server-SSD SM863 960GB MLC SATA...
welche Firmware hat der 9240- hast du die mal auf den neusten stand gebracht ?
... abgesehen davon ist der 9240 nich nur günstig, sonder auch das schlechteste was ihr kaufen konntet! wer hat euch beraten ?
und für SSD Raid´s ist er nicht vorgesehen!
besser wäre ein LSI 9361-4i mit BBU etc...
wenn ich deine Server config so lese, denke ich nur- kleiner server- 7 VM´s 1 Hdd- 2 SSD´s - das wird nie was werden...
ich frage erst gar nicht nach den NETZTEIL ... ICH VERMUTE 400W 30,- euro EK.
Frank
Moin,
Netzteile können auch einfach in sofern kaputt gehen, als das diese dann keinen Totalausfall erleiden, sondern nur schlicht zu wenig Saft liefern. Außerdem kann es durchaus sein, das das Netzteil zu klein Dimensioniert ist. Gerade bei nachträglichen Änderungen an der Hardware, wird all zu oft das Netzteil vergessen.
Gruß Krämer
Netzteile können auch einfach in sofern kaputt gehen, als das diese dann keinen Totalausfall erleiden, sondern nur schlicht zu wenig Saft liefern. Außerdem kann es durchaus sein, das das Netzteil zu klein Dimensioniert ist. Gerade bei nachträglichen Änderungen an der Hardware, wird all zu oft das Netzteil vergessen.
Gruß Krämer
äh... was willst du uns dazu sagen ? ah ich verstehe- netzteil fehlerhaft, die USV bügelt das aus...
mumpitz....
der USV ist es völlig egal wie es deinem NT geht...
frank
mumpitz....
der USV ist es völlig egal wie es deinem NT geht...
frank
Zitat von @Kraemer:
Also wenn ich euch so alle höre.
Mein ihr tatsächlich dass eine Stromversorgung
Nein, ich habe schlicht keine Ahnung / Erfahrung und laber hier nur irgendwelchen Stuss zusammen!Mein ihr tatsächlich dass eine Stromversorgung
schön das es jemand zugibt
Frank
...sind deine ohren ok...
natürlich würde ich die komponenten alle mal testen und tauschen... was sagt der hersteller aus den schweizer alpen dazu?
schon mal logs gelesen ? was sagt das MB etc...
Frank
Wir beziehen normalerweise unsere Server je nach Preisniveau und Kunden von HP oder Wortmann. Beide statten aber ihre Server mit vernünftigen Controllern und Platten aus. Diesen Server haben wir von einer kleinen Schweizer Bude gekauft, die wussten aber nicht was der Kunde damit vorhat.
nun- einer schlimmer als der andere... egal- jeder dieser genannten schraubt in das blech, was du bestellst, nicht was gut und teuer ist Mein ihr tatsächlich dass eine Stromversorgung immer wieder das RAID zerschiessen kann? Auch mit vorgeschalteter BBU?
klar... wie du an einen LSI 9240-8i eine BBU dängeln willt, bleibt mir ein Rätsel...Der Server hatte um die 3'500 Euro gekostet, aber der Kunde wollte es so. Nun ist die Frage, was tun? Power Supply ersetzen, Raid Controller ersetzen? BBU dran und neue SSD? Das wird teuer...
nun, 3500,- netto ....sind nicht teuer- dafür bekommst du schon einen ordentlichen brot und butter server, mit LSI 9361-4i +BBU.. inclusive 3 jahre Garantie....natürlich würde ich die komponenten alle mal testen und tauschen... was sagt der hersteller aus den schweizer alpen dazu?
schon mal logs gelesen ? was sagt das MB etc...
Frank
Andy
Bevor wir uns am Netzeil verbeissen:
Wie schaut es mit der SSD Wear Gauge auf dem Controller aus?
Ein Controller ohne dieses Feature, zusammen mit einfachen "Read Intensive" SSDs und Anwendungen wie z.B. Datenbanken, welche viele Daten schreiben, können in rel. kurzen Abständen zu solchen Fehlern führen.
Ich vermute daher den Fehler im Zusammenspiel der, nicht für den Serverbetrieb vorgesehenen SDDs, mit einem RAID Controller ohne angemessene SSD Verschleißkontrolle. (Wear Gauge)
Ein Austauch dieser Komponenten dürfte allerdings auf einen "wirtschaftlichen Totalschaden" des Systems hinauslaufen...
Wie schaut es mit der SSD Wear Gauge auf dem Controller aus?
Ein Controller ohne dieses Feature, zusammen mit einfachen "Read Intensive" SSDs und Anwendungen wie z.B. Datenbanken, welche viele Daten schreiben, können in rel. kurzen Abständen zu solchen Fehlern führen.
Ich vermute daher den Fehler im Zusammenspiel der, nicht für den Serverbetrieb vorgesehenen SDDs, mit einem RAID Controller ohne angemessene SSD Verschleißkontrolle. (Wear Gauge)
Ein Austauch dieser Komponenten dürfte allerdings auf einen "wirtschaftlichen Totalschaden" des Systems hinauslaufen...
@Frank
Einspruch!
Markenhersteller zeichnen sich auch dadurch aus, das sie Konfigurationen die nicht funktionieren oder Probleme bereiten können, gar nicht erst anbieten, oder in ihren technischen Unterlagen auf mögliche Inkompatibilitäten hinweisen...
Desktop SSDs an RAID Controllern ohne entsprechenden Support dieser Medien wären bei den meisten mir bekannten Herstellern nicht konfigurierbar.
Ich finde 3.500,-€ jetzt auch nicht so einen "konkurenzlosen Hammer Preis".
"Entry Server" mit Funktionsgarantie und Servicepaket gibt es von fast allen bekannten Markenherstellern, da muss man nicht unbedingt "Jugend forscht" spielen und Server aus NoName Teilen zusammenpuzzeln.
Bereits beim ersten Ausfall dieser Art dürfte sich der Preisvorteil des NoName Servers relativiert haben...
Wir beziehen normalerweise unsere Server je nach Preisniveau und Kunden von HP oder Wortmann. Beide statten aber ihre Server mit vernünftigen Controllern und Platten aus. Diesen Server haben wir von einer kleinen Schweizer Bude gekauft, die wussten aber nicht was der Kunde damit vorhat.
nun- einer schlimmer als der andere... egal- jeder dieser genannten schraubt in das blech, was du bestellst, nicht was gut und teuer ist Einspruch!
Markenhersteller zeichnen sich auch dadurch aus, das sie Konfigurationen die nicht funktionieren oder Probleme bereiten können, gar nicht erst anbieten, oder in ihren technischen Unterlagen auf mögliche Inkompatibilitäten hinweisen...
Desktop SSDs an RAID Controllern ohne entsprechenden Support dieser Medien wären bei den meisten mir bekannten Herstellern nicht konfigurierbar.
Ich finde 3.500,-€ jetzt auch nicht so einen "konkurenzlosen Hammer Preis".
"Entry Server" mit Funktionsgarantie und Servicepaket gibt es von fast allen bekannten Markenherstellern, da muss man nicht unbedingt "Jugend forscht" spielen und Server aus NoName Teilen zusammenpuzzeln.
Bereits beim ersten Ausfall dieser Art dürfte sich der Preisvorteil des NoName Servers relativiert haben...