dwestermann
Goto Top

Fehlerursache beim Server finden

Hallo Leute,

wir haben ein recht nerviges Problem bei uns in der Firma.

Ein Windows 2008 R2 Server ist uns über das Wocheende abgeraucht. Kurzschluss und als wir am Montag ankamen lief bewegte sich in dem Rechner nichts mehr.

Als wir ein anderes Netzteil eingebaut haben und eingeschaltet haben, ist dieses sofort durchgebrannt (Richtig mit Raucheffekten ;) )

Also haben wir ein neues Board und CPU bestellt, und ebenfalls eine neue PSU

Intel Xeon E3-1200 Serie E3-1220V3
Intel Server Board S1200VSRPM
Netzteil BeQuiet PURE POWER9 400 W ATX 80PLUS® Silver.


Das ganze war dann am Mittwoch bei uns, und nach erfolgreichen Einbau hatten wir gedacht jetzt wäre alles supi. Falsch!

Der PC fährt nicht hoch, wenn man Windows startet dauert es eine kurze Zeit und der PC fährt von alleine wieder von vorne hoch, beim abgesicherten modus bleibt er kurz bei crcdisk.sys hängen, um dann ebenfalls einen neustart zu starten. Es wird eine Windowsreperatur empfohlen. Also Datenträger rein und davon booten, allerdings bekommen ich einen bluescreen sobald der Balken (Dateien werden geladen) zum ersten mal durchgelaufen ist.

Daraufhin hatten wir noch den Ram in Verdacht. Also heute neuen RAM rein und erneut versucht, mit dem gleichen Problem.

Es ist also folgendes neu:
CPU, Mainboard, PSU und Ram, trotzdem passiert oben genannter Fehler. Sogar wenn ich die Festplatten abstöpsel, nur das DVD Laufwerk dran habe und davon booten möchte kommt es zu einem Bluescreen.

Ich bin so langsam ein wenig ratlos.

Für Ideen und Anregungen bin ich gerne offen.!

Grüße und Danke im vorraus,
Dominik

Content-ID: 305539

Url: https://administrator.de/contentid/305539

Ausgedruckt am: 22.11.2024 um 12:11 Uhr

certifiedit.net
certifiedit.net 27.05.2016 aktualisiert um 10:14:44 Uhr
Goto Top
Hi Dominik,

guten Morgen!
Wie sieht die restliche Umgebung aus? Woher kam der Kurzschluss? Liegt das Problem ggf. vor dem System?


Backup vom Tag davor auf einem grundsätzlich anderen System eingespielt?

Beste Grüße,

Christian
keine-ahnung
keine-ahnung 27.05.2016 um 10:23:02 Uhr
Goto Top
Moin,
Es ist also folgendes neu: CPU, Mainboard, PSU und Ram
woher sollen wir wissen, was auf der alten Büchse verbaut war??? Identische Hardware?
Für Ideen und Anregungen bin ich gerne offen.!
Imagebackup auf die neue Kiste spielen und freuen ...

LG, Thomas
dwestermann
dwestermann 27.05.2016 um 10:30:29 Uhr
Goto Top
Hallo Christian.

Die restliche Umgebung ist ja momentan irrelevant, weil der Server zur Zeit nicht im Netzwerk sitzt, bzw Ausgebaut.

Woher der Kurzschluss kam kann ich leider nicht genau sagen. Ich bin noch relativ neu im Gebiet Serverlandschaften (in der Ausbildung quasi nur Helpdesk, jetzt neue firma). Der Kollege der das bis jetzt und mit mir zusammen macht ist leider krank, deswegen ist das für mich auch ein wenig Jugend forscht.

Wir haben leider auch keinen anderen Server rumliegen wo ich das Backup aufspielen könnte, allerdings kann ich ja nicht mal von DVD booten ohne einen bluescreen zu bekommen, was mich einfach verwundert.

@keine-ahnung, keine Identische Hardware.
keine-ahnung
keine-ahnung 27.05.2016 um 10:39:07 Uhr
Goto Top
keine Identische Hardware
Und Du willst den mit Gewalt ohne passende Treiber von den alten Platten starten lassen??? Hast Du die wenigstens vor Deinen Testläufen noch mal geclont???
Ist da irgendein RAID an der alten Kiste gewesen?
Was für eine CPU / was für ein mainboard war da verbastelt?
Hast Du denn überhaupt ein baremetal-imagebackup? Dann klopf das doch in die neue Kiste rein ...
dwestermann
dwestermann 27.05.2016 um 10:44:58 Uhr
Goto Top
Kein Raid.

War auch ein Xeon Prozessor mit einem Asus Board, genaue Bezeichnung kann ich gleich einmal raussuchen.

Und ich kann ja nicht mal von DVD booten ohne das ich einen Bluescreen bekomme, auch wenn die Festplatten nicht angeschlossen sind.

Ein backup existiert meines Wissens, allerdings komme ich da ohne meinen Kollegen nicht ran, bin halt noch nicht so lange hier.
keine-ahnung
keine-ahnung 27.05.2016 um 11:06:23 Uhr
Goto Top
Und ich kann ja nicht mal von DVD booten ohne das ich einen Bluescreen bekomme
Lass da mal ein live-linux booten, wenn das auch nicht geht, ist an der Kiste noch andere hardware Schrott (Kabel, Laufwerke ...).
MG-One
MG-One 27.05.2016 aktualisiert um 11:09:58 Uhr
Goto Top
Aus dem Manual deines Boards:

◦Your power supply must provide a minimum of 420W with 2A standby current, which complies with the SSI EPS 12V specification.

Wenn du ein 400Watt Netzteil eingebaut hast, könnte das die Ursache sein.

Ich hatte mal einen ähnlichen Fehler an einem normalen PC. Nach dem Einbau einer neuen Grafikkarte ist das Teil bis zum Windows Ladebildschirm gebootet und dann abgestürzt. Ursache war lediglich das Netzteil, da die volle Leistung erst gezogen wurde als die Treiber geladen wurden. Nachdem die nicht kam,.....

Ich würde mal ein 500 oder 600 Watt Netzteil reinmachen.

EDIT: Sorry, war das falsche Board. Deines braucht mindestens 350 Watt. Wobei das immer noch der Fehler sein könnte, je nachdem wie viele Geräte / Platten / etc. in der Kiste drin sind.

http://www.intel.com/content/www/us/en/support/boards-and-kits/00000716 ...
certifiedit.net
certifiedit.net 27.05.2016 aktualisiert um 11:11:17 Uhr
Goto Top
Moin,

zusammengefasst: Du hast keine Ahnung (sorry Thomas), was und wie das System funktioniert und versuchst nun irgendwie ein nicht per RAID gesichertes, auf einem Semi Consumer Board installierten System?

Ich würde schnellstmöglichst den kranken Kollegen kontaktieren um zumindest die rudimentären Infos zu bekommen und dir dann anderweitig direkte Hilfe zu suchen.

LG,

Christian

PS: Wie groß seid Ihr?
Chonta
Chonta 27.05.2016 um 11:20:13 Uhr
Goto Top
Hallo,

Sogar wenn ich die Festplatten abstöpsel, nur das DVD Laufwerk dran habe
und auch ohne DVD also von USB booten was ist dann?

CPU neu, MB neu, HDD neu alt ist nur das Gehäuse.
Wenn bei komplett neuer Hardware nix bootet, ist entweder die Stromversorgung nicht ausreichend, oder etwas von der alten Hardware/Gehäuse ist der Übeltäter.
Also auch DVD Laufwerk abmachen und neue Tastatur und Maus verwenden.
Ich kenne einen Fall in dem eine Maus einen Rechner permanent zum Absturz gebracht hatte.

GGF auch mal mit der minimalkonfiguration an RAM die das MB kann starten und dann erhöhen.
Wie stark ist das Netzteil das vorher drin war?
GGF die Komponenten ohne Gehäuse zum laufen bringen (wenn auch ohne DVD und mit minimal RAM nix geht)


Gruß

Chonta
dwestermann
dwestermann 27.05.2016 um 11:24:25 Uhr
Goto Top
Dominik, nicht Thomas.

Kein Problem. ich weiß selber das ich da noch nicht richtig vom Fach bin.

Wir sind in der IT zu 3, wobei der dritte nur Datenauswertungen u.ä macht, und nichts mit Hardware zu tun hat. Der kranke Kollege ist Montag wieder da, von daher warte ich dann einfach bis Montag ab und mache dann mit ihm zusammen weiter. Zum Glück laufen auf dem Server keine für den Betrieb wichtige Services, sodass der Ausfall die Firma nicht beeinträchtigt.

Das mit der Watt Zahl werde ich mir merken und auch am Montag mal ansprechen.

Trotzdem danke an euch für die Hilfe und ich wünsche euch ein schönes Wochende. Wenn es wirklich nur die PSU ist wäre ich ja glücklich, glaube aber nicht das wir noch eine stärkere bei uns auf Lager haben.
StefanKittel
StefanKittel 27.05.2016 um 15:44:04 Uhr
Goto Top
Hallo,

auch neue Komponenten können defekt sein.
Erstmal nur Board, CPU, RAM und DVD-Laufwerk mit MEMtest ein paar Stunden quälen.

Stefan
Pjordorf
Pjordorf 27.05.2016 um 15:59:53 Uhr
Goto Top
Hallo,

Zitat von @dwestermann:
Also haben wir ein neues Board und CPU bestellt, und ebenfalls eine neue PSU
Und dein altes System ist zumindest dazu Kompatible gewesen (wegen Treiber und son Quatsch)?

Intel Xeon E3-1200 Serie E3-1220V3
Intel Server Board S1200VSRPM
Netzteil BeQuiet PURE POWER9 400 W ATX 80PLUS® Silver.
Und RAM?
Und RAID Kontroller oder haben eure Server so etwas nicht?

Das ganze war dann am Mittwoch bei uns, und nach erfolgreichen Einbau hatten wir gedacht jetzt wäre alles supi. Falsch!
Evtl. defekte karten oder RAM (ECC?) ins heile Board gepappt. Tödlich, auch wenn es keinen Rauch gibt.

Der PC fährt nicht hoch
OK, der Startet nicht.

wenn man Windows startet dauert
Wie schaffst du das wenn dein Server gar nicht Statet?

es eine kurze Zeit und der PC fährt von alleine wieder von vorne hoch
Klar, die Treiber passen nicht zu der jetzt verwendeten Hardware. IDE? AHCI? RAID? OnBoard RAID Chip? RAID Kontroller?

Es wird eine Windowsreperatur empfohlen. Also Datenträger rein und davon booten
Du willst deine (noch vorhandenen) Daten mit aller Macht zerstören, oder?

Daraufhin hatten wir noch den Ram in Verdacht. Also heute neuen RAM rein und erneut versucht, mit dem gleichen Problem.
Kopfschüttel

Es ist also folgendes neu:
CPU, Mainboard, PSU und Ram
Wobei mindestens ein ungeprüftes evtl Kaputt Teil schon vom Alten Blech eingebaut ware bevor wirklich alles Neu wurde....

kommt es zu einem Bluescreen.
Und der hat einen Namen. Wie lautet der?

War auch ein Xeon Prozessor mit einem Asus Board, genaue Bezeichnung kann ich gleich einmal raussuchen.
Ist wie "Auto kaputt, Beschaffe Ersatz Auto. Läuft nichts nachdem diverse Steuergeräte (Alle Anschlüße passen 1:1) umgebaut wurden." Unverständniss - Und du sagst jetzt "Der alte Wagen war doch ein Benziner und Rot war der auch. Verstehe ich nicht"

Und Unterschied Serverblech oder Desktop Blech liegt nur in den verbauten Komponenten und Entwurd. Der Strom dort ist ja auch nicht anders und selbst die CPU tut das gleiche....

Gruß,
Peter
dwestermann
dwestermann 31.05.2016 um 10:02:16 Uhr
Goto Top
Hallo Peter!

Danke für deine Ausführliche Antwort.

Allerdings waren die Probleme im Endeffekt recht simpel, wie meistens.

Das alte Netzteil ist abgeraucht, das neue (gleiches Modell, Reserve) direkt danach. Also dachten wir das irgendwas im PC defekt wäre. Aber das Problem war weiterhin die PSU.

Herausgekommen ist das als ich testen wollte ob für die neue Hardware wirklich das 400W NT zu wenig ist. Noch ein NT der "ersten" Baureihe (500W) hatten wir im Schrank. Dieses ist direkt nach dem starten ebenfalls mit Rauchentwicklung kaputt gegangen. Da ist mir klar geworden das es anscheinend wirklich das NT war. Also alte Hardware mit dem neuen 400W NT versucht, und tada, der Server läuft wieder 1a.

PS: Wir haben auch neuen RAM eingebaut gehabt. Raid Controller hat der nicht, ist ein ganz simpler Server, alle Daten von dem werden jede Nacht gesichert.

Danke an alle die geholfen haben!

MfG

Dominik
Chonta
Chonta 31.05.2016 um 10:33:11 Uhr
Goto Top
Hallo,

PSU = Netzteil
https://en.wikipedia.org/wiki/Power_supply_unit_%28computer%29

Meinst Du mit PSU eine USV?

Gruß

Chonta
Dr.EVIL
Dr.EVIL 01.06.2016 um 12:42:40 Uhr
Goto Top
Ich frage mich bei solchen Fällen, warum hier immer an den Symptomen "herumgedoktort" wird und nicht die Ursache bekämpft wird:
Billige, nicht redundante (NoName) Hardware ohne ausreichenden Wartungsvertrag durch den Hersteller!

So ein "Bastelserver" taugt vielleicht für den "Heimbetrieb", aber sobald man sein Geld damit verdienen muss ist diese unproffessionelle Technik ein unvorhersehbares Geschäftsrisiko!

Mein Tip: Alte Hardware verschrotten, neuen Server eines bekannten Herstellers (Fujitsu, Dell, HPE, Lenovo, Cisco) mit einem Servicevertrag (z.B. 4 Stunden reaktionszeit 24x7) beschaffen. Server alle 4-5 Jahre austauschen.
dwestermann
dwestermann 08.06.2016 um 11:25:09 Uhr
Goto Top
Hallo Dr. EVIL,

nur ein kurzer Kommentar meinerseits dazu:

Für unsere wichtigen Server (SAP Maschinen, PDC usw) haben wir Wartungsverträge. Der in diesem Fall relevante Server hatte nur wenige eher unwichtige Dienste am laufen, weswegen auch die Hardware nicht erste Sahne ist/war.

Außerdem sind wir ein kleines Unternehmen, und hier wird gerne mal am Budget gespart, und zwar überall wo es geht, auch in der IT.

Ein Geschäftsrisiko stellt es bei uns nicht da, da wie gesagt der Server mehr nur für uns in der IT wichtig ist, nicht für den Betrieb.
Außerdem bin ich leider in keiner Position soetwas zu fordern/sagen, maximal anmerken könnte ich sowas.

MfG,
Dominik
Dr.EVIL
Dr.EVIL 08.06.2016 um 12:30:40 Uhr
Goto Top
Hallo Dominik.

Dies ist keider ein immer wiederkehrendes Grundproblem. (Sehr häufig in Deutschland)
Das "Standing" der IT wird von vielen "Betriebswirten", speziell wenn ihr Studium einige Jahre zurückliegt, massiv unterschätzt.
Offenbar wird häufig vergessen, das sich fast alle Firmen und Organisationen in Deutschland sich in einem stark verändernden Marktumfeld bewegen und daher "unwichtige" Prozesse plötzlich, bei ihrem Ausfall, "essentiell" für das Unternehmen werden können.
Frag z.B. mal bei den Firmen nach, die massiv durch Ransomeware geschädigt wurden, weil das Thema "BuRA" für "eher unwichtig" erachtet wurde...
Wenn dann was schiefläuft, ist es aber nie der Controller, Einkäufer oder gar Geschäftsführer: Der Verantwortliche ist fast immer der ITler., der sich u.U. die Wochenenden um die Ohren schlagen muss um die Kastanien aus dem Feuer zu ziehen...

Im Übrigen sind Noname-Server nicht immer billiger als Markengeräte etablierter Konzerne: Fast alle großen Hersteller bieten vorkonfigurierte "Entry-Level" Geräte zu Kampfpreisen an, um auch in den unteren Marktsegmenten Umsatz generieren zu können.

Als Argumentationshilfe: Rechne doch einfach mal aus, wie teuer der Aufall des Gerätes in Euro und "Mannstunden" (Es sei denn der Admin arbeitet als Sklave) war.
In fast allen Fällen rechnet sich danach sogar ein "Enterprise-Level" Server mit 24x7 Servicepaket und 4 Stunden Reaktionszeit.

Viel Erfolg!
Der böse Doktor