HP ProLiant ML310 G5 Server fällt einfach aus - was kann das sein?
Hallo zusammen,
stehe seit ca. 2 Wochen nun vor einem immer größeren Problem am Domaincontroller, Backup- & Mailserver.
System
Produktname ProLiant ML310 G5
Prozessorpaket 1 (Steckplatz 1, Kern = 2) Intel Xeon Prozessor @ 2.33 Ghz
Betriebssystemumgebung Microsoft(R) Windows(R) Server 2003 für Small Business Server, Service Pack 2 (Build 3790)
System fällt auf ein Mal komplett aus.
Ist sporadisch, Zeit und Tag sind nicht gleich.
Geht dann auch nicht mehr sofort zum Einschalten.
Power-Leuchte leuchtet braun, Strom ist also da.
Nach ca. 10 Mal Power-Knopf drücken geht er wieder an, läuft ca. 2-3 Sekunden, geht dann wieder aus. Das mehrmals hintereinander. Dann fährt er irgendwann wieder ganz normal hoch.
Hatte einen Festplattenschaden vermutet. Aber das Abziehen einer der RAID-Platten bzw. alle abziehen hat keine Änderung gebracht.
Geht kurz an und sofort wieder aus.
Ansonsten ist noch ein DVD-Rom und ein DAT-160 Streamer verbaut, der Wechler hängt SCSI extern.
Habe Stromversorgung, USV Stecker, alles gecheckt. Hieran kann es nicht liegen.
Was könnte der Grund dafür sein.
Im Systemprotokoll steht nur
"Das System wurde unerwartet beendet".
Im Diagnoseprotokoll ist kein Fehler auf der Hardware verzeichnet, alle Speicher arbeiten einwandfrei, die Festplatten laufen auch problemlos.
Jemand eine Idee?
Bin für alles offen.
Bis auf einen Plattenschaden im Array 1 war bisher noch nie etwas gewesen, normalerweise läuft er 24/365 online.
Problem ist, wenn das System aussteigt steht im Betrieb alles. Mail, Netzwerk, die anderen Server können nicht angesprochen werden, da DNS ausgefallen etc.
HILFE!!
stehe seit ca. 2 Wochen nun vor einem immer größeren Problem am Domaincontroller, Backup- & Mailserver.
System
Produktname ProLiant ML310 G5
Prozessorpaket 1 (Steckplatz 1, Kern = 2) Intel Xeon Prozessor @ 2.33 Ghz
Betriebssystemumgebung Microsoft(R) Windows(R) Server 2003 für Small Business Server, Service Pack 2 (Build 3790)
System fällt auf ein Mal komplett aus.
Ist sporadisch, Zeit und Tag sind nicht gleich.
Geht dann auch nicht mehr sofort zum Einschalten.
Power-Leuchte leuchtet braun, Strom ist also da.
Nach ca. 10 Mal Power-Knopf drücken geht er wieder an, läuft ca. 2-3 Sekunden, geht dann wieder aus. Das mehrmals hintereinander. Dann fährt er irgendwann wieder ganz normal hoch.
Hatte einen Festplattenschaden vermutet. Aber das Abziehen einer der RAID-Platten bzw. alle abziehen hat keine Änderung gebracht.
Geht kurz an und sofort wieder aus.
Ansonsten ist noch ein DVD-Rom und ein DAT-160 Streamer verbaut, der Wechler hängt SCSI extern.
Habe Stromversorgung, USV Stecker, alles gecheckt. Hieran kann es nicht liegen.
Was könnte der Grund dafür sein.
Im Systemprotokoll steht nur
"Das System wurde unerwartet beendet".
Im Diagnoseprotokoll ist kein Fehler auf der Hardware verzeichnet, alle Speicher arbeiten einwandfrei, die Festplatten laufen auch problemlos.
Jemand eine Idee?
Bin für alles offen.
Bis auf einen Plattenschaden im Array 1 war bisher noch nie etwas gewesen, normalerweise läuft er 24/365 online.
Problem ist, wenn das System aussteigt steht im Betrieb alles. Mail, Netzwerk, die anderen Server können nicht angesprochen werden, da DNS ausgefallen etc.
HILFE!!
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 207180
Url: https://administrator.de/contentid/207180
Ausgedruckt am: 04.11.2024 um 18:11 Uhr
46 Kommentare
Neuester Kommentar
Zitat von @CKbeats:
Meinst Du, dass das Netzteil defekt ist und dann auf einmal wieder geht? Ich kenne nur defekt = Rechner aus.
Meinst Du, dass das Netzteil defekt ist und dann auf einmal wieder geht? Ich kenne nur defekt = Rechner aus.
Nein Defekt = "Ich funktioniere ein wenig, dann mache ich pause und kühle mcih ab und dann gehe ich mal wieder ein wenig, bis ich warmlaufe und ich keien Lust mehr habe udn dann tue ich so, als ob ich egehn würde udn gehe dann doch wieder aus." Oder so.
Komisch ist eben, dass er danach wieder völlig normal hochfährt, als wenn nie etwas gewesen wäre und brav wieder
seinen Dienst tut.
Thermisches Problem im netzteil oder auf dem Motherboard würde da passen.
Beim Booten bekomme ich keinen Fehler etc., dass z. B. Spannung irgendwo nicht passt.
das ist ja das gemeine an den dingern, daß sie ab und zu so tun, als ob sie gehen würden.
lks
Habe neues Netzteil mal schnell geordert.
Hoffe, dass es spätestens übermorgen hier ist.
Hoffe, dass es spätestens übermorgen hier ist.
Bedenke aber, daß "Netzteil" nureine möglichek fehlerquelle ist. Kann genausogut das mainboard oder der Prozessor sein, das nicht mehr mag, wenn es zu warm wird (z.B. Elkos kaputt/gealtert).
lks
Moin,
noch eine Ergänzung zu den Beiträgen hier: Wenn Du ILO installiert hast, kann man auf den Kisten auch interessante Infos dort finden. In Deinem Fall steht z.B. was im IML (Integrated Management Log). Hier werden teils Fehler geloggt, die Windows mangels Anwesenheit nicht mehr mitbekommt.
Unter System Information finden sich auch Infos zu (Netzteil-) Lüftern und Co.
ILO kostet ein paar Euronen, ist's aber in jedem Fall wert!
Gruß
noch eine Ergänzung zu den Beiträgen hier: Wenn Du ILO installiert hast, kann man auf den Kisten auch interessante Infos dort finden. In Deinem Fall steht z.B. was im IML (Integrated Management Log). Hier werden teils Fehler geloggt, die Windows mangels Anwesenheit nicht mehr mitbekommt.
Unter System Information finden sich auch Infos zu (Netzteil-) Lüftern und Co.
ILO kostet ein paar Euronen, ist's aber in jedem Fall wert!
Gruß
Moin,
das ist das Problem, wenn Windows das Problem nicht mehr loggen kann, geht es logischerweise mit der unter Windows installierten Variante auch nicht mehr...
Du brauchst die IP des ILO, hat einen eigenen Netzwerkanschluss. Dann ist wahrscheinlich (und hoffentlich) ein Passwort nötig. Wenn Du das alles nicht weißt, bleibt Dir nur der Weg über Neustart und Aufruf der ILO-Konfig. In unserem Fall greife ich über HTTPS auf das ILO zu.
Gruß
das ist das Problem, wenn Windows das Problem nicht mehr loggen kann, geht es logischerweise mit der unter Windows installierten Variante auch nicht mehr...
Du brauchst die IP des ILO, hat einen eigenen Netzwerkanschluss. Dann ist wahrscheinlich (und hoffentlich) ein Passwort nötig. Wenn Du das alles nicht weißt, bleibt Dir nur der Weg über Neustart und Aufruf der ILO-Konfig. In unserem Fall greife ich über HTTPS auf das ILO zu.
Gruß
Hy,
wie schaut es denn mit der BIOS FW aus ?
Hatte ein ähnliches Prob. mit nem DL380G6 .... die Büchse ist sporadisch gecrasht, einfach aus, keine Eventlogs , nix...
Anruf bei HP , Problem bekannt und eine neue BIOS FW aufgrund dessen installiert - danach war Ruhe.
Nur so als Frage ( oder Tip )
Gruß,
Andy
wie schaut es denn mit der BIOS FW aus ?
Hatte ein ähnliches Prob. mit nem DL380G6 .... die Büchse ist sporadisch gecrasht, einfach aus, keine Eventlogs , nix...
Anruf bei HP , Problem bekannt und eine neue BIOS FW aufgrund dessen installiert - danach war Ruhe.
Nur so als Frage ( oder Tip )
Gruß,
Andy
Hmmh, erstens muss man dafür keine Boot-CD erstellen, dafür gibt es die ProLiant-Servicepacks. Und das Argument:
LG, Thomas
Das war mir zeitlich zu aufwändig.
lässt mich schon ein wenig an der Ernsthaftigkeit Deiner Bemühungen zweifeln.Also ist es doch das Netzteil, oder?!
Wie kommst Du darauf?? Das kann alles und nichts gleichzeitig sein - liess Dir das einfach nochmal in Ruhe durch ...LG, Thomas
Hi,
LG, Thomas
der FW-Download für o. g. System ist ein Programm, dass Dich fragt, ob Du Boot-Diskette oder -CD zum updaten der Firmware haben möchtest.
Davon habe ich auch nicht gesprochen, ich sprach vom aktuellen Proliant-Servicepack. Da brauchst Du das Gedöhns nicht, sollte auch noch für die G5 gehen ...Wenn das Bremslicht am Auto defekt ist behebe ich den Fehler nicht mit dem Ölwechsel....
Wenn es das Bremslicht ist ... korrekt. Du weisst aber nicht, ob es das Bremslicht ist, die Einspritzpumpe oder ob Du nur den Wagenschlüssel Deiner Frau für Dein Auto benutzt Der Server lief jahrelang mit der FW Problemlos und auf ein Mal sollte diese Probleme machen - sehr unwahrscheinlich.
Ein Beispiel aus meiner Berufserfahrung: 22 Jährige kommt zu mir in die Sprechstunde wegen anhaltender Übelkeit. HCG-Test ist positiv. Das Argument: ich war doch 22 Jahre lang nicht schwanger wäre da auch nicht so richtig schlüssig, gelle?Das FW-Update ist auch nicht kritisch...
Woher weisst Du das??LG, Thomas
Moin,
den Ablauf kenne ich anders, wie von Thomas beschrieben: PSP durchlaufen lassen, System wird auf Updates geprüft, kannst auch konfigurieren, was upgedatet werden soll. Dann wird alles runtergeladen und nach einem oder mehreren Neustarts installiert, so auch das BIOS.
Zum Thema Muss-Das-Sein: Wenn Du einen Supportvertrag bei HP hättest, käme als erstes die Frage des Supports nach aktuellen Treibern / BIOS / etc. Nicht aktuell? Dann reden die gar nicht weiter mit Dir, bevor Du das System nicht aktualisiert hast.
Das Argument, dass es jahrelang lief, zieht nicht. Trotzdem hast Du es ja mit einem "lebenden System" zu tun, Stichwort Windows-Updates, Austausch vorhandener DLLs usw. Ändert sich irgendwo etwas, kann das ja durchaus Wechselwirkungen nach sich ziehen. Und Omas Waschmaschine lief doch gestern auch noch. Bei der Gelegenheit würde ich auch gleich das ILO updaten, gibt sicher auch hier was Neueres.
Gruß
den Ablauf kenne ich anders, wie von Thomas beschrieben: PSP durchlaufen lassen, System wird auf Updates geprüft, kannst auch konfigurieren, was upgedatet werden soll. Dann wird alles runtergeladen und nach einem oder mehreren Neustarts installiert, so auch das BIOS.
Zum Thema Muss-Das-Sein: Wenn Du einen Supportvertrag bei HP hättest, käme als erstes die Frage des Supports nach aktuellen Treibern / BIOS / etc. Nicht aktuell? Dann reden die gar nicht weiter mit Dir, bevor Du das System nicht aktualisiert hast.
Das Argument, dass es jahrelang lief, zieht nicht. Trotzdem hast Du es ja mit einem "lebenden System" zu tun, Stichwort Windows-Updates, Austausch vorhandener DLLs usw. Ändert sich irgendwo etwas, kann das ja durchaus Wechselwirkungen nach sich ziehen. Und Omas Waschmaschine lief doch gestern auch noch. Bei der Gelegenheit würde ich auch gleich das ILO updaten, gibt sicher auch hier was Neueres.
Gruß
Zitat von @Coreknabe:
Bei der Gelegenheit würde ich auch gleich das ILO updaten, gibt sicher auch hier was Neueres.
Das macht das SP gleich mit ... Bei der Gelegenheit würde ich auch gleich das ILO updaten, gibt sicher auch hier was Neueres.
LG, Thomas
Ich habe hier noch einen ML310G5p am Laufen, da machen die Lüfter kaum mal einen Mucks - allerdings hat der jetzt auch nicht wirklich viel zu tun. Leider habe ich den derartig zwischen Schrank und Wand verbastelt, dass ich mit der Hand nicht hinter die Netzteile komme ... aber rein akustisch ist da Ruhe im Schacht.
Was sagt denn nun ILO zum Gesundheitszustand des Probanden ... oder immer noch nicht eingerichtet?
LG, Thomas
Was sagt denn nun ILO zum Gesundheitszustand des Probanden ... oder immer noch nicht eingerichtet?
LG, Thomas
Hi Constantin,
dann drücke ich mal die Daumen, dass jetzt alles OK ist. Noch eine Anmerkung: Es ist nicht immer schlau, den automatischen Neustart zu unterbinden. In Deinem Fall wird ja eh nichts geloggt, durch den Neustart ist zumindest gewährleistet, dass benötigte Dienste weiterlaufen, wenn auch mit Unterbrechung. Sofern die Windows-Installation nicht mal irgendwann beschädigt wird und Windows nicht mehr startet. Aber für solche Fälle gibt's ja sicher ein Backup
Also viel Glück und einen guten Start in die neue Woche!
Gruß
dann drücke ich mal die Daumen, dass jetzt alles OK ist. Noch eine Anmerkung: Es ist nicht immer schlau, den automatischen Neustart zu unterbinden. In Deinem Fall wird ja eh nichts geloggt, durch den Neustart ist zumindest gewährleistet, dass benötigte Dienste weiterlaufen, wenn auch mit Unterbrechung. Sofern die Windows-Installation nicht mal irgendwann beschädigt wird und Windows nicht mehr startet. Aber für solche Fälle gibt's ja sicher ein Backup
Also viel Glück und einen guten Start in die neue Woche!
Gruß
Genauso, wie es nicht immer schlau ist, Gleich automatisch neustarten zu lassen.
manchmal isrt es wichtier, durch einen Ausfall des Dienstes das recht schnell mitzubekommen, um besser diagnostizieren zu können, als wenn der Dienst weiterläuft.
Muß imho immer im Einzelfall entschieden werden.
lks
Moin,
Wenn da nicht irgendwelche irren tasks auf der Büchse laufen, klingt das für mich bei dem Grossväterchen eher doch nach einem Spannungsproblem --> eventuell sind da Kondensatoren auf dem Bord am Verrecken.
LG, Thomas
Tante Edith sagt noch: ich hatte ein ähnliches Problem mal mit einem Esprimo, da hatte auch das Bord einen Treffer weg ....
darf ich diesen Thread nochmals herauskramen?
ist IMHO nicht strafbewehrt .Es scheint gar kein Hardware Defekt vorzuliegen, sondern eine Softwareansteuerung bringt die Maschine runter.
Da würde ich zumindest nicht Sack und Pfeife gleichzeitig drauf verwetten!- Könnte das ein Fehler der USV Software (Schneider APC) sein?
Nicht ausgeschlossen - ich hatte einmal in 7 (!) Jahren den Fall, dass eine APC-USV (war damals noch über USB, nicht über LAN angeknüppert) den Server in den Glauben versetzt hat, er wäre ein Airbook und der Akku ist gleich alle ... sauberer shutdown und bezaubernd, wie bei mir alle Türen gleichzeitig aufgingen . Ich bin mir aber nicht mehr sicher, ob ich da nicht was in den Energieeinstellungen verkorkst hatte. Vermutlich schon ...- Fehlfunktion des Integrated Lights Out? (Hier gibt es einen virtuellen "Power-Button")
Noch nie gehört ...- Angriff von außen (Firewall hat nur Port 25 für Exchange SMTP und Port 144 umgeleitet auf 143 Exchange für IMAP4
Klingt ebenfalls nicht plausibel ....Was oder wer kann das Betriebssystem zum Herunterfahren bringen
Dafür gibt es IMHO ein event log?Wenn da nicht irgendwelche irren tasks auf der Büchse laufen, klingt das für mich bei dem Grossväterchen eher doch nach einem Spannungsproblem --> eventuell sind da Kondensatoren auf dem Bord am Verrecken.
LG, Thomas
Tante Edith sagt noch: ich hatte ein ähnliches Problem mal mit einem Esprimo, da hatte auch das Bord einen Treffer weg ....
Hi,
LG, Thomas
Wenn irgendwelche Kondensatoren abrauchen wird doch nicht ein OS Shutdown ausgelöst?!
soll man nicht denken. Aber irgendwie sollte man bei dem ganzen PC-Gerassel nicht denken .Er loggt sogar, wenn ich eines der redundanten Netzteile vom Strom trenne.
Hexen kann ILO auch nicht - wenn kein Saft auf dem Bord ist, ist ILO auch (schein-)tod. Das mit dem begonnenen shutdown ... keine-ahnung. Natürlich kannst Du jetzt wieder bei Null anfangen: scheduler checken, offline-Virencheck and so on, and so on ...Ich werde daraus absolut nicht schlau.
In der Medizin sage ich immer, das Häufige ist häufig und das Seltene eher selten . Damit fährt man in 95% aller Lebenslagen schon mal gar nicht so schlecht ... und da Deine Kiste jetzt doch den Zenith schon überschritten hat - ich würde auf die Elko's tippen.Benötige den Server aber noch 2-3 Monate am Netzt, dann soll er ausgetauscht werden.
Wenn Du mit den crash's leben kannst, warte halt solange. aber wenn da was in Richtung SQL oder MX läuft, hast Du Dir früher oder später eine Datenbank ausgerenkt ... da würde ich den Serverumzug doch etwas forcieren LG, Thomas
Zitat von @CKbeats:
Habe hier zu Hause noch ein Testsystem mit Win2000 laufen, der ist mit Sicherheit schon 10 Jahre alt.
Und läuft 24/365 fehlerfrei.
Habe hier zu Hause noch ein Testsystem mit Win2000 laufen, der ist mit Sicherheit schon 10 Jahre alt.
Und läuft 24/365 fehlerfrei.
Früher war alles besser
irgendwo habe ich noch einen P90-Server herumstehen mit NT4 drauf. Den habe ich zwar seit mehreren Jahren nicht mehr eingeschaltet, aber ich wette, der würde heute noch wie eien 1 laufen.
Tatsache ist, daß durch die Preisoptimiererei das ganze Gedöns inzwischen nur noch so lange hebt, bis die Gewährleistung oder die Servicevertrag läuft. Früher haben Computer 20 jahre udn länger gehalten. heute kann man froh sein, wenn die 5 Jahre störungsfrei laufen.
lks
Zitat von @CKbeats:
Also kann es wirklich auch sein, dass das Board einen Schaden hat, durch Zufall eine Zeitlang absolut stabil läuft und dann
auf einmal wieder die Probleme von vorne beginnen?
Also kann es wirklich auch sein, dass das Board einen Schaden hat, durch Zufall eine Zeitlang absolut stabil läuft und dann
auf einmal wieder die Probleme von vorne beginnen?
Leider.
Das Dumme ist, daß bei soclhen Fehlern , bei denen das Board nru ein bischen nicht geht. man sich winen Wolf sucht, wenn man keien passenden diagnosemglichkeiten hat. Nicht immer sieht man den Schaden direkt.
Letztendlich muß man ab einem gewissen alter udn Aufwand abwägen, ob für einen produktivbedtrieb das ganze Tragbar ist oder nicht. Sofern Du noch einen gültigen SDupportvertag für dioe Kiste hast, würde ich damit Hp löchern. Ansonsten vielleicht die Migration vorziehen.
lks
Ich weiss nicht mehr, was da in dem G5p für ein Bord verbastelt ist - mit ein wenig Glück ist das noch ein "Eindecker", da kannst Du zumindest mal schauen, ob Du irgendwelche aufgequollenen oder verfärbten Elko's findest ... Sicherheit gibt Dir allerdings ein negatives Ergebnis auch nicht.
Bei dem Bord in meinem 350G8 schau ich nur noch wie die Sau ins Uhrwerk - das Teil besteht IMHO aus zwei Schichten
LG, Thomas
Bei dem Bord in meinem 350G8 schau ich nur noch wie die Sau ins Uhrwerk - das Teil besteht IMHO aus zwei Schichten
LG, Thomas