Server ist nach wenigen Tagen an aber nicht erreichbar
Hallo,
seit einiger Zeit nervt mich einer unserer IBM Tower SystemX X3200 M3 Serie. Er hat nicht lebenswichtiges drauf, aber stellt halt die Wsus Updates bereit. Ich habe alle Benchmarks durch laufen lassen - ohne Ergebnis alles fein. Habe Memtest darüber gejagt ohne Ergebnis. Habe Treiber aktualisiert keine Veränderung der Lage. Habe das System überprüft & sogar neu installiert. Fehler ist noch immer da. Raid Patten sind auch ok. Habe ich den Server bei mir, läuft er ohne Probleme. Ist er in der Niederlassung is alles ne Weile ok und dann nach ~2 Wochen - BANG..
Der Server ist in unregeläßigem Abstand einfach nicht mehr erreichbar. Weder über die IMM Console noch sonst wie. Obwohl er an ist!
Wenn ich den Server hart ausschalte, Strom ziehen lasse und wieder einstecke & neu Hochfahre. Is alles wieder perfekt. Bis zum nächsten
Bang.
Mein letzter Verdacht ist das es sich um ein Problem mit dem Bios handelt. So selten es passiert, deutet eigentlich alles darauf hin.
Früher gabe es so Knopfzellen fürs Bios - ob es diese immer noch gibt.. keine Ahnung. Aber wäre es denkbar das diese schuld ist? Ich meine, wenn die Zelle zu schwach ist, kommt es ja zu einem Problem mit dem Bios. Es wird ja die Settings nicht mehr halten, das Resultat wären solche Probleme wie sie hier auftreten. Aber dann müsste es die Werte auch löschen, was nicht passiert! Schaue ich mir die Serversettings an ist ALLES so wie ich es eingestellt habe. Läuft dann auch.. Ehrlich gesagt werde ich nicht wirklich schlau aus der Situation.
Any Ideas? (Ach ja - zur Zeit is er wieder mal Down.. daher kann ich keine weiteren Daten posten. Da ich nicht dran komme.)
seit einiger Zeit nervt mich einer unserer IBM Tower SystemX X3200 M3 Serie. Er hat nicht lebenswichtiges drauf, aber stellt halt die Wsus Updates bereit. Ich habe alle Benchmarks durch laufen lassen - ohne Ergebnis alles fein. Habe Memtest darüber gejagt ohne Ergebnis. Habe Treiber aktualisiert keine Veränderung der Lage. Habe das System überprüft & sogar neu installiert. Fehler ist noch immer da. Raid Patten sind auch ok. Habe ich den Server bei mir, läuft er ohne Probleme. Ist er in der Niederlassung is alles ne Weile ok und dann nach ~2 Wochen - BANG..
Der Server ist in unregeläßigem Abstand einfach nicht mehr erreichbar. Weder über die IMM Console noch sonst wie. Obwohl er an ist!
Wenn ich den Server hart ausschalte, Strom ziehen lasse und wieder einstecke & neu Hochfahre. Is alles wieder perfekt. Bis zum nächsten
Bang.
Mein letzter Verdacht ist das es sich um ein Problem mit dem Bios handelt. So selten es passiert, deutet eigentlich alles darauf hin.
Früher gabe es so Knopfzellen fürs Bios - ob es diese immer noch gibt.. keine Ahnung. Aber wäre es denkbar das diese schuld ist? Ich meine, wenn die Zelle zu schwach ist, kommt es ja zu einem Problem mit dem Bios. Es wird ja die Settings nicht mehr halten, das Resultat wären solche Probleme wie sie hier auftreten. Aber dann müsste es die Werte auch löschen, was nicht passiert! Schaue ich mir die Serversettings an ist ALLES so wie ich es eingestellt habe. Läuft dann auch.. Ehrlich gesagt werde ich nicht wirklich schlau aus der Situation.
Any Ideas? (Ach ja - zur Zeit is er wieder mal Down.. daher kann ich keine weiteren Daten posten. Da ich nicht dran komme.)
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 222899
Url: https://administrator.de/contentid/222899
Ausgedruckt am: 22.11.2024 um 08:11 Uhr
41 Kommentare
Neuester Kommentar
Hallo,
wie wäre es, wenn du dazu den IBM/Lenovo Support kontaktierst, dafür sind die Kerlchen da und die kennen sich bestimmt gut mit den Geräten aus.
Beste Grüße,
Christian
certified IT
PS: Wäre es ein BIOS/Batterie Problem würde der Server nicht danach wieder wunderbar funktionieren. Hört sich eher nach Hitze oder einem defekten Ram ovgl. an.
wie wäre es, wenn du dazu den IBM/Lenovo Support kontaktierst, dafür sind die Kerlchen da und die kennen sich bestimmt gut mit den Geräten aus.
Beste Grüße,
Christian
certified IT
PS: Wäre es ein BIOS/Batterie Problem würde der Server nicht danach wieder wunderbar funktionieren. Hört sich eher nach Hitze oder einem defekten Ram ovgl. an.
Zitat von @TechnoX:
Könnte das selbe Problem sein aber sicher bin ich mir leider nicht. Da ich nicht weis ob der Server überhaupt noch eine
Battarie füs Bios braucht.
Könnte das selbe Problem sein aber sicher bin ich mir leider nicht. Da ich nicht weis ob der Server überhaupt noch eine
Battarie füs Bios braucht.
Brauchen Sie.
Aber normalerweise ist es, solange der Server läuft egal ob die Batterie leer ist oder nicht. Nur wenn der Server neu gestartet wird oder aus und wieder eingeschaltet wird, wird das Bios auf Default zurückgesetzt, wenn die Batterie leer ist.
Gruß
Chonta
Zitat von @Chonta:
> Zitat von @TechnoX:
>
>
> Könnte das selbe Problem sein aber sicher bin ich mir leider nicht. Da ich nicht weis ob der Server überhaupt noch
eine
> Battarie füs Bios braucht.
Brauchen Sie.
Aber normalerweise ist es, solange der Server läuft egal ob die Batterie leer ist oder nicht. Nur wenn der Server neu
gestartet wird oder aus und wieder eingeschaltet wird, wird das Bios auf Default zurückgesetzt, wenn die Batterie leer ist.
> Zitat von @TechnoX:
>
>
> Könnte das selbe Problem sein aber sicher bin ich mir leider nicht. Da ich nicht weis ob der Server überhaupt noch
eine
> Battarie füs Bios braucht.
Brauchen Sie.
Aber normalerweise ist es, solange der Server läuft egal ob die Batterie leer ist oder nicht. Nur wenn der Server neu
gestartet wird oder aus und wieder eingeschaltet wird, wird das Bios auf Default zurückgesetzt, wenn die Batterie leer ist.
Es ist sogar so, daß solange Spannung am netzteil anliegt, die werte gehalten werden, auch wenn die Kiste "aus" ist. Wenn nicht per Schalter hart ausgeschaltet wird, versorgen übliche Schaltnetzteile das System immer noch mit Spannung um wichtige Funktionien wie WOL oder IPMI o.ä zur Verfügung zu haben.
lks
Zitat von @TechnoX:
Werd ich machen sobald ich das Ram ausgetauscht habe und der Fehler weiterhin auftritt. Wenns darauf raus läuft wäre das
fein, dann wäre nur der getauschte Ram ein zu schicken. Was relativ schnell abläuft. Ich hatte halt echt gehofft das der
Kelch an mir vorüber zieht.. ich hasse Support anfragen.
Warum? Das hier ist doch auch nichts anderes?Werd ich machen sobald ich das Ram ausgetauscht habe und der Fehler weiterhin auftritt. Wenns darauf raus läuft wäre das
fein, dann wäre nur der getauschte Ram ein zu schicken. Was relativ schnell abläuft. Ich hatte halt echt gehofft das der
Kelch an mir vorüber zieht.. ich hasse Support anfragen.
Dann solltest du evtl nicht mehr auf IBM/Lenovo setzen. Bei Dell brauche ich dafür genau eine ca 10 Stellen lange Nummer und gut ist. i.d.R wenn es kein Spezialfall ist gibt es direkt am Telefon, sonst innerhalb von 1-2h eine Rückmeldung mit einer Problemlösung oder ggf. die Versandbenachrichtigung des Ersatzteils.
HP sollte ähnlich sein, war bei mir aber bisher immer komplizierter...es würde mich wundern, wenn man bei Big Blue + Übernehmer größere Schwierigkeiten hat. Oder denkst du eine RMA bei Servern ist ähnlich wie bei Homenutzern?
HP sollte ähnlich sein, war bei mir aber bisher immer komplizierter...es würde mich wundern, wenn man bei Big Blue + Übernehmer größere Schwierigkeiten hat. Oder denkst du eine RMA bei Servern ist ähnlich wie bei Homenutzern?
Zitat von @VGem-e:
Hallo,
hast Du hier keinen Vor-Ort-Support?
In unserer Behörde kommt kein Server ins Haus bzw. wird ausgetauscht, sobald vom Hersteller so etwas nicht mehr
verfügbar ist!
Gruß,
VGem-e
Hallo,
hast Du hier keinen Vor-Ort-Support?
In unserer Behörde kommt kein Server ins Haus bzw. wird ausgetauscht, sobald vom Hersteller so etwas nicht mehr
verfügbar ist!
Gruß,
VGem-e
dito. Aber offensichtlich ist der Supportplan hier vollkommen unbekannt.
Hallo Ihr zwei,
Du kannst da ruhigen Gewissens bei Lenovo bleiben.
Denn auch dort gibst Du Deine Seriennummer an und der Supporter sieht genau wie lang die Garantie noch läuft und welche Garantieart überhaupt anliegt.
Die Fehlermeldung wirst Du aber in jedem Fall irgendwie übermitteln müssen.
mfg
kowa
Zitat von @KowaKowalski:
> Zitat von @certifiedit.net:
>
> Dann solltest du evtl nicht mehr auf IBM/Lenovo setzen.
Hallo Ihr zwei,
Du kannst da ruhigen Gewissens bei Lenovo bleiben.
Denn auch dort gibst Du Deine Seriennummer an und der Supporter sieht genau wie lang die Garantie noch läuft und welche
Garantieart überhaupt anliegt.
Die Fehlermeldung wirst Du aber in jedem Fall irgendwie übermitteln müssen.
mfg
kowa
> Zitat von @certifiedit.net:
>
> Dann solltest du evtl nicht mehr auf IBM/Lenovo setzen.
Hallo Ihr zwei,
Du kannst da ruhigen Gewissens bei Lenovo bleiben.
Denn auch dort gibst Du Deine Seriennummer an und der Supporter sieht genau wie lang die Garantie noch läuft und welche
Garantieart überhaupt anliegt.
Die Fehlermeldung wirst Du aber in jedem Fall irgendwie übermitteln müssen.
mfg
kowa
Offensichtlich gibt es dabei andere Probleme als den Support Hatte nur bisher keinen Lenovoserver zu supportieren.
Hallo TechnoX,
ich hätte noch eine Idee zum Thema.
Lass doch auf dem Server ein Script laufen, das dir verschiedene Infos in ein Log schreibt. Da kannst du ja dann selbst Temperaturen mit hinein nehmen.
Ich würde das Script alle 5 oder 10 min laufen lassen.
Vielleicht bekommst du so noch etwas raus.
PS: letzte BIOS Version und aktuelle Netzwerktreiber sind drauf (nur retorische Nachfrage)
grüße vom it-frosch
ich hätte noch eine Idee zum Thema.
Lass doch auf dem Server ein Script laufen, das dir verschiedene Infos in ein Log schreibt. Da kannst du ja dann selbst Temperaturen mit hinein nehmen.
Ich würde das Script alle 5 oder 10 min laufen lassen.
Vielleicht bekommst du so noch etwas raus.
PS: letzte BIOS Version und aktuelle Netzwerktreiber sind drauf (nur retorische Nachfrage)
grüße vom it-frosch
und für diese Erkenntnis brauchst du nen halben Tag?!
Was sagt denn IBM nun zu dem Verhalten?
Hallo TechnoX,
Wert 194 ist die Temperatur.
Hast du zwei Netzteile drin?
Wenn ja, hast du, wenn der Server bei dir war, auch immer beide angeschlossen?
Ich würde in das Log auch einen Ping auf localhost und Gateway mit aufnehmen. Da könntest du sehen, ob erst das Netzwerk weg ist, bevor er hängt oder ob er gleich hängt.
grüße vom it-frosch
Bezüglich der Temperatur kann ich absolut nichts sagen,
smartmontools installieren und smartctl -a /dev/sdx ins Log schreibenWert 194 ist die Temperatur.
Hast du zwei Netzteile drin?
Wenn ja, hast du, wenn der Server bei dir war, auch immer beide angeschlossen?
Ich würde in das Log auch einen Ping auf localhost und Gateway mit aufnehmen. Da könntest du sehen, ob erst das Netzwerk weg ist, bevor er hängt oder ob er gleich hängt.
grüße vom it-frosch
Zitat von @TechnoX:
Die Kiste ist in der Niederlassung, dh. ich kann direkt nicht vor ort darauf schalten. ABER ich weis das die Kiste an ist. Weil
sie immer an war (is ja schon einige Male passiert).
Die Kiste ist in der Niederlassung, dh. ich kann direkt nicht vor ort darauf schalten. ABER ich weis das die Kiste an ist. Weil
sie immer an war (is ja schon einige Male passiert).
Ja, aber da muß doch jemand vor Ort sein, wenn Du da den Stecker ziehen lassen kannst. Der soll mal wie wild auf der Tastatur rumhämmern, um zu schauen, ob das reaktionen hervorruft.
Solange Du (oder jemand vor ort) nicht hand an die Kiste anlegt, wird sa mit der hardware-Diagnose nichts.
lks
...kauf dir eine FritzBox, da hast du dann wenigstens Zugriff drauf (außerdem: Sicherer.)
https://www.google.de/search?q=vodafone+router+sicherheitsl%C3%BCcke& ...
https://www.google.de/search?q=vodafone+router+sicherheitsl%C3%BCcke& ...
Zitat von @TechnoX:
Liegt leider nicht in meiner Hand. Werd es jedenfalls mit Argusaugen beobachten und sollte es nochmal passieren Kriegt Vodaphone
einen netten Anruf. Und gut ist. Sollen die sich drum kümmern das ihr Gerät korrekt läuft.
Liegt leider nicht in meiner Hand. Werd es jedenfalls mit Argusaugen beobachten und sollte es nochmal passieren Kriegt Vodaphone
einen netten Anruf. Und gut ist. Sollen die sich drum kümmern das ihr Gerät korrekt läuft.
Das sollte aber dein Ansinnen sein. Wie viel Zeit hast du in dieses, nennen wir es mal IBM Problem investiert?
Zitat von @TechnoX:
Schlecht.. Der Niederlassungsleiter meinte nur trocken: er startet versuchsweise "mal wieder" den Vodaphone Router neu..
Schlecht.. Der Niederlassungsleiter meinte nur trocken: er startet versuchsweise "mal wieder" den Vodaphone Router neu..
Sagte ich nicht, da sollte jemand vor Ort mal schauen, ob während der Ausfälle die Kiste wirklich vom Netz ist.
lks
Zitat von @TechnoX:
*kleinlaut*... viel zu viel Zeit und ja.. war mir ssssoooo sicher das der Server das Problem is...
*kleinlaut*... viel zu viel Zeit und ja.. war mir ssssoooo sicher das der Server das Problem is...
Mach Dir nichts draus. Manchmal ist man da so sicher, daß nur etwas bestimmtes der Fehler sein kann, daß man alle anderen Optionen übersieht. Ist mir auch schon mal pasiert. Da ist es hilfreich, wenn ein anderer ohne dieses Brett vor dem Kopf eine Tipp gibt.
lks