fboy33
Goto Top

Server Acer Altos g540 mit WIN Serv 2008R2 fällt öfters immer gegen 4.00 Uhr morgens aus

Hallo liebe Hotliner und Leidensgenossen/innen

ich habe seit ca. 4 Wochen ein unerklärliches Problem mit einem Acer Altos Server G540, der öfters gegen 4.00 (3.59 / 4.03 /3.59 / usw.) Uhr abstürzt, zwischen 3 und 8 Tagen Abstand.
Laut Ereignisprotokoll ist der Strom einfach weg... es befinden sich keinerlei sonstige Protokolleinträge um diese Uhrzeit in den anderen Bereichen. Keine Sicherung läuft um diese Uhrzeit, keine Bereinigung oder sonstige Upgrates o.ä.
Dies ist der Verwaltungsserver mit der Domäne; es gibt noch einen 2. Server im Netz, der als reiner Anwendungssoftware-Server läuft, der funktioniert ohne Probleme. Habe die USV vom anderen Server getauscht (evtl. Hardwareproblem der USV) aber leider kein Erfolg, heute morgen war der Acer wieder aus.
Leider gibt es nicht wie bei HP eine Systemanalyse der Hardware von Altos, wo evtl. ein Fehler ersichtlich wird.
Hat evtl. jemand sowas schon mal gehabt und eine Lösung, oder einen Suchweg für mich!?

Danke für jede Info!

Erhard Faak

Content-ID: 205847

Url: https://administrator.de/contentid/205847

Ausgedruckt am: 22.11.2024 um 03:11 Uhr

psannz
psannz 30.04.2013 um 11:59:05 Uhr
Goto Top
Sers,

passt eventuell ein geplanter Task zu den Zeiten?

Event Logs vom BIOS geben auch keine Informationen aus?
Gibt es Fehler vom RAID Controller Utility? Wird wohl der LSI MegaRAID drauf laufen?

Wenn du den Server an ner USV dran hast, kannst du NUR den Server dran hängen und dann die Leistungslogs zum Zeitpunkt der Ausfälle befragen?

Grüße,
Philip
fboy33
fboy33 30.04.2013 um 13:59:45 Uhr
Goto Top
Hallo Philip,

Danke für die schnelle Antwort, leider keine Infos zu sehen, die das "Ereignis" betreffen; ja es ist der LSI Logic Mega Raid SAS 8708 Controler verbaut, im RAID5 mit 3 HDDs.
Im Log. der USV ist auch nichts zu sehen, um 3.53 Uhr war der turnusmäßige Eintrag und dann erst wieder nach dem Neustart um 06.57 Uhr.
liebe Grüße Erhard Faak
Deepsys
Deepsys 30.04.2013 um 14:35:22 Uhr
Goto Top
Hi,

der hat doch 2 Netzteile, oder?
Dann häng doch mal eines an die USV und die andere an eine Nicht-USV-Dose.
Dann kannst du die USV ausschließen.

VG
Deepsys
napperman
napperman 30.04.2013 aktualisiert um 14:52:15 Uhr
Goto Top
Moin,
das erinnert mich an die Story eines Systemhauses, dass zur hilfe gerufen wurde, weil bei einem Kunden genau das passierte.
Der hatte nur einen Server. Es stellte sich dann heraus, dass die USV sowieso hinüber war. Warum der Server dann immer um die gleich Uhrzeit ausging erkärte das aber nicht. Bis dann ein Mitarbeiter des Systemhauses zur üblichen Absturzzeit im Serverraum war:
Tür fliegt auf, Putzfrau kommt rein, reißt den Stecker raus und stöpselt den Staubsauger an face-wink

Nun zur Hilfe:
Wenn der Server 2 Netzteile hat, einfach mal die Anschlüsse tauschen (USV und nicht-USV)
Könnte ja sein, das die USV spinnt und ein Netzteil, und wenn dann der Test der USV anläuft, das Teil ausgeht, weil das Netzteil das an Nicht-USV hängt schrott ist und die USV nicht richtig schaltet...

Außerdem würde ich den Test der USV mal manuell anstoßen. Vielleicht lässt sich dadurch der Fehler reproduzieren.
fboy33
fboy33 30.04.2013 um 15:03:58 Uhr
Goto Top
Danke für die schnellen Antworten...
Da an jedem Server eine eigene USV hängt, habe ich die beiden USVs einfach getauscht, trotzdem ging der "richtige" Server wieder aus, also kann es an der USV nicht liegen.
Der Server wurde vor 4 Jahren noch ohne dem 2. Redundaten-Netzteil geliefert, so kann ich da leider nichts testen.
Weil es immer gegen 04.00 Uhr (+- 2 min.) passiert, haben die MA alles in der Firma überprüft, um diese Zeit ist niemand im Büro und auch die Heizung fährt dann nicht hoch, und auch keine Maschinen werden dann gestartet. Der Arbeitsbeginn ist erst um 06.00 Uhr. Da die USV normalerweise alles was übers Stromnetz geschieht filtert, kann es meiner Meinung nur intern im Server passieren...

tschüs Erhard Faak
Deepsys
Deepsys 30.04.2013 aktualisiert um 15:31:51 Uhr
Goto Top
Hi,

hmm, da hat nicht zufällig irgendein Scherzbold im BIOS ein automatisches Ausschalten oder so eingestellt?
Oder über die USV den Port abgeschaltet?

Ich würde mal die USV komplett herausnehmen, so oft gibt es ja auch keinen Stromausfall.

Tja, und im absoluten Notfall musst du wohl mal den Wecker früh stellen face-wink

VG
Deepsys
psannz
psannz 30.04.2013 um 16:34:38 Uhr
Goto Top
Und Tasks (taskschd.msc) sind auch keine für den Zeitraum eingerichtet?
fboy33
fboy33 30.04.2013 um 17:51:57 Uhr
Goto Top
Hallo psannz,
habe gerade noch mal auf dem Server nachgesehen, es läuft keine Task um die Uhrzeit, oder könnte da aufhören...

liebe Grüße Erhard Faak
psannz
psannz 30.04.2013 um 20:40:12 Uhr
Goto Top
Schade, dann fällt mir auf die schnelle zu den Symptomen auch nicht mehr ein. Obwohl... Hast eine Möglichkeit Hardwarewerte mitzuschneiden? Also Temperatur, Lüfterdrehzahlen, etc, etc? Wenn du da noch nichts hast, mit HWmonitor konnt man das - iirc - auch in ne csv loggen lassen. Das könnte eventuell noch Aufschluss geben. Das und die Leistungslogs der USV halt...

Das wars für heute, schönen Feiertag euch.

Grüße,
Philip
108012
108012 01.05.2013 um 02:35:43 Uhr
Goto Top
Hallo Erhard,

- Das Netzteil mal tauschen!
- Den Server einmal aufmachen (aufschrauben) und nach einem geplatzten Elko Ausschau halten
- Die Batterien der USVs einmal überprüfen
- Die Festplatten haben eventuell einen defekten Block und immer wenn an der Stelle auf der HDD geschrieben wird stürzt der Server ab, kann das sein.

Also mein Tipp defektes Netzteil oder ein defekter bzw. geplatzter Elko auf dem Mainboard.


Gruß
Dobby
fboy33
fboy33 01.05.2013 um 12:57:12 Uhr
Goto Top
Hallo Philip (psannz),
mit HWmonitor müsste ich es mal ausprobieren... Danke!

Hallo Dobby,
Netzteil tauschen habe ich auch schon gedacht, nur das bekommt man nur noch bei Acer, für viel - viel Geld und wenns dann nicht ist, hat der Kunde über 500 € ausgegeben...
Auf geplatzte Elkos habe ich nicht geachtet, aber bei 4 Jahren und Server hab ich an sowas auch noch nicht gedacht, aber wer darf schon bei IT denken *grins*.
Da der Absturz immer um 4 Uhr (+- 2 Minuten) geschieht, denke ich eher an einen systematischen Fehler (SW) nur ich hab keine Erklärung was es sein könnte, da ich alle mir bekannten Protokolle und Ereignisse bzw. Tasks angesehen habe. Die USVs sind erst 6 Monate alt und die habe ich gegeneinander schon getauscht, trotzdem trat genau wieder am Acer der Absturz auf.

tschüs und einen hoffendlich ruhigen Tag der Arbeit, ich sitze im Büro, da heute kein Kunde anruft und ich in Ruhe arbeiten kann.

Erhard Faak
108012
108012 01.05.2013 um 17:23:35 Uhr
Goto Top
Netzteil tauschen habe ich auch schon gedacht, nur das bekommt man nur noch bei Acer, für viel - viel Geld und wenns dann nicht ist, hat der Kunde über 500 € ausgegeben...
ok, ok, ok, das Geld würde ich auch nicht ausgeben wollen, das Thema ist dann wohl durch!

Da der Absturz immer um 4 Uhr (+- 2 Minuten) geschieht, denke ich eher an einen systematischen Fehler...
Also, ich hatte mal so ein ähnliches Problem obwohl ich eine USB Maus und Tastatur hatte lief der PC den ganzen Tag gut, nur wenn ich einen bestimmten Drucker benutzt habe kam ein BlueScreen und der
PC verabschiedete sich schlagartig! Nach näherer Betrachtung des Mainboards habe ich dann so etwas hier gefunden und dann war der Fall erledigt!!

Die USVs sind erst 6 Monate alt...
Ok dann sind die es wohl auch eher nicht!

Habt Ihr eventuell Eure Telekom Zwangstrennung morgens um 04:00 Uhr bei Euch?
Hast Du die Festplatten einmal gecheckt ob es da einen Bad Sektor gibt und der Server abstürzt
wenn ab und an dort drauf geschrieben wird?

Gruß
Dobby