franc
Goto Top

Windows Server 2003 (SP2) nicht mehr ansprechbar

Guten Tag,
ich habe ein fieses Phänomen auf meinem Windows Server 2003 (SP2):
gelegentlich, also nicht oft, vielleicht alle 1 bis 2 Monate, fängt plötzlich ein Fehler an, das System-Ereignisprotokoll zuzuballern:

Quelle: Application Popup
Kategorie: Keine
Ereigniskennung: 333

Ein E/A-Vorgang, der durch die Registrierung ausgelöst wurde, ist fehlgeschlagen. Dieser Fehler ist nicht korrigierbar. Die Registrierung konnte eine der Dateien mit dem Systemabbild der Registrierung nicht einlesen oder schreiben.


Zwei Ereignisse gleichzeitig, dann nach jeder Minute wieder.
Das Ereignis unmittelbar (2 Minuten) davor:

Fehler, Srv, 2020
Der Server konnte keinen ausgelagerten Poolspeicher reservieren, da der Pool leer war.


Der Server ist dann aber auch unansprechbar, antwortet zwar noch auf Ping, aber die Dienste sind nicht mehr nutzbar.
Ich muss ihn dann Resetten, danach geht wieder alles ganz normal.
Ich finde keinen Hinweis, was das nun verursacht. Ich kriege das aber dummerweise erst mit, wenn der Server schon (quasi) steht, so dass ich nicht mehr nachschauen kann, was da jetzt los ist (muss dann möglichst schnell wieder laufen, bin auch meistens nicht vor Ort, lasse also per Telefon auf Reset drücken).

Kann mir da jemand einen Tipp geben?

Danke, franc

Content-ID: 97981

Url: https://administrator.de/contentid/97981

Ausgedruckt am: 26.11.2024 um 10:11 Uhr

MaFa
MaFa 29.09.2008 um 11:47:20 Uhr
Goto Top
Hallo

schau dir mal http://support.microsoft.com/kb/312362/de an.

Gruß
franc
franc 06.10.2008 um 12:31:12 Uhr
Goto Top
Danke Manuel für den Tipp, leider hat das nichts geändert.
Ich habe den Poolspeicher geändert, aber der Fehler kam (schnell) wieder.

Die Fehlermeldung (im System-Ereignisprotokoll) heißt immer:

Quelle: Application Popup
Ereigniskennung: 333

Ein E/A-Vorgang, der durch die Registrierung ausgelöst wurde, ist fehlgeschlagen. Dieser Fehler ist nicht korrigierbar. Die Registrierung konnte eine der Dateien mit dem Systemabbild der Registrierung nicht einlesen oder schreiben.


Diesmal ohne den Srv-Fehler 2020 unmittelbar davor.
Dieser kam aber dennoch gelegentlich wieder (-anscheinend ist er wohl nur eine Folge des Application Popup Fehlers).

Die Application Popup-Fehlermeldung fängt (z.B. am 05.10.2008) so an:

09:55:29
09:55:35
09:55:41
09:56:32
09:57:32
09:58:32
09:59:32
10:00:05
10:00:32
10:01:32
usw. mal minütlich mal öfters bis zum Server-Reset.

Und nach dem Reset des Servers (am 06.10.2008 um 09:14:18) kommt eine Meldung:

Das System wurde zuvor am 05.10.2008 um 09:55:27 unerwartet heruntergefahren.

Das ist also unmittelbar vor dem Beginn der Fehlertirade!

Und davor das letzte System-Ereignis ist lediglich eine Information vom Service Control Manager am 04.10.2008 um 21:44:05:
Dienst "WinHTTP-Web Proxy Auto-Discovery-Dienst" befindet sich jetzt im Status "Beendet".

In den anderen Protokollen gibt es auch keinen Hinweis auf Verursacher.
Der Server läuft auch noch weiter, wenn auch sehr eingeschränkt (z.B. mit Meldungen von Security, Systemereignis, 516, wie: Die für die Überwachung reservierten internen Ressourcen sind ausgelastet. Dies wird zu einem Verlust von Überwachungsereignissen führen.). Er lässt sich noch anpingen. Aber (natürlich) kein Zugriff via Remote Desktop (RDP). Auch kein Zugriff auf Freigaben.
Der Server hat ein Raid 1 Plattenverbund mit zwei Platten (ohne Fehler).

Was kann ich tun?
MaFa
MaFa 06.10.2008 um 13:01:55 Uhr
Goto Top
Hallo,

um hier nicht alle Fragen, wie z.B. welche Backup Software und andere Anwendungen im Einsatz sind, einzeln stellen zu müssen, gibts bei dem nachfolgenden Link
ein sehr aufwendiges und gut ausgearbeitetes Workaround für den Fehler 333 und
die Folgefehler (2020, 2019 ...etc pp)

http://blogs.technet.com/perfguru/archive/2008/06/24/how-to-troubleshoo ...

Ich hoffe, dass dir der Link hilft.

Gruß

Manu
franc
franc 07.10.2008 um 00:52:43 Uhr
Goto Top
Danke für den Link.
Ich hab jetzt mal defragmentiert (war nötig) und für srv.sys den Hotfix 927435-v2 installiert (musste ich erst per Mail beantragen).
Ich hab sonst unter den vielen Tipps dort aber nichts gefunden, was so recht gepasst hätte.
Auf dem Server läuft übrigens keine Virensoftware oder Firewall.
Aber Acronis TrueImage 8.01.0000.1213 läuft dort (also ständig die TrueImageMonitor.exe). Aber ohne aktiven Task.
Ob ich das mal deinstallieren sollte?

Zum Verständnis: Ist der 333er Fehler etwa ein Folgefehler von irgendwas?
MaFa
MaFa 07.10.2008 um 09:34:25 Uhr
Goto Top
Moin,

bei einigen Systemen soll wohl geholfen haben, die Auslagerungsdatei zu vergrößern.
Wieviel Arbeitsspeicher hat der Server und wie sind die Werte für die Auslagerungsdatei eingestellt?

Das Acronis würde ich erstmal nicht deinstallieren. Da dein Fehler ja erst nach 1-2 Monaten auftritt und du ja anscheinend deine Datensicherung darafu realisierst.

Interessant wäre aber noch, welche Einträge im Anwendungs- und Systemprotokoll eingetragen werden, bevor der Server mit den Fehlern beginnt.

Gruß

Manu
franc
franc 07.10.2008 um 10:17:51 Uhr
Goto Top
Der Server:

AMD Athlon(tm) 64 Processor
3500+
2.21 GHz, 2,00 GB RAM
Physikalische Adresserweiterung


Die Auslagerungsdatei-Einstellungen:

Größe der Auslagerungsdatei für ein bestimmtes Laufwerk:
Laufwerk: C: [Boot] Verfügbarer Speicherplatz: 39406 MB
x Benutzerdefinierte Größe: Anfangsgröße (MB): 2046 Maximale Größe (MB): 4092


Ich habe die Auslagerungsdatei jetzt auf Laufwerk D gestellt (C: - Keine Auslagerungsdatei) und auf "Größe wird vom System verwaltet" umgestellt.

Im Systemprotokoll ist leider unmittelbar vor Beginn des Fehlers nichts zu finden:

Fehler 05.10.2008 09:55:29 Application Popup Keine 333
Informationen 04.10.2008 21:44:05 Service Control Manager Keine 7036
Informationen 04.10.2008 21:44:05 WinHttpAutoProxySvc Keine 12517
Informationen 04.10.2008 21:44:05 WinHttpAutoProxySvc Keine 12503
Informationen 04.10.2008 21:27:35 Service Control Manager Keine 7036
Informationen 04.10.2008 21:27:35 Service Control Manager Keine 7035


Im Anwendungsprotokoll steht noch weniger:

Fehler 05.10.2008 12:17:29 ESENT Protokollierung/Wiederherstellung 439
Fehler 05.10.2008 12:17:29 ESENT Allgemein 488
Fehler 05.10.2008 11:27:03 Userenv Keine 1081
Informationen 03.10.2008 09:10:45 APCPBEAgent Keine 1004


Die Datensicherung mache ich nur sporadisch (manuell) mit Acronis. In der Hauptsache werden die Daten auf eine externe Festplatte und auf ein Band gesichert. Das geschieht mit dem Taskplaner und mit Iomega Automatic Backup Pro (für das Bandlaufwerk).
MaFa
MaFa 07.10.2008 um 10:29:48 Uhr
Goto Top
Ehrlich gesagt viel mehr fällt mir so auch nicht ein.

Eventuell anfangen die optionalen Geschichten temporär zu entfernen / aktualisieren.
- Acronis
- USV Software (APC)
- ...

Vlt auch nicht benötigte Hardware mal temporär rausnehmen/entfernen. (Streamer, USB HDD)

Wenn alle Stricke reissen, würde ich ein Vollbackup mit Acronis erstellen und eine Windows Reparaturinstallation durchführen.

Habe ich schon mehrfach erfolgreich durchgeführt. Aber bitte nur mit vorherigen Vollbackup, wo du Ahnung von hast wie man den Server ohne Probleme wiederherstellen kann !

Gruß
MaFa
franc
franc 07.10.2008 um 10:44:07 Uhr
Goto Top
Das Dumme ist, dass es evtl. so lange dauert, bis dieser Fehler aufläuft. Dass ich ihn nicht reproduzieren kann.

Die Auslagerungsdatei hab ich wieder auf C: gestellt (aber automatisch zugeordnete Größe), da D: sowieso nur eine Partition ist.
MaFa
MaFa 07.10.2008 um 11:03:36 Uhr
Goto Top
Zitat von @franc:
Das Dumme ist, dass es evtl. so lange dauert, bis dieser Fehler
aufläuft. Dass ich ihn nicht reproduzieren kann.


Jo das stimmt, sicherlich das größte Manko bei der Fehlersuche.
franc
franc 07.10.2008 um 11:06:07 Uhr
Goto Top
Falls ich jemals den Fehler lokalisieren kann, werde ich es hier mitteilen.
franc
franc 08.12.2008 um 17:52:11 Uhr
Goto Top
... bis jetzt noch nicht wieder aufgetreten... (*tock_tock_tock*)
franc
franc 10.10.2009 um 01:55:57 Uhr
Goto Top
Immer noch nicht wieder aufgetreten. Ich vermute also schwer dass es an der Fragmentierung lag.
franc
franc 01.06.2011 um 11:03:07 Uhr
Goto Top
Bis heute nie wieder aufgetreten, es war wohl ziemlich sicher die Fragmentierung.

THREAD GESCHLOSSEN