7016
Goto Top

Windows 2000 Serverproblem

Einfrieren des Servers

Hallo alle zusammen,

ich habe folgendes Problem.

Ein Windows 2000 Server friert im Betrieb ein und ist danach nur noch durch den Resetknopf bedienbar face-sad
Konfiguration:
Maxdata Platinum Server
2 x Pentium 3 850 MHZ
1 GB Arbeitsspeicher
3 x SCSI 320er im 160er Modus laufen als Raid 5
Tandberg Bandlaufwerk
Dienste:
Active Directory alleiniger Domain Controller
Exchange 6.0
Veritas Backup 9.1
GFI Mail Essentials 10.1
GFI Mail Security 8.....
Symantec Antivirus Server 10.0
Diverse Datenbanken

Das gesamte System ist voll gepatcht, jede sich im Einsatzbefindende Software ist auf dem neuesten Stand des jeweiligen Herstellers.
Seit einer Woche friert nun die Maschine willkürlich ein und ist danach platt bootet jedoch nach einem reset Problemlos und bringt nur den event 6008 mit der quelle Eventlog.
Folgende Lösungsansätze bin ich durchgegangen:
1. Hardwareanalyse;
Hardalyser im Linux mode über Nacht - Ergebnis Hardware OK
Ich Hab alle Hardwarelogs durchgesehen und sie dem Systemhersteller sprich Maxdata zukommen lassen und wir sind übereinstimmig zu der Meinung gekommen Hardware - OK
2.
Softwarefehlersuche;
Zuerst hab ich die Registry so erweitert das man einen manuell herbeigeführten Memory.dmp erzeugen kann und dies im Betrieb getestet - läuft Problemlos der Server springt in den vorgesehenen Bluscreen und schreibt das jeweils vorher gewünschte Memory.dmp auf die Platte.
Problem wenn er freezed springt er nur noch zum Bluescreen und schreibt eben nicht mehr auf die Platte anschließend;
Anschließend hab ich die Serverüberwachung auf alle Werte und Instanzen gehetzt und einen kompletten MPSReport erstellt, alle diese Daten hab ich auch an Microsoft selbst zur durchsicht gesendet. Antwort von Microsoft - können nichts finden sieht alles Ok aus.
Die einzige Fehlermeldung die in den Protokollen erscheint ist Die Event ID 6008 mit der Quelle Eventlog. Text dazu in der Technet ist "Das System wurde unerwartet heruntergefahren" !!
Nachfolgend bin ich hergegangen und hab alle systemfremden Dienste nacheinander Deaktiviert, deinstalliert und weiterlaufen lassen... immer wieder das selbe Spiel mal läuft er 8 - 10 Std. und mal nur 10 min...

Also ich bin nun mit meinem Latein ziemlich am Ende.. Hat irgendwer noch eine Idee?!??

Content-Key: 12327

Url: https://administrator.de/contentid/12327

Printed on: April 25, 2024 at 13:04 o'clock

Member: meinereiner
meinereiner Jun 24, 2005 at 16:56:21 (UTC)
Goto Top
tja, das ist immer schwer zu sagen. Ein Treiberproblem könnte es auch sein.
Drucker können z.B. auch zu "netten" Ereignissen führen.
Member: Proloader
Proloader Jun 24, 2005 at 17:33:23 (UTC)
Goto Top
Das Problem sollte für einen Profi einfach zu lösen sein.
Wenn sie den Server alleine Administrieren, müssten sie etwa wissen was sich darauf so abspielt. Jetzt ist die Frage trat das Problem pötzlich auf? (System Log's)
Was haben sie zu letzt gemacht. Und mal das Systematisch rückgängig machen.
Auch die dofen Updates machen mehr Problem als man glaubt darum mach ich nie solche nur grosse die ca über 200MB grosse sind meisst (Version Upgrades oder schwer wiegendes!)
Man muss nur eine richtige Firewall Appliance haben.

Gruss M.P.S
Member: meinereiner
meinereiner Jun 24, 2005 at 20:38:16 (UTC)
Goto Top
Das Problem sollte für einen Profi
einfach zu lösen sein.

Wieso??

Meiner Erfahrung nach sind genau das die Probleme denen man am schwersten auf die Spur kommt.
Mitglied: 7016
7016 Jun 25, 2005 at 06:54:40 (UTC)
Goto Top
Also das letzte was ich gemacht habe ist das GFI MailEssentials auf eine neuere Version upzudaten wegen Anti Spam. Das ist das einzige was sich in letzter Zeit verändert hat. Ich bin übrigens Informatiker. Und wie gesagt ich habe bereits alle Dienste auf die vorhergehende Version zurückgespielt und ich hab nach wie vor keine Meldung in den Leistungsprotokollen in den Eventlogs steht nichts ausser die 6008 mit der Quelle Eventlog... Das problem trat einfach so plötzlich auf und ist seitdem vorhanden ohne irgendeine einwirkung von aussen die letzten Updates die ich gemacht hatte liefen da schon über 4 Tage Problemlos.
Zu den angeblich doofen Updates kann ich nur sagen das ich mit noch keinem einzigen jemals ein Problem hatte bisher. Ich Administriere auch nicht nur eine Maschine und sowas in der Art hatte ich noch niemals.
Member: csw
csw Jun 26, 2005 at 06:04:29 (UTC)
Goto Top
klingt für mich doch nach einem Hardwareproblem. Du solltest den Speicher mal tauschen oder Module ausbauen.
Über die Qualität und Kompetenz der Maxdata-Hotliner kann ich leider nichts Gutes berichten face-smile
Mitglied: 7016
7016 Jun 26, 2005 at 08:03:02 (UTC)
Goto Top
ja ich bin eigentlich auch der Meinung das es eher an der Hardware liegen muß. Ist halt eine echt beschissene Situation.
Member: marek
marek Jun 29, 2005 at 17:40:17 (UTC)
Goto Top
Symantec ???
Member: wb64
wb64 Jul 30, 2005 at 14:28:29 (UTC)
Goto Top
Hallo, habe genau das gleiche Problem mit einem Maxdata-Rechner (Baujahr 2001 / Intel Pentium 4, 2,0 GHz, MB: Asus P4B i845, 1 GB RDRAM PC133, ATI Xpert 2000 Rage, Windows 2000 Server SP4), der als Server eingesetzt wird und bislang dieses Problem nicht hatte.

Bei mir tritt das Problem immer dann ein, wenn ein Benutzer von einem Client aus größere Datenmengen übers Netz auf seinen Arbeitsplatzrechner kopiert. Server bleibt stehen oder bootet selbstständig neu und hat Fehler 6008 im Eventlog.

Es mußte schon einmal die Netzwerkkarte getauscht werden, nun ist eine Intel Pro/100+ 10/100 MBit PCI eingebaut, der Treiber war zum Zeitpunkt des Einbaus (März 2005) aktuell.

Kann die Netzwerkkarte (oder der Treiber) vielleicht schuld sein am Schlamassel?
Gibt es inzwischen bei Euch eine Lösung für das Problem?
Danke für die Hilfe!!
Member: test.dummy
test.dummy Sep 14, 2005 at 21:49:44 (UTC)
Goto Top
Habe das gleiche Problem auf einem HP Server ML110. Es läuft alles einwandfrei bis sich der Server dann aufhängt. Habe bei www.event.net nachgeschaut und bin auf eine Meldung gestossen die einen Hinweis beschreibt, dass dieses Problem sehr oft auch durch ein defektes Netzteil entsteht. Das würde auch erklären weshalb bei einem Hardware-Test keine Fehlermeldung angezeigt würde, denn das Netzwerk kann gar nicht mit Software geprüft werden - auf jedenfall nicht bei kurzen Aussetzern. Man stelle sich vor, was passiert in einer Maschine bei der kurz oder lang die 12V Spannung fehlt.

Der Disk läufen nicht mehr, gewisse Komponenten auf dem Board funktionieren auch nicht mehr, aber die Power-Anzeige leuchtet trotzdem, da ein Teil des Boards noch immer mit Strom (5V, 3,3V) versorgt wird.

Habe es selber noch nicht getestet, werde es aber morgen tun.


Hier noch die Meldung von www.eventid.net:

Hardware issues could also cause this error. Several users reported that their problems were fixed after replacing a hardware component (mostly the power supply).
Mitglied: 7016
7016 Sep 16, 2005 at 18:56:21 (UTC)
Goto Top
Ich denke ich habe den Fehler gefunden bei der Maschine eine Festplatte hatte sporadisch aussetzer dies ging dann so lange bis sie ganz ausfiel. Ausgetauscht seitdem gehts wieder Problemlos, allerdings läuft die Maschine im Leerlauf zur Zeit muß man mal abwarten, wird jetzt demnächst 2003 Server mit Blackberry draufkommen und dann schaun mer mal.

Zu der Version mit dem Netzteil würde ich bei meiner Maxdata Maschine sagen glaube ich eher nicht da sie zwei redundante Netzteile hat und ich ausserdem die Spannungen im Bios überwachen lassen habe... Kann ich daher in meinem Fall eher ausschließen sollte man aber checken ist auch ein möglicher Grund.

Was auch noch sein kann, das sich zwei Softwareprogramme untereinander nicht mögen, z.b. GFI MailEssentials GFI Mail Security in Verbindung mit Veritas Back Up Exec unter Vers. 10. mögen sich nicht so gerne auf einer Maschine nach meiner Erfahrung...

Zu der Netzwerkkarte kann ich sagen:

Das kann sehr gut ein Problem sein, vor allen Dingen dann wenn die Netzkarte auf nem shared IRQ rumeiert... oder wie schon gesagt auch Treiberprobleme können da der Grund sein. Ich hab bisher mit 2000er Maschinen immer Ärger gehabt wenn die Büchse den IRQ mit der Netzkarte und dem AGP Shared.. das sollte man unbedingt vermeiden gerade bei nachträglichem einbauen einer Netzkarte passiert das oft....
Member: wb64
wb64 Sep 17, 2005 at 12:12:35 (UTC)
Goto Top
In meinem Falle glaube ich (nein ich bin mir fast sicher), daß es die Netzkarte ist.

Zuerst war eine Netzkarte drin, die Ihren Geist ganz aufgegeben hat.
Dann habe ich eine neue Netzwerkkarte (3COM 3C905B) eingebaut und den neuesten Treiber von 3COM passend zu Win 2000 installiert.

Die Karte läuft auch im Normalbetrieb, zeigt aber zwei Anomalien:
a) Dieses Problem, über das wir hier diskutieren (Server bootet unter Netzwerk-Vollast einfach neu)
b) Wenn ich den Server starte (nachdem er ausgeschaltet war), bekomme ich keine Netzwerkverbindung zu gar niemanden (der Treiber scheint dann irgendwelche Probleme mit sich selbst zu haben). Erst wenn ich dann nochmal "herunterfahren mit Neustart" mache, läuft die Netzwerkkarte.

Kennt sich jemand aus, wie man solche "shared irq"-Probleme auflöst??
Mitglied: 7016
7016 Sep 18, 2005 at 06:08:27 (UTC)
Goto Top
Ja also mit diesen Shared Irqs ist das so eine Sache es gibt wohl mehrere Möglichkeiten, eine (die ich immer Nutze) ist die das ich eine andere HAL ins System einpflege das ist aber ein bischen knifflig den man muß 1. die genaue version haben zum system d.h. man muß schauen in welchem Update die eventuell verändert wurde.
Die 2. Version wäre es über die Registrierung das IRQ Sharing zu deaktivieren, wiederum auch sehr knifflig denn dann ist es ganz allgemein abgeschaltet und es kann sein das die Kiste dann gar nicht mehr läuft...

Auf welchem IRQ läuft denn die Karte und mit was ist sie geshared.?!

In deinem Falle würde ich erst mal einen etwas älteren Treiber versuchen und vielleicht auch nur den Treiber ohne die 3 COM Zusatzsoftware.. ISt die Karte denn ganz sicher in Ordnung?! Ist das ein DC?!? dann kann man nämlich gar nicht einfach so die Karte tauschen da muß man noch viel mehr im System ändern sonst geht das alles nicht mehr...
Member: wb64
wb64 Nov 16, 2005 at 16:22:35 (UTC)
Goto Top
Bei meinem Server wurde der Fehler inzwischen gefunden: Es war das Netzteil.
Dieses war zwar nicht defekt, aber es hatte zu wenig Leistung (300W) für zu viele Verbraucher. Immer wenn alle Platten beschäftigt waren und auch der Prozessor noch ordentlich zu tun hatte, hat das Netzteil wahllos einen der Verbraucher vernachlässigt, was zur Folge hatte, daß der Server entweder stehengeblieben ist (Bildschirm war "eingefroren" / nicht mal Strg+Alt+Entf reagierte) oder der Rechner hat grundlos mittendrin neu gebootet. Nun habe ich ein 350W-Netzteil --> Problem beseitigt.
Member: meinereiner
meinereiner Nov 16, 2005 at 20:41:16 (UTC)
Goto Top
@wb64

schön dass du auch noch nach so langer Zeit schreibst woran es lag.
Die Lösung bleibt leider oft ungeklärt.

Viele Grüße
meinereiner
Member: Huhjukel
Huhjukel Mar 04, 2006 at 08:43:29 (UTC)
Goto Top
Hallo, mir ist dieses Problem leider auch bekannt.

Bei dem Server handelt es sich um einen TX150 von FSC, die Maschine ist mit 2 Netzteilen ausgestatet, welche von mir auch gelegentlich durch entfernen des Netzsteckers getestet werden.

Probleme mit der Netzwerkkarte oder mit dem Zugriff auf größere Daten schliese ich auch nahezu aus, da der Rechner meist zu einem Zeitpunkt runterfährt wenn garniemand im Büro ist.

Mir ist aufgefallen, dass dieses Problem nur dann auftritt, wenn ich den Rechner nach der Arbeit sperre.

Hat jemand noch eine Idee zu diesem Problem?
Member: wb64
wb64 Mar 04, 2006 at 20:21:06 (UTC)
Goto Top
Tja, im November 2005 dachte ich noch, daß die Ursache das Netzteil war, denn nach dem Tausch lief ertmal wieder alles. Doch der Fehler kam wieder und er wurde ständig schlimmer, Ursache nicht erforschbar. Nun wurde es uns zu dumm --> neue Maschine / neues OS (Win 2003) / neue Platten / alles neu --> Fehler weg.
Member: Huhjukel
Huhjukel Mar 05, 2006 at 16:47:45 (UTC)
Goto Top
Hallo,

ich hab jetzt mal bei www.eventid.net nachgesehen, was der Fehler 6008 bedeutet.

" Metabase entry for W3SVC missing.

Und das komische ist, dass wenn der Rechner nach dem unerwarteten runter fahren wieder neu startet, dass dann im Systemprotokol dreimal ein Fehler eingetragen wird, der auch was mit W3SCV zu tun hat.