dabjoern
Goto Top

Windows Server 2008 R2 stürzt ohne erkennbaren Grund mehrmals am Tag ab

Im u.g. Netzwerk tritt ein unspezifisches Problem aus. Der DC stürzt total spontan ab (Blue Screen) und bootet neu. Manchmal stürzt er am Morgen 3 mal kurz hintereinander ab (zwischen 8.30 und 11.00 Uhr). Dann gab es auch schon Zeiten so um 15 oder 16.00 Uhr. Auch ist er schon Nachts gegen 23 oder 1 bzw 2.00 Uhr abgeschmiert. Es gibt IMHO keinen Rhytmus. Es passiert in der Woche öfter als am Wochenende. Aktuell stürzt er nur tagsüber ab.

In der Ereignisanzeige steht nichts Besonderes. Wir haben schon viel rumprobiert und einiges abgeschalten. Alle Updates sind drauf. Hyper-v und Schattenkopien sind aus. Wir haben ein weiteres Gerät mit der gleichen Ausstattung bei uns im Büro stehen (1:1). Wir haben die Festplatten kopiert und bei uns reingehangen. Die "Kopie" lief tagelang durch, beim Kunden dagegen weiterhin Abstürze. Das Ganze ist für uns fast unerklärlich und wir stehen auf dem Schlauch face-sad

Der Server hat folgende Hardware:
- Intel Servermainboard S3200SHV S775
- Intel Dual-Core-Xeon E3110 S77
- Areca Raid Controller ARC 1200 PCIe
- Kingston 4 GB Dual-Kit DDR2-RAM 800 MHz ECC
- 2x WD 1000 GB WD1002FBYS SATA Raid-Edition 2

Auf diesem Gerät habe ich Microsoft Windows 2008 R2 Standard Server installiert und einige Rollen eingerichtet: DNC, DHCP, DC, Drucker- und Dateifreigabe. Außerdem ist MS SQL 2008 mit SP1 installiert. Daneben sind noch ein paar weitere, kleine Programme am Start.

Das Netzwerk ist auch wenig spektakulär:
- Cat7 Kabel
- Patchpanel
- Gigabit Switch von Allnet
- 11 Clients inkl. einem Notebook
- ein Netzwerkdrucker, ein Print Server mit lokalem Drucker
- Erdung vorhanden, Potential durchgemessen - passt

Hat jemand so etwas schonmal erlebt? Ich bin für jeden Hinweis sehr sehr dankbar.

Viele Grüße, Björn

Content-ID: 138596

Url: https://administrator.de/contentid/138596

Ausgedruckt am: 22.11.2024 um 11:11 Uhr

StefanKittel
StefanKittel 18.03.2010 um 19:44:12 Uhr
Goto Top
Hallo,

Zitat von @dabjoern:
Hat jemand so etwas schonmal erlebt? Ich bin für jeden Hinweis sehr sehr dankbar.
Ja. sehr häufig face-smile

Zurück zum Thema.
Das ganze kann ja nun sehr viele Gründe haben die sich nicht wirklich eingrenzen lassen.
Also gehen wir normal stragetisch vor.
Ich würde erstmal ein paar Stunden RAM-Test laufen lassen. Das hat schon vieles aufgezeigt.
Du schreibt Ihr habt eine baugleiche Maschiene? Das macht vieles einfacher. Einfach die Festplatten umhängen und testen.
Keine Abstürze: Hardware defekt: RAM, NT, Mainboard

Sonst: Andere Festplatten mit anderem Controller
Keine Abstürze: HDD und/oder Controller

Sonst: letztes funktionierendes Image zurückspiele (alle 6 Monate machen), sonst Windows neu installieren.

Stefan
Mad-Eye
Mad-Eye 18.03.2010 um 20:00:25 Uhr
Goto Top
Was du beschreibst ist ja wohl ne selbstbau-Maschine oder?

schonmal geprüft ob Ihr nicht ein Problem auf der thermalen Seite habt?

Morgens/Abends --> Logon, etc...
Nachts DaSi?

Gruß
Mad-Eye
mrtux
mrtux 18.03.2010 um 20:31:42 Uhr
Goto Top
Hi !

Wenn es zwei exakt gleiche MaschiEnen sind und der Fehler tritt mit den gleichen Daten (OS, Treiber usw.) nur bei einer der Kisten auf, hat diese ein Problem mit der Hardware, so einfach ist das....Welche Diagnosen der Hardware hast Du schon durchgeführt? Arbeitsspeicher? Netzteil? Mainboard? Platten? Wie alt ist die Kiste (Elkos auf dem MB)? Lüfter (wurde ja oben schon angesprochen)? usw. Und aufgemerkt: Immer Schritt für Schritt vorgehen, nie an zig Schrauben gleichzeitig drehen....

mrtux
education
education 18.03.2010 um 20:39:07 Uhr
Goto Top
ich würde mal ganz billig anfangen:

speicher tauschen von server1 in server2
dreht sich das spiel hast den fehler.
bleibt der fehler bei server1:
temperatur, netzteil, mainboard cpu testen
Patriot
Patriot 18.03.2010 um 22:05:25 Uhr
Goto Top
Was sagt denn der Bluescreen?--30 Zichen voll bekommen---
dabjoern
dabjoern 18.03.2010 um 22:31:22 Uhr
Goto Top
Danke für eure vielen Antworten. Hätte nicht gedacht, dass so viel kommt. Noch ein paar Anmerkungen:
- Es handelt sich um einen Eigenbauserver. Das haben aber Profis gemacht. Die fertigen von den Teilen viele Stück pro Monat.
- Der betroffene Server wurde im November 2009 als Neugerät beim Kunden aufgestellt.
- Nachdem die Abstürze vermehrt auftraten, haben wir die Platten des alten Geräts kopiert und den Server eingepackt. Danach haben wir die Platten in einen neuen baugleichen Server gepackt und beim Kunden aufgestellt.
- Der "neue" Server mit den alten Platten ist dann wieder fein beim Kunden abgestürzt. Der alte Server stand bis letzte Woche bei uns und lief sauber durch.

Meines Erachtens fällt dann damit Hardware völlig raus. Sry, dass ich die Info euch vorbehalten habe. War keine Absicht. Beim Kunden haben wir auch schon den Aufstellort variiert...

Noch ein paar Ausführungen zur Last:
- keine DaSi zur Zeit (ist noch nicht produktiv aufgrund der Abstürze)
- Bisher nur für Netzlaufwerke und als DC (auf niedrigem Niveau) genutzt.
education
education 19.03.2010 um 20:41:42 Uhr
Goto Top
dann noch was am rande:

evtl stromprobleme? vielleicht altbau?
stromspitzen usw...

häng mal eine relativ gute steckerleiste mit überspannungsschutz ( ca. 50€ ) zwischen server und strom. die usv mal weg lassen. oder hat der server keine usv?
guennie
guennie 22.03.2010 um 08:33:02 Uhr
Goto Top
hallo,

ich hatte das Problem Anfang des Jahres bei einem neuen R2 Server. Der ist auch grundlos abgestürzt. Ist auch ein INTEL Serverboard eingebaut. Da war ein 3ware SATA Raid Controller drin. Der wurde dann einmal ausgetauchst, hat aber nichts gebracht. Habe dann einen INTEL-Raid Controller eingebaut - und siehe da, Problem gelöst. Würde ich mal testen.

Gruß Günter
dabjoern
dabjoern 24.03.2010 um 12:09:19 Uhr
Goto Top
Wir haben beim Kunden einen Altbau, jo. Der Elektriker hat alles geerdet (Panel, Steckdosen etc.). Eine USV hängt davor. Das mit der Steckdose habe ich noch nicht getestet, rechne ich mir aber nicht viel aus. Was kann das noch bringen? USVs nehmen doch die Spitzen raus.
dabjoern
dabjoern 24.03.2010 um 12:35:49 Uhr
Goto Top
Hallo Günter,

ich habe mit dem Hardware Männeken gesprochen. Die haben den Server, so wie er bei unserem Kunden steht, zig Mal verkauft. Den Controller schließe ich damit aus. Wie gesagt, eine 1:1 Kopie der gesamten Hardware inkl. Kopie der Platte stand bei mir tagelang im Büro und lief einwandfrei. Jetzt bin ich beim Kunden vor Ort und schaue mir alles an.

Gestern ist der Server bspw. wieder abgestürzt, als wir am Switch umgesteckt haben. Mit einem Multimeter bewaffnet haben wir alle Erdungen nochmals gemessen. NICHTS, alles völlig im Rahmen.

Heute habe ich nun mal Wireshark am Laufen. Gegen 10.05 Uhr ist der Server wieder weggeraucht. Im Wireshark habe ich nichts auffälliges gefunden, außer tausende Checksum Fehler.

Ich habe mal bzgl. der Checksum Sache gesucht:
http://www.wireshark.org/docs/wsug_html_chunked/ChAdvChecksums.html
http://www.mcseboard.de/windows-forum-lan-wan-32/tcp-checksum-offload-s ...

Verstehe ich nicht ganz. Der letztgenannte Link verweist auf: http://support.microsoft.com/?scid=kb%3Ben-us%3B243294&x=9&y=14. Das ist alles suspekt. Sollte man mal in der Netzwerkkarte des Servers die Checksummenprüfung (TCP Prüfsummen abladen (IP4)) deaktivieren?