trialanderror
Goto Top

Win7 Clients fireren immer wieder ein

Hallo zusammen,

seit etwa August letzten Jahres frieren bei mir immer wieder vereinzelt und in unregelmäßigen Abständen Windows 7 Clients ein. Wie es scheint ist es dabei egal welche Anwendungen die Anwender zum Zeitpunkt des Absturzes offen haben und woran sie gerade gearbeitet haben (mal nur Firefox, mal Office, mal SAP, …). Meistens lässt sich die Maus noch bewegen aber man kann nichts mehr anklicken oder verschieben. Auch die Uhr bleibt stehen. Das Problem tritt bei verschiedenen Usern auf unterschiedlichen Rechnern (Intel NUCs und Lenovo Thinkpads) auf.

Auf den Clients läuft Windows 7 x64, die in einer Univention Domäne hängen.

Erst dachte ich, ich habe eventuell ein fehlerhaftes Update verteilt. Aber das Problem betrifft nicht jeden User. Auch war ich überrascht, dass sich die Clients selbst nach einem Cleaninstall irgend wann wieder weghängen. Da bei fast allen Anwendern Firefox läuft bin ich testweise mal auf Google Chrome umgestiegen. Auch das brachte nichts.

Gibt es eine Möglichkeit diesen Fehler zu diagnostizieren?

Ich freue mich auf eure Meinung zu diesem Problem und hoffe auf Tipps, was ich noch probieren kann.

Mit freundlichen Grüßen

TrialAndError

Content-ID: 329510

Url: https://administrator.de/contentid/329510

Ausgedruckt am: 22.11.2024 um 19:11 Uhr

michi1983
michi1983 15.02.2017 um 15:05:45 Uhr
Goto Top
Hallo,

was sagen die Eventlogs der betroffenen Maschinen zu den auftretenden Zeitpunkten?

Gruß
Chonta
Chonta 15.02.2017 um 15:14:59 Uhr
Goto Top
Meistens lässt sich die Maus noch bewegen
Wenn die Maus sich noch bewegen läßt ist der Rechner nicht eingefrohren.
Kann man noch irgendwas öfnen z.B. Taskmanager über Strg+Alt+Entf?
Irgendwelce Antiviernsoftware installiert, die aufeinmal scannen und das System überlasten?
Sind die Geräte noch anpingbar?
Gib es auffälligkeiten in den Serverlogs?
Gibt es Zeitliche Abweichungen zwischen UCS und Client? Läuft der UCS Zeitserver?
Gibt es Clients/User die nicht betroffen sind?

Gruß

Chonta
TrialAndError
TrialAndError 15.02.2017 aktualisiert um 15:34:06 Uhr
Goto Top
Hi Chonta,

Kann man noch irgendwas öfnen z.B. Taskmanager über Strg+Alt+Entf?
nein

Irgendwelce Antiviernsoftware installiert, die aufeinmal scannen und das System überlasten?
Auf den Clients läuft ESET. Bei nem Rechner mit zwei Monitoren hatte ich schon mal den Taskmanager parallel laufen lassen. Beim "hängenbleiben" war der Client irgend wo bei drei Prozent Systemlast. Auch die Ramauslastung war eher homöopathisch.

Sind die Geräte noch anpingbar?
Kann ich ehrlich gesagt nicht sagen, da die Clientfirewall Pings unterbindet. (habe ich so übernommen und noch nicht geändert)

Gib es auffälligkeiten in den Serverlogs?
Nichts was mir sofort ins Auge gefallen ist.

Haben Sie eventuell nen Tipp welches Log ich mal intensiver im Auge behalten sollte?

Gibt es Zeitliche Abweichungen zwischen UCS und Client? Läuft der UCS Zeitserver?
Wie kann ich das testen? Prinzipiell werden alle Clients im Netz über einen lokalen NTP Server mit der selben Zeit gefüttert. Hatte bislang aber keine Loginfehler wie ich sie bisher bei Zeitproblemen hatte. Soweit ich das sehe laufen alle UCS Dienste.

Gibt es Clients/User die nicht betroffen sind?
Zwei Drittel der Clients laufen mit dem Setup bisher Fehlerfrei.

Gruß
TrialAndError
TrialAndError
TrialAndError 15.02.2017 um 15:32:34 Uhr
Goto Top
Hallo michi,

genau diese Frage habe ich mir auch schon gestellt. Bisher konnte ich der Ereignisanzeige auf den Windows Clients noch nichts gebrauchbares entlocken.

Ich habe mir bisher die Windows-Protokolle angesehen. Genau genommen die "Anwendungen", "Sicherheit" und "System". Zum Zeitpunkt des "einfrierens" (eingefrorene Uhrzeit auf dem Display vor dem Reset) befinden sich nie Einträge in diesen Logs.

MfG
Chonta
Chonta 15.02.2017 um 15:43:30 Uhr
Goto Top
Prozent Systemlast. Auch die Ramauslastung war eher homöopathisch
Mir geht es dabei auch um die HDD Auslastung, wenn die Platte zu 100% ackert, kann das mitunter bei einigen Rechnern so wirken, als wären sie eingefrohren.
Wa sich auch schon hatte, war "Der PC ist eingefrohren" aber es hat sich einfach nur die Maus nicht bewegt, Maus und Tastatur ziehen wieder rein und es ging.
Warum auch immer wurden die Eingabegeräte "ausgemacht" aber der Rechner selber war pingbar und über Fernwartung war auch ein raufkommen.

da die Clientfirewall Pings unterbindet
Blöd, wenn das Antwortet ist ja der Rechner noch irgendwie da.

In den Logs vom Client sollte ggf auch was drin stehen, vor allem wenn nach dem "einfrieren" noch Logeinträge kommen ist das System noch da.

Wenn Servergespeicherte Profile und Ordnerumleitungen im Einsatz sind kann auch ein bockiges Netzwerk sowas änliches auslösen.

über einen lokalen NTP Server mit der selben Zeit gefüttert
Solange der UCS dieselbe Zeit bekommt ok, weil der UCS idt der DC und das Maß aller Dinge für die Clients was Zeit angeht.

Zwei Drittel der Clients laufen mit dem Setup bisher Fehlerfrei.
Und was ist an diesen Rechnern anders?
An was für einem Switch hängen die? Alle am gleichen oder die die Probleme haben sind alle an einem eigenen?

Gruß

Chonta
Pjordorf
Pjordorf 15.02.2017 aktualisiert um 15:48:39 Uhr
Goto Top
Hallo,

Zitat von @TrialAndError:
seit etwa August letzten Jahres frieren bei mir immer wieder vereinzelt und in unregelmäßigen Abständen Windows 7 Clients ein.
NUM-Lock LED reagiert noch bei Druck auf die entsprechende Taste? (Nicht die Tastatur macht die LED an/aus, das ist das OS nachdem von der tastatur das Signal kam. Wenn die CPU noch arbeitet, siehst du das)

Meistens
Bedeutet es das es manchmal auch nicht der fall ist?

lässt sich die Maus noch bewegen aber man kann nichts mehr anklicken oder verschieben. Auch die Uhr bleibt stehen. Das Problem tritt bei verschiedenen Usern auf unterschiedlichen Rechnern (Intel NUCs und Lenovo Thinkpads) auf.
Schaltet die SSD dann in den Totstellemodus und kommt erst nach einiger Zeit 30 - 90 Sekunden wieder zurück? (Hatte das mal an ein Win 7 64 Bit welcher mit einer Intel 330 SSD lief, mit einer Intel 540e blieb der immer wieder hängen, erst das deaktivieren einiger SSD feautures ermöglichte ein reibungsloses Arbeiten, allerdings ging dass auf kosten der I/O Leistung - älteres MoBo). Oder bleiben die Rechner dann OS mäßig TOT? Mal ein Livelinux zum testen auf so einen Client genommen um festszustellen ob es Hardware oder OS seitig bedingt ist?

Gibt es eine Möglichkeit diesen Fehler zu diagnostizieren?
Schwierig. Mit ein dauerping auf soclh ein Client schauen ob alles TOT wird oder nur bestimmtes. Geht dann noch RDP Zugriff auf die Clients? VNC? Freigaben? Dienste z.B. testweise eine WebServer mal dort laufen lassen und schauen ob der noch erreichbar bleibt....

Gruß,
Peter
TrialAndError
TrialAndError 15.02.2017 um 15:58:14 Uhr
Goto Top
Ok, also

Mir geht es dabei auch um die HDD Auslastung […]
Habe bislang nicht drauf geachtet. Werde ich mal versuchen im Auge zu halten. Die Kisten haben in dem Falle "leider" alle SSDs. An wilden aktionsgeräuschen kann ich das also nicht diagnostizieren. Da muss ich es erst mal schaffen auf dem richtigen Client den Taskmanager zur rechten Zeit offen zu haben face-smile

da die Clientfirewall Pings unterbindet
Blöd, wenn das Antwortet ist ja der Rechner noch irgendwie da.
Gerade die Notebooks sind andauernd in fremden Netzen. Da kann ich die Entscheidung meines Vorgängers in der Firewall nur wenige Ports zu öffnen schon nachvollziehen face-smile

Wenn der Rechner hängt war es bisher aber auch nicht möglich sicher per RPD oder VNC (läuft auf machen der stationären Rechnern) zu verbinden.

In den Logs vom Client sollte ggf auch was drin stehen, vor allem wenn nach dem "einfrieren" noch Logeinträge kommen ist das System noch da.
Zum Zeitpunkt des "einfrierens" finde ich im Nachgang keine Logs mit passendem Zeitstempel. Gut, kann Zufall sein aber ich würde momentan sagen er schreibt in der Zeit keine.

Und was ist an diesen Rechnern anders?
Wenn ich das wüsste face-sad

Prinzipiell setzt ich die alle über OPSI auf. Sie bekommen alle das gleiche Setup. Gut, die Treiber unterscheiden sich zwischen den Modellen aber das Problem betrifft ja leider nicht nur eine Modellreihe. Es betrifft mal drei L540 und 20 NUCs, dann wieder andere Notebooks und keinen NUC.

Ein paar Anwender haben das Problem immer wieder. Bei denen habe ich aber auch schon die Hardware getauscht. Selbst ein Tausch von Notebook auf NUC oder umgekehrt hat nichts geholfen. Nach spätestens einer Woche ist die Kiste wieder "eingefroren".

An was für einem Switch hängen die?
Dazu kann ich leider keine genaue Auskunft geben. Was ich aber sagen kann ist, dass in einem Büro wo eine der Anwenderinnen sitzt, deren Rechner immer wieder hängen bleibt noch zwei weitere Kollegen am gleichen Switch hängen und deren Rechner problemlos laufen.

Alle drei haben die gleiche Aufgaben und arbeiten überwiegend mit Webanwendungen, Office und Mail. Hängt sich der Rechner bei der einen Kollegin auf während Sie eine Excel Datei bearbeitet können die anderen beiden die Datei problemlos bearbeiten.

MfG
TrialAndError
TrialAndError 15.02.2017 um 16:06:24 Uhr
Goto Top
Zitat von @Pjordorf:

Hallo,

Zitat von @TrialAndError:
seit etwa August letzten Jahres frieren bei mir immer wieder vereinzelt und in unregelmäßigen Abständen Windows 7 Clients ein.
NUM-Lock LED reagiert noch bei Druck auf die entsprechende Taste? (Nicht die Tastatur macht die LED an/aus, das ist das OS nachdem von der tastatur das Signal kam. Wenn die CPU noch arbeitet, siehst du das)

Probiere ich bei nächster Gelegenheit aus.

Meistens
Bedeutet es das es manchmal auch nicht der fall ist?

Wenn das "Meistens" im Zusammenhang mit der Maus steht, dann gibt es hin und wieder auch Systeme bei denen sich die Maus nicht mehr bewegen lässt. Ist aber eher selten.

lässt sich die Maus noch bewegen aber man kann nichts mehr anklicken oder verschieben. Auch die Uhr bleibt stehen. Das Problem tritt bei verschiedenen Usern auf unterschiedlichen Rechnern (Intel NUCs und Lenovo Thinkpads) auf.
Schaltet die SSD dann in den Totstellemodus und kommt erst nach einiger Zeit 30 - 90 Sekunden wieder zurück? Oder bleiben die Rechner dann OS mäßig TOT?

Öhm, ich habe bisher noch nichts von dem Totstellemodus einer SSD gehört. Wie kann ich das herausfinden? Manche Anwender hoffen ihre Daten wieder zu bekommen und warten auch mal 30 Minuten das das System wieder "auftaut". Bisher hat nur der Reset geholfen.

Mal ein Livelinux zum testen auf so einen Client genommen um festszustellen ob es Hardware oder OS seitig bedingt ist?
Habe aus Frust sogar schon Linux fest drauf installiert. Funktioniert bisher ohne Fehler. Trifft aber leider nicht auf besonders positive Resonanz bei den "Testkandidaten" .

Gibt es eine Möglichkeit diesen Fehler zu diagnostizieren?
Schwierig. Mit ein dauerping auf soclh ein Client schauen ob alles TOT wird oder nur bestimmtes. Geht dann noch RDP Zugriff auf die Clients? VNC? Freigaben? Dienste z.B. testweise eine WebServer mal dort laufen lassen und schauen ob der noch erreichbar bleibt....

RDP und VNC funktionieren nicht. Ping werde ich mal testweise bei einigen NUCs freigeben und hoffen, dass einer von denen einfriert. Auf nen Webserver bin ich bislang noch nicht gekommen. Werde ich auch mal probieren.
Pjordorf
Pjordorf 15.02.2017 aktualisiert um 16:18:02 Uhr
Goto Top
Hallo,

Zitat von @TrialAndError:
Öhm, ich habe bisher noch nichts von dem Totstellemodus einer SSD gehört.
Deine Suchmaschine mit "ssd friert ein" füttern und lesen face-smile

Bisher hat nur der Reset geholfen
Also war die warterei umsonst und nur ein Reset oder Poweronoff für >= 4 Sek drücken half. man könnte also definitiv sagen die CPU bleibt stehen, oder oder arbeitet eine NO Operation Loop ab face-smile

Gruß,
Peter
DankeFuerNichts
DankeFuerNichts 15.02.2017 aktualisiert um 17:29:06 Uhr
Goto Top
Eventuell hilft dieser Artikel: KB2664888

Hatte das gleiche Problem mit ESET!! Endpoint Protection

Dieser Patch hat geholfen.

Hier noch der eset-Artikel: http://support.eset.com/kb2567/
TrialAndError
TrialAndError 17.02.2017 um 14:01:32 Uhr
Goto Top
Eventuell hilft dieser Artikel: KB2664888

Soweit ich das sehe haben wir eine neuere Version und das Problem sollte bereits gepatcht sein.
DankeFuerNichts
DankeFuerNichts 18.02.2017 um 12:14:43 Uhr
Goto Top
Dann würde ich aber vorschlagen, um es ausschließen zu können, mal ESET samt Agent zu deinstallieren und schauen ob das Milderung bringt.
Denn soweit ich dem Thread entnehmen kann, hast Du das noch nicht probiert.
TrialAndError
TrialAndError 21.02.2017 um 08:56:02 Uhr
Goto Top
Status 2017.02.21

Ok,
nun "endlich" ist mal wieder ein Client eingefroren, an dem ich testen konnte. Genaugenommen ist er im Laufe das Tages 4x eingefroren.

Dieser ist dieses mal aber so richtig eingefroren. Nicht einmal die Maus lies sich mehr bewegen.
In der Firewall waren Pings erlaubt. Im eingefrorenen Zustand kamen keine Rückmeldungen. Nach einem Reset hat es wieder funktioniert.
Auf dem Rechner lief ein VNC-Server. Auch dieser erlaubte keine Verbindung vor dem Reset.
Bei dem Gerät handelt es sich um einen Intel NUC.
TrialAndError
TrialAndError 21.02.2017 um 08:58:20 Uhr
Goto Top
Dann würde ich aber vorschlagen, um es ausschließen zu können, mal ESET samt Agent zu deinstallieren und schauen ob das Milderung bringt.
Denn soweit ich dem Thread entnehmen kann, hast Du das noch nicht probiert.

Der Vorschlag ist gut nur benötige ich dafür ein komisches Passwort, das ich in der Doku meines Vorgängers noch nicht gefunden habe :P

Ein reines deaktivieren des Virenschutzes habe ich bisher schon probiert. Das hat nicht geholfen.

Sobald ich Zeit hatte das Install Script auseinander zu nehmen um das PW zu suchen werde ich Eset mal testweise auf einzelnen Clients deinstallieren.
DankeFuerNichts
DankeFuerNichts 21.02.2017 aktualisiert um 10:00:10 Uhr
Goto Top
Das Passwort kann in ERA (ESET Remote Administrator) als Richtlinie hinterlegt werden. (wenn ich mich nicht täusche)
Ich traue mich fast Wetten dass es daran liegt. Ich hatte wie gesagt das gleiche Problem.
Chonta
Chonta 21.02.2017 um 09:59:28 Uhr
Goto Top
Du solltest auch mal den RAM mit memtest von einer Bootce versuchen.
Und die genaue Hardware von den PC die betroffen sind mit PC die nicht betroffen sind vergleichen.
Und dann gezielt nach Problemen für die Unterschiede suchen.

Kann ja sein das CPU xyz probleme macht oder Chipsatz X.

Evtl hilft es auch das Bios zu aktualisieren. Ich hatte mal einen PC der hatte ein ähnliches verhalten, egal ob Windows oder Linux, und nach einem BIOS Flash gings Jahre lang tadelos.

Gruß

Chonta
TrialAndError
TrialAndError 22.02.2017 um 15:38:39 Uhr
Goto Top
@Chonta
Evtl hilft es auch das Bios zu aktualisieren.

Bin inzwischen mit allen Rechnern durch. Ich hoffe doch sie haben es nicht verschlimmbessert.

RAM mit memtest
Das sind gegenwärtig zwischen 5 und 20 PCs (zumindest die mir gemeldet wurden). Ich kann es mal übers WE bei ein oder zwei durchlaufen lassen.

Hardware von den PC die betroffen sind
Und wie finde ich heraus, welcher Rechner betroffen ist?

Bei ein paar Anwendern habe ich den Rechner jetzt schon mehrfach getauscht. Bei anderen Anwendern läuft der "alte" Rechner ohne Probleme.
TrialAndError
TrialAndError 22.02.2017 um 15:40:35 Uhr
Goto Top
Status 2017.02.22

Heute war es wieder ein ganzer Haufen. Der im Sekretariat ganze 5x

Inzwischen scheinen alle soweit einzufrieren, dass sich auch die Maus nicht mehr bewegen lässt.

Bei einem Rechner ist mir aufgefallen, dass die LED an der Tastatur aus war. Muss mal testen ob die defekt sind oder ob da eventuell was mit dem USB Ports nicht stimmt.
Chonta
Chonta 22.02.2017 um 15:53:25 Uhr
Goto Top
Bei anderen Anwendern läuft der "alte" Rechner ohne Probleme.
Das macht stutzig.
Dann sind die Profile von den Problem Benutzern hinüber und oder die haben innerhalb des Profiles oder auf dem Rechner komische Anwendungen die die Probleme verursachen.

Wenn ein Rechner Probleme bei einem Benutzer macht und bei einem anderen nicht, dann beschwert sich der eine Benutzer entwede rnicht, oder der Benutzer mit Problemen macht was was der andere Benutze rnicht macht.
Wenn die Software auf allen Rechnern identisch ist, kann es ja nur noch am Benutzerprofil selbst liegen, ist zwar merkwürdig aber nicht unmöglich.
Kann ja ein Browserplugin oder sonstwas sein das Amok läuft.

Gruß

Chonta
Pjordorf
Pjordorf 22.02.2017 um 21:41:58 Uhr
Goto Top
Hallo,

Zitat von @TrialAndError:
Bei einem Rechner ist mir aufgefallen, dass die LED an der Tastatur aus war.
Bedenke das die LED vom OS an/aus geschaltet wird bzw. der TastaturChip bekommt so den Befehl dazu. Das wird nicht in der Tastatur selbst gemacht. Geht Num -Lock On/Off nicht mehr hat die CPU den Stillstand angetreten. Geht die LED noch, dann läuft zumindest noch die CPU und ein parr Grundlegende Funktion vom OS. Bei Kabellose Tastaturen geht diese Erkennung aber nicht, da dazu zusätzliche Funkkanäle und Stärkere Batterien notwendig wären was die Hersteller aber einsparen.

Gruß,
Peter
TrialAndError
TrialAndError 24.02.2017 um 11:47:22 Uhr
Goto Top
@Chonta

Wenn ein Rechner Probleme bei einem Benutzer macht und bei einem anderen nicht, dann beschwert sich der eine Benutzer entwede rnicht, oder der Benutzer mit Problemen macht was was der andere Benutze rnicht macht.
Das kann ich leider nicht ausschließen. Nach dem dritten Notebook Tausch hatte ich dann eines von den vermeintlich defekten Notebooks genommen und drei Tage nen Leistungstest durchlaufen lassen. Lief problemlos. Danach habe ich mit dem Ding gearbeitet. Auch das lief für ne Woche problemlos. Dann habe ich das Notebook wieder an nen neuen Mitarbeiter raus gegeben. Von dem kam bisher keine Beschwerde.

Wenn die Software auf allen Rechnern identisch ist
Wir verteilen die Software über OPSI. Sollte somit auf allen Rechnern identisch sein. (Habe das mal überprüft. Es sind sowohl Standard Office Installationen als auch vereinzelt erweiterte Installationen mit Adobe betroffen.)

kann es ja nur noch am Benutzerprofil selbst liegen, ist zwar merkwürdig aber nicht unmöglich.
Kann ja ein Browserplugin oder sonstwas sein das Amok läuft.
Gibt es eine praktikabele Lösung das zu testen?
Hatte auch schon den verdacht. Habe die Benutzerdaten auf dem Server gesichert, die lokalen Profile gelöscht (und auch schon mal den Rechner neu aufgesetzt), so dass sie beim Login ein neues Profil bekommen haben. Dann habe ich Thunderbird und Firefox (Lesezeichen importiert aber keine Plugins) manuell eingerichtet und die Daten einzeln zurück in das Profil kopiert. Dabei aber auch nur Nutzdaten kopiert.
Nach spätestens einer Woche hatte ich wieder den selben Fehler.
TrialAndError
TrialAndError 08.03.2017 um 09:42:48 Uhr
Goto Top
Status 08.03.2017

Ok, es scheint tatsächlich ESET zu sein. Habe das jetzt von einigen Clients runter gekantet und die laufen jetzt Fehlerfrei.

Stellt sich mir jetzt nur die Frage, wie ich ESET nachweise, dass Ihre Software für das Einfrieren verantwortlich ist, damit die mir einen Bugfix liefern.
Bzw. wie finde ich heraus ob nich eine Andere Anwendung in Kombination mit ESET für das Einfrieren verantwortlich ist?
DankeFuerNichts
DankeFuerNichts 08.03.2017 um 10:00:48 Uhr
Goto Top
Eset hat einen super Support. Du bist Kunde da. Ruf dort an und erkläre dein vorgehen. Die werden wissen was zu tun ist. Fakt ist: Kein ESET, kein Absturz.
TrialAndError
TrialAndError 24.08.2017 um 11:13:13 Uhr
Goto Top
  1. 2017.08.24

Um das Thema mal abzuschließen.

Der ESET Support hat mit tausenden Rückfragen und "probieren Sie mal xxx" reagiert. Am Ende hieß es dann, dass der Netzwerktreiber veraltet ist und an den Abstürzen Schuld ist. Das es sich bei dem Treiber um die offiziellen SCCM Treiber für die Intel NUCs und die Lenovo Notebooks handelte, war denen volkommen egal.

Ich habe unsere Clients dann auf den Windows Defender migriert. War mir zumindest lieber als komplett ohne Virenscanner oder mit ständig einfrierenden Rechnern.

Diesen Monat habe ich dann mal wieder einen Rechner mit Eset installiert. Kann Glück gewesen sein aber der ist den ganzen Monat nicht eingefrohren. Eventuell haben Sie den Fehler ja gefunden.

Bei meinen bisherigen Tests bin ich mit dem Windows Defender allerdings so zufrieden, dass ich Eset wohr nur noch für unsere Server und Linux Kisten verlängern werde. In meinem Fall hat sich ESET um 200 Lizensierte Clients gebracht.