ben-witt
Goto Top

IBM Server x3500 (Typ 7977) startet nur kurz

Bei einem IBM Server x3500 / 7977 habe ich folgendes Hardware Problem:

Während des Betriebs mit W2K16-E ging er plötzlich aus.
Beim Neustart verhält der Server sich jetzt so, dass er zwar startet, aber wenn der Taster losgelassen wird, sofort ausgeht.
Dann leuchten beide LEDs auf, System-Info & System-Error.

In gleichmäßigen Abständen hört man, wie die Lüfter kurz anlaufen, was aber nur eine geschätzte 1/10 Sekunde dauert.
Drücke ich dabei sofort den Taster, dann passiert nichts.
Laufen die Lüfter kurz an und der Einschalt-Taster wird dabei gedrückt und fixiert, dann startet der Server komplett durch, ohne jegliche Fehlermeldung.
Allerdings laufen dann alle Lüfter auf Volllast, sodass sie einen Höllenlärm machen.

Wird der fixierte Taster losgelassen, dann ist die Kiste natürlich sofort aus.

Auf dem seitlichen Diagnostic-Panel leuchten für eventuelle Systemfehler keine LEDs auf.
Alle Controller & sonstige Karten wurden entfernt, aber das Startverhalten ist das Gleiche.
Auch gibt es keinen defekten Lüfter im System.
Das BIOS wurde überprüft und alle Einstellungen sind noch so, wie gewünscht.

Kennt jemand von euch diesen Fehler, sodass er sein Wissen mit mir teilt, wie ich diese Kiste wieder ans Laufen bekommen kann?

LG Ben

Content-ID: 385504

Url: https://administrator.de/contentid/385504

Ausgedruckt am: 22.11.2024 um 18:11 Uhr

Penny.Cilin
Penny.Cilin 05.09.2018 um 13:37:01 Uhr
Goto Top
Hallo,

lade Dir mal bei IBM / Lenovo die aktuellen BIOS / UEFI Updates herunter und installiere diese.
Ist der Server noch in Wartung? Ich bin mir nicht sicher, aber die Hardware ist etwas älter, korrekt?

Was ist mit der CMOS-Batterie?

Gruss Penny
Pjordorf
Pjordorf 05.09.2018 um 13:49:00 Uhr
Goto Top
Hallo,

Zitat von @Ben-Witt:
Allerdings laufen dann alle Lüfter auf Volllast, sodass sie einen Höllenlärm machen.
Weil eben Fehler erkannt wurden. Deine LEDs sagten dir ja schon Fehler, und nein. einen Schalter aus deinen Taster zu machen ist keine gute Idee. Da ist irgendetwas Putt gangen.

Alle Controller & sonstige Karten wurden entfernt, aber das Startverhalten ist das Gleiche.
Bedenke, es kann auch der Fehler auf dein Mainboard oder deine RAM Riegel oder sonstwo sein. Das die zusätzliche Hardware es nicht ist wie Kontrollerkarte usw. hast du ja schon gesagt bzw. getestet.

Kennt jemand von euch diesen Fehler, sodass er sein Wissen mit mir teilt, wie ich diese Kiste wieder ans Laufen bekommen kann?
Dein Server ist Putt. Mach hile dann läuft der wieder. Was jetzt Putt ist - ka.

Gruß,
Peter
Ben-Witt
Ben-Witt 05.09.2018 aktualisiert um 13:59:44 Uhr
Goto Top
Hallo Penny,
ja, dieser Server gehört schon zu einer älteren Generation und er fungiert bei mir nur als reiner Backup-Server und dafür ist er völlig ausreichend.
Die CMOS Batterie habe ich nach dem Check des BIOS vorsichtshalber gewechselt.
Der Fehler ist letzten Sonntag eingetreten und soweit ich mich erinnere, gab es an diesem Tag ein MS-Update mit einem Neustart verbunden. Als er dann neu gestartet ist, habe ich auch mittels Fernwartung auf diesen zugreifen können und in der Nacht hat er sich dann wohl verabschiedet.
Ich habe gelesen, das MS eventuell mit einem Update auch auf UEFI des BIOS Einfluss genommen hat.
Könnte das zutreffend sein und ist das richtig?

Dein Tipp mit dem BIOS Update werde ich anwenden, aber dafür muss ich mich noch durch diese Chaotenseiten von IBM/LENOVO durchkämpfen, um mir das richtige Update runterzuladen.

Gruß Ben
Ben-Witt
Ben-Witt 05.09.2018 aktualisiert um 13:57:26 Uhr
Goto Top
Zitat von @Pjordorf:
Dein Server ist Putt. Mach hile dann läuft der wieder. Was jetzt Putt ist - ka.

Das was putt ist, ist mir selbst klar!
Aber es könnte ja sein, das jemand diesen gleichen Fehler bereits an seinem Server hatte und darin liegt auch meine Hoffnung.
137084
137084 05.09.2018 aktualisiert um 14:11:53 Uhr
Goto Top
Aber es könnte ja sein, das jemand diesen gleichen Fehler bereits an seinem Server hatte und darin liegt auch meine Hoffnung.
Gibt es :
https://serverfault.com/questions/469064/ibm-xseries-3400-only-working-w ...
Ben-Witt
Ben-Witt 05.09.2018 um 14:25:22 Uhr
Goto Top
Zitat von @137084:

Aber es könnte ja sein, das jemand diesen gleichen Fehler bereits an seinem Server hatte und darin liegt auch meine Hoffnung.
Gibt es :
https://serverfault.com/questions/469064/ibm-xseries-3400-only-working-w ...


Danke für diesen Link von dir.
Aber dieser DIP-2 ist bei mir, seitdem der Server hier steht, bereits gleich zu Anfang gesetzt worden.
Was ich jedoch versuchen könnte, diesen zurückzusetzen, kurz booten, um ihn dann wieder in seine richtige Stellung zu schalten.
Ein Versuch wäre es ja wert.
137084
137084 05.09.2018 aktualisiert um 14:41:35 Uhr
Goto Top
Weiterlesen ...
According to IBM, the board must be replaced. I had 2 servers of the same type with the same problem after only 2 years. IBM stated it was not a known issue, which I find hard to believe and seeing many instances of the same issue I doubt. I opted to simply replace the server.
Pjordorf
Pjordorf 05.09.2018 aktualisiert um 14:48:48 Uhr
Goto Top
Hallo,

Zitat von @Ben-Witt:
Aber dieser DIP-2 ist bei mir, seitdem der Server hier steht, bereits gleich zu Anfang gesetzt worden.
Also steht der schon auf Position 2. Dann lass es so. In deinem Handbuch steht aber auch drin wofür dieser DIP-Switch 2 ist und welche Funktion damit geschaltet wird. Schon mal nachgelesen?

Ein Versuch wäre es ja wert.
Nicht wirklich.
Ich würde eher mal mir das Mainboard anschauen (Ausbauen ist dann Pflicht) und mir die Elekos als erstes anschauen ob da welche ausgelaufen, gebläht sind. Danach würde ich schauen ob erkennbare Leiterbahnunterbrechungen vorliegen (zuminst auf den beide sichtbaren Seiten (meist hat das Mainboard 4 bis 8 schichten mit Leiterbahnen. Danach schauen ob es einen/mehrere Spannungsregle gebruzelt hat oder sonstwelche Komponenten. SMD Bauteile können auch mal kaputt gehen. ES kann aber auch das Netzteil sein welches nicht mehr mag. Aber auch der RAM kann betroffen sein einzeln prüfen wenn im Board möglich und auch die verschiedenen RAM Slots. Mem86+ leistet da gute dienste. Ansonsten ein neues Board bei Ebay geschossen oder einen neuen Server mit mehr Leistung und weniger Stromverbrauch.

Was sagen die Diagnose LEDs auf dein Mainboard und schon mal geschaut (aufm innendeckel) was dort evtl. angezeigt wird?
http://public.dhe.ibm.com/systems/support/system_x_pdf/49y0197_20thed.p ...

Gruß,
Peter
Ben-Witt
Ben-Witt 06.09.2018 um 14:09:30 Uhr
Goto Top
Vorerst ganz lieben Dank für eure Infos und der momentane Stand sieht so aus:

Board ausgebaut.
5 Elkos sind betroffen und einer davon in der Spannungsregelung, bei dem seine Scherschlitze leicht geknackt sind.
Die Leiterbahnen sind soweit alle OK, auch ist auf der Platine nirgendwo, durch Hitzeeinwirkung, eine braune Stelle erkennbar.

Also werden heute noch diese Elkos mit der Heißluftstation gewechselt.

Morgen gibt es dann von mir die Info, ob es erfolgreich ausgegangen ist, oder halt nicht.

LG Ben
Penny.Cilin
Penny.Cilin 06.09.2018 um 14:18:03 Uhr
Goto Top
Schön, daß Du festgestellt hast, was die Ursache ist.

Hm, lohnt sich das noch?
Wie alt ist die Hardware?

Gruss Penny
Pjordorf
Pjordorf 06.09.2018 um 14:23:22 Uhr
Goto Top
Hallo,

Zitat von @Ben-Witt:
bei dem seine Scherschlitze leicht geknackt sind.
Das sind sollbruchstellen damit die wenn die sich aufblähen druck ablassen können. Sonst platzen die recht ungestüm.

Also werden heute noch diese Elkos mit der Heißluftstation gewechselt.
Ich hab noch gelernt eine Lötkolben dafür zu nehmen z.b. einen ERSA 16 - 25 Watt und darauf zu achten das die Hitze nur kurzzeitig anliegt weil sonst die inneren Leiterbahnen bei merschicht Platinen gegrillt äh. getötet werden können. Aber heiße Luft tuts auch.

Morgen gibt es dann von mir die Info, ob es erfolgreich ausgegangen ist, oder halt nicht.
Wir warten drauf face-smile

Gruß,
Peter
Ben-Witt
Ben-Witt 06.09.2018, aktualisiert am 07.09.2018 um 13:59:45 Uhr
Goto Top
Zitat von @Pjordorf:

Hallo,

Zitat von @Ben-Witt:
bei dem seine Scherschlitze leicht geknackt sind.
Das sind sollbruchstellen damit die wenn die sich aufblähen druck ablassen können. Sonst platzen die recht ungestüm.

Scherprägung = Sollbruchstelle

Also werden heute noch diese Elkos mit der Heißluftstation gewechselt.
Ich hab noch gelernt eine Lötkolben dafür zu nehmen z.b. einen ERSA 16 - 25 Watt und darauf zu achten das die Hitze nur kurzzeitig anliegt weil sonst die inneren Leiterbahnen bei merschicht Platinen gegrillt äh. getötet werden können. Aber heiße Luft tuts auch.

Gelernt habe ich das in den 60zigern auch und man könnte einen ERSA zur Not auch nehmen, nur liegt beim Entlöten der Kolben viel zu lange am Lötpunkt an und dann passiert genau das mit der Hitze.
Um das zu testen, sollte man mal ein mirco-SMB "Studentenfutter" verlöten, dann sieht man auch was ich meine. face-smile
Mal davon abgesehen, dass so ein Lötkolben beim Anlegen an den Lötpunkt nicht konstant seine Hitze hält, da dieser Lötpunkt ihm diese Hitze sofort entzieht, wobei der Zinn nicht mehr läuft.
Das wäre dann nur eine sinnlose Papperei mit viel Frust im Bauch.

Mit Heißluft, die man dazu noch stufenlos regeln kann, werden direkt beide Pins erwärmt, wie auch direkt unter dem Elko- falls dieser dort ebenfalls auf der oberen Leiterbahn noch verlötet ist.
Somit kann man den Elko dann einfach nur noch rausziehen.
Also kein Aushebeln, oder vorheriges und mühseliges Abschneiden des Elkos.
Pro Elko ist das eine Sache von einer Minute, plus eine fürs einlöten.

Morgen gibt es dann von mir die Info, ob es erfolgreich ausgegangen ist, oder halt nicht.
Wir warten drauf face-smile

Auf jeden Fall! face-wink

LG Ben

Gruß,
Peter
Ben-Witt
Ben-Witt 06.09.2018 aktualisiert um 19:43:32 Uhr
Goto Top
Zitat von @Penny.Cilin:

Schön, daß Du festgestellt hast, was die Ursache ist.

Hm, lohnt sich das noch?
Wie alt ist die Hardware?

Gruss Penny

JUST FOR FUN, wenn das Board danach wieder läuft, auf jeden Fall.
Die Arbeit das Board auszubauen, hat man ja auch bei einem Wechsel.

Server Baujahr = 2011 und ein neuer Server macht für mich keinen Sinn, da dieser für meine Zwecke (s.o) vollkommen ausreicht, denn er hat nichts anderes zu tun.
Der Einwand der hier zur Sprache kam, der Neue wäre dann stromsparender, wird wohl stimmen, aber bis ich diese Stromeinsparung bei den Kosten eines neuen Server wieder raus habe, liege ich schon längst in der Kiste und dann ist auch der Neue bereits ein Grufti. face-wink


19:00 Uhr; Elkos sind erneuert und morgen gibt es den Einbau.
Ben-Witt
Ben-Witt 07.09.2018 um 13:53:10 Uhr
Goto Top
Hier die News:

Da ich keine Elkos mehr von 820µF/6,3V hatte, habe ich als Alternative 1000µF/10V eingebaut, da man diese 180µF mehr, durchaus vernachlässigen kann.

Board eingebaut und der Server startete wie erwartet.
Einige Neustarts vorgenommen, wobei der Server vorher vom Stromnetz getrennt wurde, damit die Spannungsregelung nicht ins Leere verlaufen sollte.

Jetzt läuft er durchgehend seit 10 Uhr und somit hat sich diese Arbeit für mich durchaus gelohnt.

Nochmals meinen Dank an ALLE.

Gruß Ben