adrnex
Goto Top

Esxi 5.5 findet LUNs vom SAN nach Neuinstallation nicht

Moin!

Ich habe mal wieder ein Problem mit meinem IBM Uralt Server... Und zwar ist das ein esxi cluster aus 3 IBM x3650 M2. Daran angeschlossen ist ein SAN: IBM Storwize V3700, per FC verbunden.

Nun habe ich den einen Esxi 5.5 neu aufgesetzt und wollte den Speicher wieder einrichten. Das SAN meldet aber dass der FC Link Offline ist und im Esxi finde ich die LUNs nicht.

Wenn der Server bootet und gerade Esxi lädt, zeigt das SAN an dass die FC Verbindungen Online sind. Sobald esxi fertig gebootet ist, ist es wieder offline.

Bei den anderen beiden esxis funktioniert das SAN. Die Server sind nicht über einen switch mit dem San verbunden. Also gehen zwei Kabel an das SAN von jedem Server.

Server 1x FC -> SAN Node 1
Server 1x FC -> SAN Node 2

Hat jemand eine Idee? Muss ich noch irgendwas anderes einrichten?

Bin was das angeht eine absolute 0.

Habe die Kabel auch schon neu gesteckt, hat aber nichts gebracht. Im Esxi wird die Pcie 8gbs Karte als speichercontroller angezeigt.

Danke im Voraus.

Viele Grüße
Adrian

Content-ID: 665821

Url: https://administrator.de/contentid/665821

Ausgedruckt am: 20.11.2024 um 15:11 Uhr

em-pie
em-pie 17.04.2021 um 23:21:20 Uhr
Goto Top
Moin,

Also die M2-Generation... die ist doch in etwa 12 Jahre alt!?

Zu deinem Problem:
Ich gehe davon aus, dass dir die Treiber des FC HBAs im ESXi fehlen.
Siehst du die HBAs im ESXi?

Gruß
em-pie
ADRNEX
ADRNEX 18.04.2021 um 00:55:33 Uhr
Goto Top
Ja ich sehe sie. Die Treiber sind identisch mit den zwei funktionierenden Servern..

Ja die m2 sind zwar über 10 Jahre alt, haben aber immerhin noch 128gb RAM und jeweils 2x 8 Kern prozessoren 😇

Für nen Homelab reicht es und ich habe die mit esxi 5.5 und vcenter 5.5 Lizenzen gekauft, nur war die eine Installation kaputt und ist nicht mehr hoch gefahren...

Ich habe schon alles mögliche geprüft.. Ich sende morgen mal die vmkernel und hosts logs rein, denn in der Verwaltung bekomme ich einen unbekannten Fehler wenn ich versuche das hba für neue LUNs zu scannen.
tech-flare
tech-flare 18.04.2021 um 02:19:37 Uhr
Goto Top
Ich habe schon alles mögliche geprüft.. Ich sende morgen mal die vmkernel und hosts logs rein, denn in der Verwaltung bekomme ich einen unbekannten Fehler wenn ich versuche das hba für neue LUNs zu scannen

Worüber scannst du es? Über den Esxi Host oder über das vCenter?.
ADRNEX
ADRNEX 18.04.2021 um 02:42:29 Uhr
Goto Top
Beides probiert, bei beiden bekomme ich einen Fehler..
em-pie
em-pie 18.04.2021 aktualisiert um 14:26:58 Uhr
Goto Top
Hmm...

Wie viele FC-Ports haben die 3650 für die SAN-Anbindung verfügbar?

Es sollten mindestens zwei sein, da jeder Host mit dem Node 1 UND dem Node 2 der V3700 verbunden sein sollte.
Edit: OK. Im Ausgangspost hast du ja beschrieben, dass es so verkabelt ist:
Server 1x FC -> SAN Node 1
Server 1x FC -> SAN Node 2

Erstelle mal 'nen Screenshot von den Speicheradaptern im vCenter.
Edit: und auch von der Fehlermeldung:
[..] in der Verwaltung bekomme ich einen unbekannten Fehler wenn ich versuche das hba für neue LUNs zu scannen

Und gleiche mal alle WWNs zwischen V3700 und x3650 ab.
Es könnte auch sein, dass du alles „falsch“ verkabelt hast und dieV3700 nun nicht mehr die richtigen WWNs sieht...
Daher auch mal prüfen, ob in der V3700 die Hostzuordnung noch stimmt.

Edit:
Zeigt die V3700 irgendwelche Fehler an?
ADRNEX
ADRNEX 19.04.2021, aktualisiert am 21.04.2022 um 16:30:02 Uhr
Goto Top
So, ich habe es geschafft Screenshots zu machen. Eines der Bilder zeigt die Geräte bei einem funktionierendem ESXi Host.
Der unbekannte Fehler tritt heute nicht mehr auf... Ich schicke gleich aber noch die Logs rein.

WWNs habe ich abgeglichen, das stimmt alles soweit.

Die V3700 zeigt keine Fehler an

screenshot 2021-04-19 115538

Funktionierender Host:

screenshot 2021-04-19 115602

V3700 Interface:

screenshot 2021-04-19 115629

screenshot 2021-04-19 115729

Vielen Dank für die Hilfe!
ADRNEX
ADRNEX 19.04.2021 um 18:25:28 Uhr
Goto Top
@em-pie

Hier nochmal die Fehlermeldung im vSphere Client:
Aufruf von "HostStorageSystem.RescanHba" für Objekt "storageSystem" auf ESXi "192.168.170.13" ist fehlgeschlagen.
Ein unbekannter Fehler ist aufgetreten.

vmkernel.log:
2021-04-19T16:36:14.652Z cpu6:32883)lpfc0 log compression on target 0 ending, messages have quiesced with 1693 compressed.
2021-04-19T16:36:14.652Z cpu6:32883)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fb Time Out Returning Host Busy
2021-04-19T16:36:14.703Z cpu6:32883)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fc No Resources Host Retry
2021-04-19T16:36:14.703Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fd No Resources Host Retry
2021-04-19T16:36:14.703Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fe No Resources Host Retry
2021-04-19T16:36:14.704Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8ff No Resources Host Retry
2021-04-19T16:36:14.704Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x900 No Resources Host Retry
2021-04-19T16:36:14.704Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x901 No Resources Host Retry
2021-04-19T16:36:14.704Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x902 No Resources Host Retry
2021-04-19T16:36:14.704Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x903 No Resources Host Retry
2021-04-19T16:36:14.704Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x904 No Resources Host Retry
2021-04-19T16:36:14.704Z cpu6:33588)lpfc: lpfc_handle_status:4024: 0:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x905 No Resources Host Retry
2021-04-19T16:36:14.704Z cpu6:33588)lpfc0:(0) log compression on target 0 starting.
2021-04-19T16:36:14.774Z cpu4:34339)lpfc1 log compression on target 0 ending, messages have quiesced with 1117 compressed.
2021-04-19T16:36:14.774Z cpu4:34339)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8f5 Time Out Returning Host Busy
2021-04-19T16:36:14.826Z cpu4:33033)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8f6 No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8f7 No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8f8 No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8f9 No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd xa0 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fa No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fb No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fc No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fd No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8fe No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc: lpfc_handle_status:4024: 1:(0):3271: FCP cmd x12 failed <0/0> sid xab0200, did xab0100, oxid xffff iotag x8ff No Resources Host Retry
2021-04-19T16:36:14.826Z cpu4:33589)lpfc1:(0) log compression on target 0 starting.