the-buccaneer
Goto Top

Die WD Festplatte mit 3072 Byte phys. Sektorgrösse

Eine Ergänzung zu: Sachen gibts... die gibts nur in der IT. face-wink

In einem älteren Intel-Matrix-Raid-1 ist eine Festplatte abgeraucht. Leider kein Spare-Drive. Also schnell ersetzen. Original WD 500 GB natürlich nicht mehr erhältlich nach all der Zeit. Macht ja nix.
"On-Premise-Händler" hat als 1 TB 24/7 Platte nur eine WD Purple 1 TB vorrätig. Sicher nicht die schnellste aber hier kommt es auf Zuverlässigkeit an. Die Last ist minimal. Gleich 2 Stück erstanden.

Platte ersetzt. Zusätzlich Spare eingebaut. Server startet. RAID wird wieder aufgebaut. Keine Fehler. Also alles gut? Mitnichten. Nach dem Wochenende meldet sich die Kundin, dass der Zugriff auf ihre Branchensoftware nicht geht. Auch andere Dienste zicken.

Ereignisprotokoll sagt z.B. bei den MSSQL Instanzen:

Ereignis 5178 Die Datei 'd:\xxx\MSSQL10_50.xxx\MSSQL\DATA\mastlog.ldf' wurde ursprünglich mit der Sektorgröße 4096 formatiert. Sie befindet sich jetzt auf einem Volume mit der Sektorgröße 3072 und kann nicht verwendet werden. Verschieben Sie die Datei auf ein Volume mit einer Sektorgröße, die maximal so groß wie die ursprüngliche Sektorgröße ist.  
Auch die Jet-Datenbank ist sehr unzufrieden mit der Lage. face-wink

Was ist das denn? Physikalische Sektorgrösse 3072 Byte? Nie gehört. Das denken sich die Anwendungen offenbar auch.

Überprüfug ergibt: Festplatte meldet wirklich 3072 Byte physikalische Sektorgröße. Emuliert 512. Aber die virtuellen 512 Byte interessieren halt manche Anwendungen nicht die Bohne. DANKE an die Hersteller für diese tolle Kompatibilitätsimplementierung. Gibt ja auch woanders Probleme... face-wink Aber da sinds dann immerhin die standardgemäßen 4096 Byte.

3072 Byte Sektorgrösse sind jedenfalls kein Standard und nirgendwo dokumentiert. Fehlerhafte Serie? Supportmail an WD geschickt aber das dauert natürlich.

Könnte ja auch ein Treiberproblem sein und das war es dann auch. Neueren Intel RST Treiber gesucht. (DANKE an Intel für das nicht funktionierende webbasierte Updatetool)
Installiert. Luft angehalten und siehe da: Der Server startet und alle Datenbanken spielen ihre Logfiles ab. Ohne Fehler. Festplatte zeigt 4096 Byte. Puh.

"Never change a running System" Jaja. Aber wenn man bei der Hardware "on the fly" einen Generationenwechsel verursacht sollte man evtl. auch daran denken die Software austauschen. face-wink

Fehlerursache:
Fehlerhafter Matrix-RAID Treiber von Intel. Statt zu meckern, dass er mit der Platte nix anfangen kann (da käme man ja auf die Ursache) zählt er einfach mal soweit er kann und das ist aufgrund irgendwelcher Beschränkungen halt 3072, was er dann auch noch akzeptiert und dem OS meldet. Windows sagt offenbar: "O.k. warum nicht. Scheiss drauf" und akzeptiert diese absurde Sektorgröße ebenfalls. (Immerhin läuft es rudimentär. Dafür liebe ich Redmond!) Ich gehe davon aus, dass bei der nächsten Standardanpassung dieselben Probleme wieder auftauchen werden, da man ja immer nur nach vorne schaut und den Blick in den Rückspiegel bei 400PS gerne mal vergisst. face-wink

Aber auch der doofe Admin gehört dazu, der erstmal glaubt, dass "gemeldete" Sektorgösse gleich "wirklicher" Sektorgösse ist. face-wink

Die im Eventlog gemeldete "ursprügliche" Sektorgrösse von 4096 Byte gab es interessanterweise nie. Die alte intakte Platte im RAID-1 hat nach wie vor 512. Und die ausgebaute auch. Warum der Treiber nicht einfach zu 512 gesagt hat: "Kenn ich, nehm ich, passt schon." wissen die Intel-Jungs. Passt wohl die Speichergröße dann nicht.

Immerhin gelernt: Ein Intel Software-RAID kommt mit 2 Platten unterschiedlicher Sektorgröße klar und meldet den größeren Wert an das OS:

CU
Buc

Content-ID: 627111

Url: https://administrator.de/contentid/627111

Ausgedruckt am: 21.11.2024 um 13:11 Uhr

StefanKittel
StefanKittel 01.12.2020 um 01:12:03 Uhr
Goto Top
Hallo,

gelernt: Software-RAID hat ganz lustige Eigeneheiten und Verhaltensweisen.

Z.B. haben früher die Fastrak 100 (noch IDE) im RAID 1 noch während des Rebuilds von beiden Platten abwechselnd gelesen.
Weil die 2. noch leer war funktionierte das nicht besonders gut.

Stefan
NordicMike
NordicMike 01.12.2020 um 08:41:12 Uhr
Goto Top
Danke für diesen schönen Bericht. Auf was für niemals hervorsehbare Hürden man ständig treffen kann...
Lochkartenstanzer
Lochkartenstanzer 01.12.2020 um 10:05:31 Uhr
Goto Top
Moin,

Deswegen benutzt man "ordentliche" Betriebssysteme. face-smile

lks
NordicMike
NordicMike 01.12.2020 um 10:13:25 Uhr
Goto Top
Ich befürchte, das kann mit "jedem" Betriebssystem passieren. Ich erinnere mich, als Linux mit LSI Controllern Probleme bekommen hat, aber nur in einer bestimmten Kernel Version.
ArnoNymous
ArnoNymous 01.12.2020 um 14:51:07 Uhr
Goto Top
Moin,

na das weckt doch wieder die Freude am Beruf. Endlich mal ein bisschen Action im drögen Alltag face-smile

Gruß
the-buccaneer
the-buccaneer 03.12.2020 um 00:22:20 Uhr
Goto Top
@Anonymous: Jo. Spannend war das jedenfalls. Aber so dröge ist mein Alltag nicht. face-wink
Bist du evtl. in einem festen Anstellungsverhältnis? face-wink

Von WD bisher keine Antwort. Wahrscheinlich denken die: "Der spinnt".

Hatte halt gleichzeitig noch den Spass nen HP Gen7 Server mit ESXi 6.5 auszustatten. Aber das ist eine andere Geschichte die auch einen Beitrag wert wäre... Geht jedenfalls wirkt bisher vertrauenerweckend.

Mit nem Windows RAID wäre das wohl nicht passiert, aber wer weiss... Denke halt immer, dass diese Hardwarehersteller Fake-RAID's evtl. etwas performanter sind weil sie vielleicht direkter zugreifen aber das kann auch ein Trugschluss sein. Frage wäre halt: Welchen Treiber hätte Windows verwendet, wenn das Raid im BIOS nicht eingestellt gewesen wäre?

CU
Buc
the-buccaneer
the-buccaneer 10.12.2020 aktualisiert um 01:15:28 Uhr
Goto Top
Zur allgemeinen Erheiterung: Antwort vom WD Support:


Vielen Dank, dass Sie sich an den Kundendienst und Support von Western Digital gewandt haben. Ich heiße George K.
Ich verstehe, dass Ihr Laufwerk WD Purple einige fehlerhafte Sektoren hat.


Schon im ersten Satz nichts verstanden.

Ich entschuldige mich für die Unannehmlichkeiten und versichere Ihnen, dass ich mein Bestes tun werde, um Sie bei Ihrem Anliegen zu unterstützen.
Das ist so dreist gelogen, denn wenn er schon meine Mail nicht liest... was ist dann sein bestes? Copy-Paste?

In einigen Situationen können fehlerhafte Sektoren auftreten. Wenn sich Ihr Computer plötzlich aufgrund eines Stromausfalls oder eines gezogenen Netzkabels abschaltet, es ist möglich, dass sich die Festplatte während des Schreibvorgangs an einen Sektor abgeschaltet hat. In einigen Fällen können Sektoren auf der Festplatte Daten enthalten, die nicht mit dem Fehlerkorrekturcode übereinstimmen. Dies würde als fehlerhafter Sektor bezeichnet. Viren und andere Malware, die Ihren Computer beschädigen, können ebenfalls zu Systemproblemen und zur Entwicklung von fehlerhaften Sektoren führen.

Und wenn ich über die Strasse gehe kann ein Auto kommen. Das beantwortet aber nicht, warum die Fussgängerampel nicht funktioniert.

Bitte beachten Sie, dass in einigen Fällen fehlerhafte Sektoren möglicherweise wiederhergestellt werden können. Um diese Wiederherstellung zu versuchen, empfehlen wir Ihnen, falls Sie es noch nicht versucht haben, Ihre Festplatte mit unserer Software für Windows, der Data Lifeguard Diagnose Software zu testen und eine Low-Level-Formatierung auszuprobieren. Beachten Sie, dass durch das Formatieren alle Daten auf Ihrem Laufwerk gelöscht werden. Wenn möglich, sichern Sie Ihre Daten, bevor Sie mit diesem Formatierungsvorgang fortfahren.

Setzen. Sechs.

Nicht mal meine Fehlerbeschreibung gelesen. Ich hege den ernsten Verdacht, dass George K. ein Bot ist.
Das ist nicht 1st-Level-Support sondern 1/8-Level-Support.

Leute kauft Aktien! Dann profitieren wir von diesem Gebaren zumindest monetär.

Mit Hals von hier bis Sumatra...
Buc