jrglndmnn
Goto Top

2 ungesyncte Mountpoints an einem Raid 1 ?!?

Hallo die Damen und Herren,
Liebe Menschen und Menschinnen!

Ich habe folgende Ausgangssituation und bitte, verzeiht mir die kleine nuance Wahnsinn in der folgenden Lektüre.
Ich habe eine kleine Spielwiese inform eines Testservers mit Debian 10 am laufen. Neben einem 2TB Datengrab existiert ein Software Raid 1 (über mdadm) mit 250GB (also 2x 250GB) und eine kleine SSD als Sysplatte (/ und Co) zwischen 25 und 256GB, k.a. - die lag hier rum und ich hab sie verwurstet. Die Platten sind alle mit ext4 formatiert, das raid 1 ist gesynct ... war es zumindest mal und ignoriert seine inkosistenz inwzischen .. oder ist doch konsistent - ach, darauf komm ich später weiter unten, wo ich dann das Problem schildere - Sagen wir einfach, es ist gesynct ;).
Als Grafische dient ein schmales Xfce4. Ich habe absichtlich Xfce4 gewählt .. aus rein praktischen Gründen, denn ich hatte eigentlich gehofft , hier würde die f+*#+q auto-mount funktion nicht greifen .. vielleicht tut sie das auch nicht .. oder doch .. sagen wir, sie greift .. wahscheinlich.

Nun zum Problem: Ich habe heute eine neue Platte ... geschenkt bekommen; Ich kanns nicht anders erklären, es bloppte einfach heute ein Icon auf dem Desktop auf mit der Bezeichnung "250GB Datenträger". Ich war etwas irritiert, dann ergründete ich den Dateipfad der ominösen neuen Datenhalde und erkannte als Namen etwas, dass an eine UUID erinnerte. Interessant war auch, dass die Platte unterhalb von /media/root eingehängt war (ich glaube hier realisierte ich, das dass mit dem automount auch unter Xfce4 noch da ist - hierbei danke an den Content Creator, der in irgend einem Blog mal das als gnometypisch hinstellte - egal). Das ist in sofern interessant, da ich das eigentlich immer in /mnt packe. Noch interessanter fand ich aber, dass es sich um keine leere Platte handelte. Die hatte nämlich die Daten, die eigentlich im Raid 1 hätten sein sollen bzw - so, jetzt wirds strange - Nach mount ist die neue Platte nicht gemountet - das Geilste aber, bei genauem Vergleich des Namens der Ominösen Platte (wir erinnern uns, ich schrieb es erinnert an eine UUID) merkte ich, dass zu der UUID von md127 noch 5 alphanumerische Zeichen angefügt worden sind. Nach mdadm -D /dev/md127 ist das Raid 1 intakt, sprich synced und active. Und es ist kein Link zum Raid - wenn ich die "neuen" Daten ändere, ändere ich nicht die Daten im Raid. Komischerweise hatte ich Sie gelöscht und nach einem Reboot und paar Minuten Leerlauf waren die Daten wieder da - allerdings in der Form, wie vorher, nicht die Orginal Raiddaten gespiegelt.

So ... was könnte das sein .... ausser einem Hacker, die sshd ist nämlich nicht aktiv. Schwarze Magie? Ein bekanntes Problem, was mir noch niemand erzählt hat? |-|eLfT MiR m/\L! Ich werd' noch (mehr) meshugge mit dem Problem!

Content-ID: 627429

Url: https://administrator.de/contentid/627429

Ausgedruckt am: 18.11.2024 um 05:11 Uhr

godlie
godlie 03.12.2020 um 02:49:54 Uhr
Goto Top
Hallo,

erste Empfehlung: füge deinem Thread mal ein paar Leerzeichen hinzu, damit diese Wurst an Text leesbar wird
zweite Empfehlung:: Kein Backup kein Mitleid
cykes
cykes 03.12.2020 um 06:37:25 Uhr
Goto Top
Moin,

ich würde erstmal die wichtigsten Daten des RAIDs sichern und ggf. die 2TB Platte abhängen und
1) die SSD mal durchchecken, da auch ein Teil der RAID-Konfiguration auf der Systemplatte liegt. Auch mal Smart-Werte prüfen.
2) Hört sich Deine Beschreibung (UUID usw.) so an, als würde LVM dazwischen funken, wird ggf. eine (unkonfigurierte) VG (Volume Group) angelegt?
3) ggf. nicht ganz so alte Platten mit unbekanntem Status einsetzen
4) Mal mit bspw. Knoppix versuchen, das RAID ordentlich zu mounten und zu überprüfen.

Gruß

cykes
Lochkartenstanzer
Lochkartenstanzer 03.12.2020 aktualisiert um 07:37:06 Uhr
Goto Top
Moin,

  • erstens sollest Du Dein Geschreibsel etwas mehr ordnen.


  • Schau mal mit blkid , /proc/mdstat und /etc/mtab (am besten Ausgabe posten) nach, welche "HDDs" Du im System hast.

lks
NordicMike
NordicMike 03.12.2020 um 09:32:32 Uhr
Goto Top
Du hast einen RAM Fehler. Anders kann man sich die Hieroglyphen im Beitrag nicht erklären. War die neue Platte ganz neu oder gebraucht? Ist sie zufällig 250GB groß?

Dann warten wir mal auf die mdstat Ausgabe.
jrglndmnn
jrglndmnn 03.12.2020 aktualisiert um 15:56:15 Uhr
Goto Top
Hallo, erstmal danke für die überwiegend netten Antworten!


@godlie: Danke für den Hinweis, ich denke du meinst eher die Entertaste, zumindest würde das mehr Sinn ergeben, sofern ich deine Kritik richtig verstehe. Aber kein Problem, ich helf' dir gerne und erkläre das Problem im Kernpunkt genauer! Mein Problem beschreibt keinesfalls Datenverlust, sondern eine Art von Inkonsistenz, wahrscheinlich auf Höhe des Verzeichnisbaumes (ganze Verzeichnisse, nicht einzelne Bits bzw Sektoren, also die nodes im tree), die Daten erzeugt und nicht vernichtet. Darüber hinaus schrieb ich, dass es sich um ein Testsystem handelt. Da befinden sich nur ersetzbare bzw. bereits gebackupte Daten.

__________

@cykes:
Die 2TB Platte (sdb/sdb1) werde ich nach den Screenshoots abhängen, wichtige Daten hat das System aber nicht drauf bzw. sind gebackupt.

zu 1.: Das klingt plausibel! Ich teste die Raid Platten mal mit smartctl und poste die Ergebnisse dann.

zu 2.: LVM besteht nicht. Der einzige Verbund des Systems ist das Raid 1, realisiert durch den Software Raid Controller mdadm.

zu 3.: Du hast schon recht aber wenns dir primär drauf ankommt, ein Raid mal mit Bordmitteln zu realisieren, dann investierst du nur das Nötigste. Als ich die Platten beim Aufbau reingehängt hatte, habe ich sie natürlich auch getestet. Keine Angst, ich bin mir schon bewusst, dass die Systemconfig die Frage nach dem Sinn aufkommen lässt und der besteht nicht primär im sicheren Speichern von Daten, das ist für mich eher ein Benefit. Ich bin mir auch bewusst, dass zwei neue USB Sticks mehr Sinn machen würden als zwei Platten von Anno Dazumal ;)

zu 4.: Schau dir mal die Screenshoots unten an - ich kann mich irren aber für mich sieht's ordentlich gemountet aus :/ Ich hätte dazu kurz deine Meinung gewusst, ob die Screenshots ausreichen oder ich trotzdem noch den Knoppix Test machen sollte.

__________

@Lochkartenstanzer
Ich weiß - das ist Verbesserungsfähig aber ich denke, es könnte doch ein latentes Schmunzeln erzeugt und damit den tertiären Sinn des Postes erfüllt haben. ;)

zu 2.: Ich werde das im Rahmen der Fehlersuche mit ausprobieren. Wenn's kein Plattendefekt ist, wäre ein randaliernde Dienst eine Erklärung.

zu 3.: Wird unten angehängt!

__________

@NordicMike
Ja Mike, das mit dem "Hauptspeicher" nehmen die meisten fälschlicherweise an, es ist aber nur die Tastatur. Übrigens, Hyroglyphen bzw. Artefakte, wie man sie richtig nennt, kommen auch beim Overclocking vor, laufen aber immer auf ein oder mehrere fehlerhaft arbeitende Logikgatter hinaus. Es kann aber auch an den Eingangswerten liegen, nicht zwingend an defekter Hardware. Nicht umsonst sagt ein kybernetischer Grundsatz sinngemäß aus, dass Kommunikation nur unter gleichen möglich ist (Vws auf Gerog Klaus - Kybernetik und Erkenntnistheorie). Darin begründet sich auch warum dein Rückschluss fehlerhaft ist: Du siehst die Thematik anscheinend ohne den Spaß an der Sache und begrenzt dich auf's Kommentieren. Ich bin gespannt, ob du dieses Kommentar konstruktiv aufnimmst und man sich doch noch am Ende versteht, oder das ganze im bashing endet.

Zur eigentlichen Frage: Ja, 250GB

_________

Die geforderten Fakten erstmal (danach noch was unterstützendes, die Ergebnisse die smartctl checks folgen)!


blkid

lsblk

mdadm

mdstat

mdadm_conf

smartctl_sda_show

smartctl_sdb_show

smartctl_sdc_show

smartctl_sdd_show
jrglndmnn
jrglndmnn 03.12.2020 aktualisiert um 16:29:50 Uhr
Goto Top
Und hier noch ein Screenshot vom Desktop (den AutoMount) und den zwei Ordner mit Pfad. Merkwürdig ist, dass es sich bei dem Verzeichnis in Root vermeintlich um die UUID von md127 handelt, welche als raid in /mnt eingehäng ist (zweites Fenster). Es ist der gesamte Inhalt angezeigt.

desktop_icons

desktop_explorer
jrglndmnn
jrglndmnn 03.12.2020 aktualisiert um 16:21:54 Uhr
Goto Top
Kleiner Nachtrag: Als ich die Kiste jetzt heruntergefahren habe, war die letzte Zeile im Log "monitoring of LVM2 Mirrors". Ungeachtet der Tatsache, dass ich kein LVM hier implementiert habe (zumindest wissentlich), kann es vielleicht daran liegen und was passiert da?

Ich will noch anmerken, ich hatte vor etwa einer Woche versucht habe, das Debian auf die aktuellste Kernel hochzustufen, da sich die Schreib/Lesegeschwindigkeit zwischen Raid und USB3 Platte irgendwo bei 40MB bewegt hatte, was mir als zu wenig erschien. Ich erhoffte mir eine bessere Treiberunterstützung und damit gesteigerte Schnelligkeit. Irgendwas beim Ausführen der fstab wärend des Bootens hat aber nicht geklappt und saiga sprang in den recovery mode. Nach Recherche im Netz wäre der Fehler Bsp.-weise durch ein "defektes Sata Kabel" ausgelöst, was ich nicht bestätigen kann. Nach Austausch des Kabels, bestand der Fehler weiterhin, ich kapitulierte for dem Problem erstmal und führte mit dpkg händisch einen downgrade der Kernel durch.

Kann das vielleicht etwas ausgelöst haben bzw ein Artefakt hinterlassen haben?
NordicMike
Lösung NordicMike 03.12.2020 um 17:21:23 Uhr
Goto Top
Ich bin gespannt, ob du dieses Kommentar konstruktiv aufnimmst
Schön geschrieben. Ich habe es verstanden. Da ist noch ein kleiner Haken dabei: Dito! Die Frage ist, ob "du" es ebenfalls konstruktiv aufgenommen hast, dass dich mehrere Leute darauf angesprochen haben. Irgendwie weiss ich die Antwort schon :c)
jrglndmnn
jrglndmnn 04.12.2020 um 09:53:54 Uhr
Goto Top
Eine etwas interpretierbare Aussage -


Das Problem ist, dass Sie mir in der Sache nicht weiter hilft. Irgendwie hab ich das Gefühl, dass es inzwischen usus ist das niemand mehr Spaß am bewältigen von Problemen bzw. dazu lernen hat und mehr Energie in das kreieren von versteckten Beleidigungen bzw. Social Engineering verwendet wird.

Da gibt es einen Spruch, der das Super umschreibt: Du hältst Sie arm, ich halt Sie dumm - oder ist es anders rum?
NordicMike
NordicMike 04.12.2020 um 10:08:50 Uhr
Goto Top
Diese Aussage wiederspricht sich aber mit dem, was oben zu lesen ist. Alle, die die Schreibweise kritisiert haben, haben auch nützliche Fragen und Antworten zum Thema gestellt.

Es ist nun mal so, dass in diesem Forum halt noch die alte Netiquette herrscht. Das ist bei den Sozialen Medien zwar mittlerweile komplett eingebrochen, aber hier ist es halt noch so. Deswegen kommen halt so viele Hinweise darauf.
jrglndmnn
jrglndmnn 04.12.2020 um 10:46:43 Uhr
Goto Top
da erlebte ich schon anderes: auch auf die gefahr hin, der acc wird gelöscht: jeder vergangene post in diesem forum - unabhängig von benutzer oder thema - wurde in einem ton verfasst, den man keinesfalls mangelnen respekt vorwerfen kann. ich bin mir schon im klaren, dass ich bittsteller mit einem post bin, es sei denn, es handelt sich um ein howto bzw tutorial.
das resultat war jedesmal das gleiche: der sachverhalt wurde absichtlich falsch verstanden oder auf die plumpeste art und weise verkommentiert und durch den kakao gezogen. wenn du mit deiner ansicht recht haben würdest, würde man aqui aus dem forum löschen bzw. wegignorieren - und das bestimmt nicht wegen der fachlichen kompetenz
jrglndmnn
jrglndmnn 04.12.2020 aktualisiert um 10:53:21 Uhr
Goto Top
Zum eigentlichen Sachverhalt: Es war das LVM2 was eine vg erstellte, die ich nie manuell angelegt hatte. Ich hatte auch nie LVM2 installiert.

Jemand eine Idee, wie es dazu hätte kommen können?

edit: ich nehms zurück, die öminöse partition existiert wieder
cykes
Lösung cykes 04.12.2020 um 17:51:21 Uhr
Goto Top
Zitat von @jrglndmnn:
Zum eigentlichen Sachverhalt: Es war das LVM2 was eine vg erstellte, die ich nie manuell angelegt hatte. Ich hatte auch nie LVM2 installiert.
Hatte ich ja schon ganz weit oben vorgeschlagen.
Jemand eine Idee, wie es dazu hätte kommen können?
LVM wird bei einer Standardinstallation von Debian mit installiert, muss man mehrfach explizit abwählen, wenn man das nicht haben will.
edit: ich nehms zurück, die öminöse partition existiert wieder
Solange LVM mitläuft wird das immer wieder passieren.
Vielleicht wurde es auch durch ein Update ausgelöst.
jrglndmnn
jrglndmnn 13.01.2021 um 11:19:00 Uhr
Goto Top
Der Rückschluss ist richtig aber der Ordnung halber möchte ich dazu der Vollständigkeit halber noch was ergänzen:

ich hatte zwischenzeitlich das System neu aufgesetzt und der Fehler reproduzierte sich und blieb nach dem löschen des lvm Paketes weiter bestehen. Danach benannte ich das Raid nochmal explizit in der mdadm.conf unter im ordner etc und band md0 in die fstab ein.

Anscheinend sorgt gvfs per automount dafür, dass wenn was in der Zuweisung der fstab falsch läuft, das ganze in media mit uuid-bezeichnung gemountet wird, was dann zwei mountpoints auf eine partition ergibt.

Naja, hinterher ist man immer etwas schlauer .. also ... oft :D