rickstinson
Goto Top

Defekte Dateien nach Inhalt suchen

Hallo,

wir hatten den Fall, dass eine Mitarbeiterin in den letzten Wochen einen Teil der Ordnerstruktur neu strukturiert hat. Hauptsächlich hat Sie neue Ordner erstellt und bestehenen Inhalt hineinverschoben.

Jetzt sind wir draufgekommen dass einige bis viele (je nach Ordner) verschobenen Dateien defekt sind.
Die Dateien haben den richtigen Zeitstempel, die richtige Größe, aber wenn man sich die Dateien ansieht (PDF, DOCX, etc), besteht der Inhalt nur aus NULL-Zeichen (wird zumindest so angezeigt wenn man es im Notepad++ öffnet).

Den Größtenteil haben wir aus dem Backup wiederhergestellt, da es sich hier aber um eine Struktur mit mehreren hundert Ordner und noch mehr Dateien handelt und zusätzlich natürlich die letzten Woche gearbeitet wurde, kann ich nicht alles einfach wiederstellen. Das wurde Chaos verursachen. Weiters vermute ich irgendwie dass hier eventuell noch ältere Dateien betroffen sind. Bis jetzt war der Ausgangspunkt immer eine Userin, sonst hatte niemand defekte Dateien "erzeugt".

Ein Beispielfile schaut im Notepad++ so aus (siehe Anhang).

Daher die Frage: Du durchsuche ich per Script alle Dateien nach diesen *NULL* Inhalt?
Habe es mit Notepad++ versucht mit dem Suchstring "\x00", das funktioniert soweit, aber Notepad++ stürzt irgendwann ab - dafür ist das halt so nicht gemacht.

Schaffe ich das irgendwie mit Powershell? Das Script soll anschlagen sobald die Datei eine gewisse Anzahl von diesen Nullstrings hat.
Bisher habe ich nur diesen Befehl gefunden: dir -Recurse | Select-String -pattern "Find Me"
Nur weiß ich halt nicht wie ich hier nach diesen Nullstrings suche...

Vielen Dank!
Patrick
defekte_files

Content-Key: 666256

Url: https://administrator.de/contentid/666256

Printed on: April 13, 2024 at 13:04 o'clock

Member: HansDampf06
HansDampf06 Apr 30, 2021 at 06:52:08 (UTC)
Goto Top
In Notepad++ beispielsweise unter Menu Edit / EOL Conversion zunächst prüfen, ob die Einstellungen stimmen.

Tritt der Fehler, dass Dateien einen NULL-Inhalt aufweisen noch immer auf? Falls ja Ursache herausfinden und beseitigen.

Falls nein (oder nach der Beseitigung) kommt folgende Vorgehensweise in Betracht:

1. Eine neue VHDX-Datei anlegen und darauf den Datenzustand aus dem letzten Backup unmittelbar vor der großen Ordneroperation zurückschreiben.
2. Die Ordnerstruktur VHDX-Datei komplett durchlaufen lassen und alle relevanten Daten wie Verzeichnis, Dateiname, Erstellungs- und Änderungsdatum, Größe und Hashwert als strukturierte Datensätze in eine TXT/CSV-Datei schreiben. Für den Hashwert könnte Get-FileHash hilfreich sein.
3. Die Ordnerstruktur der originalen Datenstruktur (alte und neue Ordner) auf die gleiche Art und Weise in einer zweiten TXT/CSV-Datei erfassen.
4. Beide TXT/CSV-Dateien als je ein Blatt in eine XLS-Datei einfügen.
5.
a) Dann anhand der Datensätze zunächst die Dateien herausfiltern und eleminieren, die noch und nur am alten Ort existieren.
b) Die Dateisätze herausfiltern und eleminieren, die neue Dateien sind und auch nur an diesem Ort (alt oder neu) existieren.
c) Die Paarungen von Datensätzen herausfiltern, die nicht das NULL-Problem (aka abweichender Hashwert) haben, und eleminieren.
e) Die Paarungen von Datensätzen mit dem NULL-Problem separieren und einer entsprechenden Korrektur zuführen. Dateien, die zwischenzeitlich im ordentlichen Arbeitsgang geändert wurden, dürften abweichende Datensätze haben und grundsätzlich hier nicht hineinfallen.
f) Diejenigen Datensätze, die noch übrig sind, einer individuellen Betrachtung zuführen. Vielleicht kann das automatisiert werden, wenn ein bestimmtes Muster erkennbar ist.

Hilfreich kann in Excel die Verwendung von Makros sein, um das Filtern zu automatisieren. Immerhin kann nicht alles sinnvoll über die Standardfunktionen von Excel realisiert werden.

Viele Grüße
HansDampf06
Member: Lochkartenstanzer
Lochkartenstanzer Apr 30, 2021 updated at 07:16:14 (UTC)
Goto Top
Moin,

Sind die Dateien wirklich defekt?

Why Does My .docx File Look Like Junk In Notepad++

İch vermute eher Freitags-PEBCAK als Fehlerursache.

lks
Member: Lochkartenstanzer
Lochkartenstanzer Apr 30, 2021 at 07:26:22 (UTC)
Goto Top
Zitat von @Lochkartenstanzer:

Sind die Dateien wirklich defekt?


Moin nochmal,

heir etwas ausführlicherNotepad++ ist keine gute Methode um PDF- und Word-Dokukente zu überprüfen. Da sieht man immer NUL-Bytes, weil das eben binäre Dateien sind. Und Klartext wirst da nie sehen, außer zufällig ein paar Buchstabenfolgen, die passen könnten.

Du mußt schauen, ob die Dateien in einem Word- oder PDF-Viewer "sichtbar" sind.

Des weiteren kanns es auch sein, daß die Dateien verschlüsselt sind und Du daher sowieso nichts erkennst. Die Verschlüsselung kann z.B. durch Windows selbst kommen, weil der benutzer das veranlaß hat oder durch einen fürsorglichen Verschlüsselungstrojaner.

Du solltest also erstmal prüfen, ob Du die Dateien ganz normal iun Word oder im Adobe Reader aufmachen kannst, und zwar als der Eigentümer der Datei!

lks
Member: rickstinson
rickstinson Apr 30, 2021 at 07:42:26 (UTC)
Goto Top
@HansDampf06:
Danke! Speziell das mit dem Hashwert ist eine super Idee, da sonst die Dateigröße + Änderungsdatum gleich ist, ist dies wohl die einzige Option.

@Lochkartenstanzer:
Also ja, sind wirklich defekt. Ich wieß, das Notepad++ ein Plaintext Editor ist, aber die Files bestehen eben nur aus NULL, wenn man zB ein funktionierendes Worddokument oder PDF im Notepad++ öffnet, werden entsprechend auch andere Character angezeigt.
Und ja, die defekten Files gehen in keinem Viewer auf, meine erste Vermutung war, dass eventuell nur die Dateiendung nicht stimmt, aber nein, Dateien enhalten wirklich nur NULL Charakter.

Verschlüsselung kann ich auch ausschließen, da würde auch mehr als nur NULL in der DAtei stehen.
Ich habs auch direkt am Notebook der MA geprüft, gemeinsam mit ihr. Es betraf auch nicht alle Dateien die verschoben wurden, aber immer wieder mal eine. Das ganze ist definitiv beim verschieben passiert, da die Dateien aus dem Backup ja funktionieren.

Aber ja, zuerst mal schauen wie wir alle defekten Dateien auflisten können, und dann müssen wir schauen warum es passiert ist (MA ist angehalten derzeit nach jeden verschiebevorgang die verschobene DAteien danach nochmals zu öffnen).
Member: Lochkartenstanzer
Lochkartenstanzer Apr 30, 2021 at 07:44:35 (UTC)
Goto Top
Zitat von @rickstinson:

Ich habs auch direkt am Notebook der MA geprüft, gemeinsam mit ihr. Es betraf auch nicht alle Dateien die verschoben wurden, aber immer wieder mal eine. Das ganze ist definitiv beim verschieben passiert, da die Dateien aus dem Backup ja funktionieren.


Arbeitet der Mitarbeiter Remote (per VPN) oder hat ggf Offline-Dateien aktiv?

lks
Member: rickstinson
rickstinson Apr 30, 2021 at 08:12:17 (UTC)
Goto Top
Offlinedateien sind +berall deaktivert, übers VPN wird zwar gearbeitet, aber die Verschiebeaktionen waren definitiv im lokalen Netzwerk.
Irgendwelche Netzwerkdisconnects, etc sollten ja die Dateien auch nicht *so* verändern/zerstören. AV hat auch nie angeschlagen.

Die Ursachenforschung wird hier wohl das schwierigste....
Mitglied: 148121
148121 Apr 30, 2021 updated at 08:26:13 (UTC)
Goto Top
Zitat von @rickstinson:
Die Ursachenforschung wird hier wohl das schwierigste....
Wir haben für unsere Shares eine grundsätzliche Überwachungen über sämtliche Änderungen mit dem FSRM implementiert
https://docs.microsoft.com/de-de/windows-server/storage/fsrm/configure-f ...
So entsteht eine lückenlose Historie über alles was dort so abgeht.

Ich würde neben dem Backup auch mal über ausreichend Platz für Schattenkopien nachdenken.

Gruß w.
Member: HansDampf06
HansDampf06 Apr 30, 2021 at 08:51:30 (UTC)
Goto Top
Aufgrund der bisherigen Beschreibungen der Problemlage würde ich einmal die Überprüfung des Dateisystems auf Fehler in Erwägung ziehen. Es klingt ganz danach, dass es beschädigt sein könnte. Vielleicht zeigt auch die Hardware - egal ob HDD/SSD - auch erste Ausfallerscheinungen. Die Schutzmechanismen bei SSD's gegen verbrauchte Speicherzellen können zudem nicht verhindern, dass es nicht doch einmal Datenverlust gibt.

Viele Grüße
HansDampf06