Defekte Dateien nach Inhalt suchen
Hallo,
wir hatten den Fall, dass eine Mitarbeiterin in den letzten Wochen einen Teil der Ordnerstruktur neu strukturiert hat. Hauptsächlich hat Sie neue Ordner erstellt und bestehenen Inhalt hineinverschoben.
Jetzt sind wir draufgekommen dass einige bis viele (je nach Ordner) verschobenen Dateien defekt sind.
Die Dateien haben den richtigen Zeitstempel, die richtige Größe, aber wenn man sich die Dateien ansieht (PDF, DOCX, etc), besteht der Inhalt nur aus NULL-Zeichen (wird zumindest so angezeigt wenn man es im Notepad++ öffnet).
Den Größtenteil haben wir aus dem Backup wiederhergestellt, da es sich hier aber um eine Struktur mit mehreren hundert Ordner und noch mehr Dateien handelt und zusätzlich natürlich die letzten Woche gearbeitet wurde, kann ich nicht alles einfach wiederstellen. Das wurde Chaos verursachen. Weiters vermute ich irgendwie dass hier eventuell noch ältere Dateien betroffen sind. Bis jetzt war der Ausgangspunkt immer eine Userin, sonst hatte niemand defekte Dateien "erzeugt".
Ein Beispielfile schaut im Notepad++ so aus (siehe Anhang).
Daher die Frage: Du durchsuche ich per Script alle Dateien nach diesen *NULL* Inhalt?
Habe es mit Notepad++ versucht mit dem Suchstring "\x00", das funktioniert soweit, aber Notepad++ stürzt irgendwann ab - dafür ist das halt so nicht gemacht.
Schaffe ich das irgendwie mit Powershell? Das Script soll anschlagen sobald die Datei eine gewisse Anzahl von diesen Nullstrings hat.
Bisher habe ich nur diesen Befehl gefunden: dir -Recurse | Select-String -pattern "Find Me"
Nur weiß ich halt nicht wie ich hier nach diesen Nullstrings suche...
Vielen Dank!
Patrick
wir hatten den Fall, dass eine Mitarbeiterin in den letzten Wochen einen Teil der Ordnerstruktur neu strukturiert hat. Hauptsächlich hat Sie neue Ordner erstellt und bestehenen Inhalt hineinverschoben.
Jetzt sind wir draufgekommen dass einige bis viele (je nach Ordner) verschobenen Dateien defekt sind.
Die Dateien haben den richtigen Zeitstempel, die richtige Größe, aber wenn man sich die Dateien ansieht (PDF, DOCX, etc), besteht der Inhalt nur aus NULL-Zeichen (wird zumindest so angezeigt wenn man es im Notepad++ öffnet).
Den Größtenteil haben wir aus dem Backup wiederhergestellt, da es sich hier aber um eine Struktur mit mehreren hundert Ordner und noch mehr Dateien handelt und zusätzlich natürlich die letzten Woche gearbeitet wurde, kann ich nicht alles einfach wiederstellen. Das wurde Chaos verursachen. Weiters vermute ich irgendwie dass hier eventuell noch ältere Dateien betroffen sind. Bis jetzt war der Ausgangspunkt immer eine Userin, sonst hatte niemand defekte Dateien "erzeugt".
Ein Beispielfile schaut im Notepad++ so aus (siehe Anhang).
Daher die Frage: Du durchsuche ich per Script alle Dateien nach diesen *NULL* Inhalt?
Habe es mit Notepad++ versucht mit dem Suchstring "\x00", das funktioniert soweit, aber Notepad++ stürzt irgendwann ab - dafür ist das halt so nicht gemacht.
Schaffe ich das irgendwie mit Powershell? Das Script soll anschlagen sobald die Datei eine gewisse Anzahl von diesen Nullstrings hat.
Bisher habe ich nur diesen Befehl gefunden: dir -Recurse | Select-String -pattern "Find Me"
Nur weiß ich halt nicht wie ich hier nach diesen Nullstrings suche...
Vielen Dank!
Patrick
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 666256
Url: https://administrator.de/forum/defekte-dateien-nach-inhalt-suchen-666256.html
Ausgedruckt am: 27.01.2025 um 17:01 Uhr
8 Kommentare
Neuester Kommentar
In Notepad++ beispielsweise unter Menu Edit / EOL Conversion zunächst prüfen, ob die Einstellungen stimmen.
Tritt der Fehler, dass Dateien einen NULL-Inhalt aufweisen noch immer auf? Falls ja Ursache herausfinden und beseitigen.
Falls nein (oder nach der Beseitigung) kommt folgende Vorgehensweise in Betracht:
1. Eine neue VHDX-Datei anlegen und darauf den Datenzustand aus dem letzten Backup unmittelbar vor der großen Ordneroperation zurückschreiben.
2. Die Ordnerstruktur VHDX-Datei komplett durchlaufen lassen und alle relevanten Daten wie Verzeichnis, Dateiname, Erstellungs- und Änderungsdatum, Größe und Hashwert als strukturierte Datensätze in eine TXT/CSV-Datei schreiben. Für den Hashwert könnte Get-FileHash hilfreich sein.
3. Die Ordnerstruktur der originalen Datenstruktur (alte und neue Ordner) auf die gleiche Art und Weise in einer zweiten TXT/CSV-Datei erfassen.
4. Beide TXT/CSV-Dateien als je ein Blatt in eine XLS-Datei einfügen.
5.
a) Dann anhand der Datensätze zunächst die Dateien herausfiltern und eleminieren, die noch und nur am alten Ort existieren.
b) Die Dateisätze herausfiltern und eleminieren, die neue Dateien sind und auch nur an diesem Ort (alt oder neu) existieren.
c) Die Paarungen von Datensätzen herausfiltern, die nicht das NULL-Problem (aka abweichender Hashwert) haben, und eleminieren.
e) Die Paarungen von Datensätzen mit dem NULL-Problem separieren und einer entsprechenden Korrektur zuführen. Dateien, die zwischenzeitlich im ordentlichen Arbeitsgang geändert wurden, dürften abweichende Datensätze haben und grundsätzlich hier nicht hineinfallen.
f) Diejenigen Datensätze, die noch übrig sind, einer individuellen Betrachtung zuführen. Vielleicht kann das automatisiert werden, wenn ein bestimmtes Muster erkennbar ist.
Hilfreich kann in Excel die Verwendung von Makros sein, um das Filtern zu automatisieren. Immerhin kann nicht alles sinnvoll über die Standardfunktionen von Excel realisiert werden.
Viele Grüße
HansDampf06
Tritt der Fehler, dass Dateien einen NULL-Inhalt aufweisen noch immer auf? Falls ja Ursache herausfinden und beseitigen.
Falls nein (oder nach der Beseitigung) kommt folgende Vorgehensweise in Betracht:
1. Eine neue VHDX-Datei anlegen und darauf den Datenzustand aus dem letzten Backup unmittelbar vor der großen Ordneroperation zurückschreiben.
2. Die Ordnerstruktur VHDX-Datei komplett durchlaufen lassen und alle relevanten Daten wie Verzeichnis, Dateiname, Erstellungs- und Änderungsdatum, Größe und Hashwert als strukturierte Datensätze in eine TXT/CSV-Datei schreiben. Für den Hashwert könnte Get-FileHash hilfreich sein.
3. Die Ordnerstruktur der originalen Datenstruktur (alte und neue Ordner) auf die gleiche Art und Weise in einer zweiten TXT/CSV-Datei erfassen.
4. Beide TXT/CSV-Dateien als je ein Blatt in eine XLS-Datei einfügen.
5.
a) Dann anhand der Datensätze zunächst die Dateien herausfiltern und eleminieren, die noch und nur am alten Ort existieren.
b) Die Dateisätze herausfiltern und eleminieren, die neue Dateien sind und auch nur an diesem Ort (alt oder neu) existieren.
c) Die Paarungen von Datensätzen herausfiltern, die nicht das NULL-Problem (aka abweichender Hashwert) haben, und eleminieren.
e) Die Paarungen von Datensätzen mit dem NULL-Problem separieren und einer entsprechenden Korrektur zuführen. Dateien, die zwischenzeitlich im ordentlichen Arbeitsgang geändert wurden, dürften abweichende Datensätze haben und grundsätzlich hier nicht hineinfallen.
f) Diejenigen Datensätze, die noch übrig sind, einer individuellen Betrachtung zuführen. Vielleicht kann das automatisiert werden, wenn ein bestimmtes Muster erkennbar ist.
Hilfreich kann in Excel die Verwendung von Makros sein, um das Filtern zu automatisieren. Immerhin kann nicht alles sinnvoll über die Standardfunktionen von Excel realisiert werden.
Viele Grüße
HansDampf06
Moin,
Sind die Dateien wirklich defekt?
Why Does My .docx File Look Like Junk In Notepad++
İch vermute eher Freitags-PEBCAK als Fehlerursache.
lks
Sind die Dateien wirklich defekt?
Why Does My .docx File Look Like Junk In Notepad++
İch vermute eher Freitags-PEBCAK als Fehlerursache.
lks
Moin nochmal,
heir etwas ausführlicherNotepad++ ist keine gute Methode um PDF- und Word-Dokukente zu überprüfen. Da sieht man immer NUL-Bytes, weil das eben binäre Dateien sind. Und Klartext wirst da nie sehen, außer zufällig ein paar Buchstabenfolgen, die passen könnten.
Du mußt schauen, ob die Dateien in einem Word- oder PDF-Viewer "sichtbar" sind.
Des weiteren kanns es auch sein, daß die Dateien verschlüsselt sind und Du daher sowieso nichts erkennst. Die Verschlüsselung kann z.B. durch Windows selbst kommen, weil der benutzer das veranlaß hat oder durch einen fürsorglichen Verschlüsselungstrojaner.
Du solltest also erstmal prüfen, ob Du die Dateien ganz normal iun Word oder im Adobe Reader aufmachen kannst, und zwar als der Eigentümer der Datei!
lks
Zitat von @rickstinson:
Ich habs auch direkt am Notebook der MA geprüft, gemeinsam mit ihr. Es betraf auch nicht alle Dateien die verschoben wurden, aber immer wieder mal eine. Das ganze ist definitiv beim verschieben passiert, da die Dateien aus dem Backup ja funktionieren.
Ich habs auch direkt am Notebook der MA geprüft, gemeinsam mit ihr. Es betraf auch nicht alle Dateien die verschoben wurden, aber immer wieder mal eine. Das ganze ist definitiv beim verschieben passiert, da die Dateien aus dem Backup ja funktionieren.
Arbeitet der Mitarbeiter Remote (per VPN) oder hat ggf Offline-Dateien aktiv?
lks
Wir haben für unsere Shares eine grundsätzliche Überwachungen über sämtliche Änderungen mit dem FSRM implementiert
https://docs.microsoft.com/de-de/windows-server/storage/fsrm/configure-f ...
So entsteht eine lückenlose Historie über alles was dort so abgeht.
Ich würde neben dem Backup auch mal über ausreichend Platz für Schattenkopien nachdenken.
Gruß w.
https://docs.microsoft.com/de-de/windows-server/storage/fsrm/configure-f ...
So entsteht eine lückenlose Historie über alles was dort so abgeht.
Ich würde neben dem Backup auch mal über ausreichend Platz für Schattenkopien nachdenken.
Gruß w.
Aufgrund der bisherigen Beschreibungen der Problemlage würde ich einmal die Überprüfung des Dateisystems auf Fehler in Erwägung ziehen. Es klingt ganz danach, dass es beschädigt sein könnte. Vielleicht zeigt auch die Hardware - egal ob HDD/SSD - auch erste Ausfallerscheinungen. Die Schutzmechanismen bei SSD's gegen verbrauchte Speicherzellen können zudem nicht verhindern, dass es nicht doch einmal Datenverlust gibt.
Viele Grüße
HansDampf06
Viele Grüße
HansDampf06