Fehler-Package Loss beim Kopieren-Schreiben großer Anzahl von Bildern übers Netzwerk
Hi,
ich arbeite für eine Firma die 3d Modellierung und Animation macht. Wir haben hier 2 Netgear Switche GS724T stehen, die miteinander per Linkaggregation verbunden sind. An dem einen Switch hängen die Arbeits-PCs und ein Synology DS1511+ NAS mit 3x3TB Hitachi HDS723030ALA640 und 2x3TB Hitachi HUA723030ALA640 Festplatten(ebenfalls per Linkaggregation verbunden). An dem anderen hängen mehrere PCs als reine Render-PCs.
Das Problem ist nun das nach einem Renderjob, der eine Bildersequenz erstellt, teilweise Bilder kaputt sind also zwar teilweise etwas zu sehen ist aber stellenweise Pixel fehlen. So eine Sequenz besteht gut und gerne aus mehreren 100 Bildern. Die Renderfarm rendert jedes Bild einzeln und schreibt es danach direkt über das Netzwerk auf das NAS. Auf einem Render-PC wird das fertige Bild aber zunächst richtig angezeigt. Erst wenn die Bilder dann gespeichert und vom NAS aus geöffnet werden sind einige fehlerhaft.
Außerdem tritt das Problem scheinbar auch auf wenn die Render-PCs die Bilder erst lokal speichern und man sie dann manuell auf das NAS kopiert. Bleiben die Bilder auf dem RenderPC ist alles in Ordnung.
Laut den Monitoring-Werten der Switche gab es aber keine bis nur sehr wenige fehlerhafte Pakete. Auf jeden Fall zu wenige um die Menge an Fehlern zu rechtfertigen.
Meine Frage ist nun ob jemand eine Idee hat woran es liegen könnte oder wie ich am besten überprüfen kann ob es überhaupt an dem Netzwerk liegt oder die Fehlerquelle doch eher woanders zu suchen ist.
Das NAS meldet für die Festplatten keine Fehler und auch der S.M.A.R.T Status ist Normal.
Vielen Dank
X-Ray-Jin
ich arbeite für eine Firma die 3d Modellierung und Animation macht. Wir haben hier 2 Netgear Switche GS724T stehen, die miteinander per Linkaggregation verbunden sind. An dem einen Switch hängen die Arbeits-PCs und ein Synology DS1511+ NAS mit 3x3TB Hitachi HDS723030ALA640 und 2x3TB Hitachi HUA723030ALA640 Festplatten(ebenfalls per Linkaggregation verbunden). An dem anderen hängen mehrere PCs als reine Render-PCs.
Das Problem ist nun das nach einem Renderjob, der eine Bildersequenz erstellt, teilweise Bilder kaputt sind also zwar teilweise etwas zu sehen ist aber stellenweise Pixel fehlen. So eine Sequenz besteht gut und gerne aus mehreren 100 Bildern. Die Renderfarm rendert jedes Bild einzeln und schreibt es danach direkt über das Netzwerk auf das NAS. Auf einem Render-PC wird das fertige Bild aber zunächst richtig angezeigt. Erst wenn die Bilder dann gespeichert und vom NAS aus geöffnet werden sind einige fehlerhaft.
Außerdem tritt das Problem scheinbar auch auf wenn die Render-PCs die Bilder erst lokal speichern und man sie dann manuell auf das NAS kopiert. Bleiben die Bilder auf dem RenderPC ist alles in Ordnung.
Laut den Monitoring-Werten der Switche gab es aber keine bis nur sehr wenige fehlerhafte Pakete. Auf jeden Fall zu wenige um die Menge an Fehlern zu rechtfertigen.
Meine Frage ist nun ob jemand eine Idee hat woran es liegen könnte oder wie ich am besten überprüfen kann ob es überhaupt an dem Netzwerk liegt oder die Fehlerquelle doch eher woanders zu suchen ist.
Das NAS meldet für die Festplatten keine Fehler und auch der S.M.A.R.T Status ist Normal.
Vielen Dank
X-Ray-Jin
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 207215
Url: https://administrator.de/contentid/207215
Ausgedruckt am: 22.11.2024 um 19:11 Uhr
2 Kommentare
Neuester Kommentar
Moin,
Wenn Ihr die Dateien üebr smb/cifs ablegt, sollten pakcet-losses keien Auswirkugn haben, weil TCP dafür sorgt, daß die daten ordentlich üebrtragen werden.
Wahrscheinlicher ist es, daß z.B. der Speicher des NAS oder der renderrechne ggf kaputt ist (Bitfehler) und die Fehler daher kommen. Deswegen sollte man in NAS, Server und Workstation eigentlich prinzipiell immer ECC-RAM verwenden.
lks
Wenn Ihr die Dateien üebr smb/cifs ablegt, sollten pakcet-losses keien Auswirkugn haben, weil TCP dafür sorgt, daß die daten ordentlich üebrtragen werden.
Wahrscheinlicher ist es, daß z.B. der Speicher des NAS oder der renderrechne ggf kaputt ist (Bitfehler) und die Fehler daher kommen. Deswegen sollte man in NAS, Server und Workstation eigentlich prinzipiell immer ECC-RAM verwenden.
lks