zimbosmurf
Goto Top

Grosse externe USB-Platte bricht nach einigen Stunden Kopiervorgang ab

Hallo!

Wir haben einen Windows-10-Rechner, auf dessen lokaler Festplatte über die Woche alle möglichen Backups landen.

Mit drei externen USB-Platten machen wir im Wechsel jede Woche ein externes Backup dieser Daten mittels eines Skriptes und Robocopy und lagern diese ortsfern.

Bisher waren das 3 Stück 4TB WD USB-3.0 2,5-Zoll HDDs, von denen aber eine in letzter Zeit etwas problematisch war. Deswegen haben wir 3 neue HDDs gekauft, Seagate Expansion Portable 5TB 2,5-Zoll.

Der erste offenkundige Unterschied ist, dass die neuen Platten sich im System als USB attached SCSI anmelden. Auf den Platten war eine große ExFAT-Partition angelegt, die habe ich auch so gelassen, aber mit Bitlocker verschlüsselt, was auch bei den alten Platten der Fall war.

Gestern sollte das erste Backup auf eine der neuen Platten laufen. Nach einigen Stunden Kopiervorgang bemerkte ich bei einem Remotezugriff, dass der Rechner nicht mehr erreichbar ist. Als ich heute morgen dann vor Ort war konnte ich lokal auf den Rechner zugreifen und stellte fest, dass der Rechner insgesamt sehr unresponsive war und sich im Robocopy-Log diese Fehlermeldung ansammelten:

ERROR 21 (0x00000015) - The device is not ready
ERROR 121 (0x00000079) - The semaphore timeout period has expired
hdd_1

Ausserdem war die Platte auch aus Explorer und Devicemanager verschwunden.

Ich startete den Rechner neu und nahm eine andere der neuen Platten und startete das Backup erneut.
Ein paar Stunden später sammelten sich auch hierbei Fehlermeldungen im Log:

ERROR 3 (0x00000003) The system cannot find the path specified.
hdd_2

Ich konnte auf jeden Ordner auf der Platte zugreifen - aber beim Zugriff auf den genannten Pfad hing dann auch der Windows Explorer.

Die erste Platte checke ich gerade mit GSmartControl, der Test dauert aber noch rund 12 Stunden.

Bis auf die Tatsache, dass das Backup ab und zu doppelt so lang dauerte wie normalerweise hatten wir solche Probleme mit den alten Festplatten nie. Ich habe gerade nochmal einen Test mit einer der neuen Platten aber einer NTFS-formatierten Partition gestartet, kann mir aber nicht vorstellen, dass das zu einem anderen Ergebnis führt.

Ich bin absolut ratlos bezüglich der Ursache. Hat irgendwer eine Idee/einen Tipp?

Ich will morgen nochmal die Gegenprobe mit einer der alten Platten machen, ob vielleicht doch seit dem letzten Backup ein Problem am Rechner aufgetreten ist.

Content-ID: 9204161415

Url: https://administrator.de/contentid/9204161415

Ausgedruckt am: 28.09.2024 um 20:09 Uhr

kpunkt
kpunkt 25.06.2024 um 14:07:48 Uhr
Goto Top
Da kann auch der USB-Port bzw. -Controller die Grätsche machen.

Vielleicht wäre da ein NAS auch eine Überlegung wert.
kaiand1
kaiand1 25.06.2024 um 14:16:53 Uhr
Goto Top
Hi
nun was zeigen die Smartwerte der Platte denn an?
Mal das Dateisystem aller Platten (extern und interne) geprüft ob es ggfs Fehler hat ?
Wie sind die Temperaturen der Platte/ext Netzteil PC allgemein ?
Mal anderes USB Kabel und Port genommen ggfs Sata Kabel/Port von Interner Platte ?
Memtest laufen lassen ?

Da du Bitlocker/Verschlüsselung nutzt auch die Keys ect gesichert falls des System den Kollaps macht ?

Da natürlich jegliche Reparaturversuche auch die Lage verschlimmern kann sollte halt ein Backup auf einer neuen Platte/Netzwerk gemacht werden idealerweise per Livelinux da auch dein System/Platte ne Macke haben kann....

Normal wenn es die externe Platte ist sollte des System dennoch Problemlos weiter machen aber da es Hängt würde erst mal vermuten der PC hat nen Problem...
Aber Fehler sind halt oft nicht so wie es auf den ersten Blick erscheint....
zimbosmurf
zimbosmurf 25.06.2024 um 14:22:17 Uhr
Goto Top
Den Controller habe ich auch schon im Auge, aber:

- Die ganze Zeit zwei von drei Platten völlig problemlos, lediglich eine (immer die gleiche) brauchte zuletzt bei jedem zweiten oder dritten Backupvorgang etwa doppelt so lange wie üblich, hat aber das Backup immer sauber abgeschlossen

- Mit den neuen Platten dann auf einmal die riesen Katastrophen

Da wäre es schon seltsam, wenn der USB-Port der Übeltäter wäre. Andererseits ist es auch reichlich seltsam, dass (mindestens!) zwei von drei neuen Platten kaputt sind.

Quote from @kpunkt:
Vielleicht wäre da ein NAS auch eine Überlegung wert.
Erstmal ist das eine gewachsene Struktur, die ich jetzt nicht einfach über den Haufen schmeissen möchte.
Der Windows-10-Rechner ist ja quasi das NAS auf dem Backups von verschiedenen anderen Geräten auf verschiedenen Wegen landen. Hier bin ich mit dem Windows-10-System deutlich flexibler als mit einem NAS, das ergibt so erstmal keinen Sinn, den zu ersetzen.
NAS als Backupziel wäre zwar sicherlich ganz nett, aber das NAS kann ich, wenn es voll ist, schlechter mit nach Hause nehmen. Die kleinen USB-Platten haben ja gerade den Zweck, dass das Backup ortsfern gelagert wird. Ich könnte natürlich NAS bei Mitarbeitern zu hause platzieren und das Backup über einen Tunnel dort hin schicken, das geht aber aus verschiedenen anderen Gründen nicht.
zimbosmurf
zimbosmurf 25.06.2024 um 14:24:55 Uhr
Goto Top
Das sind die Smart-Daten der ersten Platte, die die Grätsche gemacht hat, der Selftest (der noch 12 Stunden dauern sollte, auf einem anderen Rechner) ist gerade ganz frisch gescheitert. ich fürchte, die Platte hat tatsächlich eine Macke:

smartctl 7.2 2020-12-30 r5155 [x86_64-w64-mingw32-w10-b19045] (sf-7.2-1)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 2.5 5400
Device Model:     ST5000LM000-2AN170
Serial Number:    WCJ9FTVH
LU WWN Device Id: 5 000c50 0e808a37c
Firmware Version: 0001
User Capacity:    5.000.981.078.016 bytes [5,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5526 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Jun 25 11:23:52 2024 WEDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM feature is:   Unavailable
APM level is:     128 (minimum power consumption without standby)
Rd look-ahead is: Enabled
Write cache is:   Enabled
DSN feature is:   Unavailable
ATA Security is:  Disabled, NOT FROZEN [SEC1]

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      ( 121)	The previous self-test completed having
					the read element of the test failed.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x73) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 803) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x30a5)	SCT Status supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR--   071   066   006    -    220484445
  3 Spin_Up_Time            PO----   099   097   000    -    0
  4 Start_Stop_Count        -O--CK   090   090   020    -    10305
  5 Reallocated_Sector_Ct   PO--CK   100   100   010    -    0
  7 Seek_Error_Rate         POSR--   100   253   045    -    768798
  9 Power_On_Hours          -O--CK   100   100   000    -    26 (9 5 0)
 10 Spin_Retry_Count        PO--C-   100   100   097    -    0
 12 Power_Cycle_Count       -O--CK   100   100   020    -    14
183 SATA_Downshift_Count    -O--CK   100   100   000    -    0
184 End-to-End_Error        -O--CK   100   100   099    -    0
187 Reported_Uncorrect      -O--CK   100   100   000    -    0
188 Command_Timeout         -O--CK   100   100   000    -    0
189 High_Fly_Writes         -O-RCK   100   100   000    -    0
190 Airflow_Temperature_Cel -O---K   060   052   040    -    40 (Min/Max 37/48)
191 G-Sense_Error_Rate      -O--CK   100   100   000    -    0
192 Power-Off_Retract_Count -O--CK   095   095   000    -    10296
193 Load_Cycle_Count        -O--CK   095   095   000    -    10326
194 Temperature_Celsius     -O---K   040   048   000    -    40 (0 20 0 0 0)
195 Hardware_ECC_Recovered  -O-RC-   083   066   000    -    220484445
197 Current_Pending_Sector  -O--C-   100   100   000    -    8
198 Offline_Uncorrectable   ----C-   100   100   000    -    8
199 UDMA_CRC_Error_Count    -OSRCK   200   200   000    -    0
240 Head_Flying_Hours       ------   100   253   000    -    1 (49 103 0)
241 Total_LBAs_Written      ------   100   253   000    -    147800010
242 Total_LBAs_Read         ------   100   253   000    -    72684435
254 Free_Fall_Sensor        -O--CK   100   100   000    -    0
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning

General Purpose Log Directory Version 1
SMART           Log Directory Version 1 [multi-sector log support]
Address    Access  R/W   Size  Description
0x00       GPL,SL  R/O      1  Log Directory
0x01           SL  R/O      1  Summary SMART error log
0x02           SL  R/O      5  Comprehensive SMART error log
0x03       GPL     R/O      5  Ext. Comprehensive SMART error log
0x04       GPL,SL  R/O      8  Device Statistics log
0x06           SL  R/O      1  SMART self-test log
0x07       GPL     R/O      1  Extended self-test log
0x09           SL  R/W      1  Selective self-test log
0x0c       GPL     R/O   2048  Pending Defects log
0x10       GPL     R/O      1  NCQ Command Error log
0x11       GPL     R/O      1  SATA Phy Event Counters log
0x21       GPL     R/O      1  Write stream error log
0x22       GPL     R/O      1  Read stream error log
0x24       GPL     R/O    512  Current Device Internal Status Data log
0x30       GPL,SL  R/O      9  IDENTIFY DEVICE data log
0x80-0x9f  GPL,SL  R/W     16  Host vendor specific log
0xa1       GPL,SL  VS      24  Device vendor specific log
0xa2       GPL     VS    8160  Device vendor specific log
0xa8-0xa9  GPL,SL  VS     136  Device vendor specific log
0xab       GPL     VS       1  Device vendor specific log
0xb0       GPL     VS    9048  Device vendor specific log
0xbe-0xbf  GPL     VS   65535  Device vendor specific log
0xc0       GPL,SL  VS       1  Device vendor specific log
0xc1       GPL,SL  VS      16  Device vendor specific log
0xc3       GPL,SL  VS       8  Device vendor specific log
0xc4       GPL,SL  VS      24  Device vendor specific log
0xd1       GPL     VS     168  Device vendor specific log
0xd3       GPL     VS    1920  Device vendor specific log
0xe0       GPL,SL  R/W      1  SCT Command/Status
0xe1       GPL,SL  R/W      1  SCT Data Transfer

SMART Extended Comprehensive Error Log Version: 1 (5 sectors)
No Errors Logged

SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%        26         366708256

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    47 Celsius
Power Cycle Min/Max Temperature:     36/47 Celsius
Lifetime    Min/Max Temperature:     20/47 Celsius
Under/Over Temperature Limit Count:   0/0

SCT Temperature History Version:     2
Temperature Sampling Period:         3 minutes
Temperature Logging Interval:        59 minutes
Min/Max recommended Temperature:     14/55 Celsius
Min/Max Temperature Limit:           10/60 Celsius
Temperature History Size (Index):    128 (126)

Index    Estimated Time   Temperature Celsius
 127    2024-06-20 06:27     ?  -
   0    2024-06-20 07:26    43  ************************
   1    2024-06-20 08:25     ?  -
   2    2024-06-20 09:24    43  ************************
   3    2024-06-20 10:23     ?  -
   4    2024-06-20 11:22    43  ************************
   5    2024-06-20 12:21     ?  -
   6    2024-06-20 13:20    43  ************************
   7    2024-06-20 14:19     ?  -
   8    2024-06-20 15:18    43  ************************
   9    2024-06-20 16:17     ?  -
  10    2024-06-20 17:16    44  *************************
  11    2024-06-20 18:15     ?  -
  12    2024-06-20 19:14    43  ************************
  13    2024-06-20 20:13     ?  -
  14    2024-06-20 21:12    43  ************************
  15    2024-06-20 22:11     ?  -
  16    2024-06-20 23:10    43  ************************
  17    2024-06-21 00:09     ?  -
  18    2024-06-21 01:08    43  ************************
  19    2024-06-21 02:07     ?  -
  20    2024-06-21 03:06    44  *************************
  21    2024-06-21 04:05     ?  -
  22    2024-06-21 05:04    43  ************************
  23    2024-06-21 06:03     ?  -
  24    2024-06-21 07:02    44  *************************
  25    2024-06-21 08:01     ?  -
  26    2024-06-21 09:00    44  *************************
  27    2024-06-21 09:59     ?  -
  28    2024-06-21 10:58    44  *************************
  29    2024-06-21 11:57     ?  -
  30    2024-06-21 12:56    44  *************************
  31    2024-06-21 13:55     ?  -
  32    2024-06-21 14:54    44  *************************
  33    2024-06-21 15:53     ?  -
  34    2024-06-21 16:52    44  *************************
  35    2024-06-21 17:51     ?  -
  36    2024-06-21 18:50    44  *************************
  37    2024-06-21 19:49     ?  -
  38    2024-06-21 20:48    44  *************************
  39    2024-06-21 21:47     ?  -
  40    2024-06-21 22:46    44  *************************
  41    2024-06-21 23:45     ?  -
  42    2024-06-22 00:44    44  *************************
  43    2024-06-22 01:43     ?  -
  44    2024-06-22 02:42    44  *************************
  45    2024-06-22 03:41     ?  -
  46    2024-06-22 04:40    44  *************************
  47    2024-06-22 05:39     ?  -
  48    2024-06-22 06:38    44  *************************
  49    2024-06-22 07:37     ?  -
  50    2024-06-22 08:36    44  *************************
  51    2024-06-22 09:35     ?  -
  52    2024-06-22 10:34    44  *************************
  53    2024-06-22 11:33     ?  -
  54    2024-06-22 12:32    44  *************************
  55    2024-06-22 13:31     ?  -
  56    2024-06-22 14:30    44  *************************
  57    2024-06-22 15:29     ?  -
  58    2024-06-22 16:28    44  *************************
  59    2024-06-22 17:27     ?  -
  60    2024-06-22 18:26    44  *************************
  61    2024-06-22 19:25     ?  -
  62    2024-06-22 20:24    44  *************************
  63    2024-06-22 21:23     ?  -
  64    2024-06-22 22:22    44  *************************
  65    2024-06-22 23:21     ?  -
  66    2024-06-23 00:20    44  *************************
  67    2024-06-23 01:19     ?  -
  68    2024-06-23 02:18    44  *************************
  69    2024-06-23 03:17     ?  -
  70    2024-06-23 04:16    44  *************************
  71    2024-06-23 05:15     ?  -
  72    2024-06-23 06:14    44  *************************
  73    2024-06-23 07:13     ?  -
  74    2024-06-23 08:12    44  *************************
  75    2024-06-23 09:11     ?  -
  76    2024-06-23 10:10    44  *************************
  77    2024-06-23 11:09     ?  -
  78    2024-06-23 12:08    44  *************************
  79    2024-06-23 13:07     ?  -
  80    2024-06-23 14:06    44  *************************
  81    2024-06-23 15:05     ?  -
  82    2024-06-23 16:04    44  *************************
  83    2024-06-23 17:03     ?  -
  84    2024-06-23 18:02    44  *************************
  85    2024-06-23 19:01     ?  -
  86    2024-06-23 20:00    44  *************************
  87    2024-06-23 20:59     ?  -
  88    2024-06-23 21:58    44  *************************
  89    2024-06-23 22:57     ?  -
  90    2024-06-23 23:56    44  *************************
  91    2024-06-24 00:55     ?  -
  92    2024-06-24 01:54    44  *************************
  93    2024-06-24 02:53     ?  -
  94    2024-06-24 03:52    44  *************************
  95    2024-06-24 04:51     ?  -
  96    2024-06-24 05:50    44  *************************
  97    2024-06-24 06:49     ?  -
  98    2024-06-24 07:48    44  *************************
  99    2024-06-24 08:47     ?  -
 100    2024-06-24 09:46    44  *************************
 101    2024-06-24 10:45     ?  -
 102    2024-06-24 11:44    44  *************************
 103    2024-06-24 12:43     ?  -
 104    2024-06-24 13:42    44  *************************
 105    2024-06-24 14:41     ?  -
 106    2024-06-24 15:40    44  *************************
 107    2024-06-24 16:39     ?  -
 108    2024-06-24 17:38    44  *************************
 109    2024-06-24 18:37     ?  -
 110    2024-06-24 19:36    44  *************************
 111    2024-06-24 20:35     ?  -
 112    2024-06-24 21:34    44  *************************
 113    2024-06-24 22:33     ?  -
 114    2024-06-24 23:32    44  *************************
 115    2024-06-25 00:31     ?  -
 116    2024-06-25 01:30    44  *************************
 117    2024-06-25 02:29     ?  -
 118    2024-06-25 03:28    44  *************************
 119    2024-06-25 04:27     ?  -
 120    2024-06-25 05:26    44  *************************
 121    2024-06-25 06:25     ?  -
 122    2024-06-25 07:24    44  *************************
 123    2024-06-25 08:23     ?  -
 124    2024-06-25 09:22    36  *****************
 125    2024-06-25 10:21    44  *************************
 126    2024-06-25 11:20    39  ********************

SCT Error Recovery Control command not supported

Device Statistics (GP Log 0x04)
Page  Offset Size        Value Flags Description
0x01  =====  =               =  ===  == General Statistics (rev 1) ==
0x01  0x008  4              14  ---  Lifetime Power-On Resets
0x01  0x010  4              26  ---  Power-on Hours
0x01  0x018  6       419070611  ---  Logical Sectors Written
0x01  0x020  6         1018057  ---  Number of Write Commands
0x01  0x028  6        71438701  ---  Logical Sectors Read
0x01  0x030  6          289101  ---  Number of Read Commands
0x01  0x038  6               -  ---  Date and Time TimeStamp
0x03  =====  =               =  ===  == Rotating Media Statistics (rev 1) ==
0x03  0x008  4      1883512483  N--  Spindle Motor Power-on Hours
0x03  0x010  4      1883512481  N--  Head Flying Hours
0x03  0x018  4           10326  ---  Head Load Events
0x03  0x020  4               0  ---  Number of Reallocated Logical Sectors
0x03  0x028  4              15  ---  Read Recovery Attempts
0x03  0x030  4               0  ---  Number of Mechanical Start Failures
0x03  0x038  4               8  ---  Number of Realloc. Candidate Logical Sectors
0x03  0x040  4           10297  ---  Number of High Priority Unload Events
0x04  =====  =               =  ===  == General Errors Statistics (rev 1) ==
0x04  0x008  4              15  ---  Number of Reported Uncorrectable Errors
0x04  0x010  4               0  ---  Resets Between Cmd Acceptance and Completion
0x05  =====  =               =  ===  == Temperature Statistics (rev 1) ==
0x05  0x008  1              47  ---  Current Temperature
0x05  0x010  1               -  ---  Average Short Term Temperature
0x05  0x018  1               -  ---  Average Long Term Temperature
0x05  0x020  1              47  ---  Highest Temperature
0x05  0x028  1              25  ---  Lowest Temperature
0x05  0x030  1               -  ---  Highest Average Short Term Temperature
0x05  0x038  1               -  ---  Lowest Average Short Term Temperature
0x05  0x040  1               -  ---  Highest Average Long Term Temperature
0x05  0x048  1               -  ---  Lowest Average Long Term Temperature
0x05  0x050  4               0  ---  Time in Over-Temperature
0x05  0x058  1              55  ---  Specified Maximum Operating Temperature
0x05  0x060  4               0  ---  Time in Under-Temperature
0x05  0x068  1              13  ---  Specified Minimum Operating Temperature
0x06  =====  =               =  ===  == Transport Statistics (rev 1) ==
0x06  0x008  4               9  ---  Number of Hardware Resets
0x06  0x010  4               3  ---  Number of ASR Events
0x06  0x018  4               0  ---  Number of Interface CRC Errors
                                |||_ C monitored condition met
                                ||__ D supports DSN
                                |___ N normalized value

SATA Phy Event Counters (GP Log 0x11)
ID      Size     Value  Description
0x000a  2            5  Device-to-host register FISes sent due to a COMRESET
0x0001  2            0  Command failed due to ICRC error
0x0003  2            0  R_ERR response for device-to-host data FIS
0x0004  2            0  R_ERR response for host-to-device data FIS
0x0006  2            0  R_ERR response for device-to-host non-data FIS
0x0007  2            0  R_ERR response for host-to-device non-data FIS
kpunkt
kpunkt 25.06.2024 um 14:26:54 Uhr
Goto Top
Zitat von @zimbosmurf:

Da wäre es schon seltsam, wenn der USB-Port der Übeltäter wäre. Andererseits ist es auch reichlich seltsam, dass (mindestens!) zwei von drei neuen Platten kaputt sind.

Und die mal schnell an einen anderen PC anschließen ist jetzt keine Option?
kreuzberger
kreuzberger 25.06.2024 um 14:33:27 Uhr
Goto Top
Moin @zimbosmurf

erst dachte ich es wäre die kleinen 5TB Platten von WD, bi denen um mich herum öfters Probleme auftraten. Ich habe auch für Backup 4 stück davon, die laufen aber zuverlässig.

Tip 1: Formatiere sie um auf NTFS, wenn die Situation ExFat nicht unbedingt erforderlich macht.
Tip 2: Steck die Platte mal an einen USB2 Port, um das verhalten zu beobachten. GGf. ist das Zusammenspiel USB 3.0-Treiber und USB-to-S-ATA-Bridge nicht perfekt. Die kleinen USB zu S-ATA Bridge-Platinen (die sind in dem kleinen Gehäuse mit drin) gibt es ja inzwischen wie Sand am Meer, aber nicht alle sind perfekt.
Tip 3: Die 5TB Platten mal an einem Anderen Rechner probeweise mit robocopy ne Weile beschäftigen.

Kreuzberger
zimbosmurf
zimbosmurf 25.06.2024 um 14:41:59 Uhr
Goto Top
Quote from @kpunkt:

Und die mal schnell an einen anderen PC anschließen ist jetzt keine Option?

Die eine Platte habe ich ja schon an einem anderen PC und der Selbsttest brach mit Read-Error ab. Bei der zweiten Platte warte ich gerade am eigentlichen PC drauf, dass eine NTFS-Formatierung (nicht-Quick) beendet wird.
zimbosmurf
zimbosmurf 25.06.2024 um 14:43:53 Uhr
Goto Top
Quote from @kreuzberger:

Moin @zimbosmurf

erst dachte ich es wäre die kleinen 5TB Platten von WD, bi denen um mich herum öfters Probleme auftraten. Ich habe auch für Backup 4 stück davon, die laufen aber zuverlässig.

Tip 1: Formatiere sie um auf NTFS, wenn die Situation ExFat nicht unbedingt erforderlich macht.
Tip 2: Steck die Platte mal an einen USB2 Port, um das verhalten zu beobachten. GGf. ist das Zusammenspiel USB 3.0-Treiber und USB-to-S-ATA-Bridge nicht perfekt. Die kleinen USB zu S-ATA Bridge-Platinen (die sind in dem kleinen Gehäuse mit drin) gibt es ja inzwischen wie Sand am Meer, aber nicht alle sind perfekt.
Tip 3: Die 5TB Platten mal an einem Anderen Rechner probeweise mit robocopy ne Weile beschäftigen.

Kreuzberger

Tip 1 läuft gerade schon, ich mache kein quick-format, damit beim Formatieren ggfs. schon Fehler auffallen.
Tip 2 muss ich mal schauen, ob der Rechner verschiedene USB-Controller bietet.
Tip 3 werde ich als nächstes mal angehen.
niraxx
niraxx 25.06.2024 um 14:44:10 Uhr
Goto Top
Woher bekommen die Platten denn den Strom? Per USB?
zimbosmurf
zimbosmurf 25.06.2024 um 14:53:47 Uhr
Goto Top
Quote from @niraxx:

Woher bekommen die Platten denn den Strom? Per USB?
Ja, es sind 2,5-Zoll-Platten (Beschreibung oben war falsch! Keine 3,5 Zoll!), die über den USB-Port mit Strom versorgt werden.
Ich habe auch schon überlegt, ob das das Problem sein könnte - aber USB3.0 sollte damit eigentlich auch bei so einer großen Platte zurechtkommen...
kpunkt
kpunkt 25.06.2024 um 15:15:04 Uhr
Goto Top
Deutet eher alles auf USB. Schon alleine die ursprüngliche Fehlermeldung.
Kopier den Schmonz mal auf interne Platte oder auch mal auf Freigabe im Netz.

Insgesamt würde ich die Backupstrategie dennoch nochmal durchdenken. Externe USB-Dinger sind halt doch schon mal anfällig. Mittels Backupsiftware (Veeam et al) schickt man die Scherungen auch mal tagsüber in ein entferntes Rechenzentrum oder so.
Dass ein NAS nicht so flexibel sein soll wie ein Windows-10-PC wage ich mal zu bezweifeln. Aber das ist die Entscheidung der Geschäftsleitung.
Man sollte sich als Admin aber immer fragen, wer denn den Kopf hinhalten muss, wenn ein Backup flöten gegangen ist, das man aber unbedingt braucht.
ukulele-7
ukulele-7 25.06.2024 um 15:23:54 Uhr
Goto Top
Also 2,5 portable HDDs sind nicht unbedingt das, was man für so ein Dauerstress-Szenario einsetzen sollte. Ich persönlich benutze die auch für meine privaten *räusper" Sicherheitskopien, und grundsätzlich kann man da natürlich schon in atemberaubender Entschleunigung auch große Datenmengen drauf schieben. Wenn das aber wirklich regelmäßig (vielleicht sogar täglich) passiert finde ich die Technologie unpassend. Laufwerk, Kühlung, Schnittstelle, das kann alles zum Problem werden.

Eventuell kannst du die Platte aus dem Gehäuse bauen und mal unter SATA testen, auch die SMART-Werte da mal auslesen. Manchmal ist das über USB einfach Mist. Auch mal die dritte neue Platte versuchen und vorher und hinterher die SMART-Werte auslesen.

Ansonsten das ganze einem Langzeittest unterziehen, auch an einem ganz anderen PC einfach mal viele Daten drauf schreiben.

Wie gut sind die denn belüftet? Können die heiß laufen?

Ich würde die platten mit einem kurzen Verlängerungskabel anschließen, damit der Port am Controller nicht immer wieder gesteckt und entsteckt wird. So ein Kabel kann man einfach tauschen, so ein Controller eventuell nicht.

Ansonsten wäre vielleicht auch RDX die Technologie der Wahl um das vielleicht etwas robuster zu bauen ohne wirklich viel am Prinzip zu ändern.
MysticFoxDE
MysticFoxDE 25.06.2024 um 22:46:57 Uhr
Goto Top
Moin @zimbosmurf,

Ich habe gerade nochmal einen Test mit einer der neuen Platten aber einer NTFS-formatierten Partition gestartet

👍👍👍

kann mir aber nicht vorstellen, dass das zu einem anderen Ergebnis führt.

Ich schon, weil ExFAT bei weitem nicht so stabil ist wie NTFS. 😉

Gruss Alex
DivideByZero
DivideByZero 25.06.2024 um 23:02:15 Uhr
Goto Top
Moin,

kann es abseits möglicher Defekte sein, dass Du direkt große Datenmengen sicherer und hier SMR HDDs zum Einsatz kommen, die den Schreibvorgang drastisch verlangsamen und für die timeouts beim Überlauf des Caches sorgen?

Gruß

DivideByZero
zimbosmurf
zimbosmurf 26.06.2024 um 09:44:02 Uhr
Goto Top
Quote from @MysticFoxDE:
kann mir aber nicht vorstellen, dass das zu einem anderen Ergebnis führt.

Ich schon, weil ExFAT bei weitem nicht so stabil ist wie NTFS. 😉
Was die Fehlertoleranz angeht ja, natürlich - aber dass schon der Schreibvorgang am Dateisystem scheitert finde ich doch recht unerwartet.


Quote from @DivideByZero:
kann es abseits möglicher Defekte sein, dass Du direkt große Datenmengen sicherer und hier SMR HDDs zum Einsatz kommen, die den Schreibvorgang drastisch verlangsamen und für die timeouts beim Überlauf des Caches sorgen?
Das ist eine gute Idee, ich habe gerade nachgesehen, es handelt sich tatsächlich um eine SMR-HDD, da hatte ich beim Einkauf nicht drauf geachtet.

Im Moment läuft das Backup auf die NTFS-formatierte Platte. Ich bin mal gespannt, wie es läuft.
ukulele-7
ukulele-7 26.06.2024 um 10:00:27 Uhr
Goto Top
2,5 Zoll Platten im eigenen Gehäuse dürften meistens SMR haben, auch wenn das nicht drauf steht. Mal ein schneller Blick auf Seagate, WD und Toshiba in 2,5 Zoll mit externem Gehäuse listet 77 Platten ab 4 TB in denen bei 70 "bestätigt" SMR drin ist. Eventuell ist das also auch bei 77 der Fall...
https://geizhals.de/?cat=hdx&xf=339_2.5%22%7E6_4000%7E762_Seagate%7E ...

Das liegt an der Kapazität + Bauform, und natürlich auch weil sie nicht für Dauereinsatz konzipiert sind. Das heißt zwar nicht, das das nicht funktionieren kann aber könnte daran scheitern.
zimbosmurf
zimbosmurf 26.06.2024 um 11:13:20 Uhr
Goto Top
Quote from @ukulele-7:

2,5 Zoll Platten im eigenen Gehäuse dürften meistens SMR haben, auch wenn das nicht drauf steht. Mal ein schneller Blick auf Seagate, WD und Toshiba in 2,5 Zoll mit externem Gehäuse listet 77 Platten ab 4 TB in denen bei 70 "bestätigt" SMR drin ist. Eventuell ist das also auch bei 77 der Fall...
https://geizhals.de/?cat=hdx&xf=339_2.5%22%7E6_4000%7E762_Seagate%7E ...

Das liegt an der Kapazität + Bauform, und natürlich auch weil sie nicht für Dauereinsatz konzipiert sind. Das heißt zwar nicht, das das nicht funktionieren kann aber könnte daran scheitern.

Es handelt sich gesichert um eine SMR-Festplatte. Aber jetzt kommt's:

Neueste Erkenntnis: Die 4TB-Platten, die wir vorher über Jahre eingesetzt hatten, waren auch SMR - von Western Digital.

Gerade scheint das aktuelle Backup auf die NTFS-formatierte Platte auch wieder in eine Sackgasse zu laufen. Der Explorer wird schon wieder träge, allerdings bis jetzt noch keine Fehler im Logfile.

Nächster Test wird dann ein anderer Port und dann ein anderes Kabel sein...
zimbosmurf
zimbosmurf 27.06.2024 um 09:43:41 Uhr
Goto Top
Neuestes Update: Ich habe das Backup heute morgen wieder abgebrochen, nachdem es nach rund 24 Stunden zwar keine Fehler im Log hatte, aber auch nur etwa ein Viertel der Daten kopiert hatte.

Probiere es gerade mit einem mitgelieferten Originalkabel an einem anderen Port noch einmal.

Morgen bringt der Kollege die diese Woche turnusmässig einzusetzende alte Festplatte mit, damit wir einerseits ein Backup bekommen und andererseits nochmal die Gegenprobe haben.

Vom Gefühl her sind diese neuen Platten aus irgendwelchen Gründen (SMR-Cache-Management?) beim kopieren dieser großen Datenmengen einfach grottenlangsam und Null für diesen Einsatzzweck geeignet. Andererseits frage ich mich, wofür eine 5TB-Festplatte geeignet sein soll, auf die man nicht 1,8TB kontinuierlich schreiben kann...
kreuzberger
kreuzberger 27.06.2024 um 10:19:57 Uhr
Goto Top
@zimbosmurf

Wie gesagt, ich benutze für den selben Zweck vier stück 5TB USB 2.5’ Platten von WD. Die laufen bei mir per robocopy gut. Um mich herum gab es aber Leute, die die selbe platte (War mal bei Mediamarkt im Sonderangebot) damals auch kauften und als defekt zurückgaben.
Laufen die Dinger aber, dann und sie das auch, wa sie sollen.

Bei dir hab ich nach wie vor den verdacht, dass diese USB-Bridge-Platine zu S-ATA das Problem sein könnte, welche mit dem USB-Controller bzw. der USB Treibersoftware nicht perfekt kann.

Darum: Probiere die Platten an anderen Ports, Anderen Rechnern aus, ggf. auch mal an Linux oder Macs, sofern verfügbar.

Kreuzberger
zimbosmurf
zimbosmurf 27.06.2024 um 11:24:25 Uhr
Goto Top
Quote from @kreuzberger:

@zimbosmurf

Wie gesagt, ich benutze für den selben Zweck vier stück 5TB USB 2.5’ Platten von WD. Die laufen bei mir per robocopy gut. Um mich herum gab es aber Leute, die die selbe platte (War mal bei Mediamarkt im Sonderangebot) damals auch kauften und als defekt zurückgaben.
Laufen die Dinger aber, dann und sie das auch, wa sie sollen.

Bei dir hab ich nach wie vor den verdacht, dass diese USB-Bridge-Platine zu S-ATA das Problem sein könnte, welche mit dem USB-Controller bzw. der USB Treibersoftware nicht perfekt kann.

Darum: Probiere die Platten an anderen Ports, Anderen Rechnern aus, ggf. auch mal an Linux oder Macs, sofern verfügbar.

Kreuzberger

Die erste Platte hat den SMART-Selbsttest an einem anderen Rechner mit Lesefehlern abgebrochen. Viel mehr Zeit will ich da jetzt nicht mehr reinstecken, es ist sowieso schon zu viel Zeit gewesen. Wenn der Rechner mit der alten Platte in der Gegenprobe funktioniert, dann gehen die Dinger zurück.
kreuzberger
kreuzberger 27.06.2024 um 11:53:14 Uhr
Goto Top
In der Tat, wen die Platten zu viele Macken haben ist es in Gewährleistungsfall.

dann gehen die Dinger zurück.


Kreuzberger
zimbosmurf
Lösung zimbosmurf 04.07.2024 aktualisiert um 11:51:58 Uhr
Goto Top
Hi und Danke an alle für die Tipps!

Das ganze hat uns jetzt echt eine Menge Zeit gekostet, aber wir sind jetzt durch.
Es kamen tatsächlich mehrere Sachen zusammen.

- eine der Platten hatte tatsächlich ein Problem, den SMART-Report mit den Lesefehlern hatte ich ja schon weiter oben gepostet
- das 2m lange Kabel (USB-A auf USB-3.0-Micro-B), das am Backupserver zum Anschluß der Platte hing und bisher problemlos funktioniert hatte, war wohl auch nicht ideal. Möglicherweise kam es hier zu Problemen mit der Stromversorgung. Möglicherweise (völlig spekulativ) führten diese Probleme sogar letztlich zum Defekt der ersten Platte
- Mit den mitgelieferten Anschlusskabeln und einem neuen längeren Kabel konnte ich auf die anderen beiden Platten mittlerweile insgesamt ca. 30 Stunden problemlos Daten kopieren
- Die defekte Platte wurde ausgetauscht, die neue hat auch einen 10-stündigen Kopiertest Problemlos mitgemacht
- Das neue Kabel hängt auch an einem anderen USB-Port, allerdings am selben Controller. Hier hatte ich jetzt nicht mehr den Nerv, noch eine Gegenprobe zu machen, ob eventuell auch der Port noch ein Problem hat...