lindi200000
Goto Top

Server Platte defekt?

Hi,
ich lesse mich grad bissel durch die message.log einen Suse 11.1 Server Systems.
Da sind mir folgende Werte aufgefallen, deutet das auf ein defekt einer Platte hin?

Jun 10 00:17:54 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 68 to 69
Jun 10 00:17:54 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 32 to 31
Jun 10 16:47:53 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 41 to 40
Jun 10 18:47:53 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 120 to 106
Jun 10 18:47:53 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 40 to 51
Jun 10 19:17:54 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 51 to 47
Jun 10 19:47:54 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 47 to 45
Jun 10 20:17:54 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 45 to 43
Jun 10 21:17:53 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 43 to 41
Jun 10 21:47:53 Server smartd[3736]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 41 to 40

Ist das alles noch normal oder schon gefährlich?

tschüüü lindi

p.s.: So sieht Smart derzeit von der Platte aus. Es ist eine Seagate ST31500341AS.

Server:~ # smartctl -A -d ata /dev/sdb
smartctl 5.39 2008-10-24 22:33 [i686-suse-linux-gnu] (openSUSE RPM)
Copyright (C) 2002-8 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   109   099   006    Pre-fail  Always       -       23369633
  3 Spin_Up_Time            0x0003   100   100   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       21
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       2
  7 Seek_Error_Rate         0x000f   073   060   030    Pre-fail  Always       -       23443154
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       2680
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       21
184 Unknown_Attribute       0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   098   098   000    Old_age   Always       -       2
190 Airflow_Temperature_Cel 0x0022   069   067   045    Old_age   Always       -       31 (Lifetime Min/Max 31/31)
194 Temperature_Celsius     0x0022   031   040   000    Old_age   Always       -       31 (0 21 0 0)
195 Hardware_ECC_Recovered  0x001a   037   028   000    Old_age   Always       -       23369633
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       258376642595448
241 Unknown_Attribute       0x0000   100   253   000    Old_age   Offline      -       1253087564
242 Unknown_Attribute       0x0000   100   253   000    Old_age   Offline      -       3434092170

Content-ID: 117973

Url: https://administrator.de/contentid/117973

Ausgedruckt am: 22.11.2024 um 08:11 Uhr

KHP
KHP 11.06.2009 um 11:14:57 Uhr
Goto Top
Hallo,

sieht gut aus wie ich das sehe. Man muss auf die Pre-fail-Werte schauen. Wie die Werte zu interpretieren sind guck mal da:

http://wiki.ubuntuusers.de/Festplattenstatus?highlight=Pre-fail

Vielleicht hilfts - Gruß, Tobias
lindi200000
lindi200000 11.06.2009 um 11:36:32 Uhr
Goto Top
naja mir machen da die 2 hohen Werte Sorgen

  1 Raw_Read_Error_Rate     0x000f   109   099   006    Pre-fail  Always       -       23369633 
  7 Seek_Error_Rate         0x000f   073   060   030    Pre-fail  Always       -       23443154 
KHP
KHP 11.06.2009 um 12:03:56 Uhr
Goto Top
lies Dir mal den Text ganz unten auf der Seite durch: hohe Werte sind gut!

Bei dem 73er Wert würde ich mal schauen inwieweit der problematisch werden könnte.
it-frosch
it-frosch 11.06.2009 um 12:45:03 Uhr
Goto Top
Hallo,

Zitat von @lindi200000:
naja mir machen da die 2 hohen Werte Sorgen

>   1 Raw_Read_Error_Rate     0x000f   109   099   006    Pre-fail 
> Always       -       23369633 
>   7 Seek_Error_Rate         0x000f   073   060   030    Pre-fail 
> Always       -       23443154 
> 

Dir sollten diese Zeile Gedanken machen!
>  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       2 
> 

Das bedeutet, das die Platte bereits zwei defekte Sektoren hat.

Wenn du eine Seagate Platte hast dann können die beiden hohen Werte normal sein.
siehe http://en.wikipedia.org/wiki/S.M.A.R.T.
Das ganze noch mal abgekürzt auf deutsch: http://de.wikipedia.org/wiki/Self-Monitoring%2C_Analysis_and_Reporting_ ...

Ich würde den Austausch der Platte vorsehen.
lindi200000
lindi200000 11.06.2009 um 12:48:45 Uhr
Goto Top
ok dank euch,
jetzt werde ich ma los düsen und so ne Platte noch organisieren, zum glück läuft das ganze im Raid 1.

Dann wird es morgen wieder ein langer tag face-sad
it-frosch
it-frosch 11.06.2009 um 12:54:32 Uhr
Goto Top
Mach dir nicht zu viel Stress.
Die Platte wird sicherlich noch Wochen oder Monate laufen.
Es ist nur eine Vorsorge Maßnahme.
lindi200000
lindi200000 11.06.2009 um 12:58:28 Uhr
Goto Top
naja da sie im Raid 1 läuft, kann ja nicht so viel passieren.
Aber eine Erstzplatte wird trotzdem geholt. Bei unserem Glück ist genau dann wenn diese Platte ausfällt gerade jene bei allen Händlern ausverkauft ^^.