• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Stirbt meine Festplatte ?

Habe eben mal meine Smartwerte ausgelesen.

Die Platte ist eine 500 GB Seagate mit 4 Partitionen: Windows7, Data, Swap und Opensuse 11.3 (ext3).

Bisher gibt es keinerlei Probleme.
Alledings haben mich die Smartwerte doch etwas erschrocken, wobei Reallocated_Sector-Count schon immer auf 12 steht.
Bei den anderen hohen Werten weiß ich jedoch nicht, wie die vorher aussahen.

Code:
linux:/home/test # smartctl -a /dev/sda1
smartctl 5.39.1 2010-01-28 r3054 [i686-pc-linux-gnu] (openSUSE RPM)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.12 family
Device Model:     ST3500410AS
Serial Number:    5VM0W88P
Firmware Version: CC34
User Capacity:    500.107.862.016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Dec 30 12:41:42 2010 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.                                                                                                                                                                  
Total time to complete Offline                                                                                                                                                                                     
data collection:                 ( 600) seconds.                                                                                                                                                                   
Offline data collection                                                                                                                                                                                            
capabilities:                    (0x7b) SMART execute Offline immediate.                                                                                                                                           
                                        Auto Offline data collection on/off support.                                                                                                                               
                                        Suspend Offline collection upon new                                                                                                                                        
                                        command.                                                                                                                                                                   
                                        Offline surface scan supported.                                                                                                                                            
                                        Self-test supported.                                                                                                                                                       
                                        Conveyance Self-test supported.                                                                                                                                            
                                        Selective Self-test supported.                                                                                                                                             
SMART capabilities:            (0x0003) Saves SMART data before entering                                                                                                                                           
                                        power-saving mode.                                                                                                                                                         
                                        Supports SMART auto save timer.                                                                                                                                            
Error logging capability:        (0x01) Error logging supported.                                                                                                                                                   
                                        General Purpose Logging supported.                                                                                                                                         
Short self-test routine                                                                                                                                                                                            
recommended polling time:        (   1) minutes.                                                                                                                                                                   
Extended self-test routine                                                                                                                                                                                         
recommended polling time:        (  92) minutes.                                                                                                                                                                   
Conveyance self-test routine                                                                                                                                                                                       
recommended polling time:        (   2) minutes.                                                                                                                                                                   
SCT capabilities:              (0x103f) SCT Status supported.                                                                                                                                                      
                                        SCT Feature Control supported.                                                                                                                                             
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   119   099   006    Pre-fail  Always       -       215261512
  3 Spin_Up_Time            0x0003   097   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       698
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       12
  7 Seek_Error_Rate         0x000f   075   060   030    Pre-fail  Always       -       30324401
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       1961
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       714
183 Runtime_Bad_Block       0x0000   099   099   000    Old_age   Offline      -       1
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   085   000    Old_age   Always       -       38655296569
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   067   059   045    Old_age   Always       -       33 (Lifetime Min/Max 19/34)
194 Temperature_Celsius     0x0022   033   041   000    Old_age   Always       -       33 (0 16 0 0)
195 Hardware_ECC_Recovered  0x001a   036   020   000    Old_age   Always       -       215261512
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       121749437943630
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       392761876
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       1823643112

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1663         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

linux:/home/test #

Muss ich mir da jetzt ernsthafte Sorgen machen und schnellstmöglich eine neue Platte besorgen?

mojo
 
Hallo mojo,

ich bin in Hardware nicht soo bewandert, mache die Plattentest auch erst seit kurzem und bin mir nicht sicher wie die Ergebnisse zu interpretieren sind. Ich weiss z.B. nicht, ob die Raw_Read_Error_Rate mit defekten Blöcken gleichzusetzen ist.
Deine Raw_Read_Error_Rate ist aber sehr hoch, bei mir beträgt sie nur 5 bei einer 4 Jahre alten Platte.

Wenn der Wert weiter steigt - ein paar Tage beobachten -, würde ich mir eine zweite Platte holen und versuchen die Alte zu klonen. Allerdings weiss ich nicht, ob Windows damit zickt. Das ist vermutlich weniger Aufwand als ein System neu zu installieren wenn die Platte den Geist aufgegeben hat.

Gruß
Georg
 
P6CNAT schrieb:
Wenn der Wert weiter steigt - ein paar Tage beobachten -, würde ich mir eine zweite Platte holen und versuchen die Alte zu klonen. Allerdings weiss ich nicht, ob Windows damit zickt. Das ist vermutlich weniger Aufwand als ein System neu zu installieren wenn die Platte den Geist aufgegeben hat.

Gruß
Georg

Zumindest WinXP zickt damit nicht. Hatte auch mal eine Platte klonen müssen. Das war noch vor Linux-Zeiten. ;)

Leider zeigt bei mir hier das Puppy-tool nicht so viele Einzelheiten an.

Werde das mal auf anderen Systemen testen, wenn ich wieder zu Hause bin.


Edit: Geht doch auch mit Puppy, wenn man smart-support aktiviert. Wie das geht, steht im Link des Beitrages von Heinz-Peter, weiter unten.
 
P6CNAT schrieb:
...nicht sicher wie die Ergebnisse zu interpretieren sind. Ich weiss z.B. nicht, ob die Raw_Read_Error_Rate mit defekten Blöcken gleichzusetzen ist.
Deine Raw_Read_Error_Rate ist aber sehr hoch, bei mir beträgt sie nur 5 bei einer 4 Jahre alten Platte.

Wenn der Wert weiter steigt - ein paar Tage beobachten -, würde ich mir eine zweite Platte holen und versuchen die Alte zu klonen. Allerdings weiss ich nicht, ob Windows damit zickt. Das ist vermutlich weniger Aufwand als ein System neu zu installieren wenn die Platte den Geist aufgegeben hat.

Ich habe leider bisher auch noch nicht verlässlich rausgefunden, wie diese Werte zu interpretieren sind. Ausser, dass bei Seagate-Platten dieser Wert immer sehr, sehr hoch ist.
Und der Wert steigt.

Daher ja auch meine Frage, ob die Platte bereits angeschlagen ist.

Interessanterweise habe ich hier noch eine baugleiche Platte. Und auch da sind die Werte, die hier sehr hoch sind, auch allesamt sehr hoch.

Wer die gleiche Platte im Einsatz hat, könnte ja mal vergleichsweise seine Werte hier posten.

mojo
 
Also ich habe hier eine die schon etwas länger läuft und noch höhere Werte hat ;-) Kannst ja selber vergleichen:

Code:
smartctl 5.39 2009-08-08 r2872~ [x86_64-unknown-linux-gnu] (openSUSE RPM)
Copyright (C) 2002-9 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.10 family
Device Model:     ST3500630AS
Serial Number:    5QG1FV4Y
Firmware Version: 3.AAK
User Capacity:    500.107.862.016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Thu Dec 30 18:15:11 2010 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                 ( 430) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 163) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   115   095   006    Pre-fail  Always       -       240123849
  3 Spin_Up_Time            0x0003   093   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3620
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   085   060   030    Pre-fail  Always       -       355950357
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       9076
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   020    Old_age   Always       -       3621
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   067   057   045    Old_age   Always       -       33 (Lifetime Min/Max 13/33)
194 Temperature_Celsius     0x0022   033   043   000    Old_age   Always       -       33 (0 10 0 0)
195 Hardware_ECC_Recovered  0x001a   063   058   000    Old_age   Always       -       180378638
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 
Systemcrasher schrieb:
Mal 'ne dumme Frage: Womit kann man solche Daten auslesen? Würde mich mal interessieren, wie das so bei mir aussieht....
Hier die Antwort:
http://www.tweakpc.de/forum/tutorials/29413-eine-einfuehrung-in-smart-smartmontools-linux.html
 
Die Raw read error rate bezieht sich auf die Plattenoberfläche und die Schreib- Leseköpfe und der Wert steigt meistens nicht allein, sondern hat gerne noch den Reallocated Sector Count etc. mit im Gepäck.
 
@Heinz-Peter: Danke für den Link.
c014.gif


Ansonsten habe ich noch eine recht informative Tabelle gefunden, die die Relevanz der Daten aufzeigt:

http://www.pcwelt.de/ratgeber/Smart-Tabelle-Die-wichtigsten-Werte-erklaert-Ratgeber-Festplatte-317722.html
 
K4m1K4tz3 schrieb:
Also ich habe hier eine die schon etwas länger läuft und noch höhere Werte hat ;-) Kannst ja selber vergleichen

Danke.
Beruhigt jetzt doch etwas, aber es bleibt trotzdem ein mulmiges Gefühl. Bleibt eigentlich nur, noch öfters Plattenimages zu machen, als ich es ohnehin schon tue.
Aber ich könnte wetten, dass genau dann die Platte ausfallen wird, wenn man gerade kein halbwegs aktuelles Image hat :-| .

Gruß
mojo
 
spoensche schrieb:
Die Raw read error rate bezieht sich auf die Plattenoberfläche und die Schreib- Leseköpfe und der Wert steigt meistens nicht allein, sondern hat gerne noch den Reallocated Sector Count etc. mit im Gepäck.

Der Reallocated Sector Count steht bei dieser Platte von Anfang an auf 12 und ist während der Betriebszeit auch nicht weiter gestiegen. Das wiederum beruhigt etwas. Aber trotzdem sind diese Werte eher verwirrend als informativ aber augenscheinlich bei Seagate-Platten durchaus üblich. Daher auch meine Bitte, dass User mit dieser Platte ihre Werte hier mal posten.

mojo
 
@Systemcrasher
@P6CNAT

Danke für die Links.
Über Tante Google habe ich derartige Tabellen bereit auch gefunden.
Was mich beunruhigt, ist die Angabe dass dieser Wert "ausfallrelevant" sei. Und dann ist genau dieser Wert bei meiner Platte sehr hoch!
Und irgendwo fand ich noch Aussagen, dass dieser Wert bei Seagate-Platten immer sehr hoch sei.
Tja, das hilft mir nun bei der Einschätzung, ob die Platte bald stirbt, leider nicht wirklich weiter.

Bleibt die Frage, warum es sowas wie S.M.A.R.T. gibt, wenn man mit den dort angegebenen Werten seine Platte nicht beurteilen kann :nosmile: .

mojo
 
Für kurze Zeit wurde unter KDE 4 mal eingeführt bei hohen SMART-Werten eine Fehlertext-Box nach dem Starten zu zeigen. Wurde kurz darauf aber wieder abgeschafft, weil sich vorwiegend Seagate-Benutzer darüber beschwerten, dass diese Box ständig auftaucht. So auch bei mir geschehen.

Habe damals etwas gelesen, dass man die Werte nicht so einfach vergleichen kann, da die Hersteller die teilweise anders interpretieren. Wenn ich hier falsch liegen sollte, dann bitte korrigieren.
 
Nein, das stimmt; s.m.a.r.t. ist schon ein sehr nützliches Analyse-tool, aber es versucht Parameter zu vereinheitlichen, die seitens der jeweiligen Hersteller ganz und gar nicht einheitlich sind. Seagate-Modelle fallen schon seit längerem mit sehr hohen error rates in einzelnen Bereichen auf, diese Werte sind mit s.m.a.r.t. nicht vernünftig auszuwerten. Dies sollte man berücksichtigen.

Im Zweifelsfalle überprüft man die Platte mit einem spezifischen tool des Herstellers der Platte (wenn man Glück hat, findet sich ein plattformunabhängiges Programm, z.B. der "Hitachi Drive Fitness Test" [der auch Platten vieler anderer Hersteller unter die Lupe nehmen kann]).
 
Also ich habe jetzt mal 3 Festplatten von mir getestet.

Die erste, eine IBM, über 10 Jahre alt, ist für Ihr Alter noch Top in Schuß.

Die 2. ca. 10 Jahre alt, hat merkwürdigerweise einerseits altersentsprechende Erscheinugnen und ist auf den erste Blick anscheinend ok, weist dann aber beim "Long-selftest" einige Errors auf. Da sollte ich mich wohl mal um Ersatz kümmern...

Die 3. Platte dagegen ist wiederum einwandfrei (fast so alt wie die beiden erstgenannten).
 
Oben