• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Kernel-Panic häufen sich seit Update auf 11.4

Tja, das Installationsmedium habe ich geprüft, alles ok.
Zu den besagten Leuten gehöre ich nicht. Der Rechner ist nur ca. 2 Jahre alt und "zocken" tue ich nur ganz selten.
Ich glaube, es ist ein Hardwarefehler. Da ich alles Komponenten geprüft habe, bleibt nur das Mainboard mit Speicher und Prozessor.
Was ist ein DMI-Code?
Im Bios habe ich nichts verstellt, bis auf die Bootreihenfolge. Habe auch schon mal die Standardeinstellungen geladen, nichts.
Nein, ich habe zwar mal geflasht, das ist aber schon lange her.
Mit der Energiezelle meinst du die Batterie? Hmm, wenn die leer wäre, müsste ja auch die Uhrzeit jedesmal anders sein, oder nicht?

Naja, momentan habe ich wieder eine uptime von 6,5 Stunden! Jetzt reicht es aber für heute. Mal sehen, was der Rechner morgen macht.
Danke für deine Hilfe!
Grüße
Darkwall
 
DMI = Desktop Management Interface
Ein Kernelfehler ist es nicht. Du hättest sonst eine Stack-Trace Ausgabe im Logfile. So oft, wie die Partitionen remounted worden sind, liegt es an der Festplatte. Das sieht man auch an der Meldung, dass das SMART Kommando fehlgeschlagen ist. Bau die alte Platte mal aus und verwende eine andere. Tritt das Problem dann immer noch auf?

Überprüfe die Platte mal mit den Diagnose Tools des Herstellers.
 
Hi spoensche,

Danke für deine Antwort!
Das häufige Mounten liegt wahrscheinlich an den häufigen Reboots wegen dem Einfrieren.
Seit gestern habe ich ja die neue Platte eingebaut, bisher läuft alles stabil. Aber dies dachte ich auch vorher schon, deshalb bin ich noch etwas skeptisch.
Wünsche noch einen schönen 1. Mai!

Viele Grüße
Darkwall
 
Darkwall schrieb:
Hi spoensche,

Danke für deine Antwort!
Das häufige Mounten liegt wahrscheinlich an den häufigen Reboots wegen dem Einfrieren.
Seit gestern habe ich ja die neue Platte eingebaut, bisher läuft alles stabil. Aber dies dachte ich auch vorher schon, deshalb bin ich noch etwas skeptisch.

Kein Grund zur Skepsis. Die alte Platte hat einen Schaden bzw. ist kurz vor ganz defekt.
 
Zum einen ist mir
Code:
Apr 29 14:38:12 chris kernel: [ 1513.824070] ata5.00: failed command: SMART

nur bei Platten aufgefallen, die nicht mehr lange gehalten haben und zum anderen die 20 minütigen Remounts, die definitiv nicht normal sind und die häufigen Systemfreezer.

Ich habe aber auch gesagt, dass man die Platte zur Sicherheit mit den Diagnosetools des Herstellers testen sollte.

http://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology

EDIT:

Häng die Platte mal einen anderen SATA Port. Tritt das Problem dann auch auf?
 
Danke für die Hinweise!
Das mit dem anderen Port teste ich morgen Abend mal und ein neues Kabel kaufe ich auch mal.

Noch eine Sache, die mir einfällt: Ich hatte mal zwei von den 5 Partitionen auf dieser Platte von ext3 nach ext4 konvertiert (mit tunefs usw.). Kann es damit zusammenhängen oder ist das kein Problem?

Grüße
Darkwall
 
Hallo Darkwall,

Darkwall schrieb:
Noch eine Sache, die mir einfällt: Ich hatte mal zwei von den 5 Partitionen auf dieser Platte von ext3 nach ext4 konvertiert (mit tunefs usw.). Kann es damit zusammenhängen oder ist das kein Problem?
Wenn Du das "richtig" gemacht hast ist es kein Problem. Zum Beispiel, ist es wichtig dass nach dem "tune2fs" ein "fsck" gemacht wird weil "tune2fs" die Disk Parameter verändert.

Könntest ja mal jetzt ein "fsck" ausführen:

Code:
# shutdown -h -F now
Gruss,
Roland
 
Hi Roland,
hab ich so gemacht. Das fsck führe ich nachher mal aus.
Habe jetzt erstmal das SATA-Kabel getauscht und einen anderen Port verwendet. Mal sehen...
Grüße und Dank
Darkwall
 
Schade, am Kabel kanns auch nicht liegen. Auch mit neuem Kabel an anderem Port auch wieder eingefrohren.
fsck brachte auch keine negativen Ergebnisse. :-(

Hier mal die Ausgabe von smartctl der neuen Platte. Sieht für mich alles gut aus, oder?
Code:
smartctl 5.40 2010-10-16 r3189 [x86_64-unknown-linux-gnu] (SUSE RPM)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST3500514NS
Serial Number:    9WJ16HRR
Firmware Version: SN12
User Capacity:    500.107.862.016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Tue May  3 18:34:12 2011 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                 ( 625) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        (  84) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x10bd) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   082   066   044    Pre-fail  Always       -       184278417
  3 Spin_Up_Time            0x0003   097   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       9
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       838160
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       21
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       12
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   071   068   045    Old_age   Always       -       29 (Min/Max 29/30)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       2
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       12
194 Temperature_Celsius     0x0022   029   040   000    Old_age   Always       -       29 (0 20 0 0)
195 Hardware_ECC_Recovered  0x001a   045   039   000    Old_age   Always       -       184278417
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 
Darkwall schrieb:
Memtest ... durchgeführt, Problem bleibt
Hast Du memtest mehrere Stunden laufen lassen?

Darkwall schrieb:
Sieht für mich alles gut aus, oder?
Code:
  1 Raw_Read_Error_Rate     0x000f   082   066   044    Pre-fail  Always       -       184278417
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       838160
195 Hardware_ECC_Recovered  0x001a   045   039   000    Old_age   Always       -       184278417
Bei Seagate-Festplatten sollen diese hohen Werte ja normal sein.
 
Verwende mal ein DVD- Laufwerk an dem Port, wo die Platte hängt, schließ die Platte nicht an und boote von einer Live-CD. Treten ähnliche Symptome oder gleiche Symptome auf?
 
Der memtest hat (leider) keine Fehler ergeben. Habe ihn über Nacht also ca. 10 Stunden laufen lassen.
Was mir gerade aufgefallen ist, ist in der Datei /var/log/messages:
Code:
messages:May  4 17:56:55 .... smartd[10035]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 115 to 119
sdb ist meine zweite Platte, auf der nur Win7 installiert ist und die unter Linux überhaupt nicht gemountet wird. 119 Grad ist aber schon ein bisschen warm, oder?!

Hier mal die Daten dieser Platte:
Code:
=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Black family
Device Model:     WDC WD5001AALS-00E3A0
Serial Number:    WD-WCATR4976716
Firmware Version: 05.01D05
User Capacity:    500.107.862.016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Wed May  4 18:00:55 2011 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                 (9960) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 118) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x3037) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   177   174   021    Pre-fail  Always       -       4150
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       127
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       313
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       122
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       33
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       93
194 Temperature_Celsius     0x0022   119   112   000    Old_age   Always       -       28
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Interrupted (host reset)      90%       219         -
# 2  Short offline       Completed without error       00%       152         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 
Hi Darkwall,
siehe Dir mal die Verbindung der Satakabel in die Buchsen auf dem Mainboard an.
Bei den Steckern gibt es wenigstens zwei Bauformen.
Eine einfache, lediglich aus Kunststoff und eine etwas sicherere, welche durch einen federnden Metallklipp sicher in der Buchse einrastet.
Der Stecker mit dem Federklipp verformt bei einigen Hauptplatinen die jeweils paarweise übereinanderliegenden SATA-Ports in der Weise, dass einer nicht mehr richtig kontaktierte.

Gruß Ganymed
 
Ok, mache ich gleich. Ich habe ein Kabel mit Metallklipp und eines ohne.
Aber das mit der Temperatur ist nicht normal, oder?
 
Aber was bedeuten dann die Zahlen 115 und 119? Ich dachte, das wäre eine Temperaturmeldung des smartd?
Code:
SMART Usage Attribute: 194 Temperature_Celsius changed from 115 to 119
 
Oben