• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Laufend Absturz mit weissem Bildschirm

Hallo,

ich habe Suse 10.1 auf einem AMD64 System (Shuttle ST20G5) am laufen und da laufend Abstürze mit "weissem Bildschirm". Zunächst dachte ich an ein Problem vom Grafiksystem und habe das an anderer Stelle hier mal gepostet:

http://www.linux-club.de/viewtopic.php?t=61300&highlight=

Nun ist mir aufgefallen, dass ich die Abstürze zu 100% provozieren kann wenn ich heftige Festplattenaktivitäten auslöse (z.B. Komprimieren meines ges. home Ordners in ein tar.gz Archiv). Kann das einen Hinweis geben? Mein Festplattencontroller ist ein ULI M5229, ich habe eine Samsung 200GB SATA Festplatte, das zugehörige Modul heisst alim15x3 .

Kennt jemand einen Tipp wie man das löst (update des alim15x3 Treibers??)? Oder lieber SuSE 10.1 komplett neu installieren?
 
Kannst du bei weißem Bildschirm noch auf Konsole 10 (Strg+Alt+F10) umschalten und lesen, ob irgendwelche Kernel-Meldungen kommen ?
 
Nein es geht gar nichts mehr, ich muss jedes mal frisch booten. In /var/log/messages hab ich auch nichts gefunden, das auf den Grund hindeutet.
 
Ist natürlich so ohne Fehlermeldung schwer zu sagen, um was für einen Fehler es sich handelt. Ich würde bevor ich alles neu installiere die Installations-CD/DVD einlegen und eine Reparatur versuchen.
 
Bei "normalem" Gebrauch des Rechners kann man das kaum vorhersagen, bei mir so durchschnittlich alle paar Stunden 1x. Es müssen auch keine spezielle Eingaben (Maus, Tastatur) vorangegangen sein, ich meine aber bemerkt zu haben, dass gleichzeitig ein Festplattenzugriff stattfand.

Beim komprimieren meines home Verzeichnis mir Ark, läuft das zunächst normal los, und nach etwa 1..2 Minuten stürzt dann der Rechner reproduzierbar ab.

Da ich eine onboard Grafik habe (Radeon Xpress200): könnten vielleicht Datenfehler auf dem Bus passieren??
 
Bei Komprimierung? Sofern da grafisch nicht viel passiert (z.B. bei Verwendung
von bzip2) kann ich mir das nicht vorstellen. Passiert das auch, wenn du in der
Konsole bist und "was tust"?
 
Du könntest auch mal testweise lm_sensors (Paket sensors) installieren und die Temperaturen und Lüfterdrehzahlen des Rechners damit überwachen. Sollte das ein Hitzeproblem sein, dann wäre aus den Logs der Verlauf der Temperaturen ersichtlich und es würde klar, wo die Kühlung nicht klappt. Ansonsten fiele mir nur noch ein Memtest ein.
 
@rolle: Thermoproblem glaube ich eher nicht. Ich hab parallel noch WinXP auf dem Rechner und das läuft stabil.

@jengelh: Das werde ich mal ausprobieren. Ich melde mich wieder.

Weitere Ideen?
 
@jengelh: Konsolenfenster geöffnet, maximiert und Komprimierung gestartet. Ich hatte bisher nur 1x einen Absturz, das scheint also seltener vorzukommen. Allerdings hab ich's inzwischen auch mal geschafft, eine Kompression im Konquerer zu starten und erfolgreich zu Ende zu bringen.

Hat noch jemand eine Idee, wie man der Sache auf die Spur kommen könnte?
 
Es gibt noch eine var/log/faillog schau da mal rein.

Oder dursuch einfach mal alle relevanten Logs im /var/log Verzeichnis.
Bei einem Totalabsturz wirst Du auch nichts in der messages finden.

Ansonsten schau mal im BIOS nach, manche Mainboards haben eine eigene Error-Log für defekte Hardware.

Ich hatte das auch schon, die faillog deutete auf einen Speicherfehler und die Log im BIOS bestätigte dies.

Gruß
 
Hast du eventuell Beagle am laufen? Falls ja, dann versuch doch mal, Beagle zu deaktivieren und dann komprimier noch mal irgendwas, am Besten wieder dein Heimatverzeichnis.
 
@schuermann: In /var/log/faillog sind nur Punkte drin, keine Einträge. Auch in den anderen logs finde ich nix was auf den Grund hindeutet.

@buschmann: Beagle lief. Ich habs erstmal abgeschaltet, dann mein homeverzeichnis komprimiert, diesmal OHNE Absturz! Ich beobachte jetzt mal weiter.
 
Update: Die Abstürze sind zwar nicht völlig weg, aber deutlich seltener geworden.

Trotzdem, irgendwas stimmt noch nicht. Neulich ist mir der Rechner beim Starten eines Druckjobs abgeschmiert und dann nochmal beim CD Brennen mit K3b.
 
fanformusik schrieb:
Update: Die Abstürze sind zwar nicht völlig weg, aber deutlich seltener geworden.

kleiner Corsslink:

hab deine Postings auf http://forums.suselinuxsupport.de/index.php?showtopic=36370&mode=threaded&pid=242750 aufgefangen und wollte das ganze auch in ein deutsches Forum stellen :

die Support-Seite von Shuttle is ja nicht die Beste :-(

der BIOS-Downgrade auf ft20s00w hats voll gebracht .. aber dazwischen liegen halt 8 versionen zur aktuellen version , die viele Features des ST20G5 freischaltet .. fixt treiberprobleme im tg3-module ( Netzwerk ) .. und einige ACPI-issues ..

die aktuelle version bringt weiterhin Abstürze obwohl das BIOS-Upgrade genau nach Anweisungen des Shuttle-Supports erfolgt sind

einige andere Postings legen nahe , das es nix mim ati-treiber zu tun hat .. obwohl die Annahme nahe ist , wegen des "white-screens" .. der Rechner bleibt dann komplett hängen .. auf Festplatte bleibt im letzten Arbeitsschritt stecken ( led leuchten durch ) .. und das ganze System ist stumm .. keine systemaktivität mehr .. ausser einem leisen Surren der Festplatte [ vom sound her ähnlich wie kurz nach den einschalten des Geräts oder wenn man ins BIOS wechselt .. ganz leise Festplatteaktivität .. aber wohl eher HD-firmware basierend... ]

Die Meinung einiger nach passiert der crash wenn das System den CPU-Throttling-Multiplier ändert .. oder so :) .. also das Quite'and'Cool feature .. auch sind die Sensoren für den ST20G5 nicht vollständig über den it8712-isa-0290 - treiber abgebildet .. es fehlen 1 von 3 temperaturmessern .. und der Lüfter-sensor der CPU .. im BIOS-Healthmonitor sind diese Bereiche des BIOS zugänglich ..

auch meldungen in /var/log/messages sagen das das Bios nicht komplett ist:
Aug 30 13:39:18 zion kernel: it87-isa 9191-0290: Detected broken BIOS defaults, disabling PWM interface

ich sende bereits tätglich meine Anfragen an SHUTTLE-Support .. und hoffe sie fixen das Problem bald :-o .. ein Bios-Downgrade kann keine Lösung für ein Produkt sein

in Erwartung einer Besserung: cu

-c-
 
Oben