Salü zusammen.
Ich bin neu hier im Forum, wenn auch nicht wirklich neu in der Linux-Welt. Ich hoffe, ich habe das richtige Unterforum getroffen, wenn nicht, sorry, bitte korrigieren.
Ich habe auf einem relativ rege genutzten Server seit einiger Zeit ein seltsames Problem. In unregelmäßigen Abständen tritt ein kompletter Server-freeze auf. Auf Ping reagiert der Server noch, ansonsten keine Reaktion.
Die letzte Meldung im /var/log/messages ist:
Feb 19 14:16:14 nexus2 kernel: [65979.175027] kernel BUG at /usr/src/packages/BUILD/kernel-default-2.6.34.7/linux-2.6.34/mm/slab.c:535!
Feb 19 14:16:14 nexus2 kernel: [65979.175033] invalid opcode: 0000 [#1] SMP
Feb 19 14:16:14 nexus2 kernel: [65979.175038] last sysfs file: /sys/devices/system/cpu/cpu3/cache/index2/shared_cpu_map
Feb 19 14:16:14 nexus2 kernel: [65979.175042] CPU 0
Feb 19 14:16:14 nexus2 kernel: [65979.175044] Modules linked in: fuse cpufreq_conservative cpufreq_userspace cpufreq_powersave powernow_k8 mperf ext4 jbd2 crc16 loop dm_mod sr_mod cdrom edac_core k10temp edac_mce_amd pcspkr sg i2c_nforce2 floppy forcedeth usb_storage shpchp pci_hotplug button ohci_hcd sd_mod ehci_hcd ssb usbcore mmc_core pcmcia pcmcia_core edd fan processor ata_generic pata_amd sata_nv libata aacraid scsi_mod thermal thermal_sys [last unloaded: preloadtrace]
Feb 19 14:16:14 nexus2 kernel: [65979.175091]
Feb 19 14:16:14 nexus2 kernel: [65979.175097] Pid: 77, comm: kswapd0 Not tainted 2.6.34.7-0.7-default #1 S2925/empty
Feb 19 14:16:14 nexus2 kernel: [65979.175101] RIP: 0010:[<ffffffff8111f8d6>] [<ffffffff8111f8d6>] free_block+0x176/0x180
Feb 19 14:16:14 nexus2 kernel: [65979.175114] RSP: 0018:ffff8801250c18e0 EFLAGS: 00010046
Danach ist Zapfenstreich.
Hauptaufgabe des Servers ist Samba mit knapp 1 TB Daten für 80 User.
Das Festplattensubsystem sind ein Adaptec 3405 und ein Adaptec 3805 mit RAID 1 und RAID 5
Das Board ist ein Tyan Serverboard (2865), Prozessor ein Phenom X4 9650, 4GB RAM
Der Kernel ist in keinster Weise gepatched, keine besonderen Module geladen.
Das System wurde vor wenigen Tagen auf OpenSuse 11.3 aktualisiert, das Problem tritt aber seit über einem Monat unregelmäßig (am 19.2. zum vierten Mal) auf.
Bisher trat das Problem auch nie unter Last sondern verblüffenderweise immer Nachts oder am Wochenende auf.
Vielleicht hat jemand einen klugen Tipp für mich?
Liebe Grüße
WD Palmer
Ich bin neu hier im Forum, wenn auch nicht wirklich neu in der Linux-Welt. Ich hoffe, ich habe das richtige Unterforum getroffen, wenn nicht, sorry, bitte korrigieren.
Ich habe auf einem relativ rege genutzten Server seit einiger Zeit ein seltsames Problem. In unregelmäßigen Abständen tritt ein kompletter Server-freeze auf. Auf Ping reagiert der Server noch, ansonsten keine Reaktion.
Die letzte Meldung im /var/log/messages ist:
Feb 19 14:16:14 nexus2 kernel: [65979.175027] kernel BUG at /usr/src/packages/BUILD/kernel-default-2.6.34.7/linux-2.6.34/mm/slab.c:535!
Feb 19 14:16:14 nexus2 kernel: [65979.175033] invalid opcode: 0000 [#1] SMP
Feb 19 14:16:14 nexus2 kernel: [65979.175038] last sysfs file: /sys/devices/system/cpu/cpu3/cache/index2/shared_cpu_map
Feb 19 14:16:14 nexus2 kernel: [65979.175042] CPU 0
Feb 19 14:16:14 nexus2 kernel: [65979.175044] Modules linked in: fuse cpufreq_conservative cpufreq_userspace cpufreq_powersave powernow_k8 mperf ext4 jbd2 crc16 loop dm_mod sr_mod cdrom edac_core k10temp edac_mce_amd pcspkr sg i2c_nforce2 floppy forcedeth usb_storage shpchp pci_hotplug button ohci_hcd sd_mod ehci_hcd ssb usbcore mmc_core pcmcia pcmcia_core edd fan processor ata_generic pata_amd sata_nv libata aacraid scsi_mod thermal thermal_sys [last unloaded: preloadtrace]
Feb 19 14:16:14 nexus2 kernel: [65979.175091]
Feb 19 14:16:14 nexus2 kernel: [65979.175097] Pid: 77, comm: kswapd0 Not tainted 2.6.34.7-0.7-default #1 S2925/empty
Feb 19 14:16:14 nexus2 kernel: [65979.175101] RIP: 0010:[<ffffffff8111f8d6>] [<ffffffff8111f8d6>] free_block+0x176/0x180
Feb 19 14:16:14 nexus2 kernel: [65979.175114] RSP: 0018:ffff8801250c18e0 EFLAGS: 00010046
Danach ist Zapfenstreich.
Hauptaufgabe des Servers ist Samba mit knapp 1 TB Daten für 80 User.
Das Festplattensubsystem sind ein Adaptec 3405 und ein Adaptec 3805 mit RAID 1 und RAID 5
Das Board ist ein Tyan Serverboard (2865), Prozessor ein Phenom X4 9650, 4GB RAM
Der Kernel ist in keinster Weise gepatched, keine besonderen Module geladen.
Das System wurde vor wenigen Tagen auf OpenSuse 11.3 aktualisiert, das Problem tritt aber seit über einem Monat unregelmäßig (am 19.2. zum vierten Mal) auf.
Bisher trat das Problem auch nie unter Last sondern verblüffenderweise immer Nachts oder am Wochenende auf.
Vielleicht hat jemand einen klugen Tipp für mich?
Liebe Grüße
WD Palmer