• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Mehrere USB HDD's steigen öffters aus

Ich setzte an einem Gerät mehrere USB HDD's ein (4 Stück), und habe das Problem, wenn größere Datenmengen hin und her kopiert (z.B. mit rsync) werden oder ich über NFS darauf zugreife, das irgendwann hängen im Schacht ist.

Da es mal die eine und mal die andere HDD ist und ich ich si auch alle mehr fach überprüft habe, schließe ich eine Hardware defekt der Festplatten aus.

Angaben zum System:
SLES 11 (mit bis Stand heute allen update)
Maxdata Notebook mit 4 USB Ports (da ich es nicht überforden wollte, haben alle HDD's eine eigene Stromversorgung)

Fehlermeldung
Code:
server-nb:~ # ls -l /wdtv/media02
ls: lese Verzeichnis /wdtv/media02: Eingabe-/Ausgabefehler
insgesamt 0

Das Problem ist dur erneutes mounten nicht zu beheben, sonder ich muss das USB Gerät ausschalten und wieder neu einschalten.

/var/log/messages
Code:
May 18 20:07:00 server-nb kernel: usb 1-3: USB disconnect, address 73
May 18 20:07:00 server-nb kernel: usb 1-3: new high speed USB device using ehci_hcd and address 74
May 18 20:07:00 server-nb kernel: hub 1-0:1.0: unable to enumerate USB device on port 3
May 18 20:07:01 server-nb kernel: usb 3-1: new full speed USB device using uhci_hcd and address 32
May 18 20:07:01 server-nb kernel: usb 3-1: not running at top speed; connect to a high speed hub
May 18 20:07:01 server-nb kernel: usb 3-1: configuration #1 chosen from 1 choice
May 18 20:07:01 server-nb kernel: scsi34 : SCSI emulation for USB Mass Storage devices
May 18 20:07:01 server-nb kernel: usb 3-1: New USB device found, idVendor=13fd, idProduct=1340
May 18 20:07:01 server-nb kernel: usb 3-1: New USB device strings: Mfr=1, Product=2, SerialNumber=3
May 18 20:07:01 server-nb kernel: usb 3-1: Product: WD1001FALS-00J7B
May 18 20:07:01 server-nb kernel: usb 3-1: Manufacturer: WDC     
May 18 20:07:01 server-nb kernel: usb 3-1: SerialNumber: WD-WMATV1039958         
May 18 20:07:01 server-nb kernel: usb-storage: device found at 32
May 18 20:07:01 server-nb kernel: usb-storage: waiting for device to settle before scanning
May 18 20:07:02 server-nb kernel: scsi 34:0:0:0: Direct-Access     WDC      WD1001FALS-00J7B 1.04 PQ: 0 ANSI: 4
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] 1953525168 512-byte hardware sectors: (1000GB/931GiB)
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] Write Protect is off
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] Mode Sense: 21 00 00 00
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] Assuming drive cache: write through
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] 1953525168 512-byte hardware sectors: (1000GB/931GiB)
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] Write Protect is off
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] Mode Sense: 21 00 00 00
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] Assuming drive cache: write through
May 18 20:07:02 server-nb kernel:  sdb: sdb1
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: [sdb] Attached SCSI disk
May 18 20:07:02 server-nb kernel: sd 34:0:0:0: Attached scsi generic sg5 type 0
May 18 20:07:02 server-nb kernel: usb-storage: device scan complete
May 18 20:07:30 server-nb kernel: kjournald starting.  Commit interval 5 seconds
May 18 20:07:30 server-nb kernel: EXT3 FS on sdb1, internal journal
May 18 20:07:30 server-nb kernel: EXT3-fs: recovery complete.
May 18 20:07:30 server-nb kernel: EXT3-fs: mounted filesystem with ordered data mode.
May 18 20:20:23 server-nb kernel: sd 34:0:0:0: [sdb] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK,SUGGEST_OK
May 18 20:20:23 server-nb kernel: end_request: I/O error, dev sdb, sector 308313
May 18 20:20:23 server-nb kernel: sd 34:0:0:0: [sdb] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK,SUGGEST_OK
May 18 20:20:23 server-nb kernel: end_request: I/O error, dev sdb, sector 308553
May 18 20:20:23 server-nb kernel: sd 34:0:0:0: [sdb] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK,SUGGEST_OK
May 18 20:20:23 server-nb kernel: end_request: I/O error, dev sdb, sector 308569
May 18 20:20:23 server-nb kernel: sd 34:0:0:0: [sdb] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK,SUGGEST_OK
May 18 20:20:23 server-nb kernel: end_request: I/O error, dev sdb, sector 308809
May 18 20:20:23 server-nb kernel: sd 34:0:0:0: [sdb] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK,SUGGEST_OK
May 18 20:20:23 server-nb kernel: end_request: I/O error, dev sdb, sector 308313
Code:
May 18 20:20:33 server-nb kernel: sd 34:0:0:0: [sdb] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK,SUGGEST_OK
May 18 20:20:33 server-nb kernel: end_request: I/O error, dev sdb, sector 331721
May 18 20:20:33 server-nb kernel: usb 1-3: configuration #1 chosen from 1 choice
May 18 20:20:33 server-nb kernel: scsi35 : SCSI emulation for USB Mass Storage devices
May 18 20:20:33 server-nb kernel: usb 1-3: New USB device found, idVendor=13fd, idProduct=1340
May 18 20:20:33 server-nb kernel: usb 1-3: New USB device strings: Mfr=1, Product=2, SerialNumber=3
May 18 20:20:33 server-nb kernel: usb 1-3: Product: WD1001FALS-00J7B
May 18 20:20:33 server-nb kernel: usb 1-3: Manufacturer: WDC     
May 18 20:20:33 server-nb kernel: usb 1-3: SerialNumber: WD-WMATV1039958         
May 18 20:20:33 server-nb kernel: usb 3-1: USB disconnect, address 32
May 18 20:20:33 server-nb kernel: usb-storage: device found at 75
May 18 20:20:34 server-nb kernel: usb-storage: waiting for device to settle before scanning
May 18 20:20:34 server-nb kernel: end_request: I/O error, dev sdb, sector 976245169
May 18 20:20:34 server-nb kernel: Buffer I/O error on device sdb1, logical block 122028638
May 18 20:20:34 server-nb kernel: lost page write due to I/O error on sdb1
May 18 20:20:34 server-nb kernel: Aborting journal on device sdb1.
May 18 20:20:34 server-nb kernel: journal commit I/O error
May 18 20:20:34 server-nb kernel: ext3_abort called.
May 18 20:20:34 server-nb kernel: EXT3-fs error (device sdb1): ext3_journal_start_sb: Detected aborted journal
May 18 20:20:34 server-nb kernel: Remounting filesystem read-only
May 18 20:20:34 server-nb kernel: scsi 35:0:0:0: Direct-Access     WDC      WD1001FALS-00J7B 1.04 PQ: 0 ANSI: 4
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] 268435455 512-byte hardware sectors: (137GB/127GiB)
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] Write Protect is off
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] Mode Sense: 21 00 00 00
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] Assuming drive cache: write through
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] 268435455 512-byte hardware sectors: (137GB/127GiB)
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] Write Protect is off
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] Mode Sense: 21 00 00 00
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] Assuming drive cache: write through
May 18 20:20:34 server-nb kernel:  sdg: sdg1
May 18 20:20:34 server-nb kernel: sdg: p1 size 1953487935 limited to end of disk
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: [sdg] Attached SCSI disk
May 18 20:20:34 server-nb kernel: sd 35:0:0:0: Attached scsi generic sg5 type 0
May 18 20:20:34 server-nb kernel: usb-storage: device scan complete
May 18 20:20:34 server-nb kernel: EXT3-fs error (device sdb1): ext3_find_entry: reading directory #2 offset 0
May 18 20:20:34 server-nb kernel: EXT3-fs error (device sdb1): ext3_find_entry: reading directory #2 offset 0
May 18 20:20:37 server-nb kernel: EXT3-fs error (device sdb1): ext3_find_entry: reading directory #2 offset 0
/var/log/messages lines 10724-10783/10915 98%

Vielleicht hat jemand einen Rat für mich

PS: Unter openSUSE 10.2 hatte ich das gleichen Verhalten, deshalb die Neuinstallation des SLES mit der Hoffnung auf Besserung.
 
A

Anonymous

Gast
gyrosteller schrieb:
Vielleicht hat jemand einen Rat für mich
sieht ganz böse aus, der Fehler wird im SCSI-Protokoll am Kontroller registriert, was es genau für Fehler sind und warum sie entstehen, kann man so noch nicht erkennen.

Nachdem dann auch noch
Code:
May 18 20:20:34 server-nb kernel: lost page write due to I/O error on sdb1
May 18 20:20:34 server-nb kernel: Aborting journal on device sdb1.
May 18 20:20:34 server-nb kernel: journal commit I/O error
May 18 20:20:34 server-nb kernel: ext3_abort called.
May 18 20:20:34 server-nb kernel: EXT3-fs error (device sdb1): ext3_journal_start_sb: Detected aborted journal
May 18 20:20:34 server-nb kernel: Remounting filesystem read-only
gelaufen ist, ist definitiv dann auch absolut Feierabend. Nach diesem Fehler hilft nicht mal ein "mount -o remount ...." mehr, auch ein neuscannen des Devices oder ein Device- Busreset- oder Kontrollerreset wird hier nicht viel weiterhelfen, das Teil muss erstmal komplett vom USB-Kanal und dann wieder neu angehängt werden.

Suchen würde ich im Netz wahrscheinlich nach allem möglichen USB Fehlern und deinem Laptop oder Motherboard als Reverenz. Genausogut kann dieser Fehler aber auch von falschen oder defekten Kabeln oder von einem eventuell angeschlossenen USB-Hub herkommen. Kann alles mögliche sein.

Zwar ist es möglich hier das SCSI-Logging anzuschalten um den Fehler einzukreisen ;) aber "SCSI" kann hier im Forum wohl nur die aller wenigsten einigermaßen fließend verstehen und noch viel weniger diralektfrei sprechen. ;) und hier können durchaus je nach Logging-Einstellung ein paar MB in der Minute an Logs entstehen. :schockiert: Wenn der Fehler dann nicht auf Anhieb zu reproduzieren ist, sondern sporatisch auftritt, wirds recht unpraktisch.

Hier trotzdem mal ein paar Infos dazu, auch wenn dir das definitiv niemand hier auswerten wird:
Hilfe zu den Loggingleveleinstellungen findest du im Kernelquelltext in der Datei drivers/scsi/scsi-logging.h

Ein recht umfangreiches und geschwätziges Logging einschalten ginge dann zB mit
Code:
echo 9216 > /sys/module/scsi_mod/parameters/scsi_logging_level
Ausschalten mit
Code:
echo 0 > /sys/module/scsi_mod/parameters/scsi_logging_level
Kannst du gerne mal für ein 2 Minuten einschalten während du auf die Platte zugreifst, und dir dann die Datenflut mal in der /var/log/messages anschauen. Aber wenn du niemanden hast, der dir das auswerten kann, bringt es dir eh nichts. Hilft wohl nur Suche nach Leidensgenossen und Lösungsansätzen im Netz.

robi
 
Oben