• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

[Problem] Diskless Cluster unter Suse 9.0

Also....
Ich hoffe ich hab das richtige Unterforum gefunden. Wenn nicht bitte verschieben.

In meiner Tätigkeit als Praktikant muss ich einen Diskless Beowulfcluster aufsetzen und irgendwie will das ganze noch nicht so wie ich will.

Kurz zur Hardware:
5 Rechner mit folgender Konfiguration:
- Shuttle AK32VN Board
- 2,2 Ghz Athlon
- 256 MB RAM
- onboard Realtek VT6103 PHY LAN mit Boot-ROM

Einer Der Rechner hat noch CD-ROM und Festplatte mit SuSe 9.0. Die anderen 4 sollen komplett über das Netzwerk Booten (also ohne Diskettenlaufwerk).

Zum aufgesetzten System:
/etc/hosts
Code:
27.0.0.1       localhost

# special IPv6 addresses
fe00::1             localhost ipv6-localhost ipv6-loopback

fe00::0         ipv6-localnet

ff00::0         ipv6-mcastprefix
ff02::1         ipv6-allnodes
ff02::2         ipv6-allrouters
ff02::3         ipv6-allhosts

192.168.0.2     node1.local     node1
192.168.0.1     master.local    master

in der /etc/host.conf wurde "order hosts" und "multi on" aktiviert.

/etc/exports
Code:
/mnt/nfs/       *(rw,no_root_squash)
ich gebe zu, dass ist vielleicht nicht die sicherste Lösung, aber die einfachste ^^

/etc/inetd.conf
"bootps dgram udp wait -s /tftpboot"
ist aktiviert

/etc/bootptab
Code:
.default:\
        :ht=ether:\
        :dn=joof.de:\
        :ds=192.168.0.1:\
        :sm=255.255.255.0:\
        :ns=12.168.0.1:\
        :gw=192.168.0.1:\
        :vm=rfc1048:\
        :hn:to=-18000:
nodelocal:ip=192.168.0.2:ha=00301b2e1986:tc=.default:

/etc/inetd.d/tftp
Code:
service tftp
{
        socket_type     = dgram
        protocol        = udp
        wait            = yes
        user            = root
        server          = /usr/sbin/in.tftpd
        server_args     = -c -s /tftpboot
        disable         = no
        per_source      = 11
        cps             = 100 2
}

/tftpboot ist als verzeichnis angelegt und
"chown root:root /tftpboot" wurde ausgeführt

/tftpboot/pxelinux.cfg/default
Code:
DEFAULT linux root=/dev/nfs nfsroot=192.168.0.1:/mnt/nfs

Die Datei pxelinux.0 liegt in /tftpboot

Nun zum eigendlichen Problem:
Der eingerichtete Knoten findet beim starten den Kernen und bootet ihn.
Dann allerdings kommt folgende Meldungen:
Code:
Looking up port of RPC 100003/2 on 192.168.0.1
RPC: sendmsg returned error 101
Root-NFS: Unable to get nfsd port number from server, using default
RPC: sendmsg returned error 101
mount: RPC call returned error 101
Root-NFS: Server returned error -101 while mounting /mnt/nfs
VFS: Unable to mount root fs via NFS, trying floppy.
VFS: Insert root floppy and press ENTER

Im Systemlog finde ich folgende Einträge wenn ich den Knoten boote:
Code:
Apr 15 11:55:02 master dhcpd: DHCPDISCOVER from 00:30:1b:2e:19:86 via eth0
Apr 15 11:55:02 master dhcpd: DHCPOFFER on 192.168.0.2 to 00:30:1b:2e:19:86 via eth0
Apr 15 11:55:02 master inetd[3970]: getpwnam: -s: No such user
Apr 15 11:55:02 master inetd[1959]: /tftpboot: exit status 1
<<< das wiederholt sich um die 40 mal >>>
Apr 15 11:55:02 master inetd[3970]: getpwnam: -s: No such user
Apr 15 11:55:02 master inetd[1959]: /tftpboot: exit status 1
Apr 15 11:55:02 master inetd[1959]: bootps/udp server failing (looping), service terminated
Apr 15 11:55:04 master dhcpd: DHCPREQUEST for 192.168.0.2 (192.168.0.1) from 00:30:1b:2e:19:86 via eth0
Apr 15 11:55:04 master dhcpd: DHCPACK on 192.168.0.2 to 00:30:1b:2e:19:86 via eth0
Apr 15 09:55:04 master in.tftpd[4226]: tftp: client does not accept options

Nun die alles bedeutende Frage ;) :
Was hab ich falsch gemacht oder noch nicht gemacht?

Ich komme seit 3 Tagen nicht wirklich weiter.

Meine vorschtige Vermutung besteht darin, dass er noch Probleme mit dem NFS-Root Dateisystem hat.
Ein RedHat Rechner den ich mal spaßeshalber angeschlossen habe konnte allerdings auf meinen Master zugreifen.

Ich habe bereits mit Yast eine Rootdiskette erstellt und den Inhalt der Diskette nach /tftpboot/ , /tftpboot/192.168.0.2/ und nach /mnt/nfs/ verschoben.

Im Netz habe ich keine weiteren grossartigen hilfen gefunden und nachdem ich erst mit diesem Projekt mit Linux wirklich befasse (also mehr als Surfen, Chatten und MP3 höhren) kann ich nicht mal Ahnen welche Fehlermeldungen mit was zu tun haben.

Daher auch meine komplette Konfiguration des Systems.

Hoffe auf baldige Antwort

grinning-Joker

PS: mit der Boardsuche hab ich auch nix verwertbares gefunden, aber ich bitte um nachsicht, wenn das Problem schon mal gelöst wurde un d ich zu blöd zum Suchen bin.
 
Oben