Problema con nfsd
Luca Giuzzi
giuzzi a lugbs.linux.it
Sab 15 Feb 2003 12:55:58 UTC
On Sat, Feb 15, 2003 at 11:24:47AM +0100, Alfredo Quartini wrote:
>
> Ok,
>
> anche con il kernel 2.4.18-3 ci hanno dei problemi; pero', almeno, non
> si inchioda tutta la macchina come accade con il kernel 2.4.20. Ho
> provato anche a compilare il kernel con il supporto NFS-over-TCP.
> Sapevate che Solaris usa TCP come protocollo di trasporto per NFS ? :
Si'... NFS puo' essere usato sia sotto TCP che sotto UDP (pure sotto
linux, ma non sono sicuro che le patches siano in un kernel 2.4 standard)
> dovrebbe gestire meglio congestioni, perdita di pacchetti (su reti
> packet - lossy ) differenze di velocita'etc etc. Stesso risultato:
Il problema nell'uso di TCP e' che in questo caso si perde la natura
"connectionless" di NFS che e' uno dei suoi punti di forza... chiaro:
nono si puo' avere tutto dalla vita :)
> macchina bloccata la mattina quando arrivo dopo che, di notte, avevo
> lasciato in loop un paio di client che eseguo "bonnie", un paio che
> fanno "ls -lR" ricorsivamente, ed un altro che compila su un filesystem
> montato via nfs.
>
Controlla la RAM... che c'e' nei files di log? In caso estremo: puoi
collegare un altro computer alla macchina che si e' bloccata via
seriale e reindirizzare li' la console?
> Curiosita':
>
> [root a filesrv root]# uname -a
> Linux filesrv 2.4.18-3custom #1 SMP Mon Feb 3 19:33:32 CET 2003 i686 unknown
>
> [root a filesrv root]# mount
> /dev/sda5 on / type ext2 (rw)
> none on /proc type proc (rw)
> usbdevfs on /proc/bus/usb type usbdevfs (rw)
> /dev/sda2 on /boot type ext2 (rw)
> none on /dev/pts type devpts (rw,gid=5,mode=620)
> /dev/sda9 on /home type ext2 (rw)
> none on /dev/shm type tmpfs (rw)
> /dev/sda8 on /tmp type ext2 (rw)
> /dev/sda7 on /usr type ext2 (rw)
> /dev/sda6 on /var type ext2 (rw)
> /dev/sdc1 on /export/software type ext2 (rw)
> /dev/sdd1 on /export/users type ext3 (rw)
> /dev/sde1 on /export/projects type ext3 (rw)
> /dev/sdf1 on /export/scratch type ext3 (rw)
>
> [root a filesrv root]# umount /export/users
> umount: /export/users: device is busy
>
> Qui รจ un po' difficile riusciere a capire perche' e' busy il filesystem
> /export/users. Non e' nemmeno accessibile, non ci si puo' neppure 'ls'.
> Provo a smontarlo "di forza".
prova con fuser su quel filesystem... probabilmente e' bloccato da uno
zombie.
\
> [root a filesrv root]# umount -f /export/users
> umount2: Device or resource busy
> umount: /dev/sdd1: not mounted
> umount: /export/users: Illegal seek
>
umount -f non e' supportato dai kernels 2.4, sorry...
Illegal seek suggerirebbe o problemi a livello di partizione/hd o
problemi di ram... fai una verifica con memtest...
> [root a filesrv root]# cat /etc/mtab
> /dev/sda5 / ext2 rw 0 0
> none /proc proc rw 0 0
> usbdevfs /proc/bus/usb usbdevfs rw 0 0
> /dev/sda2 /boot ext2 rw 0 0
> none /dev/pts devpts rw,gid=5,mode=620 0 0
> /dev/sda9 /home ext2 rw 0 0
> none /dev/shm tmpfs rw 0 0
> /dev/sda8 /tmp ext2 rw 0 0
> /dev/sda7 /usr ext2 rw 0 0
> /dev/sda6 /var ext2 rw 0 0
> /dev/sdc1 /export/software ext2 rw 0 0
> /dev/sdd1 /export/users ext3 rw 0 0
> /dev/sde1 /export/projects ext3 rw 0 0
> /dev/sdf1 /export/scratch ext3 rw 0 0
>
> Almeno si inchiodasse solo il server. quando lui comincia a dare i
> numeri, pure i client Solaris vanno fuori di matto :-)
Normale :((
NFS e' connectionless.. le macchine provano ad accedere al filesystem
e poi si fermano aspettando una risposta (prova a montare gli shares
con l'opzione soft)
ciao,
lg
Maggiori informazioni sulla lista
Lug
|