linux user group brescia

immagine del castello

Archivio della mailing list

Problema con nfsd

Alfredo Quartini quarto a numerica.it
Lun 17 Feb 2003 15:58:04 UTC
Porca p....

ci sono in giro dei messaggi (un po' vecchi a dir la verita') di 
problemi relativi sia alla scheda (con supporto smp), sia a nfs con 
questa scheda, quando nfs รจ messo sotto forte carico.
Se per forte carico si puo' intendere :

*) 4 client (di cui una SunFire E280 con Gigabit eth, che martella alla 
grande) di bonnie++ su nfs
*) un paio di ls -lR ricorsivi in ciclo continuo  su file system nfs  di 
qualche decina di Gb (occupati)
*) un paio di 'find . "*.txt" -exec cat {} \;' sempre sul solito 
filesystem di prima.
*) il filesrv che, tanto per tenerlo occupato un po', compila 
continuamente i sorgenti del kernel

e' un po' difficile capire perche' succede con ext3/nfs e invece (non 
ancora) non succede con ext2/nfs.

I driver che sto usando per la scheda di rete sono gli ultimi 
disponibili dal sito della Intel (dicembre 2002).
Sembra che con il kernel 2.4.20 (rispetto a 2.4.18) sia anche peggio :-)
Adesso sto a vedere cosa succede con la prova che sto eseguendo, che e' 
quella che usa ext2/nfs.
Vedremo....

By the way, e' uscito l'11/2 la versione 1.2 di XFS da Silicon Graphics :-))


Alfredo.


Luca Giuzzi wrote:
> On Mon, Feb 17, 2003 at 12:27:23PM +0100, Alfredo Quartini wrote:
> 
>>Lo so anche io che non c'e bisogno di ricreare il filesystem, ma non mi 
>>costava nulla, ci mette 2 minuti, voglio essere sicuro di avere una 
>>situazione di partenza "pulita" (che ne so che convertire un ext3 ad 
>>ext2  e' 100% affidabile ?  ); insomma, un problema alla volta :-)
>>
> 
> Si'... convertire ext3->ext2 e' affidabile al 100% per il fatto che
> il formato dei dati su disco e' il medesimo e le differenze sorgono
> solo nel modo in cui viene effettuata la scrittura dei dati (e il
> recovery in caso di errore)... d'altro canto se ext3 ha scritto
> delle porcherie, allora ti ritrovi porcherie sotto ext2...
> 
> 
>>La scheda di rete montata sulla macchina e' una Intel e1000 (ce ne sono 
>>due, con due chipset separati, ma ne sto usando solo una), collegata ad 
>>uno switch Gigabit-Eth.
>>
> 
> Mumble... potrebbe essere qui la causa del tutto... mi ricordo di 
> aver letto di "issues" con codesta scheda... prova a fare una
> ricerca con google...
> 
> 
>>Venendo al problema... mi sembra un po ' difficile da risolvere (se 
>>questo e' il problema). Il kernel che sto usando adesso e' 2.4.18-3 
>>(distribuito da redhat 7.3) con SMP attivo; usare un kernel successivo 
>>non serve in quanto mi capitava lo stesso (anzi peggio dato che dopo il 
>>crash non potevo fare piu' nulla) con l'ultima versione rilasciata, la 
>>2.4.20.
> 
> 
> Mah... io seguirei le patches di alan cox... un tentativo (tanto la macchina
> non funziona in questo momento) e' provare a sostituire la scheda con
> una piu' tradizionale 10/100 (suggerisco una 3c950) e vedere se il
> tutto si blocca ancora... in caso contrario non si puo' dire che il
> problema sia causato dai drivers per la intel (potrebbe essere una
> race condition che viene solo esposta dalla scheda) ma quantomeno si
> potrebbe avere un quadro piu' preciso della situazione...
> 
> 
>>Quello che mi sembra strano, e' che anche cercando in rete non riesco a 
>>trovare situazioni di malfunzionamento analoghe a quelle che sto 
>>riscontrando; ormai sono "quasi" sicuro che non si tratti di un problema 
>>hardware, e non saro' mica l'unico sulla faccia della terra che usa, 
>>anzi, vorrebbe usare, un server Linux-NFS per dei client Solaris ?!?
>>
> 
> Mah... io lascerei da parte i client Solaris e penserei a
>  e1000+ext3+nfs
> come motivo...
> 
> ciao,
>  lg
> 





Maggiori informazioni sulla lista Lug