linux user group brescia

immagine del castello

Archivio della mailing list

[LugBS] laboratorio che si impalla!

ollenotna2000 ollenotna2000 a yahoo.it
Ven 19 Mar 2010 08:59:41 UTC
Sono tornato in laboratorio ed iniziato a fare prove

Andrea Gelmini ha scritto:
> Il 12 marzo 2010 10.30, ollenotna2000 <ollenotna2000 a yahoo.it> ha scritto:
>> Ora, come fare a verificare se si tratta di problemi di infrastrutura, di
>> comunicazione di  rete, o piuttosto (penso proprio)  di sovraccarico del
>> server?
>> Magari come controllare il carico del server nel momento topico (niente gui
>> sul server, quindi qualche indicazione via terminale).
> 
> Il problema si puo' dividere in due grossi rami:
> a) il sistema si siede perchè i canali di I/O sono troppo impegnati
> (te ne accorgi perchè, empiricamente, vedi l'hd lavorare come un
> dannato, oppure perchè hai un carico di sistema altissimo, ma senza
> processi che si magnano CPU);

Sto provando con htop.
Ho attualmente 12 studenti al lavoro per lo più con OpenOffice a fare 
presentazioni.
E' arrivato un momento di panico (non tanto da resettare per fortuna).
Mi pare si sia avverato il caso a) : sentivo l'hd frullare come un 
macinino e htop mi dava la cpu in uso al 100%, senza che la ram fosse 
intaccata (è sempre stabile sul 20%) ne' la swap fosse attivata, ne' ci 
fossero processi a mangiarsi la cpu (tutti a 0% o al massimo 1%).
Il tutto è durato per qualche decina di secondi, poi la cpu è tornata a 
livelli accettabili.
Ogni tanto si ripetono i picchi al 100% e mi sembra corrispondano al 
momenti di massimo frullio del disco.

Aggiungo che prima avevo aggiunto alle opzioni di montaggio dello share 
nfs le opzioni tcp,ac,soft.
Magari questo potrebbe aver permesso di non arrivare alla situazione 
peggiore...

> b) il sistema si siede perchè i processi stanno facendo troppo
> contemporaneamente (sempre da top vedi tutte le istanze di OpenOffice
> che contemporaneamente vanno a 100%);

non è il caso: non ci sono istanze di openoffice sul server, che è solo 
un file server

> b1) Per monitorare i primi due punti puoi anche giocare con vmstat,
> che oltre alle statistiche sull'utilizzo della memoria, ti puo'
> tornare anche quelle relative ai dischi;
> c) Per controllare invece se ci sono scazzi di rete, comincia a vedere se dando
>     ifconfig scheda-di-rete-del-server
>     ti risultano delle collisioni (l'ideale sarebbe che fossero sempre
> a zero), inoltre puoi banalmente tenere aperto un terminale dove far
> costantemente pingare il server, o dal server pingare un client, per
> vedere se nei momenti di picco hai problemi gia' solo a livello di
> ICMP.
> 

ifconfig scheda del server: 0 collisioni
ho un client che pinga il server di continuo con 0 packet loss e con 
tempi che variano da 0.13 a 1.20 ms.
Sono tempi accettabili a parer vostro?

> Un'ultima cosa: da quando sono apparsi questi problemi?
> 
> Non da ultimo darei un occhio nei log e nel dmesg.
> Tieni presente che anche un solo blocco rovinato del disco puo'
> comportare degli ovvi ritardi su tutte le operazioni (l'i/o, in questo
> caso, blocca tutte le operazioni successive).

che cosa dovrei vedere in dmesg e in quali log?

Il server è un vecchio hp netserver di seconda mano.
Trattasi di pentium III 800 mhz con 256 Mb RAM.
Non ho voluto impiegare qualcosa di nuovo perchè pensavo bastasse 
utilizzandolo solo come file server (fornisce solo lo share /home, non 
gestisce niente altro, ne' autenticazione ne' programmi).
D'altronde in comune, da dove proviene, era il server principale con win 
NT...
Il sistema ha due dischi scsi. Nel primo c'è il sistema e nell'altro /home.
Ho in progetto di sostituirli con un IDE più capiente e magari meno 
logorato per vedere che effetto che fa.
In effetti il dubbio che mi viene è se il frullio sia dovuto ad un 
qualche sovraccarico o da problemi hw del disco.

ciao
Antonello






Maggiori informazioni sulla lista Lug