[LugBS] laboratorio che si impalla!
ollenotna2000
ollenotna2000 a yahoo.it
Ven 19 Mar 2010 08:59:41 UTC
Sono tornato in laboratorio ed iniziato a fare prove
Andrea Gelmini ha scritto:
> Il 12 marzo 2010 10.30, ollenotna2000 <ollenotna2000 a yahoo.it> ha scritto:
>> Ora, come fare a verificare se si tratta di problemi di infrastrutura, di
>> comunicazione di rete, o piuttosto (penso proprio) di sovraccarico del
>> server?
>> Magari come controllare il carico del server nel momento topico (niente gui
>> sul server, quindi qualche indicazione via terminale).
>
> Il problema si puo' dividere in due grossi rami:
> a) il sistema si siede perchè i canali di I/O sono troppo impegnati
> (te ne accorgi perchè, empiricamente, vedi l'hd lavorare come un
> dannato, oppure perchè hai un carico di sistema altissimo, ma senza
> processi che si magnano CPU);
Sto provando con htop.
Ho attualmente 12 studenti al lavoro per lo più con OpenOffice a fare
presentazioni.
E' arrivato un momento di panico (non tanto da resettare per fortuna).
Mi pare si sia avverato il caso a) : sentivo l'hd frullare come un
macinino e htop mi dava la cpu in uso al 100%, senza che la ram fosse
intaccata (è sempre stabile sul 20%) ne' la swap fosse attivata, ne' ci
fossero processi a mangiarsi la cpu (tutti a 0% o al massimo 1%).
Il tutto è durato per qualche decina di secondi, poi la cpu è tornata a
livelli accettabili.
Ogni tanto si ripetono i picchi al 100% e mi sembra corrispondano al
momenti di massimo frullio del disco.
Aggiungo che prima avevo aggiunto alle opzioni di montaggio dello share
nfs le opzioni tcp,ac,soft.
Magari questo potrebbe aver permesso di non arrivare alla situazione
peggiore...
> b) il sistema si siede perchè i processi stanno facendo troppo
> contemporaneamente (sempre da top vedi tutte le istanze di OpenOffice
> che contemporaneamente vanno a 100%);
non è il caso: non ci sono istanze di openoffice sul server, che è solo
un file server
> b1) Per monitorare i primi due punti puoi anche giocare con vmstat,
> che oltre alle statistiche sull'utilizzo della memoria, ti puo'
> tornare anche quelle relative ai dischi;
> c) Per controllare invece se ci sono scazzi di rete, comincia a vedere se dando
> ifconfig scheda-di-rete-del-server
> ti risultano delle collisioni (l'ideale sarebbe che fossero sempre
> a zero), inoltre puoi banalmente tenere aperto un terminale dove far
> costantemente pingare il server, o dal server pingare un client, per
> vedere se nei momenti di picco hai problemi gia' solo a livello di
> ICMP.
>
ifconfig scheda del server: 0 collisioni
ho un client che pinga il server di continuo con 0 packet loss e con
tempi che variano da 0.13 a 1.20 ms.
Sono tempi accettabili a parer vostro?
> Un'ultima cosa: da quando sono apparsi questi problemi?
>
> Non da ultimo darei un occhio nei log e nel dmesg.
> Tieni presente che anche un solo blocco rovinato del disco puo'
> comportare degli ovvi ritardi su tutte le operazioni (l'i/o, in questo
> caso, blocca tutte le operazioni successive).
che cosa dovrei vedere in dmesg e in quali log?
Il server è un vecchio hp netserver di seconda mano.
Trattasi di pentium III 800 mhz con 256 Mb RAM.
Non ho voluto impiegare qualcosa di nuovo perchè pensavo bastasse
utilizzandolo solo come file server (fornisce solo lo share /home, non
gestisce niente altro, ne' autenticazione ne' programmi).
D'altronde in comune, da dove proviene, era il server principale con win
NT...
Il sistema ha due dischi scsi. Nel primo c'è il sistema e nell'altro /home.
Ho in progetto di sostituirli con un IDE più capiente e magari meno
logorato per vedere che effetto che fa.
In effetti il dubbio che mi viene è se il frullio sia dovuto ad un
qualche sovraccarico o da problemi hw del disco.
ciao
Antonello
Maggiori informazioni sulla lista
Lug
|