linux user group brescia

immagine del castello

Archivio della mailing list

[LugBS] laboratorio che si impalla!

Andrea Gelmini andrea.gelmini a lugbs.linux.it
Ven 12 Mar 2010 09:50:14 UTC
Il 12 marzo 2010 10.30, ollenotna2000 <ollenotna2000 a yahoo.it> ha scritto:
> Ora, come fare a verificare se si tratta di problemi di infrastrutura, di
> comunicazione di  rete, o piuttosto (penso proprio)  di sovraccarico del
> server?
> Magari come controllare il carico del server nel momento topico (niente gui
> sul server, quindi qualche indicazione via terminale).

Uhm... se il problema è del server dovrebbe essere facilmente individuabile.
Installa htop (che è come top, ma è piu' chiaro).
Lo tieni lanciato in una finestra sul server e vedi cosa ti dice nei
momenti di freeze.

Non solo, appena succede l'evento, puoi tenere d'occhio il carico di
sistema con uptime, leggendo le medie dei carichi.

Il problema si puo' dividere in due grossi rami:
a) il sistema si siede perchè i canali di I/O sono troppo impegnati
(te ne accorgi perchè, empiricamente, vedi l'hd lavorare come un
dannato, oppure perchè hai un carico di sistema altissimo, ma senza
processi che si magnano CPU);
b) il sistema si siede perchè i processi stanno facendo troppo
contemporaneamente (sempre da top vedi tutte le istanze di OpenOffice
che contemporaneamente vanno a 100%);
b1) Per monitorare i primi due punti puoi anche giocare con vmstat,
che oltre alle statistiche sull'utilizzo della memoria, ti puo'
tornare anche quelle relative ai dischi;
c) Per controllare invece se ci sono scazzi di rete, comincia a vedere se dando
    ifconfig scheda-di-rete-del-server
    ti risultano delle collisioni (l'ideale sarebbe che fossero sempre
a zero), inoltre puoi banalmente tenere aperto un terminale dove far
costantemente pingare il server, o dal server pingare un client, per
vedere se nei momenti di picco hai problemi gia' solo a livello di
ICMP.

Un'ultima cosa: da quando sono apparsi questi problemi?

Non da ultimo darei un occhio nei log e nel dmesg.
Tieni presente che anche un solo blocco rovinato del disco puo'
comportare degli ovvi ritardi su tutte le operazioni (l'i/o, in questo
caso, blocca tutte le operazioni successive).

Ciao,
gelma




Maggiori informazioni sulla lista Lug