linux user group brescia

immagine del castello

Archivio della mailing list

Oh, oh, e' morto il server!!

Luca Giuzzi giuzzi a tartaglia.dmf.bs.unicatt.it
Mar 6 Mar 2001 16:38:05 UTC
> 
> Mi e' morto un server linux. Completamente bloccato, non andava nemmeno il 
> led del capslock.
A console non c'era niente? Qualche cosa tipo OOPS o Kernel Panic?
Cosi' sui due piedi e' un po' difficile capire cosa possa essere accaduto...
> Spento (sigh!) e riacceso, si e' lamentato e2fsck, ha trovato un paio di 
> inode smarriti ed e' ripartito.

Ti e' andata bene per questo... in che partizione erano i files? /var ...

> Nei log di sistema non ci sono messaggi "strani" (almeno per me): un po' di 
> lamenti di named (tipo "dangling CNAME pointer"), qualche tracciamento 
> PAM_pwdb e poco altro.
> 
Ok... i problemi di named sono dovuti al modo in cui e' configurato...
 essenzialmente hai dei CNAMEs senza i relativi record IN, ma forse e'
 voluto...
> 
> Io ho controllato tutti i log in /var/log. Ho aperto anche i due inode 
> recuperati in /lost+found: contengono ciascuno solo un numero di 4 
> cifre  ed appartengono a due distinti utenti POP (a me da tanto l'idea di 
> un PID o qualcosa del genere). Per il resto niente altro di strano. Non ci 
> sono core dump sul filesystem.
> 
E' bello quando l'analisi e' corretta... si' sono probabilmente i pid del
 popd per quegli utenti... 
> E' la seconda volta che capita nel giro di un mesetto, e la cosa non mi 
> piace per niente, soprattutto perche' non ho la piu' pallida idea del 
> perche' succeda :(
>
> Qualcuno ha suggerimenti in merito? Ha senso abilitare una maggior 
> quantita' di log, e se si', quali (senza affossare la macchina)? Esistono 
> dei tool opensource per fare un controllo HW della macchina? Oltre a 
> /var/log c'e' qualche altro file da controllare per cercare di capire cosa 
> e' successo?
> 
Due opzioni:
 1) problema HW, possibilmente la RAM o un surriscaldamento della CPU
 2) problema col software installato (memory leaks?)

> La macchina e' un PC "vecchiotto" (pentium MMX 200MHz) , no scsi, kernel 
> 2.2.12, fa da gateway verso internet e verso una rete privata remota, fa da 
> mailserver, DNS e via samba garantisce l'accesso a un server NT da parte di 
> macchine win95 (eh eh eh!) A parte i client POP3 (ed il sottoscritto) 
> nessuno si logga sulla macchina. Quando si e' piantata non stava eseguendo 
> niente tranne i compiti sopra descritti (almeno che io sappia!!). L'ultima 
> variazione di rilievo e' stata l'aggiunta di 32M di ram circa tre mesi fa. 
> (??? mah, che siano quelli???) .  Per il resto la macchina gira con la 
> stessa configurazione da piu' di un anno senza problemi. Proprio non riesco 
> a capire perche' sia morta!
> 
Il kernel e' un po' datato, ma non dovrebbe essere quello... 
 distribuzione? E quanta RAM hai?

Per verificare l'integrita' della RAM potresti provare il memtest86:
 http://reality.sgi.com/cbrady_denver/memtest86/
Guarda un po' che cosa viene fuori...

Ciao,
 lg
  



Maggiori informazioni sulla lista Lug