Oh, oh, e' morto il server!!
Luca Giuzzi
giuzzi a tartaglia.dmf.bs.unicatt.it
Mar 6 Mar 2001 16:38:05 UTC
>
> Mi e' morto un server linux. Completamente bloccato, non andava nemmeno il
> led del capslock.
A console non c'era niente? Qualche cosa tipo OOPS o Kernel Panic?
Cosi' sui due piedi e' un po' difficile capire cosa possa essere accaduto...
> Spento (sigh!) e riacceso, si e' lamentato e2fsck, ha trovato un paio di
> inode smarriti ed e' ripartito.
Ti e' andata bene per questo... in che partizione erano i files? /var ...
> Nei log di sistema non ci sono messaggi "strani" (almeno per me): un po' di
> lamenti di named (tipo "dangling CNAME pointer"), qualche tracciamento
> PAM_pwdb e poco altro.
>
Ok... i problemi di named sono dovuti al modo in cui e' configurato...
essenzialmente hai dei CNAMEs senza i relativi record IN, ma forse e'
voluto...
>
> Io ho controllato tutti i log in /var/log. Ho aperto anche i due inode
> recuperati in /lost+found: contengono ciascuno solo un numero di 4
> cifre ed appartengono a due distinti utenti POP (a me da tanto l'idea di
> un PID o qualcosa del genere). Per il resto niente altro di strano. Non ci
> sono core dump sul filesystem.
>
E' bello quando l'analisi e' corretta... si' sono probabilmente i pid del
popd per quegli utenti...
> E' la seconda volta che capita nel giro di un mesetto, e la cosa non mi
> piace per niente, soprattutto perche' non ho la piu' pallida idea del
> perche' succeda :(
>
> Qualcuno ha suggerimenti in merito? Ha senso abilitare una maggior
> quantita' di log, e se si', quali (senza affossare la macchina)? Esistono
> dei tool opensource per fare un controllo HW della macchina? Oltre a
> /var/log c'e' qualche altro file da controllare per cercare di capire cosa
> e' successo?
>
Due opzioni:
1) problema HW, possibilmente la RAM o un surriscaldamento della CPU
2) problema col software installato (memory leaks?)
> La macchina e' un PC "vecchiotto" (pentium MMX 200MHz) , no scsi, kernel
> 2.2.12, fa da gateway verso internet e verso una rete privata remota, fa da
> mailserver, DNS e via samba garantisce l'accesso a un server NT da parte di
> macchine win95 (eh eh eh!) A parte i client POP3 (ed il sottoscritto)
> nessuno si logga sulla macchina. Quando si e' piantata non stava eseguendo
> niente tranne i compiti sopra descritti (almeno che io sappia!!). L'ultima
> variazione di rilievo e' stata l'aggiunta di 32M di ram circa tre mesi fa.
> (??? mah, che siano quelli???) . Per il resto la macchina gira con la
> stessa configurazione da piu' di un anno senza problemi. Proprio non riesco
> a capire perche' sia morta!
>
Il kernel e' un po' datato, ma non dovrebbe essere quello...
distribuzione? E quanta RAM hai?
Per verificare l'integrita' della RAM potresti provare il memtest86:
http://reality.sgi.com/cbrady_denver/memtest86/
Guarda un po' che cosa viene fuori...
Ciao,
lg
Maggiori informazioni sulla lista
Lug
|