R: Linux crash
Luca Coianiz
lcoianux a digitalbrixia.it
Lun 9 Apr 2001 02:21:14 UTC
----- Original Message -----
From: Luca Giuzzi <giuzzi a dmf.bs.unicatt.it>
>> Fra l'altro non si blocca la macchina al 100%: tutte le console sono
>> bloccate, i vari task sono, presumo freezati (o almeno, cambiamenti sullo
>> schermo non se ne vedono), dato che uso Linux come Internet-gateway mi
>> accorgo che la macchina Win98 non riesce a far passare più un dato che è
>> uno... in compenso riesco benissimo a switchare da una console virtuale
>> all'altra (Alt-F1, F2, ... ed anche Alt-freccia-sx/dx).
> Beh'... due possibilita':
> 1. problema hardware;
Speriamo di no. In ogni caso esiste qualche test fattibile (ad es. un test
della RAM o altro).
> 2. OOM... che kernel c'e' su?
Roba vecchia: 2.0.36
>> Ad ogni modo, tornando a Linux, non c'è più mezzo di re-bootare la
>>macchina (ctrl-alt-canc non viene più preso in considerazione),i
> morto init...
M'era venuto in mente... ma non ho idea di chi l'abbia ucciso. :-(
>> se passo ad una vt
>> che mi accetta il login riesco solo ad inserire lo username e poi
>>s'inchioda anche quella. Insomma: devo spegnere la macchina (e lì
>> mi viene un brivido).
>> Riaccendendo si riavvia tutto, mi forza il controllo del disco e poi
>>tutto parte (con le varie segnalazioni dei daemons che cancellano i
>> loro .pid precedenti) e per un pò tutto gira (a parte la mia fiducia,
>> che se n'è andata).
> Beh... se al primo crash perdi la fiducia, allora
> ne avevi proprio pochina in partenza... :)
No... ma mi viene il dubbio d'averne avuta troppa. :-/
Non è il primo crash... diciamo che gli altri avevano un certo "senso":
crashava un pezzo del sistema ma Linux rimaneva integro.
Se poi tieni conto che non ci programmo sopra...
>> (in tty8)
>> Unable to handle kernel paging request at virtual address 401c9428
>> current ->tss.cr3 = 00101000, %cr3 = 00596000
>> *pde = 00011067
>> *pte = 00000000
>> Oops: 0000
>> cpu: 0
>> EIP: 0010:[<00112126>]
>> EFLAGS: 00010202
>> eax: 001c9fa8 ebx: 00586414 ecx: 00585e68 edx: 0000003f
>> esi: 001c91f4 edi: 001c91f4 ebp: 00585e7c esp: 00585e54
>> ds: 0018 es: 0018 fs: 002b gs: 002b ss: 0018
>> process swapper (pid: 0, process nr:1, stackpage=001c6a40)
>> stack: 0000000d 0059bbb0 00000000 ffffffff 001c91f4 0b66be68 001c9fa8
>> ffffffff
>> 00586414 00111e70 00000000 0012e28b 0000000b 00000000 00000000
>> bffff9fc
>> 00000000 0e137000 00000001 0e137000 0012e53e 0000000b 00585f78
>> 00585f38
>> Call Trace: [<00111e70>] [<0012e28d>] [<0012e53e>] [<001263ce>]
[<0010a3e3>]
>> [<0
>> 01181c6>] [<0010a9e1>]
>> Code: ff af 00 03 00 00 39 1d dc 95 1c 00 75 02 0f 06 83 7b 38 00
>> Idle task may not sleep
>> Idle task may not sleep
>> Idle task may not sleep
>>
>> (in tty10)
>> Apr 8 17:04:36 home kernel: Unable to handle kernel paging request at
>> virtual address 401c9428
> OK... kernel oops... fai passare l'output attraverso ksymoops
Scusa la domanda da spina ma "fai passare l'input attraverso (ecc.)" che
vuol dire ?
Mi spiego meglio: anche se non c'è una manpage o altro ho capito che
ksymoops si usa come un filtro... è che non so cosa dargli in pasto: quello
che leggo sopra l'ho copiato a mano dallo schermo del pinguino crashato, non
da un file oops.log o altro.
In /var/log/messages non c'è nulla di tutto ciò e onestamente non so come
"catturare" quello che vedo in tty8.
Input... more input.
> e prova a
> postare una versione `decodificata' dei messaggi... servono i dati che
> hai nel TUO /boot/System.map e in un paio di files in /proc per
> capire dove c'e' stato il blocco...
Mmmm... mi sa che c'è qualche problema: come dicevo, lsof rompe le scatole
proprio su /boot/System.map
Si sistema qualcosa se ricompilo il kernel ?
> io comunque sospetterei ancora problemi hw...
No dai... non dirmi questo. :-(
;-)
> [basta fare un cat di quanto hai scritto | ksymoops ]
ulp... allora provo a passare il mex da Win a Linux e poi ti faccio
sapere...
[...five minutes later...]
Spero ardentemente che TU ci capisca qualcosa: per me è arabo (v. anche
l'allegato)
- - -8<- - - - - -8<- - - - - -8<- - - - - -8<- - - - - -8<- - -
Using `/boot/System.map' to map addresses to symbols.
>>EIP: 112126 <wake_up_interruptible+ca/e8>
Trace: 111e70 <schedule+1b0/28c>
Trace: 12e28d <sys_select+115/260>
Trace: 12e53e <fifo_open+166/340>
Trace: 1263ce <getblk+26e/3bc>
Trace: 10a3e3 <setup_frame+5f/17c>
Trace: 1181c6 <sys_adjtimex+5a/430>
Trace: 10a9e1 <v86_signal_return+25/34>
Code: 112126 <wake_up_interruptible+ca/e8>
Code: 112126 <wake_up_interruptible+ca/e8> ff af 00 03 00 ljmp
*0x300(%edi)
Code: 11212b <wake_up_interruptible+cf/e8> 00
Code: 11212c <wake_up_interruptible+d0/e8> 39 1d dc 95 1c cmpl
%ebx,0x1c95dc
Code: 112137 <wake_up_interruptible+db/e8> 00
Code: 112138 <wake_up_interruptible+dc/e8> 75 02 jne 112136
<wake_up_interruptible+da/e8>
Code: 11213a <wake_up_interruptible+de/e8> 0f 06 clts
Code: 11213c <wake_up_interruptible+e0/e8> 83 7b 38 00 cmpl
$0x0,0x38(%ebx)
Code: 112146 <__up+2/18>
- - -8<- - - - - -8<- - - - - -8<- - - - - -8<- - - - - -8<- - -
>> Pensavo di ricompilare il kernel ma non vorrei che fosse inutile, anche
>>se, da qualche tempo, dando il comando lsof ricevo la segnalazione:
>> lsof: kernel symbol address mismatch: get_options
>> get_kernel_syms() value is 0x108d1c; /boot/System.map value is
>> 0x108d30.
>> There are 337 additional mismatches.
>> /boot/System.map and the booted kernel may not be a matched set.
> Questo e' strano... hai aggiornato il kernel di recente ?
No.
>> Ecco il motivo per cui pensavo di ricompilare: così creavo una nuova
>> immagine ed una nuova System.map (giusto ?).
> vediamo...
Intanto grazie. :-)
Bye
Sky
P.S.
Visto che si parla di kernel... ti va di fare da conduttore al primo
incontro della Moretto su "kernel & dintorni" ?
(teoricamente venerdì 27 c.m.)
-------------- parte successiva --------------
Un allegato non testuale è stato rimosso....
Nome: oops.out.log
Tipo: application/octet-stream
Dimensione: 926 bytes
Descrizione: non disponibile
URL: <http://lugbs.linux.it/pipermail/lug/attachments/20010409/6be6cbc4/attachment.obj>
Maggiori informazioni sulla lista
Lug
|