linux user group brescia

immagine del castello

Archivio della mailing list

R: Linux crash

Luca Coianiz lcoianux a digitalbrixia.it
Lun 9 Apr 2001 02:21:14 UTC
----- Original Message -----
From: Luca Giuzzi <giuzzi a dmf.bs.unicatt.it>
>>  Fra l'altro non si blocca la macchina al 100%: tutte le console sono
>> bloccate, i vari task sono, presumo freezati (o almeno, cambiamenti sullo
>> schermo non se ne vedono), dato che uso Linux come Internet-gateway mi
>> accorgo che la macchina Win98 non riesce a far passare più un dato che è
>> uno... in compenso riesco benissimo a switchare da una console virtuale
>> all'altra (Alt-F1, F2, ... ed anche Alt-freccia-sx/dx).
> Beh'... due possibilita':
>  1. problema hardware;

 Speriamo di no. In ogni caso esiste qualche test fattibile (ad es. un test
della RAM o altro).

>  2. OOM... che kernel c'e' su?

 Roba vecchia: 2.0.36

>>  Ad ogni modo, tornando a Linux, non c'è più mezzo di re-bootare la
>>macchina (ctrl-alt-canc non viene più preso in considerazione),i
>  morto init...

 M'era venuto in mente... ma non ho idea di chi l'abbia ucciso. :-(

>> se passo ad una vt
>> che mi accetta il login riesco solo ad inserire lo username e poi
>>s'inchioda anche quella. Insomma: devo spegnere la macchina (e lì
>> mi viene un brivido).
>>  Riaccendendo si riavvia tutto, mi forza il controllo del disco e poi
>>tutto parte (con le varie segnalazioni dei daemons che cancellano i
>> loro .pid precedenti) e per un pò tutto gira (a parte la mia fiducia,
>> che se n'è andata).
> Beh... se al primo crash  perdi la fiducia, allora
>  ne avevi proprio pochina in partenza... :)

 No... ma mi viene il dubbio d'averne avuta troppa. :-/
 Non è il primo crash... diciamo che gli altri avevano un certo "senso":
crashava un pezzo del sistema ma Linux rimaneva integro.
 Se poi tieni conto che non ci programmo sopra...

>> (in tty8)
>> Unable to handle kernel paging request at virtual address 401c9428
>> current ->tss.cr3 = 00101000, %cr3 = 00596000
>> *pde = 00011067
>> *pte = 00000000
>> Oops: 0000
>> cpu:    0
>> EIP:    0010:[<00112126>]
>> EFLAGS: 00010202
>> eax: 001c9fa8   ebx: 00586414   ecx: 00585e68   edx: 0000003f
>> esi: 001c91f4   edi: 001c91f4   ebp: 00585e7c   esp: 00585e54
>> ds: 0018   es: 0018   fs: 002b   gs: 002b   ss: 0018
>> process swapper (pid: 0, process nr:1, stackpage=001c6a40)
>> stack: 0000000d 0059bbb0 00000000 ffffffff 001c91f4 0b66be68 001c9fa8
>> ffffffff
>>        00586414 00111e70 00000000 0012e28b 0000000b 00000000 00000000
>> bffff9fc
>>        00000000 0e137000 00000001 0e137000 0012e53e 0000000b 00585f78
>> 00585f38
>> Call Trace: [<00111e70>] [<0012e28d>] [<0012e53e>] [<001263ce>]
[<0010a3e3>]
>> [<0
>> 01181c6>] [<0010a9e1>]
>> Code: ff af 00 03 00 00 39 1d dc 95 1c 00 75 02 0f 06 83 7b 38 00
>> Idle task may not sleep
>> Idle task may not sleep
>> Idle task may not sleep
>>
>> (in tty10)
>> Apr 8 17:04:36 home kernel: Unable to handle kernel paging request at
>> virtual address 401c9428
> OK... kernel oops... fai passare l'output attraverso ksymoops

 Scusa la domanda da spina ma "fai passare l'input attraverso (ecc.)" che
vuol dire ?
 Mi spiego meglio: anche se non c'è una manpage o altro ho capito che
ksymoops si usa come un filtro... è che non so cosa dargli in pasto: quello
che leggo sopra l'ho copiato a mano dallo schermo del pinguino crashato, non
da un file oops.log o altro.
 In /var/log/messages non c'è nulla di tutto ciò e onestamente non so come
"catturare" quello che vedo in tty8.
 Input... more input.

> e prova a
>  postare una versione `decodificata' dei messaggi... servono i dati che
>  hai nel TUO /boot/System.map e in un paio di files in /proc per
>  capire dove c'e' stato il blocco...

 Mmmm... mi sa che c'è qualche problema: come dicevo, lsof rompe le scatole
proprio su /boot/System.map
 Si sistema qualcosa se ricompilo il kernel ?

>  io comunque sospetterei ancora problemi hw...

 No dai... non dirmi questo.  :-(
 ;-)

> [basta fare un cat di quanto hai scritto | ksymoops ]

ulp... allora provo a passare il mex da Win a Linux e poi ti faccio
sapere...

[...five minutes later...]
 Spero ardentemente che TU ci capisca qualcosa: per me è arabo (v. anche
l'allegato)
- - -8<- - - - - -8<- - - - - -8<- - - - - -8<- - - - - -8<- - -
Using `/boot/System.map' to map addresses to symbols.

>>EIP: 112126 <wake_up_interruptible+ca/e8>
Trace: 111e70 <schedule+1b0/28c>
Trace: 12e28d <sys_select+115/260>
Trace: 12e53e <fifo_open+166/340>
Trace: 1263ce <getblk+26e/3bc>
Trace: 10a3e3 <setup_frame+5f/17c>
Trace: 1181c6 <sys_adjtimex+5a/430>
Trace: 10a9e1 <v86_signal_return+25/34>

Code: 112126 <wake_up_interruptible+ca/e8>
Code: 112126 <wake_up_interruptible+ca/e8>  ff af 00 03 00  ljmp
*0x300(%edi)
Code: 11212b <wake_up_interruptible+cf/e8>  00
Code: 11212c <wake_up_interruptible+d0/e8>  39 1d dc 95 1c  cmpl
%ebx,0x1c95dc
Code: 112137 <wake_up_interruptible+db/e8>  00
Code: 112138 <wake_up_interruptible+dc/e8>  75 02           jne    112136
<wake_up_interruptible+da/e8>
Code: 11213a <wake_up_interruptible+de/e8>  0f 06           clts
Code: 11213c <wake_up_interruptible+e0/e8>  83 7b 38 00     cmpl
$0x0,0x38(%ebx)
Code: 112146 <__up+2/18>
- - -8<- - - - - -8<- - - - - -8<- - - - - -8<- - - - - -8<- - -

>>  Pensavo di ricompilare il kernel ma non vorrei che fosse inutile, anche
>>se, da qualche tempo, dando il comando lsof ricevo la segnalazione:
>> lsof: kernel symbol address mismatch: get_options
>>       get_kernel_syms() value is 0x108d1c; /boot/System.map value is
>> 0x108d30.
>>       There are 337 additional mismatches.
>>       /boot/System.map and the booted kernel may not be a matched set.
> Questo e' strano... hai aggiornato il kernel di recente ?

 No.

>>  Ecco il motivo per cui pensavo di ricompilare: così creavo una nuova
>> immagine ed una nuova System.map (giusto ?).
> vediamo...

 Intanto grazie. :-)

        Bye
        Sky
P.S.
 Visto che si parla di kernel... ti va di fare da conduttore al primo
incontro della Moretto su "kernel & dintorni" ?
(teoricamente venerdì 27 c.m.)

-------------- parte successiva --------------
Un allegato non testuale è stato rimosso....
Nome:        oops.out.log
Tipo:        application/octet-stream
Dimensione:  926 bytes
Descrizione: non disponibile
URL:         <http://lugbs.linux.it/pipermail/lug/attachments/20010409/6be6cbc4/attachment.obj>


Maggiori informazioni sulla lista Lug