Errore di software o guasto hardware?
Marco Prezioso
prezioso a bg.camcom.it
Gio 19 Ott 2006 10:05:25 UTC
Inizio col ringraziare Franco Pasquarelli e Luciano Lucini per i loro
consigli. Per le altre risposte che ho ricevuto e che contenevano
ulteriori domande, rispondo qui di seguito. (spero in modo chiaro)
=======================================================================
Emanuele Olivetti ha scritto:
> Riesci a fare un giro di memtest? Se hai un lettore cd puoi usare una
> ubuntu/knoppix che hanno l'opzione 'memtest' al boot per fare il check
> della ram. Altrimenti procurati quanto serve da www.memtest86.com
> per ottenere l'equivalente su altro supporto.
[MARCO]
Purtroppo il server non è qui in Camera di Commercio ma presso il
nostro fornitore di housing. Le prove con MEMTEST non le possono
fare perché è la macchina su cui sta girando il sito web.
> Le informazioni che hai mandato sono molto poco dettagliate:
> il problema si ripresenta anche negli avvi i successivi? A che
> punto del boot? I filesystem sono integri? ecc. ecc.
[MARCO]
Il problema si è verificato due volte nell'ultimo mese, a distanza
di parecchi giorni dopo il boot. L'integrità del filesystem potrò
farla verificare dopo la sostituzione del server (p.s.: ne avevo fatti
comprare due uguali, ...in caso di guasto...) ;-P
=======================================================================
Enrico Colombini ha scritto:
> Marco Prezioso wrote:
>> camcombg login: Uhhuh. NMI received. Dazed and confused, but trying
>> You probably have a hardware problem with your RAM chips
>> Kernel panic - not syncing: Halting
>
> Comincerei col verificare la RAM con memtest86. C'e' su diversi dischi
> di installazione e mi pare anche sul CD di Knoppix.
> Naturalmente hai gia' fatto il RAM test del BIOS?
[MARCO]
Questa non la sapevo: si può verificare anche la RAM del BIOS?
In che modo? Sempre con MEMTEST su un CD live di diagnostica?
=======================================================================
Andrea Gelmini ha scritto:
> innanzittutto complimenti. per quanto mi è dato di capire dalla mia
> esperienza chi tenta di portare innovazione/novita` all'interno della
> cosa pubblica non solo non viene premiato/appoggiato, ma viene pure
> sbeffeggiato e guardato con sospetto.
[MARCO]
Ti ringrazio. (e ti ringrazierò ancora di più se mi dai del TU: mi
mancano ancora una ventina di anni per andare in pensione...).
Sono parecchi anni che spingo Linux e l'OpenSource in generale (sono
parecchi anni che sono iscritto a questa ML, da cui ho imparato molto).
Nel mio piccolo sono riuscito ad adottare Linux per il sito web
dell'ente e ad avere un PC su di cui ho installato OpenSuse per testare
l'accessibilità del sito.
> dunque, cercare di diagnosticare dall'interno, per di piu` via
> software, l'eventuale problema hardware è compito arduo. cio`
> detto, quanto da lei riportato è un sintono/monito nefasto.
> potrebbe essere la RAM, ma anche un problema di surriscaldamento
> della CPU (a volte basta del banale accumulo di polvere per bloccare
> il riciclo d'aria sul microprocessore). potrebbe iniziare con un
> normale ciclo di controllo: memtest, cpuburn, ecc.
> ma se stiamo parlando di una macchina di produzione non credo valga la
> pena stare a perdere delle giornate per risolvere il tutto (al di la`
> dell'aspetto propedeutico, s'intende). la faccia sostituire.
[MARCO]
Si, è la macchina di produzione. Visto che ha poco più di un anno di
vita, mi affiderò alla garanzia. Più che altro volevo dimostrare ai miei
referenti tecnici che: 1°) E' un guasto hardware; 2°) Con MS/Windows non
è dimostrabile che il guasto non si sarebbe verificato; 3) Non è stato
causato da un'errata installazione del software contenuto nella distro
Fedora Core 3.
> Le lascio il mio numero di telefono: XXX/XXXXXXX, nel caso avesse
> bisogno di chiarimenti piu` specifici.
> Per inciso, non mi interessa venderle nulla, ma mi piace l'idea
> di dare una mano a chi si sbatte in ambienti così ostili.
[MARCO]
Ti ringrazio per la disponibilità! Farò in modo di non abusarne.
> ah! la maledetta camara di commercio... potremmo spendere due
> parole sui vostri server smtp...
>
[MARCO]
Avuto rogne? Con la CCIAA di Bergamo o con quella di Brescia? O è solo
per sparare addosso alla "Croce Rossa" della PA? :-(
A proposito: in che senso "...vostri server smtp?" Se intendi i server
di posta, questi sono gestiti da Infocamere di Padova. ME GH'ENTRE MIA!
-.-.-.-.-.-.-.-.-.-.-.-.-.-.-.-
Ciao e grazie di nuovo a tutti.
Marco P.
-.-.-.-.-.-.-.-.-.-.-.-.-.-.-.-
Marco Prezioso ha scritto:
>
> Gentili iscritti alla lista, vorrei chiedervi gentilmente un consiglio.
>
> Circa un anno fa ho fatto in modo che l'ente pubblico per cui
> lavoro utilizzasse software opensource per il proprio sito web,
> sia per la sua bontà e stabilità che per risparmiare un po'
> di soldini per l'acquisto di licenze software proprietario.
>
> Ora il server ha un problema tecnico di funzionamento (software o
> hardware?) e i miei colleghi informatici mi stanno dando contro per la
> scelta 'infelice' del software. Vorrei però poter dire a "queste
> persone" che è un problema **hardware** e che quindi poteva quindi
> succedere anche sotto MS/WINDOWS!
>
> Il web server in questione ha queste caratteristiche:
>
> DELL PowerEdge 750 SCSI
> - Chipset Intel 7210 server
> - Cache 128MB L2 e 400MHz FSB speed
> - Processore Intel® Pentium® 4 2.8GHz 1MB cache
> - Supporto per singolo processore: Celeron o Pentium 4
> - 1GB DDR SDRAM (2 x 512MB 400MHz DIMMs)
> - Disco fisso 73GB U320 10,000 rpm SCSI
> - Controller SCSI 39160 U160
> - ecc.
>
> Questo è invece l'errore riportato sulla schermata video del monitor:
>
> ================
> Fedora Core release 3 (Heidelberg)
> Kernel 2.6.9-1.667smp on an i686
>
> camcombg login: Uhhuh. NMI received. Dazed and confused, but trying
> You probably have a hardware problem with your RAM chips
> Kernel panic - not syncing: Halting
>
> Badness in smp_call_function at arch/I386/kernel/smp.c:519
> [<021159f2>] smp_call_function+0x51/0xe4
> [<02120374>] release_console_sem+0x75/0xa9
> [<0212028c>] vprintk+0x136/0x14a
> [<02115ac5>] smp_send_stop+0x13/0x1c
> [<0211f998>] panic+0x5c/0xf0
> [<02106db9>] io_check_error+0x0/0x3e
> [<02106f4c>] default_do_mi+0xb5/0xd9
> [<0214f289>] put_user_size+0x29/0x2d
> [<02106fa7>] do_nmi+0x34/0x3d
>
> ================
>
> Ringrazio anticipatamente a chi mi risponderà.
> Cordiali saluti.
Maggiori informazioni sulla lista
Lug
|