linux user group brescia

immagine del castello

Archivio della mailing list

Recupero sistematico messaggi Newsgroup da Google

andrea gelmini andrea.gelmini a lugbs.linux.it
Sab 30 Mar 2002 13:55:32 UTC
On ven, mar 29, 2002 at 11:52:39 +0100, DisKre Panza wrote:
> 
>    Forse e` solo  un'illusione, ma qualcuno fra voi -  "guru informatici" -
> sa, o potrebbe avere una qualche idea su, come "succhiare" sistematicamente
> tutti i post di un NewsGroup da Google? Diciamo "da data a data".
la cosa non e` troppo complessa, il problema e` l'overhead che ti
troveresti a generare per ricercare con chiavi che ti permettano di
matchare ogni singolo messaggio, controllare i doppioni, e scaricare.

>    In realta` mi  servirebbero tutti i post  dall'inizio dell'esistenza del
> NewsGroup fino ad una certa data.
presumo tu indenda di un newsgroup in particolare, non di tutti...
comunque in genere e` piu` conveniente chiedere direttamente nel ng
interessato se qualcuno non ne abbia via gli archivi (spesso qualcuno li
ha, e sono disponibili via web).

>    Lo chiedo anche per sapere se e` "teoricamente possibile". Non ho voglia
teoricamente si`, anche se per come funzionano i newsgroup non puo` essere
garantito che siano stati storati tutti i post.

> di imbarcarmi in un'impresa "tecnicamente" destinata al fallimento... ma se
> ci fosse anche  solo una speranza, potrei profondere il  mio studio di perl
> (o qualsiasi  altro linguaggio  fosse adatto allo  scopo) per  un obiettivo
> concreto... possibilmente senza scoprire l'acqua calda... ;)
oddio, probabilmente basterebbe anche qualche linguaggio piu` semplice...
il problema sta solo nel valutare quante casistiche/azioni devi risolvere.
se devi parlare via web, controllare univocita` dei mex, storare in qualche
modo/parte che sia comodo, probabilmente ti conviene perl (oddio, anche se
in coscienza ti consiglierei python, dove ragionando a oggetti forse ti
semplifichi un po' la vita (frase assolutamente a spanne proprio perche`
sono da vedere tutta una serie di variabili))

ciao,
andrea



Maggiori informazioni sulla lista Lug