linux user group brescia

immagine del castello

Archivio della mailing list

Recupero sistematico messaggi Newsgroup da Google

Nicola Delbono delbono a dsc.it
Sab 30 Mar 2002 15:00:27 UTC
he he
Googole con i file robots.txt ha proprio negato la 
possibilità ai crawler di navigare nel newsgroup..
Proprio una settimana fa.

Tecnicamente puoi farlo, ma non so se google inc. è d'accordo.

Forse e` solo  un'illusione, ma qualcuno fra voi -  "guru informatici" -
>sa, o potrebbe avere una qualche idea su, come "succhiare" sistematicamente
>tutti i post di un NewsGroup da Google? Diciamo "da data a data".
>
>   In realta` mi  servirebbero tutti i post  dall'inizio dell'esistenza del
>NewsGroup fino ad una certa data.
>
>   Stante il fatto di non riuscire  a recuperare lo storico da nessun'altra
>parte (ma se  qualcuno avesse - o  sapesse come recuperare -  lo storico di
>it.arti.scrivere...) ;)
>
>   Lo chiedo anche per sapere se e` "teoricamente possibile". Non ho voglia
>di imbarcarmi in un'impresa "tecnicamente" destinata al fallimento... ma se
>ci fosse anche  solo una speranza, potrei profondere il  mio studio di perl
>(o qualsiasi  altro linguaggio  fosse adatto allo  scopo) per  un obiettivo
>concreto... possibilmente senza scoprire l'acqua calda... ;)
>
>   Grazie.
>   
>-- 
>Power down.




dr. Nicola Delbono
info.key5 a key5.com
Key5 di Delbono Nicola
V. G.M. Rossi, 12
25038 Rovato (Bs)
Tel 39 030 7242266
Fax 39 030 7242266




Maggiori informazioni sulla lista Lug