linux user group brescia

immagine del castello

Archivio della mailing list

Script per estrarre collegamento da pagina html

giorusconi a libero.it giorusconi a libero.it
Mar 5 Ott 2004 11:19:46 UTC
Il Fri, 1 Oct 2004 15:03:41 +0200
adri <adri a archetti.org> ha scritto:

> 
> ciao a tutti,
> avrei bisogno di un suggerimento.
> ho delle pagine html che contengono dei collegamenti a dei file che ho
> bisogno di scaricare periodicamente.
> praticamente apro delle pagine da un portale di un fornitore che mi
> danno dei collegamenti verso alcuni cataloghi scaricabili...
> la mia idea รจ quella di fare un piccolo script che mi permetta di
> estrarre la url del catalogo, cosi darla poi in pasto a wget per poterne
> scaricare il binario.

IMHO wget con le opzioni giuste fa tutto quello di cui hai bisogno.
Una cosa tipo:

wget -r -l1 -A *.pdf http://www.url.it/links

(supponendo che devi scaricare ricorsivamente per un solo livello, tutti i pdf
i cui collegamenti sono indicati nella pagina http://www.url.it/links).


Ciao,
Gio




Maggiori informazioni sulla lista Lug