Script per estrarre collegamento da pagina html
giorusconi a libero.it
giorusconi a libero.it
Mar 5 Ott 2004 11:19:46 UTC
Il Fri, 1 Oct 2004 15:03:41 +0200
adri <adri a archetti.org> ha scritto:
>
> ciao a tutti,
> avrei bisogno di un suggerimento.
> ho delle pagine html che contengono dei collegamenti a dei file che ho
> bisogno di scaricare periodicamente.
> praticamente apro delle pagine da un portale di un fornitore che mi
> danno dei collegamenti verso alcuni cataloghi scaricabili...
> la mia idea รจ quella di fare un piccolo script che mi permetta di
> estrarre la url del catalogo, cosi darla poi in pasto a wget per poterne
> scaricare il binario.
IMHO wget con le opzioni giuste fa tutto quello di cui hai bisogno.
Una cosa tipo:
wget -r -l1 -A *.pdf http://www.url.it/links
(supponendo che devi scaricare ricorsivamente per un solo livello, tutti i pdf
i cui collegamenti sono indicati nella pagina http://www.url.it/links).
Ciao,
Gio
Maggiori informazioni sulla lista
Lug
|