linux user group brescia

immagine del castello

Archivio della mailing list

[LugBS] estrarre stringhe da files html

Andrea Gelmini andrea.gelmini a gmail.com
Ven 18 Feb 2011 22:59:10 UTC
Il 18 febbraio 2011 21:02, 8557 Livio Remondini <8557 a aruba.it> ha scritto:
> Scaricando il sito, vedo che i dati di ciascun compositore sono in un file
> html per ciascuna persona (circa 1500 files con un nome dato da una
> numerazione progressiva) in un contesto simile

Qui trovi una porcata buttata giu' al volo:
https://github.com/Gelma/SuckCIDM

Se lo lanci a riga di comando scandaglia tutte le pagine e ti estrae
un grosso CSV.

Il codice è rozzissimo, ma dovrebbe permetterti di adattarlo senza conoscere
python.

Ciao,
Gelma




Maggiori informazioni sulla lista Lug