linux user group brescia

Gio 17 Maggio 2012 08:36:51 UTC

Ciao ragazzi,
dal basso della mia inferioritÃƒÂ  in materia vi pongo un quesito.

ho un file csv con una badilata di "colonne".
molte di queste "colonne" sono vuote (hanno solo l'intestazione nella prima
riga) e io intendevo filtrarle e ricreare un altro csv senza queste colonne.

visto che il file non ÃƒÂ¨ un excel, e che la cosa sarÃƒÂ  ripetuta per molti
file analoghi, ho optato per fare uno scriptino in bash (eventualmente
valuterÃƒÂ² python se la cosa non si reisce a fare in maniera agile) piuttosto
che usare libreoffice calc.

la mia idea era questa.

siccome so a priori quante sono le colonne:

for i in $(seq 1 n); do
     COUNT=$(cat $FILENAME | sed s/\"//g | awk -F ',' '{print $$i}' | grep
-v "^$" | wc -l)
     if [ $COUNT ! -eq 1 ]
          .......
     fi
done

cat $FILENAME | sed .... | awk -F ',' '{print $col1,$col2,$coln}'

l'idea quindi ÃƒÂ¨:
prendo tutte le colonne del csv, guardo quante entry hanno, se hanno piÃƒÂ¹ di
una entry allora aggiungo il numero della colonna come int
in un array e alla fine faccio un awk -F e printo solo le colonne il cui
numero ÃƒÂ¨ all'interno dell'array.

il problema ÃƒÂ¨.. non ho trovato una guida decente per gestire gli array o le
liste in bash.. qualcuno mi illumina su come fare? :D

grazie in anticipo
Francesco
-------------- parte successiva --------------
Un allegato HTML ÃƒÂ¨ stato rimosso...
URL: <http://lugbs.linux.it/pipermail/lug/attachments/20120517/8d7da320/attachment.html>

linux user group brescia

Archivio della mailing list

[LugBS] domanda ignorante bash scripting