linux user group brescia

immagine del castello

Archivio della mailing list

Trattamento testo

Luca Giuzzi giuzzi a lugbs.linux.it
Ven 11 Lug 2003 15:24:31 UTC
On Fri, Jul 11, 2003 at 09:25:18AM +0200, Vernia Damiano wrote:
> 
> 	Ciao, in numerosi casi dovrei trasformare dei file di testo in
> file binari per poterli dare in pasto piu' facilmente ai miei programmi C.

??? Cosa vuoi dire ???
di solito si vuole fare il contrario: trasformare files binari in 
testo (formattato) per poterlo meglio processare...
usare files binari e' una brutta cosa(tm)

> Il trattamento dovrebbe limitarsi a qualcosa del tipo
> ordinamento/eliminazione/inserzione/controllo_consistenza.

Di cosa? 
Sicuro che non ti serva un database?

> 	Se non ricordo male awk e' un linguaggio interpretato (tanto per
> questa fase non ho assolutamente bisogno di velocita') pensato apposta per
> questo lavoro. Mi sbaglio?

Senti... il discorso velocita' di esecuzione ha poco senso quando si parla
di selezione del linguaggio per lo sviluppo di software.
Controlla che gli algoritmi siano giusti e siano
ben congeniati... possibilmente prevedi la possibilita' di parallelizzare
le operazioni (in locale con threads, o su rete via mpi/pvm) ... poi
l'overhead consistente nell'utilizzare un linguaggio interpretato e'
praticamente nullo su moli di dati consistenti [anche perche' solitamente
i linguaggi interpretati di questo tipo compilano le espressioni prima
 di eseguirle... questo e' quanto fa' perl, in particolare, ma non solo]

> 	E se non mi sbaglio mi sapreste indicare in rete (o anche
> cartacea, forse qui in biblioteca c'e') qualche risorsa che spieghi in
> modo semplice questo linguaggio?

info gawk

Personalmente suggerirei il perl se devi fare anche dell'i/o binario, ma
ripeto e ribadisco che non penso sia una buona idea.

P.S.
 L'idea di salvare a dei checkpoints per poter riprendere il calcolo in
 caso di blocco della macchina e' buona... pero' nulla vieta di fare tali
 dump in un formato leggibile (ed editabile) da un umano.


lg



Maggiori informazioni sulla lista Lug