[Corrector] Llista de paraules per a reconeixement d'escriptura (Era: llista)
Joan Sala Soler
joansala a gmail.com
dic nov 19 16:28:58 CET 2008
En/na david valls ha escrit:
> Hola Joan,
>
> Gràcies per la informació. He vist que l'arxiu a baixar és per linux i
> jo no tinc el linux instal·lat, sóc usuari de Windows, ho sento. A més,
> he trobat l'enllaç a on explica el tema de l'"expand":
>
> http://aspell.net/man-html/Working-With-Affix-Info-in-Word-Lists.html#Working-With-Affix-Info-in-Word-Lists
>
> Crec que fa el que tu dius. Però, no només no tinc linux, sinó que ni
> tan sols ser com es fa això. A on s'han de posar aquestes ordres (en cas
> de tenir linux)?
>
> Bé, sé que acabo d'entrar per una cosa molt concreta. Seria molt que
> algú m'ho pogués fer i enviar la llista de les paraules completes amb
> derivacions al meu correu privat?
>
> És que instal·lar linux per això i a després barallar-m'hi...
>
> Mil gràcies.
> david
David, el problema és que la llista de paraules expandida, amb totes les
derivacions i flexions, ocupa prop de 200 MB i després et podries trobar
que no fos exactament en el format adequat.
En realitat no és complicat de fer. Si de debò ho necessites segurament
pots fer-ho des d'un LiveCD (Ubuntu, per exmple [1]) o buscar algú amb
Linux que t'hi ajudi.
Per si et servís, suposant que està instal·lat l'Aspell i el diccionari
català, només cal entrar les següents ordres en un terminal:
$ aspell dump master ca > ca.wl
$ aspell expand < ca.wl > ca_totes.txt
Aconseguiràs el fitxer 'ca_totes.txt' amb totes les paraules i derivats.
És clar que, com ja t'he comentat, potser després hauràs de convertir el
fitxer de text a un altre format (una paraula per línia, potser?).
Ho sento, jo no t'hi puc ajudar més i no conec cap altra manera
d'aconseguir la llista de paraules que et fa falta :)
[1] http://www.ubuntu.com/getubuntu/download
Atentament,
Joan Sala Soler
joansala a gmail.com
Més informació sobre la llista de correu Corrector