[Corrector] Noves funcionalitats de l'Hunspell
Joan Sala Soler
joansala a gmail.com
dim ago 28 19:55:52 CEST 2007
En/na Joan Montané ha escrit:
> Gràcies a tu, Joan, per la feina de l'aspell.
> Faig servir l'aspell al LyX amb les teves aportacions i va la mar de bé.
> S'ha de dir que les funcionalitats fonètiques de l'hunspell encara són
> lluny de les de l'aspell. Per exemple, no sé com ho fa l'aspell, però
> les substitucions que fas servir per corregir els barbarismes, també
> s'aproximen fonèticament!!! En canvi, en l'hunspell sembla que no va
> l'aproximació fonètica per als REP. L'hunspell també el tinc 'afinat'
> per corregir barbarismes amb el truc dels reemplaçaments. :-D
>
> Atentament, Joan Montané.
Es que l'Aspell es de llarg insuperable :)
Això que comentes és perquè el diccionari que vaig enviar de l'Aspell no
fa servir les ordres REP per a les substitucions. Els REP només són un
substitut barat de l'aproximació fonètica. De fet, un cop s'hi ha afegit
l'aproximació fonètica el REP el que fan es nosa.
L'Aspell fa servir tres típus de vocabularis: la llista de paraules, el
vocabulari personal i el diccionari de substitucions. Aquest últim es la
gràcia de la intel·ligència artificial de l'Aspell, és el que permet que
el corrector aprengui de com l'usuari el fa servir.
El que vaig fer amb els barbarismes es afegir un segon diccionari de
substitucions ja entrenat amb els barbarismes més freqüents (extret de
l'Abiword i entrenat amb els textos de la Viquipèdia). Aquest és també
el motiu de que hi hagi tan pocs barbarismes (uns 2600), si n'hi hagués
més interferirien amb l'aproximació fonètica.
També es podria utilitzar per a corregir neologismes (la Terminologia
Oberta del Termcat és una bona base).
El Hunspell té alguna cosa semblant? Si fos així es podria provar
d'implementar-ho. M'està costant de trobar documentació sobre el
funcionament del Hunspell (si existeix), si tens algun enllaç
interessant... ;)
Atentament,
Joan Sala Soler
Més informació sobre la llista de correu Corrector