[Corrector] Noves funcionalitats de l'Hunspell

Joan Sala Soler joansala a gmail.com
dim ago 28 19:55:52 CEST 2007


En/na Joan Montané ha escrit:
> Gràcies a tu, Joan, per la feina de l'aspell.
> Faig servir l'aspell al LyX amb les teves aportacions i va la mar de bé. 
> S'ha de dir que les funcionalitats fonètiques de l'hunspell encara són 
> lluny de les de l'aspell. Per exemple, no sé com ho fa l'aspell, però 
> les substitucions que fas servir per corregir els barbarismes, també 
> s'aproximen fonèticament!!! En canvi, en l'hunspell sembla que no va 
> l'aproximació fonètica per als REP. L'hunspell també el tinc 'afinat' 
> per corregir barbarismes amb el truc dels reemplaçaments. :-D
> 
> Atentament, Joan Montané.

Es que l'Aspell es de llarg insuperable :)

Això que comentes és perquè el diccionari que vaig enviar de l'Aspell no 
fa servir les ordres REP per a les substitucions. Els REP només són un 
substitut barat de l'aproximació fonètica. De fet, un cop s'hi ha afegit 
l'aproximació fonètica el REP el que fan es nosa.

L'Aspell fa servir tres típus de vocabularis: la llista de paraules, el 
vocabulari personal i el diccionari de substitucions. Aquest últim es la 
gràcia de la intel·ligència artificial de l'Aspell, és el que permet que 
el corrector aprengui de com l'usuari el fa servir.

El que vaig fer amb els barbarismes es afegir un segon diccionari de 
substitucions ja entrenat amb els barbarismes més freqüents (extret de 
l'Abiword i entrenat amb els textos de la Viquipèdia). Aquest és també 
el motiu de que hi hagi tan pocs barbarismes (uns 2600), si n'hi hagués 
més interferirien amb l'aproximació fonètica.

També es podria utilitzar per a corregir neologismes (la Terminologia 
Oberta del Termcat és una bona base).

El Hunspell té alguna cosa semblant? Si fos així es podria provar 
d'implementar-ho. M'està costant de trobar documentació sobre el 
funcionament del Hunspell (si existeix), si tens algun enllaç 
interessant... ;)

Atentament,

Joan Sala Soler



Més informació sobre la llista de correu Corrector