[Corrector] configuració del diccionari Hunspell

Jaume Ortolà i Font jaumeortola a gmail.com
dis jun 9 23:55:29 CEST 2012


Hola,

En el desenvolupament del corrector gramatical LanguageTool hem integrat
els diccionaris ortogràfics Hunspell perquè això pot servir per a diverses
aplicacions. Ens han sorgit alguns dubtes. En el cas del català hem hagut
d'afegir una línia a l'arxiu .aff perquè la llibreria Hunspell fes bé la
divisió en tokens. En concret, hem afegit:

WORDCHARS ·-'

Això fa que el punt volat, el guionet i l'apòstrof no siguen considerats
separadors de tokens. Si el OpenOffice i LibreOffice funcionen bé sense
això és perquè d'alguna manera ignoren el tokenizer de Hunspell. La qüestió
és que pensem que aquesta línia hauria d'anar en la distribució general
dels diccionaris. ¿Què me'n podeu dir?

Salutacions,
Jaume Ortolà
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20120609/06c60079/attachment.html>


Més informació sobre la llista de correu Corrector