[Corrector] configuració del diccionari Hunspell

joan a jmoratinos.com joan a jmoratinos.com
dll jun 11 21:05:12 CEST 2012


Teniu raó. S'haurà d'afegir WORDCHARS al fitxer .aff. Com bé dieu el 
corrector de LibreOffice fa servir un tokenizer propi (crec que és el 
que fa servir també per saltar d'un mot a l'altre o per seleccionar un 
mot fent doble clic a sobre). El tokenizer de LibreOffice considera els 
apòstrofs i els punts volats com a part de les paraules, però no el guionet.

JMo

Al 09/06/2012 23:55, En/na Jaume Ortolà i Font ha escrit:
> Hola,
>
> En el desenvolupament del corrector gramatical LanguageTool hem 
> integrat els diccionaris ortogràfics Hunspell perquè això pot servir 
> per a diverses aplicacions. Ens han sorgit alguns dubtes. En el cas 
> del català hem hagut d'afegir una línia a l'arxiu .aff perquè la 
> llibreria Hunspell fes bé la divisió en tokens. En concret, hem afegit:
>
> WORDCHARS ·-'
>
> Això fa que el punt volat, el guionet i l'apòstrof no siguen 
> considerats separadors de tokens. Si el OpenOffice i LibreOffice 
> funcionen bé sense això és perquè d'alguna manera ignoren el tokenizer 
> de Hunspell. La qüestió és que pensem que aquesta línia hauria d'anar 
> en la distribució general dels diccionaris. ¿Què me'n podeu dir?
>
> Salutacions,
> Jaume Ortolà
>
>
>
>
>
> _______________________________________________
> Corrector mailing list
> Corrector a llistes.softcatala.org
> http://llistes.softcatala.org/mailman/listinfo/corrector

-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20120611/5870c85c/attachment.html>


Més informació sobre la llista de correu Corrector