[Corrector] configuració del diccionari Hunspell
joan a jmoratinos.com
joan a jmoratinos.com
dll jun 11 21:05:12 CEST 2012
Teniu raó. S'haurà d'afegir WORDCHARS al fitxer .aff. Com bé dieu el
corrector de LibreOffice fa servir un tokenizer propi (crec que és el
que fa servir també per saltar d'un mot a l'altre o per seleccionar un
mot fent doble clic a sobre). El tokenizer de LibreOffice considera els
apòstrofs i els punts volats com a part de les paraules, però no el guionet.
JMo
Al 09/06/2012 23:55, En/na Jaume Ortolà i Font ha escrit:
> Hola,
>
> En el desenvolupament del corrector gramatical LanguageTool hem
> integrat els diccionaris ortogràfics Hunspell perquè això pot servir
> per a diverses aplicacions. Ens han sorgit alguns dubtes. En el cas
> del català hem hagut d'afegir una línia a l'arxiu .aff perquè la
> llibreria Hunspell fes bé la divisió en tokens. En concret, hem afegit:
>
> WORDCHARS ·-'
>
> Això fa que el punt volat, el guionet i l'apòstrof no siguen
> considerats separadors de tokens. Si el OpenOffice i LibreOffice
> funcionen bé sense això és perquè d'alguna manera ignoren el tokenizer
> de Hunspell. La qüestió és que pensem que aquesta línia hauria d'anar
> en la distribució general dels diccionaris. ¿Què me'n podeu dir?
>
> Salutacions,
> Jaume Ortolà
>
>
>
>
>
> _______________________________________________
> Corrector mailing list
> Corrector a llistes.softcatala.org
> http://llistes.softcatala.org/mailman/listinfo/corrector
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20120611/5870c85c/attachment.html>
Més informació sobre la llista de correu Corrector