<html>
<head>
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
</head>
<body bgcolor="#FFFFFF" text="#000000">
Teniu raó. S'haurà d'afegir WORDCHARS al fitxer .aff. Com bé dieu el
corrector de LibreOffice fa servir un tokenizer propi (crec que és
el que fa servir també per saltar d'un mot a l'altre o per
seleccionar un mot fent doble clic a sobre). El tokenizer de
LibreOffice considera els apòstrofs i els punts volats com a part de
les paraules, però no el guionet.<br>
<br>
JMo<br>
<br>
Al 09/06/2012 23:55, En/na Jaume Ortolà i Font ha escrit:
<blockquote
cite="mid:CANr-a9wffyM_MSH4=TCo5_Z6bhBwMB3BJVgw2p8_rm207zw1fg@mail.gmail.com"
type="cite">Hola,
<div><br>
</div>
<div>En el desenvolupament del corrector gramatical LanguageTool
hem integrat els diccionaris ortogràfics Hunspell perquè això
pot servir per a diverses aplicacions. Ens han sorgit alguns
dubtes. En el cas del català hem hagut d'afegir una línia a
l'arxiu .aff perquè la llibreria Hunspell fes bé la divisió en
tokens. En concret, hem afegit:</div>
<div><br>
</div>
<div>WORDCHARS ·-'</div>
<div><br>
</div>
<div>Això fa que el punt volat, el guionet i l'apòstrof no siguen
considerats separadors de tokens. Si el OpenOffice i LibreOffice
funcionen bé sense això és perquè d'alguna manera ignoren el
tokenizer de Hunspell. La qüestió és que pensem que aquesta
línia hauria d'anar en la distribució general dels diccionaris.
¿Què me'n podeu dir?</div>
<div><br clear="all">
<div><span></span><span></span>Salutacions,<br>
Jaume Ortolà<br>
<br>
</div>
<div><span></span><span></span><br>
</div>
<br>
</div>
<br>
<fieldset class="mimeAttachmentHeader"></fieldset>
<br>
<pre wrap="">_______________________________________________
Corrector mailing list
<a class="moz-txt-link-abbreviated" href="mailto:Corrector@llistes.softcatala.org">Corrector@llistes.softcatala.org</a>
<a class="moz-txt-link-freetext" href="http://llistes.softcatala.org/mailman/listinfo/corrector">http://llistes.softcatala.org/mailman/listinfo/corrector</a>
</pre>
</blockquote>
<br>
</body>
</html>