Gràcies, Joan.<div><br></div><div>Això explica algunes coses. El fet que el guionet no siga considerat part de la paraula fa que el diccionari ortogràfic no reconega els errors de pronoms febles amb guionet (portar-lis), però sí els errors amb apòstrof (portar'ne, portà'n). També he comprovat ara que efectivament LibreOffice ignora la instrucció WORDCHARS. És una limitació de LibreOffice, que es podria demanar que arreglaren. <div>
<div>
<br clear="all"><div><span></span><span></span>Salutacions,<br>Jaume Ortolà<br><br></div><div><span></span><span></span><br></div><br>
<br><br><div class="gmail_quote">El 11 de juny de 2012 21:05, <a href="mailto:joan@jmoratinos.com" target="_blank">joan@jmoratinos.com</a> <span dir="ltr"><<a href="mailto:joan@jmoratinos.com" target="_blank">joan@jmoratinos.com</a>></span> ha escrit:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div bgcolor="#FFFFFF" text="#000000">
Teniu raó. S'haurà d'afegir WORDCHARS al fitxer .aff. Com bé dieu el
corrector de LibreOffice fa servir un tokenizer propi (crec que és
el que fa servir també per saltar d'un mot a l'altre o per
seleccionar un mot fent doble clic a sobre). El tokenizer de
LibreOffice considera els apòstrofs i els punts volats com a part de
les paraules, però no el guionet.<br>
<br>
JMo<br>
<br>
Al 09/06/2012 23:55, En/na Jaume Ortolà i Font ha escrit:
<blockquote type="cite"><div><div>Hola,
<div><br>
</div>
<div>En el desenvolupament del corrector gramatical LanguageTool
hem integrat els diccionaris ortogràfics Hunspell perquè això
pot servir per a diverses aplicacions. Ens han sorgit alguns
dubtes. En el cas del català hem hagut d'afegir una línia a
l'arxiu .aff perquè la llibreria Hunspell fes bé la divisió en
tokens. En concret, hem afegit:</div>
<div><br>
</div>
<div>WORDCHARS ·-'</div>
<div><br>
</div>
<div>Això fa que el punt volat, el guionet i l'apòstrof no siguen
considerats separadors de tokens. Si el OpenOffice i LibreOffice
funcionen bé sense això és perquè d'alguna manera ignoren el
tokenizer de Hunspell. La qüestió és que pensem que aquesta
línia hauria d'anar en la distribució general dels diccionaris.
¿Què me'n podeu dir?</div>
<div><br clear="all">
<div><span></span><span></span>Salutacions,<br>
Jaume Ortolà<br>
<br>
</div>
<div><span></span><span></span><br>
</div>
<br>
</div>
<br>
<fieldset></fieldset>
<br>
</div></div><pre>_______________________________________________
Corrector mailing list
<a href="mailto:Corrector@llistes.softcatala.org" target="_blank">Corrector@llistes.softcatala.org</a>
<a href="http://llistes.softcatala.org/mailman/listinfo/corrector" target="_blank">http://llistes.softcatala.org/mailman/listinfo/corrector</a>
</pre>
</blockquote>
<br>
</div>
<br>_______________________________________________<br>
Corrector mailing list<br>
<a href="mailto:Corrector@llistes.softcatala.org" target="_blank">Corrector@llistes.softcatala.org</a><br>
<a href="http://llistes.softcatala.org/mailman/listinfo/corrector" target="_blank">http://llistes.softcatala.org/mailman/listinfo/corrector</a><br>
<br></blockquote></div><br></div></div>
</div>