Hola, <div><br></div><div>En el desenvolupament del corrector gramatical LanguageTool hem integrat els diccionaris ortogràfics Hunspell perquè això pot servir per a diverses aplicacions. Ens han sorgit alguns dubtes. En el cas del català hem hagut d'afegir una línia a l'arxiu .aff perquè la llibreria Hunspell fes bé la divisió en tokens. En concret, hem afegit:</div>
<div><br></div><div>WORDCHARS ·-'</div><div><br></div><div>Això fa que el punt volat, el guionet i l'apòstrof no siguen considerats separadors de tokens. Si el OpenOffice i LibreOffice funcionen bé sense això és perquè d'alguna manera ignoren el tokenizer de Hunspell. La qüestió és que pensem que aquesta línia hauria d'anar en la distribució general dels diccionaris. ¿Què me'n podeu dir?</div>
<div><br clear="all"><div><span></span><span></span>Salutacions,<br>Jaume Ortolà<br><br></div><div><span></span><span></span><br></div><br>
</div>