El 18 de gener de 2013 11.28, Xavi Ivars <span dir="ltr"><<a href="mailto:xavi.ivars@gmail.com" target="_blank">xavi.ivars@gmail.com</a>></span> ha escrit:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div>Si, jo també pense el mateix, però sent així "central" no s'ajusta a la variant "català de Catalunya". Supose que podríem deixar-ho semblant a com està ara  "general", "valencià" i "balear" (afegint "balear", que ara no n'hi ha).</div>

</blockquote><div><br></div><div>D'acord, sí. "Central" és inadequat.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div></div><div>Per curiositat: la variant "balear" també està implementada als fitxers de (a|i|my|hun)spell? O directament sobre LT?</div>

</blockquote></div><br>En el diccionari hunspell que mantenim a Softcatalà, totes les formes verbals (general, valencià, balear) apareixen en els dos diccionaris (general i AVL). Per tant, això no serveix per a diferenciar unes variants de les altres. <div>

<br></div><div>En el diccionari etiquetat FreeLing tampoc no es fa diferència entre variants regionals. Ni tan sols està previst en el sistema d'etiquetatge. La diferenciació la faig amb un conjunt de regles i excepcions, que després d'haver passat per diferents corpus de texts deuen ser ja prou fiables (però potser no al 100%). Faig igual amb l'accentuació valenciana i general. L'ideal seria tenir-ho etiquetat, perquè això permetria fer més coses (proposar canvis entre una variant i una altra), però no ho he fet de moment. Es podrien extraure dades fiables del Viccionari. <br>

<br><div><div><span></span><span></span>Salutacions,<br>Jaume Ortolà<br></div><div><span></span><span></span><br></div></div>
</div>