<div dir="ltr">Bon dia, <div><br></div><div>Teníem pendent des de fa molts mesos reconstruir els diccionaris Hunspell de correcció ortogràfica i unificar-los amb el diccionari que usa el corrector gramatical LanguageTool. Ja ho tenim fet. Abans de fer una publicació oficial, però, ens agradaria que els provara més gent. Proveu-los i feu els suggeriments o les crítiques que cregueu oportuns. </div><div><br></div><div>Els diccionaris es poden descarregar ací:</div><div><a href="https://github.com/jaumeortola/catalan-dict-tools/tree/master/resultats/hunspell">https://github.com/jaumeortola/catalan-dict-tools/tree/master/resultats/hunspell</a><br></div><div><br></div><div>Per a provar-los en LibreOffice/Windows caldria fer això:</div><div><br></div><div><span style="font-size:13px">En la ruta </span><span style="font-size:13px">"%program_files%\LibreOffice 4\share\extensions\dict-ca\" hauríeu de </span><span style="font-size:13px">trobar els diccionaris que usa l'extensió inclosa en el LibreOffice. Amb </span><span style="font-size:13px">el LibreOffice apagat, substituïu els fitxers .aff i .dic amb els nous </span><span style="font-size:13px">que </span><span style="font-size:13px">vulgueu provar </span><span style="font-size:13px">(canviant-los el nom si cal), </span><span style="font-size:13px">i després obriu el LibreOffice. </span></div><div><br></div><div>A continuació explique diferents qüestions relacionades amb els diccionaris. Si voleu que n'amplie alguna, digueu-m'ho. </div><div><br></div><div><b>Dicconaris Hunspell vs. LanguageTool</b></div><div><br></div><div>El corrector gramatical LanguageTool és molt més potent i flexible que els simples correctors ortogràfics. Ara bé, com que hi ha aplicacions que només funcionen amb un diccionari ortogràfic (p. ex. Adobe Indesign o alguns navegadors) i com que sempre hi haurà gent que no s'instal·la el corrector gramatical, cal que fem manteniment dels diccionaris Hunspell. </div><div><br></div><div>En el LibreOffice, si teniu el LanguageTool, el corrector ortogràfic és, de fet, prescindible. Per a desactivar el diccionari Hunspell (que mostra els subratllats en vermell) i quedar-se només amb LT, cal anar a Eines>Opcions>Configuració de llengua>Ajudes a l'escriptura i llavors desactivar "Hunspell Spellchecker". LT farà la correcció ortogràfica i la gramatical al mateix temps, però només hi haurà subratllats en blau. </div><div><br></div><div><b>Compostos amb guionets</b></div><div><br></div><div>Una mostra de la falta de flexibilitat del Hunspell són els compostos amb guionet. No hi ha una solució òptima. O es fa com en el punt 1 o com en el punt 2:</div><div><br></div><div>1) Marca error en "Barcelona-València" (malament!) i marca error en "canta-los" (bé!). És l'opció que tenim ara, però es pot canviar. </div><div>2) No marca error en "Barcelona-València" (bé!) i no marca error en "canta-los" (malament!). </div><div><br></div><div>¿Què preferiu?<br></div><div><br></div><div><b>Exclusions de paraules</b></div><div><br></div><div>Hi ha paraules que fan dubtar sobre si les hem d'incloure o no en els diccionaris. En el LanguageTool això és més fàcil de gestionar que en els diccionaris ortogràfics. En el LanguageTool incloem la majoria de paraules en el diccionari, i després hi ha regles que avisen del fet que tal paraula és d'ús discutit o només està admesa en alguns diccionaris. </div><div><br></div><div>En canvi, en els diccionaris ortogràfics és o tot o res. O incloem la paraula o no la incloem. Ací teniu les exclusions que es fan en els diccionaris Hunspell ara mateix: </div><div><a href="https://github.com/jaumeortola/catalan-dict-tools/blob/master/fdic-to-hunspell/dades/exclusions.txt">https://github.com/jaumeortola/catalan-dict-tools/blob/master/fdic-to-hunspell/dades/exclusions.txt</a><br></div><div><br></div><div>Es fan per diferents motius. En alguns casos és perquè, a pesar de ser paraules correctes, quasi sempre són errors (proba, composar, etc.) </div><div><br></div><div><b>Diferents diccionaris Hunspell (català/valencià)</b></div><div><br></div><div>Com hem fet fins ara, tenim un diccionari "general" i un diccionari "valencià". Supose que és complicat fer-los a gust de tothom, però volem que siguen útils al màxim nombre de gent possible. Explique breument les semblances i les diferències.</div><div><br></div><div>- El gros del lèxic és comú a tots dos diccionaris.</div><div>- Tots dos diccionaris inclouen totes les formes verbals: generals, valencianes i balears. Un inconvenient d'això és que la primera persona del present d'indicatiu balear genera formes que poden ser errors ortogràfics en altres variants. </div><div>- Accentuació. El diccionari general només inclou l'accentuació general (cafè). El valencià, en canvi, inclou les dues (café i cafè).</div><div>- Les exclusions de paraules són lleugerament diferents. Les podeu veure ací:</div><div><div><a href="https://github.com/jaumeortola/catalan-dict-tools/blob/master/fdic-to-hunspell/dades/exclusions.txt">https://github.com/jaumeortola/catalan-dict-tools/blob/master/fdic-to-hunspell/dades/exclusions.txt</a><br></div></div><div>Es podrien fer altres combinacions. El que hem fet és seguir aproximadament el que marquen el DIEC i el DNV. No és el criteri que jo personalment usaria, perquè acceptar o no "vivenda" o "disfrutar" no té res a veure amb el fet de ser valencià o no. Però no veig una altra manera de fer-ho.</div><div><br></div><div>I una qüestió final, en tots dos diccionaris hi ha bona part del lèxic no conflictiu del DOPV (de l'AVL). Podríem recuperar el lèxic més problemàtic i incloure'l en el diccionari valencià, però això s'hauria de fer amb el DNV, perquè el DOPV, pel que jo veig, ha quedat prou desfasat. El problema és que les dades del DNV no les tenim en un format accessible. Les hem demanades a l'AVL, però de moment no hi ha hagut resposta  </div><div><br></div><div><div><div class="gmail_signature"><div><span></span><span></span>Salutacions,<br>Jaume Ortolà<br><br></div><div><span></span><span></span><br></div></div></div>
</div></div>