<div dir="ltr"><div>Gràcies per l'aportació, Ernest.<br></div><div><br></div><div>Conec el Diccionari Descriptiu (<span style="font-family:arial,sans-serif;font-size:12.727272033691406px">DDLC)</span>. Em vaig entrevistar amb un dels seus directors perquè em cediren una part del Corpus que fan servir. Aquesta part del Corpus jo l'he feta servir durant l'últim any per als tests del corrector gramatical, i la veritat és que ha sigut molt profitós.</div>
<div><br></div><div>Ara, el Diccionari Descriptiu no és el que cal exactament per a crear un corrector ortogràfic. Un diccionari "descriptiu" pot contenir molts elements que són d'ús real, però no són "correctes" o "normatius". Pensa, per exemple, en l'Alcover-Moll, que podria ser un exemple diccionari descriptiu (dialectal i històric). Per a construir un corrector ortogràfic s'ha de partir dels diccionaris normatius (DIEC, DNV), i afegir-hi elements d'altres fonts: diccionaris d'ús (GDLC, D62, <a href="http://esadir.cat">esadir.cat</a>), terminologia especialitzada (Termcat), paraules derivades i compostes, noms propis (de llocs, de persones, d'organitzacions, de marques), etc.</div>
<div><br></div><div>El diccionari que fem servir ara en el corrector gramatical Languagetool és molt més ric i complet que el DDLC. Tenim més d'un milió de formes i, pel que em van dir, el DDLC no hi arriba per prou diferència. </div>
<div><br></div><div>Ara mateix tenim pendent traslladar totes les millores i les incorporacions que s'han fet al diccionari del corrector gramatical als diccionaris ortogràfics d'ús més comú (Hunspell, ispell, etc.). Joan Montané i jo hem anat fent passos per aquest camí. Alguns han sigut molt laboriosos, però ja estem arribant al final. Podem intentar explicar-ho en les pròximes setmanes aquí en la llista. L'objectiu és, en definitiva, el que assenyales tu, Ernest; tenir una manera fàcil de mantenir i generar els diccionaris ortogràfics. </div>
<div><br></div><div class="gmail_extra"><div><div><span></span><span></span>Salutacions,<br>Jaume Ortolà<br></div><div><span></span><span></span><br></div></div>
<br><br><div class="gmail_quote">El dia 21 agost de 2014 23:55, Ernest Adrogué <span dir="ltr"><<a href="mailto:nfdisco@gmail.com" target="_blank">nfdisco@gmail.com</a>></span> ha escrit:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hola,<br>
he estat mirant els diccionaris catalans d'ispell, aspell, etc., si no m'equivoco com funciona ara és a base de generar automàticament flexions a partir de les entrades del diccionari DIEC.<br>
El problema que té aquest sistema és que és molt complex, el programa que genera les paraules és difícil d'entendre i de modificar, i suposo que de mantenir.<br>
Per altra banda he vist que l'IEC té un diccionari que es diu Diccionari descriptiu de la llengua catalana [1], que es pot consultar tot i que no està acabat. L'avantatge d'aquest diccionari és que inclou totes les flexions i conjugacions verbals (no ho mirat a fons, però sembla que és així), per tant es podria utilitzar directament per crear una llista de paraules i només s'haurien d'afegir afixos pels pronoms enclítics, apòstrofs, etc., cosa que no és relativament senzill de fer.<br>
No sé quantes entrades té actualment aquest diccionari, però jo crec que no seria mala idea considerar la possibilitat d'utilitzar-lo. Legalment suposo que fa falta permís perquè en un peu de pàgina he vist que diu això:<br>
<br>
Nota: Són rigorosament prohibides, sense l'autorització escrita dels titulars del copyright, l'extracció, la reutilització i la reproducció en qualsevol mena de suport o el tractament informàtic del contingut de les dades del DDLC.<br>
<br>
[1] <a href="http://dcc.iec.cat/ddlc/index.asp" target="_blank">http://dcc.iec.cat/ddlc/index.<u></u>asp</a><br>
Si vols canviar la subscripció o donar-te de baixa, fes-ho des de:<br>
______________________________<u></u>_________________<br>
<a href="http://llistes.softcatala.org/mailman/listinfo/corrector" target="_blank">http://llistes.softcatala.org/<u></u>mailman/listinfo/corrector</a><br>
</blockquote></div><br></div></div>