[Corrector] Diccionari descriptiu de la llengua catalana

Jaume Ortolà i Font jaumeortola a gmail.com
div ago 22 22:43:44 CEST 2014


Gràcies per l'aportació, Ernest.

Conec el Diccionari Descriptiu (DDLC). Em vaig entrevistar amb un dels seus
directors perquè em cediren una part del Corpus que fan servir. Aquesta
part del Corpus jo l'he feta servir durant l'últim any per als tests del
corrector gramatical, i la veritat és que ha sigut molt profitós.

Ara, el Diccionari Descriptiu no és el que cal exactament per a crear un
corrector ortogràfic. Un diccionari "descriptiu" pot contenir molts
elements que són d'ús real, però no són "correctes" o "normatius". Pensa,
per exemple, en l'Alcover-Moll, que podria ser un exemple diccionari
descriptiu (dialectal i històric). Per a construir un corrector ortogràfic
s'ha de partir dels diccionaris normatius (DIEC, DNV), i afegir-hi elements
d'altres fonts: diccionaris d'ús (GDLC, D62, esadir.cat), terminologia
especialitzada (Termcat), paraules derivades i compostes, noms propis (de
llocs, de persones, d'organitzacions, de marques), etc.

El diccionari que fem servir ara en el corrector gramatical Languagetool és
molt més ric i complet que el DDLC. Tenim més d'un milió de formes i, pel
que em van dir, el DDLC no hi arriba per prou diferència.

Ara mateix tenim pendent traslladar totes les millores i les incorporacions
que s'han fet al diccionari del corrector gramatical als diccionaris
ortogràfics d'ús més comú (Hunspell, ispell, etc.). Joan Montané i jo hem
anat fent passos per aquest camí. Alguns han sigut molt laboriosos, però ja
estem arribant al final. Podem intentar explicar-ho en les pròximes
setmanes aquí en la llista. L'objectiu és, en definitiva, el que assenyales
tu, Ernest; tenir una manera fàcil de mantenir i generar els diccionaris
ortogràfics.

Salutacions,
Jaume Ortolà



El dia 21 agost de 2014 23:55, Ernest Adrogué <nfdisco a gmail.com> ha escrit:

> Hola,
> he estat mirant els diccionaris catalans d'ispell, aspell, etc., si no
> m'equivoco com funciona ara és a base de generar automàticament flexions a
> partir de les entrades del diccionari DIEC.
> El problema que té aquest sistema és que és molt complex, el programa que
> genera les paraules és difícil d'entendre i de modificar, i suposo que de
> mantenir.
> Per altra banda he vist que l'IEC té un diccionari que es diu Diccionari
> descriptiu de la llengua catalana [1], que es pot consultar tot i que no
> està acabat. L'avantatge d'aquest diccionari és que inclou totes les
> flexions i conjugacions verbals (no ho mirat a fons, però sembla que és
> així), per tant es podria utilitzar directament per crear una llista de
> paraules i només s'haurien d'afegir afixos pels pronoms enclítics,
> apòstrofs, etc., cosa que no és relativament senzill de fer.
> No sé quantes entrades té actualment aquest diccionari, però jo crec que
> no seria mala idea considerar la possibilitat d'utilitzar-lo.  Legalment
> suposo que fa falta permís perquè en un peu de pàgina he vist que diu això:
>
>         Nota: Són rigorosament prohibides, sense l'autorització escrita
> dels titulars del copyright, l'extracció, la reutilització i la reproducció
> en qualsevol mena de suport o el tractament informàtic del contingut de les
> dades del DDLC.
>
> [1] http://dcc.iec.cat/ddlc/index.asp
> Si vols canviar la subscripció o donar-te de baixa, fes-ho des de:
> _______________________________________________
> http://llistes.softcatala.org/mailman/listinfo/corrector
>
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20140822/421dc8af/attachment.html>


Més informació sobre la llista de correu Corrector