[Corrector] Problemes d'accents

Jaume Ortolà i Font jaumeortola a gmail.com
dll maig 18 19:23:31 CEST 2015


El dia 17 de maig de 2015, 20:35, Xavi Torres <torresaran a hotmail.com> ha
escrit:

> Ara estava mirant els scripts que ten a la web
>
> Pel que entec a partir d'uns dirccionaris base
>
>
>
> https://raw.githubusercontent.com/jaumeortola/catalan-dict-tools/master/diccionari-arrel/adjectius-fdic.txt
>
>
> I definint els models
>
>
> https://github.com/jaumeortola/catalan-dict-tools/blob/master/diccionari-arrel/models-verbals/abalisar.model
>
> Generes els diferents formats oi?
>

A partir del diccionari base es generen els diccionaris Hunspell i els
diccionaris etiquetats per al corrector gramatical LanguageTool (format
Freeling).


>
>
Els models y el diccionari son algún format stàndar?
>
> Els edites amb algún software o ho fas directament?
>
>
No. No és cap format estàndard. Els diccionaris s'editen amb un editor de
text, i els scripts són en Perl.

¿Per què no hi ha formats i programes estàndard per a fer tot això? Ja ho
he dit altres voltes. En principi, els scripts bàsics que calen són en
principi prou senzillets. Però les llengües són punyeteres i sempre hi ha
qüestions que es compliquen, i aquestes qüestions solen ser molt dependents
de la llengua. En català, per exemple, penso en les regles d'apostrofació,
pronoms febles, etc.

Jaume


M'haig de motontar algún sistema similar, però pel que he vist ho trobo una
> mica complex per a mi.
>

>
>
>
> ------------------------------
> From: jaumeortola a gmail.com
> Date: Sun, 17 May 2015 20:04:16 +0200
> To: corrector a llistes.softcatala.org
> Subject: Re: [Corrector] Problemes d'accents
>
>
> Xavi,
>
> Hauràs de mirar què et convé més.
>
> En català, per a sistematitzar-ho, tenim 156 models verbals. Només que hi
> hagi qualsevol variant creem un model nou (amb els seus afixos en el fitxer
> .aff). Però de fet el 90% dels verbs estan concentrats en un sol model, el
> regular de la primera conjugació -ar.
>
> Pots adoptar una solució intermèdia. Els verbs regulars poden seguir el
> model (és a dir, amb regles d'afixos), i els irregulars els pots afegir tal
> qual en el fitxer .dic.
>
> Salutacions,
> Jaume Ortolà
>
>
> El dia 17 de maig de 2015, 19:45, Xavi Torres <torresaran a hotmail.com> ha
> escrit:
>
> Bona tarda companys,
>
>
> Tin un problema d'accents.
>
> Quan he conjugat dos verbs:
>
>
> Parlar = parlar
> Mèter = ficar
>
> Que es cojuguen de la següent manera
>
> parlar
> parli
> parles
> parlam
> ...
> pàrliga
> pàrligues
> pàrligue
> parlegam
> ....
>
> mèter
> meti
> metes
> metam
> ..
> métiga
> métigues
> métigue
> metegam
>
> La bocal fa un anvi d'accent.
>
>
> Aquest canvi d'accents fa que la les regles quevolia definir no hem
> serveixin.
>
> #1er
> SFX A Y 9
> SFX A ar i ar
> SFX A ar es ar
> SFX A ar am ar
> SFX A ar iga ar
> SFX A ar igues ar
> SFX A ar igue ar
> SFX A ar egam ar
> SFX A ar egatz ar
> SFX A ar iguen ar
> #2on
> SFX B Y 6
>
> SFX B er iga er
> SFX B er igues er
> SFX B er igue er
> SFX B er egam er
> SFX B er egatz er
> SFX B er iguen er
>
>
> 2
> parlar/A
> méter/B
>
> Necessito definir una regla que hem serveixi per tots.
>
> He mirat en la documentació de hunspell i he trobat que la sintaxis es
> molt limitada. No he trobat una regla que hem pugui servir per a tots i si
> faig una regla per a cada cas hem surten masses variants.
>
> Si no fos per els accents aquesta regla hem serveix per casi tots els
> verbs acabats en er i ar.
>
> Alguna idea?
>
> Estic per conjugar directament els verbs al fitxer dic, i oblidar-me de
> tantes regles.
>
>
>
>
>
>
> Si vols canviar la subscripció o donar-te de baixa, fes-ho des de:
> _______________________________________________
> https://llistes.softcatala.org/mailman/listinfo/corrector
>
>
>
> Si vols canviar la subscripció o donar-te de baixa, fes-ho des de:
> _______________________________________________
> https://llistes.softcatala.org/mailman/listinfo/corrector
>
> Si vols canviar la subscripció o donar-te de baixa, fes-ho des de:
> _______________________________________________
> https://llistes.softcatala.org/mailman/listinfo/corrector
>
>
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20150518/0f42ea81/attachment.html>


Més informació sobre la llista de correu Corrector