[Corrector] LanguageTool amb editor online
Jaume Ortolà i Font
jaumeortola a gmail.com
div gen 18 12:02:43 CET 2013
El 18 de gener de 2013 11.28, Xavi Ivars <xavi.ivars a gmail.com> ha escrit:
> Si, jo també pense el mateix, però sent així "central" no s'ajusta a la
> variant "català de Catalunya". Supose que podríem deixar-ho semblant a com
> està ara "general", "valencià" i "balear" (afegint "balear", que ara no
> n'hi ha).
>
D'acord, sí. "Central" és inadequat.
> Per curiositat: la variant "balear" també està implementada als fitxers de
> (a|i|my|hun)spell? O directament sobre LT?
>
En el diccionari hunspell que mantenim a Softcatalà, totes les formes
verbals (general, valencià, balear) apareixen en els dos diccionaris
(general i AVL). Per tant, això no serveix per a diferenciar unes variants
de les altres.
En el diccionari etiquetat FreeLing tampoc no es fa diferència entre
variants regionals. Ni tan sols està previst en el sistema d'etiquetatge.
La diferenciació la faig amb un conjunt de regles i excepcions, que després
d'haver passat per diferents corpus de texts deuen ser ja prou fiables
(però potser no al 100%). Faig igual amb l'accentuació valenciana i
general. L'ideal seria tenir-ho etiquetat, perquè això permetria fer més
coses (proposar canvis entre una variant i una altra), però no ho he fet de
moment. Es podrien extraure dades fiables del Viccionari.
Salutacions,
Jaume Ortolà
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20130118/34f42d64/attachment.html>
Més informació sobre la llista de correu Corrector