[Corrector] Problemes d'accents

Joan Montané joan a montane.cat
dll maig 25 13:55:36 CEST 2015


El dia 18 de maig de 2015, 19:23, Jaume Ortolà i Font <jaumeortola a gmail.com
> ha escrit:

>
> ¿Per què no hi ha formats i programes estàndard per a fer tot això? Ja ho
> he dit altres voltes. En principi, els scripts bàsics que calen són en
> principi prou senzillets. Però les llengües són punyeteres i sempre hi ha
> qüestions que es compliquen, i aquestes qüestions solen ser molt dependents
> de la llengua. En català, per exemple, penso en les regles d'apostrofació,
> pronoms febles, etc.
>
>
Com diu el Jaume, al final sempre hi ha alguna cosa especial que has de
tractar manualment. Quan dic manualment em refereixo a que cal programar
algun script que tradueixi les dades en el format que tens al format que
cal, adaptan-te a les caracterísitques del motor de correcció en qüestió.
Hunspell ara mateix, però podria ser Languagetool, o msypell fa uns anys.

En el cas que indiques (aparició d'un accent gràfic en el radical d'un
verb), no és una operació factible a fer amb hunspell. Tens dues opcions:

1r fer un script que generi totes les formes amb accent i les afegeixes tal
qual al fitxer .dic

2n fer un script que, a partir de l'infinitu sense accent, et generi un
fals "radical" amb accent, i aquest fals radical el marques amb un flag
especial NEEDAFFIX per a què el mot no es validi llevat que generi una
forma flexionada. Òbivament, també hauràs de marcar aquest fals radical amb
algun altre flag per a generar les formes accentuades. Cerca al manual de
hunspell NEEDAFFIX i els exemples pseudoroot5.*


Per tant, en el teu cas, per a cada verb, amb 2 radicals (un de fals) i 2
models (un per al radical sense accent i una altre per al fals radical amb
accent) haurien de poder flexionar correctament els verbs.


Atentament,
Joan Montané
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20150525/64c29774/attachment.html>


Més informació sobre la llista de correu Corrector