[Corrector] Noves funcionalitats de l'Hunspell

Joan Montané jmontane a gmail.com
dll ago 27 17:48:32 CEST 2007


Bona tarda, torno a ser jo, avui estic amb ganes de xerrar, :-D


Només volia informar a la llista que l'hunspell en la vesió 1.1.10 ja
incorpora la funcionalitat d'aproximació fonètica de les paraules a l'hora
de cercar paraules a substituir. Aquesta funcionalitat ja la té l'aspell des
de la versió 0.60 (recordo uns correus a la llista del fòrum d'en
Joan...Sala? amb el seu treball al respecte).
El codi per a les funcionalitat fonètiques de l'hunspell està agafat (amb
permís) de l'aspell, això vol dir que la sintaxi és molt semblant, per veure
un exemple d'ús i sintaxi, aquí hi ha el diccionari anglès per l'hunspell:
http://hunspell.sourceforge.net/en_US.zip

Crec que ja que tenim dos correctors amb aquesta funcionalitat (aspell i
hunspell) podríem afegir-ho al motor de creació de diccionaris.


Ah!, se m'oblidava, l'hunspell també permet suggerir paraules amb espais
(veieu l'exemple a_lot del diccionari anglès). Ho comento perquè, a les
paraules femenines que comencen per I, U àtones, podríem afegir-hi el prefix
"la_" (això fa que es reconeguessin paraules com "la Universitat", tot
seguit, afegir el reemplaçament "REP l' la_", i ja es corregirien aquest
errors.

En relació amb això (afegir prefixos), veig que nosaltres només fem servir
25 lletres (flags) per definir els prefixos, bàsicament les lletres
majúscules de la A a la Z, altres llengues fan servir també les minúscules i
caràcters no-ASCCI (À,ü, etc.). Hi ha algún motiu al per fer servir només 25
lletres? Ho comento perquè amb més afixos, podríem generar els adverbis
acabats en -ment, a partir dels adjectius femenins), i també treballar els
sufixos d'aspecte (-arro, -arrra-, às, -assa, -astre, -astra, -ell, -ella,
-et, -eta, -ic, -ill, -illa, -im, -íssim, -issima, -ó, -ona, -oi, -oia, -ol,
-ola, -ot, -ota), per generar mots com: cotxet, caseta, xicotot, ..., M'he
explicat bé, suposo.


Ara sí, marxo.

Atentament, Joan Montané.
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20070827/8dd0d24f/attachment.html>


Més informació sobre la llista de correu Corrector