
Al 14/05/2013 09:39, En/na Joan Montané ha escrit:
Jordi (i altres)
El diccionari predictiu de l'Adaptxt és el millor que he trobat per a Android i funciona molt bé. Els hi vaig demanar ja fa uns dies si poden alliberar-les sota LGPL o similar, però sembla que passen de mi.
Faig entretenir-me uns dies a processar el corpus català de l'OpenAdaptxt llicència EPL v.1.0) i n'adjunto el resultat (el fitxer interessant és dades.txt). Aleshores, a nivell legal de llicències, potser podríem trobar algun sistema que permetés usar les dades amb el Catalanitzador d'Android, sense violar l'EPL. Per exemple, no distribuir la llista amb el binari i baixar-la en tems d'execució?
Només comentar que :
1.- dates.txt no està normalitzat a l'escala 0-255 d'Android. Caldria passar-ho a escala 0-255, potser aplicant una transformació no-lineal? 2.- dades.txt no he cmptat la freqüència de les locucions, que les tinc en un fitxer a part i caldria calcular-ne la freqüència... però bé... tampoc seria massa complex fer-ho si es vol fer servir aquest corpus.
Joan Montané
Hola Joan, Podem resumir que proposeu que fes el Catalanitzador per a l'Android per donar teclat predictiu en català? Fins ara l'estratègia que estava provant era afegir paraules al diccionari de l'usuari[1] per comprovar si funcionava la predicció. No he aconseguit funcionar encara però aquest mètode seria molt estàndard. Quin mètode proposeu i en quants Android funcionaria? Si podeu passar els conceptes a codi seria de gran ajuda. Atentament, Jordi, [1] https://github.com/Softcatala/Catalanitzador/blob/master/CatalanitzadorPerAl... -- Jordi Mas i Hernàndez -Bloc: http://gent.softcatala.org/jmas/bloc/ Planet Softcatalà -> http://planeta.softcatala.org