
Jordi (i altres) El diccionari predictiu de l'Adaptxt és el millor que he trobat per a Android i funciona molt bé. Els hi vaig demanar ja fa uns dies si poden alliberar-les sota LGPL o similar, però sembla que passen de mi. Faig entretenir-me uns dies a processar el corpus català de l'OpenAdaptxt llicència EPL v.1.0) i n'adjunto el resultat (el fitxer interessant és dades.txt). Aleshores, a nivell legal de llicències, potser podríem trobar algun sistema que permetés usar les dades amb el Catalanitzador d'Android, sense violar l'EPL. Per exemple, no distribuir la llista amb el binari i baixar-la en tems d'execució? Només comentar que : 1.- dates.txt no està normalitzat a l'escala 0-255 d'Android. Caldria passar-ho a escala 0-255, potser aplicant una transformació no-lineal? 2.- dades.txt no he cmptat la freqüència de les locucions, que les tinc en un fitxer a part i caldria calcular-ne la freqüència... però bé... tampoc seria massa complex fer-ho si es vol fer servir aquest corpus. Joan Montané