<div dir="ltr"><br><div class="gmail_extra"><br><br></div><div class="gmail_extra">Jordi (i  altres)<br><br> El diccionari predictiu de l'Adaptxt és el millor que he trobat per a Android i funciona molt bé. Els hi vaig demanar ja fa uns dies si poden alliberar-les sota LGPL o similar, però sembla que passen de mi.<br>
<br></div><div class="gmail_extra">Faig  entretenir-me uns dies a processar el corpus català de l'OpenAdaptxt llicència EPL v.1.0) i n'adjunto el resultat (el fitxer interessant és dades.txt). Aleshores, a nivell legal de llicències, potser podríem trobar algun sistema que permetés usar les dades amb el Catalanitzador d'Android, sense violar l'EPL. Per exemple, no distribuir la llista amb el binari i baixar-la en tems d'execució?<br>
<br></div><div class="gmail_extra">Només comentar que :<br><br>1.- dates.txt no està normalitzat a l'escala 0-255 d'Android. Caldria passar-ho a escala 0-255, potser aplicant una transformació no-lineal?<br>2.- dades.txt no he cmptat la freqüència de les locucions, que les tinc en un fitxer a part i caldria calcular-ne la freqüència... però bé... tampoc seria massa complex fer-ho si es vol fer servir aquest corpus.<br>
<br></div><div class="gmail_extra">Joan Montané<br></div><div class="gmail_extra"><br><br></div></div>