[Catalanitzador] Catalanitzador per a l'Android

Joan Montané joan a montane.cat
dim maig 14 09:39:32 CEST 2013


Jordi (i  altres)

El diccionari predictiu de l'Adaptxt és el millor que he trobat per a
Android i funciona molt bé. Els hi vaig demanar ja fa uns dies si poden
alliberar-les sota LGPL o similar, però sembla que passen de mi.

Faig  entretenir-me uns dies a processar el corpus català de l'OpenAdaptxt
llicència EPL v.1.0) i n'adjunto el resultat (el fitxer interessant és
dades.txt). Aleshores, a nivell legal de llicències, potser podríem trobar
algun sistema que permetés usar les dades amb el Catalanitzador d'Android,
sense violar l'EPL. Per exemple, no distribuir la llista amb el binari i
baixar-la en tems d'execució?

Només comentar que :

1.- dates.txt no està normalitzat a l'escala 0-255 d'Android. Caldria
passar-ho a escala 0-255, potser aplicant una transformació no-lineal?
2.- dades.txt no he cmptat la freqüència de les locucions, que les tinc en
un fitxer a part i caldria calcular-ne la freqüència... però bé... tampoc
seria massa complex fer-ho si es vol fer servir aquest corpus.

Joan Montané
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/catalanitzador/attachments/20130514/15dc2aeb/attachment-0001.html>
-------------- part següent --------------
A non-text attachment was scrubbed...
Name: dicc-freq.zip
Type: application/zip
Size: 562724 bytes
Desc: no disponible
URL: <http://llistes.softcatala.org/pipermail/catalanitzador/attachments/20130514/15dc2aeb/attachment-0001.zip>


Més informació sobre la llista de correu Catalanitzador