
Ep, Avui he rebut el meu SGS3 reparat (el meu es va espatllar per un problema conegut com a «sudden death» que fa que el telèfon no mostri res en pantalla i si treus la bateria ja no torna a funcionar) amb una placa base nova i la versió més recent d'Android que té Samsung (v4.1.2). Aquesta versió incorpora un diccionari en català i també suporta el mode d'escriptura «Swype» (lliscant) que em va preguntar en Jordi Serratosa el dia de la presentació del Catalanitzador i que vam estar fent proves amb en Xavi Ivars mentre dinàvem. Jo ja havia vist que funcionés en català, però no recordava a quina versió i en Serratosa no ho podia activar al seu mòbil (no recordo quina versió d'Android té ell al seu telèfon) i reconeixia l'escriptura lliscant en altres idiomes (anglès, castellà...) però no pas en català. El tema és que, a més del suport per a l'escriptura lliscant, han afegit un corrector ortogràfic (d¡aquí la gràcia del «Swype» en català) i també té la freqüència, o almenys això sembla; en escriure un SMS la primera paraula que m'ofereix és «Hola» i si continuo escrivint va encertant (de vegades) el que vull escriure; ídem si ho provo al ChatON. Finalment, també té reconeixement per veu en català; és a dir, no cal escriure amb el teclat. Simplement parles i el va escrivint el que dius, estalviant-te deixar la pantalla amb ditades innecessàries. La put..nyeta és que no veig enlloc el tipus de llicència que utilitzen (el teclat lliscant pertany a Samsung i el reconeixement per veu és de Google). Normalment sempre hi ha un quadre «Quant a...» on pots veure la llicència (la majoria de vegades és sota llicència Apache) que fan servir les aplicacions del sistema, però en aquest cas no hi ha res. Ho comento perquè si ja existeix quelcom fet i té una llicència vàlida pel que necessitem nosaltres, ho podríem aprofitar i així no ens trenquem les banyes des de zero... Els meus 5 cèntims, Benny. Al 14/05/2013 09:39, En/na Joan Montané ha escrit:
Jordi (i altres)
El diccionari predictiu de l'Adaptxt és el millor que he trobat per a Android i funciona molt bé. Els hi vaig demanar ja fa uns dies si poden alliberar-les sota LGPL o similar, però sembla que passen de mi.
Faig entretenir-me uns dies a processar el corpus català de l'OpenAdaptxt llicència EPL v.1.0) i n'adjunto el resultat (el fitxer interessant és dades.txt). Aleshores, a nivell legal de llicències, potser podríem trobar algun sistema que permetés usar les dades amb el Catalanitzador d'Android, sense violar l'EPL. Per exemple, no distribuir la llista amb el binari i baixar-la en tems d'execució?
Només comentar que :
1.- dates.txt no està normalitzat a l'escala 0-255 d'Android. Caldria passar-ho a escala 0-255, potser aplicant una transformació no-lineal? 2.- dades.txt no he cmptat la freqüència de les locucions, que les tinc en un fitxer a part i caldria calcular-ne la freqüència... però bé... tampoc seria massa complex fer-ho si es vol fer servir aquest corpus.
Joan Montané
_______________________________________________ Catalanitzador mailing list Catalanitzador@llistes.softcatala.org http://llistes.softcatala.org/mailman/listinfo/catalanitzador _______________________________________________ Codi de conducta: http://www.softcatala.org/wiki/Codi_de_conducta