Re: [Desenvolupament] [Forum] Client per l'Android del Traductor de Softcatalà

Jordi, movem la conversa a la llista de desenvolupament millor, ok? El 19 d’agost de 2011 10:00, Jordi Mas <jmas@softcatala.org> ha escrit:
Hola Xavi,
Com a mínim, jo afegiria al Toni i al Pau. També a tot aquell que tingues interès
Fet
Jo crec que sent els pocs que som el millor seria que la gent treballés directament sobre la branca principal. Aquests tipus de fluxes de treball no són senzills i penso que tenim temps d'adoptar-los quan tinguem la necessitat.
Ok, doncs sobre la branca principal. Al cap i a la fi, al ser una branca remota, ja es fan els "merge" que toque des de les branques locals de cadascú.
Dos qüestions:
- Tens previst treballar en alguna de les idees de millora de la versió d'Android?[1] Si és així, en quines dates aproximadament. El que ha enviat el Toni fa poc com a millores d'UI ho estic mirant jo ja avui.
Pensava dedicar-li temps a partir de la setmana que ve. Si alguna de les millores que ha proposat Toni no la pots fer, ja me n'encarregue jo d'acabar-la.
- El traductor té un problema greu. Si tecleges les paraules sense accent no les reconeix. Per exemple "el camion", quan ho tradueixes castellà -> català et diu "el *camion". Hi ha cap manera de que intenti esbrinar els accents? Això realment és un inconvenient.
De moment, no hi ha cap manera de fer-ho. Ha estat proposat per Apertium com a idea al GSoC durant un parell d'anys [1], però ningú ho ha implementat encara. I realment seria una gran millora. [1] http://wiki.apertium.org/wiki/Ideas_for_Google_Summer_of_Code/Automatic_diac... -- < Xavi Ivars > < http://xavi.ivars.me >

Hola,
Jordi, movem la conversa a la llista de desenvolupament millor, ok?
Sí, cap problema.
Ok, doncs sobre la branca principal. Al cap i a la fi, al ser una branca remota, ja es fan els "merge" que toque des de les branques locals de cadascú.
D'acord.
Dos qüestions: - Tens previst treballar en alguna de les idees de millora de la versió d'Android?[1] Si és així, en quines dates aproximadament. El que ha enviat el Toni fa poc com a millores d'UI ho estic mirant jo ja avui.
Pensava dedicar-li temps a partir de la setmana que ve. Si alguna de les millores que ha proposat Toni no la pots fer, ja me n'encarregue jo d'acabar-la.
He posat el meu nom al costat de les idees de millores que tinc previst treballar-hi: http://www.softcatala.org/wiki/Projectes/Traductor#Client_Android T'aconsello que facis el mateix.
- El traductor té un problema greu. Si tecleges les paraules sense accent no les reconeix. Per exemple "el camion", quan ho tradueixes castellà -> català et diu "el *camion". Hi ha cap manera de que intenti esbrinar els accents? Això realment és un inconvenient.
De moment, no hi ha cap manera de fer-ho. Ha estat proposat per Apertium com a idea al GSoC durant un parell d'anys [1], però ningú ho ha implementat encara. I realment seria una gran millora.
En l'anglès no és tant important perquè no té accents però en les llengües romàniques això és un entrebanc important per l'ús del traductor des de mòbil. Malgrat això sigui el camí descrit sigui correcte a llarg plaç, quina és l'opinió d'implementar Soundex[1], Metaphone[2] que són molt més senzills com a solució a curt plaç? Ho dic perquè si Apertium té una una arquitectura prou modular es podrien fer implementar ràpidament com a pre-processadors del llenguatge origen i alguna cosa guanyaríem. Atentament, Jordi, [1] http://en.wikipedia.org/wiki/Soundex [2] http://en.wikipedia.org/wiki/Metaphone -- Jordi Mas i Hernàndez -Bloc: http://gent.softcatala.org/jmas/bloc/ Planet Softcatalà -> http://planeta.softcatala.org Play on-line brain teasers at http://www.gbrainy.com

El 19 d’agost de 2011 19:28, Jordi Mas <jmas@softcatala.org> ha escrit:
He posat el meu nom al costat de les idees de millores que tinc previst treballar-hi:
T'aconsello que facis el mateix.
Perfecte, ho fem així.
- El traductor té un problema greu. Si tecleges les paraules sense
accent no les reconeix. Per exemple "el camion", quan ho tradueixes castellà -> català et diu "el *camion". Hi ha cap manera de que intenti esbrinar els accents? Això realment és un inconvenient.
De moment, no hi ha cap manera de fer-ho. Ha estat proposat per Apertium com a idea al GSoC durant un parell d'anys [1], però ningú ho ha implementat encara. I realment seria una gran millora.
En l'anglès no és tant important perquè no té accents però en les llengües romàniques això és un entrebanc important per l'ús del traductor des de mòbil.
Malgrat això sigui el camí descrit sigui correcte a llarg plaç, quina és l'opinió d'implementar Soundex[1], Metaphone[2] que són molt més senzills com a solució a curt plaç?
Ho dic perquè si Apertium té una una arquitectura prou modular es podrien fer implementar ràpidament com a pre-processadors del llenguatge origen i alguna cosa guanyaríem.
Segur que es pot fer, Apertium funciona tot amb pipelines d'Unix, i podem posar els moduls que vulguem sense problema. El que no sé és com tens idea d'implementar alguna d'eixes coses per a "accentuar" paraules mal accentuades. La única idea que se m'havia acudit a mi era integrar el corrector al formulari del traductor. -- < Xavi Ivars > < http://xavi.ivars.me >

Hola Xavi,
En l'anglès no és tant important perquè no té accents però en les llengües romàniques això és un entrebanc important per l'ús del traductor des de mòbil.
Malgrat això sigui el camí descrit sigui correcte a llarg plaç, quina és l'opinió d'implementar Soundex[1], Metaphone[2] que són molt més senzills com a solució a curt plaç?
Ho dic perquè si Apertium té una una arquitectura prou modular es podrien fer implementar ràpidament com a pre-processadors del llenguatge origen i alguna cosa guanyaríem.
Segur que es pot fer, Apertium funciona tot amb pipelines d'Unix, i podem posar els moduls que vulguem sense problema. El que no sé és com tens idea d'implementar alguna d'eixes coses per a "accentuar" paraules mal accentuades. La única idea que se m'havia acudit a mi era integrar el corrector al formulari del traductor.
Com bé dius, la idea seria re-usar la implementació ja existent en algun corrector ortogràfic. Abans de començar, vull dir que el cas d'ús que intentem solucionar és evitar com a no reconegudes paraules sense accent (per exemple 'pero' en comptes de 'però') ja que en dispositius mòbils la gent tendeix a no possar-los. No intentem corregir altres errades ortogràfiques (proba, adresa, etc) o tipogràfiques. El cas d'ús que intentem solucionar està molt acotat. Jo suggeriria usar Hunspell[1], que és força popular [2], i que moltes aplicacions ja usen. Amb pipelines seria molt senzill, potser es pot fer amb línia de comandes o sinó de forma molt senzilla usant l'API[3]. La meva idea és: - Quan fem la petició al servidor[3], poguéssim incloure un paràmetre com ara "autocorrect=yes". Quan aquest paràmetre està actiu, el text a traduir es passa pel filtre del Hunspell abans d'enviar-lo al traductor. - Passem el text pel Hunspell, per les paraules que no trobi al diccionari cal demanar-li els suggeriments seguint aquesta lògica: si hi ha cap dels suggeriments que ignorant els accents és té els mateixos caràcters (camió vs camió, pero vs però), reemplacem el mot pel suggerit, sinó ignorem el suggeriment (adresa per exemple suggeriria adreça, adesa, etc). - Un cop el text corregit, s'envia al traductor (està entre mig). Si ho féssim, penso que seria interessa documentar-ho a la web d'Apertium, ja que potser interessant per altre gent treballant amb llengües amb accents. Com ho veus? Atentament, Jordi, [1] http://hunspell.sourceforge.net/ [2] http://en.wikipedia.org/wiki/Hunspell#Uses http://switch.dl.sourceforge.net/project/hunspell/Hunspell/Documentation/hun... [3] http://www.softcatala.org/apertium/json/translate -- Jordi Mas i Hernàndez -Bloc: http://gent.softcatala.org/jmas/bloc/ Planet Softcatalà -> http://planeta.softcatala.org Play on-line brain teasers at http://www.gbrainy.com

Jordi, tornant al tema de l'accentuació... He trobat accentuate.us [1] Hi ha suport al català, però no està habilitat (necessiten ajuda amb servidors). Potser podríem instalar un node en els servidors de Softcatalà, no creus? Està basat en charlifter [2][3], que és programari lliure, i està fet en Perl (tot i que hi ha una mitja-implementació en C++ [4]) Es pot provar [5], i funciona prou bé *No se si aco anira correctament, o si haure d'afegir molts mots nous. * => * No se si açò anirà correctament, o si hauré d'afegir molts mots nous. * [1] http://accentuate.us [2] http://wiki.apertium.org/wiki/Charlifter [3] http://sourceforge.net/projects/lingala/files/charlifter/ [4] https://apertium.svn.sourceforge.net/svnroot/apertium/branches/gsoc2011/char... [5] http://logipam.org/charlifter/index.php -- < Xavi Ivars > < http://xavi.ivars.me >

En/na Xavi Ivars ha escrit:
Jordi, tornant al tema de l'accentuació...
He trobat accentuate.us <http://accentuate.us> [1]
Hi ha suport al català, però no està habilitat (necessiten ajuda amb servidors). Potser podríem instalar un node en els servidors de Softcatalà, no creus?
Està basat en charlifter [2][3], que és programari lliure, i està fet en Perl (tot i que hi ha una mitja-implementació en C++ [4])
Es pot provar [5], i funciona prou bé
/No se si aco anira correctament, o si haure d'afegir molts mots nous. / => / No se si açò anirà correctament, o si hauré d'afegir molts mots nous. /
[1] http://accentuate.us <http://accentuate.us/> [2] http://wiki.apertium.org/wiki/Charlifter [3] http://sourceforge.net/projects/lingala/files/charlifter/ [4] https://apertium.svn.sourceforge.net/svnroot/apertium/branches/gsoc2011/char... [5] http://logipam.org/charlifter/index.php
Bona trobada Ho aplicariquem només a peticions mòbils o tothom? Caldria veure si té un impacte notable en rendiment. Salut, Jordi, -- Jordi Mas i Hernàndez -Bloc: http://gent.softcatala.org/jmas/bloc/ Planet Softcatalà -> http://planeta.softcatala.org Play on-line brain teasers at http://www.gbrainy.com
participants (2)
-
Jordi Mas
-
Xavi Ivars