[Corrector] Resum de Corrector, vol 31, número 13 - Freqüència de paraules

Israel Planagumà israelplanaguma a gmail.com
div gen 18 14:07:08 CET 2013


Hola,

Jo des de la meva ignorància sobre el tema, faig una aportació.

Tinc el SwiftKey 3, un teclat de pagament per Android. Té català, i la
veritat és que la predicció de paraules és molt impressionant. No sé si
han fet servir cap corpus, crec que directament el programa aprèn del
que escriu cada usuari i dels altres usuaris, si s'activa una opció de
compartir el que s'aprèn.

El problema d'aquest programa és que no permet seleccionar la llengua
d'entrada, fa servir fins a 3 llengües alhora (encara que molta gent, al
final, barreja llengües quan escriu, i no parlo només de català i
castellà, també als EUA barregen castellà i anglès els hispans). Però
fins i tot amb aquest problema, la predicció és molt bona. Per exemple,
si vull escriure:

"Et truco a la mitja part del Barça", tenint activat català, castellà i
anglès:

1. Et - proposa "Et".
2. t - proposa "truco".
3. a - proposa "a".
4. Proposa "la".
5. mit - proposa "mitja".
6. Proposa "part".
7. d - proposa "del".
8. B - proposa "Barça".

Per tant, picant: "et t a mit d B" ja tens la frase (i seleccionant les
opcions quan apareixen).

Vull dir que potser el corpus és necessari per d'altres usos, però per a
l'escriptura predictiva?

D'altra banda, jo era un purista de tota la vida, però sincerament
l'IEC, la Real Academia de la Lengua i d'altres no s'adapten al ritme
d'avui en dia. En anglès no hi ha "organismes oficials" que diguin què
està bé i què està malament. Les universitats (Oxford, Cambridge...) i
les empreses (Merriam-Webster, HarperCollins, Hasbro -els de l'Scrabble)
editen els seus diccionaris, i això és el que val -i hi ha diferències
entre els diccionaris. No sé quina visió té SC sobre aquest tema, potser
no és el millor lloc per preguntar, però se m'ha acudit ara.

Salut.

Israel Planagumà
israelplanaguma a gmail.com
PGP key: 0x3AC33747

Al 1/18/2013 12:00 PM, En/na corrector-request a llistes.softcatala.org ha
escrit:
> Envieu les aportacions de Corrector a la llista de correu a
> 	corrector a llistes.softcatala.org
>
> Per a subscriure-us o cancel·lar subscripcions a través de la web,
> aneu a
> 	http://llistes.softcatala.org/mailman/listinfo/corrector
> o bé, si voleu utilitzar el correu electrònic, envieu un missatge
> amb la paraula «help» a l'assumpte o al cos del missatge, adreçat a
> 	corrector-request a llistes.softcatala.org
>
> Podeu dirigir-vos a la persona encarregada de la gestió de la llista
> a
> 	corrector-owner a llistes.softcatala.org
>
> En respondre, és recomanable que editeu la línia de l'Assumpte, de
> manera que sigui més específica que "Re: Contents of Corrector
> digest..."
>
>
> Temes d'avui:
>
>    1. Re: LanguageTool amb editor online (Xavi Ivars)
>    2. Re: Wordlist d'Android (Xavi Ivars)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Fri, 18 Jan 2013 11:28:52 +0100
> From: Xavi Ivars <xavi.ivars a gmail.com>
> To: Desenvolupament de correctors ortogràfics i gramaticals
> 	<corrector a llistes.softcatala.org>
> Subject: Re: [Corrector] LanguageTool amb editor online
> Message-ID:
> 	<CAPrYy1T-+vA1Aj9JC7+CrR+YQ76MtjWh1OWj568+yvhjPtDU8w a mail.gmail.com>
> Content-Type: text/plain; charset="utf-8"
>
> El 18 de gener de 2013 9.28, Jaume Ortolà i Font <jaumeortola a gmail.com> ha
> escrit:
>
>> El 17 de gener de 2013 10.30, Xavi Ivars <xavi.ivars a gmail.com> ha escrit:
>>
>> També acabe de veure el correu que has enviat ara a la llista de LT. I si,
>>> la idea que tenia jo era d'instal·lar LT als nostres servidors; el que no
>>> sé és si utilitzant el propi servidor web que duu el programa o si és
>>> millor executar-lo d'alguna altra manera sobre un servidor estàndard. Quan
>>> arribe el moment d'instal·lar-lo, ja ho parlarem amb la gent de sistemes.
>>
>> Ja deus haver vist la resposta en la llista. No té cap dificultat.
>> Simplement hem d'instal·lar el programa on vulguem i executar-lo en mode
>> servidor.[1] Pel que fa a les opcions de configuració que necessitem, ens
>> ho hauríem d'arreglar nosaltres al nostre gust en PHP/Javascript. Podem fer
>> servir el mateix editor web que en la pàgina de LanguageTool.[2]
>>
>> Per a fer-ho bé, hi haurien d'haver unes poques opcions molt simples a la
>> vista, i per altra banda, un desplegable amagat que permeta canviar més
>> opcions a qui ho vulga o ho necessite.
>>
>>
> Si, això haurem de pensar bé com ho fem per a que siga fàcil.
>
>
>> Respecte a les teues preguntes sobre les variants regionals. La variant
>> balear es refereix bàsicament a formes verbals (pens, pensàssim). El
>> valencià té algunes coses més: formes verbals (pense, exigix/exigeix),
>> accentuació opcional (cafè/café), demostratius (aquest/este). Hi ha algunes
>> coses de vocabulari, però és anecdòtic (per exemple: "novia", paraula
>> plana, usada en balear, sol ser un error en les altres variants).
>>
>> Pel que fa al nord-occidental, pel que jo sé, no cal que el considerem com
>> un estàndard escrit diferent. Sé que en algunes zones de Catalunya
>> reivindiquen certs usos (meua per meva, formes verbals en -ixo,...), però
>> no té gaire transcendència, crec.
>>
> Si, jo també pense el mateix, però sent així "central" no s'ajusta a la
> variant "català de Catalunya". Supose que podríem deixar-ho semblant a com
> està ara  "general", "valencià" i "balear" (afegint "balear", que ara no
> n'hi ha).
>
> Per curiositat: la variant "balear" també està implementada als fitxers de
> (a|i|my|hun)spell? O directament sobre LT?


-------------- part següent --------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/pkcs7-signature
Size: 5896 bytes
Desc: Signatura criptogràfica S/MIME
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20130118/6a418abb/attachment.bin>


Més informació sobre la llista de correu Corrector