[Corrector] Wordlist d'Android

Xavi Ivars xavi.ivars a gmail.com
div gen 18 11:32:35 CET 2013


El 18 de gener de 2013 0.13, Jaume Ortolà i Font <jaumeortola a gmail.com> ha
escrit:

> El 17 de gener de 2013 22.19, Xavi Ivars <xavi.ivars a gmail.com> ha escrit:
>
>>
>> Podríem intentar establir contactes amb institucions (IEC? AVL?),
>> periòdics (ElPunt-Avui, Vilaweb, Ara...), universitats,... i a vore que
>> podem traure.
>>
>
> L'IEC té un corpus textual prou important [1]. Ara, són texts de quan
> encara no hi havia mòbils (1833-1988). L'accés que donen és molt limitat.
> La web només funciona en Internet Explorer! I ni tan sols es poden fer
> cerques contextuals (de més d'una paraula). Fabulós recurs desaprofitat.


> També hi ha un corpus creat a partir d'Internet (l'any 2004) d'un grup de
> la UPF [2].
>

A això em referia, a que alliberaren un corpus per poder treballar amb ell.
On ens poguérem baixar tots els textos sencers, no fer consultes de
paraules soltes mitjançant una interfície web. Això serviria tant per a
traure freqüències com per al que volies tu d'assegurar la qualitat del
corrector gramatical.

En l'últim projecte que vaig treballar a la UA vam aconseguir alliberar un
corpus històric prou important, però era d'obres en castellà (tampoc n'hi
havia cap lliure).



>
> Si és només per a crear una llista de freqüències, la Viquipèdia mateixa
> podria servir.
>
>
És el que vam fer per a l'Android, tirar de Wikipedia
-- 
< Xavi Ivars >
< http://xavi.ivars.me >
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20130118/d590a49b/attachment.html>


Més informació sobre la llista de correu Corrector