<br><br><div class="gmail_quote">El 18 de gener de 2013 0.13, Jaume Ortolà i Font <span dir="ltr"><<a href="mailto:jaumeortola@gmail.com" target="_blank">jaumeortola@gmail.com</a>></span> ha escrit:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">El 17 de gener de 2013 22.19, Xavi Ivars <span dir="ltr"><<a href="mailto:xavi.ivars@gmail.com" target="_blank">xavi.ivars@gmail.com</a>></span> ha escrit:<br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><br></div><div class="im"><div>Podríem intentar establir contactes amb institucions (IEC? AVL?), periòdics (ElPunt-Avui, Vilaweb, Ara...), universitats,... i a vore que podem traure.</div></div></blockquote></div><br>
L'IEC té un corpus textual prou important [1]. Ara, són texts de quan encara no hi havia mòbils (1833-1988). L'accés que donen és molt limitat. La web només funciona en Internet Explorer! I ni tan sols es poden fer cerques contextuals (de més d'una paraula). Fabulós recurs desaprofitat. </blockquote>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>
<br></div><div>També hi ha un corpus creat a partir d'Internet (l'any 2004) d'un grup de la UPF [2]. </div></blockquote><div><br></div><div>A això em referia, a que alliberaren un corpus per poder treballar amb ell. On ens poguérem baixar tots els textos sencers, no fer consultes de paraules soltes mitjançant una interfície web. Això serviria tant per a traure freqüències com per al que volies tu d'assegurar la qualitat del corrector gramatical.</div>
<div><br></div><div>En l'últim projecte que vaig treballar a la UA vam aconseguir alliberar un corpus històric prou important, però era d'obres en castellà (tampoc n'hi havia cap lliure).</div><div><br></div>
<div>
</div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><br></div><div>Si és només per a crear una llista de freqüències, la Viquipèdia mateixa podria servir.<br>
<div><br></div></div></blockquote><div><br></div><div>És el que vam fer per a l'Android, tirar de Wikipedia</div></div>-- <br>< Xavi Ivars ><br>< <a href="http://xavi.ivars.me" target="_blank">http://xavi.ivars.me</a> >