<br><br><div class="gmail_quote">El 17 de gener de 2013 20.21, Joan Montané <span dir="ltr"><<a href="mailto:joan@montane.cat" target="_blank">joan@montane.cat</a>></span> ha escrit:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div dir="ltr">el problema no és generar la llista de paraules, el problema és assignar-li una freqüència, de forma que la predicció de paraules prioritzi un mot o un altre. Caldria un corpus molt gran i, posats a triar, que estigués basat en correus electrònics, xats i converses "informals".<div>


<br></div><div>Fa uns anys vaig afegir aquest diccionari a l'ASK [1], no és cap meravella, ho he de reconèixer. Ara el motor predictiu corrector va aprenent, per tant potser és més útil. Les dades crec recordar les va proporcionar algun company de SC, en Xavier Caballé potser?</div>


<div><br></div></div></blockquote><div><br></div><div>Si no recorde malament, crec que jo et vaig passar alguna cosa. Crec que un dels objectius que hauríem de plantejar-nos seriosament a SC és recopilar un corpus gran i lliure en català.</div>

<div><br></div><div>Podríem intentar establir contactes amb institucions (IEC? AVL?), periòdics (ElPunt-Avui, Vilaweb, Ara...), universitats,... i a vore que podem traure.</div></div><div><br></div>-- <br>< Xavi Ivars ><br>

< <a href="http://xavi.ivars.me" target="_blank">http://xavi.ivars.me</a> >