<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">El dia 19 desembre de 2013 20.37, Jordi Mas <span dir="ltr"><<a href="mailto:jmas@softcatala.org" target="_blank">jmas@softcatala.org</a>></span> ha escrit:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Ep gent,<br>
<br>
Un cop el tema de les memòries de traducció bastant resolt i completament automatitzat he començat a treballar en com solucionar la generació del Recull de termes. El meu objectiu és crear un sistema que produeix el recurs sense intervenció humana. No serà trivial.<br>
<br>
Aquí hi ha una descripció de les primeres idees:<br>
<a href="http://www.softcatala.org/wiki/Extracci%C3%B3_terminol%C3%B2gica" target="_blank">http://www.softcatala.org/<u></u>wiki/Extracci%C3%B3_terminol%<u></u>C3%B2gica</a><br>
<br>
Tenim ja alguna cosa funcionant. Al principi i final dels HTML hi ha documentació però la diferència entre les 4 proves és només quins corpus usem (no dels algorismes):<br>
<br>
1) <a href="http://recursos.softcatala.org/dev/terminology/all-glossary.html" target="_blank">http://recursos.softcatala.<u></u>org/dev/terminology/all-<u></u>glossary.html</a><br>
2) <a href="http://recursos.softcatala.org/dev/terminology/all-tm-glossary.html" target="_blank">http://recursos.softcatala.<u></u>org/dev/terminology/all-tm-<u></u>glossary.html</a><br>
3) <a href="http://recursos.softcatala.org/dev/terminology/sc-glossary.html" target="_blank">http://recursos.softcatala.<u></u>org/dev/terminology/sc-<u></u>glossary.html</a><br>
4) <a href="http://recursos.softcatala.org/dev/terminology/sc-tm-glossary.html" target="_blank">http://recursos.softcatala.<u></u>org/dev/terminology/sc-tm-<u></u>glossary.html</a><br>
<br>
Els termes estan ordenats de més popular a menys. Aquestes proves inicials s'enfoquen en la selecció de termes com a primera part a solucionar més que en que siguin una eina útil.<br>
<br>
Malgrat queden moltes coses per resoldre, els primers resultats són esperançadors. Si agafem el 4) glossari generat automàticament, veureu que dels 100 primeres termes un 74% dels termes coincideixen amb el Recull. I dels que no, hi ha molts que per un bon motiu (yes, no).<br>
<br>
Veureu que aquesta eina també obre la porta a millorar la terminologia emprada ja que dóna molta visibilitat d'incoherències.<br>
<br>
Si teniu preguntes inicials o suggeriments comencem a parlar. La meva estimació inicial és que trigarem de 3 a 6 mesos a resoldre aquest problema.<br>
<br></blockquote><div><br></div><div>Jordi, em sembla una iniciativa apassionant, sincerament.</div><div><br></div><div>He afegit un parell de suggeriments a la pàgina wiki, amb idees de com podríem resoldre alguna de les preguntes obertes.</div>
<div><br></div><div>Anem parlant-ne.</div></div>-- <br>< Xavi Ivars ><br>< <a href="http://xavi.ivars.me" target="_blank">http://xavi.ivars.me</a> >
</div></div>