[Recursos] Terminologia per projecte
Jordi Mas
jmas a softcatala.org
div ago 7 21:30:58 CEST 2015
Hola Xavi,
> Hola,
>
> Hi ha alguna manera de generar "glossaris" automàticament a partir de
> cada projecte? Bàsicament, seria aplicar el que ja tenim a [1] però per
> projecte.
Es pot fer però tal com funciona el sistema només genera resultats
rellevants amb molt de corpus. Adjuntat tens l'exemple amb el projecte git.
El problema és que per no haver de fer alineaments de textos (que és un
problema complex) fem extracció de cadenes curtes, i llavors et cal molt
corpus per treure quelcom rellevant.
> El cas d'ús per a aquesta funcionalitat seria facilitar l'elaboració
> d'un glossari manual per a certs projectes en els que s'està treballant
> per donar-los consistència, a partir d'un glossari automàtic que
> s'utilitzaria com a esborrany.
>
> He estat parlant amb el traductor del Git al català (un noi dels EUA que
> no és catalanoparlant nadiu) i anem a intentar homogeneïtzar les
> traduccions tant del Git com del gitg, per exemple.
Això està molt bé. El git fa servir una traducció per curiosa.
> D'altra banda, sembla que les estadístiques que recollim sobre % d'ús de
> cada terme respecte a un terme en anglés no són massa acurats [2].
Ara mateix pel procés de selecció de termes i mostrar les coincidències
es fa servir el mateix corpus seleccionat: segments de menys de 3
paraules. Per això els números són tant petits. Es podria fer que un cop
seleccionat els termes els cerqués a tot el corpus però no està fet.
Jordi,
--
Jordi Mas i Hernàndez -Bloc: http://gent.softcatala.org/jmas/bloc/
Planet Softcatalà -> http://planeta.softcatala.org
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/recursos/attachments/20150807/4b9a9995/attachment-0001.html>
Més informació sobre la llista de correu Recursos