[Recursos] Terminologia per projecte

Jordi Mas jmas a softcatala.org
div ago 7 21:30:58 CEST 2015


Hola Xavi,

> Hola,
>
> Hi ha alguna manera de generar "glossaris" automàticament a partir de
> cada projecte? Bàsicament, seria aplicar el que ja tenim a [1] però per
> projecte.

Es pot fer però tal com funciona el sistema només genera resultats 
rellevants amb molt de corpus.  Adjuntat tens l'exemple amb el projecte git.

El problema és que per no haver de fer alineaments de textos (que és un 
problema complex) fem extracció de cadenes curtes, i llavors et cal molt 
corpus per treure quelcom rellevant.

> El cas d'ús per a aquesta funcionalitat seria facilitar l'elaboració
> d'un glossari manual per a certs projectes en els que s'està treballant
> per donar-los consistència, a partir d'un glossari automàtic que
> s'utilitzaria com a esborrany.
>
> He estat parlant amb el traductor del Git al català (un noi dels EUA que
> no és catalanoparlant nadiu) i anem a intentar homogeneïtzar les
> traduccions tant del Git com del gitg, per exemple.

Això està molt bé. El git fa servir una traducció per curiosa.

> D'altra banda, sembla que les estadístiques que recollim sobre % d'ús de
> cada terme respecte a un terme en anglés no són massa acurats [2].

Ara mateix pel procés de selecció de termes i mostrar les coincidències 
es fa servir el mateix corpus seleccionat: segments de menys de 3 
paraules. Per això els números són tant petits. Es podria fer que un cop 
seleccionat els termes els cerqués a tot el corpus però no està fet.

Jordi,

-- 
Jordi Mas i Hernàndez -Bloc: http://gent.softcatala.org/jmas/bloc/
Planet Softcatalà -> http://planeta.softcatala.org
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/recursos/attachments/20150807/4b9a9995/attachment-0001.html>


Més informació sobre la llista de correu Recursos