[Recursos] Decisió sobre el glossaris - formes flexionades vs no flexionades

Jordi Mas jmas a softcatala.org
dim des 31 00:12:24 CET 2013


Hola Joan,

> El dia 30 desembre de 2013 22.31, Jordi Mas <jmas a softcatala.org
> <mailto:jmas a softcatala.org>> ha escrit:
>
>
>     En un glossari generat computacionalment (com [1]), generar un
>     glossari no flexionat requereix tècniques de processament del
>     llenguatge natural (determinar el lexema, etc) i és una inversió
>     significant de temps. No estic segur tampoc del valor que aporta a
>     dia d'avui.
>
> Aquesta és la diferència. En un glossari fet per humans, té sentit
> indicar només la forma base, perquè és més compacte i requereix menys
> feina. Els humans interpretem ràpidament que si hi apareix copy,
> to|copiar|v. totes les formes flexionades "van igual". En un de generat
> computacionalment és justament a la inversa.

És la meva opinió també però no sóc cap expert en el tema.

> Jordi, ¿podríem afegir informació manualment per a entrades concretes?
> per exemple, marcar manualment alguns verbs com a transitius (o
> intransitius) i el gènere d'algun terme confictiu.

Hi ha dues opcions:

1) Sí, podem mantenir manualment una llista on tenim aquests termes i 
incloure en l'exportació final del glossari.

2) Intentar automatizar-ho

Sabem de quants termes estem parlant?

Com presentaríem aquesta informació a l'usuari?

> El repte de posar el glossari en format "human-friendly" és temptador,
> però no crec que pagui la pena invertir-hi tants recursos com caldrien
> per a fer-ho.

Per altra banda penso que crea una major distància entre el que fem 
nosaltres i el que fa el TERMCAT, que fins ara hi havia força semblança 
i superposició.

Parlant del TERMCAT, actualment estem marcant les formes recomanades[1] 
per ells. Ho publiquen sense flexionar[2]. En el nostre glossari, si hi 
ha coincidència en l'anglès i el català marquem la forma en color verd, 
si només en l'anglès afegim la seva forma (que alguns cops és 
flexionada). Veure l'entrada "automatic" per exemple. Independement del 
que fem en el glossari, potser si caldrà automatitzar la flexió del seu 
per tenir millor coincidència. Tampoc ho veig molt molt prioritari.

Atentament,

Jordi,

[1] http://recursos.softcatala.org/dev/terminologia/sc-glossary.html
[2] 
https://github.com/Softcatala/translation-memory-tools/blob/master/terminology/termcat/to_termes.xml
-- 
Jordi Mas i Hernàndez -Bloc: http://gent.softcatala.org/jmas/bloc/
Planet Softcatalà -> http://planeta.softcatala.org


Més informació sobre la llista de correu Recursos