[Recursos] Decisió sobre el glossaris - formes flexionades vs no flexionades

Joan Montané joan a montane.cat
dll des 30 22:41:19 CET 2013


El dia 30 desembre de 2013 22.31, Jordi Mas <jmas a softcatala.org> ha escrit:

>
> En un glossari generat computacionalment (com [1]), generar un glossari no
> flexionat requereix tècniques de processament del llenguatge natural
> (determinar el lexema, etc) i és una inversió significant de temps. No
> estic segur tampoc del valor que aporta a dia d'avui.
>
> Aquesta és la diferència. En un glossari fet per humans, té sentit indicar
només la forma base, perquè és més compacte i requereix menys feina. Els
humans interpretem ràpidament que si hi apareix copy, to|copiar|v. totes
les formes flexionades "van igual". En un de generat computacionalment és
justament a la inversa.


> Aquesta és una decisió important.
>

Què en penseu?
>
>
Jordi, ¿podríem afegir informació manualment per a entrades concretes? per
exemple, marcar manualment alguns verbs com a transitius (o intransitius) i
el gènere d'algun terme confictiu.

El repte de posar el glossari en format "human-friendly" és temptador, però
no crec que pagui la pena invertir-hi tants recursos com caldrien per a
fer-ho.

Joan Montané
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/recursos/attachments/20131230/75ffd074/attachment.html>


Més informació sobre la llista de correu Recursos