[Recursos] Decisió sobre el glossaris - formes flexionades vs no flexionades
Joan Montané
joan a montane.cat
dll des 30 22:41:19 CET 2013
El dia 30 desembre de 2013 22.31, Jordi Mas <jmas a softcatala.org> ha escrit:
>
> En un glossari generat computacionalment (com [1]), generar un glossari no
> flexionat requereix tècniques de processament del llenguatge natural
> (determinar el lexema, etc) i és una inversió significant de temps. No
> estic segur tampoc del valor que aporta a dia d'avui.
>
> Aquesta és la diferència. En un glossari fet per humans, té sentit indicar
només la forma base, perquè és més compacte i requereix menys feina. Els
humans interpretem ràpidament que si hi apareix copy, to|copiar|v. totes
les formes flexionades "van igual". En un de generat computacionalment és
justament a la inversa.
> Aquesta és una decisió important.
>
Què en penseu?
>
>
Jordi, ¿podríem afegir informació manualment per a entrades concretes? per
exemple, marcar manualment alguns verbs com a transitius (o intransitius) i
el gènere d'algun terme confictiu.
El repte de posar el glossari en format "human-friendly" és temptador, però
no crec que pagui la pena invertir-hi tants recursos com caldrien per a
fer-ho.
Joan Montané
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/recursos/attachments/20131230/75ffd074/attachment.html>
Més informació sobre la llista de correu Recursos