
El dia 30 desembre de 2013 22.31, Jordi Mas <jmas@softcatala.org> ha escrit:
En un glossari generat computacionalment (com [1]), generar un glossari no flexionat requereix tècniques de processament del llenguatge natural (determinar el lexema, etc) i és una inversió significant de temps. No estic segur tampoc del valor que aporta a dia d'avui.
Aquesta és la diferència. En un glossari fet per humans, té sentit indicar
només la forma base, perquè és més compacte i requereix menys feina. Els humans interpretem ràpidament que si hi apareix copy, to|copiar|v. totes les formes flexionades "van igual". En un de generat computacionalment és justament a la inversa.
Aquesta és una decisió important.
Què en penseu?
Jordi, ¿podríem afegir informació manualment per a entrades concretes? per exemple, marcar manualment alguns verbs com a transitius (o intransitius) i el gènere d'algun terme confictiu. El repte de posar el glossari en format "human-friendly" és temptador, però no crec que pagui la pena invertir-hi tants recursos com caldrien per a fer-ho. Joan Montané