[openoffice] Openthesaurus-ca

Bon dia, Primer de tot, aviso que aquest missatge es pot considerar una mica off-topic, atès que no tracta estrictament de la traducció al català. Fa mesos, bastants, cap a finals del 2006, vaig processar les dades del Freeling per fer un diccionari de sinònims per a l'OOo. El petit diccionari el vaig enviar a aquesta llista i allà es va quedar la cosa, vaig abandonar el projecte. Recentment, arran d'un missatge d'en Vicenç Mengual a una de les llistes de desenvolupament de l'OOo demanant assessorament de com fer fer un diccionari de sinònims, ens hem posat en contacte i he reprès el tema amb una mica més d'empenta. En podríem dir el nostre projecte d'estiu. Ara mateix tinc al meu PC domèstic un sistema web tipus Openthesaurus pel català en fase de proves (està accessible a: joan.montane.cat ). L'Openthesaurus es va crear per l'alemany, i el fan servir també pel neerlandès, noruec, polonès, portuguès, eslovac, eslovès i castellà. Les dades que hi ha al sistema de proves són les del Freeling, la idea és que els usuaris interessats (en som dos com a mínim) puguin anar corregint, traient o afegint sinònims. Ja sé que això no és un wordnet però partim de gairebé 3000 sinonímies i crec que és un servei que seria prou útil. Si ho desitgeu podeu baixar-vos el diccionari i provar-lo. Només cal copiar-lo a la mateixa carpeta que el diccionari ortogràfic i modificar adientment el dictionary.lst que hi ha a la mateixa carpeta. L'Openthesaurus-ca permet cercar sinònims a qualsevol visitant i que els usuaris registrats revisin, corregeixin, afegeixin o suprimeixin dades en el sistema. També permet que els administradors generin els diccionaris de sinònims amb facilitat a partir de les dades per a diferents processadors de text i que qualsevol visitant és baixi els diccionaris generats. El sistema ara mateix és plenament funcional llevat de 3 problemes, els dos primer greus per a una versió final: 1.- No envia correus als usuaris que es donen d'alta i per tant els usuaris no reben mai la contrasenya (ho faig jo manualment) 2.- Tot el web i la base de dades està en utf8 peeeerò les consultes surten en latin1, per tant les dades, només les dades, surten en latin1 (també els diccionaris exportats). M'ho miro i remiro però no m'ensurto 3.- No sé per quin motiu però no exporta correctament en format kword i en ding Havia pensat en crear un projecte dins de Softcatalà (similar al corrector o traductor). Què us en sembla? Jo mateix m'encarregaria de muntar-lo i gestionar-lo (si ha de ser algú altre per motius de permisos cap problema, jo m'ofereixo per interès personal i per no carregar de feina algú amb un projecte d'uns altres). Crec que podria ser un servei prou popular entre els usuaris, ja que tant en tant es fa aquesta consulta al fòrum. Fins i tot s'enviava a la gent a un diccionari de sinònims blavero per manca d'alternatives en línia. Afortunadament, aquest diccionari ara està fora de línia i hi ha l'alternativa de l'Avui. Per poder fer fins i tot es podria fer un motor de cerca pel Firefox. En quant a la llicència, no en sóc cap expert. Les dades del Freeling es poden considerar GPL o LGPL, ja que la versió 2.0 és GPL i la 1.5 és LGPL i les dades són iguals (confirmat amb el responsable del Freeling. Personalment preferiria llicència GPL, algun expert en llicències en la llista? Bé, estic obert a comentaris i suggeriments. Atentament, Joan Montané.

Personalment, no et puc ajudar en els problemes tècnics, però trobo el projecte interessantíssim. Penso que m'hi donaré d'alta per contribuir-hi una mica. Oriol El 6 / juliol / 2008 08:56, Joan Montané <jmontane@gmail.com> ha escrit:
Bon dia,
Primer de tot, aviso que aquest missatge es pot considerar una mica off-topic, atès que no tracta estrictament de la traducció al català.
Fa mesos, bastants, cap a finals del 2006, vaig processar les dades del Freeling per fer un diccionari de sinònims per a l'OOo. El petit diccionari el vaig enviar a aquesta llista i allà es va quedar la cosa, vaig abandonar el projecte.
Recentment, arran d'un missatge d'en Vicenç Mengual a una de les llistes de desenvolupament de l'OOo demanant assessorament de com fer fer un diccionari de sinònims, ens hem posat en contacte i he reprès el tema amb una mica més d'empenta. En podríem dir el nostre projecte d'estiu. Ara mateix tinc al meu PC domèstic un sistema web tipus Openthesaurus pel català en fase de proves (està accessible a: joan.montane.cat ). L'Openthesaurus es va crear per l'alemany, i el fan servir també pel neerlandès, noruec, polonès, portuguès, eslovac, eslovès i castellà.
Les dades que hi ha al sistema de proves són les del Freeling, la idea és que els usuaris interessats (en som dos com a mínim) puguin anar corregint, traient o afegint sinònims. Ja sé que això no és un wordnet però partim de gairebé 3000 sinonímies i crec que és un servei que seria prou útil. Si ho desitgeu podeu baixar-vos el diccionari i provar-lo. Només cal copiar-lo a la mateixa carpeta que el diccionari ortogràfic i modificar adientment el dictionary.lst que hi ha a la mateixa carpeta.
L'Openthesaurus-ca permet cercar sinònims a qualsevol visitant i que els usuaris registrats revisin, corregeixin, afegeixin o suprimeixin dades en el sistema. També permet que els administradors generin els diccionaris de sinònims amb facilitat a partir de les dades per a diferents processadors de text i que qualsevol visitant és baixi els diccionaris generats.
El sistema ara mateix és plenament funcional llevat de 3 problemes, els dos primer greus per a una versió final: 1.- No envia correus als usuaris que es donen d'alta i per tant els usuaris no reben mai la contrasenya (ho faig jo manualment) 2.- Tot el web i la base de dades està en utf8 peeeerò les consultes surten en latin1, per tant les dades, només les dades, surten en latin1 (també els diccionaris exportats). M'ho miro i remiro però no m'ensurto 3.- No sé per quin motiu però no exporta correctament en format kword i en ding
Havia pensat en crear un projecte dins de Softcatalà (similar al corrector o traductor). Què us en sembla? Jo mateix m'encarregaria de muntar-lo i gestionar-lo (si ha de ser algú altre per motius de permisos cap problema, jo m'ofereixo per interès personal i per no carregar de feina algú amb un projecte d'uns altres). Crec que podria ser un servei prou popular entre els usuaris, ja que tant en tant es fa aquesta consulta al fòrum. Fins i tot s'enviava a la gent a un diccionari de sinònims blavero per manca d'alternatives en línia. Afortunadament, aquest diccionari ara està fora de línia i hi ha l'alternativa de l'Avui. Per poder fer fins i tot es podria fer un motor de cerca pel Firefox.
En quant a la llicència, no en sóc cap expert. Les dades del Freeling es poden considerar GPL o LGPL, ja que la versió 2.0 és GPL i la 1.5 és LGPL i les dades són iguals (confirmat amb el responsable del Freeling. Personalment preferiria llicència GPL, algun expert en llicències en la llista?
Bé, estic obert a comentaris i suggeriments.
Atentament, Joan Montané.
_______________________________________________ OpenOffice mailing list OpenOffice@llistes.softcatala.org http://llistes.softcatala.org/mailman/listinfo/openoffice
participants (2)
-
Joan Montané
-
Oriol Gordó i Casanovas