[openoffice] Openthesaurus-ca

Joan Montané jmontane a gmail.com
diu jul 6 08:56:52 CEST 2008


Bon dia,

Primer de tot, aviso que aquest missatge es pot considerar una mica
off-topic, atès que no tracta estrictament de la traducció al català.

Fa mesos, bastants, cap a finals del 2006, vaig processar les dades
del Freeling per fer un diccionari de sinònims per a l'OOo. El petit
diccionari el vaig enviar a aquesta llista i allà es va quedar la
cosa, vaig abandonar el projecte.

Recentment, arran d'un missatge d'en Vicenç Mengual a una de les
llistes de desenvolupament de l'OOo demanant assessorament de com fer
fer un diccionari de sinònims, ens hem posat en contacte i he reprès
el tema amb una mica més d'empenta. En podríem dir el nostre projecte
d'estiu.
Ara mateix tinc al meu PC domèstic un sistema web tipus Openthesaurus
pel català en fase de proves (està accessible a: joan.montane.cat ).
L'Openthesaurus es va crear per l'alemany, i el fan servir també pel
neerlandès, noruec, polonès, portuguès, eslovac, eslovès i castellà.

Les dades que hi ha al sistema de proves són les del Freeling, la idea
és que els usuaris interessats (en som dos com a mínim) puguin anar
corregint, traient o afegint sinònims. Ja sé que això no és un wordnet
però partim de gairebé 3000 sinonímies i crec que és un servei que
seria prou útil. Si ho desitgeu podeu baixar-vos el diccionari i
provar-lo. Només cal copiar-lo a la mateixa carpeta que el diccionari
ortogràfic i modificar adientment el dictionary.lst que hi ha a la
mateixa carpeta.

L'Openthesaurus-ca permet cercar sinònims a qualsevol visitant i que
els usuaris registrats revisin, corregeixin, afegeixin o suprimeixin
dades en el sistema. També permet que els administradors generin els
diccionaris de sinònims amb facilitat a partir de les dades per a
diferents processadors de text i que qualsevol visitant és baixi els
diccionaris generats.

El sistema ara mateix és plenament funcional llevat de 3 problemes,
els dos primer greus per a una versió final:
1.- No envia correus als usuaris que es donen d'alta i per tant els
usuaris no reben mai la contrasenya (ho faig jo manualment)
2.- Tot el web i la base de dades està en utf8 peeeerò les consultes
surten en latin1, per tant les dades, només les dades, surten en
latin1
(també els diccionaris exportats). M'ho miro i remiro però no m'ensurto
3.- No sé per quin motiu però no exporta correctament en format kword i en ding


Havia pensat en crear un projecte dins de Softcatalà (similar al
corrector o traductor).  Què us en sembla?
Jo mateix m'encarregaria de muntar-lo i gestionar-lo (si ha de ser
algú altre per motius de permisos cap problema, jo m'ofereixo per
interès personal i per no carregar de feina algú amb un projecte d'uns
altres). Crec que podria ser un servei prou popular entre els usuaris,
ja que  tant en tant es fa aquesta consulta al fòrum. Fins i tot
s'enviava a la gent a un diccionari de sinònims blavero per manca
d'alternatives en línia. Afortunadament, aquest diccionari ara està
fora de línia i hi ha l'alternativa de l'Avui. Per poder fer fins i
tot es podria fer un motor de cerca pel Firefox.

En quant a la llicència, no en sóc cap expert. Les dades del Freeling
es poden considerar GPL o LGPL, ja que la versió 2.0 és GPL i
la 1.5 és LGPL i les dades són iguals (confirmat amb el responsable
del Freeling. Personalment preferiria llicència GPL, algun expert en
llicències en la llista?


Bé, estic obert a comentaris i suggeriments.

Atentament, Joan Montané.


Més informació sobre la llista de correu OpenOffice