[Corrector] LanguageTool 2.0

Jaume Ortolà i Font jaumeortola a gmail.com
dll gen 7 12:52:06 CET 2013


Gràcies pels comentaris sobre LanguageTool

Us explique breument les debilitats que encara té el corrector.

En primer lloc, les falses alarmes: encara en dóna massa. La millor manera
de millorar en aquest aspecte és passar el corrector per un corpus
lingüístic de bona qualitat, i amb aquesta informació (que majoritàriament
han de ser falses alarmes) anar corregint el diccionari i les regles
gramaticals. Això també serveix per a augmentar el repertori de noms
propis. Jo, fins ara, he treballat amb la Viquipèdia, però la qualitat
mitjana que té es pot considerar baixa. Ara he començat a treballar amb
texts de més qualitat, ben corregits, que he pogut aconseguir (la Bíblia i *El
quadern gris* de Josep Pla...), i així avance molt més de pressa. Em
podríeu ajudar molt facilitant-me texts de qualitat per a crear aquest
"corpus". També serviria una col·lecció d'articles seleccionats de qualitat
de la Viquipèdia, o reculls de premsa (millor les versions en paper, més
ben corregides que versions web). Seria molt útil tindre un conveni amb
alguna institució o empresa (un diari, una editorial) que ens facilitara
aquest corpus.

Una altre problema és decidir quina ha de ser la configuració per defecte
(quines regles han d'estar activades i quines no), i quines han de ser les
opcions principals per a l'usuari bàsic. Ací els problemes i els dubtes són
els mateixos que tindríem quan algú redacta un "llibre d'estil". És difícil
o impossible acontentar a tothom... En això m'està ajudant ara Ramon
Torrents, un lingüista que s'acaba de jubilar. És un terreny molt opinable,
i evidentment podeu donar la vostra opinió.

El corrector, posat en la pàgina de Softcatalà, jo me l'imagine amb
aquestes opcions:
- Detecta errors ortogràfics (Sí/No)
- Detecta errors gramaticals (Sí/No)
- Accepta formes d'una variant regional (Català central, valencià, balear,
totes...)
- I potser alguna opció de més o menys formalitat de la llengua.

El LanguageTool es pot instal·lar fàcilment en un editor de text web. Però
totes aquestes opcions de configuració necessitarien un treball extra.

Salutacions,
Jaume Ortolà




El 4 de gener de 2013 13:43, Xavi Ivars <xavi.ivars a gmail.com> ha escrit:
>
>
> El 4 de gener de 2013 12:11, Jaume Ortolà i Font <jaumeortola a gmail.com>
ha
> escrit:
>
>> Ací teniu la versió 2.0 del corrector gramatical LanguageTool, acabada
>> de publicar, ara amb una pàgina de presentació en català:
>> http://languagetool.org/ca/
>>
>> Considere que encara no està a punt per al públic en general. Encara
>> s'han d'afegir moltes coses i fer moltes proves. Potser d'ací a 6 o 9
>> mesos... En qualsevol cas, interessa que el prove com més gent millor.
>> Alguns wikipedistes, per exemple, ja l'estan fent servir.
>>
>
>
> Hola Jaume,
>
> Dius que no el veus a punt per al públic en general, però jo l'he provat i
> m'ha paregut prou madur.
>
> Tu coneixes molt millor l'estat en què es troba, i saps quines són les
> debilitats que té. Per això, si creus que podríem ajudar d'alguna manera,
o
> si pots detallar les coses que tingues identificades que estan pendents
> d'afegir per si algú pot col·laborar, seria perfecte.
>
> Com ha comentat Jordi Mallach, a la trobada de Nadal de Softcatalà els
vaig
> mostrar l'eina (una beta d'aquell moment) i molts companys vam estar
d'acord
> en què aquest tipus d'eines han de ser estratègiques per a nosaltres, o
siga
> que en el que necessites ajuda, no dubtes en comentar-ho.
>
> Salut!
>
> --
> < Xavi Ivars >
> < http://xavi.ivars.me >
> _______________________________________________
> Corrector mailing list
> Corrector a llistes.softcatala.org
> http://llistes.softcatala.org/mailman/listinfo/corrector
>
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20130107/91c5d1a7/attachment.html>


Més informació sobre la llista de correu Corrector