[Corrector] LanguageTool 2.0

Xavi Ivars xavi.ivars a gmail.com
dic gen 9 11:13:36 CET 2013


El 7 de gener de 2013 12.52, Jaume Ortolà i Font <jaumeortola a gmail.com> ha
escrit:

> Gràcies pels comentaris sobre LanguageTool
>
> Us explique breument les debilitats que encara té el corrector.
>
> En primer lloc, les falses alarmes: encara en dóna massa. La millor manera
> de millorar en aquest aspecte és passar el corrector per un corpus
> lingüístic de bona qualitat, i amb aquesta informació (que majoritàriament
> han de ser falses alarmes) anar corregint el diccionari i les regles
> gramaticals. Això també serveix per a augmentar el repertori de noms
> propis. Jo, fins ara, he treballat amb la Viquipèdia, però la qualitat
> mitjana que té es pot considerar baixa. Ara he començat a treballar amb
> texts de més qualitat, ben corregits, que he pogut aconseguir (la Bíblia i
> *El quadern gris* de Josep Pla...), i així avance molt més de pressa. Em
> podríeu ajudar molt facilitant-me texts de qualitat per a crear aquest
> "corpus". També serviria una col·lecció d'articles seleccionats de qualitat
> de la Viquipèdia, o reculls de premsa (millor les versions en paper, més
> ben corregides que versions web). Seria molt útil tindre un conveni amb
> alguna institució o empresa (un diari, una editorial) que ens facilitara
> aquest corpus.


Respecte a això, tot i que no la solució òptima, potser és un bon
començament utilitzar les notícies de Vilaweb. Tenen llicència Creative
Commons i les podríem utilitzar sense problemes. També podríem iniciar
algun tipus de contacte amb gent de l'Avuí o l'Ara (o fins i tot amb el
Periódico, encara que parteixen de traducció automàtica).



> Una altre problema és decidir quina ha de ser la configuració per defecte
> (quines regles han d'estar activades i quines no), i quines han de ser les
> opcions principals per a l'usuari bàsic. Ací els problemes i els dubtes són
> els mateixos que tindríem quan algú redacta un "llibre d'estil". És difícil
> o impossible acontentar a tothom... En això m'està ajudant ara Ramon
> Torrents, un lingüista que s'acaba de jubilar. És un terreny molt opinable,
> i evidentment podeu donar la vostra opinió.
>
>
Hi ha alguna manera "senzilla" de mostrar aquestes "decisions" (per
exemple, a la wiki)? Si la única manera és escriure totes les regles de
nou, en format "humà", potser no val la pena, però ho dic perquè potser
tens algun tipus de documentació ja feta amb aquesta informació, i així
seria més fàcil que més gent (principalment els lingüistes que col·laboren
en diverses tasques).


> El corrector, posat en la pàgina de Softcatalà, jo me l'imagine amb
> aquestes opcions:
> - Detecta errors ortogràfics (Sí/No)
> - Detecta errors gramaticals (Sí/No)
> - Accepta formes d'una variant regional (Català central, valencià, balear,
> totes...)
> - I potser alguna opció de més o menys formalitat de la llengua.
>
> El LanguageTool es pot instal·lar fàcilment en un editor de text web. Però
> totes aquestes opcions de configuració necessitarien un treball extra.
>
>
Aquestes opcions em semblen perfectes. Quan el programa estiga
suficientment madur, podem començar a definir-ho millor, i veure com
s'hauria d'implementar.

-- 
< Xavi Ivars >
< http://xavi.ivars.me >
-------------- part següent --------------
Un document HTML ha estat eliminat...
URL: <http://llistes.softcatala.org/pipermail/corrector/attachments/20130109/02e546fc/attachment.html>


Més informació sobre la llista de correu Corrector