Joan, <div><br></div><div>Gràcies per la resposta. </div><div><br></div><div>Sí que havia tingut en compte "argüir", però no "aguar". De fet, ni tan sols tinc "aguar" en el diccionari. Supose que no hi era quan vaig descarregar les dades de la web. Com a excepció que és, el GDLC també hauria de donar-ne la divisió sil·làbica. "Deisi" ara apareix sense accent tant al GDLC com al DIEC. Aquestes coses deuen anar canviant... I tant "deisi" com tots els acabats en "-eids" apareixen sense hiat en el GDLC i en aquest altre diccionari que he descobert ara [1].</div>
<div><br></div><div>Com a curiositats, he trobat aquests altres casos de diferent divisió segons la funció del mot: </div><div>- periòdic (pe-ri-ò-dic) i àcid periòdic (per-iò-dic). </div><div>- reiter (rei-ter), nom alemany, i reiter (re-i-ter), forma balear de reiterar.</div>
<div><br></div><div>En aquestes paraules, com en "aguant", caldria tenir més informació gramatical per a fer la divisió correcta. No sé si es pot controlar la divisió de mots des de LanguageTool. Però, en fi, això sí que seria filar molt molt prim per tres paraules...</div>
<div><br></div><div style="text-align:-webkit-left">Copie més avall una llista de paraules que en el GDLC tenen una divisió errònia, incoherent o dubtosa. He escrit a Enciclopèdia Catalana a veure què diuen. També és dubtosa la divisió de shakespearià (sha_kes_pe_a_ri_à segons el GDLC) o altres.</div>
<div><br></div><div>Pere Farrando, que es dedica professionalment a la composició de texts, m'acaba d'escriure i m'ha trobat només dues excepcions no reconegudes: mileurista i altimperial. </div><div><br clear="all">
<div><span></span><span></span>Salutacions,<br>Jaume Ortolà</div><div><br></div>[1]
<a href="http://ca.oslin.org/syllables.php" target="_blank">http://ca.oslin.org/syllables.php</a> <br>
<br><br><div>abarognòsia a_ba_rog_nò_si_a</div><div>barognòsia ba_rog_nò_si_a</div><div>hidrognòsia hi_dro_gnò_si_a</div><div>(i altres acabats en -gnòsia)</div><div>tiourea ti_ou_re_a</div><div>al·liltiourea al_lil_ti_o_u_re_a</div>
<div>tiouridina ti_ou_ri_di_na</div><div>anal·lagmàtic</div><div>anabiosi an_a_bi_o_si</div><div>anabiòtic a_na_bi_ò_tic</div><div>ananabàsia a_na_na_bà_si_a</div><div>enal·logen</div><div>hepthemímera</div><div>hio-</div>
<div>hioglòs hi_o_glòs</div><div>hioide hioi_de</div><div>hiosciamina hi_os_ci_a_mi_na</div><div>hioscina hi_os_ci_na</div><div>hioïdal hio_ï_dal</div><div>hiperèmesi</div><div>hiperèmia</div><div>malaveig ma_la_veig</div>
<div>malavejar mal_a_ve_jar</div><div>microperthita</div><div>parathormona</div><div>peroxidació pe_ro_xi_da_ci_ó</div><div>peroxidar per_o_xi_dar</div><div>peroxidasa </div><div>peroxiàcid pe_ro_xi_à_cid</div><div>perthita</div>
<div>suberització sub_e_rit_za_ci_ó</div><div>subintrant</div><div>subintrar</div><div>subulat</div><div>tetraiodofenolftaleïna te_tra_io_do_fe_nolf_ta_le_ï_na (hauria de ser ...fe_nol_fta_le_ï_na) </div><br><br><br><br>
<div class="gmail_quote">
El 5 de juliol de 2012 21:05, Joan Montané <span dir="ltr"><<a href="mailto:joan@montane.cat" target="_blank">joan@montane.cat</a>></span> ha escrit:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Ep!<br>
<br>
fa molt bona pinta, el provaré (també el Languagetool... el tinc a la<br>
cua). Hi ha una versió en format oxt de fa temps [1], no tan completa<br>
com aquesta, però més que suficient.<br>
<br>
Només un comentaris, de casos moooolt poc freqÜent, per si no ho has<br>
tingut en compte.<br>
<br>
Els mots aguar i argüir són excepcions a la ortografia. Tenen un hiat<br>
entre la u i la vocal que la segueix, els derivats també. Atenció a la<br>
forma "aguant", que tant pot ser el gerundi d'"aguar", amb hiat, com<br>
la forma balear equivalent a "aguanto", d'aguantar, amb digtong.<br>
<br>
Els mot "dèisi", i alguns tàxons com escarabèids i altres tàxons<br>
acabats en vocal+ids, no està clar com s'han d'escriure. El DIEC<br>
indica la versió sense accent, però el GDLC indica la versió amb<br>
accent. En tot cas... crec que l'hiat sempre hi és. O potser no? És<br>
d'aquells casos on no se sap si la pronúncia influeix en<br>
l'ortografia... o just a l'inrevés.<br>
<br>
Atentament,<br>
Joan Montané<br>
<br>
[1] <a href="http://www.softcatala.org/wiki/Rebost:Diccionari_catal%C3%A0_de_partici%C3%B3_de_mots_per_a_l%27OpenOffice.org" target="_blank">http://www.softcatala.org/wiki/Rebost:Diccionari_catal%C3%A0_de_partici%C3%B3_de_mots_per_a_l%27OpenOffice.org</a><br>
<br>
El 5 de juliol de 2012 20:46, Jaume Ortolà i Font<br>
<<a href="mailto:jaumeortola@gmail.com" target="_blank">jaumeortola@gmail.com</a>> ha escrit:<br>
<div><div>> Hola,<br>
><br>
> He desenvolupat un diccionari de partició de mots en català que compleix<br>
> totes les excepcions que assenyala el GDLC. Estava fart, com molts altres<br>
> usuaris de l'Adobe InDesign (del món editorial), de les deficiències del<br>
> programa en la partició de mots, i com que l'InDesign ha incorporat l'opció<br>
> d'usar diccionaris Hunspell, he creat un diccionari nou i complet. El mateix<br>
> diccionari serveix per a Open/LibreOffice.<br>
><br>
> Us adjunte el diccionari perquè el proveu. També hi ha companys usuaris<br>
> d'InDesign que l'estan provant. Quan ens hàgem assegurat que funciona bé,<br>
> podríem penjar-lo en la web de Softcatalà, adequadament empaquetat per a<br>
> diferents programes i sistemes operatius.<br>
><br>
> El procediment per a crear el diccionari (per a qui tinga curiositat per<br>
> saber-ho) ha sigut el següent. He partit de totes les paraules del GDLC<br>
> (unes 70.000) i de la informació de divisió sil·làbica que dóna el mateix<br>
> diccionari en algunes entrades (unes 20.000). Usant les llibreries de<br>
> divisió de paraules de TeX en Perl, he creat dos algorismes: un de simple<br>
> (amb les regles bàsiques de divisió de paraules sense excepcions) i un altre<br>
> de complet (regles bàsiques més excepcions). He anat afegit excepcions al<br>
> segon algorisme, he anat comptant errors i encerts en tots dos algorismes, i<br>
> he anat corregint, i així successivament. L'objectiu (complit) era que<br>
> l'algorisme complet funcionés per a totes les paraules amb informació de<br>
> divisió sil·làbica (20.000), i que l'algorisme simple i el complet<br>
> coincidiren en les paraules sense informació (50.000). Amb aquestes<br>
> comprovacions, els únics errors que podria tenir el diccionari apareixerien<br>
> en paraules derivades o compostes que no siguen en el GDLC i que jo no haja<br>
> previst. Per exemple, "besàvia, besàvies" serien errors, si jo no hagués<br>
> previst que a més de "be2s3avi" calia introduir "be2s3àvi" en el diccionari.<br>
> Finalment, per a usar els patterns de TeX en OpenOffice cal fer una<br>
> transformació prèvia, perquè l'algorisme de divisió de mots en l'OpenOffice<br>
> s'ha modificat lleugerament per a fer-lo més ràpid. Aquesta qüestió ha estat<br>
> a punt de tornar-me boig... fins que he trobat la documentació que ho<br>
> explica.<br>
><br>
> Proveu, doncs, el diccionari, i si us sembla bé, el podem afegir a la web de<br>
> Softcatalà. Es pot publicar com a arxiu .dic (que serviria per a l'Adobe<br>
> Indesign), com a paquet .oxt per a Open/LibreOffice i com a arxiu .tex.<br>
><br>
> Salutacions,<br>
> Jaume Ortolà<br>
> <a href="http://www.riuraueditors.cat" target="_blank">www.riuraueditors.cat</a><br>
><br>
><br>
><br>
</div></div>> _______________________________________________<br>
> Corrector mailing list<br>
> <a href="mailto:Corrector@llistes.softcatala.org" target="_blank">Corrector@llistes.softcatala.org</a><br>
> <a href="http://llistes.softcatala.org/mailman/listinfo/corrector" target="_blank">http://llistes.softcatala.org/mailman/listinfo/corrector</a><br>
><br>
_______________________________________________<br>
Corrector mailing list<br>
<a href="mailto:Corrector@llistes.softcatala.org" target="_blank">Corrector@llistes.softcatala.org</a><br>
<a href="http://llistes.softcatala.org/mailman/listinfo/corrector" target="_blank">http://llistes.softcatala.org/mailman/listinfo/corrector</a><br>
</blockquote></div><br></div>