<html>

  <head>

    <meta content="text/html; charset=UTF-8" http-equiv="Content-Type">

  </head>

  <body bgcolor="#FFFFFF" text="#000000">

    <div class="moz-cite-prefix">Al 09/05/13 9:58, En/na Joan Montané ha

      escrit:<br>

    </div>

    <blockquote

cite="mid:CAKaaSX-HXTdVBmSHhkDFV=x3nuxYk-O+wiymPgrDKyD4W0ut+w@mail.gmail.com"

      type="cite">

      <div dir="ltr">Bon dia,<br>

        <div>

          <div class="gmail_extra"><br>

          </div>

          <div class="gmail_extra">ara li contesto.<br>

          </div>

          <div class="gmail_extra"><br>

            <div class="gmail_quote">El 9 de maig de 2013 9.45, Pau

              Sellés i Garcia <span dir="ltr"><<a

                  moz-do-not-send="true"

                  href="mailto:pau.selles@josoc.cat" target="_blank">pau.selles@josoc.cat</a>></span>

              ha escrit:<br>

              <blockquote class="gmail_quote" style="margin:0px 0px 0px

                0.8ex;border-left:1px solid

                rgb(204,204,204);padding-left:1ex">A mi eixe error em

                passa a Pages, LibreOffice i Thunderbird. No és un

                problema del catalanitzador, és un problema del

                diccionari.</blockquote>

              <div><br>

              </div>

              <div>No és un problema del diccionari, tampoc del motor

                del diccionari (hunspell?). El diccionari està ben

                definit (conté els mots amb ela geminada). El problema

                és com el programa "trenca" el text en paraules. En el

                cas dels productes Mozilla , talla les paraules amb ela

                gemianda i envia cada "paraula" al corrector ortogràfic.

                Així "instal·lació" es converteix en 2 paraules "instal"

                i "lació". La primera el nostre diccionari la dóna per

                bona ("instal", forma balear equivalent a "instal·lo"),

                per això només es queixa de la 2a part "lació". Els

                correctors ortogràfics no poden fer-hi res perquè els hi

                arriben dues paraules en comptes d'una. Aquesta mala

                segmentació és EL problema que tenim amb el punt volat

                (a banda del tipogràfic/estètic).<br>

                <br>

              </div>

              <div>Pau S: el LibreOffice hauria de segmentar

                correctament les paraules amb ela geminada si el text

                està definit com a català.<br>

              </div>

            </div>

          </div>

        </div>

      </div>

    </blockquote>

    Tens raó. Em semblava haver vist el problema a la versió PowerPC,

    però no ;). Només detecte el problema a Pages i Thunderbird. Per

    cert, has vist els meus missatges de la llista de LibreOffice?<br>

    <blockquote

cite="mid:CAKaaSX-HXTdVBmSHhkDFV=x3nuxYk-O+wiymPgrDKyD4W0ut+w@mail.gmail.com"

      type="cite">

      <div dir="ltr">

        <div>

          <div class="gmail_extra">

            <div class="gmail_quote">

              <div><br>

              </div>

              <div>En relació a això, si cap de vosaltres pot

                desenvolupar un petit programa que usi la biblioteca ICU

                i que mostri la segmentació de paraules d'un text, ens

                ajudaria molt a seguir on està el problema. Resulta que

                en Sebas Vila, del grup de la Ela Geminada, s'ha llegit

                la classificació assignada al punt volat a can Unicode

                i, segons sembla, no hauria de segmentar. Per tant...

                creiem que potser és una mala implementació a la

                biblioteca ICU de les propietats del punt volat

                assignades a Unicode. Un petit programet (per terminal

                mateix) que li passessim una frase i ens retornes les

                segmentacions ens aniria molt bé per a fer diagnòstic de

                que coi passa.<br>

                <br>

                <br>

              </div>

            </div>

            Joan Montané<br>

          </div>

        </div>

      </div>

      <br>

      <fieldset class="mimeAttachmentHeader"></fieldset>

      <br>

      <pre wrap="">_______________________________________________

Catalanitzador mailing list

<a class="moz-txt-link-abbreviated" href="mailto:Catalanitzador@llistes.softcatala.org">Catalanitzador@llistes.softcatala.org</a>

<a class="moz-txt-link-freetext" href="http://llistes.softcatala.org/mailman/listinfo/catalanitzador">http://llistes.softcatala.org/mailman/listinfo/catalanitzador</a>

_______________________________________________

Codi de conducta: <a class="moz-txt-link-freetext" href="http://www.softcatala.org/wiki/Codi_de_conducta">http://www.softcatala.org/wiki/Codi_de_conducta</a></pre>

    </blockquote>

    <br>

    <br>

    <pre class="moz-signature" cols="72">-- 

Una salutació,

----------------------

Pau Sellés i Garcia

<a class="moz-txt-link-abbreviated" href="mailto:pau.selles@josoc.cat">pau.selles@josoc.cat</a>

----------------------</pre>

  </body>

</html>