<br><br><div class="gmail_quote">El 4 de gener de 2013 11:26, Jaume Ortolà i Font <span dir="ltr"><<a href="mailto:jaumeortola@gmail.com" target="_blank">jaumeortola@gmail.com</a>></span> ha escrit:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


Crec que he trobat el problema. S'haurien de fer uns retocs en l'arxiu<br>

spell_checker.php (i spell_checker_valencia.php). El problema ve de la<br>

tokenització de paraules.<br>

<br>

Primer es fa la tokenització de paraules només amb el caràcter d'espai<br>

(línia 204):<br>

$words[$i] = preg_split("/(\s+)/", $words[$i], -1,<br>

PREG_SPLIT_DELIM_CAPTURE); //then split it on the spaces<br>

<br>

i després en la línia 215 es fa això:<br>

preg_match("/[^\s\,\.\"\:\;\«\»\-\=\+\?\!\(\)\/]{1,20}/i",<br>

$words[$i][$j], $tmp); //get the word that is in the array slot $i<br>

$tmpWord = $tmp[0]; //should only have one element in the array<br>

anyway, so it's just assign it to $tmpWord<br>

<br>

És a dir, el que hi ha darrere del punt en "sol.licitut" s'ignora i no<br>

arriba a analitzar-se mai. Tampoc no es detecta error en<br>

"Nacionalsindicalismezzz", perquè els 20 primers caràcters formen una<br>

paraula correcta.<br>

<br>

Hi ha diferents solucions. Si volem que els suggeriments siguen els<br>

esperats ("sol·licitud" per "sol.licitud" o "sol.licitut"), s'ha<br>

d'elaborar una mica més.<br></blockquote><div><br></div><div>Gràcies Jaume, </div><div><br></div><div>He vist que el fitxer spell_checker està basat en la versió 2.8, i ja va per la 3.3.</div><div><br></div><div>Intentaré veure si podem aprofitar alguna millora d'aquesta nova versió.</div>


<div><br></div><div>Toni, tu saps alguna cosa d'açò?</div></div>-- <br>< Xavi Ivars ><br>< <a href="http://xavi.ivars.me" target="_blank">http://xavi.ivars.me</a> >