<br><br><div class="gmail_quote">El 4 de gener de 2013 11:26, Jaume Ortolà i Font <span dir="ltr"><<a href="mailto:jaumeortola@gmail.com" target="_blank">jaumeortola@gmail.com</a>></span> ha escrit:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Crec que he trobat el problema. S'haurien de fer uns retocs en l'arxiu<br>
spell_checker.php (i spell_checker_valencia.php). El problema ve de la<br>
tokenització de paraules.<br>
<br>
Primer es fa la tokenització de paraules només amb el caràcter d'espai<br>
(línia 204):<br>
$words[$i] = preg_split("/(\s+)/", $words[$i], -1,<br>
PREG_SPLIT_DELIM_CAPTURE); //then split it on the spaces<br>
<br>
i després en la línia 215 es fa això:<br>
preg_match("/[^\s\,\.\"\:\;\«\»\-\=\+\?\!\(\)\/]{1,20}/i",<br>
$words[$i][$j], $tmp); //get the word that is in the array slot $i<br>
$tmpWord = $tmp[0]; //should only have one element in the array<br>
anyway, so it's just assign it to $tmpWord<br>
<br>
És a dir, el que hi ha darrere del punt en "sol.licitut" s'ignora i no<br>
arriba a analitzar-se mai. Tampoc no es detecta error en<br>
"Nacionalsindicalismezzz", perquè els 20 primers caràcters formen una<br>
paraula correcta.<br>
<br>
Hi ha diferents solucions. Si volem que els suggeriments siguen els<br>
esperats ("sol·licitud" per "sol.licitud" o "sol.licitut"), s'ha<br>
d'elaborar una mica més.<br></blockquote><div><br></div><div>Gràcies Jaume, </div><div><br></div><div>He vist que el fitxer spell_checker està basat en la versió 2.8, i ja va per la 3.3.</div><div><br></div><div>Intentaré veure si podem aprofitar alguna millora d'aquesta nova versió.</div>
<div><br></div><div>Toni, tu saps alguna cosa d'açò?</div></div>-- <br>< Xavi Ivars ><br>< <a href="http://xavi.ivars.me" target="_blank">http://xavi.ivars.me</a> >