Quello che vi propongo è la modifica di un’interessante plug-in di WordPress (che utilizzo anche nel mio sito) che mira a renderlo più adatto alla lingua italiana. Il plug-in si chiama Weighted Words Plug-in ed è possible consultarne l’home page al link http://greengabbro.net/plugins/weighted-words/. Il plug-in in questione visualizza una lista “pesata” delle parole che compaiono più spesso all’interno dei nostri post.
La modifica proposta si basa sulla gestione delle stop word tramite un file esterno invece che direttamente nel codice. Aggiungendo o togliendo le parole da questo file si riesce a filtrare i risultati. Il file che ho creato (stopwords_ita.txt) contiene una serie di parole italiane, ma potrebbero essere facilmente sostituite con parole di altre lingue.
INSTALLAZIONE
- Scaricate il file stopwords_ita.txt e copiatelo nella cartella
/wp-content/plugins/della vostra installazione di WordPress; - Aprite il file weighted_words.php;
- Commentate (o eliminate) la parte di codice:
- Sostituitelo con il codice:
- Cercate la linea:
- Modificatela con:
$overusedwords = array( '', 'a', 'am', 'an', 'the', 'and', 'of', 'i', 'to', 'is', 'in', 'for', 'as', 'that', 'on', 'at', 'this', 'my', 'was', 'our', 'it', 'its', 'you', 'we', '1', '2', '3', '4', '5', '6', '7', '8', '9', '0', '10', 'about', 'actually', 'after', 'again', 'all', 'almost', 'along', 'also', 'always', 'another', 'any', 'anyone', 'anything', 'anyway', 'are', 'area', 'around', 'available', ..., 'why', 'will', 'with', 'without', 'would', 'wouldn', 'x', 'y', 'your');
$filename = "[path]/wp-content/plugins/stopwords_ita.txt";
if (file_exists($filename)) {
$overusedwords = file($filename);
}
unset( $a[$word] );
unset( $a[trim($word)] );
DOWNLOAD
- Weighted Words Plug-in versione 1.1 (http://greengabbro.net/downloads/weighted-words-1.1.tar.gz);
- File stop word italiano (http://www.lorenzolombardi.it/downloads/stopwords_ita.zip);
- File plug-in già modificato (http://www.lorenzolombardi.it/downloads/weighted_words.zip).




dave
22 marzo 2006
ciao! ho cambiato
$filename = “[path]/wp-content/plugins/stopwords_ita.txt”;
con
$filename = dirname(__FILE__).”/wp-content/plugins/stopwords_ita.txt”;
che è il path corretto del file stopword.
ma c’è un problema…
Warning: Invalid argument supplied for foreach() in …/weighted_words.php on line 50
che ne dici? ciao Davide
Thrama
22 marzo 2006
@Dave:
Ciao dave,
sto facendo delle verifiche, puoi solo dirmi se utilizzi per il tuo blog Aruba con un hosting basato su Windows?
Potrebbero esserci dei problemi sull’istruzione
dirname(__FILE__).In questo caso dai un’occhiata al link: http://www.wordpress-it.it/wiki/Main/WordPressAruba
Appena finite le prove pubblico quanto scoperto.
A+