Archivio di marzo 2007

Gestire l’errore 404 in WordPress

sabato 24 marzo 2007

Errore 404L’errore 404 si verifica ogniqualvolta un utente o lo spider dei motori di ricerca tenta di accedere ad una pagina (o ad una componente di quest’ultima) che non è presente nel sito web.

Ovviamente, ciò accade se la pagina viene spostata o eliminata o, ancora, se il suo nome viene modificato nel tempo. In alcuni casi, inoltre, l’errore può verificarsi a causa di un link non corretto pubblicato da un altro sito verso il vostro. Vi sono, inoltre, ulteriori altre possibili cause che, per brevità, tralascio.

Digitando un URL non corretto, nella maggioranza dei siti internet, si ottiene una pagina poco comprensibile, stringata, priva di qualsiasi riferimento al layout del sito web a cui appartiene. Generalmente vi si trovano espressioni, credo incomprensibili ai più, quali “file not found” o “oggetto non trovato”. Segue una stringa che segnala il codice di errore “404″.

Cerchiamo ora di prevedere il comportamento di un utente medio che ha digitato o è pervenuto all’URL non corretto. Questi, nella maggioranza dei casi, ottenute delle informazioni che difficilmente riesce ad interpretare, abbandona il sito e passa al risultato successivo della serp da cui proviene o, addirittura, chiude il browser e rinuncia a navigare.

Questo non deve accadere! Pertanto è necessario modificare in modo sostanziale l’aspetto della pagina di errore, al fine di convincere l’utente a non abbandonare il nostro blog.

Utilizzando applicazioni per la gestione dei contenuti web, in genere, si ha la possibilità di modificare e personalizzare la pagina di errore in maniera molto semplice. Con WordPress, ad esempio, è sufficiente effettuare un editing del file 404.php, contenuto nella cartella del template che state utilizzando.

Inizialmente avevo deciso di operare in questo modo. Poi, però, mi sono imbattuto in due plugin che mi hanno concesso di mutare strategia e prendermela più comoda:

Il primo permette di ottenere una e-mail ogniqualvolta il server risponde con un errore 404. Mi è stato utilissimo: mi sono accorto che, avendo spostato un’intera categoria fuori dal loop, le pagine in essa contenute erano cercate dagli spider e, ovviamente, non venivano individuate. A quel punto ho effettuato dei redirect 301 (leggi un ottimo articolo su questo argomento) via htaccess risolvendo definitivamente il problema.

Inoltre, nel codice di un post, il nome di un’immagine era sbagliato e quindi, anche in questo caso, veniva segnalato un 404. Mi è arrivata l’e-mail ed ho subito corretto!

Consiglio a tutti pertanto di installare questa componente: è veramente molto utile.

Il secondo plugin permette di ridefinire completamente la pagina di errore 404 di WordPress, invero piuttosto limitata, poiché presenta solo il box di ricerca e un breve messaggio di errore.

Dopo aver localizzato il plugin e avervi apportato alcune modifiche sono riuscito ad ottenere una pagina di errore completa e che mi auguro possa invogliare l’utente a continuare la navigazione nel mio blog.

Credo che un’immagine, in questo caso, sia molto più efficace delle parole:

La mia pagina di errore 404

Come potete vedere, oltre ad un messaggio in cui avverto l’utente dell’errore e lo invito a continuare la navigazione, la pagina è, in pratica, una sintesi dell’intero blog.

Un primo elenco puntato contiene tutte le possibili operazioni che l’utente può effettuare che sono:

  • visitare la home page del blog;
  • leggere gli ultimi 5 articoli pubblicati (il plugin di Andrew permette di modificare a piacimento il numero di titoli visualizzabili);
  • segnalare all’autore del blog che si è verificato un errore;
  • effettuare una ricerca;
  • richiedere delle informazioni;

I puristi sostengono che una pagina di errore dovrebbe essere priva di immagini e dotata di un layout limitato, questo per consentire alla stessa di essere caricata molto velocemente. Onestamente, non sono d’accordo con questa affermazione.

La velocità di caricamento ha certamente un peso determinante nella progettazione web, ci mancherebbe! Ma altrettanto importante è garantire che la pagina possieda un’identità che renda consapevole l’utente di trovarsi in un determinato blog ed in nessun altro.

Ecco perchè ho utilizzato tout court il layout di Ranked.it. Quanto alla piccola immagine, parliamo di pochi Kilobyte che non possono rallentare più di tanto il caricamento della pagina stessa.

La Ricerca Personalizzata di Google

lunedì 19 marzo 2007

Ho inaugurato Ranked.it teorizzando sui possibili rischi che può correre la nostra Privacy nell’era della ricerca personalizzata di Google; ora passo a descrivere le funzionalità di questo servizio dal punto di vista tecnico.

La ricerca personalizzata è costituita da tre componenti:

  1. l’home page personalizzata;
  2. i risultati della ricerca personalizzata;
  3. la cronologia della ricerca.

Di queste, solo la prima è totalmente configurabile e gestibile dall’utente, per le altre il grado di personalizzazione è minore.

La ricerca personalizzata si attiva ogniqualvolta si accede al proprio account Google, pertanto è necessario effettuare la procedura di log out se si intende ritornare a navigare alla maniera tradizionale.

Home page personalizzata

Di questa componente hanno parlato in molti e, pertanto, non ho null’altro da aggiungere a quanto già è stato detto. Prenderò invece in esame le altre…

I risultati della ricerca personalizzata

Analizziamo le caratteristiche di questo strumento, anche alla luce di quanto affermato da Marissa Mayer in una recente intervista di Gord Hotchkiss:

  • solo due risultati su dieci sono personalizzati;
  • il primo risultato di una serp è sempre generico;
  • la ricerca personalizzata si attiva generalmente per ricerche frequenti;
  • in media vengono proposti risultati personalizzati una volta ogni cinque ricerche;
  • circa il 20% delle ricerche vengono stimate personalizzabili;
  • se la ricerca personalizzata è attiva i risultati delle serp che sono stati selezionati dall’utente presentano un campo che segnala il numero di volte in cui si è navigato in quel determinato sito e l’ora dell’ultima visita.

Consideriamo ciascun punto singolarmente.
Quanto al primo, non riesco a trovare una ragione logica circa il limite di due risultati personalizzati su dieci. Sembra quasi un compromesso per non disorientare troppo l’utente. Eppure nelle intenzioni di Google la ricerca personalizzata non doveva rappresentare uno strumento atto a migliorare la user experience?
Anche il secondo punto mi lascia perplesso. Perché il primo risultato deve essere identico in tutte le serp? Forse perché è il più rilevante? Se questa è la ragione, percepisco una forte contraddizione con quanto Google ha più volte dichiarato (Matt Cutts, in primis) e cioè che la prima posizione nelle serp non è poi così importante.
Il terzo punto è piuttosto banale.
È ovvio che la ricerca personalizzata si attivi molto più facilmente quando sono presenti molti dati che riguardano la nostra navigazione, situazione che si verifica quando sono state effettuate numerose ricerche per lo stesso argomento.
Circa il 4° punto, sono costretto ad ammettere di non aver intuito se tale limite sia il risultato di un calcolo statistico o, invece, una caratteristica intrinseca dello strumento.
Il punto 5, invece, rappresenta proprio un valore statistico.
Per l’ultimo punto, direi che è sufficiente l’immagine che segue.

Ricerca personalizzata di Google

Per concludere devo sottolineare che non esiste alcuna possibilità di disattivare la ricerca personalizzata se rimane attivo il proprio Google Account.

La cronologia della ricerca

Per accedere a questa funzione è necessario aver effettuato l’autenticazione in Google Account. A questo punto, al termine di una ricerca qualsiasi, comparirà, in altro a destra, il link cronologia ricerche.

Attivare la cronologia delle ricerche di Google

La sezione cronologia presenta numerose opzioni. Descriverò le più importanti. A tale scopo, di seguito propongo un’immagine che, per ragioni di layout, ho dovuto pesantemente modificare (è sufficiente un click su di essa tuttavia per visualizzare la versione integrale).

Cronologia ricerche di Google

Come si evince la schermata è suddivisa in tre colonne: la colonna sinistra contiene le opzioni disponibili, la colonna centrale mostra le serp delle ricerca (anche immagini, mappe o video) e la colonna destra presenta un calendario che consente di accedere alle pagine delle cronologie precedenti.

In questa sede analizzerò le opzioni della prima colonna.

La prima opzione permette, tramite l’apposizione di uno più segni di spunta, di visualizzare risultati per tutte o solo per certe tipologie di ricerca (Web, Immagini, News. Ecc.).

Seguono opzioni che permettono di sospendere il servizio di raccolta di tutti i dati di navigazione o solo di alcuni di essi.

“Tendenze” mostra statistiche, anche grafiche, delle principali ricerche effettuate, delle chiavi utilizzate e dei siti visualizzati. Articoli interessanti mostra, invece, una rassegna di articoli correlati agli argomenti delle proprie ricerche.

“Segnalibri”, infine, rappresenta un elementare servizio di bookmarking.

Conclusioni

La ricerca personalizzata di Google è uno strumento interessante sotto alcuni punti di vista, meno sotto altri. Sottolineo che non ho potuto effettuare test per valutare la differenze nelle serp con o senza Google Account attivo. Ho però letto molto sull’argomento e sono costretto ad ammettere che alcune sue caratteristiche mi lasciano alquanto perplesso. Alcuni blog sostengano, addirittura, che si tratti di una versione beta rilasciata, prematuramente, a scopo di test.

La ricerca personalizzata teorizzata da Google, a mio avviso, può rappresentare un punto di arrivo irrinunciabile per migliorare il modo di effettuare ricerche, ma questo può avvenire solo ed esclusivamente se l’utente è adeguatamente avvertito che i suoi dati di navigazione vengono inseriti nei database dell’azienda di Mountain View.

La procedura di rimozione, infine, è, discutibilmente, non accessibile dal proprio Google Account, (io, almeno, lì non l’ho trovata).

Mi è stato però sufficiente navigare qualche secondo e ed ecco il link che vi permette di disattivare completamente il servizio di ricerca personalizzata.

Per chi vuole approfondire

Intervista di Gord Hotchkiss a Marissa Mayer e a Matt Cutts sulla ricerca personalizzata di Google.

Attenti: Kerouac vi spia!

venerdì 16 marzo 2007

kerouac.jpgTra i vari professionisti che ho avuto modo di conoscere nel corso della mia vita, Kerouac3001, detto anche Grey Hat Seo, rappresenta certamente uno tra i personaggi più geniali e ingegnosi.

Oltre a possedere un’ottima conoscenza dei motori di ricerca, oltre ad essere un eccellente programmatore, ha il pregio di saper scrivere in un buon italiano e di porre dei “paletti etici” al suo lavoro.

Consentitemi di dire che non è da tutti!

Veniamo all’ennesima diavoleria che il ragazzo ha “tirato fuori dal suo grigio cappello”.

Kerouac ha creato uno script, denominato Tool per interrogare la cache di un utente, che permette di verificare se un dato utente ha navigato un certo insieme di siti.

Vediamo di spiegare il suo funzionamento nel dettaglio. Ogniqualvolta raggiungiamo una pagina web le sue componenti (html, immagini, css, ecc.) vengono salvate in una cartella del vostro hard disk. Questa, in gergo, viene definita cache, nascondiglio (termine italiano onestamente poco rappresentativo). I browser fanno un largo uso della cache per velocizzare il caricamento di queste stesse componenti senza dover effettuare una connessione al “lento” web server che ospita il sito.

Lo script di Vincenzo riesce ad analizzare la cache e ad individuare se l’utente ha visitato un certo numero di siti. Sia chiaro, non tutti i siti esistenti, ma quelli che Kerouac stesso (o chi utilizza lo script) ha selezionato e inserito nel database dell’applicazione.

In gergo viene effettuato un matching: viene controllato, cioè, se nella cache dell’utente sono presenti le componenti di questi siti.

Nell’esempio proposto sono stati inseriti circa 200 siti che si occupano di Seo, Web Marketing, Programmazione e Blog.

Al termine dell’analisi viene creato un report che stabilisce, in termini percentuali, se un utente è, nell’ordine, un Seo, un Web Marketer, un Programmatore e/o un Blogger.

Allego uno screenshoot del risultato da me ottenuto:

Analizzatore cache di Kerouac3001

Come potete notare il risultato è molto vicino alla realtà! Lo sanno anche i muri che sono molto scarso quanto a programmazione.

Vincenzo, nella sua presentazione, afferma giudiziosamente che questa “invenzione” lede il diritto alla Privacy dell’utente. In effetti, in linea teorica, il suo utilizzo permette di individuare tutti gli spostamenti effettuati nel web da un utente in un determinato arco di tempo.

Al di là delle interessanti applicazioni indicate da Kerouac, ritengo che questo tool potrebbe diventare un ottimo (e viscido, mi si conceda il termine) strumento per “controllare” i propri dipendenti. Caricando opportunamente il giusto set di siti web si potrebbe individuare chi utilizzi internet in maniera impropria senza dover analizzare i log del server di rete.

Che dire? Da ossessionato dalla Privacy quale sono, l’amico Gray Hat Seo mi fa un po’ paura, pertanto ho attivato l’opzione che cancella il contenuto della cache ogniqualvolta termino la navigazione.

Per ora sono tranquillo, anche se ho l’assoluta certezza che, prima poi, ne inventerà un’altra!