Guida agli errori 404 negli e-commerce (per commercianti)

Un errore 404 viene restituito dal tuo sito ogni volta che gli viene chiesta una pagina che non esiste più o che non è comunque in grado di trovare. Gestire gli errori 404 in modo corretto ti permetterà di evitare che i tuoi clienti scappino dal tuo e-commerce e, anzi, di cogliere alcune opportunità interessanti.

Cos'è un errore 404

Secondo Wikipedia

L'errore 404 (o Not Found, inglese per non trovato), è un codice di stato standard del protocollo HTTP. Con questo, viene indicato che il client è in grado di comunicare con il server, ma che il server non ha trovato ciò che è stato richiesto, o il server è stato configurato in modo tale da non completare la richiesta. L'errore 404 non deve essere confuso con "server non trovato" o simili errori, dove la connessione al server non può proprio essere stabilita.

Quindi, dicendolo in parole più semplici, il tuo sito mostra  la pagina di errore 404 ogni volta che gli viene chiesta una pagina che non riesce a trovare: il navigatore riesce a collegarsi al tuo sito, ma il tuo sito non trova la pagina e quindi restituisce un errore 404.

Esempio di pagina di errore 404 restituita da Apache

Perché ci sono pagine sul tuo e-commerce che restituiscono errori 404?

Il tuo sito di commercio elettronico è formato da molte pagine e nel corso del tempo alcune di queste semplicemente spariscono.

Questi sono alcuni dei motivi comuni che causano gli errori 404:

  1. Hai semplicemente cancellato la pagina o le pagine;
  2. Sono le schede di prodotti esauriti o cancellati;
  3. Hai semplicemente riorganizzato la struttura del tuo e-commerce;
  4. Il server che ospita il tuo e-commerce non è configurato in modo corretto;
  5. C'è un problema nel tuo file .htaccess;
  6. C'è un problema di configurazione del software che gestisce il tuo sito di commercio elettronico;
  7. Non me ne vengono in mente altri 😛

A ben vedere tutti i motivi possono essere ricompresi in 4 macro-categorie:

  1. Pagina effettivamente non più esistente;
  2. Pagina spostata;
  3. Problemi con il software che gestisce il sito e-commerce;
  4. Problemi con il server che fa funzionare il sito e-commerce.

Questa quadripartizione è importante perché capire quale sia la causa dell'errore ti permetterà di gestirlo al meglio.

Qualunque sia il motivo che causa la restituzione di errori 404, però, il problema, in questo momento, è un altro: come fai a sapere se il tuo sito di commercio elettronico restituisce errori 404?

Come si comporta il tuo possibile cliente quando trova una pagina 404

Quando incontra una pagina 404 il navigatore scappa. Di solito. Almeno nel 77% dei casi.

Però, con un po' di attenzione e con qualche accorgimento, potresti, in realtà, anche riuscire a fargli continuare la navigazione.

Tutto dipende da come gestisci gli errori 404. Continua a leggere e alla fine del post avrai tutti gli strumenti per prendere una decisione e sfruttare le opportunità che potrebbe offrirti una corretta gestione di questo tipo di errori.

Come si comporta Google quando trova un errore 404

Come vedremo anche in seguito, un errore 404 di per sé non influisce più di tanto sul posizionamento di un sito. Secondo alcuni, quando ne incontra uno GoogleBot semplicemente smette di navigare il sito ma, in realtà, questo non è vero. Anzi, se adeguatamente gestiti, gli errori 404 possono aiutare sia il motore di ricerca che il navigatore a continuare la navigazione.

Ecco cosa dice Google in merito:

We aim to understand as much as possible about your site and its content. So while we wouldn't want to show a hard 404 to users in search results, we may utilize a 404's content or links if it's detected as a signal to help us better understand your site.
Keep in mind that if you want links crawled or content indexed, it's far more beneficial to include them in a non-404 page.

Google vuole capire quanto più possible del tuo sito, quindi, anche se preferisce non mostrare ai propri navigatori pagine che restituiscono errori, usa comunque il contenuto delle pagine 404 per capirne di più. Dagli link utili e GoogleBot continuerà la navigazione. Ma in ogni caso "è molto meglio" (far more beneficial) dargli pagine che funzionano! 😛

Non sei ancora convinto? Riporto un altro estratto, questa volta della guida della Google Search Console (ricorda questo nome: la useremo tra pochissimo!):

La restituzione di un codice diverso da 404 o 410 per una pagina inesistente (o il reindirizzamento degli utenti a un'altra pagina, come la home page, invece di restituire un codice 404) può creare problemi. In primo luogo, ciò indica ai motori di ricerca che c'è una pagina reale a tale URL. Di conseguenza, tale URL potrebbe essere sottoposto a scansione e i suoi contenuti potrebbero essere indicizzati. A causa del tempo perso da Googlebot su pagine inesistenti, i tuoi URL univoci rischiano di non essere rilevati rapidamente o visitati frequentemente e la copertura offerta dalla scansione del tuo sito potrebbe risentirne (inoltre, probabilmente non desideri che il tuo sito si posizioni in alto relativamente alla query di ricerca "File non trovato").

Gli errori 404 influiscono sul posizionamento?

Secondo Google (vedrai questo messaggio continuando a leggere il post):

Googlebot non ha potuto eseguire la scansione dell'URL perché rimanda a una pagina che non esiste. In genere gli errori 404 non influiscono negativamente sul rendimento del sito nella ricerca, ma puoi utilizzarli per migliorare l'esperienza degli utenti.

Quindi, secondo Google, gli errori 404 non influiscono sul posizionamento ma solo sull'esperienza utente. Questo significa che possiamo trascurarli? No, assolutamente NO! Significa, anzi, che li devi tenere in altissima considerazione: pensa se nei risultati di ricerca un navigatore cliccasse un link e si trovasse davanti a un errore 404: come reagirebbe secondo te? E come reagirebbe il GoogleBot? E Google cosa pensa a riguardo? Ora ti dice che non influiscono, ma, se tu fossi Google, nei risultati di ricerca preferiresti mostrare pagine che esistono e che funzionano oppure ti accontenteresti di pagine che restituiscono un errore 404? Io direi che sei in grado di darti una risposta sensata da solo 🙂

Ok, ti do qualche altro spunto di riflessione:

  • Il tuo sito perde link juice, cioè il valore passato da una pagina a un'altra si interrompe (per questo devi correggere i link interni e non accontentarti dei redirect! - ne parliamo più avanti);
  • Se la pagina 404 non è scritta in modo corretto, la navigazione, sia dell'utente che del bot, si potrebbe fermare;
  • Perdi i segnali positivi di altri link e dei segnali social (Facebook, Twitter, ecc.);
  • In un solo punto: la qualità del tuo sito diminuisce... E se diminuisce...

Ora dovrebbe essere più chiara la risposta... Spero! 🙄

Come trovare gli errori 404 con la Google Search Console

La Google Search Console è tra i primi strumenti che devi installare sul tuo sito di commercio elettronico se intendi posizionarlo correttamente (sia su Google che su altri motori di ricerca).

La Google Search Console è lo strumento che Google mette a disposizione di ogni gestore di un sito web e con il quale è possibile monitorare alcuni parametri fondamentali come lo stato di indicizzazione, eventuali problemi di sicurezza, avere alcune informazioni interessanti sul traffico verso il tuo e-commerce e, ovviamente, anche conoscere gli errori che il GoogleBot incontra navigando il tuo sito. E tra questi errori ci sono anche i famigerati 404! 😀

Per visualizzare gli errori 404 che GoogleBot ha incontrato navigando il tuo sito vai su Dashboard > Scansione > Errori di scansione.

Errori di scansione Google Search Console

Schermata della Google Search Console che mostra gli errori di scansione

Come vedi dall'immagine, nel momento in cui scrivo eCommerceRS.NET ha un po' di errori 404 (e del resto è per questo che ho cominciato a scrivere questo post).
In questo caso la causa è la mia decisione di riorganizzare la struttura dei link per rendere il sito più veloce. Quindi, a questo punto, quello che devo fare è decidere come gestire tutti questi errori.

Come gestire gli errori 404

Gestire gli errori 404 significa decidere cosa succede quando il navigatore raggiunge una pagina che attualmente lo restituisce.

In questo senso hai essenzialmente tre sole alternative:

  1. Puoi lasciare che la pagina restituisca un errore 404 e in questo caso puoi pensare di personalizzare la pagina e sfruttarla a tuo vantaggio;
  2. Puoi reindirizzare automaticamente il navigatore a una nuova pagina usando un codice HTTP 301;
  3. Puoi risolvere l'eventuale problema e fare in modo che la pagina torni ad essere funzionante.

Non ne hai altre, solo queste 3: aggiustare, reindirizzare o mostrare il 404.

Per decidere sul da farsi, però, devi prima capire perché l'errore 404 viene mostrato. A seconda del motivo, infatti, dovrai comportarti in un modo piuttosto che in un altro.

Quindi, comincia ad esaminare ogni singolo link che la Google Search Console ti mostra e vedi, in primis, se effettivamente la pagina restituisce un errore 404: potrebbe capitare, infatti, che l'errore sia in realtà solamente temporaneo.

Se, invece, effettivamente viene mostrato l'errore 404, il primo step è capirne la causa.

Ricordi poco più su cosa ho scritto? Le cause di un errore 404 sono essenzialmente 4:

  1. La pagina effettivamente non esiste più;
  2. La pagina è stata spostata;
  3. L'errore 404 viene mostrato perché il software che gestisce il tuo e-commerce ha qualche problema di funzionamento;
  4. L'errore 404 viene mostrato perché il server che ospita il tuo sito di commercio elettronico ha qualche problema di funzionamento.

Cominciamo dalle cose più complicate e su cui abbiamo meno potere, così le togliamo subito di mezzo 😛

Gestire gli errori 404 causati dal server

Questa è la cosa su cui hai meno potere in assoluto: che tu abbia un hosting condiviso o che tu abbia un server dedicato, dubito fortemente che tu sia in grado di risolvere il problema.

Così come dubito fortemente che ti accorgerai di questo tipo di problema dalla Google Search Console: molto più probabilmente, semplicemente il tuo sito di commercio elettronico ha smesso di funzionare e quindi sei già allarmato da un pezzo e hai mobilitato tutte le risorse IT di cui disponi per risolverlo.

Saltiamo a piè pari questo tipo di errori perché un post non basta a spiegarlo e sicuramente tu non hai nemmeno voglia di leggerlo qualora lo scrivessi. Quindi, avanti col prossimo caso.

Gestire gli errori causati dal software di commercio elettronico

Non so se il tuo e-commerce è stato realizzato da qualcun altro o se invece lo hai realizzato da solo.

In ogni caso, risolvere questo tipo di problema presenta difficoltà vicine a quelle della risoluzione dei problemi legati al server. Tuttavia qui posso darti un consiglio.

Sei pronto? Ecco il consiglio: fai una copia di backup almeno giornaliera del tuo e-commerce. Ancora meglio sarebbe se la copia di backup fosse oraria!

Di più non posso dirti perché in questa categoria rientrano così tante casistiche che anche in questo caso non solo non basterebbe un solo post ma, se anche bastasse, o non avresti voglia di leggerlo oppure comunque non saresti in grado di mettere mano al codice. Perché è di questo che stiamo parlando: di mettere mano al codice.

In conclusione, saltiamo a piè pari anche questo caso e passiamo al prossimo. Tranquillo, il prossimo caso potrai gestirlo da solo! 😛

Gestire gli errori 404 di pagine spostate

E finalmente arriviamo a qualcosa su cui abbiamo potere, torniamo nella nostra "zona di comfort" 🙂 Parliamo delle pagine che sono state spostate.

C'è davvero poco da dire in merito: l'unica cosa che puoi fare se sposti una pagina è impostare un reindirizzamento 301 dal vecchio indirizzo al nuovo.

Il 301 è un codice di stato HTTP (come il 404 di cui stiamo parlando) che indica al browser che la pagina a cui sta tentando di accedere è stata spostata in modo permanente a un altro indirizzo. Esiste un altro codice di stato HTTP molto simile: il 302. Questo, però, indica al browser che la pagina è stata spostata temporaneamente in un'altra posizione!

Quindi, due codici diversi per la stessa cosa, ma con una sottilissima e fondamentale differenza:

  • 301: Spostamento PERMANENTE;
  • 302: Spostamento TEMPORANEO.

Inviare il codice corretto è fondamentale per mantenere il posizionamento di una pagina sui motori di ricerca: un codice 301, infatti, indica al GoogleBot (o a qualunque altro bot di qualunque altro motore di ricerca) che il vecchio indirizzo non esiste più e che tutto il "valore" (genericamente inteso, ricomprendendo, per esempio, anche il PageRank - anche se oggi non è più così importante) della vecchia pagina deve essere trasferito alla nuova pagina. Quindi, il motore di ricerca cancella dal proprio archivio la vecchia pagina e la sostituisce con la nuova a cui punta il reindirizzamento.

Presta attenzione a questo piccolissimo particolare perchè usare un codice 302 quando invece è necessario un codice 301 è un errore frequente. Non lo commettere. Evitalo!

Gestire gli errori 404 di pagine "non più esistenti"

Ho volutamente usato le parole "non più esistenti" anziché "cancellate" perché stiamo parlando di siti di commercio elettronico.

In un sito diverso da uno di e-commerce, questo caso prevederebbe la sola cancellazione della pagina. In un sito di commercio elettronico, invece, c'è un altro caso: la pagina in questione è la scheda di un prodotto non più disponibile.

I due casi potrebbero essere gestiti in modo uguale, ma per i prodotti non più disponibili hai un'alternativa: mantenere la scheda prodotto attiva, anche se il prodotto non è più disponibile.
Questa è una cosa che dovresti valutare attentamente.

Nel caso in cui la pagina sia stata effettivamente cancellata, invece, la cosa migliore da fare è personalizzare la pagina 404 e sfruttarla a tuo vantaggio. Meglio ancora, potresti restituire un errore 410 che è molto più "forte" di un 404: indica, infatti, che la pagina non solo non è più disponibile ma CON ASSOLUTA CERTEZZA non lo sarà mai più! Anche in questo caso, valgono le regole di personalizzazione per permettere a navigatori e bot di continuare la navigazione del sito.

Errori comuni nella gestione dei redirect 301

Gestendo i tuoi cari errori 404 potrebbe affiorarti alla mente un pensiero: "ora redireziono tutto alla home page". NON LO FARE. Come direbbe Totò: "astieniti"!

Reindirizzare alla home page in modo massivo è un errore perchè ti fa perdere opportunità. Invece, cerca un contenuto molto simile e redireziona a quello: ricordati che il navigatore stava cercando qualcosa quando ha trovato il 404. Dagli qualcosa di simile, anche se non proprio uguale, e sarà molto meglio che mandarlo in home page dove si troverà davanti a... "niente": dovrebbe ricominciare tutto da capo... Per lui sarebbe molto più semplice tornare indietro di un paio di pagine e continuare con il prossimo risultato nella SERP di Google.

Magari puoi pensare di reindirizzare a un livello direttamente superiore. Così, se il 404 è restituito dalla pagina "Interruttori da interno rossi" potresti pensare di reindirizzare semplicemente alla pagina "Interruttori da interno", appena un livello superiore.

Cosa fare una volta gestito l'errore 404

Una volta che l'errore 404 è stato gestito nel modo che hai ritenuto più corretto il lavoro non è finito.

Infatti ora devi fare altre due cose:

  1. Controllare che nessuna altra pagina del tuo sito contenga link alla pagina che ha generato l'errore 404;
  2. Comunicare a Google che hai gestito l'errore 404.

Come trovare le pagine che rimandano a pagine che restituiscono errori 404

Ricordi la schermata di Google Search Console in cui erano elencati tutti gli errori 404 che GoogleBot aveva trovato?

Hai cliccato su un link qualunque? Se non l'hai ancora fatto, fallo.

Ecco cosa appare:

5131-GoogleSearchConsole-ErroriDiScansione-Dettaglio

 

A parte l'informazione che dà il messaggio (ti è familiare? È esattamente lo stesso che hai letto all'inizio del post), quello che devi notare sono le 3 linguette. Infatti, se clicchi sulla terza "Con link da" ecco cosa appare:

5131-GoogleSearchConsole-ErroriDiScansione-LinkIngresso

Come vedi Google ti dice esattamente in quali pagine ha trovato il link che ha prodotto l'errore 404. A questo punto ti basterà aprire ognuna di quelle pagine e modificare i link in modo che rimandino a quelli nuovi e corretti... se sono pagine che puoi modificare.

Il discorso cambia se le pagine segnalate sono pagine esterne al tuo sito. In questo caso, infatti, hai solo un'alternativa: armarti di pazienza e contattare i webmaster dei singoli siti spiegando la situazione e confidando che decidano di impiegare 5 minuti del loro tempo per cambiare l'indirizzo. In bocca al lupo! 😛

Come segnalare a Google la corretta gestione dell'errore 404

Una volta che avrai risolto gli errori 404 esistenti sul tuo sito e una volta che avrai modificato le pagine che contengono link a questi URL errati, l'ultima cosa che dovrai fare è segnalare a Google che quelle pagine sono state corrette. Per farlo, nella Google Search Console seleziona gli indirizzi che hai corretto e clicca sul pulsante rosso "Segnala come corretti":

5131-GoogleSearchConsole-ErroriDiScansione-Corretti

Quello che succede a questo punto è semplice: Google ora sa che hai corretto quegli errori e li rimuove dall'elenco. Questo non significa che essi verranno rimossi dall'indicce di Google, ma solo che non li visualizzerai più nella Google Search Console. Infatti, se per un qualunque motivo, Google dovesse ritrovare quegli indirizzi e questi, per un altro qualunque motivo, dovessero di nuovo restituire un errore 404, Google mostrerà di nuovo l'errore in questo elenco.

ATTENTO: Ci sono altri tipi di errori 404!

Eh eh, tu pensavi avessimo finito, e invece...

E invece, prima di chiudere, ti devo parlare di altri due tipi di errori 404: gli errori 404 di siti diversi dal tuo a cui tu linki e gli errori 404 di risorse interne.

E già, perché è ben possibile che le tue pagine presentino link a siti diversi dal tuo (questo serve per migliorare il posizionamento sui motori di ricerca) ed è altrettanto possibile che, nel corso del tempo, tali link smettano di funzionare. Devi trovali e correggerli o cancellarli.

E poi ci sono gli errori 404 di risorse interne: le tue pagine web presentano immagini. Se quelle mancano, te ne accorgi subito, ma le pagine web usano anche altri file esterni come file javascript o css. Anche questi file potrebbero sparire dal tuo sito ma tu potresti non accorgertene. Trovarli e correggerli è molto utile.

Però questi sono argomenti un po' lunghetti da trattare e visto quanto è già lungo questo post... Ne parleremo. Iscriviti alla newsletter di eCommerceRS.NET e saprai quando 🙂

Per il momento credo tu abbia già abbastanza lavoro da fare (anche se spero, in realtà, tu non ne abbia! 😛 ).

2017-04-07T14:17:43+00:00 By |Categorie: Blog|Argomenti: , , |

Scrivi un commento