URL simili: Google può considerare i contenuti duplicati

Google individua le pagine web come duplicati se gli URL sono simili?

In questo articolo:

Ebbene sì. Google è in grado di vedere le pagine Web come duplicati, se gli URL si somigliano troppo.

Stando alle parole di John Mueller di Google si tratta di un metodo predittivo utilizzato dal motore di ricerca per rilevare i contenuti duplicati. Per la precisione, individua i contenuti duplicati in base ai pattern URL, cosa che potrebbe condurre ad un’erronea identificazione delle pagine come duplicati.

Google infatti prevede quando le pagine contengono materiale simili o duplicati identificando il loro URL.

Perchè Google analizza gli URL?

L’ obiettivo è quello di risparmiare la “fatica” di scansionare i contenuti, e quindi si sofferma sull’URL.

Se Google, eseguendo la scansione, si accorge che pagine con pattern URL simili contengono lo stesso contenuto, ipotizza che anche tutte le altre pagine con quel preciso pattern URL contengano le stesse informazioni.

Questo crea non pochi problemi ai proprietari di siti che ospitano contenuti simili. Le loro pagine vengono rimosse perchè ritenute duplicate a causa del pattern URL somigliante, venendo escluse dall’indice di Google.

Quella degli URL non indicizzati in modo corretto è una questione seria. Mueller ritiene che l’inconveniente derivi dal metodo predittivo utilizzato da Google per trovare i contenuti duplicati.
A riguardo, spiega che il motore di ricerca ha diversi livelli per individuare quando le pagine web posseggono contenuti duplicati.
Ad esempio, uno dei metodi che utilizza è guardare direttamente il contenuto della pagina, per verificare il tipo di contenuto. Ancora, mediante gli URL, è in grado di prevedere quando le pagine sono duplicate.

Mueller argomenta poi che noi stessi abbiamo modi differenti per giudicare il materiale contenuto nelle varie pagine Web, e dunque se le informazioni veicolate sono duplicate o meno. Ad esempio, guardiamo direttamente l’oggetto della pagina e realizziamo se, da pagina a pagina, è differente o se si trattano gli stessi contenuti.

Google si rende conto, di solito, quando la struttura dell’URL di una pagina è somigliante a quella di un’altra pagina dello stesso sito. Una volta realizzata la similarità, impareremo quel pattern e riterremo che gli URL che hanno quello stesso aspetto siano simili nei contenuti.

Mueller continua spiegando come mai Google attua questo sistema: principalmente lo fa per risparmiare risorse quando deve occuparsi della scansione e della indicizzazione.
Infatti, quando Google ritiene che due pagine siano una la duplicazione dell’altra perché hanno un URL simile, non si occupa nemmeno di scansionare le pagine per analizzarne a fondo i contenuti.

Hai presente quel modo di dire: “Non giudicare un libro dalla copertina”? Per Google non vale!

Queste le parole di John Mueller a riguardo:

URL simili in un sito di eventi

Questo procedimento predittivo di Google, che si pone l’obiettivo di rilevare i contenuti duplicati, può influenzare numerosi siti web, ad esempio quelli degli eventi.

Ipotizziamo di avere una pagina dedicata agli eventi di una grande città, il cui url potrebbe essere: /eventi-teatro-città

Sempre sullo stesso sito sono presenti altre pagine per i paesini nelle vicinanze della grande città, tuttavia il contenuto, ovvero gli eventi, sono gli stessi o quasi. Stiamo parlando di pagine con url: /eventi-teatro-città2, /eventi-teatro-città3 etc..

Google, riconoscendo come identici i contenuti di queste pagine, potrebbe memorizzare il pattern dell’url ( /eventi-teatro) e ignorare la città in quanto ritenuta ininfluente. Una volta memorizzato questo pattern, potrebbe applicare il ragionamento a tutti gli url simili, non indicizzando queste pagine.

Se l’URL è simile, la pagina è ignorata e finisce nel dimenticatoio.

Cosa fare quando gli URL sono simili?

C’è un modo, per il proprietario di un sito, di risolvere il problema degli url simili?

Assolutamente SI. Occorre cercare il modo per limitare questa situazione. Riprendendo l’esempio del sito di eventi, lo si può fare utilizzando ad esempio un rel canonical sulle pagine del paesino e così via, dando una sorta di unicità all’URL della grande città, così che venga indicizzato.

Un’altra soluzione, valida solo per questa occasione, potrebbe essere quella di allargare il raggio di copertura della grande città, soprattutto se nei piccoli paesi non vengono organizzati eventi e quelli più vicini sono nella grande città.

URL simili penalizzano i contenuti?

Sembrerebbero non esserci penalizzazioni o segnali di ranking negativi per i siti che contengono url simili. La cosa peggiore che può succedere è che Google non indicizzi i contenuti duplicati, ma tutto ciò non si ripercuoterà negativamente sul sito nel suo insieme.

Quindi che dire, Google ha le sue tecniche per prevedere la duplicazione di contenuti, giuste o meno che siano, siamo noi a doverci adattare!

Scritto da

Luigi Virginio

Consulente Google Ads

Gestisco campagne Google Ads per PMI, E-commerce e professionisti dal 2014. Ho lavorato su oltre 200 account in settori diversi. Ogni articolo che scrivo nasce dall’esperienza diretta sugli account, non dalla teoria. Se vuoi saperne di più sul mio approccio, visita la pagina Chi sono.