Potatura di un sito web: guida super dettagliata
+39 338 2498107 info@effettoundici.it

Ci rendiamo sempre più conto che l’ottimizzazione di un sito web non può prescindere dall’ottimizzazione del crawl budget di Google. In pratica chi gestisce un sito – di grandi o di piccole dimensioni non fa differenza – deve preoccuparsi ogni giorno di non far sprecare inutilmente il crawl budget a Google, o meglio non solo, deve far in modo che il crawl budget di Google nei suoi confronti sia più “cospicuo” che nei confronti dei propri competitor.

Tutto quanto concerne il riediting dei contenuti del nostro sito che deve essere improntato e influenzato da questo tipo di dogma: “far perdere tempo a Google è nocivo per il sito web che curiamo ogni giorno con gioia, apprensione, dedizione e passione”.

🙂

Detto questo, andiamo a vedere come dobbiamo comportarci in ottica SEO durante la potatura di un sito web sempre considerando che Google non deve e non vuole sprecare inutilmente crawl budget e che noi da bravi SEO Specialist – ripetetelo a gran voce – vogliamo e dobbiamo fare qualcosa per il crawl budget del nostro sito web.

Attenzione ad alcuni dettagli…

Come avete già potuto comprendere a volte si sente anche un po’ troppo spesso la frase “risparmiare crawl budget”  che altro non è che un’espressione un po’ fuorviante, qui è corretto se mai dire “aumentare Crawl budget“..

oddio in che senso?

Stiamo parlando in sostanza del lasso di tempo per cui Google è disposto ad occuparsi di noi, e sarebbe ancora più corretto precisare che “per fare questo,  facciamo risparmiare tempo a Google facendogli capire fin da subito quali sono le erbacce secche del nostro sito che non ci interessano più”…

Vedete tra potatura e crawl budget abbiamo trovato il nesso 🙂

Cos’è il Crawl Budget?

Partiamo da una definizione, cos’ è il crawl budget. Quando parliamo di crawl budget altro non facciamo che intendere il numero di volte che il bot di Google scansiona le pagine web comprese in un dominio in un determinato lasso di tempo.

Incidetevi sulla pelle questa definizione.

“Tagliamo le erbacce del nostro sito” e vediamo quali sono oggi i rimedi possibili: 301, 404, noindex/disallow, riediting del contenuto

Abbiamo analizzato 5 circostanze che chi si trova dinnanzi a contenuti da rieditare potrà sempre tenere a mente e non solo, potrà applicare il tutto al caso di specie tenendo fede alle concause e alle situazioni analizzate.

Spesso e volentieri quando andiamo di “potatura” ci ritroviamo di fronte a:

  • 1) articolo/pagina mal posizionato con la keyword di riferimento o che più che altro non soddisfa l’intento di ricerca.
  • 2) articolo/pagina posizionato con una keyword che è ancora salvabile
  • 3) articolo/pagina non indicizzato
  • 4) articolo/pagina nel limbo  (non posizionato con niente, ma presente nell’indice su Google)
  • 5) articolo/pagina che non ci interessa più sia a livello di keyword che di contenuto

Ricostruzione del Contenuto: quando, come e perché

Togliamoci subito il pensiero così i SEO Copywriter hanno già finito di leggere l’articolo.

A parte gli scherzi, quando ha senso intervenire lato contenuto? Solo in alcuni casi, proprio perché alcuni contenuti è meglio tagliarli via, farli annegare tra gli abissi del web e non pensarci più…. 🙁

dalla 35 pos. alla 10, salvate i contenuti che per chiavi rilevanti hanno ottenuto questi posizionamenti, gli altri… ehm, potete appunto continuare la lettura di questa guida o comunque non salvateli!

Quando il posizionamento è situato tra la 35° e la 1° posizione allora facciamo SEO on Site lato contenuto. Questo è il dogma principale… già inciso sulla pelle?

… ma ATTENZIONE, e se invece siamo oltre la 35° posizione…  ?

potatura seo

301

Possiamo applicare un Redirect 301 quando:

  • non ti interessa il posizionamento che hai ottenuto (unica eccezione qui nel non intervenire lato contenuto e dunque sfruttare il redirect 301 anche se abbiamo ottenuto posizionamenti tra la 35° pos e la 10° pos)
  • quando la medesima keyword è posizionata male in rapporto ad un’altra URL che è posizionata meglio (in sostanza si evita la cannibalizzazione…)
  • quando abbiamo un piccolo posizionamento pertanto irrilevante, ovverosia parole chiave cercate da  20, 30, persone al mese, e magari questo posizionamento ricade su una kw correlata ad una principale posizionata più in alto. Ecco che in questo caso il Redirect diventa anche un micro incremento di “juice” tipico dei link interni, in pratica ci “reinderizziamo addosso la pagina che vogliamo cancellare” proprio come se ci mandassimo un link interno verso la pagina/URL che riteniamo dominante.

Quando si fa un 301 durante la potatura di un sito web, tenete sempre presente che siamo di fronte ad uno strumento ottimo quando vogliamo:

  • salvare il posizionamento della URL pregressa,
  • rinforzare il posizionamento della URL ospitante

Per farlo in modo corretto:

Bisogna sempre procurarsi una pagina di appoggio capace di accogliere a livello tematico/sarch intent la URL che verrà reindirizzata e comunque dobbiamo sempre tenere presente che comunque, nel bene e nel male, un piccolo sforzo a livello di crawl budget ecco che Google lo pone in essere: diciamo che il 301 è un ottimo intervento ma non è il più leggero in assoluto in termini di crawl budget.

404

Sì ci sono anche le pagine 404 in questa trattazione 🙂

Applichiamo invece un “404”, banalmente mettiamo nel Cestino su WP la pagina di un contenuto che non ci serve più quando siamo di fronte a:

  • articoli non indicizzati*   in realtà agire su un articolo manco presente nell’indice di Google è comunque un paradosso e non ha senso… però se proprio vogliamo 🙂
  • articoli che sono nel limbo tra il mancato posizionamento e la non indicizzazione, articoli che non portano niente lato traffico, ma come niente si intende il quasi nulla più assoluto
  • articoli mal posizionati per la keyword che ci siamo posti fin dall’inizio come obiettivo 

Se eliminiamo e dunque mettiamo nel cestino determinate URL/contenuti ecco che Google smaltirà da solo questi contenuti deindicizzandoli se è il caso.

Ques’azione è pericolosa in termini di UI e UX (ovviamente non è possibile che nella tua homepage vi siano, innumerevoli link che portano a 404, inoltre nel contesto di un sito se si sta facendo tanta potatura non si può pensare di “ranzare” tutto così in questi termini solo perché è comodo a livello di crawl busget, nel senso ci vuole una certa cautela quando “creiamo di nostra sponte” dei 404!).

Abbiamo capito dunque che non non bisogna esagerare di 404  ma che bisogna saperle dosare all’interno del nostro sito, del resto Google sul versante 404 non è più severo come un tempo…

Peraltro sempre su WP quando si procede a “mettere pagine e articoli nel Cestino” ecco che SEO Yoast comunque toglie in automatico la URL dalla Sitemap, in pratica il contenuto resta soltanto nel DB ma non esiste più come pagina vera e propria percepibile da Google.

Non è poco, nel senso, stiamo parlando di una potatura pressoché definitiva in questo caso e che per forza di cose non pesa in termini di scansione e di crawl budget.

Ancora un ultimo sforzo…

potatura di un sito web

Noindex  // Disallow

  • Quando un articolo è indicizzato e ben posizionato e non lo volete più nell’indice di Google
  • Quando un articolo è mal posizionato oltre la 40/50 posizione*

ecco che possiamo utilizzare il Noindex e il suo “cugino Disallow” (il Disallow solo per questa condizione*, o comunque semplicemente quando vogliamo che Google eviti la scansione di una determinata pagina)

Ma attenzione, qui la faccenda si complica… facciamo ordine:

  • articolo mal posizionato che volete espellere dall’indice
  • articolo mal posizionato

nella prima delle ipotesi il noindex assolve alla sua funzione naturale: strappare via la URL dall’indice di Google, nell’ultima ipotesi invece è meglio utilizzare un 404 oppure un noindex, eh lo so, qui viene il bello… voi infatti vi state chiedendo: quando è meglio usare un noindex e quando invece un 404?

Non esiste una regola precisa e ferrea, bisogna però tenere sempre presente che:

  • Il noindex fa dannare eccome Google a livelli di crawl budget anche se al tempo stesso conserva all’apparenza una situazione stabile e dunque non di pericolo per la corretta UI di un sito lato utente. Vi ricordate.. prima vi avevamo detto, “dosate i 404, troppi fanno casino, pochi vanno bene” in termini di Usability.
  • d’altro canto inserire diversi 404 è vero che non urta a livello di crawl budget ma non si può dire che è un ottima soluzione a livello di UI/UX

A voi la scelta!

ma attenzione e…. il nostro amico “Disallow”?

Ed eccoci di fronte ad un “altro nodo della potatura”… se il noindex è un provvedimento pesante e complesso in termini di crawl budget ecco che ci aiuta il Disallow a dirimere “tutti i casini” a livello di crawl che ci combina il noindex. Il Disallow  secondo ormai la SEO moderna è il miglior provvedimento in assoluto per quanto riguarda il “non far sperecare crawl budget a Google”… ok,

però si deve sempre tener presente che il Disallow è un provvedimento che:

  • è applicabile soltanto a file robots.txt
  • lo si può applicare ad una pagina sola oppure ad una categoria, ok… ma non è un provvedimento che lede l’indicizzazione di una singola URL, nel senso Google non perderà più tempo con la URL tacciata di Disallow, ma qualcuno, anche casualmente, la potrebbe intercettare nell’indice proprio perché il Disallow non la deindicizza come provvedimento. Il Disallow è in sostanza un provvedimento che ab origine dice a Google di non perdere tempo con quel determinato ramo del sito, tutto qui ;):

 

Approfondimenti su Disallow e Noindex

Conclusioni

So benissimo che alla fine di questo delirio alcuni rimarranno confusi e sbigottiti.

Il punto è che la “potatura” di un sito web quando orientata al risparmio del crawl budget è argomento complesso che lascia “basiti “più di un SEO Specialist e soprattutto, come vedete, le soluzioni per interventi corretti e performanti non mancano e sono tutte su per giù ricche di pro e di contro, nel senso, non esiste una soluzione nettamente migliore dell’altra, accettatelo, a volte nella SEO è così.

Articolo realizzato con la collaborazione di Saverio Bruno di Saverio Web