Un'enorme quantità di documenti trapelati dalla sede di Google ha rivelato alcuni degli elementi più importanti che il motore di ricerca utilizza per classificare i contenuti.
Il 13 marzo una raccolta di 2.500 documenti, che sembrano provenire dal Content API Warehouse interno di Google, sono stati rilasciati su GitHub.
I file contengono dettagli sui dati che Google raccoglie e potenzialmente utilizza nei suoi algoritmi di classificazione delle ricerche. Dati che potrebbero svelare i potenziali fattori di ranking della Ricerca Google, inclusi dettagli sulle variazioni del PageRank, metriche sull'autorità del sito e altro ancora.
Stando a quanto riportato da alcuni portali online americani, ieri (30 maggio) Google ha ufficialmente riconosciuto che alcuni documenti interni recentemente trapelati online sono autentici. Al contempo Google ha messo in guardia dal trarre conclusioni affrettate basandosi solo sui file trapelati.
I documenti contengono oltre 14.000 funzionalità API che rivelano dettagli inediti su come Google classifica i contenuti, gestisce i dati degli utenti e utilizza vari segnali per determinare il ranking delle pagine web.
Se vuoi avere un dettaglio completo del contenuto, ti invitiamo a leggere l'ottimo articolo pubblicato da Search Engine Land Unpacking Google’s massive search documentation leak.
Nel nostro esame dei documenti trapelati, ci siamo concentrati su alcuni aspetti che abbiamo trovato particolarmente significativi, attribuendo una nostra personale interpretazione. Questa analisi è frutto di una deduzione basata sui dati raccolti sul web in questi ultimi giorni e dalla nostra esperienza.
Diverse metriche emergono come cruciali nella determinazione della "topic authority":
Queste metriche sono interessanti perché permetterebbero di ottimizzare le pagine per allinearle meglio con l'interpretazione di Google.
Google adotta un sistema chiamato NavBoost con il quale modifica i ranking basandosi sui dati di clic degli utenti.
Questo sistema segna una deviazione dalle precedenti dichiarazioni di Google, che negavano l'influenza dei dati di clic sul posizionamento nei risultati di ricerca. Tale rivelazione suggerisce che le metriche di engagement degli utenti rivestono un ruolo significativamente più importante per l'ottimizzazione per i motori di ricerca (SEO) rispetto a quanto ammesso in passato.
Un aspetto particolarmente rilevante è l'utilizzo specifico dei dati di clic provenienti dal browser Chrome, presumibilmente esteso anche ai dispositivi Android. Google utilizzerebbe questi dati per calcolare metriche che influenzano il ranking delle pagine.
L'età di un sito web, nota come "HostAge", non influisce direttamente sui punteggi di ranking, ma viene menzionata in relazione a un "sandbox" utilizzato nel sistema Twiddler per limitare la visibilità di nuovi spam durante la fase di erogazione dei risultati. Potrebbe avere un impatto anche su tutti i nuovi siti appena pubblicati?
Google ha sostenuto di non utilizzare un concetto di "overall domain authority" per il posizionamento delle pagine nei risultati di ricerca. Tuttavia, dai documenti trapelati emerge che Google calcola una caratteristica denominata "siteAuthority". Questo indica che, nonostante le dichiarazioni ufficiali, esiste un qualche tipo di misurazione dell'autorità a livello di sito che potrebbe influenzare il ranking.
Google conserva le ultime 20 versioni di ogni pagina web, funzionando come un archivio web interno simile alla "Wayback Machine".
Analizzando le informazioni contenute in questi documenti emerge una discrepanza tra le dichiarazioni ufficiali di Google e le pratiche apparentemente in uso, solleva questioni di trasparenza e affidabilità nelle comunicazioni di Google riguardo al proprio algoritmo di ricerca.
Dal nostro punto di vista questo divario tra ciò che Google afferma e ciò che effettivamente fa alimenta un clima di confusione e frustrazione nei Team SEO come il nostro, che cercano di ottimizzare i siti in base a linee guida che potrebbero non essere completamente allineate con i fattori che influenzano il posizionamento nei risultati di ricerca.