Cos’è la ricerca semantica basata sulle entità.

Cos’è la ricerca semantica basata sulle entità.

1. La strada di Google per diventare un motore di ricerca semantico.

Gli sforzi di Google per sviluppare un motore di ricerca semantico risalgono al 1999 (come visto in questo post dal compianto Bill Slawski), diventando più concreti con l’introduzione del Knowledge Graph (database che consente a Google di fornire risposte immediate e concrete) nel 2012 e con il cambiamento fondamentale nel suo algoritmo di classificazione nel 2013 (popolarmente noto come Hummingbird).

Tutte le altre principali innovazioni come RankBrain, E-A-T, BERT e MUM supportano direttamente o indirettamente l’obiettivo di diventare un motore di ricerca completamente semantico. Introducendo l’elaborazione del linguaggio naturale (NLP) nella ricerca, Google si sta muovendo a un ritmo esponenziale verso questo obiettivo.

 

2. Hummingbird: “non stringhe, ma cose” = entità.

Hummingbird è il segnale di partenza dell’evoluzione di Google per diventare un motore di ricerca semantico. È stata la più grande elaborazione delle query di ricerca (insieme di parole chiave) e modifica del ranking (metodo con cui un motore dispone i risultati ricercati) mai apportata da Google, interessando oltre il 90% di tutte le ricerche già nel 2013: Hummingbird, infatti, ha sostanzialmente sostituito gran parte degli algoritmi di ranking esistenti.

Attraverso Hummingbird, Google è stata immediatamente in grado di includere le entità registrate nel Knowledge Graph per l’elaborazione delle query, il ranking e l’output delle SERP (Search Engine Results Page, ossia la pagina dei risultati che il motore di ricerca mostra in risposta alla query ricercata).

Ma cosa sono le entità?
Un’entità descrive l’essenza o l’identità di un oggetto concreto o astratto dell’essere. Le entità, quindi, sono univocamente identificabili e significative.
Fondamentalmente, si può fare una distinzione tra entità denominate e concetti astratti:

  • Le entità denominate sono oggetti del mondo reale, come persone, luoghi, organizzazioni, prodotti ed eventi.
  • I concetti astratti sono di natura fisica, psicologica o sociale, come la distanza, la quantità, le emozioni, i diritti umani, la pace, ecc.

Prima di Hummingbird, Google eseguiva principalmente la corrispondenza dei documenti con keywords (parole chiave) per il posizionamento, e non era in grado di riconoscere il significato di una query di ricerca o di un contenuto.

3. Cos’è un motore di ricerca semantico?

Si tratta di un motore di ricerca che considera il contesto semantico delle query e del contenuto per comprendere meglio il significato di ciò che si sta cercando. I motori di ricerca semantici considerano anche le relazioni tra le entità per restituire i risultati della ricerca.

Al contrario, i sistemi di ricerca puramente basati su parole chiave funzionano solo sulla base di una corrispondenza testo-parola chiave.

4. Cos’è la ricerca semantica?

Molte definizioni di ricerca semantica si concentrano sull’interpretazione dell’intento di ricerca come la sua essenza. Ma, prima di tutto, la ricerca semantica riguarda il riconoscimento del significato delle query di ricerca e del contenuto in base alle entità che si verificano.
Semantica, infatti, vuol dire “teoria del significato”.
Ma “significato” non è la stessa cosa di “intenzione”. L’intento di ricerca descrive ciò che un utente si aspetta dai risultati della ricerca. Il significato è un’altra cosa.
Identificare il significato può aiutare a riconoscere l’intento di ricerca, ma è per lo più un ulteriore vantaggio della ricerca semantica.

5. Il ruolo del Knowledge Graph nella ricerca semantica di Google.

La classificazione basata sull’entità richiede anche l’indicizzazione basata sulla stessa.
Il Knowledge Graph è l’indice delle entità di Google che tiene conto delle relazioni tra le entità.
Gli indici classici sono organizzati in forma tabellare e, pertanto, non consentono la mappatura delle relazioni tra i set di dati.

Il Knowledge Graph è un database semantico in cui le informazioni sono strutturate in modo tale che la conoscenza sia creata dalle informazioni. Qui, le entità (nodi) sono correlate tra loro tramite bordi, fornite di attributi e altre informazioni, e collocate in contesti tematici o ontologie.

 

Le entità sono l’elemento organizzativo centrale nei database semantici, come il Knowledge Graph di Google. E, oltre alle relazioni tra le entità, Google utilizza il data mining (estrazione di dati) per raccogliere attributi e altre informazioni sulle entità e le organizza attorno alle stesse.

6. Come funziona Google come motore di ricerca semantico?

Google utilizza la ricerca semantica nelle seguenti aree:

  • Comprensione delle query di ricerca o delle entità nell’elaborazione delle query di ricerca.
  • Comprensione del contenuto delle entità per il posizionamento.
  • Comprensione del contenuto e delle entità per il data mining.
  • Classificazione contestuale delle entità per la successiva valutazione E-A-T (Expertise, Authoritativeness e Trustworthiness, ossia esperienza, autorevolezza e veridicità dei risultati di ricerca).

La ricerca di Google è ora basata su un elaboratore di query di ricerca per l’interpretazione delle query ricercate e la compilazione di corpus di documenti pertinenti alla query di ricerca.
È qui che possono entrare in gioco:

  • BERT (Bidirectional Encoder Representation from Transformers, cioè un modello informatico che elabora e imita il linguaggio naturale umano).
  • MUM (Multitask Unified Model, algoritmo funzionante con l’Ai – intelligenza artificiale – per migliorare le ricerche).
  • RankBrain (sistema di apprendimento basato sull’AI per elaborare i risultati di ricerca e ordinarli in modo adeguato).

 

 

 

 

 

Nell’elaborazione delle query di ricerca, i termini di ricerca vengono confrontati con le entità registrate nei database semantici per poi essere rifiniti o riscritti, se necessario. Nella fase successiva, viene determinato l’intento di ricerca e un corpus adeguato di contenuti X.
Google utilizza il classico indice di ricerca e il proprio database semantico sotto forma di Knowledge Graph. È probabile che avvenga uno scambio tra questi due database tramite un’interfaccia.

Esiste un motore di punteggio composto da diversi algoritmi basati sull’algoritmo principale di Hummingbird, il quale è responsabile della valutazione del contenuto e quindi dell’ordine in base al punteggio. Il punteggio riguarda la pertinenza del contenuto in relazione alla query di ricerca o all’intento di ricerca.

Poiché Google, oltre alla pertinenza vuole anche valutare la qualità dei contenuti, viene effettuata una valutazione secondo 14 diverse modalità riguardanti i criteri E-A-T,  attraverso i quali Google si baserà sull’esperienza, l’autorità e l’affidabilità del dominio, dell’editore e/o dell’autore.
I database di entità semantiche possono essere la base per questa ricerca di valutazione. I risultati della ricerca vengono quindi liberati dai duplicati tramite un motore di pulizia e vengono prese in considerazione eventuali sanzioni.

7. Cosa significa questo per la SEO semantica?

Abbiamo letto molto sui dati strutturati, sull’ottimizzazione semantica dei contenuti e sulla struttura dei mondi tematici quando si tratta di SEO semantica: mostrare a Google che trattiamo determinati argomenti con relativi contenuti e competenze attinenti è importante.

Alcuni brevetti riguardano il confronto dei Knowledge Graph interni dei documenti con il Knowledge Graph di Google. La teoria qui è che un alto livello di corrispondenza tra le entità utilizzate in un testo e le strutture di relazione dell’entità principale nel database semantico di Google porta a classifiche migliori.
Tutto questo sembra logico, ma siamo onesti: alla fine, l’ottimizzazione basata sulle parole chiave non differisce in modo significativo dall’ottimizzazione dei contenuti basata sull’entità.

Anche la struttura dei mondi topici ha senso, ma va detto che in tempi di ranking di passaggio si dovrebbe considerare quanto segue:

  • Fino a che punto un tema è scomposto in vari sottotemi?
  • Vengono prodotti contenuti separati per ogni sottotema?
  • È stata creata solo una risorsa di contenuto olistico?

Per quanto riguarda i dati strutturati, questi possono aiutare Google a comprendere le relazioni semantiche, ma solo fino a quando non ne ce ne sarà più bisogno. E ciò avverrà presto.
Secondo noi, Google è così bravo nell’apprendimento automatico che utilizza dati strutturati per addestrare gli algoritmi più velocemente.
Prendiamo come esempio i markup (tag) per i profili dei social media: in meno di un anno, Google è passato dal consigliarne l’uso a dichiarare di poter vedere automaticamente i profili social senza dati strutturati. Ecco perché è solo una questione di tempo prima che Google non abbia più bisogno di loro.

Anche i dati strutturati non sono una buona base per una valutazione. O li hai o non li hai.
Tutto questo fa parte della SEO semantica. Tuttavia, ciò che spesso ci manca è la visione globale delle entità come editori e autori, e qui giocano un ruolo maggiore i segnali off-page (insieme di tutte le tecniche SEO che si sviluppano al di fuori del sito web) che quelli on-page.

Sulla base delle relazioni tra entità autorevoli e credibili, Google vuole determinare quali domini e autori sono le migliori fonti di qualità per un argomento secondo E-A-T:

  • Chi è imparentato con chi?
  • Chi consiglia chi?
  • Chi esce con chi?

I collegamenti e le co-occorrenze di Google possono essere utilizzati come fattori per questa vicinanza tra entità di autorità. E per SEO semantico, intendiamo anche ottimizzarli.
Mentre siamo in tema di co-occorrenza, bisogna anche considerare come funziona la PNL (programmazione neurolinguistica) durante l’ottimizzazione dei contenuti: Google utilizza la PNL per identificare le entità e il loro contesto, e il funzionamento si basa su strutture di frasi grammaticali, triple e tuple (l’insieme delle informazioni), composte da nomi e verbi.
Ecco perché dovremmo anche prestare attenzione a una struttura grammaticale semplice della frase nella SEO semantica, perché usa frasi brevi senza pronomi personali e nidificazioni.

Questo è il modo in cui serviamo gli utenti in termini di leggibilità e motori di ricerca.

8. Il futuro della ricerca semantica: quando sarà possibile ottenere una ricerca Google basata su entità al 100%?

Pensiamo che in futuro ci sarà uno scambio crescente tra il classico indice di ricerca di Google e il Knowledge Graph tramite un’interfaccia: più entità vengono registrate nel Knowledge Graph, maggiore sarà la loro influenza sulle SERP. Tuttavia, Google deve ancora affrontare le principali sfide per conciliare completezza e accuratezza.

Per il punteggio effettivo di Hummingbird, le entità a livello di documento non svolgono un ruolo importante. Piuttosto, sono un elemento organizzativo di valore per la creazione di corpus di documenti non ponderati sul lato dell’indice di ricerca. Il punteggio effettivo dei documenti viene eseguito da Hummingbird secondo le classiche regole di recupero delle informazioni. Tuttavia, a livello di dominio, vediamo l’influenza delle entità sul ranking molto più alto.

Nei prossimi anni, molto probabilmente vedremo il crescente impatto delle entità nella ricerca di Google.
Il nuovo aspetto delle ricerche basate su entità mostra in modo chiaro come Google stia gradualmente organizzando l’indicizzazione di informazioni e contenuti attorno a un’entità. Ciò indica quanto innovazioni come MUM seguano fortemente l’idea di una ricerca semantica.

Related Posts