Il mondo dei motori di ricerca è tanto vasto quanto complesso. Per iniziare a conoscerli bisogna imparare il funzionamento basilare di un algoritmo. Ma anche familiarizzare con acronimi quali SEO e SERP.
La conoscenza dei motori di ricerca passa poi per un utilizzo di almeno alcuni dei più celebri e utilizzati: dai motori di ricerca generalisti a quelli specifici, passando per quei motori di ricerca con funzioni più o meno particolari.
Infine è sicuramente utile approcciarsi alle operazioni booleane e a tutte quelle accortezze che permettono di affinare i risultati di una ricerca. In modo da ottenere più rapidamente quello di cui si ha davvero bisogno.
- Cosa sono e come funzionano i motori di ricerca
- Breve storia dei motori di ricerca
- Il vocabolario dei motori di ricerca
- I motori di ricerca più famosi
- Come funzionano i motori di ricerca specifici
- Altri motori di ricerca con funzionalità particolari
- Come usare le operazioni booleane per migliorare una ricerca
- Come usare la SEO per posizionarsi sui motori di ricerca
- Cosa sono gli aggregatori Atom e RSS
-
0. Cosa sono e come funzionano i motori di ricerca
Credits Shutterstock
Un motore di ricerca è un sistema che si occupa di elaborare dei dati in input e di restituire dei dati in output. Da una parte interpreta le richieste: gruppi di parole chiave scritte da parte degli utenti attivi su Internet. Dall’altra restituisce un elenco di contenuti (tendenzialmente pagine o siti web) corrispondenti alla singola ricerca.
Il funzionamento dei motori di ricerca non è troppo diverso da quello delle applicazioni web client-server. In questo caso il client è rappresentato dal browser utilizzato dal singolo utente.
Il browser si connette a sua volta ad un server, eseguendo poi la cosiddetta query informatica: un’interrogazione che l’utente propone al software con l’obiettivo di ottenere delle informazioni relative a una qualsiasi base di dati.
L’attività dei motori di ricerca viene generalmente organizzata in fasi distinte. La prima fase è quella dell’analisi: ha che fare con lo studio dei contenuti disponibili sul web e la creazione successiva di un database, che verrà periodicamente aggiornato.
I motori di ricerca di solito affidano l’analisi ai webcrawler: dei bot espressamente dedicati all’acquisizione di informazioni, in grado di generare una copia testuale dei documenti presenti all’interno delle pagine Internet.
I motori di ricerca analizzano il web, catalogano i risultati individuati e rispondono alle richieste inviate dagli utenti
La seconda fase di attività dei motori di ricerca prevede la catalogazione del materiale ottenuto a seguito dell’analisi. I contenuti individuati vengono inseriti all’interno del database cui si accennava in precedenza soltanto se rispondono a criteri specifici.
Le regole che portano il motore di ricerca a arricchire il suo database con i contenuti individuati quotidianamente dai web crawler variano di caso in caso. E hanno ripercussioni dirette sui risultati di una ricerca da parte dell’utente.
La terza e ultima fase di attività dei motori di ricerca è quella di risposta. Ogni volta che un utente invia una richiesta a un motore di ricerca, quest’ultimo effettua una ricerca all’interno del suo database.
La selezione dei risultati di ricerca da restituire dipende dall’algoritmo e le impostazioni che caratterizzano il singolo motore di ricerca. In linea di principio le pagine web acquistano rilevanza in base alla quantità di parole chiave che contengono. Ma anche tenendo conto di quanto sono effettivamente in grado di rispondere alla richiesta dell’utente.
-
1. Breve storia dei motori di ricerca
Credits Shutterstock
Non è semplice individuare il primo motore di ricerca in assoluto. Anche perché la necessità di orientarsi tra i siti e le pagine web è nata grosso modo contestualmente all’avvento di Internet.
Detto questo diversi esperti del settore concordano nel considerare Aliweb il primo motore di ricerca della Storia. Se non altro perché alcuni suoi software concorrenti come ad esempio Wanderer o Gopher erano stati sviluppati per ottenere risultati differenti.
Aliweb è l’acronimo di Archie Like Indexing for the Web e richiama un ulteriore programma di nome Archie: un sistema di ricerca e schedatura per file salvati su server FTP.
Annunciato nel novembre del 1993, Aliweb è stato presentato al pubblico l’anno successivo. Più precisamente durante la prima conferenza internazionale dedicata al neonato World Wide Web, tenutasi all’interno della sede del CERN di Ginevra.
Secondo molti addetti ai lavori, Aliweb (Archie Like Indexing for the Web) è il primo motore di ricerca mai realizzato.
Questo motore di ricerca ha avuto un ruolo fondamentale anche per lo sviluppo dei successivi. Aliweb infatti permetteva agli utenti di condividere il file indice dei loro siti, oltre a una descrizione che li rappresentasse. In questo modo anche i webmaster hanno iniziato ad avvicinarsi a concetti ancora in via di definizione, quali SEO e SERP.
Da una parte dovevano pensare a determinate parole chiave in grado di descrivere le funzionalità o i servizi offerti dal sito all’utente. Dall’altra dovevano fare un ragionamento inverso e partire proprio dalle parole che gli utenti avrebbero potuto utilizzare per cercare le pagine che gestivano.
Il motore di ricerca più antico ancora attivo è WebCrawler: lanciato nel 1994, ma successivamente acquisito da Bing. Il primo motore di ricerca italiano, oggi inattivo, è invece Spenki. Anche Spenki è stato lanciato nel 1994 ed è stato sviluppato su macchine legate al sistema operativo open source Linux.
Spenki permette di menzionare anche i (pochi) motori di ricerca interamente fondati su software libero. Ad esempio Lucene, lanciato nel 2000 da Apache Software Foundation. Ma anche OpenIndexer, un particolare motore di ricerca per file di tipo ODF.
-
2. Il vocabolario dei motori di ricerca
Credits Shutterstock
Prima di entrare nel merito della classificazione di alcune categorie di motore di ricerca e dell’analisi di funzionalità specifiche, può essere utile approfondire alcune parole chiave. Una specie di lessico fondamentale, per imparare a parlare in maniera consapevole di Google, Yahoo! e soci.
La prima parola è “indicizzazione”, che non spesso viene fusa e confusa con la parola “SEO”. In realtà si tratta di concetti piuttosto distanti tra loro. L’indicizzazione è semplicemente la procedura di inserimento di siti e pagine web all’interno dei database dei diversi motori di ricerca. Il processo eseguito daicrawler, descritto nei capoversi precedenti.
L’acronimo SEO sta invece per Search Engine Optimization e fa riferimento a tutta una serie di procedure che verranno descritte in seguito. In generale però si parla di “ottimizzazione” ogni qual volta vengano seguite strategie atte ad aumentare la visibilità di una pagina o un sito su un motore di ricerca.
La SEO è la Search Engine Optimization, mentre l’acronimo SERP significa Search Engine REsult Pages
L’ottimizzazione sui motori di ricerca è spesso la diretta conseguenza di una buona attività di “posizionamento”: un’altra parola chiave, che fa riferimento più esplicito alle operazioni che permettono a un sito di venire ottimizzato.
Infine spazio ad altre due parole decisamente importanti quando si trattano i motori di ricerca: da una parte “SERP”, dall’altra “raffinamento”. L’acronimo SERP sta per Search Engine Result Pages e fa riferimento alla schermata di risultati proposti da un motore di ricerca dopo una richiesta dell’utente.
La parola “raffinamento” chiama invece in causa i cosiddetti operatori logici, tra cui quelli che derivano dalle operazioni booleane. In informatica gli operatori permettono di indicare alla macchina le regole da applicare al suo metodo di lavoro.
Gli operatori booleani permettono di effettuare una ricerca mirata su Google, ma anche su un qualsiasi altro motore di ricerca. Nei capoversi a seguire verrà spiegato il funzionamento di alcuni tra i più utilizzati.
-
3. I motori di ricerca più famosi
Credits Shutterstock
Parlare dei motori di ricerca più diffusi e apprezzati significa giocoforza parlare di Google: non solo il motore di ricerca, ma addirittura il sito più visitato in tutto il mondo da anni.
I numeri di Google sono semplicemente impressionanti, si parla di una media di quasi 160 milioni di visite al mese, effettuate da oltre 24 milioni di utenti unici. Non a caso ormai il verbo inglese to google (traducibile in italiano con la parola “googlare”) viene utilizzato per alludere a una qualunque ricerca sul web.
Google è attivo dal 1997 e col passare del tempo ha aggiornato via via funzionalità e servizi a disposizione dell’utente. A partire dai suggerimenti di ricerca, che compaiono dopo l’inserimento anche di una sola parola chiave. Fino ad arrivare alla ricerca per immagini e al raggiungimento di uno stato carbon neutral.
Nonostante il suo successo, Google non è certamente l’unico motore di ricerca disponibile sul mercato. Esistono tantissime altre alternative, sia in termini di motori generalisti, sia in termini di motori più specifici.
Ad esempio Bing e Yahoo! completano il podio dei motori di ricerca più utilizzati in questo periodo storico. Anche se la differenza di percentuale con Google, in termini di preferenze, è piuttosto marcata.
Basti pensare che il motore di ricerca sviluppato a Mountain View, raccoglie da solo quasi il 95% degli utenti internazionali. Agli altri player del settore non resta che un 5%, occupato in larga parte proprio da Bing e Yahoo!. Secondo stime del 2022 il primo viene scelto dal 3,33% degli utenti, mentre il secondo raccoglie l’1,25% delle preferenze.
-
4. Come funzionano i motori di ricerca specifici
Credits monticello / Shutterstock
Ai motori di ricerca generalisti come Google, Bing e Yahoo! se ne aggiungono altri più specifici: ad esempio quelli che delimitano la propria attività a una categoria specifica di informazioni. A ciò si aggiungono altri motori di ricerca che si distinguono per funzionalità particolari.
Un ottimo esempio di motore di ricerca specifico è Indeed: una piattaforma pensata espressamente per cercare lavoro. Indeed alimenta quotidianamente il suo database proprio come un motore di ricerca generico, raccogliendo annunci e offerte da migliaia di siti internazionali: dai lavori manuali ai lavori tech. Da quelli con decenni di Storia alle spalle, a quelli più futuristici.
Il funzionamento è lo stesso di un motore di ricerca “classico” anche dal punto di vista dell’utente. Basta inserire alcune parole chiave, per ottenere una lista di risultati in linea con le proprie aspettative.
Con la grande differenza che tutte le risposte possono essere geolocalizzate. Ciò vuol dire visualizzare soltanto offerte di lavoro all’interno di una città, una regione o un Paese selezionato.
Indeed, LexisNexis e Geody sono tre esempi di motori di ricerca dedicati a settori specifici
Volendo fare altri esempi di motori di ricerca che utilizzano il loro algoritmo per trattare una selezione piuttosto astringente di dati è possibile citare LexisNexis e Geody.
LexisNexis è un servizio a metà tra un motore di ricerca e una banca dati full text, che permette di accedere a informazioni giuridiche, economiche e finanziarie. Geody invece è un motore di ricerca che offre informazioni sulle località di tutto il mondo. L’utente può utilizzare parole chiave come il nome della città che ha in mente. Ma anche le sue coordinate geografiche.
La SERP di Geody consiste in una scheda molto dettagliata sul luogo in questione. A partire dalla sua latitudine, la sua longitudine e una sua visione dal satellite. Fino ad arrivare a una selezione di punti di interesse all’interno della località selezionata e nei suoi dintorni.
-
5. Altri motori di ricerca con funzionalità particolari
Credits DANIEL CONSTANTE / Shutterstock
La lista delle alternative a Google, Bing, Yahoo! e gli altri motori di ricerca generalisti prosegue con alcune realtà caratterizzate da funzioni più o meno distintive.
Un primo valido esempio è Ecosia, il motore di ricerca green per eccellenza. Dal punto di vista dell’algoritmo o dei risultati di ricerca, Ecosia è piuttosto simile ai suoi competitor. Eppure per anni è stato (quasi) unico nel suo genere.
Ecosia è l’esempio internazionale più famoso di motore di ricerca attento all’ambiente. L’azienda che lo ha fondato è senza scopo di lucro e reinveste il 100% dei suoi profitti in attività all’insegna dell’ecosostenibilità. A partire dalle donazioni a campagne pubblicitarie di sensibilizzazione, fino ad arrivare a veri e propri interventi di riforestazione.
Ecosia è stato lanciato nel 2009 e da allora ha rispettato pienamente lo slogan che lo descrive come: “Il motore di ricerca che pianta alberi”. L’azienda alle sue spalle ha infatti preso parte a decine di progetti in altrettanti Paesi del mondo. È attivo in progetti ambientali, ma anche in progetti umanitari che vedono il coinvolgimento di imprese sociali certificate.
Ecosia è un motore di ricerca green, mentre DuckDuckGo tutela la privacy dei suoi utenti
Restando in tema motori di ricerca non convenzionali, è poi possibile citare DuckDuckGo: la soluzione perfetta per chi vuole proteggere la propria privacy online.
DuckDuckGo è un particolare motore di ricerca che promette di non tracciare i suoi utenti. Questo vuol dire che non memorizza l’attività degli utenti e le loro informazioni personali. Una prima conseguenza di questa scelta è che propone risultati di ricerca sempre e comunque scevri da condizionamenti di sorta.
L’attività di protezione della privacy garantita da DuckDuckGo può poi essere ampliata attraverso le apposite estensioni. In questo modo l’utente si garantisce un’attività di ricerca privata, ma anche un blocco consistente dei sistemi di tracciamento.
-
6. Come usare le operazioni booleane per migliorare una ricerca
Credits Shutterstock
Le operazioni booleane sono frutto dei principi di algebra ideati da un matematico inglese di nome George Boole. Dal punto di vista informatico è forse più corretto parlare di operatori: indicazioni che l’uomo dà alla macchina per impartire regole specifiche, al fine di ottenere risultati più precisi.
Usare le operazioni booleane con i motori di ricerca permette di ottenere una SERP molto più linea con le proprie reali esigenze. Specie se queste operazioni vengono integrate con altri filtri di ricerca.
Gli operatori logici esistenti sono molteplici, ma i più famosi sono senza ombra di dubbio AND e OR. Sia AND che OR hanno una funzione di collegamento tra condizioni diverse. Eppure permettono di ottenere risultati di ricerca praticamente agli antipodi.
Utilizzando l’operatore AND tra una parola chiave e l’altra chiediamo all’algoritmo del motore di ricerca di restituire soltanto pagine che comprendano tutte le parole chiave utilizzate.
Al contrario utilizzando l’operatore OR tra una parola chiave e l’altra chiediamo all’algoritmo del motore di ricerca di restituire tutte le pagine che comprendano almeno una delle parole chiave utilizzate.
Operatori booleani quali AND, OR, NOT e AROUND(X) permettono di effettuare ricerche più mirate
Un terzo comando legato alle operazioni booleane da tenere a mente è NOT, con cui è possibile rimuovere una o più parole chiave dalla SERP. Ad esempio è possibile effettuare una ricerca del tipo: “X OR Y, NOT Z”. In questo modo stiamo chiedendo ai motori di ricerca di restituire pagine o siti web che contengano almeno una parola chiave tra X e Y. E che però, allo stesso tempo, non contengano al loro interno la parola chiave Z.
Infine è importante citare anche AROUND (X): un operatore booleano decisamente meno conosciuto rispetto ai precedenti. Con AROUND (X) è possibile effettuare una ricerca di prossimità: più precisamente andando a selezionare soltanto le pagine che contengono un tot di parole o di frasi posizionate a una distanza X l’una dall’altra.
Per fare un esempio concreto, con una ricerca tipo “noleggio furgone AROUND (3) Roma”, si chiede ai motori una SERP che escluda tutte le pagine in cui le keyword in questione si trovano a più di tre parole di distanza.
Esistono poi tanti altri operatori logici che non derivano necessariamente dalle operazioni booleane e che però permettono di affinare i risultati di una qualsiasi ricerca.
Inserendo un qualsiasi gruppo di parole chiave tra virgolette (“”) si chiede ai motori di ricerca di restituire una SERP con sole corrispondenze esatte. In caso di frasi complesse, questo significa visualizzare soltanto quei siti e quelle pagine che contengono la frase esatta nella sua interezza.
-
7. Come usare la SEO per posizionarsi sui motori di ricerca
Credits Shutterstock
Dopo essere entrati nel merito del funzionamento dei motori di ricerca, è possibile accennare in maniera più dettagliata alla SEO: quell’insieme di attività finalizzate a ottimizzare il posizionamento di un sito web all’interno dei risultati di ricerca.
È già stato accennato nei capoversi precedenti che questi risultati di ricerca sono anche noti con l’acronimo SERP, che può essere tradotto proprio con “Pagine dei Risultati del Motore di Ricerca”.
Non è semplice stilare una SEO checklist che sia universalmente valida per tutti i siti web. Al tempo stesso esistono alcuni filoni di attività che permettono di migliorare la visibilità delle proprie pagine.
Il primo lavoro da fare è di natura intellettuale e consiste nel mettersi nei panni dell’utente. In altre parole bisogna immaginare quali parole chiave potrebbero venire utilizzate sui motori di ricerca, quando si è interessati al proprio sito, prodotto o servizio.
A ciò si aggiungono delle procedure tecniche che riguardano la struttura delle pagine web, oltre che l’organizzazione e la forma dei contenuti: a partire dall’utilizzo corretto di titoli principali H1, titoli secondari H2 e Paragrafi. Fino ad arrivare all’inserimento di collegamenti ipertestuali interni ed esterni al sito in questione.
-
8. Cosa sono gli aggregatori Atom e RSS
Credits Shutterstock
Gli aggregatori non sono dei veri e propri motori di ricerca, ma il loro algoritmo permette comunque di riunire risultati specifici tenendo conto degli interessi dell’utente.
Gli aggregatori più noti si basano su due formati XML di nome Atom e RSS (acronimo di Really Simple Syndication). Entrambi servono a diffondere contenuti ad hoc a tutti gli utenti che risultino abbonati a servizi specifici.
Questi servizi di solito vengono fornito dagli aggregatori e uno dei settori in cui gli aggregatori sono maggiormente attivi è quello delle news. Grazie agli aggregatori di news gli utenti possono visualizzare un feed personalizzato, che tiene conto dei loro interessi e delle loro attività precedenti sul web.
Più in generale gli aggregatori hanno l’obiettivo di semplificare la fruizione di contenuti. Filtrano e raccolgono contenuti per conto dell’utente, organizzandoli all’interno di flussi di informazione in formato XML (feed).