Sviluppo di un sito web “search-engine friendly”

By | 5 giugno 2014

Siti web search-engine friendlyI motori di ricerca sono strumenti potentissimi, ma sono comunque soggetti a limitazioni tecniche nell’interpretazione dei contenuti che incontrano, durante la scansione delle pagine presenti sul Web.

Ci concentreremo dunque sugli aspetti tecnici relativi ai requisiti di un sito web, per fare in modo che questo possa venir correttamente strutturato per l’indicizzazione da parte dei motori di ricerca, oltre naturalmente che per la “normale” navigazione da parte dei visitatori. Questi aspetti dovrebbero essere tenuti in debita considerazione da parte di tutti i diversi professionisti che prendono parte alla progettazione, creazione e sviluppo di un sito web “search-engine friendly, e cioè ottimizzato per l’indicizzazione da parte dei motori di ricerca.

I principali aspetti tecnici principali affrontati in questa guida:

Contenuto indicizzabile

La prima considerazione da fare in merito all’indicizzazione del nostro sito da parte dei motori di ricerca, è che il contenuto dello stesso venga presentato utilizzando il linguaggio HTML (HyperText Markup Language), da questi comprensibile. Il sistema più semplice, per assicurarsi che le parole e le frasi contenute in una pagina web possano essere visibili ai motori di ricerca, è quello di assicurarsi che le stesse siano presenti nel codice HTML della stessa.

Suggerimento: A seconda del browser utilizzato, potrebbe essere diversa la voce presente nel menu e/o la combinazione di tasti necessaria a visualizzare il codice HTML di una pagina, ma solitamente è sufficiente la combinazione di tasti [Ctrl] + [U]. Provate già ora per controllare il codice sorgente di questa pagina, magari provando a ricercare questo termine: FACEBOOK

Negli ultimi tempi i motori di ricerca (Google in particolare) hanno fatto passi da gigante per ciò che riguarda l’interpretazione dei contenuti delle applicazioni Flash. E’ comunque appropriato considerare tutti i contenuti non testuali (non presenti all’interno del codice HTML della pagine) come virtualmente invisibili agli “occhi” dei motori di ricerca. In tutti questi casi è comunque consigliabile l’utilizzo di alcuni accorgimenti:

  • alle immagini in formato .jpg, .gif e .png è possibile assegnare una descrizione testuale, tramite l’utilizzo dell’attributo “alt” nel tag HTML;
  • le immagini possono altresì sostituire sezioni testuali, tramite l’utilizzo di file CSS (Cascading Style Sheets) in aggiunta all’HTML standard;
  • il contenuto di file Flash o di applet Java può essere ripetuto nel codice HTML della pagina (a volte replicando l’intero sito, se costituito da un singolo file Flash).

Struttura dei link interni

I motori di ricerca, ancora prima di riuscire ad analizzare correttamente il contenuto di una pagina, devono necessariamente sapere che questa “esiste”. Il nostro sito dovrà quindi possedere una struttura dei link interni completamente “navigabile”, in maniera che gli spider dei motori di ricerca riescano a raggiungere ognuna delle pagine presenti. In molti siti invece sono presenti pagine “orfane”, che cioè non sono collegate tramite hyperlink da nessun’altra pagina. In pratica queste pagine è come se venissero “nascoste” agli occhi del motore di ricerca, rendendo problematica la possibilità che queste compaiano poi nelle SERP (Search Engine Results Pages), le pagine dei risultati delle ricerche effettuate dagli utenti.

Link presenti in moduli (form). I moduli (iscrizioni, richieste informazioni, funzioni di ricerca testo, ecc.) possono contenere svariati elementi, quali caselle di testo, menu a tendine, ecc. In ogni caso i motori di ricerca non tenteranno di effettuare l’invio dei dati (submit), e quindi qualsiasi contenuto accessibile solamente dopo la validazione del modulo, sarà per questi invisibile.

Link presenti in codice javascript, flash, ed altri plugin. Se è presente codice javascript o flash per la creazione di link, i motori di ricerca non saranno in grado di identificarli correttamente, o in ogni caso daranno un’importanza davvero minima alla pagina collegata. In questi casi il link creato tramite javascript dovrebbe essere sostituito o accompagnato da un link in HTML standard.

Link presenti in frame. Teoricamente i link contenuti in un frame sono identificabili da parte dei motori di ricerca, ma presentano delle limitazioni strutturali in merito all’effettiva possibilità di essere seguiti. In ogni caso è sempre meglio evitare l’inclusione di link in frame ed i-frame.

Link in pagine contenenti centinaia di altri link. I motori di ricerca tendono a limitare il numero massimo di link, indicizzabili all’interno di una data pagina web, ad un massimo di circa 100. Questo ai fini di preservare l’affidabilità dei loro algoritmi per il calcolo del PageRank, ed evitare fenomeni di spam.

Utilizzo dell’attributo rel=”nofollow”. Nei link possono essere specificati una moltitudine di attributi diversi, ed i motori di ricerca tendono ad ignorare la maggior parte di essi, con l’unica eccezione del tag rel=”nofollow”. Questo attributo viene utilizzato in particolar modo dagli amministratori di forum e blog, al fine di evitare il trasferimento di PageRank dalla pagina contenente il link a quella pagina linkata, con particolare riferimento alle pratiche (più o meno automatizzate) di “link injection spam”. In questo modo si può differenziare l’affidabilità dei link “editoriali” da quelli invece postati da utenti esterni.

Utilizzo delle parole chiave

Le keywords (parole chiave) e le keyphrases (frasi chiave) sono le fondamenta di tutto il sistema dei motori di ricerca, in quanto proprio su di queste è basato il processo di ricerca delle informazioni. Ogni motore di ricerca fa affidamento su di una sterminata serie di database, contenenti gli indici relativi alle parole chiave, ed alle combinazioni tra di esse. Diventa quindi probabilmente superfluo ricordare in questa sede che se vogliamo avere qualche possibilità di essere presenti tra i risultati di chi ricerca “mangime per cani”, le parole “mangime” e “cani” dovranno essere sicuramente presenti all’interno della pagina!

Quando viene effettuata una ricerca, il motore valuta quali risultati ritornare in funzione dei termini inseriti all’interno del modulo di ricerca. L’ordine dei termini, la punteggiatura, le maiuscole, sono tutte informazioni aggiuntive che possono essere prese in considerazione, al fine di identificare il giusto contesto nel quale considerare i termini immessi. Naturalmente le pagine che assumeranno una maggiore rilevanza saranno quelli dove, oltre ad essere presenti le parole chiave ricercate, queste assumeranno un’importanza maggiore quando specificate all’interno di tag <title> od <h1>, ad esempio.

Il processo di analisi delle keywords presenti viene continuamente sviluppato, e diventa difficile dare  delle regole comuni universalmente accettate. I fattori più importanti da tenere in considerazione, quando si tratta di predisporre contenuti per il web, sono la coerenza e la originalità, al di sopra di tutti i falsi miti che abbondano tra gli pseudo-guru del SEO (Search Engine Optimization, ottimizzazione per i motori di ricerca).

Il falso mito della keyword density

Mentre i motori di ricerca sviluppano metodi ed algoritmi per l’analisi dell’utilizzo delle keyword, c’è ancora chi sostiene che sia invece lo studio della “densità” delle stesse ad influenzare i risultati restituiti, e che basti “indovinare” il numero giusto per arrivare al primo posto. Sinceramente non c’è nessuna ragione per credere a questo tipo di pratica, e l’unica spiegazione per cui esistano ancora alcuni SEO che ne facciano utilizzo, è legato semplicemente alla disinformazione.

Esistono diverse analisi scientifiche, che dimostrano come la semplice densità delle parole chiave in una pagina web, non possa essere di nessuna utilità ad un algoritmo deputato a calcolarne il grado di affidabilità, durante il processo di recupero delle informazioni principali dallo stesso. Detto ciò, è incredibile come una semplice ricerca su Google con i termini keywords density optimization ritorni addirittura più di 700.000 risultati!

Il prossimo consulente SEO che vi parlerà della necessità di ottimizzare la densità delle keyword, al fine di ottimizzare il vostro sito web, vi consigliamo di farlo uscire velocemente dalla porta!

Un’analisi basata semplicemente sulla densità delle keyword, non ci fornisce nessuna informazione utile in termini di:

  • prossimità: la distanza che separa le varie occorrenze della keyword;
  • distribuzione: dove è presente la keyword, all’interno del documento;
  • co-occorrenza: la frequenza con la quale la keyword viene citata insieme ad un’altra specifica keyword;
  • argomento principale trattato e topic, presenti nel documento.

In pratica l’analisi della densità delle keyword non ci dice nulla in termini di contenuti, qualità, semantica e rilevanza.

Ottimizzazione semplice della pagina

La scelta delle parole chiave è solamente la prima ed indispensabile operazione, all’interno del ben più complesso processo di ottimizzazione, nei confronti degli algoritmi dei motori di ricerca. Altre procedure devono essere adottate, al fine di considerare il nostro sito veramente “ottimizzato”. Ecco dunque una lista di alcune delle pratiche che consigliamo di intraprendere:

  • utilizzate le parole chiave principali all’interno del tag <title> della relativa pagina almeno una volta, cercando di mantenerle il più possibile vicino all’inizio del campo;
  • la parola chiave dovrebbe apparire anche all’interno della descrizione alternativa (attributo alt) delle immagini. Questo servirà non solo nell’indicizzazione della pagina web, ma anche in quella dell’immagine stessa, durante la ricerca specifica di immagini;
  • ogni parola chiave dovrebbe altresì apparire anche all’interno della descizione della pagina (meta tag <description>), non tanto ai fini dell’indicizzazione, quanto a quello del tasso di conversione di click da parte dei visitatori, che visualizzeranno il testo riportato nella descrizione stessa, tra i risultati ritornati dai motori di ricerca;
  • nel contenuto della pagina (body) ogni parola chiave principale dovrà essere utilizzata almeno 3-4 volte. L’utilizzo di un numero maggiore di ricorrenze non è opportuna: i test effettuati con una “densità” maggiore non hanno infatto portato a nessun risultato apprezzabile;
  • utilizzate ogni parola chiave principale in un tag <h1>;
  • ogni parola chiave dovrebbe apparire almeno una volta in grassetto, utilizzando indifferentemente i tag <strong> oppure <b>, che i motori di ricerca considerano equivalenti;
  • la parola chiave principale dovrebbe comparire anche all’interno dell’indirizzo URL della pagina.

Tag <title>

L’elemento “titolo” (tag <title>) di una pagina web dovrebbe essere una concisa ed accurata descrizione del suo contenuto. Questo viene mostrato innanzitutto come descrizione della pagina da parte di ogni browser, e viene mostrato nella parte alta della sua finestra. Questa è probabilmente la funzione più evidente, ma anche quella che probabilmente riceve meno attenzione, sia da parte degli utenti che dei motori di ricerca. Sarà sicuramente più “utile” quando questo apparirà in bella evidenza tra i risultati restituiti dai motori di ricerca, attirando immediatamente l’attenzione dei visitatori.

E proprio per questo motivo, è fondamentale che le parole chiave primarie appaiano all’interno del titolo, per ottenere i migliori risultati in termini di posizionamento, per i termini ricercati quando questi conterranno proprio i termini presenti tra le keywords.

Altre precauzioni saranno in ogni caso da adottare, quando ci troveremo ad operare sul tag <title>:

Attenzione alla lunghezza! Il valore di 70 caratteri è il massimo per la lunghezza, oltre il quale verranno probabilmente riportati dei puntini di sospensione (…) all’interno dei risultati restituiti dai motori di ricerca. Se però è intenzionale sfruttare al massimo il potere del tag <title> ai soli fini del posizionamento di diverse keywords, può essere opportuno superare questo limite.

Posizionamento delle parole chiave più importanti all’inizio del titolo. Più le keywords verranno posizionate all’inizio del titolo, e più queste verranno considerate come “importanti” da parte dei motori di ricerca.

Considerare la leggibilità e l’impatto del messaggio. Un titolo scelto con oculatezza può avere un drammatico impatto in termini di click e di visite. Il titolo è probabilmente il primo “oggetto” del nostro sito web, con il quale ogni potenziale visitatore verrà a contatto, e quindi dovrà generare l’impressione più positiva possibile.

Meta tags

I meta tags furono inizialmente previsti per la fornitura di informazioni standard, a proposito dei contenuti di un sito web. Alcuni di questi hanno mantenuto una certa importanza, nel processo di indicizzazione da parte dei motori di ricerca, mentre altri sono diventati perfettamente inutili.

Uno dei meta tag che ha mantenuto una certa importanza è il meta tag <meta name=”robots”>, utilizzato per controllare l’attività degli spider dei diversi motori di ricerca:

  • Index/NoIndex informa il motore di ricerca in merito al fatto che la pagina in questione debba venire indicizzata. Se verrà utilizzata l’opzione “noindex,” la pagina verrà esclusa dall’analisi da parte del motore di ricerca. Generalmente viene considerato valido il valore “index” su tutte le pagine web, se non diversamente specificato, e quindi l’utilizzo dell’opzione index non è necessaria.
  • Follow/NoFollow avvisa il motore di ricerca in merito alla necessità di “seguire” i link presenti all’interno della pagina web. Se verrà specificato il valore “nofollow,” il motore di ricerca ignorerà ogni hyperlink, sia per le funzioni di PageRank che di scoperta di nuove pagine. Se non diversamente specificato, verrà generalmente considerato il valore“follow”.
  • Noarchive viene utilizzato per evitare il salvataggio della copia cache della pagina, da parte del motore di ricerca, che generalmente memorizza tutte le “istantanee” delle pagine web che analizza, visualizzabili dagli utenti mediante la funzione “Copia cache”.
  • Nosnippet informa i motori di ricerca della necessità di evitare di mostrare la descrizione della pagina web, di fianco al titolo ed all’URL della stessa, tra i risultati restituiti.

Il meta tag che si occupa della definizione della descrizione specifica della pagina web è il <meta name=”description”>. Solitamente i motori di ricerca utilizzano le parole chiave qui presenti ai fini del posizionamente della pagina, ma la descrizione è una funzione utilissima anche per i visitatori, che possono identificare a colpo d’occhio tra i risultati restituiti quale potrà essere interessante, proprio per la presenza di queste poche righe descrittive.

Non esiste una lunghezza massima per il campo descrizione, ma generalmente il testo eccedente i 160 caratteri verrà troncato, per cui è consigliabile rimanere entro questo limite.

Struttura degli URL

L’URL (Uniform Resource Locator) è l’indirizzo che identifica univocamente ogni pagina web presente in Internet, ed assume un’importanza strategica, nell’ottica dell’ottimizzazione per i motori di ricerca, in quanto i termini di ricerca qui presenti assumono una grossa valenza. E’ inoltre riportato in bella evidenza in diverse occasioni: nei risultati restituiti dai motori di ricerca, nella barra dell’indirizzo di qualsiasi browser web, così come eventualmente negli anchor text dei link disseminati per il web.

Proprio a causa dell’importanza che riveste in ottica SEO, è fondamentale curarne alcuni aspetti particolari:

L’URL deve essere descrittivo: agli occhi di un visitatore risulterà di fondamentale importanza che il testo presente nell’URL anticipi, in qualche maniera, il contenuto della pagina che si appresta a visitare.

L’URL deve essere breve: in contrapposizione alla necessità precedente, bisogna altresì tenere in debita considerazione l’importanza di mantenere la lunghezza dell’URL ad una lunghezza “accettabile”, non tanto per esigenze mnemoniche da parte del visitatore (che probabilmente userà comunque le funzioni di copia-e-incolla per inserire l’indirizzo della pagina nelle sue e-mail, nei suoi post su blog e nei suoi messaggi di testo), quanto per esigenze “visuali”, in quanto la visualizzazione di un URL eccessivamente lungo non sarebbe appropriata, e comunque verrebbe troncata tra i risultati dei motori di ricerca.

Utilizzare parole chiave negli URL: la parola chiave principale relativa ad una particolare pagina web dovrebbe essere sempre presente all’interno del suo URL. Attenzione però a non abusarne: la presenza di troppe o inutili keywords/keyphrases potrebbe anche essere interpretata come pratica malevole, da parte dei motori di ricerca e dei filtri anti-spam, e portare a cattivi risultati.

Utilizzare indirizzi URL statici: la presenza di tecnologie quali mod_rewrite (per server Apache) e ISAPI_rewrite (per server Microsoft) permette la traduzione di “complicati” indirizzi URL contenenti parametri dinamici, in “semplici” indirizzi URL “statici”. Diverse ricerche hanno dimostrato come la stessa identica pagina, raggiungibile attraverso un indirizzo statico anzichè uno dinamico, possa migliorare il posizionamento sui principali motori di ricerca, causando un aumento delle visite dal 10%, fino al 30%!

Utilizzare categorie e sezioni descrittive: è consigliabile l’utilizzo di parole reali e descrittive.

Utilizzare il trattino per separare i termini nell’URL: non tutti i motori di ricerca interpretano correttamente caratteri quali il “trattino basso” (o underscore) “_”, il più “+” o lo spazio “%20”, per cui raccomandiamo l’utilizzo del “trattino” (o meno) “-” come carattere separatore, per i diversi termini presenti nell’indirizzo URL.

Canonicalizzazione degli URL

La canonicalizzazione è un argomento a volte ostico da affrontare (ma sicuramente da pronunciare), e riguarda la necessità di fornire un URL “canonico” (o preferito) ai motori di ricerca, in maniera che la stessa pagina/contenuto, raggiungibile tramite diversi indirizzi URL, non venga considerato come effettivamente “duplicato” (e quindi penalizzato tra i risultati restituiti). I motori di ricerca sono infatti alquanto “schizzinosi” a proposito di contenuti duplicati, ed in questa maniera li aiutiamo a scegliere la soluzione migliore (quella effettivamente “originale”).

In questo modo si potrà arrivare a consolidare alcune proprietà della pagina web, ed evitare che le diverse “versioni” dello stesso contenuto arrivino a contendersi la popolarità a disposizione, con conseguente danno in termini di PageRank. In poche parole, la canonicalizzazione degli URL è la pratica di organizzare le pagine del sito web, in maniera che ognuna abbia un unico indirizzo, e fare quindi in modo che i motori di ricerca trovino una singola versione per ogni tipo di contenuto, e che riservino a questa la massima popolarità possibile.

Per fare ciò, sarà necessario specificare l’URL canonico, aggiungendo l’elemento <link> con l’attributo rel=”canonical” alla sezione <head>, di tutte le pagine non canoniche:

<link rel=”canonical” href=”http://www.excelsaweb.it”/>