Q&A Search Engine Optimization

Posted by Stefano |07 Feb 10 | 4 comments

Il post di questa settimana ha lo scopo di rispondere alle domande che mi vengono poste più frequentemente in merito all’argomento del Search Engine Optimization. Il post sarà strutturato in stile Q&A (Questions and Answers) in modo tale da rendere più chiara la comprensione degli argomenti. Passiamo subito a rispondere alle 9 domande:

1) Qual’è la procedura esatta perchè il sito sia correttamente indicizzato da Google?

Quando si esegue una ricerca in Google viene quasi immediatamente presentato un elenco di risultati. Questo è possibile poichè Google dispone di un’indice dove reperire le pagine web pertinenti al nostro argomento di ricerca. Per ottenere questo indice, e quindi visualizzare i risultati di ricerca, Google svolge tre passi chiave cono sono:

Scansione della rete: Utilizzando molti computer, sui quali gira un software chiamto Googlebot, Spider o Crawler, vengono scansionate tutte le pagine World Wide Web. Questi algoritmi, in base a dei criteri non ben precisati, determinano la frequenza e quante e quali pagine scansionare di ogni sito. Il processo di scansione inizia da un URL di siti noti da precedenti scansioni dei Googlebot e da SiteMap fornite dagli utenti.
I Googlebot quando visitano una pagina rivelano i link presenti nella pagina e li aggiungono all’elenco delle pagine da scansionare. Terminata la scansione della pagina corrente, il Googlebot, accede all’elenco, estrae un nuovo link e ripete le operazioni precedenti.

Indicizzazione: durante la scansione i Googlebot, oltre ai link, per ogni pagina web immagazzina le parole chiave, i tag title, il tag description e altre informazioni utili a creare un indice identificativo, il più accurato possibile, della pagina.
Per assicurarsi che il proprio sito sia correttamente indicizzato è consigliabile:

  • Inviare una SiteMap tramite gli Stumenti per Webmaster di Google.
  • Farsi conoscere nel web in modo tale che altri siti puntino al nostro sito rendendo così più facile l’individuazione delle nostre pagine da parte dei crawler di Google.

Restituzione dei risultati: quando l’utente esegue una query Google accede all’indice, controlla le keywords inserite dall’utente con quelle estratte dalle varie pagine durante l’indicizzazione  e restituisce un elenco ordinato, per rilevanza, di pagine web. La rilevanza viene stabilita da BigG durante la fase di indicizzazione considerando oltre 200 fattori tra cui il famosissimo PageRank.

Durante la promozione del vostro sito vi consiglio di non inserire solo link che rimandano alla homepage del sito in quanto i Crawler durante la scansione sono configurati per accedere solo fino ad un certo livello di profondità della struttura del sito. Quindi è buona norma, quando si linkate in un articolo il vostro articolo, rimandare a pagine specifiche, diverse dalla homepage, in modo tale che i crawler possano iniziare la scansione da punti diversi della struttura gerarchica del vostro sito accedendo quindi a livelli di profondità diversi aumentando quindi la probabilità di indicizzare tutte le pagine da voi realizzate. Questo consiglio è principalmente rivolto a webmaster che realizzano siti di grandi dimensioni con oltre 400 pagine.

2) Che cos’è una Sitemap?

Durante la risposta precedente ho parlato di sottoporre a Google una Sitemap. Sapete che cos’è?
Una sitemap è una pagina web che elenca gerarchicamente tutte le pagine del proprio sito. Quando si usa il termine sitemap bisogna distinguere due significati a seconda di come viene scritto il termine:

  • sitemap (“s” minuscola): è una pagina web fruibile dai visitatori del sito per visualizzare un elenco di tutte le pagine del sito e per individuare più facilmente i contenuti che stanno ricercando.
  • Sitemap (“S” maiuscola): è un file xml da inviare ai motori di ricerca e che contiene la medesima struttura presente nella sitemap solamente che scritta in un linguaggio di facile comprendere ai crawler.

Un esempio di come deve essere scritta una Sitemap xml è  riportata nel seguito:

<url>
<loc>http://www.tuosito.com/index.php</loc>
<lastmod>2010-02-18</lastmod>
<changefreq>weekly</changefreq>
<priority>1</priority>
</url>
<url>
<loc>http://www.tuosito.com/chisiamo.php</loc>
<lastmod>2010-02-18</lastmod>
<changefreq>weekly</changefreq>
<priority>0.6</priority>
</url>
<url>
<loc>http://www.tuosito.com/dovesiamo.php</loc>
<lastmod>2010-02-18</lastmod>
<changefreq>weekly</changefreq>
<priority>0.9</priority>
</url>

come è possibile vedere  è presente un tag di apertura (<url> ) seguito da: un path che identifica la posizione fisica della pagina web (<loc> ), dalla frequenza di aggiornamento della pagina (<changefreq>) e dalla priorità della pagina <priority> espressa con un valore compreso tra 0 e 1.

Ovviamente sono disponibili molti strumento in internet per la realizzazione delle Sitemap, uno di questi è xml sitemap.

3)  Che cos’è il PageRank?E’ l’unico fattore considerato da Google per definire il ranking delle pagine internet?

Come ho già detto svariate volte, il PageRank è stato il principale fattore per determinare l’ordinamento delle pagine web fino a qualche anno fa, al quale oggi, sono stati aggiunti circa 200 nuovi fattori per migliorare i risultati di ricerche. Il PageRank è un algoritmo che assegna un peso numerico ad ogni elemento di un insieme di documenti web ipertestuali con lo scopo di stabilire un ordinamento dei documenti in base alla loro importanza. Il comportamento del PageRank può essere sintetizzato attraverso la seguente formula:

dove:

PR[pi] è il valore di PageRank della pagina pi che vogliamo calcolare.
M(pi) è l’insieme delle pagine che puntano alla pagina pi.
PR[Pj] è il pageRank della j-esima pagina che punta ad Pi.
L[Pj] rappresenta il numero di link in uscita dalla pagina pj.
N è il numero totale di pagine che si stanno considerando per il calcolo: p1,p2, … , pN
d è il dumping factor ed è deciso da Google.

In pratica la formula precedente esprime il fatto che una pagina web ha pagerank elevato tanto più è puntata da pagine web, preferibilmente con PageRank elevato.

Se ancora non vi è chiaro il concetto di pagerank vi aiuto con la seguente figura:

La quale non considera il damping factor inn modo tale da semplificare al massimo il concetto e dare un’idea del funzionamento dell’algoritmo del PageRank. Come è possibile vedere se una pagina ha PageRank 100 e punta a due pagine diverse il suo pagerank viene distribuito in maniera uguale tra le due pagine. E il pageRank di una pagina è costituito dalla somma dei PageRank dei link entranti.

4) E’ importante l’ordinamento dei Link all’interno delle pagine internet?

Come si può ben intuire,dalla figura precedente, l’ordinamento dei link all’interno di una pagina web non influisce sulla divisione della pagerank dei link in uscita. Quindi il primo link non viene considerato più importante dei successivi.

5) Il PageRank di una pagina web che punta alla mia ha una vita infinita?

Falso, poichè tutte le pagine web vengono scansionate con una certa frequenza più o meno alta a seconda della loro importanza; se una pagina web inizialmente era puntata da una pagina web il cui PR era di 5 e poi questa pagina viene eliminata o il suo pagerank diminuisce ovviamente anche il PR della vostra pagina sarà modificato.

6) Per aumentare il PR del mio sito conviene acquistare i link da siti appositi?

Assolutamente NO!!!!Acquistare o vendere Link è una tecnica che, se scoperta, penalizza pesantemente i siti coinvolti in quanto va contro i principi fondamentali del web quali Meritocrazia e Democrazia! Proprio su questi principi si basa il PR e gli altri fattori utilizzati da BigG per stabilire la rilevanza e l’importanza di una sito.
Infatti, la ricerca naturale di Google funziona perchè può contare su milioni di persone che inseriscono link nelle proprie pagine web, perchè ritengono importanti i collegamenti che creano, aiutando così Google a creare un ranking veritiero basato sui principi espressi precedentemente.

6a) Quindi vendere link o spazi pubblicitari è sempre sbagliato?

No, Google non vuole dire agli utenti come gestire il loro sito o business ma vuole proteggere i valori fondamentali su cui si basato il Web e il PR. Quindi è possibile vendere link o banner pubblicitari purchè non ci sia un trasferimento di PageRank tra le pagine web. E’ possibile evitare questo trasferimento di PR in due modi:

  • Utilizzare un attributo rel = “nofollow” al tag.
  • Indirizzare i link a pagamento ad una pagina intermedia, escludendola dall’indicizzazione tramite file robot.txt , la quale rimanda all’indirizzo finale.

7) La presenza di Malware nelle mie pagine web può danneggiare la mia posizione nel ranking?

Per chi non lo sapesse il malware è un tipo di software malevolo che tenta di impossessarsi di informazioni personali dell’utente o in alcuni casi utilizzare il computer dell’utente per svolgere attività non desiderate. Le pagine web contenenti malware sono pagine web , che ad insaputa del webmaster (nella maggior parte dei casi), contengono codice malevolo capace di svolgere una delle attività indicate precedentemente.
Google durante la fase di scansione controlla, grazie ad algoritmi efficienti ed imparziali, la presenza di codice malevolo all’interno delle pagine web e cerca di isolare le pagine infette causando quindi una penalizzazione nei risultati di ricerca di tali pagine.
Quando Google individua del codice malevolo all’interno delle pagine web esegue tre operazioni principali che sono:

  1. Invio di messaggi di notifica al webmaster attraverso gli indirizzi mail più comuni  quali support@, abuse@, admin@, support@ webmaster@ ecc.
  2. Viene notificata la presenza delle pagine web dannose attraverso gli strumenti per webmaster  qual’ora il dominio sia controllato attraverso questo servizio.
  3. Viene inserito un messaggio di avvertimento all’interno dei risultati di ricerca.

Se si riceve una segnalazione di codice malevolo nelle proprie pagine la prima cosa da fare è ripulire la pagina da tale codice, controllare e capire come questo codice sia stato inserito nella pagina, verificare che il sistema operativo che ospita il nostro sito sia aggiornato e successivamente modificare le password di accesso al dominio.

Una volta risolto il problema accedere agli strumenti per webmaster di Google ed entrare nella sezione malware e richiedere di controllare nuovamente la pagina in modo tale da dimostrare che il problema è stato risolto.

8) La velocità quanto influisce sulla mia posizione in Google?

Non è stato specificato di preciso quanto la velocità di caricamento del sito web possa influire sul posizionamento del proprio sito nei risultati di ricerca ma, di certo c’è che la Velocità è uno dei 200 fattori importanti per BigG. La motivazione dell’inclusione di questo parametro tra i fattori di valutazione è dovuta al fatto che offrire agli utenti un’esperienza di navigazione e fruizione dei contenuti positiva è uno degli obiettivi di Google quindi garantire una maggiore reattività del sito garantisce un accesso rapido ai contenuti da parte del’utente.

E’ possibile valutare la velocità di caricamento del proprio sito tramite gli strumenti per webmaster di Google oppure tramite delle estensioni per il proprio browser come Google PageSpeed oppure Google SpeedTracer.
Per rendere il vostro sito più veloce ci sono vari trucchi e accorgimenti variabili a seconda di come il vostro sito è stato realizzato.

Per gli utilizzatori di WordPress consiglio la lettura dell’articolo “Velocizzare WordPress: La guida (semi) Definitiva per rendere più veloce il tuo blog” scritto dall’amico Francesco Gavello.

Il consiglio generale che posso dare a tutti è quello di verificare se il vostro hosting adotta la compressione gZip. Tale compressione prevede che i dati trasmessi dall’hosting al browser siano compressi in modo tale da risparmiare banda e quindi un caricamento più rapido delle pagine.
Purtroppo ho riscontrato che molti servizi di hosting sharing non permettono l’utilizzo della compressione gZip quindi dovrete ottimizzare al migliore dei modi il vostro sito per questo motivo vi consiglio vivamente la lettura dell’articolo di Francesco.

9) Come influisce il realtime search nel posizionamento del mio sito nei risultati di ricerca?

Come indicato nell’articolo “Google Real Time Search e il Ranking” non è ancora ben chiaro il modo in cui questi risultati influiscono nel ranking ma la cosa certa è che in Google utilizzano un approccio simile al PR con la sostituzione del concetto di importanza con quello di AUTOREVOLEZZA. Quindi sarà molto importante creare una network di utenti selezionata e autorevole in modo tale che i nostri tweet o status possano comparire tra i primi risultati di ricerca anche box dedicato al realtime search.

In conclusione è possibile vedere come l’attività di Search Engine Optimization richieda molta cura e attenzione. Quello che vi posso garantire è che la presenza di contenuti di qualità e soprattutto un approccio orientato a migliorare l’esperienza utente sarà ben ripagato aumentando la vostra popolarità nel web e soprattutto aumentando la vostra autorevolezza!

Dubbi?? Domande?? Perplessità???


4 Responses

  • simone/ 08 Feb 10 @ 9:07 AM

    Molto ben fatto, ovviamente… dindo.biz una garanzia! taggatelo!

  • Francesco Gavello/ 10 Feb 10 @ 2:43 PM

    Ciao Stefano :)

    Imho le sitemap sono il classico aspetto trascurato (più di molti altri argomenti caldi) perché: “Tanto Google è il miglior motore di ricerca al mondo e sarà bravissimo a scansionare il mio sito da solo :D”

    Come dici giustamente tu esistono numerosi tool online che permettono di generarne una al volo (o perlomeno di capirne il senso se si è un minimo tecnici), ma ancora più efficaci sono tutti i tool installabili direttamente sul CMS che la rigenerano di volta in volta non appena nuovi contenuti si rendono disponibili.

    XML-Sitemap (http://wordpress.org/extend/plugins/google-sitemap-generator/) per WordPress o una delle tantissime (http://extensions.joomla.org/extensions/structure-a-navigation/site-map) estensioni equivalenti per Joomla, giusto per portare due esempi.

    Un must, insomma. Tanto più che simili strumenti si configurano in un attimo, sono flessibili quanto basta per sopperire a quasi tutte le necessità e durano una vita.

  • Mobile SEO prime riflessioni « Stefano Dindo/ 08 May 10 @ 7:40 PM

    […] – Questions & answers relativa all'ottimizzazione di motori di ricerca tradizionali. […]

  • Google vs Bing « Stefano Dindo/ 15 Nov 10 @ 8:37 PM

    […] dalla maggioranza degli utenti web, ha costruito il suo successo grazie all'algoritmo PageRank (potete trovare alcune informazioni su un mio post passato) che, nel corso degli anni, è diventato uno degli oltre 200 fattori utilizzati per indicizzare e […]

Leave a Reply