Archivi per la categoria ‘indicizzazione siti’
Down del server durante la prima indicizzazione del sito
Per la prima volta in dieci anni di SEO mi è capitato il problema di un down prolungato del server proprio mentre lo spider di Google stava completando l'indicizzazione del sito.
Sito pescheria Bellucci Modena
Martedì 29 Novembre 2011 nella mattinata – Pubblicazione del sito effettuata seguendo scrupolosamente le fasi classiche
Martedì 29 Novembre 2011 alla sera tardi. – Dopo 12 ore Google ha iniziato l’indicizzazione iniziando a prendere nei sui elenchi le varie pagine e sono incominciati a comparire i primi posizionamenti nelle ricerche sulle SERP di Google
Mercoled' 30 Novembre 2011 ore 9,09 – il sito è gia indicizzato quasi completamente e si raggiungono ottimi risultati nelle SERP di Google per le frasi più importanti del business del cliente che commercia all'ingrosso prodotti ittici in tutta la regione Emilia Romagna.
Mercoledì 30 Nopvembre alle ore 18 - Consegna sito e report posizionamenti al cliente (grande soddisfazione).
Giovedì 1 Dicembre 2011 alla sera ora imprecisata – Tophost.it il provider sul quale è appoggiato il dominio ha subito un grave danno alla farm dove sono i computer .
Per inciso il provider Tophost è stato selezionato per il prezzo basso dell’hosting ma anche perche nel corso dell’anno 2011 ha rinnovato le infrastrutture rendendo veloce oltre che economico il servizio e come da loro affermato molto sicuro.
Tophost su pressione delle migliaia di utenti che hanno visto sparire il loro sito o come noi hanno avuto dei problemi dichiarano esplicitamente il problema solo il venerdì mattina
IL CROLLO (Danno grave di immagine)
Venerdì 2 Dicembre 2011 ore 13 Nel mentre io che stavo partendo per un convegno effettuo un controllo a valige chiuse e mi accorgo del danno grave che abbiamo subito:
- il sito ha perso tutti i posizionamenti (quelli del report e quelli che sarebbero venuti successivamente)
- L’indicizzazione del sito che era in atto viene interrotta da Google perché non era più in grado di accedere col suo spider
- il comando site:www.belluccipesce.it restituisce un vuoto terribile (scomparse le 25 pagine che stava indicizzando)
- Sabato, domenica e Lunedì il comando (site:) restituisce il vuoto ma la site map pubblicata sulle webmasters di Google sembra accettata e non sono segnalati errori html (questo faceva ben sperare)
Domencia 4 Dicembre 2011. – Il cliente invia email di preoccupazione alla quale rispondo dettagliando il problema e la strategia da seguire con i passi successivi scansionati nel tempo
LA RICOMPARSA (Il recupero immagine)
Martedì 6 Dicembre ore 9 - Effettuo il controllo col comando site:www.belluccipesce.it e verifico la ricomparsa del processo di indicizzazione (ha gia recuperato 6 pagine con i relativi risultati nelle SERP).
Contemporaneamente sono comparsi i risultati di posizionamento del video pubblicato su Youtube sulla fornitura prodotti ittici a ristoranti e pescherie (mediamente adesso i video pubblicati su youtube compaiono nelle SERP di google dopo 6 – 8 giorni)
Certo che fare SEO porta un po di stress le variabili sono tante e quando ci si mette anche il diavolo (il server di Tophost). Naturalmente il sito verrà spostato su altro provider e la fiducia su Tophost è tornata a scendere a zero.
Problema indicizzazione sito Lotus
Problema di indicizzazione su Sito web Lotus Un’altro esempio di indicizzazione a macchia di Leopardo
Mi chiama un cliente con 200 siti non tutti attivi perchè le sue pagine web sono affette da evidenti problemi e sofferenze nei posizionamenti.
La piattaforma IBM Lotus Notes ha un applicativo " Sito web Lotus" che consente di realizzare siti anche con molte pagine in maniera relativamente semplice.
Il cliente si era accorto di una strana indicizzazione a macchia di leopardo delle pagine dei suoi siti.
Infatti si trovava con vari domini che puntavano a pagine e sezioni allocate internamente all’unica cartella che Lotus consentiva di avere per il sito.
Lo spider pertanto si trovava entrando con la URL (dominio A) ad indicizzare alcune pagine poi incontrava altre pagine che aveva indicizzato per un’altra URL (dominio B) e si fermava.
Ogni volta che il cliente lanciava il comando site:nomedominio si trovava elenchi misti di pagine attribuite ad un dominio o alltro.
La situazione sicuramente complessa coinvolgeva decine di migliia di pagine e svariati nomi a dominio.
La terapia considerando anche che i siti erano in business è iniziata sganciando un primo sito e cercando anche di correggere altri errori di ottimizzazione presenti , come eccesso di link, keyword stuffing, e sovra ottimizzazione con anche qualche problema ovvio di duplicazione di contenuti (che potevano da soli giustificare eventuali penalizzazioni).
Altro post sulla Indicizzazione a macchia di Leopardo
Pubblicazione indicizzazione siti con Adwords
La pubblicazione del sito web
L’operazione di pubblicazione di un sito web è spesso ingiustamente trascurata dai webmasters ed è facile vedere dei siti con pagine in costruzione o peggio ancora siti dove è stata pubblicata esclusivemente la home page.
- Vale la regola assoluta che un sito deve essere tenuto lontano dagli spider fino a che non sia terminato sia come struttura che come inserimento dei contenuti.
- Funziona anche il detto "Chi ben inizia è a metà dell’opera"
Tenere lontani gli spider è semplice quando il sito lo realizziamo in locale sul nostro computer e lo pubblichiamo solo quando è terminato.
Nel caso dei CMS come Joomla dove spesso i webmasters realizzano il sito online è indispensabile aggiungere un file robots.txt col comando di esclusione
User-agent: *
Disallow: /
inoltre è bene tenere il sito offline con l’apposito comando della configurazione

Perchè tenere il sito offline?
I motori di ricerca al momento dell’indicizazione si fanno un’idea dei contenuti del sito nel suo complesso, del glossario usatato dal sito, della sua struttura di link, ecc e come si puo ben capire un sito incompleto fornisce un’immagine parziale che poi richiede tempo e lavoro per essere modificata a nostro favore.
Iniziare bene la pubblicazione sottintende una operazione di inserimento nei motori di ricerca, nelle directory, ecc . Attualmente il sistema migliore per pubblicare un sito è quello di farselo pubblicare da un’altro sito importante (alto PR, apprezzato dai motori, un buon Rank di Alexa, possibilmente sito anziano). Questa pubblicazione avviene tramite una piccola recensione o tramite un link testuale.
Forzare la pubblicazione e l’indicizzazione tramite Adwords.
Adwords funziona anche come strumento di pubblicazione siti.
- registro il dominio
- realizzo una o piu pagine del sito o una o piu landing
- attivo una campagna Adwords con i link che puntano a questo dominio
- la conseguenza è che Google deve per forza indicizzare il sito per far funzionare la campagna
————————————————————————————————————–
Vuoi PUBBLICARE BENE IL TUO SITO?
Vuoi FAR INDICIZZARE il tuo sito su Google?
Telefonami al 3398736464
o contattami su Skype ![]()
—————————————————————————————–
Dominio Alias Problemi coi trasferimenti siti
Già abbiamo evidenziato i problemi di indicizzazione che porta un uso non adeguato del settaggio degli alias del dominio ( Indicizzazione a macchie di Leopardo ).
Aggiungiamo un altro problema che potrebbe essere collegato.
Abbiamo un dominio sul provider Register e lo passiamo sul provider Tophost controlliamo l’indicizzazione e ci accorgiamo che le pagine interne del sito sono indicizzate mentre la home in precedenza indicizzata adesso è scomparsa.
La causa piu probabile potrebbe essere imputabile al passaggio dello spider in un momento in cui il server era out oppure i server DNS non erano ancora aggiornati.
Pero….
Controlliamo su www.bing.com il nuovo motore Microsoft e troviamo il sito posizionato ma con la versione alias del dominio cioè senza www
A questo punto facciamo il controllo e su tophost non è attivato di default l’alias senza www questo comporta che sul motore bing ho pagine indicizzate che danno errore 404 (non si vedono) e mi evidenzia una seconda possibilità che giustifica la mancata indicizzazione della home
Tabella dei provider e del loro settaggio alias
| Provider | www.dominio.ext | dominio.ext |
| www.register.it | si | si |
| www.tophost.it | si | no |
| www.misterdomain.eu | si | si |
| www.seeweb.it | si | no |
| www.tiscali.it | si | si |
| www.unibit.it | si | si |
| www.aruba.it | si | si |
Terapia:
Attendere il prossimo passaggio dello spider tutto dovrebbe andare a posto
Eventuale riproposizione della site map
Se ci sono pagine interne oltre alla home indicizzate in maniera errata si puo usare il file .htaccess per fare dei "Redirect permanent"
Indicizzazione a macchie di Leopardo
Ho ristrutturato e ottimizzato il sito di un cliente nel settore dei prestiti mutui e convenzioni.
Passano i giorni e nel controllare se compare su google (site:www.nomesitolungo.it e anche nomesitolungo.it) mi accorgo che il cliente ha anche:
nomesitolungo.com
nomesitolungo.biz
nomesitolungo.org
nomesitolungo.net
nomesitolungo.info
nomesitolungo.us
tutti reindirizzano sul dominio it ma qualcosa non quadra perche Google ha indicizzato un paio di pagine sul com, un paio di pagine su org ecc. Evidentemente il reindirizzamento è stato fatto male ho il cliente incautamente ha ritenuto di pubblicare la fotocopia del sito negli altri domini rovinando tutto il lavoro di ottimizzazione.
Questa strana indicizzazione porta come conseguenza che:
- il dominio base .it risulta indicizzato solo per la home (con risultati molto importanti, ma solo di una pagina)
- ritengo che in mancanza di un rapido intervento l'indicizzazione del dominio .it si fermi alla home vanificando tutto il lavoro
A questo punto ho indagato presso il cliente chiedendo di avere i dati FTP degli altri domini per fare un reindirizzamento manuale con un link nella pagina index di ogni singolo dominio.
Ebbene le indagini successive e il colloquio col webmaster hanno portato alla scoperta che tutti i domini sono stati allocati come Alias di quello principale e questo porta alla indicizzazione a macchie di leopardo.
Terapia :
Gestire con redirect tutti i domini escluso www.nomesitolungo.it (il principale) e nomesitolungo.it senza www (perche sta usandolo per le campagne Adwords)
—————————————–
Il tuo sito non si fà trovare? Vuoi sapere se si può ristrutturare?
Vuoi sapere cosa si può ottenere ristrutturando?
Telefonami al 3398736464 o lascia un commento
———————————-
