Verificate dopo ogni upgrade di versione che il file originale robots.txt non sia stato ripristinato.
Ed ecco i risultati sul posizionamento di file documento PDF e Word NON ANCORA ATTENDIBILI:
Ovviamente tutti e tre i motori di ricerca verificati hanno indicizzato la parola chiave di controllo.
La Keyword inserita nel path è stata indicizzata per tutti i documenti ma utilizzandola come ricerca solo un documento viene visualizzato (il docx) mentre gli altri due finiscono nei "risultati omessi".
YAHOO | BING | ||||||||
PDF da Word | Word | PDF da HTML | PDF da Word | Word | PDF da HTML | PDF da Word | Word | PDF da HTML | |
Path | SI | SI | SI | NO | NO | NO | NO | NO | NO |
Nome file | SI | |
NO |
NO |
|||||
Titolo | NO |
NO | NO | ||||||
Testo | |||||||||
Testo BOLD | |||||||||
Didascalia img | NO | NO |
NO |
||||||
Immagine | |||||||||
Linked Text | |||||||||
Link | |||||||||
PDF Property | |||||||||
Titolo | |||||||||
autore | |||||||||
oggetto | |||||||||
KW | |||||||||
copyright | |||||||||
URL |
Purtroppo mi ero già accorto da una mia precedente verifica che il file RObots.txt impediva l'indicizzazione della directory dove i file erano contenuti... ma un successivo aggiornamento ha ripristinato il file originale.
Nonostante i problemi riscontrati nell'indicizzazione possiamo già arrivare ad una deduzione importante:
tutti i tre motori di ricerca rispettano le direttive del file robots... anzi, visto che una mio precedente verifica aveva già dato esito positivo per Google possiamo anche determinare che Google cancella le keyword contenute documenti bloccate da direttive HTML ma... non sembra cancellarli...