ATTENZIONE!!! I test sono incompleti, Joomla, il CMS utilizzato di default esclude dall'indicizzazione tutto il contenuto della directory images in cui sono contenuti i file utilizzati per il test.
Verificate dopo ogni upgrade di versione che il file originale robots.txt non sia stato ripristinato.

 

Ed ecco i risultati sul posizionamento di file documento PDF e Word NON ANCORA ATTENDIBILI:

Ovviamente tutti e tre i motori di ricerca verificati hanno indicizzato la parola chiave di controllo.

La Keyword inserita nel path è stata indicizzata per tutti i documenti ma utilizzandola come ricerca solo un documento viene visualizzato (il docx) mentre gli altri due finiscono nei "risultati omessi".

  GOOGLE YAHOO BING
  PDF da Word Word PDF da HTML PDF da Word Word PDF da HTML PDF da Word Word PDF da HTML
Path SI SI SI NO NO NO NO NO NO
Nome file  SI  
  NO
    NO
   
Titolo NO
     NO      NO    
Testo                  
Testo BOLD                  
Didascalia img  NO     NO
    NO
   
Immagine                  
Linked Text                  
Link                  
                   
 PDF Property                  
Titolo                  
autore                  
oggetto                  
KW                  
copyright                  
URL                  

 

Purtroppo mi ero già accorto da una mia precedente verifica che il file RObots.txt impediva l'indicizzazione della directory dove i file erano contenuti... ma un successivo aggiornamento ha ripristinato il file originale.

Nonostante i problemi riscontrati nell'indicizzazione possiamo già arrivare ad una deduzione importante:

tutti i tre motori di ricerca rispettano le direttive del file robots... anzi, visto che una mio precedente verifica aveva già dato esito positivo per Google possiamo anche determinare che Google cancella le keyword contenute documenti bloccate da direttive HTML ma... non sembra cancellarli...

Joomla SEF URLs by Artio