Comments
Transcript
Istruzioni per le immagini - linguaggio-html
Corso di Webmaster PROGETTAZIONE DEL SITO Prof. Molteni Jonathan Linee guida consigli per consentire ai motori di ricerca di trovare indicizzare classificare il tuo sito prestare attenzione alle norme sulla qualità evitando trucchi per migliorare il posizionamento nei MdR : cloaking: non sottoporre ai motori di ricerca (MdR) contenuti diversi da quelli mostrati agli utenti doorway: pagine di scarsa qualità ottimizzate per una determinata frase o parola chiave PageRank : link progettati per migliorare la posizione del tuo sito Struttura e contenuti -1 link comprensibili ogni pagina raggiungibile da almeno un link testuale mappa del sito con link che rimandano alle sezioni più importanti (vedi esempio) se la mappa del sito contiene molti link, suddividerla in più pagine limitare il numero di link in una pagina descrizione chiara e accurata dei contenuti includere nelle pagine le parole che gli utenti potrebbero digitare per trovare il tuo sito. Struttura e contenuti - 2 utilizzare del testo anziché immagini per visualizzare: nomi contenuti link il crawler dei MdR non riconosce il testo contenuto nelle immagini utilizzare l'attributo "ALT" per includere parole di testo descrittivo nelle immagini tag <title> e attributi "ALT" descrittivi e precisi verificare l'eventuale presenza di link non funzionanti Istruzioni per le immagini - 1 Non incorporare testo nelle immagini: i MdR non sono in grado di leggere il testo incorporato nelle immagini utilizzare il formato HTML standard Fornire tutte le informazioni possibili sull'immagine Assegnare alle immagini nomi file dettagliati e informativi: il nome file offre ai MdR indizi sul soggetto dell'immagine Esempio: il-mio-nuovo-gattino-nero.jpg molto più informativo di IMG00023.JPG Istruzioni per le immagini - 2 Creare testo alternativo valido: l'attributo ALT viene utilizzato per descrivere i contenuti di un file immagine ed è importante perchè: gli MdR utilizzano queste informazioni per determinare l'immagine migliore da restituire per la query di un utente utenti con problemi visivi utilizzano screen reader utenti che dispongono di connessioni a bassa velocità Questi potrebbero non visualizzare le immagini sulle pagine web. Il testo descrittivo contenuto all'interno del tag ALT fornisce loro importanti informazioni. Istruzioni per le immmagini - 4 Visualizzazione non ideale: <img src="cucciolo.jpg" alt=""/> Visualizzazione migliore: <img src="cucciolo.jpg" alt="cucciolo"/> Visualizzazione ottimale: <img src="cucciolo.jpg" alt="Cucciolo dalmata che gioca"> Da evitare <img src="puppy.jpg" alt="cucciolo cane cagnolino cagnetto cagnetti cuccioli cagnolini cucciolata cane retriever labrador wolfhound setter pointer cucciolo jack russell terrier cuccioli cibo per cani economico cibo per cuccioli alimenti per cani"/> Istruzioni per le immmagini - 5 inserire troppe parole chiave nel testo alternativo riduce la qualità del servizio fornito all'utente e può far sì che il tuo sito venga percepito come spam. creare contenuti utili e ricchi di informazioni che utilizzino le parole chiave in modo appropriato e nel contesto provare i tuoi contenuti utilizzando un browser, Lynx, di solo testo Istruzioni tecniche - 1 Utilizzare Lynx per esaminare il proprio sito, in quanto la maggior parte degli spider dei MdR rileva il sito allo stesso modo di Lynx Se funzioni creative come JavaScript, cookie, ID di sessione, frame, DHTML o Flash ti impediscono di visualizzare l'intero sito in un browser di testo, anche gli spider dei motori di ricerca potrebbero riscontrare problemi durante la scansione del tuo sito. Istruzioni tecniche - 2 Assicurati che il tuo server web supporti l'intestazione HTTP If-Modified-Since: questa funzione consente al server web di comunicare ai MdR se il contenuto è stato modificato dall'ultima scansione del tuo sito questa funzione consentirà di limitare l'uso di larghezza di banda e di ridurre il sovraccarico Istruzioni tecniche – 3 (Advanced) Utilizzare il file robots.txt sul tuo server web. Questo file indica ai crawler su quali directory è possibile eseguire la scansione assicurati che il file sia aggiornato, in modo da non bloccare involontariamente il crawler Crawler, spider o robot: è un software che analizza i contenuti di una rete in modo automatizzato per conto di un MdR, acquisisce una copia testuale di tutti i documenti visitati e le inseriscono in un indice. File robots.txt – 1 (Advanced) Un file robots.txt limita l'accesso al tuo sito da parte dei robot o bot dei MdR che eseguono la scansione del Web Il file robots.txt, risede nella directory principale del dominio I bot sono automatici e, prima di accedere alle pagine di un sito, effettuano un controllo per verificare la presenza di un file robots.txt che impedisce loro di accedere a determinate pagine non è possibile imporre l'applicazione di un file robots.txt e alcuni spammer potrebbero ignorarlo, per posizionare annunci pubblicitari online senza dover pagare alcun costo. Per questo si consiglia di proteggere mediante password le informazioni riservate. è necessario un file robots.txt solo se sul sito vi sono contenuti che si desidera escludere dall'indicizzazione dei MdR Approfondimento (Advanced) Bot: programma che accede alla rete attraverso lo stesso tipo di canali utilizzati dagli utenti (pagine Web, invia messaggi in chat, si muove nei videogiochi...). Programmi legati all'automazione di compiti che sarebbero troppo gravosi o complessi per gli utenti umani. Spam: da un autore conosciuto si generano messaggi identici contenti pubblicità indesiderata. Istruzioni tecniche - 4 Eseguire dei test del sito per assicurarsi che venga visualizzato correttamente nei diversi browser Monitorare le prestazioni del sito e ottimizzare i tempi di caricamento. Siti veloci aumentano la soddisfazione degli utenti e migliorano la qualità generale del Web Monitorare regolarmente le prestazioni dei siti utilizzando: Page Speed: http://code.google.com/intl/it/speed/page-speed/ Yslow: http://developer.yahoo.com/yslow/ WebPagetest: http://www.webpagetest.org/ Diffusione dei browser: dicembre 2010 Statistiche browser Distribuzione versioni di IE Compatibilità del browser Ciascun browser interpreta i codici del sito web in maniera leggermente differente il sito può apparire diverso ai visitatori a seconda del browser utilizzato evitare di basarsi sul comportamento specifico di un browser eseguire test del sito su più browser possibili progettato il sito, controllare "visualizzazione" e "funzionalità" su diversi browser per assicurarsi che i visitatori usufruiscano del serviziodesiderato eseguire i test sul processo di sviluppo il prima possibile browser diversi o diverse versioni dello stesso browser possono visualizzare il sito in modo differente Codice HTML chiaro ed efficace utilizzare codici HTML e CSS e eseguirne il test su più browser CSS consente di separare la presentazione dai contenuti e velocizza il caricamento e la visualizzazione delle pagine Strumenti di convalida: MarkupValidation Service, http://validator.w3.org/ CSSValidation Service, CSS , http://jigsaw.w3.org/css-validator/ messi a disposizione dal Consorzio W3 strumenti di pulizia facili e veloci: Tidy , http://www.w3.org/People/Raggett/tidy/ corregge gli errori tipici in cui si occorre durante lo sviluppo di codice web Fattore accessibilità non tutti gli utenti hanno JavaScript attivato sui propri browser inserire lo stesso contenuto di JavaScript in un tag noscript. accertarsi che i contenuti siano identici a quelli presenti in JavaScript tecnologie come Flash e ActiveX potrebbero non consentire una corretta visualizzazione o non consentirla affatto su tutti i browser eseguire sempre il test del sito su un browser di solo testo (Lynx) fornire alternative di solo testo a funzionalità e contenuti multimediali: per i MdR sarà più semplice eseguire la scansione e l'indicizzazione del sito il sito sarà più accessibile agli utenti che utilizzano tecnologie alternative (screenreader) Testo & motori di ricerca i MdR si basano su testo, per poter essere sottoposti a scansione e indicizzati, i contenuti devono essere in formato testo Non tutti i MdR sono in grado di indicizzare i contenuti testuali presenti nei file Flash contenuti multimediali (Flash, Silverlight o video) dovranno essere disponibili anche in formato testo, altrimenti non saranno accessibili ai MdR Googlebot & Flash Googlebot: indicizza il testo visibile dei file SWF Flash e lo utilizza per abbinare termini di query nelle ricerche Google rintraccia gli URL nei file SWF e segue tali link non è garantita la scansione o l'indicizzazione di tutti i contenuti Flash o di altro tipo eccetto testo Non è possibile allegare contenuti caricati dai file Flash: se un file Flash carica un altro file, viene indicizzato il contenuto di tale file, ma non è fa parte del sorgente Flash Googlebot Googlebot effettua due tipi di scansione del web: Deep-crawl: una volta al mese, viene scansionato tutto il web pagina per pagina aggiornando indici Fresh-crawl: quasi tutti i giorni, aggiorna le pagine che già sono presenti nell'indice e aggiunge quelle eventualmente create dopo l'ultima Deepcrawl Indicizzazione file Flash: consigli Solamente alcuni motori di ricerca indicizzano i contenuti dei file Flash, è preferibile utilizzare Flash per l'abbellimento del sito e il codice HTML per contenuti e navigazione sito più adatto al crawler e accessibile a più utenti lettori che necessitano di screen reader utenti che utilizzano browser obsoleti o non standard utenti che utilizzano cellulari o dei dispositivi mobili Silverlight e altri formati multimediali I motori di ricerca incontrano problemi nel gestire i contenuti di formati multimediali: Silverlight I rob sono in grado di leggere alcuni file multimediali e di estrarre il testo e i link in essi contenuti, ma mancano la struttura e il contesto i designer multimediali includono contenuti sotto forma di immagini: è possibile che i MdR tralascino parole chiave importanti. i contenuti vengono inclusi nell’indice dei MdR, ma potrebbero mancare testo, contenuti e link. Video I rob non eseguono la scansione dei contenuti dei file video; fondamentale fornire informazioni sui video inclusi nel sito: fornire una descrizione dettagliata del video all'interno del codice HTML pubblicarli su Google Video,YouTube o su altri provider di servizi di hosting video Best practice utilizzare formati multimediali solo dove necessario servirsi HTML per i contenuti e la navigazione fornire versioni di testo delle pagine se Silverlight è utilizzato nella home page accertarsi che la pagina iniziale contenga un link HTML standard a una pagina di testo da cui è possibile esplorare il sito senza utilizzare il formato multimediale Tipi di file indicizzati dai MdR (advanted) Adobe Portable Document Format (.pdf), Adobe PostScript (.ps), Autodesk Design Web Format (.dwf), Codice Basic (.bas), C/C++ Codice (.c, .cpp, .cxx, .h, .hpp), Flash (.swf), Google Earth (.kml, .kmz), HTML (.htm, .html), Perl (.pl), Python (.py), Codice sorgente Java (.java), Microsoft Excel (.xls, .xlsx), Microsoft PowerPoint (.ppt, .pptx), Microsoft Word (.doc, .docx), Testo OpenOffice (.odt), Presentazioni OpenOffice (.odp), Fogli di calcolo OpenOffice (.ods), Rich Text Format (.rtf, .wri), Testo (.ans, .asc, .cas, .txt, .text), XML (.xml), Wireless Markup Language (.wml, .wap) Non tutti gli URL e le pagine hanno l'estensione di file .html: Alcune pagine (http://www.google.com) non utilizzano alcuna estensione altre hanno un'estensione che non corrisponde al loro tipo di file Limitando la ricerca a un tipo di file specifico si ottengono pagine con tale estensione ottenendo meno risultati pertinenti. Uso di parole chiave in eccesso L'uso di parole chiave in eccesso consiste nel sovraccaricare una pagina web di parole chiave nel tentativo di modificare il posizionamento di un sito nei risultati di ricerca Riempire le pagine con parole chiave determina un peggioramento del servizio offerto e può danneggiare il posizionamento del sito creare contenuti utili e ricchi di informazioni che utilizzino le parole chiave in modo appropriato e nel contesto Evitare elenchi di parole chiave ripetute a caso le parole chiave possono presentarsi sotto forma di testo nascosto o nei tag "title" o negli attributi "alt" Norme sulla qualità: Princìpi di base progettare pagine per utenti e non per i motori di ricerca non sottoporre ai motori di ricerca contenuti diversi da quelli proposti agli utenti, cloaking evitare i link a siti di spam, potrebbe influire negativamente sul posizionamento del sito non utilizzare programmi non autorizzati per inviare pagine Norme sulla qualità - Norme specifiche Evita testo o link nascosti Non utilizzare il cloaking o comandi di reindirizzamento non ammessi Non inviare query automatizzate Non creare più pagine, sottodomini o domini dai contenuti duplicati Evita le "pagine doorway" create appositamente per i motori di ricerca o altri approcci mirati alla soppressione dei cookie, come i programmi affiliati con contenuto originale scarso o nullo. Testo e link nascosti testo e|o link nascosti possono far sì che il sito venga ritenuto inaffidabile Il testo può essere nascosto in diversi modi, ad esempio: Utilizzando testo bianco su uno sfondo bianco Inserendo del testo dietro un'immagine Utilizzando CSS per nascondere il testo Impostando la dimensione del carattere su 0 il sito viene rimosso dall'indice dei MdR non compare nei risultati di ricerca Cloaking Presentare agli utenti contenuti o URL diversi da quelli presentati ai motori di ricerca. Esempi: pagina HTML ai MdR, visualizzando una pagina di immagini o Flash per gli utenti se il sito contiene elementi non sottoponibili a scansione da parte dei MdR( file multimediali), non fornire contenuti mascherati. La restituzione di risultati diversi a seconda dello user-agent può provocare l'identificazione del sito come ingannevole e la sua conseguente rimozione dall'indice. Query automatizzate i MdR non consentono l'invio al sistema di query automatizzate di alcun tipo senza il previo consenso esplicito dei MdR stessi. l'invio di query automatizzate assorbe risorse e prevede l'utilizzo di software per stabilire il posizionamento di un sito o una pagina web nei risultati di ricerca dei MdR per varie query. Contenuti duplicati blocchi di contenuti all'interno o tra i domini che sono identici o molto simili Questa pratica non è all'origine ingannevole: Forum di discussione che generano sia pagine destinate a dispositivi mobili Contenuti archiviati visualizzati o collegati tramite più URL distinti Versioni unicamente stampabili delle pagine web I MdR cercano di indicizzare pagine contenenti informazioni distinte; Es: se il sito contiene una versione "regolare" e una "stampabile" e nessuna di esse è bloccata con un metatag noindex (impedisce l'indicizzazione della pagina), i MdR ne scelgono una sola In alcuni casi i contenuti vengono deliberatamente duplicati tra i domini nel tentativo di manipolare il posizionamento nei MdR per conquistare un traffico maggiore. peggiora il servizio offerto agli utenti: contenuti ripetuti in un insieme di risultati di ricerca sito rimosso dall'indice in modo che non compaia tra i risultati di ricerca Pagine doorway pagine di scarsa qualità dove ciascuna pagina è ottimizzata per una determinata frase o parola chiave scritte per ottenere un posizionamento per una determinata distribuite su più domini o presenti in un uno solo pratiche volte a manipolare i MdR e a ingannare gli utenti indirizzandoli a siti diversi da quelli selezionati Assenza o scarsa presenza di contenuti originali pagine contenenti molte parole ma contenuti autentici scarsi o assenti pagine generate automaticamente, che non sono di alcun valore per gli utenti Esempi: Siti affiliati poveri di contenuti: raccolgono entrate pay-per-click (PPC) inviando i visitatori ai siti di programmi affiliati, pur fornendo contenuti o da un valore aggiunto scarso o assente. siti mirati alla soppressione dei cookie o di modelli privi di contenuti univoci. contenuti generati automaticamente a livello di programmazione: paragrafi di testo casuali che non hanno alcun senso per il lettore ma che possono contenere parole chiave di ricerca Contenuti di altri siti: contenuti tratti da altri siti più affidabili, supponendo erroneamente che aumentare il volume di pagine web con contenuti casuali non pertinenti rappresenti una buona strategia a lungo termine Suggerimenti HTML http://www.google.com/support/webmasters/bin/answer. py?hl=it&answer=80407 Metatag http://www.google.com/support/webmasters/bin/answer. py?answer=79812 Ancora immagini Testo di ancoraggio Il testo di ancoraggio esterno (il testo utilizzato dalle pagine per creare link al tuo sito) rispecchia le modalità di visualizzazione delle tue pagine da parte degli altri utenti. I webmaster in genere non hanno il controllo sul modo in cui altri siti creano link ai loro, ma tu puoi assicurarti che il testo di ancoraggio che utilizzi nel tuo sito sia utile, descrittivo e pertinente. In questo modo si offre un miglior servizio all'utente e lo si aiuta a comprendere qual è la destinazione del link. Ad esempio, potresti creare un link a una pagina di foto delle vacanze come questo: Foto del nostro viaggio in Irlanda di giugno 2008. Fornisci un buon contesto per la tua immagine La pagina in cui si trova l'immagine e i contenuti intorno a quest'ultima (comprese eventuali didascalie o titoli di immagine) forniscono ai motori di ricerca informazioni importanti sul soggetto della tua immagine. Ad esempio, la foto di un orso polare mostrata in una pagina web sui pomodori coltivati in casa invierebbe un messaggio fuorviante ai motori di ricerca che devono determinare il soggetto del file orsopolare.jpg. Ove possibile, è una buona idea assicurarsi che le immagini siano collocate vicino al testo attinente. Inoltre, consigliamo di fornire alle immagini validi titoli e didascalie descrittivi. Rifletti sulle soluzioni migliori per proteggere le tue immagini Dato che le immagini vengono spesso copiate dagli utenti, Google in genere trova più copie della stessa immagine online. Utilizziamo svariati elementi per identificare la fonte originale dell'immagine e tu puoi aiutarci fornendoci tutte le informazioni possibili. Inoltre, le informazioni che ci fornisci ci indicano il contenuto e il soggetto dell'immagine. Una delle preoccupazioni più frequenti per i webmaster è l'utilizzo non autorizzato delle loro immagini. Se impedisci agli utenti di utilizzare le tue immagini sui loro siti o di creare link alle tue immagini, impedirai loro di utilizzare la tua larghezza di banda, ma limiterai anche il potenziale pubblico delle tue immagini riducendo le possibilità che vengano scoperte dai motori di ricerca. Una possibile soluzione è consentire agli utenti di utilizzare le tue immagini, richiedendo però il riconoscimento della fonte e l'inclusione di un link che rimandi al tuo sito. Per farlo, puoi scegliere fra vari metodi. Ad esempio, puoi procedere nei seguenti modi: Analogamente, alcune persone aggiungono alle proprie immagini del testo di copyright, filigrane o altre informazioni. Questo tipo di informazioni non avrà effetti sulle prestazioni della tua immagine nei risultati di ricerca e consente ai fotografi di chiedere il riconoscimento della paternità dei loro lavori dissuadendo gli utilizzi anonimi. Tuttavia, il rischio è che una caratteristica come le filigrane riduca la qualità dell'immagine o della miniatura nella percezione degli utenti con una conseguente riduzione del numero di clic nei risultati di ricerca. Se non vuoi che i motori di ricerca eseguano la scansione delle tue immagini, ti consigliamo di utilizzare un file robots.txt per bloccare l'accesso alle tue immagini. Offri all'utente un servizio ottimale Delle belle immagini sono un ottimo modo per attirare traffico sul tuo sito. Quando pubblichi delle immagini, ti consigliamo di porti come obiettivo la migliore esperienza utente possibile. Le foto di buona qualità attirano maggiormente gli utenti rispetto a foto sfocate e poco chiare. Inoltre, gli altri webmaster saranno più propensi a creare link a un'immagine di buona qualità, fatto che può aumentare le visite al tuo sito. Se utilizzi immagini nitide e chiare, anche le relative versioni in miniatura che mostriamo nei risultati di ricerca avranno un aspetto migliore e con ogni probabilità attireranno più clic da parte degli utenti. Anche se le immagini sono distribuite tra più pagine del tuo sito, considera l'idea di creare una pagina di destinazione separata per ogni immagine dove raccogliere tutte le relative informazioni. In questo caso, assicurati di fornire informazioni univoche (come didascalie e titoli descrittivi) in ogni pagina. Potresti anche abilitare commenti, discussioni o voti per ogni immagine. Non tutti gli utenti scorrono le pagine fino alla fine, quindi considera l'idea di inserire le immagini nella parte superiore della pagina, dove saranno immediatamente visibili. Considera la possibilità di strutturare le tue directory in modo che le immagini simili siano salvate insieme. Ad esempio, potresti dedicare una directory alle miniature e un'altra alle immagini di dimensioni normali; oppure potresti creare directory separate per ogni categoria di immagini (ad esempio, potresti creare directory separate per Hawaii, Ghana e Irlanda nella directory Viaggi). Se il tuo sito contiene immagini per adulti, ti consigliamo di memorizzarle in una o più directory separate dal resto delle immagini sul sito. Specifica larghezza e altezza di tutte le immagini. Un browser web può iniziare a visualizzare una pagina anche prima che le immagini vengano scaricate, purché ne conosca le dimensioni per disporre gli elementi non sostituibili. Specificando tali dimensioni è possibile velocizzare il caricamento delle pagine e migliorare l'esperienza utente. Per ulteriori informazioni sull'ottimizzazione delle tue immagini, consulta Optimizing Web Graphics sul sito Let's Make the Web Faster. Nella ricerca immagini, così come nella ricerca web, il nostro obiettivo è offrire agli utenti i risultati di ricerca migliori e più pertinenti. Seguendo le best practice appena descritte, aumentano le probabilità che i nostri risultati di ricerca restituiscano anche le tue immagini. Lynx Lynx is a text browser for the World Wide Web. Lynx 2.8.7 runs on Un*x, VMS, Windows 95/98/NT, DOS386+ but not 3.1, 3.11, or OS/2 EMX. The current developmental version is also available for testing. Ports to Mac are in beta test. Many user questions are answered in the online help provided with Lynx. Press the '?' key to find this help. If you are encountering difficulty with Lynx you may write to [email protected]. Be as detailed as you can about the URL where you were on the Web when you had trouble, what you did, what Lynx version you have (try '=' key), and what OS you have. If you are using an older version, you may well need to upgrade. Sito non indicizzato: motivi Il sito potrebbe essere indicizzato con un dominio diverso. Esempio: indicizzato come http://example.com anziché come http://www.example.com. Se il sito è recente, il MdR non ha ancora eseguito la scansione e l'indicizzazione. Segnala il tuo sito al MdR. Sitemap Invialo a Google alla pagina http://www.google.com/addurl.html Invia una Sitemap consentono di comunicare ai motori di ricerca informazioni sulle pagine del tuo sito è un elenco delle pagine del tuo sito web. permette di conoscere la struttura del tuo sito e aumentare la copertura delle tue pagine web. Importante verifica che tutti i siti potenzialmente interessati alle tue pagine siano a conoscenza della presenza online del tuo sito. Link per creare site map: http://www.xml-sitemaps.com/ Verifica in google: file HTML home di Strumenti per i Webmaster clic su Verifica questo sito accanto al sito desiderato. Scegli il metodo di verifica seleziona Carica file HTML, segui le istruzioni. Carica il file sul tuo server web nel percorso indicato Conferma facendo clic sul link fornito. Dopo aver caricato, fai clic su Verifica Non eliminare il file dal server perché in tal caso verrà annullata la verifica del sito. Aggiungi il tuo URL all'indice di Google Aggiungere all'indice il nuovo sito o aggiorniamo quelli già presenti. Non vengono aggiunti all'indice tutti i siti suggeriti né vengono fornite garanzie su quando e se il sito verrà aggiunto. Vai alll'URL http://www.google.com/addurl/?continue=/addurl Inserisci l'URL del tuo sito comprensivo del prefisso http:// Se lo desideri, aggiungi commenti o parole chiave che descrivono i contenuti della tua pagina Centro webmaster google Ricevi dati su scansione, indicizzazione e traffico di ricerca. Ricevi notifiche in merito a problemi sul tuo sito. Link: http://www.google.com/webmasters/ Approfondimenti Informazioni sulle statistiche e sui dati http://www.google.com/support/webmasters/bin/answer.py ?hl=it&answer=96568 Errori http://www.google.com/support/webmasters/bin/answer.py ?hl=it&answer=35638 Il tuo sito sul Web http://www.google.com/support/webmasters/bin/topic.py?h l=it&topic=20624