HTML (HYPER
TEXT MARKUP LANGUAGE)
LINGUAGGIO di MARCATORI per creare IPERTESTI
INTRODUZIONE
Questa premessa, apparentemente inutile, serve invece a sottolineare
pochi ma fondamentali concetti che reggono l'HTML e che, se compresi
tempestivamente, consentono di far proprio un sistema di contrassegno
tutt'altro che complesso, ma pur sempre retto da regole e principi
inderogabili.
Le parole chiave sono INSERIRE e FORMATTARE
Creare un sito Internet non è difficile, ne' può
essere messo a confronto con veri e propri sistemi di programmazione.
Su quest'ultimo punto, in particolare, è bene fin d'ora sottolineare
come HTML non è un linguaggio di programmazione ma un semplice
sistema di contrassegno, i cui marcatori (TAG) vengono riconosciuti
ed interpretati dai browser Web (Netscape, MsIe, Opera ecc). Questa
peculiarità rende HTML un sistema facile da comprendere perchè
non pressuppone alcuna conoscenza tecnica preesistente. Per questo
motivo chiunque può avvicinarsi al Web Publishing senza prerequisiti
di specializzazione e per questo in Internet esistono milioni di
creatori di pagine Web.
TIPI DI EDITOR HTML
Il mercato è gravido di decine di software speciliazzati
nella creazione di pagine HTML: i cosiddetti editor HTML. La complessità
di questi programmi ha raggiunto livelli molto alti ma ha seguito
strade diverse. In buona sostanza il mercato propone due tipi di
editor HTML:
Editor testuali
Si tratta di programmi che propongono modifiche dirette sul codice
HTML puro con possibilità di preview del risultato. Per facilitare
la scrittura del codice mettono a disposizione comandi preconfezionati
attivabili con semplici click. L'utilità maggiore di questi
strumenti è la padronanza del codice HTML puro che riescono
a comunicare agli utilizzatori. Il difetto maggiore è nell'apprendimento
più difficile rispetto agli editor WYSIWYG.
Editor WYSIWYG (Wath You See Is Wath You Get)
L'acronimo sopraindicato sta per: What You See Is What You Get,
ed italianizzando significa che ciò che si vede sullo schermo
è ciò che si ottiene in un browser Web. In altre parole
questi editor non visualizzano il codice HTML ma esclusivamente
gli oggetti, le immagini ed il testo. In questo modo lo sviluppatore
non si trova a lavorare su codice HTML ma sulla pagina così
come verrà visualizzata dal browser: spostando oggetti con
il semplice trascinamento del mouse, sfruttando layout predefiniti
ecc.
Il vantaggio di questo tipo di editor è evidente: lo sforzo
di comprensione delle specifiche HTML è ridotto al minimo
e il tempo di apprendimento è brevissimo.
Secondo chi scrive, però, questo tipo di editor (un esempio
concreto è Front Page) non dà la possibilità
di comprendere l'HTML e personalizzarne l'uso. Si corre, infatti,
il rischio di creare siti fotocopia con un layout identico agli
altri e, in presenza di errori che l'editor non riesce a risolvere,
di non riuscire ad andare oltre ciò che il programma prevede.
A prescindere da pareri soggettivi su programmi per l'HTML, la
presente guida è concepita per far comprendere i rudimenti
dell'HTML puro. Continuando questo corso non ti troverai di fronte
un tutorial sui comandi degli editor più diffusi, ma davanti
codice HTML puro ed universale. Solo in questo modo potrai comprendere
le peculiarità dell'HTML e degli altri linguaggi che ne supportano
e ampliano l'utilizzo.
Abbandona per tutto il corso di questo tutorial il tuo editor e
concentrati sulle nozioni di codice che la guida ti presenta volta
per volta. Comprese le basi dell'HTML potrai scegliere se usare
editor WYSIWYG o editor testuali, in entrambi i casi avrai consapevolezza
dei limiti e delle potezialità del sistema, potendo usare
meglio tutti gli strumenti che il mercato mette a tua disposizione.
NOTA BENE :
i siti Web, prima della pubblicazione, vanno creati in locali, cioè
sul tuo hard disk. Solo successivamente vengono spediti attraverso
programmi appositi.
per i nomi dei file e per le estensioni degli stessi usa caratteri
sempre in minuscolo.
Ricorda che la modifica del tuo sito Web avviene tramite programmi
FTP (File Trasfer Protocol) mediante password e UserId. Quindi nessun
altro, oltre te, può modificare le pagine.
Per scrivere codice HTML puoi utilizzare qualsiasi editor HTML
testuale (HomeSite, HotDog, DreamWeaver ecc.), ma anche solo Blocco
Notes di Win95.
Prima di continuare è importante sottolineare una caratteristica
dei tag HTML. Come più volte accennato, HTML è un
sistema di contrassegno che produce i suoi effetti su testo e immagini.
Perchè tali effetti si producano è necessario che
elementi specifici (standardizzati in HTML) vengano assegnati ai
vari elementi testuali o d'immagine della pagina. Il termine marcatura
deriva proprio da questa caratteristica. Per una migliore comprensione
di questo fondamentale concetto di HTML prendiamo in considerazione
il testo seguente:
esempio
HTML è un sistema di contrassegno indipendente dalla piattaforma.
Come vedi si tratta di un normalissimo testo per il quale non abbiamo
specificato alcun tag HTML. In linea con i concetti che reggono
il sistema di markup, senza altre indicazioni, il browser formatta
il testo come quello che lo precede (infatti si tratta di un font
Times New Roman colore identici a questo stesso testo).
Consideriamo, ora, l'ipotesi di voler dare un colore rosso al testo
di esempio. Per fare questo marchiamo il testo con lo specifico
tag HTML che determina il colore del testo:
<font color="red">HTML è un sistema di
contrassegno indipendente dalla piattaforma.</font>
commento:
la prima parte del TAG indica al BROWSER l'azione che il tag deve
svolgere sull'oggetto ( in questo caso il testo)
la seconda parte indica al BROWSER che il tag aperto precedentemente
và chiuso.
In seguito vedremo il funzionamento del tag FONT. Quello che interessa
sottolineare in questa sede è l'uso generale dei marcatori
HTML: come si nota agevolmente dall'esempio, il tag <font color="red">
è posto immediatamente prima e dopo la frase da formattare
in rosso. L'unica differenza è che il tag prima della frase
è <font color="red">, mentre quello
che chiude è </font>. La barra posta in verticale verso
destra indica al browser che il tag <font> precedentemente
aperto, in questo caso va chiuso. Abbiamo così dato vita
ad un piccola marcatura, comunque sintomatica del funzionamento
del sistema HTML.
I tag HTML sono case insensitive, cioè assolutamente indipendenti
dal maiuscolo e minuscolo. Per intenderci, il seguente codice:
<font size="red"></font>
ha gli stessi effetti del codice:
<FONT SIZE="RED"></font>
In HTML esistono TAG che non hanno bisogno di chiusura, perchè
la loro funziona non è quella di marcare un elemento, ma
di fornire informazioni di diverso tipo. Volta per volta indicheremo
quali elementi hanno bisogno di chiusura e quali funzionano correttamente
anche se ne sono privi.
Intestare il documento
(elemento HEAD)
Cosa imparerai in questa lezione: come creare da zero un documento
HTML; dare un titolo alla pagina e cosa sono e come impostare i
meta tag.
Per essere visualizzati su Internet, i documenti vengono salvati
in formato testo e contengono i tag necessari ad informare il browser
(Netscape, MsIe o Explorer) sulla visualizzazione della stessa.
In altri termini un documento contenente testo, salvato in formato
.htm senza alcun tag HTML viene comunque visualizzato dal browser,
ma privo di qualsiasi formattazione: senza ritorni a capo, paragrafi,
testo centrato, grassetto, corsivo ecc.
Lo scopo dell'HTML è quello di fornire, attraverso comandi
chiamati TAG , una formattazione al documento, oltre all'inserimento
di immagini ed altri elementi multimediali (filmati, applet ecc.).
Il lavoro che uno sviluppatore Web produce all'interno di un documento
HTML è indirizzato a fornire tutte le informazioni necessarie
al browser per interpretare correttamente la pagina.
Un documento HTML si divide in due parti fondamentali:
l'intestazione e il corpo del documento.
E' facile comprendere che il corpo del documento contiene tutti
gli elementi della pagina: il testo, le immagini, le applet Java,
il codice Javascript e quant'altro viene materialmente visualizzato
dal browser.
Al contrario, l'intestazione contiene una serie di informazioni
necessarie al browser per una corretta interpretazione del documento,
ma non visualizzate all'interno dello stesso. L'intestazione, quindi,
ha un ruolo non apparente ma sicuramente fondamentale. Solo per
citare alcuni elementi forniti dall'intestazione: il titolo della
pagina, i termini chiave per i motori di ricerca, il tipo di HTML
supportato ed i link base di riferimento.
In questa sede analizzeremo solo alcuni elementi, omettendo per
il momento lo studio degli altri non immediatamente necessari alla
comprensione di HTML:
· HTML
· DOCTYPE
· HEAD
· TITLE
· META
In seguito dettaglieremo per ognuno di questi elementi le peculiarità
salienti.
<HTML>
Tutti gli elementi ed il contenuto di un documento HTML sono compresi
all'interno dei marcatori <HTML></HTML> che, in altre
parole, hanno il compito di aprire e chiudere il file. I tag <HTML></HTML>
indicano al browser che il documento è marcato in HTML, anche
se i browser più recenti (Netscape 3 e 4, MsIe 3,4 e 5) riescono
ugualmente ad interpretare i tag successivi. Detto questo esistono
comunque due ragioni per inserire sempre il tag <HTML></HTML>
all'interno del documento:
HTML non è l'unico linguaggio di contrassegno presente sul
WWW (si pensi solo a XML) e il browser rischia di malinterpretare
i tag, confondendoli con altri linguaggi di markup
Gli utenti che usano vecchi browser rischiamo di visualizzare un
documento pessiamamente formattato.
DOCTYPE
Seguendo le indicazioni del W3C (consorzio internazionale che si
occupa di armonizzare l'utilizzo dell'HTML) Doctype deve essere
il primo elemento ad aprire il documento. Questo vuol dire che andrebbe
posto prima di <HTML>.
Si tratta di un tag che non ha bisogno di chiusura e che ha il compito
di fornire informazioni al server Web che ospita la pagina. Le informazioni
fornite da DOCTYPE riguardano il tipo di documento visualizzato
oltre ad essere necessaria alla comunicazione tra browser e server.
DOCTYPE deve essere scritto in una forma standard:
<!DOCTYPE HTML PUBLIC ="-//IETF//DTD HTML 4.0//EN">
Questa riga fornisce alcune informazioni sul documento:
HTML PUBLIC: il documento è pubblico IETF: il tipo di HTML
pubblico è gestito dalla Internet Engineering Task Force
DTD HTML 4.0: la versione di HTML supportata è la 4.0 EN:
la lingua del documento è l'inglese
L'uso di DOCTYPE non è obbligatorio e può essere
omesso. Certamente un suo utilizzo aiuta il server Web ad interpretare
correttamente il documento, ma la sua assenza non è condizionamente
ai fini della corretta visualizzazione.
Come si nota agevolmente DOCTYPE è un tag che non prevede
un elemento di chiusura (non va scritto in questo modo: <!DOCTYPE
HTML PUBLIC ="-//IETF//DTD HTML 4.0//EN"></DOCTYPE>)
<HEAD>
Gli elementi <HEAD></HEAD> sono posti immediatamente
dopo l'apertura del tag <HTML> e racchiudono l'intestazione
vera e propria del documento; cioè tutte le informazioni
necessarie al browser, al Webserver ed ai motori di ricerca. Si
tratta del primo elemento letto dal browser e per questo è
il luogo migliore per inserire sintassi script . All'intero di <HEAD></HEAD>
va inserito il titolo del documento e altre informazioni. Ecco la
sintassi HTML di un documento con i comandi finora esaminati:
<!DOCTYPE HTML PUBLIC ="-//IETF//DTD HTML 4.0//EN">
<HTML>
<HEAD></HEAD>
</HTML>
<TITLE>
L'elemento <TITLE></TITLE> è il più
utilizzato all'interno del tag <HEAD>, in quanto fornisce
il titolo alla pagina. Il titolo viene solitamente visualizzato
dai browser nell'intestazione di pagina.
In caso di salvataggio dell'URL con "Aggiungi a preferiti"
(per MsIe) e "Aggiungi Segnalibro" (per Netscape) il tag
TITLE dà il nome al collegamento. In altre parole, quando
si salva l'indirizzo, il browser assegna allo stesso quanto presente
all'interno di <TITLE></TITLE>.
Il contenuto riportato tra i tag <TITLE></TITLE> è
anche utilizzato da alcuni motori di ricerca per indicizzare la
pagina e trovare parole chiave. Altavista è probabilmente
l'esempio più eclatante. Per questo è bene fornire
nel TITLE una descrizione dettagliata ma sintetica della pagina,
con tutte le parole chiave che i motori possono indicizzare.
Un consiglio da tenere a mente è comunque quello di non esagerare
con la lunghezza del testo, ma di contemperare le esigenze di chi
aggiunge il sito al bookmark e dei motori di ricerca.
La corretta sintassi per il tag TITLE è la seguente:
<TITLE>La mia prima home page</TITLE>
META
I motori di ricerca rappresentano una risorsa indispensabile per
chi cerca informazioni sulla rete, e siti quali Altavista, Yahoo,
Lycos e Excite sono tra i piu' visitati su internet.
Figurare all'interno di tali motori di ricerca è fondamentale
per chi crea pagine web e vuole maggior visibilità. E' necessario
innanzitutto segnalare le proprie pagine a questi motori di ricerca,
e ciò viene fatto attraverso piccoli form presenti sulle
pagine web sotto la scritta "Add your site". Periodicamente
questi "spider" monitoreranno le milioni di pagine contenute
nei loro database verificando le eventuali modifiche.
Oltre che essere inseriti nei motori di ricerca e' importante figurare
tra i primi siti che vengono visulizzati nella ricerca (spesso,
soprattutto quando i termini da ricercare sono di largo uso e di
carattere generale, vengono presentate delle liste con migliaia
di siti), e per fare questo è possibile adottare qualche
semplice accorgimento.
Fondamentale a questo scopo risultano i META tag, stringhe di codice
che figurano in testa al documento, tra i comandi <HEAD></HEAD>
e che vengono, per prime, lette dai motori di ricerca.
Le "keywords" (parole chiave) sono i termini che, sinteticamente,
descrivono il contenuto di una pagina web. Se, ad esempio, il sito
si occupa della realizzazione di pagine Web, le keywords saranno:
HTML
realizzazione pagine Web
home page
motori di ricerca
prezzi modici
.......
Il META tag dovrà essere così impostato:
<META name="keywords" Content="HTML, realizzazione
pagine Web, home page, motori di ricerca, prezzi modici">
La virgola divide i termini gli uni dagli altri. Le frasi non limitate
a singoli vocabili vanno scritte senza virgola perchè il
motore di ricerca le trovi in quella stessa forma.
Naturalmente, se il vostro sito e' multilingue sara' bene inserire
keywords in italiano e nella lingua straniera presente nel sito,
facendo sempre molta attenzione a non usare termini troppo generici.
Nel caso in cui non si tratti di nomi propri e' buona regola inserire
la forma singolare e plurale.
Il motore di ricerca considera il numero di volte in cui un termine
e' presente all'interno della pagina e delle keywords, ma ripetere
esageratamente una stessa parola nel META tag ha l'effetto opposto
a quello voluto, in quanto la gran parte degli spider cancellano
dal proprio database questi siti. E' bene quindi non esagerare col
numero di termini all'interno delle keywords.
Altri META tag riguardano l'autore della pagina web:
<META name="author" content="Nome Cognome">
il titolo che apparira' alla fine della ricerca:
<META name="description" content="La mia prima
home page">
e il nome dell'editor con cui il documento HTML e' stato generato:
<meta name="GENERATOR" content="Blocco note
di Win95">
Se per qualche ragione desideri che una delle tue pagine NON sia
indicizzata nei motori di ricerca, devi inserire il seguente META
tag:
<META NAME="ROBOTS" CONTENT="NOINDEX">
Un altro META Tag e' quello che permette il "refresh"
della pagina. Cio' vuol dire che la stessa pagina o altra differente
può essere automaticamente lanciata dopo un certo numero
di secondi che noi stessi impostiamo.
Ecco il codice:
<META HTTP-EQUIV="Refresh" CONTENT="5; url=pippo.htm">
Dove CONTENT="5 e' il numero di secondi entro il quale la
nuova pagina sara' caricata; mentre url=pippo.htm" e' il file
che verra' caricato.
APPROFONDIMENTI SUI META TAG
Lo studio dei dati forniti dai più frequentati Search Engine
ha dimostrato come il termine più ricercato sia "sex",
e come l'80% degli utenti non consulta oltre la seconda pagina di
ogni ricerca effettuata. Ciò significa che se una ricerca
per parola chiave risponde con 30 pagine di indirizzi Web, soltanto
2 utenti su 10 consulteranno oltre la seconda pagina. In ultima
analisi, i siti contenuti nella trentesima pagina hanno una visibilità
nulla. Questa considerazione dovrebbe chiarire la vitale importanza
di risultare tra i primi posti in queste ricerche. E' dimostrato
che i Search Engine e le directory sono i mezzi che più di
altri (riviste, link su altri siti, televisione ecc.) portano accessi
e visitatori in un sito.
Alla luce di queste considerazioni, l'inserimento di un sito all'interno
di Search Engine o Directory è un'operazione fondamentale
per la riuscita del sito stesso. Accorgimenti e piccoli trucchi
possono aiutare in questo, ma non c'è un modo univoco per
risultare in testa ad ogni motore di ricerca, per la banale constatazione
che ogni motore ha peculiarità proprie. Prima di continuare
è utile precisare alcuni concetti:
· non è importante risultare in tutti i motori di
ricerca ma al massimo nei 10 più diffusi a livello mondiale
e nei 2 a livello nazionale;
· diffidare dei numerosi servizi che per pochi dollari promettono
l'inserimento in 500 motori di ricerca, perchè spesso non
danno risultati e perchè, appunto, non ha alcuna rilevanza
risultare nei motori minori;
· diffidare dai programmi automatici di inserimento;
· non sperare che le "keywords" dei Meta Tag siano
la soluzione unica a questi problemi;
· spesso l'inserimento non è immediato, e in alcuni
casi (Lycos e HotBot) è successo addirittura che il database
non venisse aggiornato per mesi.
Il numero di persone che negli USA si occupano esclusivamente di
inserimento siti nei motori di ricerca è stimato intorno
alle 100 unità. Ciò significa che nessuna Directory
può materialmente controllare tutti i nuovi siti inseriti,
per cui molti vengono indicizzati senza essere previamente verificati.
Questo stato di cose genera una certa confusione, oltre ad uno scadimento
qualitativo degli inserimenti. Infoseek ha reso noto che giornalmente
riceve 30.000 nuove richieste di inserimento, poco meno della metà
di Yahoo.com.
L'inserimento nelle Directory è, per loro stessa natura,
più umanizzato e difficilmente oggetto di trucchi più
o meno leciti. Anzi, tentare di risultare furbescamente ai primi
posti delle Directory può essere controproducente, visto
che gli operatori, resisi conto del trucco, inseriscono il sito
nel "limbo dei furbi" in posizione quasi invisibile. Diverso,
invece, il caso dei Search Engine dove non è un essere umano
a ricevere le richieste di inserimento ma uno spider. Nel corso
degli anni gli spider, non troppo perspicaci agli esordi, hanno
affinato i propri strumenti e in molti casi radicalizzato l'intolleranza
verso trucchi e trucchetti. Spesso è sufficiente una keyword
ripetuta due volte per causare la cancellazione, tout court, del
sito dal database. Prima di tutto, quindi, è buona regola
evitare le penalizzazioni. Trucchi che fino ad una anno fa permettevano
di risultare primi nei Search Engine oggi sono riconosciuti dagli
spider. Per esempio non è una buona idea inserire testo nascosto
nella pagina HTML di colore identico al background, come non è
una buona idea creare pagine con parole chiave che non hanno nulla
a che vedere col contenuto del sito, ma inserite solo perchè
spesso ricercate dagli utenti (per es il termine "sex"
in un sito che si occupa di informatica). Evitare in modo assoluto
di inserire pagine con un meta tag "refresh" che rimanda
ad un'altra pagina dopo un certo numero di secondi.
Premesso che il delitto non paga, ecco una serie di suggerimenti
per ottenere un buon posizionamento nei Search Engine:
· evitare, per quanto possibile, l'uso di frame HTML;
· non iniziare il documento HTML con un'immagine o una tabella;
· porre particolare attenzione alla home page del sito;
· evitare, per quanto possibile, l'uso di pagine ASP (Active
Server Pages) o nominate con un nome di file dove compare un punto
interrogativo "?";
· inserire le parole chiave del sito tra i tag <TITLE></TITLE>,
perchè molti spider (Altavista in primis) danno molta importanza
a questo;
· usare i tag <H1><H2> ecc.
· creare "doorpage", cioè delle pagine di
supporto a quelle principali, contenenti testo e keywords attinenti
al sito;
· registrare non più di una pagina al giorno;
· registrare domini di primo livello. Per esempio www.nome.com
piuttosto che www.nome.com/direcotry;
· il meta tag "keywords" non deve contenere termini
duplicati e non più di mille caratteri. Il 90% delle ricerche
avviene per termini scritti in minuscolo, per cui è preferibile
evitare quelli maiuscoli;
· il meta tag "description" è fondamentale
perchè a questo il Search Engine associa il link al sito
e non deve superare i 300 caratteri.
RIEPILOGO LEZIONE
Di seguito riportiamo una pagina HTML impostata con il codice
visto in questa lezione. Questa pagina costituirà un punto
di riferimento anche per le lezioni successive:
<!DOCTYPE HTML PUBLIC ="-//IETF//DTD HTML 4.0//EN">
<HTML>
<HEAD>
<META name="keywords" Content="HTML, realizzazione
pagine Web, home page, motori di ricerca, prezzi modici">
<META name="description" content="La mia prima
home page">
<meta name="GENERATOR" content="Blocco note di
Win95">
<META name="author" content="Nome Cognome">
<TITLE>La mia prima home page</TITLE>
</HEAD>
</HTML>
|