Logo ufficiale ASMTEL Home Chi siamo Approfondimenti Materiali Normativa Vision 2000
8 - Perchè è necessario l'XML

1 - Premessa 2 - Introduzione Generale 3 - I marcatori 4 - Le regole dei marcatori 5 - Gli elementi del documento 6 - Identificare gli elementi 7 - Manipolare gli elementi 8 - Perchè è necessario l'XML 9 - Introduzione al linguaggio XML


Precedente Home Su Successiva

 

Nelle precedenti lezioni abbiamo visto che HTML significa Linguaggio basato sui marcatori per ipertesti.

Nell'HTML vi sono marcatori definiti da qualcuno (un organismo chiamato consorzio W3C), e codificati in un DTD (Document Type Definition) scritto in linguaggio SGML. Abbiamo anche accennato come la prossima versione dell'HTML (nome proposto: XHTML), sarà invece scritta in linguaggio XML. 

L'HTML è stato definito sulla base di regole precise, cioè sulla base di un particolare linguaggio che è in grado di definire da quali marcatori è formato l'HTML, quali attributi possono contenere, i loro significati, ecc.

Quindi un linguaggio generalizzato che consente di creare specifici linguaggi di marcatura, quali l'HTML. 

Tale linguaggio deve inoltre essere standard, cioè tutti i linguaggi di marcatura devono seguirne le regole. In tal modo un qualunque programma saprà che per poter comprendere i marcatori di un linguaggio di marcatura specifico, deve semplicemente leggerne le spiegazioni in un documento scritto con il linguaggio generalizzato (che è il DTD, la definizione del Tipo di Documento).

Il linguaggio generalizzato da cui deriva l'HTML si chiama SGML, Standard Generalized Markup Language (Linguaggio Generalizzato Standard basato sui Marcatori).

A questo punto possiamo vedere meglio come è stato creato l'HTML, anche se in maniera schematica.

Utilizzando il linguaggio SGML viene scritto un documento, chiamato DTD (Document Type Definition, definizione del tipo di documento, ad esempio il documento HTML), che definisce, per quel dato tipo di documento, i macatori, gli attributi ed il loro significato.

Infatti, all'inizio di ogni documento HTML, occorrerebbe inserire la dichiarazione del  tipo di documento, che dice al programma client (il browser) dove trovare le regole che il documento utilizza nell'uso dei propri marcatori: quali sono i marcatori ammessi, quali gli attributi, qual'è il loro significato.

Potrete ad esempio verificare che molti documenti HTML iniziano con il tag <!DOCTYPE>, tipo di documento, che specifica che si tratta di un documento HTML pubblico, la sua versione, eventualmente l'URL (indirizzo) dove reperire le regole su cui si basa l'HTML, l'organismo che definisce tali regole (W3C), ecc. 

Un esempio di questo TAG è:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">

Oggi su Internet si usa prevalentemente l'HTML, quindi la dichiarazione di documento viene spesso omessa. Inoltre, per semplificarne l'uso, la maggior parte delle regole HTML sono facoltative. 

In caso di errori nell'HTML, il browser ignora l'errore e visualizza in qualche modo il documento. 

Questo ha portato all'esistenza su internet di documenti HTML non conformi alle regole generali dell'SGML, o che contengono tag non validi per il DTD dell'HTML (che vengono ignorati).

Questo può non essere un grosso problema per l'essere umano, che guarda ciò che il computer gli fa apparire a video e lo valuta.

E' un grosso problema invece per l'utilizzo da parte di applicazioni software del documento HTML, applicazioni che non sono certo dotate di spirito di quello spirito di valutazione critica per valutare i documenti non ben formati ("well formed").

Ma il problema che rende particolarmente limitato l'HTML non è solo questo. 

Il linguaggio HTML, avendo tag fissi e generici, da solamente informazioni limitate e generiche sulla struttura di un documento e sul tipo di informazioni in esso contenute.

Il computer non comprende il significato del testo di un nostro documento, ma comprende i marcatori, i tag HTML, che gli dicono: questo testo è un titolo di primo livello, questo è un paragrafo che va giustificato, questa è una citazione che va scritta in corsivo.

La genericità e la rigidità dell'HTML rappresentano un limite molto forte al pieno sfruttamento del principio per cui è nato l'HTML: far comprendere al computer la struttura dei documenti umani e delle informazioni in essi contenuti, in modo da fargli compiere in maniera automatica delle determinate azioni sulla base di queste informazioni.

Se io scrivo, ad esempio, le mie fatture con Microsoft Word e le salvo in HTML su un server Internet ad accesso riservato, per poterle visionare, se necessario, anche quando sono in vacanza in qualche altro continente, posso farlo, e posso vedere le mie fatture.

Ma non posso chiedere al computer di leggere per me tutte le fatture, calcolarmi il totale del fatturato, l'IVA, e di farmi una tabella del fatturato suddiviso per cliente o per periodo. 

L'HTML non ha i marcatori utili a definire in maniera appropriata la struttura delle mie fatture, quella che interessa a me, così come la struttura di vari altri documenti, di farla comprendere al computer e di fargli estrarre ed elaborare i dati che mi servono.

Oggi per fare questo i dati delle mie fatture dovrebbero essere gestite da un programma collegato ad un database. Il computer conosce il significato dei campi di un database, e sa in quale campo si trovano le cifre delle fatture, i nomi dei clienti, la data, e può soddisfare le mie richieste. Ma è come aver utilizzato una lingua specifica, non universale per farmi capire dal computer, che non comprenderà le mie fatture se espresse in altra lingua, al di fuori di quel programma.

E' quindi necessario estendere e generalizzare le capacità di comprensione del computer dei documenti o dati prodotti dall'uomo, siano essi in forma di documento, o contenuti all'interno di un qualsiasi programma.

Principalmente da questa esigenza nasce il nuovo linguaggio chiamato XML.

Vedremo di cosa si tratta nella prossima lezione.

 



Precedente Home Su Successiva

Editoriali ] Notizie ] Presentazioni ASMTEL ] Schede ] Libro ] ASMTEL Informa ]

Contatore visite

 Per informazioni e commenti: asm@asm-settimo.it - Note sul copyright

statistiche accessi al sito (dal 2 luglio 2003)

Statistiche complessive con il sito Centro di Competenza sul SUAP (dal 5/6/1999)